Está en la página 1de 446

Algunas Notas para un curso elemental de

“Álgebra Conmutativa”, Parte I.

Luis M. Pardo
Índice

Capı́tulo 0. Prólogo: Thinking outside the box 7


Aclaración sobre la ortografı́a usada en este texto 11

Part 1. Requisitos y Prerrequisitos al Álgebra Conmutativa:


Los “gigantes” del XIX y princios del XX: pensamiento Noetheriano 13

Capı́tulo 1. Algunos Prerrequisitos de Álgebra


(“...all novelty is but oblivion”) 15
1.1. Introducción: Prerrequisitos. 16
1.2. Semigrupo, monoide, grupo, acciones 16
1.2.1. Las nociones básicas 16
1.2.2. Un ejemplo: alfabeto, palabras, lenguajes 18
1.2.3. Grupos 21
1.2.4. Acciones de un grupo 27
1.2.5. Ejercicios y problemas de la Sección 1.2 35
1.3. El paradigma de las acciones transitivas y fieles: Sn 42
1.3.1. Grupo simétrico Sn : Órbitas, ciclos, transposiciones. 42
1.3.2. Índice de una permutación 48
1.3.3. Ejercicios y problemas la Sección 1.3 53
1.4. Anillos, ideales, morfismos de anillos 54
1.4.1. Propiedades generales 54
1.4.2. Anillos de polinomios y de series de potencias formales en varias variables 65
1.4.3. Otros ejemplos 70
1.4.4. Ejercicios y problemas de la Sección 1.4 71

Capı́tulo 2.Módulos, Determinantes y Teorema de Hamilton-Cayley


(“Begin at the beginning and go on till...”) 79
2.1. Introducción 79
2.2. Módulos, submódulos, morfismos de módulos 80
2.2.1. Generalidades 80
2.2.2. Operaciones básicas con submódulos e ideales 86
2.2.3. Teoremas de isomorfı́a 91
2.2.4. Módulos libres y bases 94
2.2.5. Diagramas conmutativos, complejos y sucesiones exactas (Opcional) 99
2.2.6. Ejercicios y problemas de la Sección 2.2 103
2.3. Determinante. Teorema de Hamilton-Cayley 111
2.3.1. Determinante: propiedades básicas. 112
2.3.2. La Fórmula de Laplace 116
2.3.3. Polinomios con coeficiente matricial y matrices con coordenadas polinomiales.
Teorema de Hamilton-Cayley 126
2.3.4. Ejercicios y problemas de la Sección 2.3 131

Capı́tulo 3. Dominios de Ideales Principales. Anillos Noetherianos. Dominios Enclı́deos.


Con unas reflexiones sobre algoritmos de Cálculo del Máximo Común Divisor
“ à la Sylvester”.
(À la recherche du temps perdu) 137
3.1. Introducción: DIP’s, Noetherianos y Dominios Euclı́deos. 138
3
4 ÍNDICE

3.2. Dominios de ideales principales, propiedades elementales, elementos primos e


irreducibles. 139
3.3. Anillos noetherianos: aplicación del pensamiento noetheriano a la factorización en
dominios de ideales pincipales. 143
3.4. Dominios Euclı́deos 147
3.4.1. Dominios Euclı́deos: Elementos básicos 147
3.4.2. Existencia de factorización en primos en dominios euclı́deos (Opcional) 151
3.4.3. Existen dominios de ideales principales que no son dominios euclı́deos:
Dedekind-Hasse (Opcional) 152
3.4.4. Ejercicios y problemas de las secciones 3.2, 3.3 y 3.4 156
3.5. Sobre la eficiencia del Algoritmo de Euclides en Z 159
3.5.1. Divisiones del algoritmo de Euclides en Z 159
3.6. Eliminación univariada clásica: la Matriz de Sylvester 162
3.6.1. Extensiones algebraicas (Resumen Opcional) 162
3.6.2. Cuerpos algebraicamente cerrados (Resumen opcional) 165
3.6.3. La matriz de Sylvester y el máximo común divisor en K[X] 168
3.6.4. Resultante de Sylvester-Bézout y Eliminación: cuando los coeficientes están en
un anillo 172
3.6.5. Ejercicios y problemas de la Sección 3.5 177

Capı́tulo 4. Ideales Primos y Maximales. Módulos Libres. Con una coda sobre la Forma
Normal de Smith
(Le temps retrouvé) 183
4.1. Introducción 184
4.1.1. Motivación: El ejemplo de las ecuaciones diofánticas lineales: Diagonalización,
forma normal de Smith y aplicaciones. 185
4.2. Ideales primos e ideales maximales. La noción de rango de un R−módulo libre. 187
4.2.1. Las nociones y primeras propiedades 187
4.2.2. La noción de rango de un R−módulo libre 192
4.2.3. Generación finita sobre anillos noetherianos es hereditaria 196
4.3. Proyectivos, libres y dominios de ideales principales 197
4.4. Libres y Libres de Torsión sobre dominios de ideales principales 204
4.4.1. Libres de Torsión sobre dominios de ideales principales 204
4.4.2. Libres de torsión sobre dominios euclı́deos (Opcional) 208
4.4.3. Ejercicios y problemas de las secciones 4.2 y 4.3 211
4.5. Diagonalización de Matrices sobre un DIP 217
4.5.1. Motivaciones 217
4.5.2. Matrices de operaciones elementales en GL(2, R) 218
4.5.3. Generalizando a matrices m × n: Operaciones elementales sobre DIP’s 220
4.5.4. Matrices elementales particulares 222
4.5.5. Orlar una matriz 225
4.5.6. “Algoritmo”: Hacer ceros por filas o columnas 226
4.5.7. Hacer ceros en filas y columnas 228
4.5.8. Diagonalización de una matriz sobre un DIP: “algoritmo” primario 230
4.5.9. Resolución de ecuaciones lineales diofánticas 231
4.6. Forma Normal de Smith 234
4.6.1. Estructura de grupos abelianos finitamente generados 237
4.7. Forma de Frobenius y Factores Invariantes de un endomorfismo sobre un espacio
vectorial de dimensión finita. 241
4.7.1. Factores invariantes de un endomorfismo 241
4.7.2. Forma de Frobenius de un endomorfismo: factores invariantes en K[X] 242
4.7.3. El álgebra R[X]/(f ), con f ∈ R[X]mon . 242
4.7.4. Ejercicios y problemas de la Sección 4.5 251

Capı́tulo 5. El Teorema Chino de los Restos (Opcional)


(..nanos gigantum humeris insidentes) 257
5.1. Introducción 257
ÍNDICE 5

5.2. El anillo producto y el Teorema Chino de los Restos 258


5.3. El Teorema Chino de los Restos en el caso R = Z 260
5.3.1. En relación con el problema de Sun Tzu. 261
5.3.2. En computación: cálculo del determinante por algoritmos modulares. 262
5.3.3. Secretos compartidos. 268
5.3.4. Grupos abelianos finitamente generados: estructura, divisores elementales. 269
5.3.5. Ejercicios y problemas de la Sección 5.3 271
5.4. El Teorema Chino de los Restos en el caso R := K[X]: Forma de Jordan. 275
5.4.1. La forma canónica de Jordan: divisores elementales en K[X]. 275
5.4.2. Teorı́a del endomorfismo y el máximo común divisor en K[X]. 278
5.4.3. Ejercicios y problemas de la Sección 5.4 287

Capı́tulo 6.Factorización de elementos e ideales: Las ideas de Gauss, Lasker y Noether.


(“...hac re copiose loqui superfluum foret.” (Gauss)
“Meine Methoden sind Arbeits- und Auffassungsmethoden...”
(Noether)) 293
6.1. Introducción 294
6.2. Dominios de factorización única: Lema de Gauss 295
6.2.1. Dominios de factorización única 295
6.2.2. Máximo común divisor en dominios de factorización única 298
6.2.3. El Lema de Gauss 301
6.2.4. Ejercicios y problemas de la Sección 6.2 305
6.3. El Teorema de Lasker-Noether (Existencia): “factorizando” ideales en anillos
noetherianos 314
6.3.1. Radical de un Ideal 315
6.3.2. Ideales Primarios 318
6.3.3. Descomposición Primaria en anillos noetherianos: Teorema de Lasker-Noether 323
6.3.4. Unicidad (Primer Teorema): descomposición primaria, asociados e ideales
primos minimales de un anillo noetheriano 325
6.3.5. Ejercicios y Problemas de la Sección 6.3 330

Capı́tulo 7.Rudimentos de Geometrı́a Algebraica: La Topologı́a de Zariski


(La découverte est le privilège de l’enfant.) 335
7.1. Introducción 335
7.1.1. Geometrı́a Diferencial: objetos dados “explı́citamente” ( por parametrizaciones
locales o globales) con buenos rangos en los Jacobianos: 336
7.1.2. Geometrı́a Algebraica, Analı́tica, Diofántica etc.: Objetos geométricos dados
implı́citamente por sus ecuaciones globales (o locales): 338
7.2. Geometrı́a y soluciones: La(s) topologı́a(s) de Zariski 339
7.2.1. Variedades o conjuntos de ceros (o de soluciones): Topologı́a(s) de Zariski 340
7.2.2. Ideal de un objeto geométrico, primos, maximales y variedades. 346
7.3. Rudimentos de Geometrı́a Algebraica: Variedades algebraicas K−definibles 350
7.3.1. Funciones polinomiales K−definibles. 351
7.3.2. Variedades algebraicas afines y K−definibles. 352
7.3.3. Primos, maximales y variedades algebraicas afines. 355
7.3.4. Otras consecuencias de la argumentación noetheriana 357
7.4. Variedades algebraicas en el espacio proyectivo: Ideales homogéneos 362
7.4.1. Ejercicios y problemas de la Sección 7.2 378

Capı́tulo 8.Una Prueba Elemental de Nullstellensatz de Hilbert.


(...el vacı́o...inútil y perfecto.) 381
8.1. Introducción. 382
8.1.1. Unas palabras sobre la Conjetura de Cook (P 6= NP). 384
8.2. Una demostración elemental del Nullstellensatz de Hilbert: Parte I 386
8.2.1. La resultante y los tensores de multiplicación módulo un polinomio mónico:
especialización de la resultante 386
8.2.2. La prueba de la Parte I del Nullstellensazt de Hilbert-Kronecker 391
8.3. Un cambio de coordenadas útil 391
6 ÍNDICE

8.4. Tests de (no) nulidad para polinomios. 393


8.4.1. El Test de Schwartz-Zippel-DeMillo-Lipton. 395
8.4.2. Cuestores (Opcional, resumen de sólo lectura) 397
8.4.3. Witness Theorem. 397
8.4.4. Tests de (no) nulidad para números enteros dados por esquemas de evaluación. 399
8.5. Una demostración elemental del Nullstellensatz de Hilbert: Parte II 401
8.5.1. Nullstellensatz de Hilbert-Kronecker: Parte II 401
8.5.2. Nullstellensatz de Hilbert: Cuerpos finitos 402
8.5.3. Nullstellensatz: Identidad de Bézout 404
8.5.4. Nullstellensatz: Maximales 404
8.5.5. Nullstellensatz: Rabinowitsch y el radical de un ideal 406
8.5.6. Nullstellensatz e ideales primos. 408
8.5.7. Nullstellensatz y Geometrı́a Algebraica en Pn (K) 408
8.5.8. Nullstellensätze Efectivos y eliminación de un bloque de cuantificadores
existenciales (sólo enunciados). 410
8.6. Nullstellensatz y equivalencia natural: El lenguaje de las categorı́as 414
8.6.1. El lenguaje de las categorı́as. 414
8.6.2. Categorı́as 414
8.6.3. Functores y equivalencias naturales 416
8.6.4. La categorı́a de las variedades algebraicas afines y los morfimos regulares. 418
8.6.5. La Categorı́a de las K−álgebras reducidas finitamente generadas. 419
8.6.6. Nullstellensatz como Equivalencia Natural 421
8.7. Variaciones del Nullstellensatz en otros contextos (Cultura General) 421
8.7.1. Variación de un primer tema clásico: El Teorema de Banach-Čech-Gel’fand-
Stone- 421
8.7.2. Variación de un segundo tema clásico: El Lema de Urysohn y el Teorema de
Extensión de Tietze. 422
8.7.3. Variación de un tercer tema clásico: Extensión de funciones en Variedades
Diferenciables 422
8.8. Ejericios y Problemas sobre el Nullstellensatz 423
8.8.1. La topologı́a de Zariski en el espectro de un anillo. 424
8.9. Meta-matemática: La Teorı́a de Primer Orden sobre los Complejos admite
Eliminación de Cuantificadores (Opcional, no se imparte en esta forma). 426
8.9.1. Teorı́a de Primer Orden sobre cuerpos algebraicamente cerrados 426
Apéndice. Glosario de Términos 429
Apéndice. Glosario de Teoremas y Resultados 435

Apéndice. Glosario de Sı́mbolos y Abreviaturas 437


Apéndice. Bibliografı́a 439
CAPı́TULO 0

Prólogo: Thinking outside the box

El Arte de la Matemática:

From [Zh, 13]:


Zhuping Man studied the art of
butchering dragons under Crippled Yi.
It cost him all the thousand pieces
of gold he had in his house,
and after three years he’d mastered the art,
but there was no one who could use his services.
Zhuangzi (s. IV adC)

From [BL, 1972]:


...As a result he began
to teach how to slay dragons”
René Thom (Fields Medal of 1958)

Índice
Aclaración sobre la ortografı́a usada en este texto 11

En el nuevo milenio, la expresión “ Think outside the box!” ha sido acuñada como referente
del pensamiento moderno. El origen de la expresión es discutido por mucha gente a lo largo del
siglo XX, especialmente del ámbito de la psicologı́a, el márketing, la finanzas o la tecnologı́a.
Sin embargo, nada hay menos moderno que el significado de esa expresión (cf.(cf.1 la cita a R.
Bacon que se encuentra al inicio del Capı́tulo 1: “...all novelty is but oblivion”). Al cabo, la
Humanidad lleva milenios pensando de manera diferente, enfrentándose de manera diferente a
problemas, para lograr un cierto progreso, no siempre estable o permanente. Desde luego no es
nuevo, ni novedoso el acto de pensar fuera del tarro.
Es en el ámbito del conocimiento humano, el ámbito de la Ciencia, donde el pensamiento fuera
de los cánones establecidos ha marcado la pauta para responder a los problemas y las preguntas
que las mentes más curiosas se han planteado. Muchos son los nombres que se me ocurre citar
(y podrı́a citar algunos de los más apreciados por mı́, sion citar amigos personales, como E.
Noether, D. Hilbert, J. Nash, A. Turing, S. Smale, R. Thom, K. Gödel y muchı́simos otros cuyo
pensamiento influyó en distintas épocas de mi carrera académica). Pero me voy a restringir al
caso de la asignatura que nos ocupa.
Pensar fuera de la caja que nos envuelve supone un esfuerzo enorme y un acto brutal de cre-
atividad. No es necesario que ese pensamiento esté desarrollado hasta el lı́mite técnico extremo
(para eso ya vendrán los “continuadores” - ya sean amigos o enemigos - que se encargarán de
llevar a término la tecnicalidad del asunto). Para pensar fuera de lo establecido basta con tener
la mente dispuesta a dar un “pas à côté”, ponerse en un lado, y mirar lo que existe desde la per-
spectiva desde la que nadie miró antes. Tras esa observación desde una perspectiva inesperada,
se trata de dar un primer paso y mostrar un nuevo camino. Es el trabajo del “pathfinder”, de
quien muestra un camino o un atajo, de nuevas rutas de pensamiento. En muchos casos, esos
pathfinders son maltratados por sus contemporáneos, en otros reciben en vida el premio a su
1
cf.: Abreviatura del imperativo cónfer del verbo latino conferre. De acuerdo al Diccionario Panhispánico
de dudas, se puede traducir por “compare [usted]” o “compara [tú]” , aunque, por costumbre o tradición, se
interpreta como una instrucción que “Remite a la consulta de un determinado texto o pasaje...”

7
8 0. PRÓLOGO

creatividad. Esto no es importante. Lo que sı́ es importante es que quienes logran pensar fuera
del tarro abren una vı́a a través de la cual el conocimiento humano (un constructo cooperativo
de la Humanidad) puede profundizar su comprensión de las cosas.
Lo que sı́ suele suceder es que, ante la sociedad que nos rodea, estos golpes de inmensa creativi-
dad parecen “dragones” y, por tanto, logros imaginarios, fantasiosos, hasta que no son aplicados.
Tampoco eso debe importar demasiado al matemático. La Matemática no es un constructo de
la mente humana creada para ser aplicada sino para profundizar en el conocimiento de aquellos
objetos que se resisten a ser comprendidos y que son susceptibles de ser estudiados con medios
meramente deductivos. De ahı́ que la enseñaza de la Matemática, por más que moleste a quienes
sólo buscan aplicaciones inmediatas, tenga ese matiz de “Manual para la caza de dragones”, de
guı́a para la comprensión de grandes golpes de creatividad en el arte de abstraer y deducir.
Para este humilde matemático, el problema más duro de comprender es el manejo y dominio del
sı́mbolo ∃. La “existencia” (o su hermano, la “universalidad” del sı́mbolo ∀) son los dos grandes
misterios de la Matemática. No en vano, cuatro de los problemas del Milenio llevan en su cuerpo
un ∃ sin piedad, imperturbable. Un ∃ subyace a la Conjetura de Cook y a la Conjetura de Birch
y Swynerton-Dyer. Un ∃ | (existe un único) subyace a la Conjetura sobre las ecuaciones de
Navier-Stokes, mientras un ∀ se encuentra inmerso en la Conjetura de Riemann.
Enfrentar el ∃ o el ∀ de manera única se ha mostrado imposible a lo largo de la historia. Y las
veces en que ha habido un cierto progreso significativo ha sido porque alguien miró de soslayo,
enfrentó el problema de otro modo y, a trancas y barrancas, dió lugar a una nueva forma de
pensamiento matemático. No todos son afortunados porque no todos lo lograron, pero la esencia
del matemático profesional consisten en, al menos, intentarlo. Los tecnicismos son aburridas
tareas colectivas, mientras que el encontrar un nuevo camino es un éxito de la formación y el
ingenio.
Cuando uno enfrenta la formación de un Grado en Matemáticas y hace referencia al Álgebra, dos
casos clásicos de pensamiento fuera del tarro vienen a la mente. Se trata de dos casos sencillos
de exponer, complicados de demostrar y que se produjeron a lo largo del siglo XIX y principios
del XX. El primero, conocido globalmente, es la respuesta a la pregunta de si ∃ solución por
radicales a una ecuación polinomial univariada. La respuesta a años de búsqueda positiva la dió,
en primer lugar, un jovencı́simo N. Abel (a la sazón tenı́a 26 años cuando muere en la pobreza)
mostrando una quı́ntica que no es resoluble por radicales. Es un contraejemplo muy brillante,
pero insuficiente para alimentar un nuevo camino. Será otro jovencı́simo Évariste Galois quien,
a sus 22 años escribe un testamento, la vı́spera del duelo en el que encontró la muerte, en el
que entremezcla de manera confusa sus asuntos personales con su nueva idea: entrelazar la
resolución de ecuaciones polinomiales con la familia de permutaciones de las raı́ces. Este sı́ fue
un pensamiento fuera de la caja que generó la Teorı́a de Grupos y la presencia de las acciones de
los grupos como paradigma de mecanismo para comprender muchos de los asuntos matemáticos
que resultaban de difı́cil penetración intelectual. No en vano, ya en 1872, Felix Klein defiende
en su programa de Erlangen que la Geometrı́a sólo es entendible si se interpreta a través del
grupo de las acciones permitidas. Por eso es común que la Teorı́a de Galois forme parte de la
formación básica de todo matemático. No se trata solo de que los tecnicismos que subyacen a
esas ideas sean de conocimiento común de cuantos ostentan el nombre de “matemático”, que
también. Se trata, ante todo, de que la formación del matemático contemple la comprensión
de cuanto acontece a un pensamiento fuera de la caja, como paradigma del necesario “pensar
distinto” que todo matemático debe llevar en su ADN deontológico.
El presente curso es, sin embargo, un curso de “Algebra Conmutativa”. Al alumno se le supone
el conocimiento previo del sofisticado salto que dió É. Galois y ahora se trata de enfrentar otro
∃ ligeramente distinto, algo más moderno. Se suele citar a D. Hilbert2, en su trabajo de 1893
sobre la Teorı́a de Invariantes, como el origen de ese otro punto de partida del pensamiento fuera
del tarro: el Nullstellensatz. Aunque un poco antes, en 1882, L. Kronecker 3 prueba el mismo
resultado en un contexto ligeramente distinto, por lo que es más difı́cil de detectar su presencia.
La pregunta es ahora sobre la existencia de soluciones en Cn de un sistema finito de ecuaciones

2D.Hilbert, Über die vollen Invariantensysteme. Mathematische Annalen 42 (1893), 313–373.


3L.Kronecker, Grundzüge einer arithmetischen theorie de algebraischen grössen. J. reine angew.
Math. 92 (1882) 1–122.
0. PRÓLOGO 9

polinomiales. En la obra de Hilbert, la respuesta aparece como un resultado marginal, en el


apartado II, § 3 (páginas 320-326), de su estudio sobre invariantes. Posiblemente Hilbert no
le dió relevancia suficiente a este resultado y tuvieron que ser sus colaboradores más cercanos
quienes desarrolları́an el nuevo camino, la nueva ruta.
Tendrán que venir los colaboradores más cercanos de D. Hilbert (especialmente E. Noether, pero
también E- Artin, y su amplio grupo de alumnos, colaboradores y seguidores) para que este
primer resultado tenga un impacto de gran relevancia. La brillantı́sima algebrista E. Noether,
a pesar de su desafortunada vida académica (por prejuicios raciales y de género), desarrollará el
camino abierto por Hilbert con el Nullstellensatz. Con E. Lasker desarrollará la generalización
de la factorización a través de la descomposición primaria de ideales (el Teorema de Lasker-
Noether). El jugador de ajedrez y filósofo E. Lasker contribuye mostrando la descomposición
primaria de ideales en anillos de polinomios. E. Noether, generaliza la idea del Basissatz
de Hilbert a la noción de anillos hoy llamados noetherianos y prueba la existencia (y ciertas
formas de unicidad) de descomposición primaria de ideales en anillos noetherianos. No es menos
relevante el Lema de Normalización 4 que dará contexto geométrico a las extensiones enteras
de anillos. Tras Emmy, sus alumnos, como el holandés B.L. van der Waerden o la alemana
G. Hermann, y sus colegas más crecanos, como W. Krull (cf. [Krull, 1935]), desarrollarán
los primeros elementos del Álgebra Conmutativa. Desde Odessa, George Yuri Rainich (nacido
“Rabinowitsch”) mostrará cómo el Nullstellensatz de Hilbert permite construir un diccionario
entre el Álgebra Conmutativa y los objetos geométricos llamados “variedades algebraicas”.
Al cabo, Hilbert y Kronecker han mostrado que se puede aparcar la ingeniosa geometrı́a de
lo “genérico” de los maestros italianos del XIX, para sustituirla por el aspecto más formal de
los ideales y los anillos de funciones polinomiales y racionales, mediante la equivalencia natural
que propicia el Nullstellensatz. También a través del Nullstellensatz, el tratamiento y estudio
de las variedades algebraicas se puede hacer algorı́tmicamente a través de ideales de anillos de
polinomios, dando un fundamento preciso a la “Teorı́a de la Eliminación” (eliminación de ∃ y
∀), tan apreciada por L. Kronecker.
Son muchos los frentes que aquı́ encuentran su fuente de pensamiento. B. L. van der Waerden
escribirá su texto “Moderne Algebra” (cf. [vdW, 1930, vdW, 1931]), compilación de los
cursos impartidos por E. Noether y E. Artin, que pasará a ser el referente de la forma mod-
erna de entender el Álgebra desde 1929. La eliminación del ∃ entero o racional en ecuaciones
polinomiales, dará lugar al Problema X de Hilbert, a los trabajos de Gödel, Turing y Church
y al nacimiento de la informática. Desde la equivalencia natural, J. Dieudonné y, sobre todo,
A. Grothendieck, tratarán de fundamentar “toda” geometrı́a a través de haces de espacios lo-
camente anillados y la unificación de la Homologı́a y Co-homologı́a. Lang intentará trasladar
las ideas de Grothendieck (y su brillante elenco de colaboradores, que sustentarán el difunto N.
Bourbaki) a la Teorı́a de Números, dando lugar a la Geometrı́a Diofántica moderna. Y el Null-
stellensatz se reencontrará en el Análisis Funcional a través de resultados como el teorema de
Stone-Čech-Banach sobre el espectro maximal del anillo de funciones continuas sobre un com-
pacto. La Geometrı́a Analı́tica (real o compleja) tratará de asemejarse, en lo posible, a las ideas
originales del colectivo de Goetingen, permı́taseme citar a mi muy apreciado S. Lojasiewicz,
mientras que la Geometrı́a sobre los reales tratará de asemejarse a través del Principio de Tarski
y del Nullstellensatz Real de JJ. Risler y D. Dubois.
Muchos otros ámbitos sienten la influencia del pensamiento de este resultado, aunque luego
las formas y los tecnicismos los hagan aparecer de manera diversa, fragmentada y sin aparente
conexión. En lo esencial, el concepto es el mismo: transformar el estudio de difusos objetos
geométricos en objetos bien axiomatizados y formalmente tratables, cuyas propiedades son
demostrables sin ánimo de duda. Esto dió lugar al Álgebra Conmutativa moderna, objeto de
este curso, con fuertes aplicaciones también, y no sólo por la obra de Lang, a la Teorı́a Algebraica
de Números. Ni que decir tiene que el Álgebra Conmutativa moderna tiene fuertes implicaciones
en la algorı́tmica a través, sobre todo, de la Computación Simbólica, también llamada, Álgebra
Computacional. Se ha intentado introducir algún que otro algoritmo para dar un poco de
presencia a este ámbito: ası́, hemos introducido el agoritmo de Berlekamp para la factorización

4E. Noether, Der Endlichkeitsatz der Invarianten endlicher linearer Gruppen der Charakteristik p,
Nachrichten von der Gesellschaft der Wissenschaften zu Göttingen (1926), 28–35
10 0. PRÓLOGO

de polinomios sobre cuerpos finitos, la División de Hironaka y las Bases de Gröbner, junto a
algoritmos como los tests de “composición” de Solovay-Strassen y Miller-Rabin o los algoritmos
de multiplicación “rápida de matrices de V. Strassen o S. Winograd, entre otros.
El problema, en la impartición de una asignatura como ésta, es doble: de una parte, el Grado
en la Universidad de Cantabria tiene 120 horas de docencia en Álgebra Lineal en la que no
se alcanzan objetivos mı́nimos imprescindibles y, de otra parte, el Álgebra Conmutativa es
una parte “descarnada” del conocimiento matemático. El primer problema es un problema
grave: No se puede admitir un graduado en Matemáticas sin unos conocimientos sólidos en
Álgebra Lineal. Por eso, el curso contiene, subrepticiamente en sus primeros capı́tulos, un curso
básico de Álgebra Lineal y Teorı́a del Endomorfismo (camuflado a la manera más elegante
de módulos sobre dominios de ideales principales), cuyos contenidos son, sorprendetemente,
desconocidos para los alumnos de último cuatrimestre de tercero de un Grado de Matemáticas.
Estos contenidos se presentan como aplicaciones de algunas de las propiedades de anillos y
módulos y, sobre todo, en el cuerpo de los problemas de los primeros Capı́tulos. Por eso, el
curso dedica sus buenas 280 páginas a aspectos tan elementales como la noción de determinante,
el teorema de Hamilton-Cayley, los dominios de ideales principales, los dominios euclı́deos, los
dominios de factorización única, los módulos finitamente generados sobre dominios de ideales
principales, La Forma Normal de Smith y su interacción con la Teorı́a del Endomorfismo (la
llamada Forma de Frobenius) o el histórico Teorema Chino de los Restos (que Jordan “tradujo”
en la llamada Forma Canóica de Jordan).
En honor a E. Noether, a su colaboración con Lasker y al desarrollo de las ideas de Hilbert (que
ella misma denomina “Meine Methoden sind Arbeits- und Auffassungsmethoden...”). Por eso
se intercala un Capı́tulo en el que no sólo se demuestra el Teoramde la Base de Hilbert como el
éxito de Lasker-Noether en “factorizar” ideales no principales, generalizando el sueño de Gauss.
Las contribuciones de E-Artin a estas ideas de Nother quedan para una segunda parte de este
manual para la caza de dragones.
En lo que respecta a la segunda dificultad, al tratarse de uno de los lenguajes de la Geometrı́a,
se vuelve lenguaje “per se” y pierde el acercamiento visual de algo más dibujable. Aprender
un lenguaje relevante pero descarnado es una tarea ardua como principio. Nada pasa o nada
parece pasar si no hay un poco de Geometrı́a a su lado. Pero el “poco” de Geometrı́a ya es
un mucho de formación que, ligada al conocimiento del lenguaje, entrelaza inexorablemente
ambas formaciones. Y esto no encaja en el universo fragmentario y burocrático, a la par que
superficial, de los Grados de Matemáticas de la decadente universidad española actual.
Como remate, la formación media de los graduados en matemáticas posee fuertes lagunas de
conocimiento “recordado” (o, si se prefiere, un exceso de “no recuerdo” o “ no lo he visto”), lo
que obliga a retomar ese mismo concocimiento desde sus mismos elementales orı́genes. Final-
mente, y como primer paso a la interacción entre Álgebra y Geometrı́a, dedicamos un Capı́tulo
a la terminologı́a básica de la llamada topologı́a de Zariski e introduciremos un demostración
muy elemental del Nullstellensatz de Hilbert-Kronecker. Daremos una demostración muy ele-
mental que usa implı́citamente la Normalización de Noeteher, pero sin desarrollarla aún, y la
resultante de dos polinomios univariados, uno de los cuales es mónico. Todo ello se presenta
aderezado de ejercicios y ejemplos bien conocidos, a la par que evidentes. Muchos ejemplos de
algoritmos, algunos de los cuales no suelen ser comúnmente conocidos, son descritos como prob-
lemas y, en ocasiones, como enunciados del texto. Con todo ello se ha configurado una Parte 1
de Prerrequisitos que, por casualidad, está formada por las muchas ideas que los gigantes que
nos precedieron dieron a la luz durante el siglo XIX y primeros años del siglo XX.
No será hasta la Parte ??, a jugar con un formalismo más actualizado del Álgebra Conmutativa
con la presencia de la escuela de Cartan y Eilenberg (muy influyentes a partir de mediados
sel sigloXX) y la conjugación del lenguaja del Álgebra Homológica con el lenguaje del Álgebra
Conmutativa. No obstante, mucho de esa futura Parte ?? seguirá estando inspirado por Hilbert,
Krull y Noether, aunque sólo aparezcan de modo fragmentario. Debo decir que mi visión sobre
este curso debe mucho a la escuela japonesa (Nakayama, Azumaya, Nagata, Matsumura), al
clásico texto de Atiyah y Macdonald, a “libruco” de S. Raghavan y co-autores, al texto de E.
Kunz, a los clásicos de Zariski y Samuel y, sin falsa humildad, a un poco de lectura y pen-
samiento de quien suscribe que siempre admiró la excelente arquitectura colectiva levantada
0. PRÓLOGO 11

en torno a estas ideas. Aunque están esbozadas otras partes más técnicas y recientes, con
contribuciones que pretenden mostrar mi lealtad a maestros y amigos, todo está inacabado por
la dificultad doble de encontrar tiempo y encontrar los textos/poemas que más se ajusten al
mensaje inmanente de cada Capı́tulo. Sueño con tener la disponibilidad en tiempo para trans-
feriri esos otros capı́tulos a este Latex interminable, aunque mi incapacidad como mecanógrafo
sea públicamente conocida e inhabilitante. Mientras tanto, lanzo al formato de Trabajos Fin
de Grado muchos de los capı́tulos que algún dı́a añadiré.
No debo dejar este Prólogo sin mostrar mi más sincero agradecimiento a cuantos alumnos
hicieron el esfuerzo de una lectura crı́tica de los textos. A pesar de que cada año son modificados,
a pesar de mis dilsexia y disgrafı́a con los tipos de imprenta (que plagan el texto de erratas), las
lecturas y comentarios de algunos pocos alumnos me han ayudado a ir mejorando cada parte,
cada año y a evitar groseras barbaridades. Gracias a ellos por sus lecturas,
Suerte al lector y suerte a los alumnos que traten de entenderlo. No es fácil porque no es trivial,
pero tampoco es tan profundo que nos pueda abrumar.
May 11, 2023.
5

Aclaración sobre la ortografı́a usada en este texto. En evitación de lecturas aviesas,


quiero clarificar algunos aspectos relativos a la ortografı́a elegida para este texto.
Se ha elegido el formato de libro (book) de la American Mathematical Society (AMS). Aunque el
idioma utilizado es el español, hemos tratado de seguir lo más fielmente posible las recomenda-
ciones del Libro de Estilo de esta asociación6, juntamente con las reglas de estilo recomendadas
por D. E. Knuth y co-autores para la Mathematical Asociation of America (MAA) 7.
Especı́ficamente, hemos tratado de seguir atentamente las siguientes dos reglas:
• “Numbered theorems, lemmas, etc. are proper nouns and, thus, are capitalized: The-
orem 2.3, Lemma 3.1, Figure 4.5” (p. 79 del AMS Style Guide).
• “Rule 19. Capitalize names like Theorem 1, Lemma 2, Algorithm 3, Method 4”’ (en
D. E. Knuth et al.).

5Este Prólogo hace referencia a un texto incompleto que contiene muchos Capı́tulos sin desarrollar. Quizá
algún dı́a tenga la paciencia de encontrar los poemas que reflejan los contenidos de los Capı́tulos inacabados.
Pero “hoy no es ese dı́a”.
6M. Letourneau, J. Wright Sharp, AMS Style Guide, Journals, October 2017, AMS, Providence, 2017
7D. E. Knuth, T. Larrabee, P. M. Roberts, Mathematical Writing, MAA, 1989
Part 1

Requisitos y Prerrequisitos al Álgebra


Conmutativa:
Los “gigantes” del XIX y princios del
XX: pensamiento Noetheriano
CAPı́TULO 1

Algunos Prerrequisitos de Álgebra


(“...all novelty is but oblivion”)

Solomon saith,
ç There is no new thing upon the earth.
So that as Plato had an imagination,
That all knowledge was but remembrance;
so Solomon giveth his sentence:
That all novelty is but oblivion.
(R. Bacon)

Está bien que se mida con la dura


sombra que una columna en el estı́o
arroja o con el agua de aquel rı́o
en que Heráclito vio nuestra locura
...
La arena de los ciclos es la misma
e infinita es la historia de la arena;
...
la invulnerable eternidad se abisma.
...
Todo lo arrastra y pierde este incansable
hilo sutil de arena numerosa.
No he de salvarme yo, fortuita cosa
Del tiempo, que es materia deleznable.

15
16 1. PRE-ÁLGEBRA

Índice
1.1. Introducción: Prerrequisitos. 16
1.2. Semigrupo, monoide, grupo, acciones 16
1.2.1. Las nociones básicas 16
1.2.2. Un ejemplo: alfabeto, palabras, lenguajes 18
1.2.2.1. Operaciones Básicas con palabras. 20
1.2.2.2. Operaciones Elementales con Lenguajes. 20
1.2.3. Grupos 21
1.2.3.1. La terminologı́a usual con morfismos: Teorema de Schreier. 22
1.2.3.2. Generación de Subgrupos 26
1.2.4. Acciones de un grupo 27
1.2.5. Ejercicios y problemas de la Sección 1.2 35
1.2.5.1. Descomposición en Valores Singulares. 39
1.3. El paradigma de las acciones transitivas y fieles: Sn 42
1.3.1. Grupo simétrico Sn : Órbitas, ciclos, transposiciones. 42
1.3.2. Índice de una permutación 48
1.3.2.1. Índice por la naturaleza de la identidad. 48
1.3.2.2. Índice de una permutación por alteración del orden
(Alternativo). 50
1.3.3. Ejercicios y problemas la Sección 1.3 53
1.4. Anillos, ideales, morfismos de anillos 54
1.4.1. Propiedades generales 54
1.4.2. Anillos de polinomios y de series de potencias formales en varias variables 65
1.4.3. Otros ejemplos 70
1.4.4. Ejercicios y problemas de la Sección 1.4 71
1.4.4.1. Problemas sobre cuerpos ordenados o formalmente reales 75
1.4.4.2. Problemas sobre Órdenes Monomiales y división de Hironaka. 76

1.1. Introducción: Prerrequisitos.


Este Capı́tulo es una lista de nociones y propiedades elementales que suponen los requisitos
previos que un alumno deberı́a tener en su bagaje cultural, antes de someterse a las exigencias
propias de este curso. De hecho, deberı́an ser requisitos previos superados antes de superar
los requisitos de las asignaturas, previas a este curso, “Estructuras Algebraicas” y “Teorı́a de
Galois”. Pero requisito ya no es una palabra de uso común cuando uno habla de superar una
formación previa (al menos no en el Grado en Matemáticas). Ası́ que este Capı́tulo se queda en
aderezar prerrequisitos con algo del lenguaje del Álgebra Conmutativa para que no desentone
demasiado.
Notación 1.1.1. Dadas dos clases X e Y denoteremos por Y X al conjunto de todas las apli-
caciones de X en Y , es decir:
Y X := {f : X −→ T : f es aplicación}.
Asimismo, denoteramoes por 2X (o por P(X)) la clase de todos los subconjuntos de un con-
junto X dado. Recuérdeser que hay una identidad obvia entre los subconjuntos de X y las
funciones caracterı́sticas definidas en X. Es decir, P(X) ∼
= {0, 1}X , de donde viene la notación
X
simplificada 2 .

1.2. Semigrupo, monoide, grupo, acciones


1.2.1. Las nociones básicas. Comencemos recordando algunas nociones básicas
Definición 1 (Semi-grupo, Monoide). Un semigrupo es un par (S, ∗), donde S es un con-
junto no vacı́o y ∗ es una aplicación
∗: S×S −→ S
(a, b) 7−→ a ∗ b,
1.2. SEMIGRUPO, MONOIDE, GRUPO, ACCIONES 17

Donde S × S = {(x, y) : x, y ∈ S} es el producto cartesiano de S consigo mismo y, además,


verifica la siguiente propiedad:

Propiedad Asociativa: (x ∗ y) ∗ z = x ∗ (y ∗ z), ∀x, y, z ∈ S.

A la aplicación ∗ se la denomina Operación Interna del semi-grupo. Un semigrupo (S, ∗) se


denomina monoide si verifica la siguiente propiedad adicional:

Existencia de Elemento Neutro: ∃e ∈ S, e ∗ x = x ∗ e = x, ∀x ∈ S.

Al elemento e, si existe, se le denomina Elemento Neutro del monoide.


Un semigrupo (o un monoide) (S, ∗) se dice conmutativo o abeliano si verifica la siguiente
propiedad adicional:

Propiedad Conmutativa: ∀x, y ∈ S, x ∗ y = y ∗ x.

Proposición 1.2.1. Si (S, ∗) es un monoide, el elemento neutro es único y suele denotarse


mediante eS o, simplemente, e o 1 si no hay confusión en el lenguaje.

Demostración. Sea e1 y e2 son dos elementos de S neutros en el sentido de la definición


precedente, tendremos que
e1 e2 = e1 porque e2 es neutro,
mientras que
e1 e2 = e2 porque e1 es neutro,
Con lo que hemos concluido que e1 = e2 como se indica en el enunciado. 

Definición 2 (Morfismo de semi-grupos, monoides). Un morfismo de semigrupos entre


dos semigrupos (S, ∗), (T, ⊥) es una aplicación entre los respectivos conjuntos:

f: S −→ T
a 7−→ f (a),

que verifica la siguiente propiedad:

f (x ∗ y) = f (x) ⊥ f (y).

Un morfismo entre dos monoides (M, ∗), (N, ·), con respectivos elementos neutros eM y eN , es
un morfismo de semi-grupos fM −→ N que verifica, además, la siguiente propiedad:

f (eM ) = eN .

Ejemplo 1.2.2 (El monoide de los exponentes monomiales). El conjunto (Nn , +) es un


monoide conmutativo con la operación:

+ : Nn × Nn −→ Nn ,

dada mediante:
(µ1 , . . . , µn ) + (θ1 , . . . , θn ) := (µ1 + θ1 , . . . , µ1 + θ1 ).
A los elementos µ ∈ Nn se les suele denominar multi-ı́ndices (o también exponente monomial ).
Más aún, la siguiente aplicación es un morfismo de monoides entre (Nn , +) y (N, +), llamada
grado: | · | : Nn −→ N, dada mediante

|(µ1 , . . . , µn )| = µ1 + · · · + µn .

A los elementos de Nn , en este contexto, se les suele llamar exponentes o exponentes monomiales.
18 1. PRE-ÁLGEBRA

1.2.2. Un ejemplo: alfabeto, palabras, lenguajes. Lo que sigue son unas notas rela-
tivas al ejemplo más simple de monoide, dentro del contexto de los Lenguajes Formales y de las
ideas de N. Chomsky (cf. [ChMi, 1957], [Ch, 1959a],[Ch, 1959b], [Ch, 1962], [Ch, 1965],
por ejemplo). La primera idea, que se remonta al Cı́rculo de Viena, es que en toda comunicación
no ambigua (o en toda computación), lo único susceptible de comunicarse (o comptar) viene
escrito sobre un alfabet finito. Ası́ que comenzamos con esta definición elemental.
Definición 3 (Alfabeto, Palabras, Lenguajes). Sea Σ un conjunto finito que llamaremos
alfabeto.
i) Una palabra de longitud n sobre el alfabeto Σ es una lista finita de sı́mbolos de Σ.
Podemos formalmente identificar las listas x = x1 · · · xn de sı́mbolos (xi ∈ Σ) con
los elementos del producto cartesiano Σn . Denotaremos por |x| = n la longitud de la
palabra x1 · · · xn .
ii) El conjunto de todas las palabras sobre el alfabeto Σ se denotará mediante Σ∗ y podemos
identificarlo con la unión disjunta
[˙ n
Σ∗ = Σ
n∈N

iii) Los subconjuntos L de Σ se denominan lenguajes.

Insistamos en la notación x1 · · · xn para expresar la palabra (x1 , . . . , xn ) ∈ Σn . Los “)”, “(” y


las “,” pudieran ser (y suelen ser) elementos del alfabeto.
Definición 4 (Palabra Vacı́a). Al único elemento x ∈ Σ∗ de longitud cero |x| = 0 (o,
equivalentemente, x ∈ Σ0 ) se la denomina palabra vacı́a y se la denota usualmente mediante λ
(o ε, según los autores).

Veremos enseguida que todos los lenguajes son conjuntos numerables, pero el número de lengua-
jes (identificable con la clase de subconjuntos de N, P(N)) es no numerable.

Ejemplo 1.2.3. Como ejemplos de alfabetos y palabras podemos destacar los siguientes:
i) Alfabetos Unarios. Son alfabetos Σ := {a} formados por un único elemento. Por
ejemplo, Σ1 := {1}. Las palabras x ∈ Σ∗1 n sobre este alfabeto son listas de la forma:
(n
,
x= 11 · · · 1
y, obviamente, es una representación mediante “palotes” de los números naturales.
Es decir, definir N := Σ∗1 , para cualquier alfabeto unario. El elemento 0 ∈ N es la
longitud de (y, por ende, es) la palabra vacı́a λ.
ii) Alfabeto Binario: bits. Son todos los alfabetos Σ con dos elementos. Su objeto
habitual es el alfabeto Σ1 := {0, 1} cuyos elements se llaman bits. El conjunto de las
palabras en Σ∗2 de longitud n se puede identificar con el conjunto {0, 1}n .
iii) Alfabeto del español. Son los sı́mbolos comúnmente admitidos en la lengua española,
incluyeno el sı́mbolo de espacio o el sı́mbolo de punto final de párrafo. Ası́, con estas
dos inclusiones, un capı́tulo de “El Quijote” o un capı́tulo de “Tiempo de Silencio” o
un poema de “Poeta en Nueva York” son palabras sobre el alfabeto español.
iv) Alfabeto Cirı́lico (o alfabetos de otros idiomas europeos). Son los alfabetos
de cada una de las lenguas en vigor en cada uno de esos paı́ses. Ası́, un capı́tulo de
“El Idiota” o de “La Odisea” son, respectivamente, palabras sobre el alfabeto cirı́lico
o el griego clásico.
v) Otros alfabetos del Lenguaje Natural. Desde el alfabeto de los “Vedas”, hasta el
alfabeto árabe clásico de “Al-Quaran” o el alfabeto mandarı́n para la obra de Sun-Tzu
sobre “el Arte de la Guerra”...Son todos alfabetos generados por las distintas culturas
para comunicarse entre sı́ o para preservar información a lo largo del tiempo.
vi) ASCII (American Standard Code for Information Interchange): byte. Es
el alfabeto correspondiente al teclado estándard de un ordenador. Creado el 6 de
Octubre de 1960, quedó como un estándard de la codificación en ordenadores y aún
permanece como tal en las telecomunicaciones (salo por la masiva degeneración de los
emoticonos originales a través de sub-products como Whatsapp). Se trata del alfabeto
1.2. SEMIGRUPO, MONOIDE, GRUPO, ACCIONES 19

del teclado. Para “codificarlo” se usó el alfabeto de 8 bits (Σ28 := {0, 1}8 ). Por tanto,
la unidad de comunicación pasó a ser una lista de 8 bits que acabó denominándose
byte.
vii) El Lenguaje de la Vida. Sea Σlife = {A, C, G, T},representando las cuatro bases
que conforman el ADN, a saber: Adenina, Guanina, Citosina y Timina (reciente-
mente se suele añadir también U por Uracilo como sı́mbolo del “alfabeto de la vida”).
Las cadenas de ADN forman un lenguaje que contiene la información genética y esta
empaquetada de esta forma para su posible transmisión hereditaria. Curiosamente,
este lenguaje es casi universal y se aplica a todos los seres vivos.
Cada cadena de ADN guarda la codificación de varias proteı́nas. Dentro del ADN, cada
secuencia de tres bases de las mencionadas corresponden a un aminoácido concreto.
Esto se conoce como el código genético. Por ejemplo, la combinación AT G representa
el inicio de la secuencia y el final puede ser representada por T GA, T AG, T AA 1 . Debe
señalarse que no sólo son las cadenas sı́mbolos, sino la estructura de inter-conexiones,
representado a través de la hélice doble, lo que caracteriza el ADN individual.
En cambio, el ARN resulta más simple como lenguaje. El alfabeto cambia a ΣARN life =
{A, C, G, U} por adenina, guanina, citosina y uracilo y las cadenas de palabras son
suficientes. Lo que no obsta para que el lenguaje del ARN se salga de la clasificación
tradicional de lenguajes de Noam Chomsky. Esto ha sido aprovechado, por ejemplo,
en algunas de la vacunas para la COVID19 (Pfizer, Moderna, etc.).

La operación esencial sobre Σ∗ es la concatenación (también llamada adjunción) de palabras:


·: Σ∗ × Σ∗ −→ Σ∗ (x, y) 7−→ x · y,
donde si x = x1 · · · xn e y = y1 · · · ym , entonces
x · y = x1 · · · xn y1 · · · ym .

Proposición 1.2.4. Con las notaciones anteriores, (Σ∗ , ·) es un monoide, donde λ es el ele-
mento neutro. La longitud define un morfismo de monoides entre (Σ∗ , ·) y el monoide (N, +).
El monoide Σ∗ es conmutativo si y solamente si el cardinal de Σ es uno. De hecho, la operación
suma + sobre N es siplemente la operación de adjunción, cuando identifamos N ∼= Σ∗1 .
Demostración. Ejercicio obvio. 

Lema 1.2.5. Si Σ es un alfabeto finito, el conjunto Σ∗ es numerable, esto es, es biyectable con
el conjunto N de los números naturales.

Demostración. Para dar una prueba de este enunciado basta con fijar un buen orden en
Σ∗ . Un ejercicio razonable consiste en definir el buen orden basado en “lexicográfico + longitud”
length+lex que define la biyección. Recuérdese que el orden lexicográfico es el orden usual del
“diccionario”, i.e.i.e.2 basado en establecer un orden en el alfabeto Σ (en ocasiones lo llamarán
alfabético). Es decir, sea  un orden total en Σ (que existe por ser Σ finito). Supongamos que
los elementos de Σ quedan ordenados mediante:
Σ := {α1  α2  · · ·  αr }.
Definimos para x = x1 . . . xn , y = y1 . . . ym ∈ Σ∗ la relación de orden siguiente:


 o bien n = |x| < |y| = m, 
 ∃k ≤ n = m, ∀i ≤ k − 1,



x ≤ y ⇐⇒ o bien |x| = |y| = n = m, xi = yi ,
xk  yk

 


o bien x = y.

1El ADN siempre se ha considerado el “lenguaje de la vida” y parece que se cumple la máxima de Galileo:
“La Naturaleza es un libro escrito con el lenguaje de las matemáticas”.
2Abreviatura de la expresión latina id est, traducida al español por “esto es”.
20 1. PRE-ÁLGEBRA

Esta relación de orden es un buen orden en Σ∗ y permite una identificación (biyección) entre
Σ∗ y N, asociando a cada elemento de Σ∗ , el número de elementos menores que el:
λ 7−→ 0
α1 7−→ 1
α2 7−→ 2
···
α1 α1 7−→ r+1
α1 α2 7−→ r+2
···

Nótese que como consecuencia (Corolario) se tienen las propiedades siguientes:
Corolario 1.2.6 (Los lenguajes son conjuntos contables). Sea Σ un alfabeto finito y
L ⊆ Σ∗ un lenguaje. Entonces, L es un conjunto contable (i.e. es finito o numerable).
Más aún, el cardinal de los posibles lenguajes L ⊆ Σ∗ coincide con el número de subconjuntos
de N y, por tanto, verifica:
] (P(Σ∗ )) = ] (P(N)) = ] (R) = 2ℵ0 .
En particular, hay una cantidad infinita no numerable de lenguajes sobre un alfabeto finito.
1.2.2.1. Operaciones Básicas con palabras. Además de la concatenación de palabras,
podemos destacar las siguientes:
i) Potencia de Palabras. Se define recursivamente a partir de la concatenación. Ası́,
dada una palabra ω ∈ Σ∗ y un número natural n ∈ N, definimos la potencia ω n ,
mediante:
• Definimos ω 0 = λ,
• Para n ≥ 1, definimos
ω n := ω · ω n−1 .
ii) Reverso de una Palabra: Se trata de una biyección
R
: Σ∗ −→ Σ∗ ,
dada mediante:
• Si ω = λ, λR = λ,
• Si ω = x1 · · · xn ∈ Σ∗ , con xi ∈ Σ, definimos
ω R := xn xn−1 · · · x1 ∈ Σ∗ .

Ejemplo 1.2.7. Un lenguaje de cierta relevancia es el Palı́ndromo P ⊆ {0, 1}∗ y que viene
dado por la siguiente igualdad:
P := {ω ∈ {0, 1}∗ : ω R = ω}.

1.2.2.2. Operaciones Elementales con Lenguajes. Vamos a considerar las siguientes


operaciones básicas con lenguajes formales. Tendremos fijado un alfabeto Σ,
i) Unión de Lenguajes: De la manera obvia como subconjuntos. Dados L1 , L2 ⊆ Σ∗ ,
definimos:
L1 ∪ L2 := {ω ∈ Σ∗ : [ω ∈ L1 ] ∨ [ω ∈ L2 ]}.
ii) Concatenación de Lenguajes: Dados L1 , L2 ⊆ Σ∗ , definimos su concatenación:
L1 · L2 := {ω1 · ω2 ∈ Σ∗ : ω1 ∈ L1 , ω2 ∈ L2 }.
iii) Potencia de Lenguajes: Se define recursivamente.
• Si n = 0, L0 = {λ}.
• Si n ≥ 1, Ln := L · (Ln−1 ).

Observación 1.2.8. Obsérvese que L1 · L2 no es, en general, igual a L2 · L1 . Tampoco es


cierto que si L1 · L2 = L2 · L1 entonces se tiene L1 = L2 . El ejemplo más sencillo de esto es
Σ = {a}, L1 = {a}, L2 = {aa}.
1.2. SEMIGRUPO, MONOIDE, GRUPO, ACCIONES 21

Proposición 1.2.9 (Distributivas). Con las anteriores notaciones, se tienen las siguientes
propiedades para lenguajes L1 , L2 y L3 contenidos en Σ∗ :
L1 · (L2 ∪ L3 ) = L1 · L2 ∪ L1 · L3 .
(L1 ∪ L2 ) · L3 = L1 · L3 ∪ L2 · L3 .
Otras operaciones importantes entre lenguajes, hacen referencia al cálculo de la clausura tran-
sitiva por la operación de adjunción :
i) Clausura transitiva o monoide generado por un lenguaje: Dado un lenguaje L ⊆ Σ∗
definimos el monoide L∗ que genera mediante la igualdad siguiente:
[
L∗ := Ln .
n∈N

ii) Clausura positiva de un lenguaje: Dado un lenguaje L ⊆ Σ∗ definimos la clausura


positiva L+ que genera mediante la igualdad siguiente:
[
L+ := Ln .
n≥1

1.2.3. Grupos.
Definición 5 (Grupo). Un grupo es un monoide (G, ∗) que verifica la siguiente propiedad
adicional:
Existencia de Inverso: ∀x ∈ G, ∃x0 ∈ G, x ∗ x0 = x0 ∗ x = eG ,
donde eG es el elemento neutro de (G, ∗). Para cada x ∈ G, todo elemento x0 tal que x0 ∗ x =
x0 ∗ x = eG se denomina inverso de x y se denota x−1 . Un grupo abeliano es un grupo cuyo
monoide subyacente es conmutativo.
Ejemplo 1.2.10. El conjunto (Zn , +) con la operación:
+ : Zn × Zn −→ Zn ,
dada mediante:
(µ1 , . . . , µn ) + (θ1 , . . . , θn ) := (µ1 + θ1 , . . . , µ1 + θ1 ),
es un grupo abeliano.

Ejemplo 1.2.11 (Grupo Simétrico). Sea X un conjunto y consideremos el conjunto S (X)


formado por todas las biyecciones sobre X, es decir,
S (X) := {f : X −→ X : f es una biyección}.
Sobre conjunto S (X) definimos:
◦ : S (X) × S (X) −→ S (X)
(f, g) 7−→ f ◦ g.
Dado que la composición de aplicaciones biyectivas es biyectiva, sabemos que esta aplicación
está bien definida. Más aún, es fácil verificar, a partir de las propiedades de la composición de
aplicaciones, que (S (X), ◦) forma un grupo cuyo elemento unidad es la identidad IdX : X −→
X. A este grupo (S (X), ◦) se le denomina el grupo de las permutaciones (o grupo simétrico)
sobre el conjunto X.

Notación 1.2.12 (Notación para Grupos Abelianos). Es habitual que los grupos abelianos
se representen mediante notación aditiva. Es decir, se suelen presentar mediante la forma
“(G, +) es un grupo abeliano”. El elemento neutro de un (G, +) se suele denotar mediante 0G
o, simplemente, 0, cuando no haya confusión. Para cada elemento g ∈ G de un grupo abeliano
(G, +) el inverso de g se denomina “el opuesto de g” y se suele denotar mediante −g.

Ejemplo 1.2.13 (Grupos cı́clicos finitos). Los grupos cı́clicos finitos son grupos abelianos,
isomorfos a las clases de restos de elementos en Z con respecto al subgrupo nZ = {nx : x ∈ Z}.
Denotaremos estos grupos cociente mediante Z/nZ o por Z/(n). Nunca mediante Zn que
corresponderá a otra construcción (véase el ı́tem iv) del Ejemplo ??). Será admisible usar Cn
para describir al grupo cı́clico de orden n.
22 1. PRE-ÁLGEBRA

Proposición 1.2.14. Si (G, ·) es un grupo, cada elemento x ∈ G posee un único elemento


inverso.
Demostración. Ya hemos visto que (G, ·) posee un único elemento neutro. Ahora supong-
amos que x ∈ G posee dos posiles elementos neutros x0 , x00 ∈ G. Por la propiedad asociativa se
tiene:
x0 = x0 · e = x0 · (x · x00 ) = (x0 · x) · x00 = e · x00 = x00 .
Y se tiene el enunciado. 
Definición 6 (Subgrupo). Dado un grupo (G, ∗), un subgrupo es un subconjunto no vacı́o
G1 ⊆ G tal que se verifica la siguiente propiedad:
∀x, y ∈ G1 , xy −1 ∈ G1 .

Definición 7 (Morfismo de grupos). Un entre dos grupos (G, ∗), (H, ⊥)es un morfismo
entre los subyacentes monoides. Es decir, f : (G, ∗) −→ (H, ⊥) es morfismo de grupos si
f (eG ) = eH y
∀x, y ∈ G, f (x ∗ y) = f (x) ⊥ f (y).

Proposición 1.2.15. Sean (G, ∗) y (H, ⊥) dos grupos. Una aplicación f : G −→ H define un
morfismo de grupos f : (G, ∗) −→ (H, ⊥) si y solamente si se verifica la siguiente propiedad:
−1
∀x, y ∈ G, ϕ(x ∗ y −1 ) = ϕ(x) ⊥ (ϕ(y)) .
En particular, los morfismos de grupos transforman los inversos de los elementos del primer
grupo, en inversos de la imagen.
Demostración. Basta con ver que los morfismos de monoide entre grupos transforman
inversos en inversos. Supongamos ϕ : (G, ∗) −→ (H, ⊥) un morfismo de grupos y sea g ∈ G,
entonces,
−1
ϕ(g −1 ) = (ϕ(x)) .
Para verificarlo, baste con observar que
ϕ(g) ⊥ ϕ(g −1 ) = ϕ(g ∗ g −1 ) = ϕ(eG ) = eH ,
y
ϕ(g −1 ) ⊥ ϕ(g) = ϕ(g −1 ∗ g) = ϕ(eG ) = eH .
El recı́proco es también obvio y omitimos su prueba. 
Proposición 1.2.16. Sea f : (G, ∗) −→ (H, ⊥) un morfismo de grupos. Sean S ⊆ G y T ⊆ H
dos subgrupos de G y H respectivamente. Entonces, también se tiene que f (S) es subgrupo de
H y f −1 (T ) es subgrupo de G.
Entre los subgrupos obtenidos como imagen y anti-imagen de subgrupos por morfismos de grupos,
son destacables el núcleo y la imagen, respectivamente definidos mediante:
ker(f ) := f −1 ({eH }) := {x ∈ G : f (x) = eH }.
Im(f ) := f (G).
Demostración. Queda como problema. 
1.2.3.1. La terminologı́a usual con morfismos: Teorema de Schreier. En oca-
siones se encuentra la terminologı́a homomorfismo en lugar de morfismo que hemos usado en
la definición precedente. Nosotros usaremos, como en Teorı́a de Categorı́as el término mor-
fismo, seguido de la palabra que indica la categorı́a en la que estemos ocupados: Ası́, usaremos
sufijos para indicar “morfismo de monoides”, “morfismo de grupos”, “morfismos de espacios
vectoriales”, etcétera.
Pero, a la hora de clasificar o comprender los morfismos, son también importantes los prefijos.
Consideraremos algunos usuales. Ası́, sea
f : (G, ∗) −→ (H, ⊥),
un morfismo de alguna clase. Se pueden encontrar los términos:
• Endo-: Llamamos “endomorfismo” , cuando (G, ∗) = (H, ⊥).
1.2. SEMIGRUPO, MONOIDE, GRUPO, ACCIONES 23

• Iso-: Llamamos “isomorfismo”, cuando exista g : (H, ⊥) −→ (G, ∗) morfismo (de


grupos o de la clase que corresponda), tal que
f ◦ g = IdH , g ◦ f = IdG ,
donde ◦ indica composición e IdX : X −→ X significa la aplicación identidad de un
conjunto X en sı́ mismo.
• Auto-: Se usa bajo la forma “automorfismo” cuando es endomorfismo e isomorfismo
a la vez.
Hay que poner un poco más cuidado en el uso de los términos siguientes:
Definición 8 (Morfismos inyectivos y suprayectivos). Sea f : (G, ∗) −→ (H, ⊥) un
morfismo (de grupos, de monoides, etc.)
• Diremos que f es un morfismo inyectivo si la aplicación subyacente f : G −→ H es
una aplicación inyectiva.
• Diremos que f es un morfismo suprayectivo si la aplicación subyacente f : G −→ H
es una aplicación suprayectiva.
• Diremos que f es un morfismo biyectivo si la aplicación subyacente f : G −→ H es
una aplicación biyectiva.

Observación 1.2.17 (Isomorfismos en Topologı́a, llamados homeomorfismos). En Topologı́a


se usa la noción de “aplicación continua” en lugar de “morfismo”, “aplicación continua inyec-
tiva” en lugar de “morfismo inyectivo”, “aplicación continua suprayectiva” en lugar de morfismo
suprayectivo y, un término que no debe confundirse, “homeomorfismo” en lugar de isomorfismo.
Pero son nociones idénticas, aunque con nombres distintos. Lo que no es idéntico en Topologı́a
es la equivalencia entre homeomorfismo y morfismo biyectivo (continua y biyectiva). Por ejem-
plo, es obvio que existe una aplicación biyectiva entre el intervalo [0, 1) y la esfera unidad S 1 .
Además es continua y viene dada mediante:
exp : [0, 1) −→ S1
2πti
t 7−→ e .
Es continua, biyectiva, pero no es homeomorfismo porque su inversa no es continua. Es decir,
en general, isomorfismo no ha de coindicir con morfismo inyectivo y suprayectivo a la vez, ni
siquiera cuando los “morfismos” tiene como sustrato una aplicación entre conjuntos con ciertas
estructuras destacables.

Observación 1.2.18 (Isomorfismo en Geometrı́a Diferencial, llamado difeomorfismo).


En Geometrı́a Diferencial se puede usar la noción de “aplicación diferenciable” en lugar de mor-
fismo, “aplicación diferenciable inyectiva” en lugar de morfismo inyectivo, “aplicación diferencia-
ble suprayectiva” en lugar de morfismo suprayectivo y “difeomorfismo” en lugar de isomorfismo.
Sin embargo, en Geometrı́a Diferencial es muy importante compaginar el comportamiento como
aplicación con el comportamiento sobre el espacio tangente, con lo que tendremos, inmersiones,
embebimientos y submersiones con especiales definiciones y propiedades. En todo caso, apli-
cación diferenciable biyectiva tampoco concide con “difeomorfismo” en el caso de la Geometrı́a
Diferencial, con ejemplos obvios como el anterior.

Los términos usuals para entender este fenómeno son los términos de monomorfismo y epimor-
fismo que daremos a continuación.

Definición 9 (Monomorfismo y Epimorfismo de grupos). Sea f : (G, ∗) −→ (H, ⊥) un


morfismo de grupos.
i) Decimos que f es un monomorfismo de grupos si para todo grupo (T, ?) y cualesquiera
dos morfismos α1 , α2 : (T, ?) −→ (G, ∗), se tiene:
f ◦ α1 = f ◦ α1 =⇒ α1 = α2 .
ii) Decimos que f es un epimorfismo de grupos si para todo grupo (T, ?) y cualesquiera
dos morfismos α1 , α2 : (H, ⊥) −→ (T, ?), se tiene:
α1 ◦ f = α1 ◦ f =⇒ α1 = α2 .
24 1. PRE-ÁLGEBRA

Para mejor recordar estas nociones, consideremos los siguientes dos diagramas que reflejan la
condición de monomorfismo y epimorfismo:
• Con las anteriores notaciones, f es monomorfismo si para todo grupo (T, ?) y cua-
lesquiera dos morfismos α1 , α2 : (T, ?) −→ (G, ∗), si el siguiente diagrama es conmu-
tativo:
(T, ?) f ◦ α1
α1 

f
Id (G, ∗) (H, ⊥)
T

α2 
(T, ?) f ◦ α2

Es decir, si f ◦ α1 = f ◦ α2 , entonces, α1 = α2 .
• Con las anteriores notaciones, f es epimorfismo si para todo grupo (T, ?) y cualesquiera
dos morfismos α1 , α2 : (H, ⊥) −→ (T, ?), si el siguiente diagrama es conmutativo:

α1 ◦ f (T, ?)
 α1

f
(G, ∗) (H, ⊥) Id
T

 α2

α2 ◦ f (T, ?)

Es decir, si α1 ◦ f = α2 ◦ f , entonces α1 = α2 .
Ya hemos visto que, en general, monomorfismo y morfismo inyectivo (respectvamente, epimor-
fismo y morfismo suprayectivo o ismorfismo y morfismo biyevtivo) no siempre son sinónimos.
Esta equivalencia, usualmente ausmida en las presentaciones de los grupos, es un caso particular
de los morfismos de grupos. Es el resultado que introducimos a continuación. Aunque el resul-
tado sobre la caracterización de epimorfismos de grupos de atribuye a O. Schreier (1901-1929),
su forma actual de debe a C. Linderholm (cf. [Lind, 1970]) que es la presentación elegida en
estas páginas.
Teorema 1.2.19. Con las anteriores notaciones, sea f : (G, ∗) −→ (H, ⊥) un morfismo de
grupos.
i) El morfismo f es morfismo inyectivo si y solamente si
ker(f ) := {x ∈ G : f (x) = eH } = {eG }.
ii) El morfismo f es monomofismo (en la categorı́a de grupos) si y solamente si f es
morfismo inyectivo.
iii) (Teorema de Schreier) El morfismo f es epimorfismo (en la categorı́a de grupos)
si y solamente si f es un morfismo suprayectivo.
Demostración. Demostraremos cada ı́tem separadamente:
i) Es evidente que si f es inyectiva ker(f ) = {eG }. Recı́procamente, si ker(f ) = {eG },
supongamos que tenemos x, y ∈ G tales que f (x) = f (y). Entonces, xy −1 ∈ ker(f ) y,
por tanto, x = y con lo que tenemos la inyectividad.
ii) Si f es inyectiva, se verifica obviamente la propiedad indicada con lo que tenemos la
implicación ⇐=. Recı́procamente, supongamos que f es un monoformismo de gru-
pos. Consideremos ker(f ) con la operación inducida por la de (G, ∗) como grupo y
1.2. SEMIGRUPO, MONOIDE, GRUPO, ACCIONES 25

consideremos los siguientes dos morfismos:


α1 : (ker(f ), ∗) ,→ (G, ∗)
x 7 →
− x,
α2 : (ker(f ), ∗) ,→ (G, ∗)
x 7−→ eG .
Es decir, α1 es la inclusión y α2 es claramente la “aplicación nula”, en el sentido de
que va siempre al elemento neutro. Entonces, es obvio que f ◦ α1 = f ◦ α2 . Por tanto,
si f es monomorfismo, α1 = α2 y, necesariamente, ker(f ) ⊆ {eG }.
iii) Para demostrar el Teorema de Schreier observamos, en primer lugar, que si f es
suprayectiva, entonces se verifica la condición de epimorfismo. El Teorema de Schreier
es justamente la prueba del recı́proco. Consideremos el subgrupo de H dado mediante:
L := Im(f ) := f (G).
Supongamos a ∈ H. Consideremos el conjunto de las clases a izquierda módulo L
(nótese que no hemos supuesto que L sea subgrupo normal, luego no es el grupo
cociente) unido, y de manera disjunta, un elemento a ∈ H cualquiera, es decir:
˙
[
X := {xL : x ∈ H} {a},
donde ∪˙ significa unión disjunta. Sea (S (X), ◦) el grupo de las permutaciones del
conjunto X con la composición ◦ como operación (descrito en el Ejemplo 1.2.11).
Definamos la siguiente permutación sobre X:
σ: X −→  X
 a, si s = L = eH L ∈ X,
s 7−→ σ(s) := L, si s = a,
s, si s 6= a, L.

Es obvio que es una biyección (nótese que σ −1 = σ, 3) que, en términos simplistas,


pretende “confundir” los papeles de a y L como elementos de X. Definamos dos
morfismos φ, ψ : (H, ⊥) −→ (S (X), ◦) del modo siguiente:
η: H −→ S (X)
x 7−→ η(x) := ηx ∈ S (S),
donde la permutación φx viene dada por:
ηx : X −→  X
xyL, si s = yL,
s 7−→
a, si s = a.
Por otro lado definamos
ψ: H −→ S (X)
x 7−→ σ ◦ ηx ◦ σ −1 ∈ S (S),
Es obvio que ambos son morfismos de grupo. Ahora hay que probar la siguiente afirmación:
Afirmación. Con las notaciones precedentes:
(1.2.1) L = {z ∈ H : η(z) = ψ(z)}.
Dejamos para más abajo la prueba de esta afirmación y damos por obvio que ambos son mor-
fismos de grupos. Asumiendo esta igualdad, veamos que η ◦ f = ψ ◦ f . Pues si x ∈ G, sea
entonces y = f (x) ∈ Im(f ) = f (G) = L. Pero como η(y) = ψ(y), para todo y ∈ L, tendremos
que η ◦ f (x) = ψ ◦ f (x) para cualquier x ∈ G, luego η ◦ f = ψ ◦ f y, como f es epimor-
fismo, concluiremos que η = ψ. En particular, tenemos que η(a) = ψ(a), con lo que por la
Igualdad (1.2.1) concluimos que a ∈ L. Habremos demostrado ası́ que H ⊆ L y, por tanto,
H = Im(f ), con lo que f es un morfismo suprayectivo. Nos queda por probar la Igualdad (1.2.1):

Demostración de la Afirmación.
3Aunque mantendremos la notación σ y σ −1 por razones didáctias: al alumno puede “recordarle” alguna
la semejanza con los subgrupos normales
26 1. PRE-ÁLGEBRA

• Demostración del contenido L ⊆ {z ∈ H : φ(z) = ψ(z)}: Sea z ∈ L. Por definición


de η, tenemos que ηz (s) = ηz (yL) = (zy)L para cada s = yL ∈ X y ηz (a) = a. De
otro lado,
ψ(z) := σ ◦ ηz ◦ σ −1 ∈ S (X).
Entonces, si s = yL ∈ X \ {a}, con y ∈ H, tenemos que s 6= L si y solamente si
y 6∈ L = Im(f ). En este caso, σ(s) = s y σ −1 (s) = s, y se tiene:
ψ(z)(s) = σ ◦ ηz ◦ σ −1 (yL) = σ ◦ ηz (yL) = σ ((zy)L) .
De nuevo, (zy)L 6= a y (zy)L 6= L. La primera afrimación es obvia, la segunda se
basa en el hecho de que z ∈ L. Pues si (zy)L = L es porque zy ∈ L, como z ∈ L,
esto implicarı́a que y ∈ L y hemos supuesto que yL 6= L. Por tanto, tendremos que si
s = yL ∈ X \ {L, a}, con y ∈ H se tiene:
ψ(z)(s) = σ ((zy)L) = (zy)L = ηz (yL).
En los dos casos que quedan, es obvio, por las definiciones de las funciones, que:
ψ(z)(a) = ηz (a),
y
ψ(z)(L) = ηz (L).
Con ello hemos probado que las dos permutaciones ψ(z) y ηz coinciden en todo punto
s ∈ X y, por tanto, ψ(z) = ηz , cuando z ∈ L.
• Demostración del contenido L ⊇ {z ∈ H : η(z) = ψ(z)}: Sea z ∈ H y supongamos
que z 6∈ L = Im(f ). Tenemos que
ψ(z)(a) = σ ◦ ηz ◦ σ −1 (a) = σ ◦ ηz (L) = σ(zL).
Como z 6∈ L, entonces zL 6= L y, por tanto, σ(zL) = zL. De otro lado,
ηz (a) = a,
y habremos probado que ψ(z) 6= ηz , con lo que hemos probado el contenido buscado.


Corolario 1.2.20. En la categorı́a de grupos, los isomorfismos de grupos son los morfismos
biyectivos y, por tanto, aquellos morfismos de grupos que son, a la vez, monomorfismos y
epimorfismos.
Demostración. Baste observar que los isomorfismos son precisamente aquellos morfismos
que son inyectivos y suprayectivos a la vez y usar el anterior Teorema. 

1.2.3.2. Generación de Subgrupos. El punto de partida es la siguiente


Proposición 1.2.21. Sea (G, ·) un grupo y {Si : i ∈ I} una familia cualquiera de subgrupos.
Entonces, la intersección \
Si ⊆ G,
i∈I
es también subgrupo.
Demostración. Obvio. 

A partir de esta sencilla propiedad podemos definir las nociones siguientes:


Definición 10 (Generadores de Subgrupos). Sea (G, ·) un grupo.
i) Para cada subconjunto F ⊆ G, llamaremos subgrupo generado por F al subgrupo dado
por la intersección de todos los subgrupos de G que contienen a F, es decir,
\
hFi := {S ⊆ G : F ⊆ S, S es subgrupo de G}.
ii) Un subgrupo S de G se dice finitamente generado si existe F ⊆ G finito tal que
hFi = S. Se dice que un subgrupo finitamente generado S es cı́clico si posee un
conjunto generador F de cardinal 1 (i.e. ](F) = 1).
iii) Un subgrupo se dice cı́clico si es el subgrupo generado por un único elemento.
1.2. SEMIGRUPO, MONOIDE, GRUPO, ACCIONES 27

La siguiente Proposición indica la relación entre los conjuntos de palabras Σ∗ y los grupos
finitamente generados, subyacente a las ideas de Thue y, finalmente, al Teorema de Novikov-
Boone.
Proposición 1.2.22. Sea (G, ∗) un grupo. Entonces, G es finitamente generado como grupo si
y solamente si existe un alfabeto finito Σ y un morfismo suprayectivo de monoides:
ψ : (Σ∗ , ·) −→ (G, ∗),
donde · es la operación de adjunción sobre Σ∗ .
Demostración. Es la clásica representación de los elementos de un grupo generado por
un subconjunto finito F = {γ1 , . . . , γm }. Los elementos g ∈ G vienen representados como
palabras
g = γi1 ∗ γi2 ∗ · · · ∗ γi` ,
con ik ∈ {1, . . . , γm }. Esta representación es simplemente la escritura informal de un morfismo
de monoides suprayectivo de la forma siguiente:
ψ: (F ∗ , ·) −→ (G, ∗)
γ i1 · · · · · γ i` 7−→ γi1 ∗ · · · ∗ γi` .
Dejamos los detalles al lector. 

Observación 1.2.23. Nótese que el morfismo suprayectivo de monoides anterior no es, en gen-
eral, inyectivo. Aunque sı́ se puede inducir una relación de equivalencia ∼ sobre F ∗ que define
una estructura de grupo en el conjunto cociente F ∗ / ∼ a través de la adjunción de clases. Esto
permitirá identificar (G, ∗) con el cociente de (F ∗ / ∼, ·). Por tanto, los grupos finitamente
generados son los cocientes de conjuntos de palabras Σ∗ por relaciones de equivalencia espe-
ciales compatibles con la operación de adjunción de palabras. Entre ellos son especialmente
significativos los grupos finitamente generados y finitamente presentados que son los grupos en
los que la relación de equivalencia ∼ sobre Σ∗ está generada por una familia finita de reglas de
reescritura.
1.2.4. Acciones de un grupo.
Definición 11 (Acción de un monoide/grupo). Sea X un conjunto no vacı́o y (G, ∗) un
monoide. Una acción a izquierda del monoide G sobre X es una aplicación:
·G : G × X −→ X
(g, x) 7−→ g · x,
verificando
i) Dados cualesquiera g1 , g2 ∈ G y x ∈ X se tiene:
g1 ·G (g2 ·G x) = (g1 ∗ g2 ) ·G x.
ii) Si e ∈ G es el elemento neutro de G se tiene, para cada x ∈ X:
e · x = x.
Si (G, ∗) es un grupo diremos que es una acción a izquierda de un grupo sobre el conjunto X

En lo que respecta a esta Sección nos centraremos fundamentalmente en las acciones de grupo.
En Capı́tulos posteriores nos interesarán también las acciones de monoides.
Ejemplo 1.2.24 (Algunos ejemplos y comentarios sobre acciones de grupos). Unos
pocos comentarios preliminares:
i) La primera de las propiedades indicadas en la definición indica que se tiene una cierta
asociatividad entre la operación de grupo ∗ y la acción ·. Por eso se suelen denotar
con el mismo sı́mbolo (i.e. escribir (G, ·) para el grupo y ·G para la acción “externa”
del grupo sobre el conjunto X. Progresivamente iremos suprimiendo el sı́mbolo · de
las operaciones, siempre que no genere confusión alguna.
28 1. PRE-ÁLGEBRA

ii) El ejemplo más tradicional de acción a izquierda de un grupo sobre un conjunto es el


siguiente:
Sea K un cuerpo y V un espacio vectorial sobre K. Consideremos V ∗ := V \ {0},
el conjunto de los “vectores” de V , excluyendo el 0. Tenemos una acción a izquierda
natural sobre V ∗ a partir del grupo multiplicativo (K × , ·), donde K × = K \ {0}:
η : K× × V ∗ −→ V∗
(λ, v) 7−→ ηλ (v) := λv.
A la transformación ηλ se la suele denominar homotecia de razón λ sobre V ∗ .
iii) Las acciones a izquierda no solamente pueden ser de grupos, sino también de monoides.
Un ejemplo de acción a izquierda de un monoide sobre un grupo es el clásico ejemplo
de la acción del monoide multiplicativo (Z, ·) sobre cualquier grupo abeliano (X, ∗).
La acción tradicional se define del modo siguiente:
·: Z×X −→ X
(n, g) 7−→ ng,
dada mediante:


 0X , si n = 0
g, si n = 1

ng :=

 g ∗ (n − 1)g, si n ∈ N, n ≥ 2
−((−n)g), si −n ∈ N,

donde 0X es el neutro del grupo abeliano (X, ∗) y −g es el opuesto de h ∈ X para la


operación de X. Obviamente, es una acción de monoide.
iv) Junto a las acciones a izquierda se suelen introducir las acciones “a derecha”. Una
acción a derecha es una aplicación
R: G×X −→ X
(g, x) 7−→ R(g, x),
verificando
(a) Dados cualesquiera g1 , g2 ∈ G y x ∈ X se tiene:
R(g1 ∗ g2 , x) = R(g2 , R(g1 , x)).
(b) Si e ∈ G es el elemento neutro de G se tiene, para cada x ∈ X:
e · x = x.
De ahı́ que, usualmente, se suelan denotar las acciones a derecha mediante:
R(g, x) = x ·G g,
para indicar la diferencia con las acciones a izquierda. A modo de ejemplo, conside-
remos el conjunto X := Mn (K) de matrices n × n con coordenadas en un cuerpo K
y el grupo de matrices regulares G := GL(n, K). Consideremos una primera acción,
claramente acción a izquierda, dada por :
L: G × X −→ X
(P, M ) 7−→ P M,
Del mismo modo podemos considerar la siguiente acción que es una acción a derecha
(aunque multipliquemos por la izquierda):
R: G × X −→ X
(P, M ) 7−→ P −1 M,
La acción por la derecha esperable en este caso serı́a:
R0 : G × X −→ X
(Q, M ) 7−→ M Q,
que tiene asociada su correspondiente acción a izquierda, aunque multiliquemos por
la derecha:
L0 : G × X −→ X
(Q, M ) 7−→ M Q−1 .
1.2. SEMIGRUPO, MONOIDE, GRUPO, ACCIONES 29

v) De modo más general, las acciones a izquierda y a derecha de un grupo están rela-
cionadas a través de la inversión en G de modo obvio. Si R : G × X −→ X es una
acción a derecha de un grupo G sobre un conjunto X, la siguiente es una acción a
izquierda:
R0 : G × X −→ X
(g, x) 7−→ R(g −1 , x).
Esto determina una biyección entre ambos tipos de acciones. En lo que queda nos
ocupamos sólo de acciones a izquierda.
vi) Consideremos el grupo simétrico sobre un conjunto X, (S (X), ◦) introducido en el
Ejemplo 1.2.11. De manera natural define una acción a izquierda sobre el conjunto X
mediante:
◦S : S (X) × X −→ X
(1.2.2)
(σ, x) 7−→ σ(x).

Definición 12 (Órbitas). Sea (G, ·) un grupo, X un conjunto no vacı́o, ·G : G×X −→ X una


acción de grupo, S ⊆ G un subgrupo, Y ⊆ X un subconjunto y x ∈ X un elemento. Definimos
las diferentes órbitas:
i) Definimos la órbita definida por S sobre Y mediante:
OS (Y ) := {gy : g ∈ S, y ∈ Y }.
ii) Para cada elemento x ∈ X, se define la órbita a izquierda de x por la acción de S al
conjunto:
OS (x) := {gx : g ∈ S}.
iii) Si S = h{g}i es un subgrupo cı́clico, escribiremos simplemente Og (x) en lugar de
Ohgi (x). Es decir, escribiremos:
Oσ (x) := Ohgi = {g n (x) : n ∈ Z}.

Proposición 1.2.25. Sea (G, ·) un grupo y sea X un conjunto no vacı́o y sea ∗G : G×X −→ X
una acción a izquierda. Se tiene:
i) Para cada g ∈ G, la siguiente es una biyección (y, por tanto, está en S (X))4
ηg : X −→ X
x 7−→ g · x.
ii) El siguiente es un morfismo de grupos:
H : G −→ S (X)
g 7−→ ηg .
iii) Las órbitas definen una relación de equivalencia sobre X. Ası́, dado S ⊆ G un sub-
grupo, la siguiente es una relación de equivalencia sobre X
x ∼S y ⇐⇒ y ∈ OS (x).
Más aún, las clases de equivalencia son las órbitas, es decir,
x ∼S y ⇐⇒ OS (x) = OS (y).
Al conjunto cociente de X por la órbitas definidas por S a través de la acción de G se le denota
mediante X/ ∼S .
Demostración. Las propiedades i) y ii) son obvias dado que son, precisamente, las usadas
−1
en la definición de acción a izquierda anterior y dado que ηg−1 = (ηg ) .
Para la propiedade iii), bastará con que probemos la siguiente propiedad:
\
OS (x) OS (y) 6= ∅ ⇐⇒ OS (x) = OS (y).
Pero esa propiedad se sigue si probamos la siguiente:
∀z ∈ X, z ∈ OS (x) ∩ OS (y) =⇒ y ∈ OS (x).
4Bastantes autores prefieren la notación L en lugar de η haciendo referencia a que la acción es “a
g g
izquierda” (left). En estas notas hemos preferido usar ηg porque la homotecia de multiplicación por un elemento
(del grupo o de cualquier otra etructura) tiene un papel esencial en el sustrato cultural del curso.
30 1. PRE-ÁLGEBRA

Para probarlo, supongamos que existen g1 , g2 ∈ S tales que:


z = g1 x = g2 y.
Entonces,
y = g2−1 z = g2−1 (g1 x) = g2−1 · g1 x ∈ OS (x),


porque S subgrupo (i.e. g2−1 g1 ∈ S). Por tanto, y ∈ OS (x) y, consecuentemente, OS (y) ⊆
OS (x). El mismo argumento, “mutatis mutandi”, nos lleva a concluir que OS (x) ⊆ OS (y) y
ambas órbitas han de ser iguales.
Obviamente esto significa que la siguiente es una partición de X a través de las órbitas de la
acción de S sobre X:
{OS (xi ) : i ∈ I} = {OS (x) : x ∈ X},
En particular, tendremos la relación de equivalencia ∼S como se indica en el enunciado. 
Ejemplo 1.2.26. Varios comentarios sobre la acción de grupo y las órbitas.
i) Obviamente se tiene la siguiente igualdad:
[
OS (N ) := OS (x).
x∈N

ii) Si tomamos la acción definida en el apartado ii) del Ejemplo 1.2.24 precedente:
η : K× × V ∗ −→ V∗
(λ, v) 7−→ ηλ (v) := λv,
el conjunto de las órbitas es una construcción geométrica básica conocida como , el
espacio tangente de V como K−espacio vectorial y se denota mediante P(V ). Es
la clase de los subespacios de dimensión uno como K−espacio vecorial. Nótese que,
obviamente depende del cuerpo K en consideración. En el caso V = K n se suele
denotar mediante Pn−1 (K), donde n − 1 hace referencia a la dimensión sobre K.
iii) Dada la acción de un grupo sobre sı́ mismo, las órbitas (por la acción a izquierda) de
un elemento σ ∈ G con respecto a un subgrupo S ⊆ G serán las clases a derecha, es
decir, se trata de:
OS (σ) := Sσ := {gσ : g ∈ S}.
En este caso, también se pueden considerar las órbitas a la derecha (interpretando la
acción a derecha):
(R)
OS (σ) := σS := {σg : g ∈ S}.
Esta es la notación más habitual para las clases módulo un subgrupo. En el caso de
subgrupos normales se estudia la relación entre ambos tipos de clases (ver Problema
11).
iv) Grupo de Automorfismos de una extensión de cuerpos. Los alumnos de este curso
han visto, mayoritariamente, un curso de Teorı́a de Galois por lo que, aunque no
veremos la noción de anillo y subanillo hasta dentro de algunas páginas, introducimos
aquı́ un ejemplo basado en extensiones de cuerpos y morfismos de cuerpos. Ası́,
consideremos (L, +, ·) un cuerpo y K ⊆ L un subconjunto que es subcuerpo (es decir,
(K, +) es subgrupo de (L, +) y (K × , ·) es subgrupo de (L× , ·), donde K × = K \ {0}
y L× = L \ {0}. Se dice que K ⊆ L es una extensión de cuerpos. Consideramos el
siguiente conjunto:

AutK (L) := {f : L −→ L : f es automorfismo de cuerpos y f = Id },
K K
donde automorfismo significa isomorfismo de anillos. Con la composición de aplica-
ciones (AutK (L) es un subgrupo del grupo de permutaciones (S (L), ◦). Y tenemos
inducida una acción a izquierda natural:
·: AutK (L) × L −→ L
(f, x) 7−→ f (x).
La ŕobita de un elemento x ∈ L se denomina los “elementos conjugados de x en L”.
Claramente se observa que si x ∈ L es algebraico sobre K, su órbita bajo esta acción
es finita, es decir, verifica:
] OAutK (L) (x) < ∞.

1.2. SEMIGRUPO, MONOIDE, GRUPO, ACCIONES 31

v) La relación de semejanza de matrices. Sea K un cuerpo, Mn (K) el conjunto de las


matrices n × n con coordenadas en K y GL(n, K) el grupo general lineal sobre K.
Entonces, tenemos la acción de GL(n, K) sobre Mn (K) dado mediante:
·GL(n,K) : GL(n, K) × Mn (K) −→ Mn (K)
(P, A) 7−→ P AP −1 ,
La órbita de una matriz A, en este caso, es el conjunto de las matrices semejantes
a la matriz A y estará determinada unı́vocamente por factores, invariantes, divisores
elementales y/o forma canónica de Jordan o de Frobenius. 5
vi) La relación de equivalencia de matrices. Sea K un cuerpo, Mn×m (K) el conjunto de
las matrices n × m con coordenadas en K. Consideremos los grupos generales lineales
GL(n, K) y GL(m, K) sobre K. Definamos el grupo producto cartesiano (también
producto “semi-directo”) (ver Problema 18) G := GL(n, K) × GL(m, K). Definamos
la acción de G sobre Mn×m (K) mediante:
·G : G × Mn×m (K) −→ Mn×m (K)
((P, Q), A) 7−→ P AQ−1 ,
Las órbitas inducen una relación de equivalencia denominada “equivalencia de matri-
ces”. Y el conjunto cociente es finito y está determinado por el rango. 6
vii) La relación de congruencia de matrices. Consideremos Symn (K) el conjunto de las
matrices simétricas n × n con coordenadas en K y GL(n, K) el grupo general lineal
sobre K. Entonces, tenemos la acción de GL(n, K) sobre Symn (K) dado mediante:
·GL(n,K) : GL(n, K) × Symn (K) −→ Symn (K)
(P, A) 7−→ P AP t ,
donde P t significa matriz traspuesta (i.e. P t := (qi,j ) donde P = (pi,j ) y qi,j = pj,i ,
para todo i, j). La órbita de una matriz simétrica A, en este caso, es el conjunto de
las matrices congruentes a la matriz A. En el caso K = R el conjunto cociente está
determinado por el rango y la signatura de la matriz, gracias al Lema de Cancelación
de Witt. En particular, sirve para clasificar las formas bilineales y formas cuadráticas
afı́n y proyectivamente. 7
viii) La relación de congruencia unitaria de matrices. Consideremos el cuerpo C de los
números complejos. Para cada matriz A ∈ Mn (C) denotamos por A∗ su transpuesta
conjugada. Es decir, si A = (ai,j ), su traspuesta conjugada es la matriz A∗ := (bi,j )
donde
bi,j = aj,i , ∀i, j.
Consideremos el grupo unitario U (n) := {A ∈ Mn (C) : A∗ = A−1 }. Y consideremos
el conjunto de matrices Hermitianas
Hn (C) := {A ∈ Mn (C) : A∗ = A}.
Consideremos el grupo unitario de matrices unitarias complejas:
U (n) := {A ∈ Mn (C) : A−1 = A∗ } = {A ∈ Mn (C) : AA∗ = Idn }.

la acción de grupo:
·U (n) : U (n) × Hn (C) −→ Hn (C)
(P, A) 7−→ P AP ∗ .
Se trata de una acción de grupo que define una relación de equivalencia sobre Hn (C).
En este caso, el número de órbitas está identificado con Rn . En particular, sirve para
clasificar métricamente las formas sesqui-lineales y formas cuadráticas cobre C. 8

5Teóricamente, el curso de Álgebra Lineal I está dedicado a entender esta acción del grupo GL(n, K).
6Teóricamente, el Álgebra Lineal de Bachillerato está dedicado a entender esta acción de grupo.
7Teóricamente, el curso de Álgebra Lineal II está dedicado a entender esta acción de grupo.
8Teóricamente, el curso de Álgebra Lineal II está dedicado a entender esta acción de grupo.
32 1. PRE-ÁLGEBRA

ix) Sistemas Dinámicos. Consideramos un conjunto X = M dado como una variedad


diferenciable de clase C ∞ y Dif f (M ) el grupo de sus difeomorfismos. Fijamos un
elemento f ∈ Dif f (M ) y consideramos el grupo cı́clico que genera por composición
hf i := {f n : n ∈ Z}. Definimos la acción:
·f : hf i × M −→ M
(f n , x) 7−→ f n (x).
A esta acción se la suele denominar sistema dinámico y se representa por el par (M, f ).
Ver [Shu, 1987], [HSD, 1974] o [BS, 02] para más aspectos sobre el tema.

Observación 1.2.27. La parte usualmente difı́cil cuando se trata de acciones de grupos sobre
conjuntos es la determinación de las órbitas y, en particular, la determinación de representantes
significativos (llamados “canónicos”) de cada una de las órbitas. Entre los ejemplos se pueden
ver varias acciones de grupo y se trata de determinar representantes canónicos de las órbitas,
para lo que los alumnos han sido adiestrados en diversas asignaturas precdentes a ésta.

Definición 13 (Acciones Transitivas y Fieles.). Una acción de un grupo (G, ·) sobre un


conjunto X no vacı́o dada mediante ·G : G × X −→ X
i) Se dice que la acción es transitiva si verifica:
∀x, y ∈ X, ∃g ∈ G, g · x = y.
ii) Se dice que la acción es fiel si verifica:
∀g1 , g2 ∈ G, ∃x ∈ M, g1 · x 6= g2 · x.

Definición 14 (Estabilizador de un elemento). Sea (G, ·) un grupo, X un conjunto no


vacı́o y ·G : G × X −→ X una acción de G sobre X. Sea x ∈ X un elemento. Definimos el
estabilizador de x con respecto a la acción de ·G como el subgrupo de G dado mediante :
StabG (x) := {g ∈ G : g ·G x = x}.
Es, obviamente, un subgrupo de G.
Observación 1.2.28. Nótese que un elemento g ∈ G está en el estabilizador de un elemento
x ∈ G si y solamente si la órbita Og (x) se reduce a un punto, i.e.
g ∈ StabG (x) ⇐⇒ Og (x) = {x}.

Proposición 1.2.29. Sea (G, ·) un grupo y ·G : G×X −→ X una acción a izquierda de G sobre
el conjunto X no vacı́o. La acción es fiel si y solamente si el siguiente es un monomorfismo de
grupos:
H : G −→ S (X)
g 7−→ ηg .
En particular, G se identifica con un subgrupo del grupo simétrico S (X).
Demostración. Ya hemos visto que es morfismo. Justamente, por ser fiel si dos elementos
g1 , g2 ∈ G definen la misma transformación ηg1 y ηg2 , entonces g1 = g2 por la definición de fiel.
El recı́proco es igualmente obvio y mera reescritura comparada de las definiciones. 

Observación 1.2.30 (“Fidelizando” acciones a izquierda). Algunas acciones a izquierda


(o a derecha) de un grupo sobre un conjunto pueden ser “infieles” porque varios elementos del
grupo tienen un mismo comporatmiento sobre el conjunto. Por ejemplo, el grupo aditivo (Z, +)
actuando sobre el conjunto Z/6Z del modo usual no define una acción fiel: hay demasiados
elementos de Z que definen el mismo comportamiento sobre Z/6Z. Las acciones infieles se
pueden “fidelizar” pasando simplemente al núcleo. Es decir, dada una acción a izquierda G ×
X −→ X del grupo (G, ·) sobre el conjunto X, tenemos defino un morfismo de grupos: H :
(G, ·) −→ (S (X), ◦) definido en la Proposición 1.2.25. Consideramos el núcleo de ese morfismo
ker(H) que es un subgrupo normal de (G, ·). Tenemos un monomorfismo (por el Primer Teorema
de Isomorfı́a de Grupos):
e : (G/ ker(H), ·) ,−→ (S (X), ◦).
H
1.2. SEMIGRUPO, MONOIDE, GRUPO, ACCIONES 33

Ası́, podemos construir una nueva acción:


·: (G/ ker(H)) × X −→ X
(g ker(H), x) 7−→ gx.
Es una acción a izquierda y ahora la acción es fiel porque e(H) es monomorfismo. La conclusión
es que se pueden “fidelizar” las acciones a izquierda pero, en general, no siempre es fácil describir
el grupo cociente G/ ker(H) que “fideliza” la acción.

Proposición 1.2.31 (Estabilizador y cociente). Sea G×X −→ X una acción a izquierda del
grupo (G, ·) sobre el conjunto X no vacı́o. Entonces, para cada x ∈ X se tiene una biyección
entre la órbita OG (x) y el conjunto cociente G/ ∼S , donde S := StabG (x) es el subgrupo
estabilizador del punto x ∈ X 9. En particular, si el estabilizador S es un subgrupo normal,
entonces, las órbitas son biyectables al grupo cociente G/S.
Demostración. Baste con observar la siguiente aplicación suprayectiva:
ω : G −→ OG (x)
g 7−→ gx.
Obviamente, ω(g1 ) = ω(g2 ) si y solamente si g1 x = g2 x, lo cual implica g2−1 g1 x = x o, equiva-
lentemente, g2−1 g1 ∈ S := StabG (x). Por tanto, g1 y g2 definen la misma clase de equivalencia
mediante la relación
g1 ∼S g2 ⇐⇒ g2−1 g1 ∈ S = StabG (x).
Esto nos permite definir la siguiente correspondencia:
Ω : G/ ∼S −→ OG (x)
gS 7−→ gx.
Por construción, Ω es aplicación (i.e. está bien definida), es suprayectiva por definición y, como
hemos visto, debe ser inyectiva. 

Proposición 1.2.32 (Acciones transitivas y estabilizador). Sea (G, ·) un grupo, X un


conjunto no vacı́o y ·G : G × X −→ X una acción transitiva de G sobre X.
i) Todos los estabilizadores de puntos son subgrupos conjugados y, en particular, isomor-
fos. Es decir, dados x0 , y0 ∈ X existe g ∈ G tal que
StabG (x0 ) = g · StabG (y0 ) · g −1 ,
ii) Sea x0 ∈ X un elemento cualquiera de X y sea S := StabG (x0 ). Entonces, X es
biyectable al conjunto de clases definido por S en G. Es decir, existe una biyección
natural entre X y el conjunto cociente:
G/ ∼S := {aS : a ∈ G}.
iii) Si existiera un punto y0 ∈ X tal que su estabilizador T := StabG (y0 ) es subgrupo
normal de G (en cuyo caso todos los estabilizadores son iguales)(ver Problema 11), el
conjunto X serı́a biyectable a un grupo cociente: G/T .
Demostración. Probemos la afirmación i). Sabemos que existe g ∈ G tal que gx0 = y0
por ser la acción transitiva. Entonces, se tiene la igualdad
gStabG (x0 )g −1 = StabG (y0 ).
Dado h ∈ StabG (x0 ) tenemos que hx0 = x0 . Por tanto, ghg −1 (y0 ) = (gh)x0 = gx0 = y0 . El
recı́proco es igualmente obvio. Al ser subgrupos conjugados son obviamente isomorfos.
Para la afirmación ii), retomamos la biyección descrita en la Proposición 1.2.31 precedente:
Ω : G/ ∼S −→ OG (x0 )
gS 7−→ gx0
Como la acción es transitiva, la órbita de cualquier punto es todo X, i.e. OG (x0 ) = X, y
tenemos la biyección anunciada.
9Recuérdese que un subgrupo S de un grupo G define una relación de equivalencia mediante a ∼ b sii
S
ab−1 ∈ S. Pero el conjunto cociente G/ ∼S , formado por las clases de equivalencia, no necesariamente es un
grupo con la operación natural. Para ello es necesario que S sea subgrupo normal.
34 1. PRE-ÁLGEBRA

Para la afirmación iii), siguiendo, de nuevo, la estela de la Proposición 1.2.31, consideremos la


biyección allı́ discutida:
Ω : G/ ∼S −→ OG (x)
gS 7−→ gx.
Nótese simplemente que la afirmación i) no depende del punto x0 elegido. Si, además, y0 es tal
que su estabilizador es un subgrupo normal, entonces G/ ∼T tiene estructura de grupo cociente,
que suele denotarse por G/T (ver Problema 11 más adelante). Por tanto, el conjunto X es, en
realidad, un grupo cociente G/T camuflado tras la acción. 

Ejemplo 1.2.33 (Esferas como variedades homogéneas). Consideremos la esfera unidad


real S n−1 := {x ∈ Rn : ||x||2 = 1}, donde || · ||2 es la norma euclı́dea canónica. Consideremos
también el grupo de las matrices ortogonales reales O(n) := {A ∈ GL(n, R) : A−1 = At },
donde At es la transpuesta de A. Ahora observamos la siguiente acción a izquierda:
·: (O(n), ·) × S n−1 −→ S n−1
(U, x) 7−→ U x.
Es claro que la acción es transitiva. Más aún, consideremos el polo e1 := (1, 0, . . . , 0) ∈ S n−1 .
Es sencillo verificar que el estabilizador de e1 es dado por la siguiente igualdad:
 
1 0
StabO(n) (e1 ) = { : U1 ∈ O(n − 1)} ∼= O(n − 1).
0 U1
El resultado anterior nos permite concluir que S n−1 es el cociente del grupo de matrices ortog-
onales O(n) por la acción del estabilizador de e1 . Es decir,
S n−1 ∼
= O(n)/ ∼O(n−1) .
En Geometrı́a Diferencial suele usarse la notación
S n−1 =∼ O(n)/O(n − 1),
sin poner mucha atención al hecho de que no es un grupo cociente casi nunca. De hecho, es
fácil ver que si n ≥ 2, ese cociente no es un grupo. Para ello, baste con ver que StabO(n) (e1 ) no
es subgrupo normal para n ≥ 3. Si lo fuera, todos los establizadores de todos los puntos serı́an
iguales. Mostremos, simplicando el caso n = 3. En ese caso, consideremos la matriz unitaria
que transforma el polo e1 en el polo e2 := (0, 1, 0). Es la matriz ortogonal
 
0 1 0
P := 1 0 0 ∈ O(3),
0 0 1
que verifica P e1 = e2 . Obviamente, P −1 = P t = P , con lo que también se verifica P e2 = e1 .
Por la demostración de la proposición precedente, tenemos que
StabO(3) (e2 ) = P StabO(3) (e1 )P −1 .
Pero si StabO(3) (e1 ) fuera un subgrupo normal,entonces StabO(3) (e2 ) = StabO(3) (e1 ), lo cual es
imposible: la siguiente matriz están en StabO(3) (e2 ) pero no en StabO(3) (e1 ):
 
0 0 1
Q := 0 1 0 ∈ StabO(3) (e2 ) \ StabO(3) (e1 ).
1 0 0
Es posible que el lector no quiera usar la proposición predente. Entonces, basta con que observe
el siguiente producto de matrices:
     
0 1 0 1 0 0 0 1 0 a 0 −b
1 0 0 0 a −b 1 0 0 = 0 1 0  ,
0 0 1 0 b a 0 0 1 b 0 a
donde a2 + b2 = 1. Claramente, esta matriz no está en StabO(3) (e1 ) en cuando b 6= 0, luego
StabO(3) (e1 ) no es un subgrupo normal.
El único caso en el que la esfera unidad es grupo es el caso de S 1 , que es grupo por obvias
razones pero, en el contexto actual, es grupo porque StabO(2) (e1 ) ∼
= O(1) = {±1} = Z× , donde
1.2. SEMIGRUPO, MONOIDE, GRUPO, ACCIONES 35

Z× es el grupo de las unidades del anillo (Z, +, ·) con la operación producto. En ese caso, es
sencillo ver que StabO(2) (e1 ) es un subgrupo normal y que
S1 ∼
= O(2)/O(1),
donde el ∼= no es solamente una biyección sino un isomorfismo de grupos. A las variedades
diferenciables que son cociente (salvo ∼S , no necesariamente como grupos) de dos grupos [de
Lie, topológicos, etc] se las denomina variedades homogéneas. Las esferas S n−1 son variedades
homogéas.
1.2.5. Ejercicios y problemas de la Sección 1.2.
Problema 1. Considérese el conjunto Nn y, sobre él, consideremos la estructura de monoide
definida mediante la suma coordenada a coordenada (Nn , +). Consideremos la aplicación grado
definida sobre Nn del modo siguiente:
| · | : Nn −→ N,
definida para cada µ := (µ1 , . . . , µn ) ∈ Nn , entonces
|µ| := µ1 + · · · + µn ∈ N.
A la aplicación | · | se la denomina grado total del multi-ı́ndice (o exponente monomial) µ. Se
pide:
i) Probad que, efectivamente, (Nn , +) es un monoide.
ii) Hay que probar que el par (2Z, ·), donde 2Z son los enteros pares y · es el producto.
Pruébese que se trata de un semi-grupo que no es monoide.
iii) Probad la siguiente igualdad para cada d ∈ N:
 
n d+n−1
]{µ ∈ N : |µ| = d} = .
n−1
Problema 2. Pruébese la Proposición 1.2.16 anterior.
Problema 3. Verifica que un morfismo de grupos f : (G, ∗) −→ (H, ⊥) es biyectivo si y
solamente si es isomorfismo, es decir, si y solamente si existe otro morfismo de grupos f 0 :
(H, ⊥) −→ (G, ∗) tal que:
f ◦ f 0 = IdH , f 0 ◦ f = IdG ,
donde ◦ denota composición de aplicaciones e IdG , IdH son, respectivamente, los morfismos
identidad. Concluir que un isomorfismo es un morfismo que es monomorfismo y epimorfismo
en el sentido de la Definición 9.
Problema 4. Sea (K, +, ·) un cuerpo y definamos la clase de las sumas finitas de cuadrados
en K como el conjunto:
X n
X
K := {x ∈ K : ∃n ∈ N, ∃x1 , . . . , xn ∈ K, x = x2i }.
i=1

Pruébense:
P
i) El par (P K , +) es un monoide conmutativo.
ii) El par ( K , ·) es un monoide conmutativo.
Problema 5 (Teorema de Euler sobre la suma de 4 cuadrados). Considera el conjunto
de números enteros que son suma de 4 cuadrados:
X
Z := {x ∈ Z : ∃a1 , a2 , a3 , a4 ∈ Z, x = a21 + a22 + a23 + a24 }.
4
P
Pruébese que ( 4 Z , ·) con el producto de enteros, es un monoide. ( Hint: Busca una prueba
del Teorema de Euler sobre la suma de cuatro cuadrados).
Problema 6. Sea p ∈ N un primo impar. Pruébese que las clases residuales en Z/pZ son todas
distintas:
{a2 + pZ : 0 ≤ a ≤ (p − 1)/2}.
( Hint: Usad el Teorema de Lagrange sobre el número de raı́ces de un polynomio f ∈ Z/pZ[X].)
36 1. PRE-ÁLGEBRA

Problema 7 (Principio de las Cajas de Dirichlet). Prueba el siguiente resultado, conocido


como principio de las cajas de Dirichlet (aunque la prioridad pertenece a Jean Leurechon,
Dirichlet lo redescubre y el nombre se mantiene), también conocido como Principio del Palomar:
Sean k y m dos números naturales y sea n = km + 1. Dada cualquier partición del conjunto
{1, . . . , n} en m subconjuntos disjuntos de cardinal finitoF, debe existir al menos un subconjunto
con k + 1 elementos.
Problema 8 (Teorema de Lagrange sobre los cuatro cuadrados). Prueba el siguiente
Teorema de Lagrange:
Todo entero positivo es suma de 4 cuadrados o, equivalentemente, con las notaciones de los
problema precedentes, pruébese que: X
N⊆ Z .
4

Problema 9. Consideremos el conjunto O(n) de las matrices n × n ortogonales sobre R. Es


decir,
O(n) := {O ∈ Mn (R) : Ot = O−1 },
donde O∗ es la transpuesta de O. Se pide:
i) Se debe probar que (O(n), ·) es un grupo con la operación producto de matrices.
ii) Se tiene que probar que la siguiente es una acción de O(n) sobre Mn (R):
·O : O(n) × Mn (R) −→ Mn (R)
(O, M ) 7−→ OM Ot .
iii) Determinar las órbitas de una matriz M ∈ Symn (R) (el conjunto de las matrices
simétricas cuadradas) salvo la congruencia ortogonal de matrices. ¿Existe algún rep-
resentante canónica de esa clase de equivalencia?. Explicar la relación con la diagonal-
ización de formas cuadráticas (i.e. polinomios homogéneos de grado 2 con coeficientes
reales). ( Hint: Buscad en internet (o en vuestra bibliografı́a personal o apuntes) la
Factorización de Schur real de matrices reales y explicar qué tiene que ver con este
enunciado).
iv) Indica en qué curso y asignatura estudiaste la congruencia ortogonal de matrices y su
relación con lo estudiado en este Problema.
Problema 10. Consideremos el conjunto U (n) de las matrices n × n unitarias sobre C. Es
decir,
U (n) := {U ∈ Mn (C) : U ∗ = U −1 },
donde U ∗ es la transpuesta de la conjugada de U . Se pide:
i) Probad que (U (n), ·) es un grupo con la operación producto de matrices.
ii) Probad que la siguiente es una acción de U (n) sobre Mn (C):
·U : U (n) × Mn (C) −→ Mn (C)
(U, M ) 7−→ U M U ∗.
iii) Determinar las órbitas de una matriz M ∈ Hermn (C) (matrices hermı́ticas comple-
jas, i.e. matrices que coinciden con su transpuesta conjugada M = M ∗ ). ¿Existe
algún representante canónica de esa clase de equivalencia?. ( Hint: Buscad en inter-
net (o en vuestra bibliografı́a personal o apuntes) la Factorización de Schur de matrices
complejas y explicar qué tiene que ver con este enunciado).
iv) Indica en qué curso y asignatura estudiaste la congruencia unitaria de matrices y su
relación con lo estudiado en este Problema.
Problema 11 (Subgrupo Normal). Sea (G, ∗) un grupo y G1 un subgrupo. Decimos que G1
es un subgrupo normal de G si verifica la siguiente propiedad adicional:
∀x ∈ G, xG1 x−1 := {x ∗ g ∗ x−1 : g ∈ G1 } ⊆ G1 .
Probad que las siguientes propiedades son equivalentes:
i) G1 es un subgrupo normal de (G, ∗),
ii) ∀x ∈ G, xG1 x−1 = G1 ,
iii) ∀x ∈ G, xG1 = {x ∗ g : g ∈ G1 } = {g ∗ x : g ∈ G1 } = G1 x.
Da un ejemplo de un grupo y un subgrupo que no sea normal en él.
1.2. SEMIGRUPO, MONOIDE, GRUPO, ACCIONES 37

Problema 12. Se debe probar que todo subgrupo de un grupo abeliano es un subgrupo normal.
Buscar un ejemplo de un grupo donde no se dé esta propiedad (Pista: Intentarlo con S3 y el
subgrupo H = {Id, (1 2)}).
Problema 13. Sea f : G −→ H un morfismo de grupos. Prueba que la imagen inversa de
todo subgrupo normal de H es subgrupo de G. Concluye que, en particular, el núcleo ker(f )
es un subgrupo normal de G. ¿Es también cierto que las imágenes de subgrupos normales son
subgrupos normales?. Razona la respuesta a esta pregunta ( Hint: reflexiona usando el problema
precedente).
Problema 14. Probad que todo grupo finito de cardinal menor o igual a 5 es un grupo abeliano.
¿Es eso cierto también para grupos de cardinal 6?.
Problema 15 (Grupo cociente). Sea (G, ∗) un grupo y G1 un subgrupo normal. Hay que
probar que la siguiente es una relación de equivalencia entre elementos de G:
a ∼G1 b ⇔ ab−1 ∈ G1 .
Consideremos el conjunto cociente de G por esa relación de equivalencia R/ ∼G1 . Probad que
para cada elemento x ∈ G, su clase de equivalencia con respecto a esa relación ∼G1 verifica:
[x]∼G ; = {y ∈ G : y ∼G1 x} = xG1 = G1 x.
1

Denotemos mediante G/G1 a ese conjunto cociente y definamos la siguiente correspondencia:


∗ : G/G1 × G/G1 −→ G/G1
(xG1 , yG1 ) 7−→ (x ∗ y)G1 .
Pruébese que ∗ es una aplicación y que (G/G1 , ∗) es un grupo (llamado grupo cociente de G
por el subgrupo normal G1 . Probad, adicionalmente, que la siguiente es aplicación y que es
epimorfismo de grupos:
π : G −→ G/G1
x 7−→ xG1 .
Problema 16 (Primer Teorema de Isomorfı́a). Sea f : (G, ∗) −→ (H, ⊥) un morfismo de
grupos. Entonces, existe un isomorfismo de grupos dado del modo siguiente:
f˜ : (G/Ker(f )) −→ Im(f )
xKer(f ) 7−→ ˜
f (xKer(f )) = f (x).
Se debe probar esta afirmación.
Problema 17. Buscar alguna identificación del grupo cociente (R/Z, +).
Problema 18 (Producto (cartesiano) de grupos). Dados dos grupos (G, ∗), (H, ⊥), se
define una estructura de grupo sobre el producto cartesiano G × H del modo siguiente:
2
·: (G × H) −→ G×H
((g1 , h1 ), (g2 , h2 )) 7−→ (g1 ∗ g2 , h1 ⊥ h2 ).
Se suele denominar producto semi-directo de los grupos G y H y se representa, en ocasiones,
mediante G o H. Se pide:
i) Probad que (G × H, ·) es un grupo con la anterior operación.
ii) Consideremos el conjunto Mn×m (K) de las matrices n×m (con n filas y m columnas)
y coordenadas en un cuerpo K. Consideremos el grupo producto GL(n, K)×GL(m, K)
y definamos la siguiente acción:
·Gauss : (GL(n, K) × GL(m, K)) × Mn×m (K) −→ Mn×m (K)
((P, Q), M ) 7−→ P M Q−1 .
Hay que probar que es una acción del grypo producto GL(n, K) × GL(m, K) sobre
Mn×m (K).
iii) Para cada elemento M ∈ Mn×m (K) detectar la relación de equivalencia a sociada a
esta acción. Determina algún representante canónico.
38 1. PRE-ÁLGEBRA

Problema 19 (El Espacio Proyectivo). Sea V un espacio vecorial sobre un cuerpo K.


Consideremos el grupo multiplicativo (K × , ·) donde K × := K \ {0} y el conjunto X := V \ {0}.
Definamos la acción a izquierda usual determinada por las homotecias:
η : K × × X −→ X,
definida entre los ejemplos de la Observación 1.2.24. Se pide:
i) Determinar las órbitas OK × (v) para cada v ∈ V .
ii) Expresar la relación de equivalencia que, sobre V \ {0}, definen estas órbitas. Al
conjunto cociente se le denomina espacio proyectivo sobre V y se denota mediante
P(V ).
iii) Si V = K n+1 , al espacio proyectivo P(V ) se le denota mediante Pn (K) y se le denom-
ina espacio proyectivo n−dimensional sobre el cuerpo K. Se pide:
• En el caso K = R, busca representaciones gráficas de P1 (R) y P2 (R) ( Hint: Usa
las esferas de dimensiones 1 y 2 sobre R: S 1 := {(x, y) ∈ R2 : x2 + y 2 − 1 = 0}
y S 2 := {(x, y, z) ∈ R3 : x2 + y 2 + z 2 − 1 = 0}.)
• Tomando los cuerpos finitos K = F2 y K = F3 , construye representaciones
gráficas de Pi (K), para i = 1, 2, 3.
Problema 20. Seguidamente se describen algunas acciones clásicas de grupos sobre diversas
geometrı́as elementales. Describe las acciones que conozcas, indica en qué materia o asignatura
te las han introducido y trata de determinar representantes canónicos de las órbitas. Para las
acciones o términos que no reconozcas, trata de localizar en la web los términos y trata de
resumir lo que hayas entendido al respecto.
i) Afinidades sobre el espacio afı́n Rn .
ii) (Opcional, sólo se han visto y se ha estudiado el espacio proyectivo) Homografı́as
(también proyectividades) actuando sobre el espacio proyectivo Pn (R).
iii) Isometrı́as sobre el espacio afı́n real Rn .
iv) Movimientos sobre el espacio afı́n real Rn .
v) Isometrı́as lineales sobre la esfera real S n−1 .
vi) Isometrı́as sobre el espacio proyectivo real Pn (R).
vii) Homemomorfismos sobre espacios topológicos.
Problema 21. Sea G × X −→ X una acción a izquierda de un grupo G sobre un conjunto no
vacı́o X. Se pide:
i) Pruébese que si la acción es transitiva y fiel y si X es un conjunto finito, la siguiente
aplicación es monomorfismo de grupos, pero no siempre es un isomorfismo de grupos:
H : G −→ S (X)
g 7−→ ηg ,
ii) Discútase si la anterior afirmación sigue siendo cierta cuando X no es un conjunto
finito.
Problema 22. Pruébese que el grupo ortogonal O(n) define una acción natural a izquierda
sobre la esfera unidad S n−1 := {x ∈ Rn : ||x||22 = 1}. Pruébese asimismo:
i) Es una acción transitiva.
ii) Discutir si es acción fiel.
iii) Si e1 ∈ S n−1 ⊆ Rn es el primer elemento de la llamada base canónica de Rn , pruébese
que  
1 0
StabO(n) (e1 ) = { : U ∈ O(n − 1)}.
0 U
iv) Los establizadores de todo punto son isomorfos entre sı́ e isomorfos a O(n − 1).
v) Discútase si para n ≥ 3, StabO(n) (e1 ) es un subgrupo normal de O(n) y si la esfera
tiene una estructura de cociente entre dos grupos, con la operación habitual entre
matrices:
S n−1 = O(n)/ ∼O(n−1) .
Hágase un análisis similar con la acción de O(n) sobre bolas (abiertas y/o cerradas) en Rn con
centro en el origen y radio variable.
Problema 23. Demostrar la Proposición 1.2.29 anterior.
1.2. SEMIGRUPO, MONOIDE, GRUPO, ACCIONES 39

1.2.5.1. Descomposición en Valores Singulares. En esta serie de problemas probare-


mos la existencia de Descomposición en Valores Singulares (SVD) de matrices reales y com-
plejas.
Problema 24. Sea Mn×m (R) el conjunto de las matrices con n filas y m columnas con coor-
denadas reales. Para cada k consideremos el producto euclı́deo sobre Rk usual:
h·, ·i : Rk × Rk −→ R
Pk
((a1 , . . . , ak ), (b1 , . . . , bk )) 7−→ i=1 ai bi .
Sea || · ||2 la norma inducida por ese producto euclı́deo. Para cada A ∈ Mn×m (R), defı́nase la
norma de A como operador lineal mediante la identidad siguiente:
||Av||2
||A||2 := sup{ : v ∈ Rm , v 6= 0}.
||v||2
Se pide:
i) Pruébese la siguiente identidad:
||A||2 := sup{||Av||2 : v ∈ Rm , ||v||2 = 1}.
ii) Pruébese que la norma de una matriz como operador está bien definida (es decir,
que ese supremo existe y es finito) ( Hint: Úsese que toda función continua sobre un
compacto tiene como imagen un compacto y el hecho de que S m−1 es compacto).
iii) Pruébese que existe siempre v1 ∈ S m−1 ⊆ Rm tal que ||Av1 ||2 = ||A||2 . ( Hint: Úsese
el Teorema de Weierstrass y la compacidad de S m−1 ).
iv) Pruébese que si At es la matriz transpuesta de A, entonces ||At ||2 = ||A||2 ( Hint:
Tomad v1 el vector de la anterior afirmación. Usando las definiciones y la desigualdad
de Cauchy-Schwartz probar la siguiente cadena de desigualdades:
||A||22 = ||Av1 ||22 = |(v1t At )(Av1 )| = |v1t ((At A)v1 ))| ≤
||v1 ||||At Av1 || ≤ ||At ||2 ||Av1 || = ||At ||2 ||A||2 .
v) Pruébese que para cada matriz A ∈ Mn×m (R) existen matrices ortogonales U ∈ O(n)
y V ∈ O(n) tales que  
t ||A||2 0
U AV = ,
0 A1
donde A1 ∈ M(n−1)×(m−1) (R) y los ceros representan, respectivamente matrices fila o
columa de tamaño adecuado ( Hint:Úsese la ortonormalización de Gram-Schmidt).
Problema 25 (Existencia de Descomposición en Valores Singulares (SVD) para ma-
trices reales). Con las notaciones de problema precedente, consideremos el conjunto Mn×m (R)
de matrices n × m con coordenadas reales y los grupos de matrices ortogonales O(n) y O(m).
Consideremos el grupo producto G := O(n) × O(m) con la operación descrita en el Problema
18 precedente. Definamos la siguiente aplicación :
L : G × Mn×m (R) −→ Mn×m (R)
((U, V ), A) 7−→ U AV ∗ ,
donde V ∗ es la transpuesta de V . Se pide:
i) Probar que es una acción a izquierda.
ii) Usando el Problema precedente, pruébese que para cada A ∈ Mn×m (R) la órbita de A
por la acción de G satisface que existe una matriz diagonal DA ∈ OG (A)de la forma
siguiente:  
σ1 0 · · · 0
 0 σ2 · · · 0 
 .. . 0
 
DA :=  . .. .. r×(m−r)
,

 . 
 0 0 · · · σr 
0(n−r)×r 0(n−r)×(m−r)
donde
• Las matrices 0i×j son la matrices nulas de tamaño i × j,
• r = rank(A) es el rango de la matriz A,
40 1. PRE-ÁLGEBRA

• DA ∈ Mn×m (R) (i.e. las cantidades σi están en R) y se tiene


σ1 ≥ σ2 ≥ · · · ≥ σr ≥ 0.
• σ1 = ||A||2 .
iii) Discute la unicidad de los σi ’s en la diagonalización anterior.
A la sucesión σ1 ≥ σ2 ≥ σr se la denomina los valores singulares de la matriz A y a la
descomposición DA := U AV ∗ se la denomina descomposición en valores singulares, singular
value decomposicition o, simplemente, SVD. Algunos autores, suelen llamar valores signulares
a la sucesión siguiente:
σ1 ≥ · · · σr ≥ σr+1 ≥ · · · ≥ σt ,
donde t := min{m, n} y σi = 0 para r +1 ≤ i ≤ m. Estos autores quieren simplemente enfatizar
el caso r < min{m, n} añadiendo 00 s como valores singulares. Usaremos ambos indistintamente.
Problema 26. Sea Mn×m (C) el conjunto de las matrices con n filas y m columnas con coor-
denadas complejas. Para cada k consideremos el producto hermı́tico sobre Ck usual:
h·, ·i : Ck × Ck −→ C
Pk
((a1 , . . . , ak ), (b1 , . . . , bk )) 7−→ i=1 ai bi ,

donde bi es elpconjugado de bi ∈ C. Sea || · ||2 la norma inducida por ese producto hermı́tico
(i.e. ||v||s := hv, vi. Para cada A ∈ Mn×m (C), defı́nase la norma de A como operador lineal
mediante la identidad siguiente:
||Av||2
||A||2 := sup{ : v ∈ Cm , v 6= 0}.
||v||2
Se pide:
i) Pruébese la siguiente identidad:
||A||2 := sup{||Av||2 : v ∈ Cm , ||v||2 = 1}.
ii) Pruébese que la norma de una matriz como operador está bien definida ( Hint: Úsese
que toda función continua sobre un compacto tiene como imagen un compacto y el
hecho de que la esfera unidad compleja S 2m−1 := S 1 (C) := {v ∈ Cm : ||v||2 = 1} es
compacto).
iii) Pruébese que existe siempre v1 ∈ S 2m−1 ⊆ Cm tal que ||Av1 ||2 = ||A||2 . ( Hint: Úsese
el Teorema de Weierstrass y la compacidad de S m−1 ).
iv) Pruébese que si A∗ es la matriz transpuesta conjugada de A, entonces ||A∗ ||2 = ||A||2
( Hint: Tomad v1 el vector de la anterior afirmación. Usando las definiciones y la
desigualdad de Cauchy-Schwartz probar la siguiente cadena de desigualdades:
||A||22 = ||Av1 ||22 = |(v1∗ A∗ )(Av1 )| = |v1t ((A∗ A)v1 ))| ≤
||v1 ||||A∗ Av1 || ≤ ||A∗ ||2 ||Av1 || = ||A∗ ||2 ||A||2 .
v) Pruébese que para cada matriz A ∈ Mn×m (C) existen matrices unitarias U ∈ U (n) y
V ∈ U (n) tales que  
∗ ||A||2 0
U AV = ,
0 A1
donde V ∗ es la transpuesta conjugada de V , A1 ∈ M(n−1)×(m−1) (C) y los ceros rep-
resentan, respectivamente matrices fila o columa de tamaño adecuado ( Hint:Úsese la
ortonormalización de Gram-Schmidt).
Problema 27 (Existencia de Descomposición en Valores Singulares (SVD) para
matrices complejas). Con las notaciones de problema precedente, consideremos el conjunto
Mn×m (C) de matrices n × m con coordenadas complejas y los grupos de matrices unitarias
U (n) y U (m). Consideremos el grupo producto G := U (n) × U (m) con la operación descrita
en el Problema 18 precedente. Definamos la siguiente aplicación :
L : G × Mn×m (C) −→ Mn×m (C)
((U, V ), A) 7−→ U AV ∗ ,
donde V ∗ es la transpuesta conjugada de V . Se pide:
i) Probar que es una acción a izquierda.
1.2. SEMIGRUPO, MONOIDE, GRUPO, ACCIONES 41

ii) Usando el Problema precedente, pruébese que para cada A ∈ Mn×m (C) la órbita de A
por la acción de G satisface que existe una matriz diagonal DA ∈ OG (A)de la forma
siguiente:
 
σ1 0 · · · 0
 0 σ2 · · · 0 
 .. . 0r×(m−r) 
 
DA :=  . . . . .. ,
 
 0 0 · · · σr 
0(n−r)×r 0(n−r)×(m−r)
donde
• Las matrices 0i×j son la matrices nulas de tamaño i × j,
• r = rank(A) es el rango de la matriz A,
• DA ∈ Mn×m (R) (i.e. las cantidades σi están en R) y se tiene
σ1 ≥ σ2 ≥ · · · ≥ σr ≥ 0.
• σ1 = ||A||2 .
iii) Discute la unicidad de los σi ’s en la diagonalización anterior.
A la sucesión σ1 ≥ σ2 ≥ σr se la denomina los valores singulares de la matriz A. y a la
descomposición DA := U AV ∗ se la denomina descomposición en valores singulares, singular
value decomposicition o, simplemente, SVD. Algunos autores, suelen llamar valores signulares
a la sucesión siguiente:
σ1 ≥ · · · σr ≥ σr+1 ≥ · · · ≥ σt ,
donde t := min{m, n} y σi = 0 para r +1 ≤ i ≤ m. Estos autores quieren simplemente enfatizar
el caso r < min{m, n} añadiendo 00 s como valores singulares. Usaremos ambos indistintamente.
Problema 28 (ODE’s y órbitas). Considera la ecuación diferencial con valor inicial sigu-
iente:

ẋ = f (x),
(1.2.3)
x(0) = x0
Donde x := (x1 (t), . . . , xn (t)) son las funciones que buscamos hallar, f : U ⊆ Rn −→ Rn , es una
función de clase C ∞ (U ), definida en un abierto U ⊆ Rn , x0 ∈ Rn y ẋ(t) := (x01 (t), . . . , x0n (t))
es el vertor de las derivadas con respecto a la variable t de las soluciones de la ecuación difer-
encial. Aplicando el Teorema de Existencia y Unicidad de solución (que sirve en nuestro caso),
denotemos por φt (x0 ) := x(t) una solución maximal de (1.2.3), definida para t ∈ Ix0 ⊆ R.
Definamos el conjunto
[
Ω := Ix0 × {x0 } ⊆ R × U.
x0 ∈U

Pruébese que φ está definida en Ω y que:


∂φt
(x0 ) = f (φt (x0 )).
∂t
Pruébese que si 0 ∈ Ix0 , φ0 (x0 ) = x0 y que si s, t ∈ Ix0 son tales que s + t ∈ Ix0 , entonces,
φt+s (x0 ) = φt (φs (x0 )) .
Si Ix0 = R, explica que estas propiedades definen una acción del grupo abeliano (R, +) sobre
Rn , en la que las órbitas de un punto x0 ∈ Rn vienen dads por:
OR (x0 ) := {φt (x0 ) : t ∈ R}.
Busca ejemplos de EDO’s sencillas y trata de determinar las órbitas de los puntos que definen
las condiciones iniciales10.

10En General, los autores de EDO’s no se preopuan en exceso de disponer de todo el grupo (R, +), sino que
consideran (Ix0 , +), que no tiene necesariamente una estructura de grupo abeliano, e igualmente llaman ŕbitas
a los conjuntos que acabamos de definir.
42 1. PRE-ÁLGEBRA

Problema 29. Considérese el anillo de polinomios univariados con coeficientes en un cuerpo


K (K[X], +, ·) y el espacio vectorial de las matrices cuadradas n × n sobre K Mn (K). Se
consider el grupo aditivo (K[X], +) y la acción:
·K[X] : K[X] × Mn (K) −→ Mn (K)
(p(X), A) 7−→ p(A).
Pruébese que para cada elemento A ∈ Mn (K) la órbita por la acción de K[X] es un espacio
vectorial de dimensión a lo sumo n sobre K, i.e.
dimK OK[X] (A) ≤ n.


( Hint: El alumno necesitará conocer la definición de K[X] y usar el Teorema de Hamilton-


Cayley o sucedáneos. Este material está probado con detalle más adelante en este mismo texto).
Problema 30 (Opcional). Lee los dos textos citados al principio del Capı́tulo. Pertenecen
a dos autores distintos y distantes en el tiempo (del segundo he incluido el nombre). Trata de
averiguar qué relación hay entre ellos, completa el poema citado por el primero e indica si el
texto del segundo tiene algo que ver con el Capı́tulo.

1.3. El paradigma de las acciones transitivas y fieles: Sn


1.3.1. Grupo simétrico Sn : Órbitas, ciclos, transposiciones. El paradigma de las
acciones transitivas y fieles de un grupo sobre un conjunto es el caso del grupo simétrico
(S (X), ◦) actuando sobre un conjunto finito no vacı́o. Nos ocuparemos de estudiar ese caso
particular en esta Sección. Demostrar que está generado por tipos especiales de permutaciones,
llamados ciclos y trasposiciones11 que, a su vez, están ligados a las órbitas que se definen sobre
puntos de X. Para no siobrecargar de palabras definiciones y enunciados, en toda la sección,
cuando nos referimos a un conjunto finito X supondremos implı́citamente que es no vacı́o,
aunque no se insista en decirlo.
Si X es un conjunto finito de cardinal n, podemos identificar (mediante biyección) X con el
conjunto [n] := {1, . . . , n} ⊆ N, formado por los n primeros números naturales estrictamente
positivos. Escribamos [0] = ∅ por mantener la notación. Como veremos después, si X e [n] son
biyectables sus respectivos grupos simétricos son isomorfos, por lo que podemos concentrarnos
esencialmente en el grupo simétrico de orden n! como el grupo
Sn = S ([n]) = {σ : [n] −→ [n] : σ es una biyección},
con la composición de aplicaciones. Los elementos de Sn se denominan permutaciones. El
problema esencial en el manejo y estudio de los elementos de Sn es su desmedido cardinal (ver
Problema 31), que es n!. El objetivo esencial es encontrar un conjunto Σ ⊆ Sn lo más pequeño
posible de tal modo que tengamos un morfismo suprayectivo de monoides:
ϕ : (Σ∗ , ·) −→ (Sn , ◦).
En otra palabras, se busca un conjunto generador de Sn lo más pequeño posible. Veremos que
se puede elegir con cardinal n(n−1)
2 , que es una cantidad mucho más pequeña que n!, aunque
no habrá representación única.
Retomemos la noción de órbita de un elemento por la acción de un grupo, ya introducida en la
Definición 12 anterior:

Definición 15 (Órbita de un elemento por la acción de una permutación). Sea X un


conjunto y sea x ∈ X un elemento y sea σ ∈ S (X) una permutación. Definimos la órbita de
x mediante σ como el conjunto:
Oσ (x) := {σ i (x) : i ∈ Z}.

11El diccionario de la RAE parece admitir como sinónimos “trasposición” y “transposición”, por lo que los
usaremos indistintamente.
1.3. EL PARADIGMA DE LAS ACCIONES TRANSITIVAS Y FIELES: Sn 43

Proposición 1.3.1. Sea X un conjunto finito. La órbita de un elemento x ∈ X por cualquier


permutación σ ∈ S (X) es finita y verifica:
(1.3.1) Oσ (x) := {σ k (x) : 0 ≤ k ≤ p − 1},
donde
p := min{k ∈ N : k ≥ 1, σ k ∈ StabS (X) (x)} = min{k ∈ N : k ≥ 1, σ k (x) = x},
y StabS (X) (x) es el estabilizador de x para la acción de natural de S (X) sobre X.
Además, el cardinal de la órbita es precisamente p y diremos que Oσ (x) es una órbita de longitud
p.
Por último, la permutación σ y el punto “inicial” x ∈ X inducen un orden natural entre los
elementos de la órbita Oσ (x) que viene dado mediante:
x < σ(x) < · · · < σ p−1 (x).
Demostración. La finitud de las órbitas es obvia dado que Oσ (x) ⊆ X, luego necesari-
amente es un conjunto finito. En cuanto a p se deduce fácilmente su existencia de la finitud
del orden de la permutación como elemento de un grupo finito. Pero, para facilitar el acceso al
concepto, hacemos una demostración auto-contenida que facilite el acceso a la idea subyacente.
Consideremos p definido como en el enunciado. Como StabS (X) (x) es subgrupo, para cada
q
q ∈ Z, (σ p ) = σ pq ∈ StabS (X) (x). Por tanto, concluimos que para cada q ∈ Z, se tiene:
σ qp (x) = x.
Dado n ∈ Z, hacemos la división euclı́dea en Z de n por p. Tendremos que existe q ∈ Z y existe
k ∈ N tales que:
• 0 ≤ k ≤ p − 1,
• n = qp + k.
Por tanto, se tiene la siguiente cadena de igualdades:
σ n (x) = σ qp+k (x) = σ k (σ qp (x)) = σ k (x).
Lo cual prueba la igualdad (1.3.1).
Para finalizar, queda simplemente por probar que los elementos de la forma σ k (x), con 0 ≤
k ≤ p − 1 son todos distintos. Para probarlo, consideremos k y k 0 , con 0 ≤ k, k 0 ≤ p − 1.
0 0
Si σ k (x) = σ k (x), supongamos que k ≥ k 0 . Como σ es una biyección, también lo será σ k y
concluiremos que
0
 0
 0 0
σ k (x) = σ k σ k−k (x) = σ k (x) =⇒ σ k−k (x) = x.
0
Luego k − k 0 ≤ p − 1 es tal que σ k−k ∈ StabS (X) (x) y p es la mı́nima potencia de σ que le hace
estar en el estabilizador StabS (X) (x). La única posibilidad es que k−k 0 = 0 o, equivalentemente,
k = k0 .
En cuanto a la relación de orden sobre Oσ (x) es obvia y natural dado que todos los elementos
descritos son distinto entre sı́. 

Corolario 1.3.2. Con las notaciones de la Proposición anterior, dados x, y ∈ X, se tiene que
Oσ (x) ∩ Oσ (y) 6= ∅ ⇐⇒ Oσ (x) = Oσ (y).
En particular, las órbitas definen una relación de equivalencia sobre [n], cuyas clases de equiv-
alencia son precisamente las órbitas. Más aún, para cada x ∈ X y cada órbita Oσ (x) definida
por algún elemento σ ∈ S (X), se tiene que
σ(X \ Oσ (x)) ⊆ (X \ Oσ (x)).
Y la restricción de σ a X \ Oσ (x) es una permutación de X \ Oσ (x), i.e. σ |X\Oσ (x) ∈ S (X \
Oσ (x)).
Demostración. No es sino la traducción al caso de permutaciones de la Proposición 1.2.25
anterior. El resto de afirmaciones son obvias. 
44 1. PRE-ÁLGEBRA

Observación 1.3.3 (Subconjuntos de [n] con un orden). Las órbitas definidas por una
permutación σ ∈ S (X) sobre un punto son subconjuntos de X con una relación de orden
inducida por la propia permutacón. Consideremos ası́ subconjuntos de un conjunto finito X
con un orden implı́cito. Para denotarlos consideraremos subconjuntos S ⊆]n] descritos mediante
la expresión:
S = {x1 < x2 < . . . < xs }.

Definición 16 (Ciclo). Sea X un conjunto finito y sea τ : X −→ X una permutación sobre


X. Decimos que τ es un ciclo de orden k (o k−ciclo) si existe un conjunto finito ordenado
O := {x1 < · · · < xk } ⊆ X de cardinal k verificando las propiedades siguientes:
i) La órbita de τ sobre x1 verifica:
Oτ (x1 ) = O.
ii) El orden en Oτ (x) es el inducido por la permutación τ , esto es, xi+1 = τ (xi ) = τ i (x1 ),
para 0 ≤ i ≤ k − 1, con τ (xk ) = x1 .
iii) Para todo y ∈ X \ {x1 , . . . , xk }, τ (y) = y, es decir,

τ X\O = IdX .

X\O

Al conjunto ordenado O se le denomina órbita distinguido del ciclo τ . A los 2−ciclos se les
denomina transposiciones.

Notación 1.3.4 (Notación usual para los ciclos). Un ciclo σ : [n] −→ [n] lleva intrı́n-
secamente implı́cito una ordenación sobre los elementos de la órbita de un punto x. La órbita
fue definida como conjunto, pero el ciclo impone una ordenación. Por ello, se suele utilizar
la notación vectorial (x1 x2 · · · xk ) para describir un ciclo como en la definición precedente..
Ası́, por ejemplo, tomando I5 := {1, 2, 3, 4, 5}, el ciclo de orden 3 descrito mediante (4 3 1),
representa la permutación
 
1 2 3 4 5
.
4 2 1 3 5
Obsérvese que la identidad es el único ciclo de orden 1.

Observación 1.3.5 (Ciclos con órbitas distinguidas disjuntas conmutan entre sı́).
Supongamos dados dos ciclos τ1 y τ2 con órbitas distinguidas O1 y O2 respectivamente. Supong-
amos que O1 ∩ O2 = ∅. Entonces,
τ1 ◦ τ2 = τ2 ◦ τ1 .
Es una propiedad de sencilla verificación a partir de la definición de ciclo.

Proposición 1.3.6 (Órbitas y Ciclos). Sea X un conjunto finito y sea S (X) el grupo de las
permutaciones sobre X. Se tiene:
i) Dada una permutación σ ∈ S (X), y dado x ∈ X, sea O := Oσ (x) la órbita que
determinan σ y x, con el orden inducido por la permutación σ. Supongamos que la
órbita O es de cardinal p. Entonces, existe un único p−ciclo τO ∈ S (X) tal que:

τO O = σ, τO X\O = IdX\O .

Es decir, τO sobre O se comporta como σ y τO sobre el complementario X \ O se


comporta como la identidad.
ii) Dado un ciclo τ ∈ S (X) de orden mayor o igual que 2, hay una órbita distinguida de
cardinal igual al orden del ciclo y que es dada por la propiedad:
Oτ (x) = {y ∈ X : τ (y) 6= y}.
El resto de las órbitas tienen cardinal 1.
Demostración. Veamos cada afirmación separadamente.
1.3. EL PARADIGMA DE LAS ACCIONES TRANSITIVAS Y FIELES: Sn 45

i) Para la primera afirmación, si p ∈ N es el mı́nimo entero tal que σ p ∈ StabS (X) (x)
basta con observar que la órbita toma la forma:
Oσ (x) := {x1 := x := σ 0 (x), x2 = σ 1 (x1 ), . . . , xp = σ p−1 (x1 ) = σ(xp−1 )},
y, además, σ(xp ) = x1 . Como se ha observado anteriormente, el conjunto O := Oσ (x)
tiene un orden natural inducido por σ:
O := Oσ (x) := {x1 < x2 < . . . < xp }.
Definamos, con estas notaciones, τO como el ciclo siguiente:
τO := (x1 x2 x3 · · · xp ).
Claramente, tenemos las propiedades indicadas, dado que
• τO (xi ) = xi+1 = σ(xi ), para cada i, 1 ≤ i ≤ p − 1,
• τO (y) = y para todo y ∈ X \ O,
• τO (xp ) = x1 = x = σ(xp )).
Es claro también que τO es único dado que σ y x1 = x lo definen completamente.
ii) Para la segunda afirmación, basta con reproducir la definición de ciclo. Si σ ∈ S (X)
es un ciclo de orden p es porque existe x ∈ X tal que la órbita O := Oσ (x) tiene
cardinal p y verifica:
Oσ (x) = {x1 := x = σ 0 (x), σ 1 (x), . . . , σ t−1 (x)},
y σ p (x) = x. Adicionalmente, σ |X\O = Id. Por tanto τO satisface las propiedades
descritas en ii).


Observación 1.3.7. La anterior Proposición nos indica que existe una biyección entre las
órbitas (ordenadas y definidas por una permutación) y los ciclos que, además, transforma
cardinal de las órbitas en orden de ciclo.

Proposición 1.3.8. Dados X e Y dos conjuntos finitos del mismo cardinal, entonces, los re-
spectivos grupos de permutaciones (S (X), ◦) y (S (Y ), ◦) son isomorfos como grupos. Más aún,
el isomorfismo respeta ciclos, órbitas, órdenes de ciclos y longitud de las órbitas. Recı́procamente,
si estos grupos de permutaciones son isomorfos, entonces X e Y son biyectables y, por tanto,
tienen el mismo cardinal.
Demostración. Supongamos que existe f : X −→ Y una biyección entre los conjuntos
X e Y (o, lo que es lo mismo, que tienen el mismo cardinal). Entonces, podemos definir una
transformación:
f ∗ : S (X) −→ S (Y )
σ 7−→ f ◦ σ ◦ f −1 ,
donde f −1 : Y −→ X es la inversa de f (que existe por ser f biyección) y f ◦ σ ◦ f −1 : Y −→ Y
es la composición de estas tres aplicaciones, es decir,
f ◦ σ ◦ f −1 (y) = f (σ(f −1 (y))), ∀y ∈ Y.
Es claro que f ∗ es una biyección cuya inversa es la aplicación:
f∗ : S (Y ) −→ S (X)
τ 7−→ f −1 ◦ τ ◦ f.
Es decir, se verifica:
f ∗ ◦ f∗ = IdS (X) , f∗ ◦ f ∗ = IdS (Y ) .
Es claro también (mera verificación) que tanto f ∗ como f∗ son morfismos de grupo, con lo que
queda probado que S (X) y S (Y ) son isomorfos. En cuanto al hecho de que se preserven los
ciclos y las órbitas, simplemente se trata de verificar que si σ ∈ S (X) es un ciclo de orden k,
entonces f ∗ (σ) es un ciclo del mismo orden. Y lo mismo sucede para τ ∈ S (Y ) y f∗ (τ ). En
cuanto a las órbitas, se tiene la identidad siguiente:
f (Oσ (x)) = Of ∗ (σ) (f (x)),
46 1. PRE-ÁLGEBRA

para cada x ∈ X y para cada σ ∈ S (X). Basta con escribir las identidades respectivas y
comprobar. Lo mismo se puede hacer con las órbitas de todo elemento y ∈ Y y toda permutación
τ ∈ S (Y ). Para la última afirmación del enunciado. Recuérdese, antes de nada, que decir “
X es un conjunto finito de cardinal n ∈ N” es lo mismo que decir que existe una biyección
entre X e [n] para algún n ∈ N”. Por tanto, S (X) será isomorfo al grupo Sn de orden n!.
En particular, si dos grupos S (X) y S (Y ) son isomorfos, ambos tendrán el mismo cardinal
(por ser biyectivos) y dicho cardinal coincidirá con algún n!. Pero, entonces, necesariamente, los
cardinales de X y de Y han de ser iguales a n ∈ N y esto significa que X e Y son biyectables. 

Teorema 1.3.9. Toda permutación sobre un conjunto finito es composición de un número finito
de ciclos con óribtas disntiguidad dos a dos disjuntas y de orden mayor o igual que 2. Es decir,
dada σ ∈ Sn una permutación, existe una presentación de σ como producto finito:
(1.3.2) σ = τO1 ◦ · · · ◦ τOr ,
de tal modo que:
i) Para cada i, 1 ≤ i ≤ r, ](Oi ) ≥ 2 (luego τOi es un ciclo de orden mayor o igual que
dos).
ii) Dados i, j ∈ [r] tales que i 6= j, entonces Oi ∩ Oj = ∅.
Más aún, la descomposición descrita en (1.3.2), con las condiciones i) y ii) es única, salvo
permutación de los ciclos que aparecen en ella.
Demostración. Supongamos X nuestro conjunto finito y sea σ ∈ S (X) una permutación
sobre un conjunto finito X. Por lo descrito en el apartado iii) de la Proposición 1.2.25, las
órbitas de σ sobre elementos de X definen una relación de equivalencia sobre X. En particular,
como X es finito, existe una partición de X de la forma siguiente:
X = O1 ∪˙ · · · ∪O
˙ s,
donde la unión es disjunta y cada Oi := Oσ (xi ) es la órbita de algún elemento xi ∈ X. Además,
conforme a la Proposición 1.3.1 esas órbitas tienen inducida una ordenación natural a partir de
σ. Esto nos permite considerar los conjuntos Oi ordenados mediante:
Oi = {xi < σ(xi ) < · · · < σ pi −1 (xi )}.
Aplicando la Proposición 1.3.6, podemos considerar los ciclos τOi allı́ descritos y que verifican:
• La permutación σ satisface:

σ Oi = τOi Oi ,
• El ciclo es la identidad fuera de su órbita:

τOi X\O = IdX .

i X\Oi

Es decir, consideramos el ciclo:


τOi = xi σ(xi ) · · · σ pi −1 (xi ) ∈ Sn .


Veamos que se tiene:


(1.3.3) σ = τO1 ◦ · · · ◦ τOs .
Obsérvese, además, que estos ciclos conmutan entre sı́ por tener órbitas distinguidas disjuntas
(ver Observación 1.3.5). Es decir, sabemos que
τOi ◦ τOj = τOj ◦ τOi , ∀ i, j ∈ [s].
Ahora, dado x ∈ X, existe un único i tal que x ∈ Oi (las órbitas son disjuntas dos a dos, por
formar una partición de X). Entonces,

σ(x) = σ (x) = τOi (x) = τOi (x),
Oi Oi
y, además, para j 6= i, se tiene:
τOj Oi (x) = x.
Por tanto, para x ∈ Oi , dado que estos ciclos permutan entre sı́, se prueba de modo elemental
que:

τO1 ◦ · · · ◦ τOs (x) = τOi ◦ τO1 ◦ · · · ◦ τOi−1 ◦ τOi+1 ◦ · · · ◦ τOs (x) = τOi (x) = σ(x).
1.3. EL PARADIGMA DE LAS ACCIONES TRANSITIVAS Y FIELES: Sn 47

Como todos los elementos de X deben estar en alguna órbita, se tiene la Igualdad (1.3.3).
Seguidamente, podemos suponer, salvo ordenación de los ı́ndices, que existe r ≤ s tal que:
i) ](Oi ) ≥ 2, para cada i ∈ {1, . . . , r},
ii) ](Oj ) = 1, para cada j tal que r + 1 ≤ j ≤ s.
Consideremos el conjunto
A = O1 ∪˙ · · · ∪O
˙ r ⊆ X.
que es una unión disjunta de las órbitas de σ de cardinal mayor o igual que 2. Observemos que
para i ∈ {1, . . . , r}, se tiene:

(1.3.4) σ
X\A
= IdX
X\A
= τO
i X\A
= τO ◦ · · · τO
1 r
.
X\A
La razón tiene que ver con el cardinal de las órbitas de los elementos x 6∈ A. Si un elemento
x 6∈ A, entonces su órbita Oσ (x) debe ser una de las órbitas Or+1 , . . . , Os , que son órbitas
de cardinal 1. Entonces ](Oσ (x)) = 1 o, equivalentemente, Oσ (x) = {x}, lo que significa que
σ(x) = x.
De otro lado, para j ∈ {r + 1, . . . , s}, se tiene que

τOj A = IdX ,

A
porque A ∩ Oj = ∅ para j ∈ {r + 1, . . . , s}. Por tanto, concluimos que:

(1.3.5) σ A = τO1 ◦ · · · ◦ τOs A = τO1 ◦ · · · ◦ τOr A .
Juntando las igualdades (1.3.4) y (1.3.5), concluimos que
σ = τO1 ◦ · · · ◦ τOr .
Y tenemos probada la primera afirmación del enunciado relativa la existencia de tal descom-
posición.

Deajamos al inteligente lector la verificación de que una descomposición como la descrita en


(1.3.2), satisfaciendo las propiedades i) y ii), ha de ser única, salvo permutación de las órbitas
distinguidas. De hecho, con una tal descomposición, las órbitas de cardinal mayor o igual que
2 se σ sobre puntos de X han de ser exacta,emte las órbitas distinguidas {O1 , . . . , Or }. 

Observación 1.3.10 (La representación por ciclos, aunque con cierta unicidad, no es
suficiente para expresar las permutaciones). A pesar de la unicidad mostrada en el antrior
resultado, no es satisfactorio para poder decir que disponemos de una buena representación
del grupo de las permutaciones Sn mediante las órbitas que definen. La dificultad de esta
representación de las permutaciones es que si bien hay n! permutaciones y hay menos ciclos que
permutaciones, el número de ciclos sigue siendo una cantidad esponencial en n y no resulta un
gran salto cualitativos representar permutaciones mediante un alfabeto de cardinal exponencial
en n. De ahı́ que se busque en un conjunto de menor cardinal para representar las permutaciones
y por eso se restringe la búsqueda a las transposiciones que exhibimos a continuación.

Definición 17 (Transposiciones adyacentes). Consideremos X = [n] := {1, . . . , n}. Lla-


maremos transposiciones adyacentes a todas las transposiciones (i j) ∈ S ([n]), tales que
i ∈ {1, . . . , n − 1} y j = i + 1.

Observación 1.3.11. Nótese que la transposición (i i + 1) = (i + 1 i), con lo que la definición


anterior incluye como transposiciones adyacentes tanto (1 2), (2 3) como (2 1), (3 2) por ser las
mismas. En particular, si X = [n] las únicas transposiciones adyacentes son:
(1 2), (2 3), . . . , (n − 1 n).

Teorema 1.3.12. Se verifican las siguientes propiedades:


i) Toda permutación sobre un conjunto finito es una composición finita de transposi-
ciones.
ii) Toda permutación sobre [n] es una composición finita de transposiciones adyacentes.
De hecho, toda transposición es composición de un número impar de transposiciones
adyacentes.
48 1. PRE-ÁLGEBRA

En particular, el conjunto de las transposiciones es un conjunto de generadores del grupo


simétrico, Más aún, para cualquier conjunto finito X y para cada biyección f : X −→ [n],
el grupo S (X) está generado por las permutaciones adyacentes.
Demostración. i) Por lo visto en el Teorema 1.3.9, basta con que probemos que
los ciclos de cualquier orden se pueden dar como composición finita de transposiciones.
Lo haremos por inducción en el orden.
Dado un ciclo de orden 3 (x1 x2 x3 ) podemos reescribirlo como la composición de dos
transposiciones:
(x1 x2 x3 ) = (x1 x3 ) ◦ (x1 x2 ).
Para un ciclo de orden r, (x1 x2 · · · xr ), tenemos que
(x1 x2 · · · xr ) = (x1 x3 · · · xr ) ◦ (x1 x2 ),
y la propiedad se sigue por inducción. Verificar esta igualdad es inmediato y el lector
puede hacerlo por su cuenta. Obsérvese que el número de transposiciones es igual al
orden del ciclo (ver Problema 34 más abajo).
ii) Para la segunda afirmación basta con que probemos que toda transposición es com-
posición de un número impar de transposiciones adyacentes. La demostración es
evidente dado que
(k l) = (k k + 1) ◦ (k + 1 k + 2) ◦ · · · (l − 1 l) ◦ (l − 1 l − 2) ◦ · · · ◦ (k + 1 k).
El número de transposiciones adyacentes es (k − l) + (k − l) − 1 = 2(k − l) − 1.


Observación 1.3.13. Dado el conjunto finito Σ := {(i, j) : i < j}. Es fácil verificar que Σ es
un conjunto cuyo cardinal satisface:
n−1
X n(n − 1)
](Σ) = r= .
r=1
2
El anterior resultado simplemente significa que tenemos un morfismo suprayectivo de monoides:
ϕ : (Σ∗ , ·) −→ (Sn , ·).
donde a cada par (i, j) se le asigna la transposición ϕ((i, j)) := (i j). Hemos reducido el número
de elementos de Sn con los que “representar” las permutaciones, pero, a cambio, hemos perdido
la unicidad que suponı́a disponer de la presentación mediante ciclos asociados a las órbitas.
Obviamente, se tiene que la identidad puede representarse de varias formas mediante producto
de transposiciones (si n ≥ 3):
Id = (1 2)(1 2) = (1 3)(1 3) = (2 3)(2 3).
[n]

Es decir, resulta más difı́cil controlar la forma de expresar el cociente Σ∗ / ∼∼


= Sn . En nuestra
ayuda viene la noción de ı́ndice de una permutación que trataremos en la sección siguiente.
Al menos podremos controlar una cierta cualidad de las transposiciones usadas: su paridad es
independiente de la representación elegida.

1.3.2. Índice de una permutación. Daremos dos presentaciones de esta noción de


ı́ndice. Una que viene dada de forma “interna”, teniendo en cuenta cómo se articulan las trans-
posiciones en la descomposición de la identidad. La segunda tendrán en cuenta cómo las trans-
posiciones suponene un cambio de “orden” de los elementos del conjunto X = [n] = {1, . . . , n}.
1.3.2.1. Índice por la naturaleza de la identidad. Comencemos probando el sigu-
iente resultado que prueba que, por la naturaleza intrı́nseca de la identidad, el número de
transposiciones que aparecen en ella tiene que ser par.
Teorema 1.3.14 (Paridad de transposiciones de la Identidad). Con las notaciones prec-
dentes, sea Id[n] ∈ Sn la identidad sobre [n] y supongamos que existe una descomposición
(1.3.6) Id
[n]
:= σ1 · · · σr ,
donde cada σ` ∈ Sn es una transposición de orden 2. Entonces, r es un número par.
1.3. EL PARADIGMA DE LAS ACCIONES TRANSITIVAS Y FIELES: Sn 49

Demostración. Razonaremos por inducción en r (la menos elegante de las formas de de-
mostración). Es claro que si r = 1, no puede existir una descomposición del tipo que se exhibe
en la Identidad (1.3.6). Pues si tal descomposición existiera, tendrı́amos Id[n] = σ1 , donde σ1
es una transposición de orden 2. Por tanto, tiene que haber un i ∈ {1, . . . , n} tal que σ1 (i) 6= i
(i.e. σ1 = (i j) con j 6= i). Pero esto es imposible si Id[n] = σ1 . El caso r = 2 siendo obvio,
analicemos el caso de cualquier r.
Supongamos, por hipótesis inductiva, que el enunciado es cierto para cualquier r < t y consid-
eremos una descomposición:
[n] := σ1 · · · σt ,
donde cada σi es una transposición de orden 2. Consideremos la última de las transposiciones σt
y debe existir un ı́ndice i ∈ {1, . . . , n} tal que σt (i) 6= i (es decir, suponemos que σt = (i j) para
algún j 6= i). Consideremos el subconjunto S(i) ⊆ {1, . . . , r} dado por los número naturales
m ∈ {1, . . . , t} tales que se verifican la siguiente propiedad:
Existen transposiciones ρm , ρm+1 , . . . , ρt tales que:
• Id[n] = σ1 σ2 · · · σm−1 ρm · · · ρt .
• Para cada ` con m + 1 ≤ ` ≤ t, ρ` (i) = i.
• ρm (i) 6= i.
Nótese que S(i) 6= ∅ porque t ∈ S(i):
simplemente obsérvese la descomposición Id[n] := σ1 · · · σt de la que hemos partido.
Ahora consideremos s = min S(i), el menor de esos elementos en S(i). Observamos que,
necesariamente, s ≥ 2. Porque si s = 1, entonces 1 ∈ S(i) y tendrı́amos una descomposición de
la identidad
Id = ρ1 ρ2 · · · ρt ,
[n]
donde ρ` (i) = i para ` ≥ 2, mientras que ρ1 (i) 6= i. Entonces, tendrı́amos la siguiente con-
tradicción:
i = Id[n] (i) = ρ1 ◦ ρ2 ◦ · · · ◦ ρt (i) = ρ1 (i) 6= i.
Dado que s ≥ 2, tenemos una presentación de Id[n] de la forma siguiente:
Id
[n]
= σ1 σ2 · · · σs−1 ρs · · · ρt .

Supongamos que ρs = (i j), con inot = j y consideremos las distintas posibilidades para el
producto σs−1 ρs :
• Supongamos σs−1 = (i k). En ese caso observamos que:
σs−1 ρs = (i k)(i j) = (i j)(j k),
con lo que tenemos la descomposición:
Id
[n]
= σ1 σ2 · · · σs−2 ρs (j k)ρs+1 · · · ρt .

Esto significa que s − 1 ∈ S(i), lo cual contradice la minimalidad de s y es imposible.


• Supongamos que σs−1 = (j k), con k 6= i, j. En ese caso observamos que:
σs−1 ρs = (j k)(i j) = (i k)(j k),
con lo que tenemos la descomposición:
Id
[n]
= σ1 σ2 · · · σs−2 (i k)(j k)ρs+1 · · · ρt .

Esto significa que s − 1 ∈ S(i), lo cual contradice la minimalidad de s y es, de nuevo,


imposible.
• σs−1 = (u k), con u, k 6∈ {i, j}. En ese caso, observamos que:
σs−1 ρs = (u k)(i j) = (i j)(u k) = ρs σs−1 ,
porque son transposiciones disjuntas y, por tanto, conmutan. Por tanto, tenemos una
descomposición
Id
[n]
= σ1 σ2 · · · σs−2 ρs (u k)ρs+1 · · · ρt .

Esto significa, finalmente, que s − 1 ∈ S(i) contradiciendo la minimalidad de s.


50 1. PRE-ÁLGEBRA

De los tres casos anteriores, deducimos que tenemos una descomposición:


Id
[n]
= σ1 σ2 · · · σs−1 ρs · · · ρt ,
donde ρs = (i j), ρ` (i) = i, para s + 1 ≤ ` ≤ t y, además, σs−1 = (u1 u2 ) no está en ninguno
de los tres casos precedentes. pero esos significa que {u1 , u2 } = {i, j} o, equivalentemente,
σs−1 = (i j). Por tanto, σs−1 ρs = (i j)(i j) = Id[n] . Ası́, tendrmoes una descomposición de la
identidad con la forma:
Id = σ1 σ2 · · · σs−2 ρs+1 · · · ρt ,
[n]
donde todas las permutaciones que aparecen son transposiciones y hay t − 2 transposiciones.
Por hip’otesis inductiva, tendremos que t − 2 ∈ 2N y, en consecuencia, t es un número par. 

Definición 18 (Índice de una permutación). La siguiente correspondencia se denomina


ı́ndice de una permutación :

I : Sn −→ Z× = {±1}
σ 7−→ (−1)m ,
donde σ admite una descomposición σ := ρ1 · · · ρm , donde ρ` son transposiciones de orden 2.
Nótese que la dificultad con esta correspondencia I consiste en probar que es una aplicación.
Es decir,
Teorema 1.3.15 (El ı́ndice es un morfismo de grupos). La correspondencia I es un
morfismo de grupos.
Demostración. Comencemos probando que I está bien definida. Esto es, comencemos
probando que, dado σ ∈ Sn , entonces dadas dos descomposiciones de σ como producto de
transposiciones
σ = ρ1 · · · ρm = τ1 · · · τs ,
entonces m = s mod 2. La razón es el Teorema 1.3.14 precedente. Estas dos descomposiciones
inducen una descomposición de la identidad en producto de m + s transposiciones (recuŕdese
que la inversa de una transposición es una transposición):
Id
[n]
= ρ1 · · · ρm τ1−1 · · · τs−1 ,
con lo que m + s ∈ 2N y m = s mod 2. En conclusión, (−1)m = (−1)s y, por tanto, I está
bien definida.
Es casi inmediato probar que, entonces, es morfismo de grupos dado que se comporta como la
adjunaicón de palabras, es decir, si tenemos
σ = ρ1 · · · ρm , τ = τ1 · · · τs ,
entonces,
I(στ ) = I(ρ1 · · · ρm τ1 · · · τs ) = (−1)m+s = I(σ)I(τ ).
En cuanto a la identidad, el Teorema precedente indica que I(Id[n] ) = 1. 

1.3.2.2. Índice de una permutación por alteración del orden (Alternativo).


En esta subsección mostraremos una prueba alternativa de los mismos hechos. Pero, en este
caso, no haremos una prueba por inducción sino que contaremos con un elemento externo.
Como en la subsección precedente, consideremos en esta Subsección X = [n] = {1, . . . , n} y el
grupo simétrico Sn . Consideremos el conjunto de pares de elementos de [n] siguiente:
A := {(i, j) ∈ [n]2 : i < j}.
Nótese que el cardinal de A satisface:
n(n − 1)
](A) = 1 + 2 + · · · + (n − 1) = .
2
Para una permutación σ ∈ Sn , obtendremos una descomposición de A en dos subconjuntos
disjuntos [
A = A+ (σ) A− (σ),
1.3. EL PARADIGMA DE LAS ACCIONES TRANSITIVAS Y FIELES: Sn 51

donde
A+ (σ) := {(i, j) ∈ A : σ(i) < σ(j)}, A− (σ) := {(i, j) ∈ A : σ(i) > σ(j)}.
Los elementos de A− (σ) se llaman inversiones de la permutación σ. Denotaremos por
N+ (σ) := ](A+ (σ)), N− (σ) := ](A− (σ)),
y al número N− (σ) se le llama el número de inversiones de la permutación σ.
Observación 1.3.16. Las siguientes propiedades son obvias de verificar:
i) Si Id[n] ∈ Sn es la identidad, N− (Id[n] ) = 0.
ii) Para cualquier transposición σ ∈ Sn , se tiene N− (σ) = 1.
Definición 19 (Índice de una Permutación (alternativo)). Con las anteriores nota-
ciones, se llama ı́ndice de una permutación σ ∈ Sn al elemento del grupo multiplicativo
Z× := {+1, −1}, dado mediante:
N− (σ)
ι(σ) := (−1) ∈ Z× .
Teorema 1.3.17. El ı́ndice ι define un morfismo de grupos:
ι: (Sn , ◦) −→ (Z× , ·)
N (σ)
σ 7−→ ι(σ) := (−1) − ,
donde la operación · sobre Z× es la multiplicación. En otras palabras, se verifican las dos
propiedades siguientes:
i) ι(Id[n] ) = 1 ∈ Z× ,
ii) Para todo par de permutaciones σ, τ ∈ Sn , se tiene:
ι(σ ◦ τ ) = ι(σ) · ι(τ ).
Demostración. Nótese que se trata de probar simplemente que para todo par de per-
mutaciones σ, τ ∈ Sn , se tiene:
ι(σ ◦ τ ) = ι(σ) · ι(τ ).
Obsérvese, además, que esta propiedad es equivalente a probar que
N− (σ ◦ τ ) = N− (σ) + N− (τ ), mod 2.
Para ello, comencemos definiendo los conjuntos siguientes para una permutación σ fijada:
τ + (A+ (τ )) = {(τ (i), τ (j)) : (i, j) ∈ A+ (τ )},
τ − (A− (τ )) = {(τ (j), τ (i)) : (i, j) ∈ A− (τ )}.
Comencemos observando que
[
A = τ + (A+ (τ )) τ − (A− (τ )),
siendo ésta una unión disjunta. La razón es obvia, dado (i, j) ∈ A, han de existir i1 , j1 ∈ [n]
tales que i = τ (i1 ), j = τ (j1 ). Ahora se tiene:
• Si i1 < j1 , como (i, j) ∈ A (i.e. i < j), entonces (i1 , j1 ) ∈ A+ (τ ) y, por tanto,
(i, j) = (τ (i1 , τ (j1 )) ∈ τ + (A+ (τ )).
• Si i1 > j1 , como (i, j) ∈ A (i.e. i < j), entonces (j1 , i1 ) ∈ A− (τ ) y, por tanto,
(i, j) = (τ (j1 ), τ (i1 )) ∈ τ − (A− (τ )).
De otro lado, como τ es una biyección, es fácil concluir que los cardinales verifican:
N+ (τ ) = ](τ + (A+ (τ ))), N− (τ ) = ](τ − (A− (τ ))).
Ahora, consideremos los siguientes cuatro conjuntos disjuntos dos a dos y sus cardinales:
• El conjunto A++ (σ, τ ), de cardinal N++ (σ, τ ) = ](A++ (σ, τ )), dado mediante:
A++ (σ, τ ) := {(i, j) ∈ A+ (σ) : (i, j) ∈ τ + (A+ (τ ))}.
• El conjunto A+− (σ, τ ), de cardinal N+− (σ, τ ) = ](A+− (σ, τ )), dado mediante:
A+− (σ, τ ) := {(i, j) ∈ A+ (σ) : (i, j) ∈ τ − (A− (τ ))}.
• El conjunto A−+ (σ, τ ), de cardinal N−+ (σ, τ ) = ](A−+ (σ, τ )), dado mediante:
A−+ (σ, τ ) := {(i, j) ∈ A− (σ) : (i, j) ∈ τ + (A+ (τ ))}.
52 1. PRE-ÁLGEBRA

• El conjunto A−− (σ, τ ), de cardinal N−− (σ, τ ) = ](A−− (σ, τ )), dado mediante:
A−− (σ, τ ) := {(i, j) ∈ A− (σ) : (i, j) ∈ τ − (A− (τ ))}.
Las siguientes propiedades son de mera comprobación:
[
A+ (σ ◦ τ ) = A++ (σ, τ ) A−− (σ, τ ),
[
A− (σ ◦ τ ) = A+− (σ, τ ) A−+ (σ, τ ),
[
A+ (σ) = A++ (σ, τ ) A+− (σ, τ ),
A− (σ) ∼
[
= A−+ (σ, τ ) A−− (σ, τ ),
τ + (A+ (τ )) ∼
[
= A++ (σ, τ ) A−+ (σ, τ ),
τ − (A− (τ )) ∼
[
= A+− (σ, τ ) A−− (σ, τ ),
donde ∼= significa biyectables. Obsérvese, como pista esencial, que
A− (σ) = {(i, j) ∈ τ + (A+ (τ )) : σ(i) > σ(j)} ∪ {(i, j) ∈ τ − (A− (τ )) : σ(i) > σ(j)}.
Y que esta identidad induce la biyección señalada porque se tienen biyecciones siguientes:
ϕ : A−+ (σ, τ ) −→ {(i, j) ∈ τ + (A+ (τ )) : σ(i) > σ(j)}
(i1 , j1 ) 7−→ (τ (i1 ), τ (j1 )).
ψ: A−− (σ, τ ) −→ {(j, i) ∈ τ − (A− (τ )) : σ(i) > σj }
(i1 , j1 ) 7−→ (τ (j1 ), τ (i1 )).
Con estas identidades conjuntistas de fácil verificación, obtenemos (entre otras) las siguientes
relaciones entre los cardinales:
N− (σ) = N−+ (σ, τ ) + N−− (σ, τ ),
N− (τ ) = ](τ − (A− (τ )) = N+− (σ, τ ) + N−− (σ, τ ),
N− (σ ◦ τ ) = N+− (σ, τ ) + N−+ (σ, τ )
Sumando las dos primeras identidades obtenemos
N− (σ)+N− (τ ) = N−+ (σ, τ )+N−− (σ, τ )+N+− (σ, τ )+N−− (σ, τ ) = N−+ (σ, τ )+N−− (σ, τ )+2(N−− (σ, τ )).
Por tanto, tenemos
N− (σ) + N− (τ ) = N− (σ ◦ τ ) + 2(N−− (σ, τ )),
y esto último implica:
N− (σ◦τ ) N− (σ)+N− (τ )
ι(σ ◦ τ ) = (−1) = (−1) = ι(σ) · ι(τ ),
que es la identidad buscada. 
Corolario 1.3.18. Sea σ ∈ Sn una permutación se tiene la siguiente igualdad entre las dos
nociones de ı́ndice antes definidas:
ι(σ) = I(σ).
Demostración. Es evidente, por ser ambas un morfismo de grupos y porque para cada
transposición τ , se tiene ι(τ ) = I(τ ) = −1. Es decir, dada una descomposición de σ mediante
transposiciones:
σ = τ1 · · · τm ,
tendremos que, por ser ι un morfismo de grupos se tendrá:
m
Y
ι(σ) = ι(τi ) = (−1)m = I(σ),
i=1
donde I(σ) es el ı́ndice definido en la sección precedente. 

Corolario 1.3.19. Sea X un conjunto finito cualquiera, entonces dadas dos representaciones
de una permutación σ ∈ S (X) como composición de transposiciones en X:
σ = τ1 ◦ τ2 ◦ · · · ◦ τr = ρ1 ◦ ρ2 ◦ · · · ◦ ρm ,
se tiene que r = m mod 2.
1.3. EL PARADIGMA DE LAS ACCIONES TRANSITIVAS Y FIELES: Sn 53

Demostración. Basta con usar el isomorfismo de S (X) con un Sn cualquiera. 


Esta forma de ver el ı́ndice de una permutación como algo que depende solamente del número
de transposiciones implicadas, permite generalizar la noción de ı́ndice para un conjunto finito
cualquiera X del modo siguiente.
Definición 20 (Índice de una permutación de un conjunto cualquiera). Sea X un
conjunto finito cualquiera y sea σ ∈ S (X) una biyección de X. Llamamos ı́ndice de σ al valor
I(σ) := (−1)m ,
donde σ admite una descomposición como producto de m transposiciones de X.

Observación 1.3.20. Obsérvese que el ı́ndice ası́ definido tambiéon define un morfismo de
grupos:
I : (S (X), ◦) −→ (Z× , ·)
σ 7−→ I(σ).

1.3.3. Ejercicios y problemas la Sección 1.3.


Problema 31. Se pide:
i) Pruébese que (Sn , ◦) es un grupo (es decir, verificar que ◦ está bien definida como
aplicación (i.e. que es operación interna) y que verifica la propiedad asociativa, que
posee elemento neutro y que todo elemento posee un inverso).
ii) Probad que el cardinal ](Sn ) = n! (Pista: por inducción en n).
Problema 32. Para un conjunto X, el grupo simétrico S (X) define una acción natural sobre
X. Probar que esa acción es transitiva y fiel.
Problema 33. Verificar todos los detalles de la demostración de la Proposición 1.3.8. Es decir,
todas las identidades entre conjuntos y aplicaciones no probadas con detalle y las afirmaciones
como f ∗ y f∗ son morfismos de grupo, etc.
Problema 34. Sea X un conjunto finito y consideremos un ciclo de orden r en S (X). Hay
que probar que ese ciclo puede ser dado como la composición de r − 1 transposiciones. (Pista:
Por inducción en r).
Problema 35. Consideremos [n] := {1, . . . , n}, el grupo simétrico Sn y escribamos τi para la
transposición adyacente τi := (i i + 1). Prueba que se verifican las siguientes propiedades:
i) τi2 = Id[n] ,
ii) τi ◦ τi+1 ◦ τi = τi+1 ◦ τi ◦ τi+1 .
iii) τi ◦ τj = τj ◦ τi , siempre que |i − j| ≥ 2.
Problema 36. Prueba que el ı́ndice de una permutación σ ∈ S (X), siendo X un conjunto
finito, es invariante por biyecciones de X con conjuntos finitos de la forma [n].
Problema 37. Pruébese que el conjunto de todas las permutaciones en Sn que tienen ı́ndice
1 es un subgrupo normal de Sn . A este subgrupo se le conoce como el subgrupo alternado y se
denota por An ⊆ Sn . Pruébese que An es un subgrupo normal de Sn y se verifica:
Sn /An ∼= Z/2Z.
Problema 38. Sea O(n) el grupo de las matrices ortogonales n × n con coordenadas reales y
sea SO(n) es grupo especial ortogonal de las matrices orotogonales con determinante 1. Probad
que SO(n) es un subgrupo normal de O(n) y que se verifica el siguiente isomorfismo de grupos:
O(n)/SO(n) ∼ = Z/2Z.
Problema 39 (Sólo para alumnos que haya superado la asignatura Matemática Disc-
reta). Un grafo orientado es un par G := (V, E) donde V es un conjunto no vacı́o (cuyos
elementos son llamados nodos o vértices) y E ⊆ V × V es un conjunto finito de pares de nodos
de V llamados aristas. Un grafo no orientado es un grafo orientado G tal que el conjunto de
las aristas verifica:
∀x, y ∈ V, (x, y) ∈ E ⇐⇒ (y, x) ∈ E.
54 1. PRE-ÁLGEBRA

Un automorfismo de un grafo es un elemento σ ∈ S (V ) tal que


∀x, y ∈ V, (x, y) ∈ E ⇐⇒ (σ(x), σ(y)) ∈ E.
Se pide:
i) Hay que probar que los grafos no orientados pueden definirse como los pares (V, E),
donde V es un conjunto no vacı́o y E es un subconjunto del conjunto P(V ) de todos
los subconjuntos de V que verifica:
∀X ∈ E, 1 ≤ ](X) ≤ 2.
ii) Hay que probar que el conjunto Aut(G ) de automorfismos de un grafo orientado forma
un grupo con la operación composición de aplicaciones. ¿Es abeliano?.
iii) Sea G un grafo no orientado con vértices V . Consideremos el subgrupo G ⊆ S (V )
generado por las transposiciones
G := h{(i j) : {i, j} ∈ E}i.
¿Son los elementos de G automorfismos del grafo G (i.e. G ⊆ Aut(G ))?. Razona la
respuesta.
iv) Probad que el grupo simétrico S (V ) es el grupo Aut(Kn ), donde Kn es el grafo com-
pleto de n vérices (i.e. el grafo con todas las aristas posibles).
v) Busca en internet (Wiki, por ejemplo) información sobre el enunciado del Teorema
de Frucht y el enunciado del Problema de Galois Inverso. Cópialos y trata de explicar
sus significados.
vi) Busca en internet información sobre los grafos de Cayley. Explica su construcción.
Problema 40. Dos ciclos τ y θ en S (X), con X conjunto finito, se dicen disjuntos si sus
respectivas órbitas no triviales son conjuntos disjuntos. Pruébese que toda permutación es
producto finito de ciclos disjuntos dos a dos ( Hint: Observar el detalle de la prueba del Teorema
1.3.9).
Problema 41. Con la terminologı́a del Problema precedente, pruébese que si τ y θ son dos
ciclos disjuntos, entonces conmutan entre sı́ (i.e. τ θ = θτ ). Pruébese que el orden de un
k−ciclo es k como elemento del grupo simétrico al que pertenece. Concluir una estimación del
orden de una permutación dada como producto finito de ciclos disjuntos dos a dos.
Problema 42. Dado un entero positivo n ∈ N, para cada r ∈ N, r ≤ n, calcula una cota
superior del número de permutaciones en Sn que se pueden obtener como producto de r √ ci-
clos. Concluye que para n ≥ 2, siempre existe una permutación que necesite más de n
transposiciones. Concluye que el número de transposiciones necesarias para escribir cualquier
permutación está en Θ(n).

1.4. Anillos, ideales, morfismos de anillos


1.4.1. Propiedades generales.
Definición 21 (Anillo). Un anillo (conmutativo con unidad) es una terna (R, +, ·), donde
i) (R, +) es un grupo abeliano, cuyo elemento neutro se suele denotar por 0R ,
ii) (R, ·) es un monoide conmutativo, cuyo elemento neutro se suele denotar por 1R ,
iii) se verifica la propiedad distributiva siguiente:
∀a, b, c ∈ R, a · (b + c) = a · b + a · c.
Al elemento neutro del grupo abeliano (R, +) lo denotaremos por 0R o, simpemente, 0 y al
elemento neutro del monoide (R, ·) lo denotaremos por 1R o, simplemente, 1.

Observación 1.4.1 (Simplemente “anillo”). En este curso, “ Álgebra Conmutativa”, todos


los anillos serán conmutativos con unidad, por lo que simplificaremos diciendo “Sea (R, +, ·)
un anillo.” queriendo decir “Sea (R, +, ·) anillo conmutativo con unidad”.
Terminológicamente, podemos establecer tres niveles del uso posible del término “anillo”.
1.4. ANILLOS, IDEALES, MORFISMOS DE ANILLOS 55

• Casi-anillo: Es una terna (R, +, ·) en las que (R, +) es un grupo (no necesariamente
conmutativo), (R, ·) es un semi-grupo y se da la distributiva, pero solamente en una de
las direcciones. Por ejemplo, si (G, ∗) es un grupo definamos M (G) como el conjunto
de todas las aplicaciones de G en sı́ mismo. Sobre el conjunto M (G) podemos definir
la operación f ∗ g, entre dos elementos f, g ∈ M (G) de la manera obvia. Añadamos la
composición de aplicaciones ◦ y tendremos que (M (G), ∗, ◦) es un casi-anillo. Es una
noción que no carece de interés, pero es poco común su estudio.
• Pseudo-anillo (Anillo “sin unidad”): Es una terna (R, +, ·) en las que se da la
propiedad distributiva, (R, +) es un grupo abeliano y (R, ·) es un semi-grupo, pero
no necesariamente tiene unidad. Este caso es poco habitual. Un ejemplo podı́a ser
cualquier ideal propio, como los números enteros pares (2Z, +, ·). Pero no es una
noción demasiado interesante ni es comúnmente aceptado.
• Anillo : Es una terna (R, +, ·) en las que se da la propiedad distributiva, (R, +) es
un grupo abeliano y (R, ·) es un monoide. Este uso es el más habitual. Un ejemplo
podı́a ser el conjunto de los endomorfismos sobre un espacio vectorial o las matrices
cuadradas (Mn (K), +, ·). Es el más aceptado, salvo que se trate de un curso de
“Álgebra Conmutativa”, como es nuestro caso.
• Anillo Conmutativo (o, simplemente, anillo): que es el uso que daremos habitualmente
en este curso, aunque puedan aparecer anillos que no sean conmutativos con unidad,
en cuyo caso advertiremos al lector.
La definición de anillo (conmutativo con unidad) tiene sus precursores en D. Hilbert y A.
Fraenkel, pero es E. Noether, junto con E. Artin, quien estabiliza la noción actualmente acep-
tada en su trabajo [Noether, 1921]. Será la escuela de E. Noether, su seminario conjunto con
E. Artin y, especialmente, la obra de su colega W. Krull (cf. [Krull, 1929], [Krull, 1935]) o las
notas del seminario, recogidas y publicadas por su alumno B.-L. van der Waerden ([vdW, 1930,
vdW, 1931]), las que más influirán en la concepción del Álgebra Conmutativa moderna. Ob-
viamente, el conocimiento de estos aspectos ha evolucionado mucho en los últimos ochenta
años, ganando relevancia en Geometrı́a Algebraica y, en general, en Geometrı́a a partir de la
fundamentación de la Geometrı́a propuesta por A. Grothendieck en sus EGA’s y SGA’s. Un
cambio significativo del Álgebra Conmutativa se produce a mediados de los años 50 con la
intervención como herramiento del “ Álgebra Homológica” (introducida por Cartan y Elien-
berg en [CaEi, 1956]) y una serie de preguntas de J.P. Serre y el propio E. Artin, que
conducián a resultados tan significativos como el Teorema de Serre-Auslander-Buchsbaum
([AuBu, 1957, AuBu, 1959], [Ser, 1955]) o el Teorema de Quillen-Suslin (con direcciones
opuestas en cuanto al uso del Álgebra Homológica, [Qui, 1976], [Sus, 1976]). Pero ambos
aspectos no surgirán sino muy avanzado el curso y este curso es, por desgracia, una pre-
introducción al conocimiento de la “Teorı́a de Anillos”.

Observación 1.4.2. Si (R, +, ·) es un anillo, entonces:


∀x ∈ R, x · 0 = 0.
Para probarlo, obsérvese que
x · 0 + x · 1 = x · (1 + 0) = x · 1 = x.
Como (R, +) es un grupo, concluiremos que si x · 0 + x = x, entonces, x · 0 = 0. En particular,
concluimos que si R es un anillo y R 6= {0} (es decir, si R posee algún elemento además del
neutro de la suma), entonces 1 6= 0. La razón es que si x ∈ R, con x 6= 0, tendremos que,
de una parte, x · 0 = 0 y, por otro lado, x · 1 = x. Por tanto, si 1 = 0 en R, concluirı́amos
x = 0 y, necesariamente, R = {0}. Para excluir este caso patológico y nulamente interesante,
supondremos, a partir de ahora, que todo anillo R es tal que 1R 6= 0R o, equivalentemente, que
R 6= {0}.

Definición 22 (Subanillo). Sea (R, +, ·) un anillo. Llamaremos subanillo de R a todo sub-


grupo (S, +) de (R, +) tal que 1R ∈ S y S es cerrado para la operación producto, esto es,
∀a, b ∈ S, a · b ∈ S.
56 1. PRE-ÁLGEBRA

Ejemplo 1.4.3. Los ejemplos más elementales de anillos son obviamente los cuerpos, como
Q, R, C, o anillos que no son cuerpos como Z. Veremos, sin embargo, que hay muchos más
ejemplos. También son ejemplos de anillos los anillos de polinomios en una variable con coefi-
cientes en los anteriores anillos.
Para una definición formal de los anillos de polinomios, sea (R, +, ·) un anillo (conmutativo con
unidad) y consideremos los siguientes dos conjuntos de sucesiones de elementos de R:
(1.4.1) R[[X]] := RN := {(an )n∈N ∈ RN : an ∈ R, ∀n ∈ N}.
Definimos el subconjunto siguiente:
(1.4.2) R[X] := {(an )n∈N ∈ RN : ∃I ⊆ N, finito, an = 0, ∀n ∈ N \ I}.
Ahora definimos dos operaciones sobre estos dos conjuntos
+: R[[X]] × R[[X]]  −→ R[[X]], ∗: R[[X]] × R[[X]]  −→ R[[X]]
(an )n∈N , (bn )n∈N 7−→ (an + bn )n∈N . (an )n∈N , (bn )n∈N 7−→ (cn )n∈N ,
donde
X
(1.4.3) ck := ai bj , ∀k ∈ N.
i+j=k

Nótese la relación existente entre la operación ∗ y la convolución de funciones estudiada en


Análisis. De hecho, podrı́amos decir directamente que ∗ es la operación de convolución. La
terna (R[[X]], +, ∗) es un anillo conmutativo con unidad, conocido como el anillo de series
de potencias formales en una variable con coeficientes en R. Es importante subrrayar que la
operación clave para tener en cuenta la estructura de anillo en R[[X]] es la convolución: sin
ella, estarı́amos hablando simplemente de sucesiones. De hecho, por tradición y para distinguir
este anillo, no se usa la notación sucesional (an )n∈N ni la notación funcional a : N −→ R, sino
la notación en forma de serie no necesariamente convergente:
X X∞
(an )n∈N se denota mediante an X n = an X n ,
n∈N n=0

aunque todas estas notaciones representan el mismo objeto, siempre que se tenga en cuanta la
operación ∗ que inspira a la convolución de funciones. Se suele usar la terminologı́a coeficiente
n−ésimo para referirse al elemento n−ésimo an de la sucesión. Una primera noción importante
para una serie de potencias formales σ ∈ R[[X]] es su soporte, que se define del modo siguiente:
supp(σ) := {n ∈ N : an 6= 0}.
Es un sencillo ejercicio de verificación el comprobar las siguientes propiedades del soporte para
σ, τ ∈ R[[X]]:
supp(σ + τ ) ⊆ supp(σ) ∪ supp(τ ),
supp(σ ∗ τ ) ⊆ supp(σ) · supp(τ ) = {ij : i ∈ supp(σ), j ∈ supp(τ )}.
En particular, si dos series σ, τ ∈ R[[X]] tienen soporte finito también lo tienen σ + τ y σ ∗ τ .
Esto facilita la introducción de la siguiente noción:
Las series en R[[X]] de soporte finito se llaman polinomios univariados. Denotamos por R[X]
el conjunto de todos esos polinomios univariados:
N
Rfin := {σ ∈ R[[X]] : supp(σ) es un conjunto finito}.
N
Por el comportamiento del soporte antes descrito, Rfin es cerrado para ambas operaciones:
+: N
Rfin × Rfin
N
 −→ N
Rfin , ∗: N
Rfin × Rfin
N
 −→ N
Rfin
(an )n∈N , (bn )n∈N 7−→ (an + bn )n∈N . (an )n∈N , (bn )n∈N 7−→ (cn )n∈N ,
donde los elementos ck están igualmente definidos mediante la convolución definida en la
Ecuación (1.4.3) anterior. De nuevo, la terna (Rfin N
, +, ∗) define un anillo conmutativo con
unidad, conocido como el anillo de polinomios univariados con coeficientes en R y que deno-
taremos simplemente mediante R[X]. En particular, R[X] es un subanillo de R[[X]]. Debemos
insistir en la idea de la relevancia de la operación convolución ∗ involucrada porque, en otro
caso, no estarı́amos hablando de anillo de polinomios sino de sucesiones nulas salvo un conjunto
finito (que suelen ser vistas como otra estructura usualmente). Usualmente, se usa el sı́mmbolo
más modesto · para representar la operación ∗, esperando que el lector sea capaz de recordar
1.4. ANILLOS, IDEALES, MORFISMOS DE ANILLOS 57

que el prodycto en R[[X]] y R[X] s el dado por la convolución de funciones.


Una segunda noción importante sobre las series de potencias formales es la noción de orden de
una serie de potencias formales en 012. Dada una serie σ := n∈N an X n , se denomina orden
P
de σ en 0 y se denota por ord0 (σ), al mı́nimo siguiente:
ord0 (σ) := min{n ∈ N : an 6= 0} = min{n ∈ N : n + 1 ∈ supp(σ)}.
Es fácil observar que el orden verifica las siguientes propiedades:
ord0 (σ + τ ) ≥ min{ord0 (σ), ord0 (τ )}, ord0 (σ ∗ τ ) ≥ ord0 (σ) + ord0 (τ ).
Estas propiedades inducirán la noción de valoración (en especial las valoraciones discretas) y,
pasando el tiempo, entroncará con la Geometrı́a Tropical. Pero esto son aspectos que no alcan-
zaremos hasta mucho más adelante en este curso.
Tendremos ası́ nuevos ejemplos de anillo como Z[X], Q[X], R[X], C[X] (anillos de polinomios)
o Z[[X]], Q[[X]], R[[X]], C[[X]] (anillos de series de potencias formales) con coeficientes respec-
tivamente en Z, Q, R, C.
En el caso de los polinomios f = (an )n∈N ∈ R[X] cambiamos el mı́nimo, usado en la noción
de orden anterior, por el máximo del soporte (que no tiene sentido en el caso de las series con
soporte infinito). Es el grado de un polinomio f como el anterior, y que se define mediante:
deg(f ) := max{k ∈ N : ak 6= 0} = max{k ∈ N : k ∈ supp(f )}.
Si f = (an )n∈N es la sucesión nula, escribiremos f = 0 y definiremos su grado mediante
deg(0) = −1. Por eso, para un polinomio f = (an )n∈N ∈ R[X], de grado d := deg(f ) se suele
denotar mediante la suma formal (llamada representación densa de polinomios):
d
X
f := ai Xi = ad X d + · · · + a1 X + a0 ,
i=0

donde hemos ordenado el soporte de modo decreciente. Al coeficiente ad 6= 0, con d = deg(f ),


se le denomina coeficiente director de f . Es sencillo dobservar que el grado satisface las dos
propiedades siguientes:
deg(f + g) ≤ max{deg(f ), deg(g)}, deg(f ∗ g) ≤ deg(f ) + deg(g).

Ejemplo 1.4.4 (Anillo de Polinomios con coeficientes en un anillo no necesariamente


conmutativo). Supongamos que tenemos ahora un anillo (A, +, ·) no necesariamente conmu-
tativo con unidad. Por ejemplo, en anillo A = Mn (R) de las matrices n × n con coordenadas
en un anillo R. Podemos hacer una construcción idéntica de los anillos de series de potencias
formales A[[X]] y A[X], teniendo sumo cuidado con el hecho de que ahora los anillos A[[X]]
y A[X no son necesariamente conmutativos. Ası́, el sustrato del anillo de series de potencias
formales será en conjunto AN := {f : N −→ A : f es aplicación}. Las operaciones suma y
producto serán las mismas diseñadas para el caso en que A es conmutativo. Ası́ la suma de dos
funciones f.g ∈ A[[X]] será la “suma coordenada a coordenada” y producto será la convolución,
es decir,
X
f ∗ g(n) := f (i)f (j).
i+j=n

La terna (A , +, ∗) es un anillo (no necesariamente conmutativo) con unidad. Denotamos por


N

A[[X]] a ese anillo de series de potencias formales con coeficientes en A y sus elementos se
representan también mediante la forma:

X
f ∈ A[[X]] =⇒ f = ak X k , ak = f (k),
k=0
k
y los “monomios” X se definen igualmente al caso de anillos conmutativos. De nuevo, podemos
considerar el conjunto de las sucesiones de elementos de A con soporte finito:
AN
fin := {f ∈ A
N
: supp(A) es finito}.

12Es recomendable que el lector acompase esta noción de “orden de una serie” con la noción de orden en
un cero de una función holomorfa, usada en los cursos estándar de Variable Compleja.
58 1. PRE-ÁLGEBRA

Idénticamente se prueba que el conjunto AN 0 es estable para las operaciones “suma” y “con-
volución” y se tiene un anillo (no necesariamente conmutativo) con unidad (AN fin , +, ∗). A este
anillo se le denota mediante A[X] y se le denomina anillo de polinomios con coeficientes en A.
Obviamente, los lementos f ∈ A[X] admiten una presentación en la forma:
d
X
f := ai X i ,
i=0

donde d := max(supp(f ). Y a este máximo se le denomna también grado de f . En este curso,


como curso de Álgebra Conmutativa” que es, sólo habrá un caso en el que usaremos los anillos
A[[X]] y A[X] que será el caso de los anillos de matrices cuadradas A = Mn (R), con R anillo
conmutativo. Es decir, apenas si usaremos, por el contexto del curso, los anillos Mn (T )[[X]] y
Mn (R)[X]. Será de modo puntual y solamente para garantizar un buen fundamento de Teorı́a
del Endomorfismo. Como en el caso conmutativo, no harmos especial ńfasis en destacar la
operación convolución ∗ y usaremos el sı́mbolo más modesto ·, esperando que el lector sepa
recordar que el producto en A[[X]] y A[X] se dfine a través de la convolución.

Ejemplo 1.4.5 (Enteros de Gauss). Un sencillo ejemplo de anillo es el anillo de los enteros
de Gauss Z[i], formado por los números complejos de la forma:
Z[i] := {a + bi : a, b ∈ Z},
donde i2 = −1.
Definición 23 (Ideales, morfismos, unidades). Dado un anillo (R, +, ·), llamaremos:
i) Ideal: a todo subgrupo (a, +) de (R, +) tal que se verifica:
∀a ∈ R, ∀b ∈ a, a · b ∈ a.
El ideal R se denominan ideal impropio de R. Los demás, incluyendo el ideal (0), se
denominan propios.
ii) Morfismo de anillos: Dados dos anillos (R, +, ·) y (T, +, ·), llamamos morfismo
entre los anillos R y T a todo morfismo de grupos f : (R, +) −→ (T, +) tal que
f : (R, ·) −→ (T, ·) es un morfismo de monoides, es decir, si verifica, además, las
propiedades:
• f (1R ) = 1T ,
• ∀a, b ∈ R, f (a · b) = f (a) · f (b).
iii) R−álgebra: Dado un morfismo de anillos f : R −→ T , decimos que T es una
R−álgebra. Esto incluye el caso de subanillos (i.e. R ⊆ T , cuando f es simplemente
la inclusión).
iv) Unidades en el anillo: A todos los elemenos a ∈ R tales que existe a0 ∈ R, con
aa0 = a0 a = 1R . Denotamos por R× al conjunto de las unidades del anillo R y forma
un grupo abeliano con la operación producto (R× , ·) llamado grupo de las unidades
del anillo R.
v) Cuerpo:Un anillo R se denomina cuerpo si R× = R \ {0}.

Ejemplo 1.4.6 (Ideal Principal). Dado un anillo R y un elemento a ∈ R, se define el ideal


principal generado por a como el conjunto siguiente:
(a) := {λa : λ ∈ R}.
Es un sencillo ejercicio verificar que (a) es ideal en R. En ocasiones utilizaremos la notación
aR. Esto conduce a todos los anillos cociente R/(a) (o R/aR). Entre ellos podemos considerar
los anillos cocientes Z/mZ, donde m es un entero cualquiera en Z.
Es también un ejercicio sencillo probar que (a) = R si y solamente si a ∈ R× .

Proposición 1.4.7 (Subanillo generado por un subconjunto). Sea (R, +, ·) un anillo.


i) La intersección de una familia cualquiera de subanillos de R es también subanillo. Es
decir, dados {Ti : i ∈ I} una familia de subanillos de un anillo R, entonces, la
intersección ∩i∈I Ti es también subanillo de R.
1.4. ANILLOS, IDEALES, MORFISMOS DE ANILLOS 59

ii) Dado un subanillo R1 de R y dado un subconjunto F ⊆ R, llamaremos subanillo (sub-


R1 −álgebra) generado por R1 y F al menor subanillo de R que contiene a R1 y F, es
decir, \
R1 [F] := {T ⊆ R : R1 , F ⊆ T, T es subanillo}.

Demostración. Mero ejercicio de verificación a partir de las definiciones. 

Ejemplo 1.4.8. Con los ejemplos precedentes, K[X] es el subanillo (sub-K−álgebra) de K X


generado por K y el conjunto {X}. Igualmente, Z[i] es el subanillo del cuerpo de los complejos
C generado por Z y por {i}.
Definición 24 (Mono, epi, iso, endo, auto....morfismo de anillos). Sean (R, +, ·) y
(T, +, ·) dos anillos y sea f : (R, +, ·) −→ (T, +, ·) un morfismo de anillos. Usando el Teorema
de Schreier (Teorema 1.2.19 anterior) podemos definir los términos siguientes:
i) Diremos que f es monomorfismo si lo es como morfismo de grupos f : (R, +) −→
(T, +) (equivalentemente, si, como aplicación, es inyectiva).
ii) Diremos que f es epimorfismo si lo es como morfismo de grupos f : (R, +) −→ (T, +)
(equivalentemente, si, como aplicación, es suprayectiva).
iii) Diremos que f es isomorfismo si monomorfismo y epimorfismo a la vez (equivalen-
temente, si, como aplicación, es biyectiva). Esto, en particular significa que f es
isomorfismo si y solamente si existe otro morfismo de anillos g : (T, +, ·) −→ (R, +, ·)
tal que:
g ◦ f = IdR , f ◦ g = IdT .
iv) Diremos que es f endomorfismo si R = T .
v) Diremos que f es automorfismo si es endomorfismo e isomorfismo a la vez.

Proposición 1.4.9 (Propiedades elementales). Se tienen las siguientes propiedades ele-


mentales:
i) Los subanillos T de un anillo (R, +, ·) son ideales si y solamente si T = R. Equiva-
lentemente, los ideals a de un anillo (R, +, ·) son subannilos si y solamente si a = R.
ii) Los morfismos de anillos transforman subanillos en subanillos en ambas direcciones.
Es decir, si f : R −→ T es un morfismo de anillos, se tiene:
• Si S es subanillo de R, entonces f (S) := {f (x) : x ∈ S} es un subanillo de T .
En particular, Im(f ) = f (R) es un subanillo de T , que no suele ser ideal (salvo
en el caso en que f sea epimorfismo (i.e. salvo si Im(f ) = T ).
• Si U es un subanillo de T , entonces f −1 (U ) := {x ∈ R : f (x) ∈ U } es un
subanillo de R.
iii) Las imágenes inversas de ideales son ideales, pero no necesariamente lo son las imágenes
directas. Es decir, si f : R −→ T es un morfismo de anillos, se tiene:
• Si b es un ideal de T , entonces f −1 (b) := {x ∈ R : f (x) ∈ a} es un ideal de R.
En particular el núcleo ker(f ) := f −1 ({0}) es un ideal de R y f es monomorfismo
si y solamente si ker(f ) = (0) es el ideal nulo.
• Si b es un ideal de R, en general no es cierto que f (a) sea ideal de T .
Cuando no hay confusión sobre el morfismo f , al ideal f −1 (b) se le denota mediante
bc y se le denomina contracción del ideal b de T .
iv) Un subgrupo propio a ( R del grupo aditivo de un anillo (R, +, ·) es ideal si y solamente
si el grupo cociente (R/a, +) es anillo con la correspondencia siguiente:
· : R/a × R/a −→ R/a,
dada mediante
(x + a)(y + a) := xy + a, ∀x + a, y + a ∈ R/a.
Al anillo R/a se le denomina anillo cociente de R por el ideal a. Además, la proyección
canónica:
π : R −→ R/a
x 7−→ x + a,
es un epimorfismo de anillos.
60 1. PRE-ÁLGEBRA

v) Un anillo es cuerpo si y solamente si los únicos ideales son (0) y el ideal impropio.
En particular, si K es un cuerpo y R es una K−álgebra, (i.e. existe f : K −→ R un
morfismo de anillos), entonces f es inyectivo (monomorfismo) y K se puede identificar
isomórfimcamente con un subcuerpo de R (i.e. un subanillo de R que, además, es
cuerpo con las operaciones inducidas por las de R).
Demostración. La mayorı́a de estas propiedades son evidentes y no necesitan de mayor
discusión. 
Ejemplo 1.4.10. Consideremos (X, T ) un espacio topológico y consideremos C 0 (X) (en oca-
siones se escribe también C (X) y usaremos ambas notaciones indistintamente) el anillo formado
por las funciones continuas f :−→ R. Es decir,
C 0 (X) := {f : X −→ R : f es aplicación continua}.
Podemos dotar a C 0 (X) con dos operaciones de suma y producto mediante la suma y producto
de funciones continuas. Esto es, dadas f, g ∈ C 0 (X), definimos
f +g : X −→ R f ·g : X −→ R
x 7−→ f (x) + g(x), x 7−→ f (x) · g(x),
donde + y · son la suma y producto usuales en R. Es fácil ver que (C 0 (X), +, ·) es un anillo.
Consideremos ahora F ⊆ X un subconjunto cualquiera. Entonces podemos definir el conjunto
de las funciones continuas que se anulan en F :
I(X) := IC 0 (X) (F ) := {f ∈ C 0 (X) : f (x) = 0, ∀x ∈ F } = {f ∈ C 0 (X) : f F = 0}.

Observamos que I(F ) es un ideal en C 0 (X) y no es subanillo salvo que 1 ∈ I(F ), en cuyo caso
F = ∅.

Ejemplo 1.4.11 (K−álgebras y cuerpos primos). Un ejemplo relevante de R−álgebras son


aquellas en las que K es un cuerpo. Ası́, si f : K −→ R es un morfismo de anillos, siendo K un
cuerpo (es decir R es un K−álgebra), entonces f es un monomorfismo y podemos identificar K
con un subanillo de R (podemos suponer entonces que K ⊆ R. Esta es la base de la noción de
caracterı́stica de un cuerpo. Ası́, se denominan cuerpos primos a la familia numerable siguiente
de cuerpos:
i) Para cada primo p ∈ N, denotamos por GFp o, simplemente por Fp al cuerpo de Galois
de cardinal p ∈ N. Se trata, obviamente, del cuerpo Fp := Z/pZ, donde Z/pZ es el
anillo residual de Z sobre el ideal pZ.
ii) El cuerpo primo de caracterı́stica 0 que es el cuerpo de los números racionales Q.
Se tiene la siguiente sencilla Proposición:
Proposición 1.4.12. Sea K un cuerpo. Dado un número natural n ∈ N definamos n · 1K a la
cantidad siguiente:
• Si n = 0, entonces n · 1K = 0K .
• Si n = 1, entonces 1 · 1K = 1K .
• Para n ≥ 2, se define recursivamente
n · 1K := (n − 1) · 1K + 1K .
Las siguientes propiedades son equivalentes:
i) Existe un número entero n ∈ N, n 6= 0, tal que n · 1K = 0. En ese caso, se tendrá que
el número natural:
p := min{n ∈ N : n 6= 0, n · 1K = 0} = min{n ∈ N : n 6= 0, n · x = 0, ∀x ∈ K},
es un número primo denominado la caracterı́stica del cuerpo K.
ii) Existe un único número primo p ∈ N tal que K es una Fp −álgebra (o, equivalente-
mente, Fp está identificado con un subanillo de K).
En caso de no existir ningún primo no nulo p ∈ N tal que se verifique algunas de las dos
propiedades equivalentes precedentes, diremos que K tiene caracterı́stica 0 y, en ese caso, K
será un Q−álgebra (o, equivalentemente, Q estará identificado con un subanillo de K).
1.4. ANILLOS, IDEALES, MORFISMOS DE ANILLOS 61

En particular, la caracterı́stica de un cuerpo quedará definida por el tipo de Álgebra que es con
respecto a los cuerpo primos {Fp : p ∈ N, p 6= 0 primo} ∪ {Q}.

Ejemplo 1.4.13. Con las notaciones anteriores, R[X] es un subanillo de R[[X]] y existe un
monomorfismo de anillos entre R y R[X] que permite identificar R con un subanillo de R[X].
De hecho, tanto R[X] como R[[X]] son R−álgebras, lo cual es particularmente significativo en
Análisis Matemático cuando R = R o R = C.

Definición 25 (Divisores de cero, Dominio de Integridad). En un anillo (R, +, ·) se


dice que un elemento x ∈ R es un divisor de cero si existe otro elemento no nulo y ∈ R tales
que xy = 0. Un anillo sin divisores de cero no nulos se denomina dominio de integridad (o,
simplemente, dominio).

Ejemplo 1.4.14. Son ejemplos de dominios de integridad los siguientes:


i) Los cuerpos son dominios de integridad.
ii) Si R es un dominio de integridad también lo son los anillos de polinomios en una
variable con coeficientes en R: R[X]. Para probarlo, consideremos el grado deg :
R[X] −→ N ∪ {−1}. Es sencillo demostrar que si R es un dominio de integridad,
entonces el grado de un polinomio univariado satisface las dos propiedades siguientes
para dos polinomios no nulos f, g ∈ R[X]:
deg(f + g) ≤ max{deg(f ), deg(g)}.
deg(f g) = deg(f ) + deg(g).
La segunda propiedad era una desigualdad (≤) en el caso de que R no sea dominio de
integridad. Y es esa segunda propiedad la única que habrı́a que demostrar. Para ello
bastarı́a con repasar la expresión del producto de dos polinomios. Ası́ dados
m
X n
X
f := ai X i , g = bj X j ,
i=0 j=0

con am 6= 0 y bn 6= 0 como los respectivos coeficientes directores, entonces,


f g = am bn X n+m + h,
donde deg(h) < m + n. Por tanto, si R es dominio de integridad, am bn 6= 0 y
deg(f g) = deg(f ) + deg(g). En cambio, si R no fuera dominio de integridad podrı́a
darse am 6= 0, bn 6= 0 y am bn = 0, con lo que deg(f g) = deg(h) < deg(f ) + deg(g).
Con estas dos propiedades es claro que si R es dominio de integridad, el producto
de dos polinomios no nulos es un polinomio no nulo y, por tanto, también R[X] es
dominio de integridad. Dejamos para más adelante el probar que si R es dominio de
integridad también lo es el anillo de series R[[X]] (ver Teorema 1.4.39).
iii) Un caso interesante es el caso de un anillo R cualquiera y el producto de dos polinomios
f y g en R[X] de grados respectivos m y N , pero suponiendo que f es mónico con
respecto a la variable X. Es decir, si
n
X
m m−1
f := uX + am−1 X + · · · + a0 , g = bj X j ,
j=0

donde u ∈ R× es una unidad de R y bn 6= 0. Entonces,


f g = ubn X n+m + h,
donde h tiene grado en X menor que n + m. En este caso uan 6= 0 porque u es unidad
en R. Por tanto, en este caso, deg(f g) = deg(f ) + deg(g). De hecho, el verdadero
fenómeno es es f ∈ R[X] si es mónico no es divisor de cero en R[X], lo que no obsta
para que haya otros divisores de cero y que R[X] no sea dominio de integridad.
iv) Los subanillos de dominios de integridad también son dominios de integridad. El anillo
de los enteros Z es dominio de integridad.
62 1. PRE-ÁLGEBRA

Teorema 1.4.15 (División Euclı́dea en R[X] por un polinomio mónico). Sea R un anillo
y g ∈ R[X] un polinomio mónico (i.e. un polinomio cuyo coeficiente director es una unidad en
R× o, equivalentemente, g es de la forma:
g = uX d + ad−1 X d−1 + · · · + a1 X + a0 ,
con ai ∈ R y u ∈ R× ).
Entonces, existe división por g en R[X], es decir, para todo f ∈ R[X] existen q, r ∈ R[X] tales
que se verifican las dos propiedades siguientes:
i) f = qg + r,
ii) deg(r) ≤ deg(g) − 1.
Además, q y r son únicos con esa propiedad. Al elemento q lo llamamos el cociente de la
división (euclı́dea) de f por g y lo representamos mediante q := quo(f, g) y al elemento r lo
llamamos el resto de la división (euclı́dea) de f por g y lo representamos mediante rem(f, g).
Demostración. Probemos, en primer lugar, la existencia de q y r. Para ello, consideremos
el conjunto
I := {f − qg : q ∈ R[X]}.
Y consideremos el conjunto de sus grados:
deg(I ) := {n ∈ Z : ∃h ∈ I , n = deg(h)} ⊆ N ∪ {−1} ⊆ Z.
Observamos que deg(I ) es un subconjunto de Z inferiormente acotado (por −1) y, por tanto,
posee mı́nimo. Sea n0 := min (deg(I )) ese mı́nimo. Si n0 = −1, entonces 0 ∈ I (es el único
polinomio de grado −1) y se tiene la propiedad buscada tomando r = 0 y q ∈ R[X] tal que
f = qg, (que existe porque f − qg ∈ I ).
Supongamos que n0 ≥ 0 y que n0 ≤ deg(g) = d. Supongamos que g tiene la forma:
g = uX d + ad−1 X d−1 + · · · + a1 X + a0 ,
con ai ∈ R y u ∈ R× . Supongamos q ∈ R[X] tal que deg(f − qg) = n0 (que ha de existir porque
n0 ∈ deg(I ). Supongamos que
f − qg = bn0 X n0 + bn0 −1 X n0 −1 + · · · + b0 ,
con bi ∈ R. Como n0 ≥ d consideremos el polinomio:
q 0 := u−1 bn0 X n0 −d + q ∈ R[X].
Nótese que aquı́ usamos que u ∈ R× es unidad y, por tanto, posee inverso para el producto
(u−1 ). Entonces f − q 0 g ∈ I (por definición de I ) y observamos que
f −q 0 g = f −qg −u−1 bn0 X n0 −d g = (bn0 X n0 +· · ·+b0 )−bn0 X n0 −u−1 bn0 X n0 −d (g −uX n0 ) ∈ I .
Por tanto,
f − q 0 g = (bn0 −1 X n0 −1 + · · · + b0 ) − u−1 bn0 X n0 −d (g − uX d ) ∈ I .
Y, por tanto,
deg(f − g 0 q) ≤ max{n0 − 1, (n0 − d) + deg(g − uX d )} = max{n0 − 1, (n0 − d) + (d − 1)} = n0 − 1,
lo que contradice la minimalidad de n0 en I . Por tanto, si n0 ≥ 0, se ha de tener n0 6≥ deg(g)
(o, equivalentemente, n0 ≤ deg(g) − 1. Como n0 ≤ deg(g) − 1, ha de existir q ∈ R[X] tal que el
polinomio r = f − qg tiene grado n0 y, por tanto, se verifican las dos afirmaciones declaradas
en el enunciado.

Supongamos ahora que un polinomio admitiera dos descomposiciones del tipo indicado:
f = q1 g + r1 = q2 g + r2 ,
con deg(ri ) ≤ deg(g) − 1. Entonces tendremos:
q1 g + r1 = q2 g + r2 =⇒ (q1 − q2 )g = r1 − r2 .
Usando los grados tendremos que, como g es mónico con respecto a la variable
deg(q1 − q2 ) + deg(g) = deg(r1 − r2 ) ≤ max{deg(r1 ), deg(r2 )} ≤ deg(g) − 1.
Por tanto, necesariamente q1 = q2 y r1 = r2 y tendremos la unicidad. 
1.4. ANILLOS, IDEALES, MORFISMOS DE ANILLOS 63

Observación 1.4.16. Nótese que la propiedad “el coeficiente director es una unidad en R”
es una condición necesaria. Por ejemplo, dividir X por 2X en Z[X] no es posible con las
condiciones de la División euclı́dea.

Corolario 1.4.17. Si K es un cuerpo, entonces K[X] admite división euclı́dea, esto es, se
verifica:
Dados f, g ∈ K[X], g 6= 0, existen q, r ∈ K[X] tales que se verifican las dos propiedades
siguientes:
i) f = qg + r,
ii) deg(r) ≤ deg(g) − 1.
Además, q y r son únicos con esa propiedad.
Demostración. Es obvio dado que todo polinomio no nulo en K[X] posee un coeficiente
director que es una unidad en K. 
Utilicemos este Teorema para mostrar ejemplos de extensiones de Z.
Ejemplo 1.4.18 (Enteros de Gauss, de nuevo). Es fácil ver que se tiene la identificación
Z[i] := Z[X]/(X 2 + 1).
Por ello, y por el Teorema precedente, podemos entender los enteros de Gauss como los restos
de la división por el polinomio mónico X 2 + 1. Claramente, tenemos una identificación
Z[i] := {a + bX : a, b ∈ Z},
donde a + bX denota la clase a + bX + (X 2 + 1) en el anillo cociente Z[X]/(X 2 + 1).

Ejemplo 1.4.19 (Enteros de Einsenstein). El anillo de los enteros de Eisenstein. Consider-


emos el polinomio X 3 − 1 ∈ Z[X] y su factorización:
X 3 − 1 = (X − 1)(X 2 + X + 1).
Podemos considerar el anillo cociente
Z[X]/(X 2 + X + 1).
Es fácil, de nuevo, comprobar que es el anillo de restos de la división por el polinomo mónico
X 2 + X + 1. Podemos escribir:
Z[X]/(X 2 + X + 1) = {a + bX : a, b ∈ Z},
donde a + bX denota la clase a + bX + (X 2 + X + 1) en el anillo cociente Z[X]/(X 2 + X + 1).
De hecho, podemos considerar el número complejo

−1 + −3
ω := ∈ C,
2
y considerar el subanillo de C:
Z[ω] := {a + bω : a, b ∈ Z}.
Es un sencillo ejercicio verificar que este anillo coincide con el anillo de enteros de Eisenstein,
es decir,
Z[ω] = Z[X]/(X 2 + X + 1).

Observación 1.4.20 (Operations matter!). En los dos ejemplos anteriores, hemos mostrado
los anillos Z[i] y Z[ω]. Para cada uno de ellos disponemos de una biyección:
ϕ : Z[i] −→ Z2 , ϕ(a + bi) = (a, b)
ψ : Z[ω] −→ Z2 , ψ(a + bω) = (a, b).
Cada una de ellas define una estructura de anillo en Z2 del modo siguiente.
• (Z2 , +, ∗1 ) siendo (Z2 , +) la estructura natural de grupo abeliano libre de rango 2 y
el producto viene dado por:
(a, b) ∗1 (c, d) := ϕ(ϕ−1 (a, b)ϕ−1 (c, d)) = (ac − db, ad + bc).
64 1. PRE-ÁLGEBRA

• (Z2 , +, ∗2 ) siendo (Z2 , +) la estructura natural de grupo abeliano libre de rango 2 y


el producto viene dado por13 :
(a, b) ∗2 (c, d) := ψ(ψ −1 (a, b)ψ −1 (c, d)) = (ac − bd, ad + bc − bd).
Pero, incluso, podemos definir una estructura más de anillo en Z2 del modo siguiente. Se trata
de la estructura (Z2 , +, ·), donde (Z2 , +) es la estructura usual de grupo, meintras que
·: Z2 × Z2 −→ Z2
((a, b), (c, d)) 7−→ (ac, bd).
La conclusión es que tenemos tres estructuras de anillo definidas sobre Z2 y las tres son diferentes
y no isomorfas. Para verlo, baste con observar lo siguiente:
• Las estructuras (Z2 , +, ∗1 ) y (Z2 , +, ∗2 ) le dan a Z2 una estructura de dominio de
integridad. En cambio, (Z2 , +, ·) no es dominio de integridad porque (1, 0) · (0, 1) =
(0, 0) y (Z2 , +, ·) posee divisores de cero no nulos.
• Las estructuras (Z2 , +, ∗1 ) y (Z2 , +, ∗2 ) tampoco son isomorfas entre sı́ porque el
número de elementos unidad en cada una de ellas es distinto. Esto se comprueba
probando que:
Z[i]× = {±1, ±i}, Z[ω]× = {±1, ±ω, ±ω 2 }.
Dado que el segundo posee 6 elementos unidad y el primero posee solamente 4, es
imposible que sean isomorfos.
La moraleja es que las operaciones sı́ importan y que en un mismo conjunto, incluso en un
mismo grupo abeliano, podemos inducir muy diferentes estructuras de anillo. En ocasiones
(y, muy comúnmente, en la literatura) se usa la expresión “...Sea R un anillo...”. Aunque
no se esté escribiendo explı́citamente, se está sobre-entendiendo la estructura subyacente y las
operaciones.

Ejemplo 1.4.21 (Los anillos Z[ m]). Sea m ∈ Z un entero que no es un cuadrado. Podemos
considerar el anillo cociente: √
Z[ m] := Z[X]/(X 2 − m).
Como en los casos anteriores, por ser X 2 − m mónico, tenemos la identificación siguiente:
√ √
Z[ m] = {a + b m : a, b ∈ Z} = {a + bX : a, b ∈ Z},
donde a + bX = a + bX + (X 2 − m) es la clase residual definida por a + bX. Como subanillos
de C, todos ellos son dominios de integridad pero toman estructuras y formas muy diversas.
Pongamos un par de ejmplos. Por supuesto, los enteros de Gauss son un caso particular.
√ √
• El anillo Z[ −5]. El elemento 2 ∈ Z deja de ser un primo si lo miramos en Z[ −5]
porque tendremos que 6 admite dos factorizaciones distintas:
√ √
6 = 2 · 3 = (1 + −5) · (1 − −5).

• El anillo Z[ 2] tiene una infinidad de unidades dado que:
√ √
±(1 + 2)n ∈ Z[ 2]× ,
√ √
para todo n ∈ N. La razón es que, obviamente, se tiene (1 + 2)(1 − 2) = −1.
2
Esto
√ confiere una estructura muy distinta a Z a través del isomorfismo de grupos con
Z[ 2].

Ejemplo 1.4.22 (Los anillos Z[ 1+2 m ]). Supongamos que m ∈ Z no es un cuadrado en Z y
consideremos el polinomio
√ √
2 1+ m 1− m
4X − 4X + (1 − m) = 4(X − )(X − ) ∈ Z[X].
2 2
Consideremos una de las raı́ces en C y pensemos en el conjunto siguiente :
√ √
1+ m 1+ m
Z+Z = {a + b : a, b ∈ Z}.
2 2
13Nótese que ω 2 = −1 − ω y que (a + bω)(c + dω) es igual a ac − db + (ad + bc − bd)ω.
1.4. ANILLOS, IDEALES, MORFISMOS DE ANILLOS 65

Este conjunto es obviamente un subgrupo de (C, +) pero no siempre es un anillo. De hecho, la


condición clave es la siguiente:
m = 1 mod 4.
Si m 6= 1 mod 4, se tiene que:
√ √ √ √ √
1+ m 1+ m 1+ m1− m 1−m 1+ m
(1 − )= = 6∈ Z + Z .
2 2 2 2 4 2

Por tanto, si m 6= 1 mod 4, tenemos que el producto de dos elementos de Z + Z 1+2 m no

necesariamente está en Z + Z 1+2 m , con lo que, en este caso, no es un anillo. Sin embargo, si
m = 1 mod 4, podemos reemplazar el polinomio original por el siguiente:
1−m
4X 2 − 4X + (1 − m) = 4(X 2 − X + ).
4
El polinomio X 2 − X + 1−m4 ∈ Z[X] y tendremos:
√ √ √
1+ m 1+ m 1+ m 1−m
Z[ ]=Z+Z = {a + b : a, b ∈ Z} = Z[X]/(X 2 − X + ),
2 2 2 4
y recuperamos la analogı́a con situaciones anteriores y una nueva estructura de anillo sobre Z2 .

1.4.2. Anillos de polinomios y de series de potencias formales en varias va-


riables. Sea S un conjunto no vacı́o cualquiera y sea R un anillo. El conjunto RS de las
aplicaciones de S en R es claramente un anillo con las operaciones naturales de suma y producto
de aplicaciones. Recordaremos esta estructura de anillo.
En ocasiones usuaremos indistintamente cualquiera de las dos notationes siguientes:
RS = Ap(S, R) := {f : S −→ R : f es aplicación}.
Ejemplo 1.4.23 (Aplicaciones). Las operaciones de RS vienen dadas mediante la construcción
siguiente:
De una parte consideramos la suma usual de funciones, esto es, la aplicación:
+ : RS × RS −→ RS
(f, g) 7−→ f + g,
donde
(f + g)(x) := f (x) +R g(x), ∀x ∈ S,
y f (x) +R g(x) representa la suma en R. Es claro que (RS , +) es un grupo abeliano. De otra
parte podemos definir una operación producto:
· : RS × RS −→ RS
(f, g) 7−→ f · g,
donde
(f · g)(x) := f (x) ·R g(x), ∀x ∈ S.
y f (x) ·R g(x) representa el producto en R. Usaremos la notación clásica RS para el conjunto
de las aplicaciones de S en R.
Proposición 1.4.24. Con las anteriores notaciones e hipótesis (RS , +, ·) es un anillo conmu-
tativo con unidad.
Demostración. Mero ejercicio de comprobación de propiedades. 

Retomemos el monoide (Nn , +) ya discutido en el Ejemplo 1.2.2 anterior. Queremos introducir


n
una estructura de anillo en el grupo abeliano (RN , +) y que tenga un buen comportamiento
cara a un procesio de división que se “parezca” a la división euclı́dea (en el Teorema 1.4.15
anterior) y que se denominará división de Hironaka (véase el Problema 67) . En el caso de la
división euclı́dea un elemento esencial es el orden natural del conjunto N (obsérvese que, en la
demostración, se usa de manera esencial la existencia del mı́nimo de un cierto conjunto y, para
haber un mı́nimo tiene que haber un orden y, a ser posible, un buen orden). Exploremos un
poco más esta idea.
66 1. PRE-ÁLGEBRA

Observación 1.4.25 (Orden en (Nn , +) y Biyecciones con N). Podemos identificar Nn con
N de diversas formas. Cada biyección ϕ : Nn −→ N induce una relación de orden sobre Nn del
modo siguiente:
Dados µ, θ ∈ Nn , µ ≤ϕ θ si y solamente si ϕ(µ) ≤ ϕ(θ). Nos interesa no solamente una biyección
sino que, además, se comporte bien sobre la estrcuctura de monoide. En este sentido, en lugar
de tratar con biyecciones, interesan, sobre todo, los órdenes monomiales.
Definición 26 (Orden Monomial). Un orden monomial sobre (Nn , +) es una relación de
orden ≤ sobre Nn que verifica las siguientes propiedades:
i) Es un buen orden (i.e. todo subconjunto no vacı́o de Nn posee mı́nimo para ≤)
ii) ∀µ, θ, τ ∈ Nn , si µ ≤ τ , entonces µ + θ ≤ τ + θ.)
iii) El elemento 0 = (0, . . . , 0) ∈ Nn es el mı́nimo de (Nn , ≤).
Ejemplo 1.4.26 (Orden Lexicográfico). El orden lexicográfico ≤lex es el orden dado por la
regla siguiente:
Dados µ := (µ1 , . . . , µn ) ∈ Nn y ν := (ν1 , . . . , νn ) ∈ Nn , diremos que µ ≤lex ν si existe
k ∈ {0, . . . , n − 1} tal que se verifican las dos propiedades siguientes:
• µi = νi , para 1 ≤ i ≤ k. Obsérvese que si k = 0, esta condición es la condici—ón
vacı́a.
• µk+1 ≤ νk+1 .
Es claramente un ordem monomial en Nn .

Ejemplo 1.4.27 (Orden Grado+lexicográfico). Otro ejemplo de orden monomial es el


≤deglex , también denominado “grado + lexicográfico” (≤deglex ) y en ocasiones denotado medi-
ante grlex , que se define del modo siguiente:
Sea ≤lex el orden lexicográfico en Nn . Obsérvese que ≤lex no es un orden que permita Identi-
ficar (biyectar) Nn con N. Entonces, definimos: para µ, θ ∈ Nn , diremos que µ ≤deglex θ si se
verifica:
[|µ| < |θ|] ∨ [(|µ| = |θ|) ∧ (µ ≤lex θ)] .
En el Problema 67 se discuten estos órdenes monomiales como preparación para la División de
Hironaka.
Independientemente de los órdenes monomiales que respetan la operación + en Nn , tenemos
también propiedades internas de finitud asociadas a la operación suma.
Lema 1.4.28. Sea µ ∈ Nn un multiı́ndice. Entonces, el siguiente conjunto es finito:
Tµ := {(α, β) ∈ Nn × Nn : α + β = µ}.
Además, si µ = (µ1 , . . . , µn ), el cardinal de Tµ satisface:
n
Y
] (Tµ ) = (µi + 1).
i=1

Demostración. Ver Problema 69. 


n
Sea R un anillo y consideremos el grupo aditivo (RN , +) de las aplicaciones de Nn en R.
Definamos la función producto siguiente:
n n n
∗ : RN × RN −→ RN ,
dada mediante:
n
Dadas f, g ∈ RN , definamos: f ∗ g : Nn −→ R, mediante:
X
f ∗ g(µ) := f (θ)g(τ ).
θ,τ ∈Nn ,θ+τ =µ

Obsérvese que esta operación producto es la versión discreta de la convolución de funciones


medibles y que está bien definida gracias al Lema 1.4.28 precedente (porque se trata de una
suma finita en R).
n
Proposición 1.4.29. La terna (RN , +, ∗) es un anillo conmutativo con unidad que se denomina
anillo de series de potencias formales en n variables con coeficientes en R y se denota mediante
R[[X1 , . . . , Xn ]], sin necesidad de insistir en las operaciones + y ∗ definidas sobre él.
1.4. ANILLOS, IDEALES, MORFISMOS DE ANILLOS 67

Demostración. Es un sencillo ejercicio de verificación. 


n
Nótese que (RN , +, ·) difiere fuertemente de R[[X1 , . . . , Xn ]] como anillo. Por ejemplo, to-
dos los elementos σ ∈ RX tales que el soporte está estrictamente contenido en Nn (i.e. si
n
existe µ ∈ Nn tal que σ(µ) = 0) son divisores de cero en (RN , +, ·) lo que no es el caso en
R[[X1 , . . . , Xn ]]. Se puede verificar fácilmente tomando 1 ∈ R[[X1 , . . . , Xn ]]: 1 no es divisor
n
de cero en (R[[X1 , . . . , Xn ]], +, ∗) pero sı́ los es como elemento en (RN , +, ·). No sólo no son
isomorfos sino que tendrán más que notables diferencias.
n
Dada σ ∈ RN definamos su soporte mediante la siguiente identidad:
supp(σ) := {µ ∈ Nn : σ(µ) 6= 0}.
n
Designemos mediante R[X1 , . . . , Xn ] ⊆ RN al subconjunto formado por las series de soporte
finito. Esto es,
n
R[X1 , . . . , Xn ] := {σ ∈ RN : supp(σ) es un conjunto finito}.
Proposición 1.4.30. Con las anteriores notaciones R[X1 , . . . , Xn ] es un subanillo propio de
R[[X1 , . . . , Xn ]] que se denomina el anillo de polinomios en n variables con coficientes en R. A
los elementos de R[X1 , . . . , Xn ] se les denomina polinomios en las variables {X1 , . . . , Xn } con
coeficientes en R.
Demostración. Se trata simplemente de verificar las propiedades indicadas. 

La siguiente es una Proposición de fácil demostración:


Proposición 1.4.31. Con las anteriores notaciones se tiene para cada m ≤ n:
i) R[[X1 , . . . , Xm ]][[Xm+1 , . . . , Xn ]] = R[[X1 , . . . , Xn ]].
ii) R[X1 , . . . , Xm ][Xm+1 , . . . , Xn ] = R[X1 , . . . , Xn ].
Demostración. Es de sencilla verificación, usando apropiadamente la terminologı́a de
n
aplicaciones en RN usada para definir series de potencias formales y polinomios multivariados.


Notación 1.4.32 (Monomios, términos, grado). Hay una notación estandarizada de estos
objetos. Supongamos dado un multi-ı́ndice µ := (µ1 , . . . , µn ) ∈ Nn . Se define el monomio
X µ := X1µ1 X2µ2 · · · Xnµn ∈ R[X1 , . . . , Xn ] como la transformación X µ : Nn −→ R, dada medi-
ante: 
µ 1, si θ = µ,
X (θ) :=
0, en caso contrario.
Dado a ∈ R, se define el el término aX µ ∈ R[X1 , . . . , Xn ] como como la transformación
aX µ : Nn −→ R, dada mediante:

a, si θ = µ,
aX µ (θ) :=
0, en caso contrario.
Se dice que a 6= 0 es el coeficiente de aX µ , que µ es su exponente monomial (es decir, µ =
exp(aX µ )) y diremos que el grado del término es el grado del exponente monomial, esto es, el
número natural
deg(aX µ ) := |µ| = µ1 + µ2 + · · · + µn ∈ N.
como en el Ejemplo 1.2.2. En el caso a = 0 diremos que el grado del término es −1.
Lema 1.4.33. Con estas notaciones, R es un subanillo de R[X1 , . . . , Xn ], identificando R con
el conjunto de términos:
{λX (0) : λ ∈ R},
donde (0) = (0, . . . , 0) ∈ Nn es el elemento neutro de Nn como monoide. Escribiremos 1 en
lugar de X (0) y a ∈ R[[X1 , . . . , Xn ]] en lugar de aX (0) , para cada a ∈ R.
Demostración. Obvio. 
68 1. PRE-ÁLGEBRA

n
Notación 1.4.34. Definamos, además, los siguientes elementos de RN : {X1 , . . . , Xn } dados
mediante las reglas siguientes:

1, si θ = (1, 0, 0, . . . , 0),
X1 : Nn −→ R, X1 (θ) :=
0, en caso contrario.

1, si θ = (0, 1, 0, . . . , 0),
X2 : Nn −→ R, X2 (θ) :=
0, en caso contrario.
..
.

1, si θ = (0, 0, 0, . . . , 1),
Xn : Nn −→ R, Xn (θ) :=
0, en caso contrario.
Se denominan las variables X1 , . . . , Xn . Podemos definir también las potencias de variables a
n
partir de la operación producto ∗ de RN :
Xi0 := 1, Xi1 := Xi , Xi2 := Xi ∗ Xi ,

Xit := Xit−1 ∗ Xi .
Lema 1.4.35. Con las anteriores notaciones, dado µ = (µ1 , . . . , µn ) ∈ Nn , y para cada a ∈ R
se tiene:
aX µ = a ∗ X1µ1 ∗ · · · ∗ Xnµn .
Demostración. Es un ejercicio obvio. 

Observación 1.4.36. En ocasiones se “olvida” que la operación entre variables es la operación


convolución ∗ y se omite. Por eso encontraremos como notación estandarizada:
aX µ = aX1µ1 · · · Xnµn .
Debe tenerse cuidado con esta omisión y ser siempre consciente de su presencia, sobre todo
cuando se comparan las operaciones producto de polinomios y series con las operaciones pro-
n
ducto de aplicaciones que definı́an el anillo (RN , +, ·).

Proposición 1.4.37. Con las anteriores notaciones, para cada polinomio f ∈ R[X1 , . . . , Xn ] y
su soporte finito supp(f ) ⊆ Nn de y existen {aµ : µ ∈ supp(f )} ⊆ R \ {0} una cantidad finita
de elementos del anillo tales que:
X X
f := aµ X µ = aµ X1µ1 ∗ · · · ∗ Xnµn .
µ∈supp(f ) µ∈supp(f )

Obviamente, se verifica que f 6= 0 si y solamente si supp(f ) 6= ∅. Al siguiente valor se le


denomina el grado de f ∈ R[X1 , . . . , Xn ] \ {0}:
deg(f ) := max{|µ| : µ ∈ supp(f )} ∈ N.
En el caso f = 0 diremos que deg(f ) = −1
Demostración. Mero ejercicio de comprobación a partir de las definiciones. 

Observación 1.4.38. En el caso de series de potencias formales también se admite una repre-
sentación de la forma siguiente: Dada σ ∈ R[[X1 , . . . , Xn ]], escribiremos:
X X
σ := aµ X µ = aµ X µ ,
µ∈Nn µ∈supp(σ)

aunque, obviamente, se trata de una suma infinita y meramente simbólica. Sin embargo, será
posible generar una topologı́a (y una métrica) en algunos anillos de la forma R[[X1 , . . . , Xn ]]
(especialmente interesante en el caso de que R sea un cuerpo) para los que esa suma infinita es
un lı́mite, pero el asunto requiere varias discusiones ulteriores.

Teorema 1.4.39. Si R es dominio de integridad, también lo son R[X1 , . . . , Xn ] y R[[X1 , . . . , Xn ]].


1.4. ANILLOS, IDEALES, MORFISMOS DE ANILLOS 69

Demostración. Bastará con probar el enunciado para R[[X1 , . . . , Xn ]] porque, al ser


R[X1 , . . . , Xn ] subanillo, la condición de ser dominio de integridad se hereda. Sean f, g ∈
R[[X1 , . . . , Xn ]] dos elementos ninguno de ellos nulo. Por tanto, sus respectivos soportes son
no vacı́os:
supp(f ) := {θ ∈ Nn : f (θ) 6= 0} =
6 ∅, supp(f ) := {θ ∈ Nn : f (θ) 6= 0} =
6 ∅.
Consideremos un orden monomial ≤ sobre Nn (como ≤deglex antes definido), que es un buen
orden sobre Nn . Ambos soportes poseen, por tanto, mı́nimo. Denotemos por µ := min supp(f )
y ν := min supp(g) los mı́nimos de los respectivos soportes. Definamos ρ := µ + ν ∈ Nn la
suma de ambos mı́nimos. Consideremos el conjunto de ı́ndices
Tρ := {(α, β) ∈ Nn : α + β = ρ},
y su subconjunto formado por los pares en los respectivos soportes de f y g:
Tρ0 := {(α, β) ∈ Tρ ×Tρ : f (α) 6= 0, g(β) 6= 0} = {(α, β) ∈ Tρ ×Tρ : α ∈ supp(f ), β ∈ supp(g)}.
Es claro que el la suma que define el valor f ∗ g(ρ) sólo intervienen los términos que viven,
respectivamente, en los soportes de f y g, esto es
X X
f ∗ g(ρ) := f (α)g(β) = f (α)g(β).
α+β=ρ (α,β)∈Tρ0

Veamos finalmente que Tρ0 = {(µ, ν)}. Es claro que el par (µ, ν) está en Tρ0 . Queda por ver el
otro contenido. Además, si (α, β) ∈ Tρ0 , entonces, α ∈ supp(f ) y β ∈ supp(g). Pero, como el
orden monomial escogido es un orden total, entonces,
α ≥ µ = min suppf (f ), β ≥ ν = min supp(g).
Concluyamos que si α > µ o β > ν, α ∈ supp(f ) y β ∈ supp(g), entonces, α + β > ρ y
(α, β) 6∈ Tρ0 . Supongamos, sin pérdida de la generalidad, que α > µ y que α + β = ρ. Nótese
que, en Nn , como subconjunto del grupo abeliano Zn , si µ + θ = α + θ, para algún θ ∈ Nn ,
entonces se debe tener µ = α. Por tanto, considerando el orden monomial, y su definición,
tendremos
µ < α =⇒ µ + ν < α + ν,
y
ν ≤ β =⇒ α + ν ≤ α + β.
En conclusión, tenemos
ρ = µ + ν < α + β,
y, por tanto, si µ < α , α ∈ supp(f ) y β ∈ supp(g), entonces y α + β 6= ρ y (α, β) 6∈ Tρ0 .
En suma, hemos probado que Tρ0 = {(µ, ν)} y, por ser R un dominio de integridad,
X
f ∗ g(ρ) := f (α)g(β) = f (µ)g(ν) 6= 0.
α+β=ρ

En particular, ρ ∈ supp(f ∗ g) 6= ∅ y, por tanto, f ∗ g 6= 0. 

Proposición 1.4.40. Sea K un cuerpo y K[X1 , . . . , Xn ] el anillo de polinomios en n variables


con coeficientes en K. Entonces,
i) K[X1 , . . . , Xn ] es un K−espacio vectorial, con base dada por los monomios
{X µ : µ ∈ Nn }.
ii) Dado un polinomio f ∈ K[X1 , . . . , Xn ], tenemos una representación como suma finita:
X
f := aµ X µ ,
µ∈∈supp(f )

donde {aµ : µ ∈ I} ⊆ K es un conjunto finito.


70 1. PRE-ÁLGEBRA

iii) Dado un entero d ∈ N, denotaremos por Hd (X1 , . . . , Xn ) al K−subespacio vectorial


de K[X1 , . . . , Xn ] generado por los monomios de grado d, es decir, generado por:
{X µ : |µ| = d, µ ∈ Nn }.
A los elementos de Hd (X1 , . . . , Xn ) los llamamos polinomios homogéneos de grado d.
Entonces, Hd (X1 , . . . , Xn ) es un espacio vectorial de dimensión finita e igual a
 
d+n−1
dimK Hd (X1 , . . . , Xn ) = .
n−1
Más aún, tenemos la descomposición de K[X1 , . . . , Xn ] en suma directa de subespacios
siguiente: M
K[X1 , . . . , Xn ] := Hd (X1 , . . . , Xn ).
d∈N
Obviamente, se tiene que H0 (X0 , . . . , Xn ) = K.
iv) Con las notaciones de la afirmación precedente, se tiene:
∀f ∈ Hd (X0 , . . . , Xn ), ∀g ∈ Hk (X0 , . . . , Xn ) =⇒ f · g ∈ Hd+k (X0 , . . . , Xn ),
donde · es el producto de polinomios descrito anterioremente.
Demostración. Las afirmaciones son de mera comprobación. 
1.4.3. Otros ejemplos.
Ejemplo 1.4.41 (Funciones Booleanas). Son funciones básicas en Lógica y en Electrónica
Digital, a través de los circuitos booleanos o digitales. Por ahora nos vamos a conformar con
definirlas. Comenzamos observando la identificación {0, 1} = Z/2Z que identifica los valores
boooleanos {0, 1} (o también en su versiones verdadero/falso: {V, F}) con el cuerpo primo de
caracterı́stica 2. Se denomina función booleana de n variables a toda aplicación: f : {0, 1}n −→
{0, 1}. Se define el conjunto de funciones booleanas :
Bn := {f : {0, 1}n −→ {0, 1} : f es aplicación}.
Es fácil de observar que podemos identificar
Bn ∼= P({0, 1}n ),
es decir, el conjunto de funciones booleanas con el conjunto de todos los subconjuntos de {0, 1}n .
La biyección entre ambos conjuntos es dada por las funciones caracterı́sticas:
• Dado un subconjunto L ∈ P({0, 1}n ), definimos la función booleana χL ∈ Bn dada
mediante:
∀x ∈ {0, 1}n , χL (x) = 1 ⇐⇒ x ∈ X.
• Recı́procamente, dada una función booleana f ∈ Bn , definimos el lenguaje aceptado
por f como L := f −1 ({1}) ∈ P({0, 1}n ).
{0,1}n
Ahora, identificando {0, 1} con Z/2Z, observamos que Bn := Ap({0, 1}n , Z/2Z) = (F2 ) y
tiene una estructura de anillo natural a través de las operaciones del cuerpo Z/2Z.

Podemos concluir:
Proposición 1.4.42. El conjunto de funciones booleanas Bn tiene una estructura natural de
anillo conmutativo con unidad, es biyectable al conjunto P({0, 1}n ) y tiene, por tanto, cardinal
dado por la siguiente identidad:
n
] (Bn ) = 22 .
Demostración. Es lo discutido en párrafos previos. 
Ejemplo 1.4.43 (Funciones Holomorfas). Un ejemplo de dominio de integridad que se sale
del contexto de este curso es el siguiente:
• Sea U ⊆ Rn un abierto y consideramos el siguiente conjunto:
C ω (U ) := {f : U −→ R : f es analı́tica en U }.
Es un sencillo ejercicio de análisis, probar que C ω (U ) es un subanillo de (RU , +, ·) y,
por tanto, un anillo con las operaciones habituales de suma y producto de funciones.
Se llama el anillo de las funciones analı́ticas sobre U .
1.4. ANILLOS, IDEALES, MORFISMOS DE ANILLOS 71

• Sea U ⊆ Cn un abierto y consideramos el siguiente conjunto:


H(U ) := {f : U −→ C : f es analı́tica en U }.
Un clásico ejercicio de Análisis consiste en probar que H(U ) es un subanillo de
(CU , +, ·) y, por tanto, un anillo con las operaciones habituales de suma y producto de
funciones. A las funciones en H(U ) se las denomina funciones holomorfas y a H(U )
se denomina anillo de las funciones holomorfas definidas en U .
Se tiene el siguiente resultado:
Teorema 1.4.44. Sea U ⊆ C un abierto no vacı́o. Entonces, el anillo de funciones holomorfas
definidas en U , que hemos denotado por H(U ), es un dominio de integridad si y solamente si
U es un abierto conexo.
Demostración. Baste con observar que el conjunto de ceros de una función holomorfa
compleja no nula es un conjunto numerable sin puntos de acumulación (i.e. que los ceros de
funciones holomorfas son puntos aislados 14). Con este resultado, supongamos que U es abierto
conexo y que el producto de dos funciones f, g ∈ H(U ) es tal que f g se anula idénticamente en
U . Entonces, podemos observar que
U = VU (f ) ∪ VU (g),
donde VU (f ) y VU (g) son los ceros en U de f y g necesariamente. Pero U es un abierto en
C, luego no es numerable, mientras que la unión de dos numerables es numerable. Esto quiere
decir que si f 6= 0 y g 6= 0, entonces tendrı́amos U como unión de dos numerables llegando a
contradicción. Luego, necesariamente U = VU (f ) o U = VU (g), lo que equivale a decir f = 0 o
g = 0 y H(U ) es dominio de integridad.
Para el recı́proco, baste con observar lo siguiente: Si U no fuera conexo, posee una descom-
posición como unión de dos abiertos disjuntos U = U1 ∪ U2 . Entonces, podemos definir dos
funciones no nulas f1 , f2 : U −→ C, del modo siguiente:

1 si x ∈ Ui
fi (x) :=
0 en caso contrario
Obviamente f1 f2 = 0 y ninguna de ellas es nula. 
Observación 1.4.45. [Las funciones C y los divisores de cero] El anterior resultado es

también cierto en el caso de funciones analı́ticas reales definidas sobre abiertos U ⊆ R, es decir
C ω (U ) es dominio de integridad si y solamente si U es conexo. En cambio, el resultado no
es cierto para funciones diferenciables o para funciones continuas. Si tratamos con funciones
C ∞ (R) podemos encontrar dos funciones f+ y f− : R −→ R tales que ambas son infinitamente
diferenciables y verifican:


 f+ (x) = 0, f− (x) = 1, si x ∈ (−∞, −1)
f+ (x) = 0, si x ∈ (−1, 0)


 f − (x) = 0, si x ∈ (0, 1)
f+ (x) = 1, f− (x) = 0, si x ∈ (1, +∞)

Claramente f+ f− = 0 y ninguna de ellas dos es un función nula, con lo que C ∞ (R) no es


dominio de integridad. Como ejercicio se propone buscar esas dos funciones en el caso U = R.

1.4.4. Ejercicios y problemas de la Sección 1.4.


Problema 43. Pruébese que todas las afirmaciones descritas en la Proposición 1.4.9.
Problema 44. Pruébese la Proposición 1.4.24.
Problema 45. Pruébese la Proposición 1.4.42.
Problema 46. Pruébense las siguientes igualdades que caracterizan las unidades R× de los
anillos que se indican:
i) Z[i]× = {±1, ±i} ∼
= (Z/4Z).

14Buscar http://en.wikipedia.org/wiki/Zeros_and_poles.
72 1. PRE-ÁLGEBRA

ii) Si Z[ω] es el anillo de Eisenstein, probrar


Z[ω]× = {±1, ±ω, ±ω 2 }.
iii) Si m < −1 es un entero, probar que:

Z[ m]× = {±1}.
iv) Si m ∈ Z es un entero tal que m ≡ 1 mod 4 y m < −3, entonces
  √ ×
1+ m
Z = {±1}.
2
Problema 47. Sea K un cuerpo y consideremos el conjunto de los polinomios en una variable
de grado a lo sumo d y con coneficientes en K. Esto es, el conjunto:
K[X]d := {f ∈ K[X] : deg(f ) ≤ d}.
Probad:
• (K[X]d , +) es un grupo con la suma de polinomios univariados.
• (K[X]d , +, ·K ) es un espacio vectorial de dimensión d + 1 con base monomial:
Md (X) := {1, X, X 2 , . . . , X d }.
• Pero (K[X]d , +, ·) no es anillo con las operaciones habituales de suma y producto de
polinomios.
Problema 48 (Funciones continuas). Sea (X, T ) un espacio topológico y sea U ⊆ X un
abierto. Consideramos el siguiente conjunto de las funciones continuas a valores reales definidas
en U ( a veces denotado mediante C 0 (U ) o C (U ), según el contexto)
C (U ) := {f : U −→ R : f es continua}.
Hay que probar que C (U ) es un subanillo de (RX , +, ·) y, por tanto, un anillo con las operaciones
habituales de suma y producto de funciones.
Problema 49 (Funciones continuas a valores complejos). Sea (X, T ) un espacio topológico
y sea U ⊆ X un abierto. Consideramos el siguiente conjunto:
C (U, C) := {f : U −→ C : f es continua}.
Se debe probar que C (U, C) es un subanillo de (CU , +, ·) y, por tanto, un anillo con las opera-
ciones habituales de suma y producto de funciones. ¿Qué relación tienen C (U ) y C (U, C)?.
Problema 50 (Funciones Diferenciables). Sea k ∈ N ∪ {∞}, k ≥ 1 y sea M una variedad
diferenciable de clase C ∞ . Sea U ⊆ M un abierto y consideramos el siguiente conjunto:
C k (U ) := {f : U −→ R : f es k veces diferenciable con derivada k−ésima continua}.
Probad que C k (U ) es un subanillo de (RU , +, ·) y, por tanto, un anillo con las operaciones
habituales de suma y producto de funciones.
Problema 51. Buscar ejemplos de funciones no nulas f+ y f− de clase C ∞ (R) y tales que
f+ f− = 0 en todo R y que se citan en la observación 1.4.45. Concluir que C k (R) no es dominio
de integridad para todo k, 0 ≤ k ≤ ∞. (Pista: Considerar la función f :−→ R siguiente:

0, si x ≤ 0
f (x)
e−1/x , si x > 0.
Problema 52. Buscar ejemplos de abiertos X en R tales que cada contenido es estricto (ver
cursos previos de Análisis Matemático) y, por tanto, dan lugar a un contenido estricto de
anillos:
• X tal que R ( C ω (X),
• X tal que C ω (X) ( C ∞ (X),
• X tal que C ∞ (X) ( C k (X), con k < ∞,
• X tal que C 2 (X) ( C 1 (X),
• X tal que C 1 (X) ( C (X).
1.4. ANILLOS, IDEALES, MORFISMOS DE ANILLOS 73

Problema 53. Sea x un elemento nilpotente de un anillo R (un elemento x ∈ R se llama


nilpotente si ∃n ∈ N, xn = 0 ∈ R). Probad que 1 + x ∈ R× . Deducir que la suma de un
elemento nilpotente y una unidad en un anillo es una unidad del anillo.
Problema 54. Sea f = a0 +a1 X +· · ·+an X n ∈ R[X] un polinomio univariado con coeficientes
en un anillo R. Probad que f es una unidad en R[X] si y solamente si a0 es una unidad en
R y a1 , . . . , an son nilpotentes en R. Probad también que f es nilpotente si y solamente si
a0 , a1 , . . . , an son nilpotentes en R.
Problema 55. Con las notaciones de los problemas anteriores, probar que f es divisor de
cero en R[X] si y solamente si existe a ∈ R \ {0} tal que af = 0. ( Hint: Suponed que
f = a0 + a1 X + · · · + an X n , con an 6= 0, y considerad el conjunto de todos los polinomios
en R[X] que anulan f , es decir, AnnR[X] (f ) := {g ∈ R[X] : gf = 0}, que es un ideal de
R[X]. Considérese el conjunto de los grados de los polinomios no nulos en AnnR[X] (f ), es
decir, N (f ) := {deg(g) : g 6= 0, g ∈ AnnR[X] (f )}. Si f es un divisor de cero, entonces
N (f ) ⊆ N es un conjunto no vacı́o que posee un mı́nimo. Sea m := min(N (f )) ese mı́nimo
y sea g ∈ AnnR[X] (f ) un polinomio de grado m (y, por tanto, g 6= 0). Supongamos g =
b0 + b1 X + · · · + bm X m , con bm 6= 0. Sabemos que gf = 0 y consideremos el polinomio an g.
Del hecho gf = 0, concluimos que an bm = 0 y, además, an g es un polinomio de grado menor
o igual que m − 1. Pero, además, an g ∈ AnnR[X] (f ) por ser ideal. Por tanto, an g = 0.
Inductivamente, concluir que ai g = 0 para todo i, 0 ≤ i ≤ n. Concluid que, si se da ai g = 0,
para cada i, 0 ≤ i ≤ n, entonces, en particular, ai bm = 0 para cada i, 0 ≤ i ≤ n. Concluid,
finalmente, que bm f = 0 y bm 6= 0, que es lo buscado en el problema. )
Problema 56 (Funciones Polinomiales sobre un conjunto V ). Sea R un anillo y sea
V ⊆ Rn un subjconjunto cualquiera. Se definen las funciones polinomiales sobre V del modo
siguiente:
i) Son funciones polinomiales las siguientes:
(a) Son funciones polinomiales sobre V las constantes. Es decir, dado a ∈ R, la
siguiente es una función polinomial sobre V :
a: V −→ R
x 7−→ a.
(b) Son funciones polinomiales sobre V las proyecciones. Es decir, para cada i,
1 ≤ i ≤ n, la siguiente es una función polinomial sobre V :

πi V : V −→ R
(x1 , . . . , xn ) 7−→ xi .

En el caso V = Rn escribiremos simplemente πi en lugar de πi Rn .
ii) Las funciones polinomiales son estables por las siguientes reglas:
(a) Las funciones polinomiales son estables por la suma de funciones. Es decir, dadas
dos funciones polinomiales f, g : V −→ R, la siguiente es una función polinomial
sobre V :
f + g : V −→ R
x 7−→ f (x) + g(x).
(b) Las funciones polinomiales son estables por el producto de funciones. Es decir,
dadas dos funciones polinomiales f, g : V −→ R, la siguiente es una función
polinomial sobre V :
f ·g : V −→ R
x 7−→ f (x) · g(x).
Se define el anillo de funciones polinomiales R[V ] sobre V con respecto al anillo R como el
menor subanillo de RV que satisface las propiedades (1) y (2) anteriores. Pruébese que se
trata de la R−álgebra
(contenida
en RV ) generada por R y las proyecciones canónicas (es
decir R[V ] = R[π1 V , . . . , πn V ]) conforme a la Proposición 1.4.7 (debe tenerse en cuenta que

las proyecciones de referencia πi V son las restricciones a V de las proyecciones desde Rn ).
Pruébese que dado un subconjunto V ⊆ Rn , entonces existe un epimorfismo natural de anillos
Φ : R[X1 , . . . , Xn ] −→ R[V ],
74 1. PRE-ÁLGEBRA


tal que Φ(a) = a, ∀a ∈ R y Φ(Xi ) = πi V , para 1 ≤ i ≤ n.

Problema 57. Probad que si K es un cuerpo infinito, y V = An (K) = K n el espacio afı́n


sobre el cuerpo K, entonces el morfismo de anillos
Φ : K[X1 , . . . , Xn ] −→ K[An (K)] = K[π1 , . . . , πn ],
definido en el problema anterior es un isomorfismo de anillos. ( Hint: Prueba que si K es un
cuerpo finito, entonces el núcleo Ker(Φ) del morfismo anterior es no nulo y Φ no es inyectiva).
Problema 58. Prueba que si K es un cuerpo infinito, f ∈ K[X1 , . . . , Xn ] es un polinomio
y ϕf := Φ(f ) es la función polinomial asociada a f mediante Φ del Problema 57 anterior,
Entonces, si ϕf (x) = 0, ∀x ∈ K n , se tiene f = 0 en K[X1 , . . . , Xn ]. Comprobar que esta
implicación no es cierta cuando K no es un cuerpo infinito.
Problema 59. Probad que el anillo de funciones booleanas Bn está identificado con el anillo
n
de las aplicaciones del conjunto (Z/2Z) en el cuerpo F2 = Z/2Z. Y que se tiene Bn =
F2 [An (F2 )] = F2 [π1 , . . . , πn ].
Problema 60. Conforme a la Proposición 1.4.40, un polinomio f ∈ K[X1 , . . . , Xn ] se dice ho-
mogéneo si es una suma finita de términos del mismo grado. Pruébese que si f ∈ K[X1 , . . . , Xn ]
es un polinomio homogéneo de grado d, si x = (x1 , . . . , xn ) ∈ An (K) y si λ ∈ K, se tiene:
f (λx) = λd f (x).
Prueba también que para todo polinomio homogéneo f ∈ Hd (X0 , . . . , Xn ) (con d no divisible
por la caracterı́stica de K) se verifica la siguiente identidad ( Identidad de Euler):
n
X ∂f
df := Xi .
i=0
∂Xi

Concluir que todo polinomio homogéneo f (cuyo grado no es divisible por la caracterı́stica del
cuerpo) está en el ideal homogéneo generado por sus derivadas parciales, i.e.
 
∂f ∂f ∂f
f∈ , ,..., .
∂X0 ∂X1 ∂Xn
Problema 61. Probad que si U = U1 ∪ U2 ⊆ X es un abierto en un espacio topológico (X, T )
con dos componentes conexas U1 , U2 disjuntas, entonces C (U ) no es dominio de integridad.
Problema 62. Sea K ⊆ E una extensión finita de cuerpos (es decir, E es un K−espacio
vectorial de dimensión finita sobre K). Para cada α ∈ E, se define la siguiente aplicación:
ηα : E −→ E
x 7−→ αx.
Se pide probar las siguientes propiedades:
i) La aplicación ηα es un endomorfismo de espacios vectoriales de E.
ii) Fijada una base ordenada B de E como espacio vectorial, existe una matriz Mα ∈
Mn (K) que es la matriz de ηα con respecto a esa base.
iii) Dados α, β ∈ E y λ ∈ K se tiene las siguientes propiedades:
ηαβ = ηα ◦ ηβ = ηβ ◦ ηα , ηα+β = ηα + ηβ = ηβ + ηα , ηλα = ληα ,
donde las operaciones entre elementos de E son las propias del cuerpo E y las opera-
ciones entre endomorfismos son las propias de EndK (E).
iv) Dados α, β ∈ E y λ ∈ K se tiene las siguientes propiedades entre matrices:
Mαβ = Mα Mβ = Mβ Mα , Mα+β = Mα + Mβ = Mβ + Mα , Mλα = λMα ,
donde las operaciones entre elementos de E son las propias del cuerpo E y las opera-
ciones entre matrices son las propias de Mn (E).
v) Si p ∈ K[X] es un polinomio tal que p(Mα ) = 0, entonces p(α) = 0.
vi) Concluir que todos los elementos de E son algebraicos sobre K.
1.4. ANILLOS, IDEALES, MORFISMOS DE ANILLOS 75

1.4.4.1. Problemas sobre cuerpos ordenados o formalmente reales.


Problema 63 (Órdenes sobre un cuerpo). Un orden sobre un cuerpo (K, +, ·) es un sub-
conjunto P ⊆ K tal que se verifica:
P + P ⊆ P, P · P ⊆ P, P ∩ (−P ) = {0}, P ∪ (−P ) = K,
donde −P = {−x : x ∈ P } y P + P o P · P son los conjuntos
P + P := {x + y : x ∈ P, y ∈ P },
P · P := {x · y : x ∈ P, y ∈ P },
P
Sea K el conjunto de las sumas finitas de cuadrados de elementos de K usados en el
Problema 4. Es decir,
X n
X
K := {b ∈ K : ∃m ∈ N, m ≥ 1, ∃a1 , . . . , am ∈ K, b = a2i }.
i=1
Pruébese:
i) La relación definida del modo siguiente:
∀x, y ∈, x ≤P y ⇐⇒ y − x ∈ P,
es una relación de orden total sobre el cuerpo K.
ii) Pruébese que esta relación de orden total respeta las operaciones del cuerpo, es decir,
se verifican las siguientes propiedades:
• ∀x, y ∈ K, x ≤ 0, y ≥ 0 =⇒ x + y ≥ 0.
• ∀x, y, K, x ≥ 0, y ≥ 0 =⇒ xy ≥ 0. P
iii) Pruébese que si P es un orden sobre un cuerpo se verifica K ⊆ P , pero −1 6∈ P
( Hint: Para la primera afirmación, dado x ∈ K, si x ∈ P , entonces x2 ∈ P ; pero si
x 6∈ P , entonces −x ∈ P y, por tanto, x2 = (−x)2 ∈ P . Para la segunda afirmción
obsérvese que 1 = 12 = (−1)2 ∈ P .)
iv) Pruébese que cualquier relación de orden total sobre un cuerpo K que respete las
operaciones del cuerpo, viene de un orden P que satisface las propiedades indicadas
( Hint: Úsese el conjunto P := {x ∈ K : x ≥ 0} y pruébese que P es un orden).
Problema 64. Sea (K, +, ·) un cuerpo. Pruébese que las dos propiedades siguientes son equiv-
alentes:
P
i) −1 6∈ K , Pn
ii) Dados x1 , . . . xn ∈ K, si i=1 x2i = 0, entonces xi = 0 para cada i, 1 ≤ i ≤ n.
Diremos que K es un cuerpo formalmente real (o real) si se verifica algunas de las dos propiedades
equivalentes anteriores. Pruébese que Q, R y cualquier subcuerpo de R es un cuerpo formal-
mente real. Pruébese que C no es un cuerpo formalmente real.
Problema 65 (Pre-orden sobre un cuerpo). Un pre-orden ( también denominado cono
por algunos autores) sobre un cuerpo (K, +, · · · ) es un subconjunto P ⊆ K que verifica las
siguientes propiedades:
X
P + P ⊆ P, P · P ⊆ P, P ∩ (−P ) = {0}, K ⊆ P.
Decimos que un pre-orden es propio si −1 6∈ P .
i) Pruébese que P define una relación de orden parcial sobre K.
ii) Pruébese que todo orden sobre P
un cuerpo es un Ppre-orden.
iii) Pruébese que si K = Q y P = Q , entonces Q es un pre-orden sobre Q que no
es un orden sobre Q. P
iv) Pruébese que si K es un cuerpo formalmente real, entonces K es un pre-orden
propio sobre K.
v) Pruébese que si P es un pre-orden sobre K y si a 6∈ −P , el siguiente conjunto es un
pre-orden sobre K que contiene al pre-orden P :
P [a] := {x + ya : x, y ∈ P }.
vi) Con las mismas notaciones del ı́tem precedente, si P es un pre-orden propio, y si
a 6∈ −P , entonces P [a] es un pre-orden propio.
76 1. PRE-ÁLGEBRA

Problema 66. Pruébese que si K es un cuerpo formalmente real se tiene:


X \ X 
K − K = {0}.

Conclúyase el siguiente resultado:


Teorema 1.4.46 (Teorı́a de Artin-Schreier sobre cuerpos formalmente reales). Un
cuerpo es formalmente real si y solamente si admite algún orden P ⊆ K
( Hint: Consideremos el conjunto de todos los pre-órdenes propios de K:
A := {P ⊆ K : P es un pre-orden propio}.
K ∈ A (cf. problemas
P
Supóngase que K es formalmente real. Pruébese que, entonces,
precedentes) y A 6= ∅. Pruébese que A satisface la hipótesis del Axioma de Zorn (i.e. toda
cadena de elementos de A con respecto a la inclusión admite cota superior en A ). Sea P un
elemento maximal de A , que existirı́a por el Axioma de Zorn. Pruébese que, necesariamente,
para cada a ∈ K se ha de tener a ∈ P o −a ∈ P . Úsese para ello que si a 6∈ −P y P es
el elemento maximal de A , entonces P [a] es pre-orden propio (cf. problemas precedentes).
Conclúyase que K = P ∪ (−P ) y, entonces, P es un orden. La otra implicación es evidente).

1.4.4.2. Problemas sobre Órdenes Monomiales y división de Hironaka. La difi-


cultad principal en la algorı́tmica con polinomios multi-variados es la ausencia de un algoritmo
de división euclı́dea en el anillo K[X1 , . . . , Xn ] de polinomios multi-variados con coeficientes
en un cuerpo K. En particular, los ideales de este anillo de polinomios no son principales y
tampoco disponemos de un algoritmo de Euclides para el cálculo del máximo común divisor15.
El introductor de las bases de Gröbner fue Hironaka en sus famosos trabajos sobre resolución
de singularidades, de 1964, que la valió la medalla Fields. H. Hironaka llamó a estas bases
“bases standard” y demostró el Teorema de División que veremos más adelante. El algoritmo
de cálculo de bases standard (o de Gröbner) es debido a B. Buchberger. Los trabajos a los que
hacemos referencia son dos artı́culos aparecidos en el Annals of Mathematics: [Hir, 1964a] y
[Hir, 1964b]. La principal observación es la siguiente:
La división euclı́dea funciona por disponer N de un buen orden como monomio que, además, es
compatible con el producto de polinomios.
Esta observación permitirá extender la división euclı́dea (de una manera menos perfecta) al
anillo de polinomios en varias variables K[X1 , . . . , Xn ]. Usaremos las notaciones y terminologı́a
de la Subsección 1.4.2.
Problema 67. Con las notaciones de la Subsección 1.4.2, consideremos el monoide (Nn , +).
Recordemos de la Definición 26 que una relación de orden ≤ sobre Nn se denomina un orden
monomial si se verifican las siguientes propiedades :
i) La relación ≤ es un buen orden en Nn , ésto es, todo subconjunto no vacı́o de Nn posee
mı́nimo.
ii) Dados α, β, γ ∈ Nn , se tiene :
Si α ≤ β, entonces α + γ ≤ β + γ.
iii) El elemento 0 := (0, . . . , 0) es el mı́nimo de Nn .
Se pide probar que los siguientes son órdenes monomiales:
• El orden de N : Es el orden usual asociado a los algoritmos de división euclı́dea en
K[X].
• Lexicográfico (≤lex ): Es el orden dado por el orden lexicográfico. Viene dado en
los términos siguientes : Dados α := (α1 , . . . , αn ), β := (β1 , . . . , βn ) ∈ Nn , diremos
α ≤lex β si y solamente si se verifica la siguiente propiedad : existe k ∈ {0, . . . , n − 1},
tal que
αi = βi , ∀i, 1 ≤ i ≤ k, αk+1 ≤ βk+1 .

15Mejor dicho, disponemos del algoritmo de división (siempre que el divisor sea un polinomio mónico con
respecto a una de las variables), y de la noción de máximo común divisor (por el Lema de Gauss (cf. 6.2) pero
ni la una ni el otro tienen las buenas propiedades que tenı́an en el caso univariado.
1.4. ANILLOS, IDEALES, MORFISMOS DE ANILLOS 77

• Graduado Lexicográfico ≤deglex (a veces ≤grlex ): Consiste en añadir el grado


al orden ≤lex . Con las anteriores notaciones, diremos que α ≤deglex β si y solamente
si se verifica : o bien |α| < |β| o bien |α| = |β| y α ≤lex β.
• Graduado reverso lexicográfico ≤revdeglex 16 (a veces denotado ≤revgrlex ): Con
las mismas notaciones diremos que que α ≤revdeglex β si y solamente si se verifica : o
bien |α| < |β| o bien |α| = |β| y existe j ∈ {1, . . . , n} tal que αi = βi para todo i tal
que j + 1 ≤ i ≤ n y αj > βj o bien α = β.
Pruébese que ≤revdeglex no es ≤deglex , ni siquiera permutando las variables. ( Hint: Tómese el
caso de, al menos, tres variables {X1 , X2 , X3 }. Consideramos el orden revdeglex y tenemos
que los monomios de grado 2 están ordenados del modo siguiente:
X12 > X1 X2 > X22 > X1 X3 > X2 X3 > X32 ,
mientras que el ≤revdeglex da el orden siguiente:
X12 > X1 X2 > X1 X3 > X22 > X2 X3 > X32 .)
Antes de concluir, introduzcamos un poco más de notación sobre la representación densa de
polinomios f ∈ K[X1 , . . . , Xn ]. Supongamos fijado un orden monomial ≤ sobre Nn :
i) Grado de f : deg(f ) es el máximo de los grados de sus términos (o, equivalentemente,
el máximo de su soporte supp(f ) como serie de potencias formal).
ii) Multigrado de f : md(f ) es el máximo de los multigrados de los términos de f con
respecto el orden monomial ≤ fijado.
iii) Término director de f : LT (f ) es el término de f cuyo multigrado coincide con el
multigrado de f
iv) Coeficiente director de f : LC(f ) es el coeficiente del LT (f ).
Problema 68 (División de Hironaka). Es el resultado crucial para entender las bases
de Gröbner. En principio, petende ser un análogo a la división euclı́dea. Supongamos que
disponemos de un orden monomial ≤ sobre Nn . Definamos el escalón asociado a un expo-
nente monomial α ∈ Nn . Se define mediante :
E(α) := α + Nn = {α + β : β ∈ Nn } ⊆ Nn ,
donde + es la operación del monoide (Nn , +). Pruébese que
E(α) ≡ {X µ : X α | X µ },
donde | significa “divide” en el anillo de polinomios K[X1 , . . . , Xn ].
Pruébese el siguiente resultado, conocido como División de Hironaka:
Existe un algoritmo que realiza la tarea siguiente :
Dados f1 , . . . , fr ∈ K[X1 , . . . , Xn ], y dado g ∈ K[X1 , . . . , Xn ]. Supongamos fijados los multi-
grados de cada fi mediante:
αi := md(fi ), 1 ≤ i ≤ r.
Definamos los conjuntos de exponentes monomiales (multi-ı́ndices) en el monoide (Nn , +):
∆1 := E(α1 ),
∆2 := E(α2 ) \ ∆1 ,
∆3 := E(α3 ) \ (∆1 ∪ ∆2 ),
..
.
∆r := E(αr ) \ ∪r−1

i=1 ∆i ,
∆ := Nn \ (∪ri=1 ∆i ) .
El algoritmo anterior genera polinomios g1 , . . . , gr , h ∈ K[X1 , . . . , Xn ] tales que se satisfacen
las siguientes propiedades :
i) Para cada i, 1 ≤ i ≤ r, los términos del polinomio gi tienen multigrado en ∆i ,
ii) Los términos del polinomio h tienen multigrado en ∆,

16No se trata de un orden obtenible mediante los anteriores y una permutación de las variables. Debe
señalarse que, a pesar de lo extraño de su definición, suele ser el orden que mejor se comporta en la ejecución del
algoritmo de cálculo de bases de Gröbner. No se sabe muy bien el porqué de este fenómeno con este particular
orden monomial.
78 1. PRE-ÁLGEBRA

iii) Se verifica la siguiente igualdad :


g := g1 f1 + · · · + gr fr + h.
iv) Los polinomios g1 , . . . , gr verificando las anteriores propiedades son únicos y se de-
nominan cocientes de la división de Hironaka.
v) El polinomio h es único y se denomina resto de la división de Hironaka.
Problema 69. Pruébese el Lema 1.4.28. Es decir, pruébese que dada µ ∈ Nn un lista de
exponentes. Entonces, el siguiente conjunto es finito:
Tµ := {(α, β) ∈ Nn × Nn : α + β = µ}.
Además, si µ = (µ1 , . . . , µn ), el cardinal de Tµ satisface:
n
Y
] (Tµ ) = (µi + 1).
i=1
( Hint: Por inducción en n.)
Problema 70. Prueba la Proposición 1.4.12 sobre la caracterı́stica de un cuerpo.
Problema 71 (Algoritmo de Karastuba-Ofman, [KO, 1962]). Se trata de analizar un
algoritmo más eficiente que el escolar para la multiplicación de números enteros. Como el signo
no es problema, nos dedicaremos a estudiar simplemente el producto de dos números naturales.
Consideremos, por tanto, dos número naturales N, M ∈ N dados por su expansión en una base
cualquiera c ≥ 2. Supongamos:
N := an cn + an−1 cn−1 + · · · + a0 , an 6= 0,
M := bm cm + cm−1 cm−1 + · · · + b0 , bm 6= 0,
donde ai , bj ∈ {0, . . . , c − 1}. Simplifiquemos suponiendo que n ≥ m y rellenemos (añadiendo
0’s si fuera necesarios) y escribiendo
N := an cn + an−1 cn−1 + · · · + a0 ,
M := bn cn + cn−1 cn−1 + · · · + b0 .
Digamos que n es la talla de ambos números (que es, esencialmente, el logaritmo en base c del
mayor de ambos).
Se pide probar:
i) El número de operaciones elementales (que se pueden interpretar como el número de
veces que se acude a las tablas de multiplicar “en base c”) del algoritmo aprendido en
la escuela es del orden O(n2 ).
Hint:Recuérdese que
O(f ) := {g : N −→ R+ : ∃c ∈ R+ , ∃nc ∈ N, g(n) ≤ cf (n), ∀n ≥ nc }.
ii) Supongamos que k ∈ N dado por k = n/2 si n es par o k = (n + 1)/2 si n es impar.
Los elementos N y M se pueden escribir del modo siguiente:
N := A1 ck + A0 , M := B1 ck + B0 ,
donde A0 , A1 , B0 , B1 ≤ ck . ( Hint: Sacar “factor común” ck )
iii) Con la descomposición precedente, sea P ∈ N es el producto N M . Se tiene:
P := N M = (A1 ck + A0 )(B1 ck + B0 ) = D2 c2k + D1 ck + D0 ,
donde:
D2 := A1 B1 , D0 := A0 B0 , D1 := (A0 + A1 )(B0 + B1 ) − D2 − D0 .
Concluir que para multiplicar dos números naturales de talla a lo sumo n (i.e. menores
que cn+1 ), basta con hacer 3 multiplicaciones de números naturales de talla (n + 1)/2.
iv) Concluir que si T (n) es la función que mide el número de operaciones elementales
necesarias para multiplicar dos números enteros de talla a lo sumo n, entonces
T (n) ∈ O(nlog2 3 ).
Concluir que el método de multiplicación de números enteros aprendido en la escuela
no es un método eficiente (i.e. que los hay mejores).
CAPı́TULO 2

Módulos, Determinantes y Teorema de Hamilton-Cayley


(“Begin at the beginning and go on till...”)

“On earth there is nothing great but [hu]man; in [hu]man


there is nothing great but mind.”
W.R. Hamilton, Lectures on Metaphysics, 1860.

“...‘Begin at the beginning,’ the King said, very gravely, ‘and


go on till you come to the end:...’ ”
L. Carroll, Alice’s Adventures in Wonderland, 1865.

Índice
2.1. Introducción 79
2.2. Módulos, submódulos, morfismos de módulos 80
2.2.1. Generalidades 80
2.2.2. Operaciones básicas con submódulos e ideales 86
2.2.3. Teoremas de isomorfı́a 91
2.2.4. Módulos libres y bases 94
2.2.5. Diagramas conmutativos, complejos y sucesiones exactas (Opcional) 99
2.2.6. Ejercicios y problemas de la Sección 2.2 103
2.2.6.1. Breve recordatorio de Teorı́a elemental del Endomorfismo (en
caso de no disponer de formación previa) 104
2.2.6.2. Futuro: Homologı́a Singular 111
2.2.6.3. Futuro: Homotopı́a 111
2.2.6.4. Futuro: Co-homologı́a de de Rahm 111
2.3. Determinante. Teorema de Hamilton-Cayley 111
2.3.1. Determinante: propiedades básicas. 112
2.3.2. La Fórmula de Laplace 116
2.3.3. Polinomios con coeficiente matricial y matrices con coordenadas
polinomiales. Teorema de Hamilton-Cayley 126
2.3.4. Ejercicios y problemas de la Sección 2.3 131
2.3.4.1. Complejidad Algebraica en unos ejemplos 132
2.3.4.2. Sumas de Newton y Funciones simétricas elementales. 134

2.1. Introducción
El Capı́tulo introduce los R−módulos (noción fundamental, junto con la noción de anillo,
del Álgebra Conmutativa). Si el ejemplo primario puede ser el ejemplo de los K−espacios
vectoriales, pronto se observa la diferencia entre disponer de escalares en un cuerpo o en un
anillo cualquiera, simplemente considerando los grupos abelianos (noción equivalente a la de
Z−módulo), donde aparece la torsión o los divisores de cero de manera natural. Nos dedicamos
a establecer la noción y a demostrar algunas propiedades muy elementales, con una fuerte carga
de notación y cuantos ejemplos sea posible a partir del acerbo cultural de la audiencia.
La siguiente notable diferencia entre R−módulos y K−espacios vectoriales es la dificultad de
poseer una base en los R−módulos que, de forma elemental, existe en el caso de los K−espacios
vectoriales finitamente generados gracias al Teorema del Reemplazamiento. Ante la posible
ausencia de bases, hacemos una primera presentación de los R−módulos que poseen bases:
módulos libres. Por falta de suficientes medios de lenguaje, dejamos para más adelante la
discusión de si la existencia de base en R−módulos libres comporta la existencia de algún tipo
79
80 2. MÓDULOS, DETERMINANTES, HAMILTON-CAYLEY

de unicidad (como la dimensión en el caso de K−espacios vectoriales) y nos conformamos en


hablar, sin entrar en esa unicidad, de R−módulos de rango finito.
Los R−módulos de rango finito parecen apelar, casi inmediatamente, al uso de matrices con
coordenadas en un anillo Mn×m (R) como medio de representación de los morfismos entre
R−módulos de rango finito. Ciertamente, como R ya no es un cuerpo, estamos muy limitados
en lo que respecta al uso de las técnicas gaussianas de diagonalización (i.e., salvo equivalencia
de matrices): no podemos siempre dividir por un elemento no nulo si éste no es unidad del
anillo. Pero algunos elementos clásicos se preservan como son el determinante y el celebrado
Teorema de Hamilton-Cayley.
Algunos autores prefieren decir Teorema de Cayley-Hamilton, usando el orden lexicográfico en
su denominación. Personalmente, he preferido el orden inverso (i.e. Teorema de Hamilton-
Cayley) valorando la prioridad en el descubrimiento del resultado. Ası́, fue primero W.R.
Hamilton quien “descubrió” en resultado en [Hamilton, 1853], aunque de forma limitada para
cálculos de inversos de funciones lineales de cuaterniones (cuerpo no conmutativo que anunció
en [Hamilton, 1843] y a cuya defensa dedicó el texto [Hamilton, 1853]). Posteriormente,
será A. Cayley quien re-exprese el re-exprese esta idea primaria de Hamilton como un teorema
para matrices 2 × 2 y anuncie su validez para matrices 3 × 3 en [Cayley, 1858]. Habrá que
esperar a F.G. Frobenius para tener una forma completa del resultado en [Frobenius, 1878].
Ası́, en puridad, deberı́amos llamar Teorema de Frobenius a lo que la costumbre ha dado en
llamar Teorema de Cayley-Hamilton. Para no confundir más al lector, dejemos establecido el
nombre elegido en el tı́tulo del Capı́tulo.
Estos autores trabajan en el nacimiento del Álgebra Lineal, sujeto que tuvo sus dificultades
en establecerse y tendrá que esperar a Peano para poder hablar de espacios vectoriales en el
año 1900. Obviamente, todas estas disquisiciones tratan de matrices sobre cuerpos donde los
métodos de C.F. Gauss y el pensamiento de Frobenius sobre extensiones finitas de cuerpos nos
facilitan la argumentación. Pero en anillos generales, muchas de aquellas pruebas clásicas (con
matrices en Mn (K)) no sirven por las dificultades inherentes al uso de coordenadas en un anillo
R, posiblemente con divisores de cero y en el que no todo elemento no nulo es unidad.
La primera de las dificultades que uno encuentra es la noción de determinante. En muchos
casos, cada vez más habituales, se habla de la noción de determinante sólo para matrices
A ∈ Mn (K), donde K es un cuerpo. Y se define, si es que se define, que cada vez es más
inhabitual, a partir de una triangulación de A por métodos gaussianos. Pero se “olvidan”
que K[X] ya no es cuerpo sino dominio de integridad y que el polinomio caracterı́stico de
una matriz A ∈ Mn (K) es, en realidad, el determinante de una matriz A(X) ∈ Mn (K[X]).
Como consecuencia, todas esas definiciones y todas las propiedades que se le suponen viven
en un limbo de incertidumbre rayando la falsedad, lo cual es, desgraciadamente, cada vez más
habitual: impartir matemáticas como religión, donde la audiencia cree fervientemente lo que se
le dice. Porque o bien le importa poco una cierta dosis de verdad (i.e. le da lo mismo) o bien no
es capaz de percibir la incoherencia de la presentación. Si, al menos, explicaran que el cuerpo
de fracciones de K[X] (K(X) = qf (K[X])) puede servir para razonar, a lo mejor cerraban
bien sus presentaciones. Parafraseando el estribillo de G. Coppini “Malos tiempos para la ...”
Matemática.
Ası́ que el texto se carga de paciencia y, haciendo un incómodo rodeo, nos dedicamos a introducir
el determinante de matrices cuadradas con coordenadas en un anillo cualquiera y a mostrar sus
principales propiedades. Destacamos la Fórmula de Laplace (y su generalización) que nos
ayudará a mostrar como el determinante surge como el producto de una matriz por su adjunta.
Con ello, podemos dar una sencilla prueba del Teorema de Hamilton-Cayley, no sin hacer sufrir
al lector en el farragoso (agotador, muchas veces) detalle de las propiedades del determinante
de una matriz A ∈ Mn (R).

2.2. Módulos, submódulos, morfismos de módulos


2.2.1. Generalidades.

Definición 27 (Módulo). Sea (R, +, ·) un anillo. Llamaremos R−módulo a toda terna


(M, +, ·R ) donde:
i) (M, +) es un grupo abeliano,
2.2. MÓDULOS, SUBMÓDULOS, MORFISMOS DE MÓDULOS 81

ii) ·R : R × M −→ M es una acción a izquierda del monoide (R, ·) sobre M (usualmente


denominada operación externa), que denotaremos mediante ·R (x, m) := xm, y que
verifica dos propiedades distributivas:
(a) Propiedad Distributiva I: ∀x ∈ R, ∀m, n ∈ M, x(m + n) = xm + xn.
(b) Propiedad Distributiva II: ∀x, y ∈ R, ∀m ∈ M, (x + y)m = xm + ym.

Observación 2.2.1 (Módulo: otras definiciones equivalentes). Recordando nuestra definición


de acción de un monoide sobre un conjunto (ver Definición 11), la anterior definición es una
simplificación de la forma en que otros autores definen R−módulo. Por ello las reproducimos
aquı́, notando que, obviamente, son definiciones equivalentes:

Sea (R, +, ·) un anillo. Llamaremos R−módulo a toda terna (M, +, ·R ) donde:


i) (M, +) es un grupo abeliano,
ii) ·R : R × M −→ M es una aplicación, que se denomina operación externa y que se
representa mediante ·R (x, m) := xm, verificando:
(a) Propiedad Distributiva I: ∀x ∈ R, ∀m, n ∈ M, x(m + n) = xm + xn.
(b) Propiedad Distributiva II: ∀x, y ∈ R, ∀m ∈ M, (x + y)m = xm + ym.
(c) Propiedad Asociativa: ∀x, y ∈ R, ∀m ∈ N, (xy)m = x(ym).
(d) Elemento Neutro: ∀m ∈ M, 1m = m.

Definición 28 (Submódulo). Sea R un anillo y sean (M, +, ·R ) un R−módulo. Un subgrupo


(N, +) del grupo aditivo (M, +) se denomina submódulo de M si, además, verifica:
∀x ∈ R, ∀n ∈ N, xn ∈ N.

Ejemplo 2.2.2. Los siguientes son ejemplos básicos de módulos y submódulos:


i) Los ejemplos más evidentes de módulos son los espacios vectoriales: Un espacio vec-
torial V sobre un cuerpo K no es otra cosa que un K−módulo (ambas nociones son
equivalentes). Sus submódulos son los subespacios, obviamente.
ii) Los anillos son módulos sobre sı́ mismos. Y los submódulos de los anillos (R, +, ·)
como R−módulos sobre sı́ mismos son, precisamente, sus ideales (cf. Definición 23).
En cambio, los subanillos sólo son submódulos cuando son el total.
iii) Existe un R−módulo dado por el grupo abeliano con un único elemento, que es el
R−módulo {0} y denotaremos simplemente por 0.
iv) si M es un R−módulo, los subgrupos {0} y M de M son, obviamente, submódulos.
v) Si considero un R−módulo (M, +, ·R ) y un elemento m ∈ M , la órbita por la acción
del monoide (R, ·) sobre M y definida por el punto m ∈ M es un submódulo de M :
OR (m) := {λm : λ ∈ R}.
Normalmente este submódulo se presenta mediante Rhmi o mediante Rm y se deno-
mina submódulo generado por m. Obsérvese que los ideales principales de los anillos
son, precisamente, las órbitas de sus elementos por la acción de (R, ·) como monoide
actuando sobre R en su rol de R−módulo.
vi) En un sentido general se habla de producto y co-producto (o suma directa) de módulos.
Dada una familia de módulos {Mi : i ∈ I}, denotaremos
Y [ [
Mi := {ϕ : I −→ Mi : ϕ(i) ∈ Mi , ∀i ∈ I} ⊆ ( Mi )I .
i∈I i∈I i∈I

Nótese
Q que es esencial la propiedad ϕ(i) ∈ Mi , ∀i ∈ I. Definimos las operaciones sobre
i∈I Mi mediante el Qclásico procedimiento de “operar coordenada a coordenada”. Es
decir, dados ϕ, ψ ∈ i∈I Mi y dado a ∈ R, definimos las siguientes correspondencias:
S
ϕ + ψ : I −→ i∈I Mi
i 7−→ ϕ(i) + ψ(i).
S
a ·r ϕ : I −→ i∈I Mi
i 7−→ a ·R ϕ(i),
82 2. MÓDULOS, DETERMINANTES, HAMILTON-CAYLEY

donde a ·R ϕ(i) es el resultado de la acción de (R, ·) sobre Mi (porque ϕ(i) ∈ Mi ).


En sencilo verificar que ambas correspondencias
Q ϕ + ψ y a ·r ϕ son aplicaciones
Q y que
ambas están son elementos de i∈I Mi . Es fácil también verificar que ( i∈I Mi , +)
es un grupo abeliano y que la siguiente es una acción a izquierda que satisface las dos
distributivas indicadas en la definición de R−módulo:
Q Q
·R : (R, ·) × i∈I Mi −→ i∈I Mi
(a, ϕ) 7−→ a ·R ϕ.
Q
En conclusión, ( i∈I Mi , +, ·R ) será un R−módulo conocido como el R−módulo pro-
ducto de la familia de R−módulos {Mi : i ∈ I}.
vii) Adicionalmente (como ya hicimos en el Capı́tulo precedente),Q se puede considerar el
soporte definido del modo obvio siguiente para cada f ∈ i∈I Mi :
supp(f ) := {i ∈ I : f (i) 6= 0Mi }.
Q
Nótese que si f, g ∈ i∈I Mi y si a ∈ R, se tiente:
supp(f + g) ⊆ supp(f ) ∪ supp(g),
supp(a ·R f ) ⊆ supp(f ).
Q
Por tanto, operando con elementos de i∈I Mi que tienen soporet finito, obtenemos un
nuevo
Q elemento que tiene soporte finito. Por eso, podemos considerar el subconjunto
de i∈I Mi de los elementos f con soporte finito. Se denomina el co-producto de la
familia {Mi : i ∈ I} (o también la suma directa):
a Y
Mi = ⊕i∈I Mi := {f ∈ Mi : supp(f ) es un conjunto finito}.
i∈I i∈I
Q
Por lo indicado sobre el soporte, ⊕i∈I Mi es un submódulo de i∈I Mi y, por tanto,
un R−módulo.
viii) Los anillos R[X1 , . . . , Xn ] y R[[X1 , . . . , Xn ]] tienen una estructura natural de R−módulo
que es compatible con sus operaciones como anillo.
ix) Nótese que si X es un conjunto y R es un anillo, el conjunto RX de las aplicaciones de
X en R es un producto cartesiano. Denotemos Rx = R para cada x ∈ X y, observamos
que Y
Rx = R X .
x∈X
Por tanto RX es un R−módulo. En particular, tomando X = Nn , en el anillo de
n
series de potencias formales R[[X1 , . . . , Xn]], cuyo conjunto base es RN , tenemos una
estructura de R−módulo compatible con su estructura de anillo. Más aún, el anillos
de series de potencias formales se puede identificar (como R−módulos y sólo como
R−módulos) del modo siguiente:
Y
R[[X1 , . . . , Xn ]] := Rµ ,
µ∈Nn

donde {Rµ : µ ∈ Nn } son copias del anillo R (i.e. Rµ = R) repetidas tantas veces
como elementos µ ∈ Nn . Por tanto, R[[X1 , . . . , Xn ]] es identificable como R−módulos
n
con RN , pero no son identificables como anillos, como ya se indición en su lugar.
x) De modo análogo a la construcción precedente, podemos considerar un conjunto X
cuanlquiera y una familia {Rx : x ∈ X} de R−módulos, donde Rx = R es el propio
anillo. Podemos considerar la suma directa de estos módulos que denotaremos del
modo siguiente: M M
Rx = R.
x∈X X
Se trata de un R−módulo que tendrá una importancia relevante en la siguiente sección
del Capı́tulo. Nótese que en el caso X = Nn , el anillo R[X1 , . . . , Xn ] se puede idetificar
con: M
R[X1 , . . . , Xn ] := Rµ ,
µ∈Nn
n
donde, de nuevo, {Rµ : µ ∈ N } son copias del anillo R (i.e. Rµ = R). Una vez más,
no es posible identificar ambos conjuntos como anillos.
2.2. MÓDULOS, SUBMÓDULOS, MORFISMOS DE MÓDULOS 83

xi) Sea f : R −→ B un morfismo de anillos(o, equivalentemente, una estructura de


R−álgebra sobre B, ver Definición 23) Podemos definir sobre B una estructura de
R−módulo sobre B mediante:
∗f : R × B −→ B
(2.2.1)
(x, b) 7−→ x ∗f b := f (x) ·B b,
donde ·B es el producto de B como anillo. Se llama la estructura de R−módulo sobre B
determinada por el morfismo f . Esto incluye el caso de subanillos (f será la inclusión)
y, por tanto, son R−álgebras C (X), C 1 (X), . . . , C ∞ , . . . y son C−álgebras C (X, C) y
H(X).
xii) Recı́procamente al ı́tem anterior, si (R, +, ·) y (B, +, ∗) son dos anillos y supongamos
que B tiene una estructura de R−módulo:
·R : R × B −→ B
(λ, b) 7−→ λ ·R b.
Supongamos que, adicionalmente, se satisface la siguiente propiedad (que hace com-
patible la estructura de R−módulo de B con su estructura de anillo):
(2.2.2) ∀λ, θ ∈ R, ∀a, b ∈ B, (λ · θ) ·R (a ∗ b) = (λ ·R a) ∗ (θ ·R b) ,
donde 1B es el elemento unidad del producto de B como anillo. Entonces podemos
definir un morfismo de anillos ϕ : R −→ B a partir de esa operación externa y dada
mediante:
ϕ : R −→ B
λ 7−→ ϕ(λ) := λ ·R 1B ,
Si ahora construimos la estructura de R−módulo de B asociada a este morfismo de
anillos ϕ: la operación externa ∗ϕ definida como en la Identidad (2.2.1) anterior, se
tendrá: ∗ϕ = ·R . Es decir, los morfismos entre dos anillos R y B están identificados
con las estructuras de R−módulo sobre B que satisfacen la identidad (2.2.2). Dicho
de otro modo:
Una R−álgebra es un anillo (A, +, ·) que posee una estructura de R−módulo (A, +, ·R )
y que satisface la Identidad (2.2.1).
El Problema 85 pedirá que se verifiquen todos los detalles de esta afirmación y,
por tanto, la frase recientemente citada. En particular, los anillos R[X1 , . . . , Xn ] y
R[[X1 , . . . , Xn ]] son R−álgebras que, además, contienen al anillo R (es decir, el mor-
fismo entre R y cualquiera de ellos es simplemente la incusión) ι : R ,−→ R[X1 , . . . , Xn ] ⊆
R[[X1 , . . . , Xn ]].

xiii) Los conjuntos de matrices Mn×m (R) tienen una estructura natural de R−módulo.
Simplemente, obsérvese que si escribimos [n] := {1, . . . , n} y [m] := {1, . . . , m}, las
matrices son simplemente el conjunto descrito por la igualdad siguiente:
Mn×m /R) = R[n]×[m] := {f : [n] × [m] −→ R : f es aplicación},
y su estructura se sigue de lo descrito para el producto cartesiano de R−módulos.

Ejemplo 2.2.3 (Grupos abelianos). Los grupos abelianos no son otra cosa que Z−módulos
(ambas nociones son equivalentes). Obviamente, todo Z−módulo es un grupo abeliano, ası́ que
se trata de ver el otro contenido. Para ello consideremos la siguiente notación para un grupo
abeliano (G, +):
Dado m ∈ N y g ∈ G, definamos:
• Si m = 0 ∈ N, definamos 0 · g = 0G ,
• Si m ≥ 1, definamos m · g = g + (m − 1) · g.
Para cada número entero n ∈ Z, definamos
• Si n ∈ N, definamos n · g ∈ G es el definido en el apartado anterior,
• Si n ≤ 0, definamos n · g = (−n) · (−g) (que está definido porque (−n) ∈ N).
Tenemos una aplicación:
·Z : Z × G −→ G
(n, g) 7−→ n · g.
84 2. MÓDULOS, DETERMINANTES, HAMILTON-CAYLEY

Además, (G, +, ·Z ) es un Z−módulo. Los submódulos de un grupo abeliano son, precisamente,


sus subgrupos.

Ejemplo 2.2.4 (Teorı́a del endomorfismo). Sea V un espacio vectorial sobre un cuerpo K,
ϕ : V −→ V una aplicación lineal. Podemos definir una estructura de K[X]−módulo sobre
V que se conoce como Teorı́a del endomorfismo. Se define del modo siguiente: Definamos
recursivamente:
• ϕ0 = IdV (la identidad),
• ϕ1 = ϕ,
• Para n ≥ 2, ϕn := ϕ ◦ ϕn−1 , donde ◦ es la composición.
Dado p ∈ K[X], de la forma:
p := ao + a1 X + a2 X 2 + · · · an X n ,
definimos p(ϕ) : V −→ V mediante:
p(ϕ) := a0 IdV + a1 ϕ + a2 ϕ ◦ ϕ + · · · + an ϕn .
Finalmente, definimos
·K[X] : K[X] × V −→ V
(p(X), v) 7−→ p(ϕ)(v) ∈ V.
Se tiene que (V, +, ·K[X] ) es un K[X]−módulo. Los submódulos de V como K[X]−módulo serán
los subespacios vectoriales (como K−espacio vectorial) de V invariantes por ϕ (ver Problema
78).

Definición 29 (Morfismos). Sea R un anillo y sean M, M 0 dos R−módulos. Un morfismo


de grupos f : (M, +) −→ (M 0 , +) se denomina morfismo de R−módulos si verifica:
∀x ∈ R, ∀m ∈ M, f (xm) = xf (m).
El conjunto de todos los morfismos de R−módulo entre M y M 0 se denota mediante HomR (M, M 0 ).

Definición 30 (Mono, epi, iso, endo, auto....morfismo de R−módulos). Sea (R, +, ·)


un anillo, (M, +, ·R ) y (N, +, ·R ) dos R−módulos. Sea f ∈ HomR (M, N ) un morfismo de
R−módulos entre M y N . Definimos los términos siguientes:
i) Diremos que f es monomorfismo si lo es como morfismo de grupos f : (M, +) −→
(N, +) (equivalentemente, si como aplicación es inyectiva).
ii) Diremos que f es epimorfismo si lo es como morfismo de grupos f : (M, +) −→ (N, +)
(equivalentemente, si como aplicación es suprayectiva).
iii) Diremos que f es isomorfismo si es monomorfismo y epimorfismo a la vez (equiva-
lentemente, si como aplicación es biyectiva). Esto, en particular significa que f es
isomorfismo si y solamente si existe otro morfismo de R−módulos g ∈ HomR (M, N )
tal que:
g ◦ f = IdM , f ◦ g = IdN .
iv) Diremos que es f endomorfismo si M = N . Al conjunto de los endomorfismos de un
R−módulo M lo denotaremos mediante EndR (M ) := HomR (M, M ).
v) Diremos que f es automorfismo si es endomorfismo e isomorfismo a la vez.

Ejemplo 2.2.5. i) En el caso de espacios vectoriales, HomK (V, W ) son las aplicaciones
lineales.
ii) En el caso de grupos abelianos, HomZ (A, B) son los morfismos de grupos entre (A, +)
y (B, +).
iii) Consideremos una familia cualquieraQde R−módulos {Mi : i ∈ I}. Consideremos los
R−módulos producto y co-producto i∈I Mi y ⊕i∈I Mi . Los siguientes son morfismos
de R−módulos:
2.2. MÓDULOS, SUBMÓDULOS, MORFISMOS DE MÓDULOS 85

(a) Para cada j ∈ I,


Q
πj : Mi
i∈IS −→ Mj
ϕ : I −→ i∈I Mi 7−→ ϕ(j).
Se denominan proyecciones naturales del producto cartesiano.
(b) Para cada j ∈ I y cada m ∈ Mj definamos el elemento
S
λj (m) : I −→  i∈I Mi
m, si i = j
i 7−→
0, en otro caso.
Q
Claramente λj (m) ∈ ⊕i∈I Mi ⊆ i∈I Mi . Definimos
λ j : Mj −→ ⊕i∈I Mi
m 7−→ λj (m).
Se denominan inclusiones naturales en la suma directa.

Observación 2.2.6. Obsérvese que los morfismos de R−módulos f : M −→ N , preservan el


anillo R. En cambio, si f : R −→ B es un morfismo de anillos, cambia el anillo y nos permite
definir una estructura de R−módulo sobre cualquier B−módulo. Estas estructuras cambian,
obviamente, la percepción del módulo. Como ejemplo clásico el espacio vectorial complejo Cn es
un C−espacio vectorial de dimensión n, pero es también un R−espacio vectorial de dimensión
2n. Ası́, C es una recta compleja, pero un plano real. De modo similar, tenemos el morfismo
dado por la inclusión Q ,→ R. Si n ≥ 1, Rn es un espacio vectorial de dimensión R sobre
R pero tiene dimensión infinita no numerable como Q−espacio vectorial. De hecho, el único
espacio vectorial real V que tiene dimensión numerable como Q−espacio vectorial es el espacio
vectorial nulo V = {0}.

Proposición 2.2.7. Sean M y N dos módulos sobre un anillo R.


i) Un subgrupo M 0 de (M, +) es submódulo si y solamente el grupo cociente (M/M 0 , +)
es R−módulo con la acción a izquierda ∗R : (R, ·) × M/M 0 −→ M/M 0 dada mediante:
x ∗R (m + M 0 ) := xm + M 0 , ∀x ∈ R, ∀m + M 0 ∈ M/M 0 .
ii) Para cada morfismo f : M −→ N se verifica:
(a) Para cada submódulo S de M , f (S) := {f (m) : m ∈ S} es submódulo de N .
Un caso particular es el submódulo imagen de f Im(f ) := f (M ).
(b) Para cada submódulo T de N , f −1 (T ) := {m ∈ M ; f (m) ∈ T } es un submódulo
de M . Un caso particular es el submódulo conocido como el núcleo ker(f ) :=
f −1 ((0)).
iii) El conjunto HomR (M, N ) es un R−módulo con las operaciones dadas por las sigu-
ientes aplicaciones:
• La estructura de grupo abeliano (HomR (M, N ), +) es dada mediante:
+: HomR (M, N ) × HomR (M, N ) −→ HomR (M, N )
(f, g) 7−→ f + g,
donde
f +g : M −→ N
m 7−→ f (m) + g(m).
• La acción a izquierda del monoide (R, ·) es dada mediante:
·R : (R, ·) × HomR (M, N ) −→ HomR (M, N )
(x, f ) 7−→ xf,
donde
xf : M −→ N
m 7−→ x ·R f (m),
donde x ·R f (m) es la operación externa de (R, ·) sobre N .
Demostración. La prueba es un mero ejercicio. 
86 2. MÓDULOS, DETERMINANTES, HAMILTON-CAYLEY

Observación 2.2.8. Obviamente esta Proposición nos da toda una colección adicional de
módulos a través de operaciones de cociente y tomar morfismos.
Nótese también la discrepancia aparente entre el ı́tem ii), (a) de esta Proposición 2.2.7 y el ı́tem
iii), (b) de la Proposición 1.4.9. Si a es un ideal de un anillo R y f : R −→ T es un morfismo de
anillos, entionces f (a) es un submódulo de T como R−módulo. Pero no hay discrepancia salvo
en apariencia porque para ser ideal de T debemos exigir que f (a) sea submódulo de T ¡como
T −módulo!.

Definición 31 (Co-Núcleo). Dado un morfismo de R−módulos f : M −→ N , se define el


co-núcleo de f como el R−módulo Coker(f ) := N/ Im(f ).
Proposición 2.2.9. Dado un morfismo de R−módulos f : M −→ N , se verifican las siguientes
propiedades:
i) Son equivalentes las propiedades siguientes:
• f es inyectiva (es decir, es un monomorfismo),
• ker(f ) = 0.
ii) Son equivalentes las propiedades siguientes:
• f es suprayectiva (es decir, es un epimorfismo),
• Im(f ) = N ,
• Co − ker(f ) = 0.
iii) Son equivalentes las propiedades siguientes:
• f es biyectiva (es decir, es un isomorfismo),
• ker(f ) = 0 y Co − ker(f) = 0.
En este caso, su inversa f −1 : N −→ M también es un morfismo de R−módulos.
Demostración. Igual que en el caso de la Proposición precedente, las afirmaciones son
obvias. 
Ejemplo 2.2.10. Siguiendo las notaciones del apartado iii) del Ejemplo 2.2.5 precedente, es
sencillo verificar que se tienen las siguientes propiedades:
Q
i) Para cada j ∈ I, cada proyección natural πj : i∈I Mi −→ Mj es un epimorfismo de
R−módulos.
ii) Para cada j ∈ I, cada inclusión natural λj : Mj −→ ⊕i∈I Mi es un monomorfismo de
R−módulos.

Ejemplo 2.2.11 (Módulo dual). Sea M un R−módulo y consideremos el R−módulo que se


proyecta sobre M , HomR (R, M ). Como se trata de morfismo de R−módulos para cada λ ∈ R
y dado f ∈ HomR (R, M ), tendremos que f (λ) = f (λ · 1R ) = λf (1R ). De hecho, tendremos un
morfismo natural de R−módulos definido del modo siguiente:
ev1 : HomR (R, M ) −→ M
f 7−→ f (1R ).
Es sencillo verificar que ev1 (evaluar en 1R ∈ R) es un isomorfismo de R−módulos:
HomR (R, M ) =∼ M.
De otro lado, podemos considerar el R−módulo HomR (M, R) que se denomina R−módulo
dual de M y se denota mediante M ∗ . En espacios vectoriales de dimensión finita se puede
probar el isomorfismo entre V ∗ y V y, sobre todo (V ∗ )∗ = V . Esto no sucederá en general para
R−módulos. El papel del uso del espacio vectorial dual V ∗ en Geometrı́a Proyectiva clásica (y
elemental) será desarrollado en otro tipo de curso.

2.2.2. Operaciones básicas con submódulos e ideales.


Proposición 2.2.12. La intersección de una familia cualquiera de submódulos es un submódulo.
Del mismo modo, la intersección de una familia cualquiera de ideales es un ideal.
Demostración. Mero ejercicio de comprobación formal. 
2.2. MÓDULOS, SUBMÓDULOS, MORFISMOS DE MÓDULOS 87

Definición 32 (Submódulo generado por un subconjunto). Dado un subconjunto F ⊆


M de un R−módulo M. Llamaremos submódulo generado por F al menor submódulo que le
contiene. Es decir, usando la Proposición precedente, el submódulo generado por F y que
denotaremos por RhFi viene dado por la siguiente identidad:
\
RhFi := {N : F ⊆ N, N es submódulo de M }.
Diremos que F es un sistema generador del submódulo N de M si N = RhFi.
Del mismo modo definiremos el ideal de un anillo R generado por un subconjunto F ⊆ R como
el menor ideal de R que contiene a F . La notación que usaremos en este caso es ligeramente
diferente y escribiremos (F ) para denotar el ideal generado por F . Y diremos, igualmente, que
F es un conjunto (o sistema) de generadores del ideal (F ), dado que el anillo ambiente R se
sobrentiende.

Proposición 2.2.13. Sea M un R−módulo y F ⊆ M un subconjunto. La siguiente expresión


caracteriza el submódulo generado por F:
X
RhFi := {m ∈ M : ∃G ⊆ F finito, y ∃{xg ∈ R : g ∈ G} ⊆ R, tales que m = xg g}.
g∈G

En particular, una identidad similar se tendrá para ideales de un anillo. Es decir, si F ⊆ R es


un subconjunto de un anillo R se tiene:
X
(F ) := {m ∈ R : ∃G ⊆ S finito, y ∃{xg ∈ R : g ∈ G} ⊆ R, tales que m = xg g}.
g∈G

Demostración. Bastará con hacerlo para submódulos porque, al cabo, los ideales de un
anillo R son sus submódulos como R−módulo. Para pobar la identidad basta con demostrar
primero que la expresión de la derecha define un submódulo de M . Esto es mera escritura
cuidadosa de la fórmula expresada. Una vez probado que es submódulo, se prueba que para
cualquier otro submódulo N de M que contenga a F, N debe contener todos los elementos
que aparecen en el conjunto de la derecha de la igualdad buscada. Como RhFi es el menor
submódulo que contiene a F la prueba se concluirá. 
Notación 2.2.14 (Módulos, submódulos e ideales finitamente generados). Módulos
y submódulos finitamente generados serán aquellos generados por un conjunto finito de el-
ementos. Como ya indicamos, escribiremos Rm para denotar al submódulo generado por
{m}. En ocasiones escribiremos Rm1 + · · · + Rmr o Rhm1 , . . . , mr i para denotar al módulo
Rh{m1 , . . . , mr }i generado por el conjunto finito {m1 , . . . , mr }. Para ideales, sin embargo, es-
cribiremos (a1 , . . . , am ) para denotar el ideal generado por la familia {a1 , . . . , am }. Nótese que,
en el caso de un conjunto de generadores finito se tiene:
• (Para submódulos) dado m ∈ M , se tiene m ∈ Rhm1 , . . . , mr i si y solamente si existen
x1 , . . . , xr ∈ R tales que:
Xr
m= xi m i .
i=1
• (Para ideales) dado x ∈ R, se tiene x ∈ (a1 , . . . , ar ) si y solamente si existen x1 , . . . , xr ∈
R tales que:
Xr
x= xi ai .
i=1

Observación 2.2.15. Sea M un R−módulo finitamente generado. Entonces, puedo considerar


el conjunto de todos los subconjuntos finitos que generan M . Es decir
G(M ) := {S ⊆ M : RhSi = M, ](M ) ∈ N}.
A su vez, podemos considerar el conjunto de todos los cardinales de conjuntos finitos que
generan M .
S (M ) := {n ∈ N : ∃S ∈ G(M ), ](S) = n}.
Como es un subconjunto de los naturales y no es vacı́o, entonces posee algún mı́nimo:
n0 ; = min (S (M )) ∈ N.
88 2. MÓDULOS, DETERMINANTES, HAMILTON-CAYLEY

Es evidente que si K es un cuerpo y V es un K−espacio vectorial finitamente generado sobre


K, entonces V es un espacio vectorial de dimensión finita y el Teorema del Reemplazamiento 1
nos dice que todo sistema minimal de generadores de V es una base de V . Por suerte, o por
desgracia, no es igual para módulos, lo que obliga a hablar de R−módulos libres en la Subsección
2.2.4 siguiente.

Definición 33 (Número mı́nimo de generadores de M ). Sea M un R−módulo finitamente


generado. Llamaremos número mı́nimo de generadores de M (y lo denotaremos por µ(M )) al
mı́nimo de los cardinales de los conjuntos finitos que generan M . Es decir, al siguiente número
entero:
µ(M ) := min{](G) : RhGi, G es finito}.
A cualquier conjunto H tal que M = RhHi y ](H) = µ(M ) se le denomina conjunto minimal
de generadores de M .
En el caso en que M no sea finitamente generado escribiremos µ(M ) = ∞.

Definición 34 (R−álgebras finitas y finitamente generadas). Con estas notaciones:


• Una R−álgebra B se llama finitamente generada si es isomorfa a un cociente de algún
anillo de polinomios R[X1 , . . . , Xn ] por alguno de sus ideales a.
• Una R−álgebra B se denomina finita si B es un R−módulo finitamente generado.

Definición 35 (Suma de Submódulos e Ideales). Dada una familia {Ni : i ∈ I} de


submódulos de un R−módulo M , llamaremos submódulo suma de los submódulos de esta familia
al submódulo generador por la unión de todos ellos.
X
Ni := Rh∪i∈I Ni i.
i∈I
P
Del mismo modo, dada una familia de ideales {ai : i ∈ I}, denotaremos por i∈I ai al ideal
suma de esa familia.

Notación 2.2.16. En el caso de tener un número finito de submódulos e ideales usaremos


indistintamente las notaciones:
m
X
N1 + · · · + Nm := Ni ,
i=1
y, para ideales,
m
X
a1 + · · · + am := ai ,
i=1
En el caso de dos sumandos, usaremos a + b (para ideales) y N1 + N2 (para submódulos).

Definición 36 (Anillos Principales). Un anillo se denomina principal si todos sus ideales


son principales (ver Definición 1.4.6).

Ejemplo 2.2.17. Los ideales (0) y (1) son principales. En particular, los cuerpos son anillos
principales. Pero no todos los anillos principales son dominios de integridad. Por ejemplo Z/6Z
es un anillo principal que no es dominio.

1Los amables lingüistas de la RAE no conocen mucho de la terminologı́a de las matemáticas, ni de


las matemáticas en general, incluyendo las operaciones más elementales. No es el momento de descubrir el
analfabetismo matemático endémico de la sociedad española. Estos académicos están dispuestos a admitir
cualquier término de origen anglosajón sin mayor relevancia técnica, pero no reconocen el término “reemplaza-
miento” (acción y efecto de reemplazar), sugiriendo algo semánticamente muy distinto como es el término
“emplazamiento”. Amistosamente les emplazo a incorporar reemplazamiento al DRAE. El Teorema del Reem-
plazamiento es un resultado fundamental del Álgebra Lineal por el cual todo subespacio vectorial de un es-
pacio vectorial finitamente generado posee una base. Dejamos al lector la búsqueda de este Teorema, su
demostración y la razón por la cual “reemplazamiento” significa que la estructura de los conjuntos de vec-
tores linealmente independientes de los espacios vectoriales de dimensión finita poseen estructura de matroide
(https://en.wikipedia.org/wiki/Matroid).
2.2. MÓDULOS, SUBMÓDULOS, MORFISMOS DE MÓDULOS 89

Teorema 2.2.18. i) Los anillos Z y K[X], cuando K es un cuerpo, son principales y


también son anillos principales los cocientes de ambos anillos, aunque no siempre son
dominios de integridad.
ii) El anillo Z[X] no es principal. El ideal a := (2, X) no puede ser generado por un solo
elemento de Z[X].
Demostración. En el caso de Z, como en el caso de K[X], el argumento se basa en probar
la existencia de máximo común divisor. Pondremos, como recordatorio, la prueba en el caso
K[X]. Usando el valor absoluto en lugar del grado, de obtiene el enunciado para el caso Z. Sea
a un ideal en K[X] y consideremos el conjunto siguiente:
D(a) := {deg(f ) : f ∈ a, f 6= 0} ⊆ N.
Si a = (0), entonces es principal y hemos terminado. Si a 6= 0, entonces existe f ∈ a, con f 6= 0
y, por tanto, D(a) es un conjunto no vacı́o de números naturales. Por tanto, posee un mı́nimo.
Sea d0 := min(D(a)) ese mı́nimo y sea f0 ∈ a un elemento no nulo tal que deg(f0 ) = d0 .
Consideremos el ideal principal (f0 ) ⊆ a. Veamos que ambos ideales son iguales. Sea g ∈ a.
Usando la división euclı́dea, existirán q, r ∈ K[X] tales que
• g = qf0 + r,
• deg(r) ≤ deg(f0 ) − 1.
Por la primera afirmación r = g + (−q)f0 ∈ a. Si r 6= 0, entonces deg(r) ∈ D(a) y deg(r) <
min(D(a)), lo cual es imposible. Por tanto, r = 0, g = qf0 ∈ (f0 ) y tendremos probado que
a ⊆ (f0 ) como pretendı́amos. En lo que respecta a los cocientes de Z y K[X], queda como
sencillo ejercicio a partir del conocimiento de los anillos Z y K[X] que se le supone al lector.
Para la segunda afirmación, supongamos que a = (2, X) es un ideal principal. Entonces, existe
un elemento no nulo (y no unidad) f = ad X d + · · · + a0 ∈ Z[X] tal que
a = (2, X) = (f ).
Por tanto, existen polinomios qq , q2 ∈ Z[X] tales que
2 = q1 f, X = q2 f.
La primera identidad (i.e. 2 = q1 f ) nos indica que todos los coeficientes de f deben ser divisores
enteros de 2 y, por tanto, están en {±1, ±2}. La segunda identidad (i.e. X = q2 f ) nos indica
que todos los coeficientes de f son divisores de 1. Por tanto, juntando ambas afirmaciones, los
coeficientes deben estar en {±1}. De otro lado, ambas identidades indican que el grado de f
habrı́a de ser 0, con lo que, necesariamente f es una unidad. Pero (f ) = a no es el ideal total,
es un ideal propio y llegamos a contradicción. 
Definición 37 (Producto de ideales y de ideales por submódulos). Se trata de las
nociones siguientes:
i) Dados dos ideales a y b de un anillo R, definimos el ideal producto como el ideal ab
generado por {xy : x ∈ a, y ∈ b}.
ii) Dado un ideal a de un anillo R y un submódulo N de un R−módulo M , escribiremos
aN para designar al submódulo generado por:
{xm : x ∈ a, m ∈ N }.

Proposición 2.2.19 (Producto y generadores). Sea a y b dos ideales en un anillo R,


respetivamente generados por conjuntos finitos
a = (f1 , . . . , fr ), b = (g1 , . . . , gs ).
Entonces, el ideal producto ab está generado del modo siguiente:
ab = ({fi gj : 1 ≤ i ≤ r, 1 ≤ j ≤ s}).
Una propiedad análoga se verifica para el producto de ideales por submódulos.
Demostración. Ejercicio de comprobación. 

Afirmaciones análogas son obvias para ideales y módulos generados por familias cualesquiera,
teniendo en cuenta siempre que se trata de combinaciones lineales finitas.
90 2. MÓDULOS, DETERMINANTES, HAMILTON-CAYLEY

Ejemplo 2.2.20 (Producto no significa que todos los elementos sean productos). Es
importante señalar que, salvo en el caso obvio de anillos principales, los productos aN y ab
no suelen coincidir con los productos de los objetos implicados. Es decir, existen ejemplos de
anillos y módulos tales que:
aN 6= {λn : λ ∈ a, n ∈ N },
ab 6= {xy : x ∈ a, y ∈ b}.
Pongamos un ejemplo con un producto de ideales que cubre ambas afirmaciones. Consideremos
los ideales a = (2, X) y b = (3, X + 1) en el anillo no principal Z[X]. El ideal producto ab es el
generado por los productos de los generadores, con lo que tendremos:
ab = (6, 3X, 2(X + 1), X(X + 1)).
Ahora observamos que el polinomio X − 2 ∈ ab:
(X − 2) = 3X − 2(X + 1).
Sin embargo, no es posible presentar X − 2 como un producto p(X)q(X) con p(X) ∈ a y
q(X) ∈ b. Razonemos por reducción al absurdo. Supongamos (X − 2) = p(X)q(X). Como
Z[X] es un dominio de integridad, se tendrá que
deg(p) + deg(q) = 1, 0 ≤ deg(p) ≤ 1, 0 ≤ deg(q) ≤ 1.
Por tanto, uno de los dos es una constante (en Z) no nula y el otro es un polinomio de grado
1. Sin pérdida de la generalidad podemos suponer:
p(X) = a ∈ Z \ {0}, q(X) = cX + b ∈ Z[X].
Como X − 2 = p(X)q(X), concluiremos:
ac = 1, ab = −2.
Pero, entonces, a ∈ {±1} y, a ∈ a. Basta con observar que (2, X) es un ideal propio en Z[X],
para concluir que esto no es posible. Luego X − 2 no es un producto de un elemento de a y
otro de b.

Proposición 2.2.21 (Propiedades Elementales para ideales). Las operaciones intersección,


suma y producto de ideales verifican las usuales propiedades asociativas, conmutativa, existencia
de elemento neutro. Además:
• Se verifica la Ley Modular de la intersección con respecto a la suma (por ser simple-
mente subgrupos). Es decir,
a ∩ (b + c) ⊇ a ∩ b + a ∩ c,
además, si b ⊆ a o c ⊆ a, el anterior contenido es una igualdad. Nótese que también
se da la igualdad si b ⊆ c o si c ⊆ b de manera obvia.
• La propiedad distributiva del producto con respecto a la suma.
a.(b + c) = a.b + a.b.

Definición 38 (Extensión de un ideal). Sea f : R −→ B un morfismo de anillos y a ⊆ R


un ideal de R. Llamaremos extensión del ideal a al anillo B al ideal generado por f (a) en B:
ae := (f (a)) .

Proposición 2.2.22. Sea f : (R, +, ·) −→ (B, +, ·) un morfismo de anillos y a ⊆ R un ideal de


R. El ideal extensión ae de a a B coincide con el submódulo producto aB, considerando en B
la estructura de R−módulo generada por el morfismo f .
Demostración. Es un ejercicio de mera comprobación a partir de las nociones. 
Esto justifica que algunos autores prefieran escribir aB en lugar de ae al referirse a la extensión
de un ideal porque, además, intensifica el papel que juega B en la propia notación. Utilizaremos
ambas indistintamente a lo largo del texto.
Proposición 2.2.23. Sea f : R −→ B un morfismo de anillos, a ⊆ R un ideal y b ⊆ B otro
ideal. Se tiene:
2.2. MÓDULOS, SUBMÓDULOS, MORFISMOS DE MÓDULOS 91

c e
i) a ⊆ (ae ) , b ⊇ (bc ) .
c e e c
ii) ae = ((ae ) ) , bc = ((bc ) ) .
iii) Sea C es el conjunto de las contracciones a R de los ideales de B (i.e. C := {bc :
b ideal en B}). Sea E el conjunto de los ideales de B que son extensión de los ideales
de R (i.e.E := {ae : a ideal en R}). Las siguientes son aplicaciones biyectivas (una
inversa de la otra):
Φ : C −→ E
a 7−→ ae .
Φ−1 : E −→ C
b 7−→ bc .
Demostración. Véase el Problema 97. 

Las extensiones y contracciones de ideales verifican algunas propiedades inmediatas más que
dejaremos como Problema y que resumimos a continuación:
Proposición 2.2.24. Sea f : R −→ B un morfismo de anillos. Sean a1 y a2 dos ideales del
anillo R. Se tiene:
e
i) (a1 + a2 ) = ae1 + ae2 .
e
ii) (a1 ∩ a2 ) ⊆ ae1 ∩ ae2 .
e
iii) (a1 a2 ) = ae1 ae2 .
Además, el contenido en la afirmación ii) es, en ocasiones, estricto.
Demostración. Se deja como Problema 98. Una pista para la afirmación última es la
siguiente. Considérense los anillos A = Q[Y, Z] y B := Q[X] y considérese el siguiente morfismo
de anillos:
ϕ: A −→ B
f (Y, Z) −→ f (X 2 , X 3 ).
Sean a1 = (Y ) y a2 = (Z). Entonces, compruébese que
a1 ∩ a2 = (Y Z),
lo que implicará que
e
(a1 ∩ a2 ) = (Y Z)e = (X 5 ),
mientras que
ae1 = (X 2 ), ae2 = (X 3 ),
y, por tanto,
ae1 ∩ ae2 = (X 3 ).


Proposición 2.2.25. Sea f : R −→ B un morfismo de anillos. Sean b1 y b2 dos ideales del


anillo B. Se tiene:
c
i) (b1 + b2 ) ⊇ bc1 + bc2 .
c
ii) (b1 ∩ b2 ) = bc1 ∩ bc2 .
c
iii) (b1 b2 ) ⊇ bc1 ac2 .
Demostración. Se deja como Problema 99. 

2.2.3. Teoremas de isomorfı́a.


Teorema 2.2.26 (Primer Teorema de isomorfı́a). Dado f : M −→ N un morfismo de
R−módulos, f induce un isomorfismo
f˜ : M/ ker(f ) −→ Im(f ) ⊆ N,
dado mediante f˜(m + ker(f )) = f (m).
Demostración. Es la misma demostración de lo hecho para grupos en el Problema 16. 
Teorema 2.2.27 (Otros Teoremas de isomorfı́a). Se verifican los siguientes resultados:
92 2. MÓDULOS, DETERMINANTES, HAMILTON-CAYLEY

i) Segundo Teorema de Isomorfı́a para Módulos: Sean N ⊆ M ⊆ L R−módulos,


entonces se tiene un isomorfismo
(L/N ) / ∼
(M/N ) = L/M.
ii) Tercer Teorema de Isomorfı́a para Módulos: Dados M1 y M2 submódulos de
un R−módulo M , se tiene el isomorfismo canónico:
(M1 + M2 ) /M1 ∼ = M2 / (M1 ∩ M2 ) .
Demostración. Para la primera afirmación, consideremos la siguiente correspondencia:
π: (L/N ) −→ (L/M )
x + N 7−→ x + M.
Veamos, en primer lugar, que π es una aplicación. Para ello, sean x, y ∈ L tales que x + N =
y + N , es decir, x − y ∈ N . Pero, como N ⊆ M , se tiene también x − y ∈ M . Por tanto, la
definición de π no depende del representante elegido de una clase (i.e. π(x + N ) = π(y + N )
en el caso expuesto) y se tiene que π es aplicación. Para ver que es morfismo de R−módulos
basta con observar que se verifican las siguientes propiedades ∀x, y ∈ L y ∀λ ∈ R:
π((x+N )+(y +N )) = π((x+y)+N ) = (x+y)+M = (x+M )+(y +M ) = π(x+N )+π(y +N ),
π(λ(x + N )) = π((λx) + N )) = (λx) + M = λ(x + M ) = λπ(x + N ).
Para ver que π es un epimorfismo (i.e. suprayectiva) baste con observar que
∀x + M ∈ (L/M ), ∃(x + N ) ∈ (L/N ), π(x + N ) = x + M.
En cuanto a la inyectividad, basta con verificar la siguiente ingualdad:
ker(π) = {y + N ∈ (L/N ) : π(y + N ) = y + M = 0 + M } = {y + N : y ∈ M } = (M/N ).
Aplicando el Primer Teorema de Isomorfı́a (Teorema 2.2.26) concluiremos
(L/N ) / (L/N ) / ∼
(M/N ) = ker(π) = Im(π) = (L/M ).
Para el Tercer Teorema de Isomorfı́a consideremos los morfismos siguientes:
ι : M2 −→ M1 + M2 , π : M1 + M2 −→ (M1 + M2 )/M1
x 7−→ x z 7−→ z + M1 ,
donde ι es la inclusión canónica y π es la proyección canónica sobre el módulo cociente. Con-
sideremos el morfismo φ := π ◦ ι dado por la composición de ι y π. Probaremos las siguientes
propiedades:
• φ es un epimorfismo
• ker(φ) = M1 ∩ M2 .
Para ver que φ e suprayectiva, consideremos un elemento z + M1 ∈ (M1 + M2 )/M1 . Como
z ∈ M1 + M2 , han de existir x ∈ M1 e y ∈ M2 tales que z = x + y. Entonces, nótese que
z + M1 = (x + y) + M1 = y + M1 = π(y) = π(ι(y)) = φ(y) ∈ Im(φ),
y habremos probado que φ es suprayectiva. En cuanto al núcleo, sea x ∈ M2 tal que φ(x) =
0 + M1 ∈ (M1 + M1 )/M1 . Se tiene que
φ(x) = x + M1 = 0 + M1 ⇐⇒ x ∈ M1 .
Por tanto, x ∈ ker(φ) si y solamente si x ∈ M1 ∩ M2 . De nuevo, aplicando el Primer Teorema
de Isomorfı́a concluimos
M2 / ker(φ) = M2 / (M1 ∩ M2 ) ∼
= Im(φ) = (M1 + M2 ) /M1 .

Proposición 2.2.28 (Ideales y Submódulos del Cociente). Con las notaciones de los
Teoremas de Isomorfı́a, tendremos las siguientes propiedades:
i) Los ideales del anillo cociente R/a son de la forma b/a, donde b es un ideal de R que
contiene al ideal a.
ii) Los submódulos del módulo cociente M/N son de la forma L/N , donde L es un
submódulo de M que contiene al submódulo N .
Además esa relación es biyectiva y preserva el orden.
2.2. MÓDULOS, SUBMÓDULOS, MORFISMOS DE MÓDULOS 93

Demostración. Aunque las afirmaciones son evidentes, veamos en detalle las relaciones:
• En el caso de anillos. Sea a ( R un ideal propio del anillo R. Por ser ideal R/a
posee una estructura natural de anillo ya discutida anteriormente. Tenemos, además,
un epi–morfismo de anillos dado por la proyección canónica:
π : R −→ R/a
x 7−→ x + a.
Para un ideal b de R, uno puede observar que la imagen por π de b es dada por:
π(b) := {x + a : x ∈ b}.
Es fácil observar que π(b) = π(b + a) y que b + a es un ideal de R que contiene a a.
Por eso, si b es un ideal de R que contiene a a, entonces, π(b) es un ideal de R/a que
denotaremos mediante b/a.
De otro lado, para un ideal i de R/a, la anti–imagen por π es dada por
π −1 (i) = {x ∈ R : x + a ∈ i}.
Por lo visto anteriormente, π −1 (i) es ideal en R y dado que 0 + a ∈ i, uno concluye
que a ⊆ π −1 (i).
Con estas observaciones, es claro que la siguiente define una biyección entre ideales:
{b ⊆ R : b ⊇ a, b es ideal} −→ {i ⊆ R/a : i es ideal}
b 7−→ π(b) = b/a,
cuya inversa es dada por i 7−→ π −1 (i).
• En el caso de R−módulos. Se trata esencialmente del mismo tipo de argumento. Sea
N ⊆ M un submódulo del R−módulo M . El cociente M/N posee una estructura
natural de R−módulo anillo ya discutida. Tenemos, además, un epi–morfismo de
R−módulos dado por la proyección canónica:
π : M −→ M/N
x 7−→ x + N.
Para un Submódulo L de M , uno puede observar que la imagen por π de L es dada
por:
π(L) := {x + N : x ∈ L}.
Es fácil observar que π(L) = π(L + N ) y que L + N es un submódulo de M que
contiene a N . Por eso, si L es un submódulo de M que contiene a N , entonces, π(L)
es un submódulo de M/N que denotaremos mediante L/N .
De otro lado, para un submódulo K de M/N , la anti–imagen por π es dada por
π −1 (K) = {x ∈ M : x + N ∈ K}.
Por lo visto anteriormente, π −1 (K) es submódulo de M y dado que 0 + N ∈ K, uno
concluye que N ⊆ π −1 (K).
Con estas observaciones, es, de nuevo, claro que la siguiente define una biyección entre
submódulos:
{L submódulo de M : L ⊇ N } −→ {K submódulo de M/N }
L 7−→ π(L) = L/N,
cuya inversa es dada por K 7−→ π −1 (K).


Ejemplo 2.2.29. A modo de ejemplo, aunque ya se ha percibido en los casos de Z y K[X],


observamos que los cocientes de anillos principales son siempre principales. Puesto que si R es
un anillo principal y a ( R es un ideal propio, los ideales del cociente R/a debe ser principales.
Como se acaba de ver los ideales del anillo R/a son de la forma b/a, donde b es un ideal de
R. Como R es principal, b es un ideal principal. Supongamos b = (b). Es sencillo veficar que,
entonces, el ideal cociente satisface:
b/a = (b + a),
y es, por tanto, un ideal principal.
94 2. MÓDULOS, DETERMINANTES, HAMILTON-CAYLEY

2.2.4. Módulos libres y bases.


Retomemos el ejemplo ya discutido en Ejemplo 2.2.2:
Ejemplo 2.2.30. Dado un conjunto X cualquiera, retomemos el conjunto RX de las aplicaciones
de un conjunto X en el anillo R. Vimos que tenı́a una estructura de R−módulo en el Ejemplo
2.2.2. La suma es la suma natural como grupo abeliano producto (cartesiano). También tiene
una estructura natural de anillo (con el producto “coordenada a coordenada” de aplicaciones
(una estructura que se diferenciaba de la convolución usada para definir polinomios y series de
potencias formales). Y le hemos dotado de una estructura de R−módulo mediante la operación:
·R : R × R X −→ RX
(λ, f ) 7−→ λf,
donde la aplicación λf viene dada por
λf : X −→ R
x 7−→ λ · f (x).
Asimismo, dado ϕ ∈ RX , definimos el soporte
supp(ϕ) := {x ∈ X : ϕ(x) 6= 0}.
Y podemos considerar el subconjunto: :
⊕X R := {f ∈ RX : supp(f ) es un conjunto finito}.
Obviamente, si X es un conjunto finito se tiene RX = ⊕X R. De hecho, si X es finito y biyectable
con el conjunto de números naturales [n] := {1, . . . , n}, la notación habitual es escribir Rn en
lugar de R[n] o R{1,...,n} .

Definición 39 (R−módulo libre). Un R−módulo M se denomina R−módulo libre si es


isomorfo como R−módulo a algún R−módulo de la forma ⊕X R, para algún conjunto X.

Observación 2.2.31. La Teorı́a de Módulos serı́a una sencilla traslación (con pocas variaciones)
de muchas de las ideas del Álgebra Lineal (la parte más “lineal” de la Matemática, por ausencia
de “ramificaciones”). Afortunadamente, los módulos interesantes tienden a no ser libres y, quizá
por ello, son más interesantes (lo lineal tiende a ser trivial si se estudia del modo esperable).
Para ver que no todo módulo es libre baste con observar que un grupo abeliano finito no puede
ser Z−módulo libre porque, si lo fuera, su cardinal serı́a, al menos, numerable infinito y no finito.
Pero podemos hablar de bases como en los espacios vectoriales con la definición siguiente:

Definición 40 (Base de un R−módulo). Se llama base de un submódulo N de un R−módulo


M , a todo subconjunto B ⊆ N tal que se verifican las siguientes dos propiedades:
i) El conjunto B es sistema generador de N como submódulo de M , es decir,
M := RhBi.
ii) Los elementos de B son una familia libre (también llamada linealmente independiente)
sobre R, es decir, para cualquier conjunto J finito, para cualquier lista indiciada por
J de elementos {vj : j ∈ J} ⊆ B, y para cualesquiera {aj ∈ R : j ∈ J}, se tiene
que si X
aj vj = 0,
j∈J
entonces aj = 0, ∀j ∈ J.

Proposición 2.2.32. Sean M y N dos R−módulos, y f : M −→ N un morfismo de R−módulos.


Sea T ⊆ M un submódulo y B ⊆ T un subconjunto de T .
Entonces, se tiene:
i) Si B es un sistema generador de T , entonces, f (B) es un sistema generador de f (T ).
Es decir,
T = RhBi =⇒ f (T ) := Rhf (B)i.
De hecho, f es epimorfismo si y solamente si transforma cualquier sistema generador
de M en un sistema generador de N .
2.2. MÓDULOS, SUBMÓDULOS, MORFISMOS DE MÓDULOS 95

ii) Si f es monomorfismo y B es una familia libre de elementos de M , como R−módulo,


entonces f (B) es una familia libre de elementos de N como R−módulo.
iii) Si f es un isomorfismo y B es una base de T como R−módulo entonces, f (B) es una
base de f (T ) como R−módulo.
Demostración. Los alumnos han debido probar similares afirmaciones en el caso de es-
pacios vectoriales, por lo que obvio el incluir aquı́ una prueba; pero propongo probarlo como
Problema 87. 

Proposición 2.2.33. Un R−módulo es libre si y sólo si posee alguna base.


Demostración. Veamos que si M es un R−módulo libre entonces posee una base. Para
verlo, recordemos que M es un R−módulo libre si y sólo si es isomorfo a un R−módulo de la
forma ⊕X R. Por tanto, usando la Proposición precedente, bastará con probar que ⊕X R posee
una base y transferirla, vı́a el isomorfismo, a una base de M .
Para construir una base de ⊕X R, consideremos para cada x ∈ X consideremos el siguiente
elemento ex ∈ ⊕X R:
ex : X −→  R
1, si y = x
z 7−→
0, en otro caso.
Veamos que el conjunto BX := {ex : x ∈ X} es una base del R−módulo libre ⊕X R. Para ello,
consideremos f ∈ RX un elemento cualquiera. por definición sabemos que existe un conjunto
J ⊆ X finito tal que f (x) = 0 para todo x ∈ X \ J. Consideremos entonces el siguiente
elemento: X
g := f (y)ey .
y∈J
Es un elemento del submódulo RhBX i generado por BX : como J es finito, la suma es una
suma finita y como RhBX i es submódulo g ∈ RhBX i. Pero es, además, sencillo observar que
f y g coinciden como aplicaciones. La razón es que si x 6∈ J es claro que tanto g(x) como f (x)
valen 0 y, por tanto, conciden. En el caso de x ∈ J se tendrá que
X
g(x) = f (y)ey (x) = f (x)ex (x) = f (x).
y∈J

De otro lado, es fácil ver que la familia BX es una familia de elementos linealmente independi-
entes sobre R. Si tomamos J ⊆ X un conjunto finito y unos elementos {λx ∈ R : x ∈ J}, y si
suponemos X
ax ex = 0,
x∈J
entonces esa es una igualdad como funciones, por lo que

X 0, si y 6∈ J
0= ax ex (y) =
ax = ax ex (y) si y = x ∈ J.
x∈J
Con lo que tendremos la conclusión buscada y BX es base de ⊕X R.
Supongamos ahora que un R−módulo M posee una base B := {vi : i ∈ I} ⊆ M . Conluyamos
que, entonces, M es isomorfo a ⊕I R = ⊕B R y habremos probado que M es un R−módulo
libre. Nótese que ya hemos asumido que B e I son conjuntos biyectables y que, como tales
conjuntos biyectables ⊕I R y ⊕B R son isomorfos. De todos modos, es fácil definir la siguiente
correspondencia:
Φ : ⊕I R −→ P M
f 7−→ i∈I f (i)vi .
La primera dificultad es probar que se trata, efectivamente, de una aplicación. Para ello,
recordemos que f ∈ ⊕I R, luego es de soporte finito, por tanto,
X X
f (i)vi = f (i)vi ,
i∈I i∈supp(f )

que es una suma finita que, por tanto, es un elemento de M . Tendremos ası́ probado que se
trata de una correspondencia. Además, se observa que la suma finita sólo depende de f (de
supp(f ) y de los valores de f en supp(f )). Verificar que se trata de un morfismo de R−módulos
96 2. MÓDULOS, DETERMINANTES, HAMILTON-CAYLEY

es un elemental ejercicio de comprobación que recomendamos al lector para familiarizarse con


el asunto, pero que omitimos or obvio. Además, si BI es la base de ⊕I R usada en la primera
parte de esta Demostración, es claro que Φ(BI ) = B. Como B es un sistema generador de
M , usando la Proposición precedente, conluimos que f es epimorfismo. Para ver que tenemos
un monomorfismo tampoco hay que hacer mucho esfuerzo. Supogamos que f ∈ ⊕I R es un
elemento del ker(Φ). Entonces,
X
0 = Φ(f ) := f (i)vi ,
i∈supp(f )

donde supp(f ) ⊆ I es un conjunto finito. Pero, por ser B una familia libre de elemntos de M
y por la identidad que acabamos de escribir (que es una suma finita de múltiplos “escalares”
de los elementos de B, igualada a cero) concluiremos sin esfuerzo que f (j) = 0 para todo
j ∈ supp(f ), con lo que f debe ser la aplicación nula. 

Observación 2.2.34 (R[X1 , . . . , Xn ] como R−módulo libre y base monomial). Por la


propia definición del anillo de polinomios R[X1 , . . . , Xn ] hecha en el capı́tulo precedente, el
grupo aditivo subyacente era ⊕Nn R con lo que es un R−módulo libre. Es decir, se tiene un
isomorfismo de de R−módulos entre:
R[X1 , . . . , Xn ] ∼
= ⊕Nn R.
Además, una base de R[X1 , . . . , Xn ] es dada por los monomios. Es decir, la siguiente es una
base de R[X1 , . . . , Xn ]:
B := {X µ : µ ∈ Nn } = {X1µ1 · · · Xnµn : (µ1 , . . . , µn ) ∈ Nn }.
Se la denomina la base monomial de R[X1 , . . . , Xn ].

Observación 2.2.35 (Módulos libres y morfismos). En la prueba de la Proposición prece-


dente ya se deja entrever una propiedad esencial de los morfismos que parten de los módulos
libres: para determinar un morfismo de R−módulos entre un módulo libre M y otro módulo N
cualquiera, basta con determinar una imagen de una base. Fijemos esa idea.

Proposición 2.2.36 (Morfismos de la suma directa). Sea {Mi : i ∈ I} una familia de


R−módulos y sea N otro R−módulo. Entonces, los siguientes dos R−módulos son isomorfos:
HomR (⊕i∈I Mi , N ) ∼
Y
= HomR (Mi , N ).
i∈I

Demostración. En otros términos, supongamos dada una familia cualquiera de morfismos


de R−módulos F := {fi ∈ HomR (Mi , N ) : i ∈ I}, entonces existe un único morfismo
F
f : ⊕i∈I Mi −→ N,
tal que si λi : Mi −→ ⊕i∈I Mi son las inclusiones de cada Mi en ⊕i∈I Mi , se verifica
Ff◦ λi = fi , ∀i ∈ I.
Es fácil verificar que la anterior construcción define un morfismo de R−módulos del tipo sigu-
iente: Q
e· : i∈I HomR (Mi , n) −→ HomR (⊕i∈I Mi , N )
F := {fi ∈ HomR (Mi , N ) : i ∈ I} 7−→ F
f.
Para concluir la prueba basta con verificar que éste es un isomorfismo de R−módulos. 

Corolario 2.2.37. Sea {Mi : i ∈ I} una familia de R−módulos. Se tiene:


∗ ∗
(⊕i∈I Mi ) ∼
Y
= (Mi ) ,
i∈I

donde (·) significa dual.
Demostración. Como ya se indicó en la definición de módulo dual (Ejemplo 2.2.11), el
dual de un R−módulo M se define como M ∗ := HomR (M, R). Por tanto, el enunciado es
consecuencia inmediata de la Proposición precedente. 
2.2. MÓDULOS, SUBMÓDULOS, MORFISMOS DE MÓDULOS 97

Proposición 2.2.38 (Propiedades básicas de los módulos libres). Se tienen las siguientes
propiedades:
i) Sean M y N dos R−módulos y supongamos que M es un R−módulo libre. Sea B =
{vi : i ∈ I} una base de M como R−módulo libre. Sea {ni : i ∈ I} una familia
cualquiera de elementos de N . Entonces, existe un único morfismo de R−módulos
f ∈ HomR (M, N ) tal que
f (vi ) = ni , ∀i ∈ I.
ii) Si M y N son dos R−módulos libres, fijadas unas bases B y B 0 en M y N , las
representaciones (coordenadas en R) en la base B 0 de las imágenes de los elemen-
tos de la base B determinan unı́vocamente los morfismos de R−módulos entre M y
N . En particular, si M y N son R−módulos libres con bases finitas, el R−módulo
HomR (M, N ) es también un R−módulo libre.
iii) Sumas directas de R−módulos libres son libres. Es decir, dada una familia {Mi : i ∈
I} una familia cualquiera de R−módulos libres (con I conjunto de cualquier cardinal),
entonces, el siguiente es un R−módulo libre:
⊕i∈I Mi .
iv) Producto cartesianos finitos de R−módulos libres es un R−módulo libre. Qr Es decir, si
{M1 , . . . , Mr } es una familia finita de R−módulos libres, el producto i=1 Mi es un
R−módulo libre.
Demostración. Las afirmaciones son esencialmente de mera verificación a partir de la
Proposición 2.2.36. Las proponemos como Problema. 

Proposición 2.2.39. Todo R−módulo es la imagen por un epimorfismo de un R−módulo libre.


Demostración. Usemos la Proposición precedente. Sea M un R−módulo y consideremos
el R−módulo libre
F (M ) := ⊕M R.
Es decir, la suma directa de copias de R indiciada por el propio R−módulo M . Ahora, por la
afirmación i) de la Proposición precedente, para definir un morfismo entre F (M ) y M basta
con definir la imagen de una base. Una base de F (M ) como R−módulo libre es la siguiente:
B := {em : m ∈ M },
donde
em : M −→  R
1, si n = m
n 7−→ em (n) :=
0, en otro caso.
Ahira definamos π : F (M ) −→ M como el único morfismo de R−módulos tal que se satisface:
π(em ) := m, ∀m ∈ M.
Es morfismo de R−módulos por lo dicho en la Proposición precedente y es epimorfismo porque
M ⊆ Im(π). 

Definición 41 (R−módulos libres (de rango finito)). Se denomina R−módulo libre de


rango finito a todo R−módulo M que posee una base B de cardinal finito. Llamaremos rango
de un R−módulo libre de rango finito al mı́nimo de los cardinales de sus bases2, es decir,
rankR (M ) := min{](B) : B es base finita de M }.

Ejemplo 2.2.40 (Ejemplos de módulos libres de rango finito). Los siguientes son ejemplos
de R−módulos libres y no libres:
i) Un espacio vectorial V sobre un cuerpo K son módulos libres, al rango se le llama
dimensión y está determinado de forma unı́voca.
2Esta es una definición “provisional”: no hemos probado aún que dos bases de un R−módulo libre tengan
que tener el mismo cardinal. Lo haremos en el Capı́tulo siguiente (Subsección 4.2.2 y, en particular, en la
Definición 69) con poco esfuerzo adicional, pero nos permitimos usar esta terminologı́a por el momento.
98 2. MÓDULOS, DETERMINANTES, HAMILTON-CAYLEY

ii) Los anillos son módulos libres sobre sı́ mismos de rango acotado por 1.
iii) Los conjuntos de matrices Mn×m (R) tienen una estructura natural de R−módulo libre
de rango acotado por nm.
iv) Los polinomios homogéneos de grado fijado con coeficientes en R, i.e. el conjunto
Hd (X1 , . . . , Xn ) := {f ∈ R[X1 , . . . , Xn ] : deg(f ) = d} ∪ {0},
tendremos un R−módulo libre de rango acotado por
 
d+n−1
.
n−1
v) Los grupos abelianos finitos no son nunca Z−módulos libres. En particular, no son
Z−módulos libres los de la forma:
r
Y
G := (Z/pi Z) ,
i=1
con pi ∈ Z no nulos.

Proposición 2.2.41. En el caso finito, todo R−módulo finitamente generado es el cociente


de un R−módulo libre de rango finito por uno de sus submódulos. En particular, todo grupo
abeliano finitamente generado es de la forma (i.e. isomorfo) a un Z−módulo cociente del tipo
Zn /N , donde N es un subgrupo de Zn . No es cierto, en general, que todo R−módulo finitamente
generado sea libre.
Demostración. Se trata de analizar el caso finitamente generado. Sea X := {m1 , . . . , mr }
un conjunto de generadores de M . Consideremos F := Rr = R{1,...,r} . Nótese que F es un
R−módulo libre de rango finito. Consideremos la correspondencia siguiente:
Φ: F −→ Pr M
(x1 , . . . , xr ) 7−→ i=1 xi mi .
Es claro que Φ es una aplicación y es un ejercicio de comprobación el verificar que es un
epimorfismo de R−módulos. Mientras que los ejemplos de Z−módulos con torsión son buenos
ejemplos de módulos finitamente generados que no son libres. Por ejemplo los siguientes:
Z/2Z × Z/3Z,
no pueden ser Z−módulos libres porque son de cardinal finito y el único Z−módulo libre de
cardinal finito es (0). 

Observación 2.2.42 (Módulos libres de rango finito y matrices). Sean M y N dos


R−módulos libres de rangos respectivos m y n. Supongamos B := {α1 , . . . , αm } una base de
M y B 0 = {ω1 , . . . , ωn } una base de N . Consideremos una matriz:
 
a1,1 a1,2 · · · a1,m
 a2,1 a2,2 · · · a2,m 
M :=  . ..  ∈ Mn×m (R).
 
 .. ..
. . 
an,1 an,2 ··· an,m
Entonces, existe un único morfismo de R−módulos f : M −→ N tal que
f (αi ) := a1,j ω1 + · · · + an,j ωn .
De hecho, ese único morfismo toma la forma
Xm n
X
f( xi αi ) = yj ωj ,
i=1 j=1

si y solamente si     
a1,1 a1,2 ··· a1,m x1 y1
 a2,1 a2,2 ··· a2,m 
  x2   y2 
   
..   ..  =  ..  .

 .. ..
 . . .  .   . 
an,1 an,2 ··· an,m xm yn
2.2. MÓDULOS, SUBMÓDULOS, MORFISMOS DE MÓDULOS 99

Proposición 2.2.43 (Matrices y morfismos entre módulos libres de rango finito). Sean
M y N dos R−módulos libres con bases respectivas B y B 0 de respectivos cardinales m y n.
Entonces, existe un isomorfismo de R−módulos
MB,B0 : HomR (M, N ) −→ Mn×m (R).
Para cada f ∈ HomR (M, N ), la matriz MB,B0 (f ) = A ∈ Mn×m (R) se la denomina matriz de
f en las bases B y B 0 .
Demostración. Es casi obvio desde la observación precedente y lo dejamos como ejercicio.
Debe tenerse en cuenta que no hemos demostrado la unicidad del rango, aspecto éste que
dejaremos para el Capı́tulo siguiente. 

2.2.5. Diagramas conmutativos, complejos y sucesiones exactas (Opcional). Se


trata, por ahora, de fijar unos pocos términos para poder usarlos con posterioridad. Comence-
mos con una noción básica de Combinatoria.
Definición 42 (Grafo orientado). Un grafo orientado es un par G := (V, E), donde V es un
conjunto (cuyos elementos se denominan vértices o nodos) y E ⊆ V 2 es una relación (cuyos
elementos se denominan aristas). Un camino en un grafo orientado es una sucesión finita de
vértices
ν1 , . . . , νn ,
de tal modo que (νi , νi+1 ) ∈ E. En ocasiones, el camino se describe mediante la notación:
ν1 → ν2 → · · · → νn .
Un ciclo es un camino que comienza y termina en el mismo nodo.
Un grafo con pesos en un conjunto F es un par (G , A), donde G := (V, E) es un grafo y
A : E −→ F es una aplicación que asigna a cada arista (ν1 , ν2 ) un elemento A(ν1 , ν2 ) ∈ F .

Observación 2.2.44. Usualmente, en Combinatoria, se tratan los grafos G := (V, E) para


los que el conjunto de vértices V es finito. Sin embargo, esta restricción es, a veces, poco
enriquecedora.
Sin embargo, dado cualquier conjunto V y cualquier relación de orden ≤ sobre V tenemos un
grafo orientado mediante el conjunto de aristas E := {(ν1 , ν2 ) ∈ V 2 : ν1 ≤ ν2 }. De hecho,
también se da en el sentido recı́proco: dado un grafo orientado G := (V, E) sobre un conjunto
V que satisfaga las propiedades reflexiva y simétrica, podemos inducir una relación de orden
sobre V mediante transitividad.
Por supuesto, todo grafo de una correspondencia f : D(f ) ⊆ A −→ A define un grafo orientado
de modo obvio. Es el grafo G := (A, G) donde
G := {(x, y) ∈ A2 : x ∈ D(f ), y = f (x)}.
Otros ejemplos sintomáticos de grafos orientados son los sistemas dinámicos formados por un
par (M, f ) donde M es una variedad y f : M −→ M es un difeomorfismo. esto permite
introducir un grafo (M, Gr(f )), donde Gr(f ) es el grafo de f .
Definición 43 (Diagrama en la categorı́a de R−módulos). Un diagrama en la categorı́a
de R−módulos es un grafo con pesos (G , A) donde:
i) El grafo G = (V, E) es un grafo orientado cuyos vértices son R−módulos,
ii) Los pesos son morfismos de R−módulos, es decir, para cada (M, N ) ∈ E, A((M, N )) ∈
HomR (M, N ).
Un diagrama conmutativo en la categorı́a de R−módulos es un diagrama (G , A), siendo G =
(V, E), si verifica lo siguiente:
Dados cualesquiera dos caminos dos caminos en el grafo:
N1 → N2 → · · · → Nn ,
y
M1 → M2 → · · · → Mm ,
con el mismo punto inicial y final (M1 = N1 , Mm = Nn ) y dadas las asignaciones de morfismos
for A:
fi := A(Ni , Ni+1 ) ∈ HomR (Ni , Ni+1 ), 1 ≤ i ≤ n − 1,
100 2. MÓDULOS, DETERMINANTES, HAMILTON-CAYLEY

gj := A(Mj , Mj+1 ) ∈ HomR (Mj , Mj+1 ), 1 ≤ j ≤ m − 1,


se tiene la igualdad entre las composiciones de morfismos obtenidas siguiendo indistintanmente
cada uno de los caminos señalados, es decir, la igualdad siguientes:
fn−1 ◦ fn−2 ◦ · · · ◦ f1 = gm−1 ◦ gm−2 ◦ · · · ◦ g1 ,
donde ◦ quiere decir, como siempre, composición.

Notación 2.2.45. Usualmente se usan los sı́mbolos o  para representar la conmutatividad


de una diagrama. Ası́, la propiedad que define la conmutatividad de un diagrama se puede
escribir mediante una figura del tipo siguiente:
f2 fn−2
N2 ··· Nn−1
f1 fn−1
M 1 = N1 Mm = Nn
g1 g2 gm−2 gm−1
M2 ··· Mm−1

Ejemplo 2.2.46 (Diagramas conmutativos de los Teoremas de isomorfı́a). Veamos


algunos ejemplos sencillos de diagramas conmutativos asociados a los Teoremas de Isomorfı́a
de R−módulos discutidos en Capı́tulos anteriores.
• Primer Teorema de Isomorfı́a: Consideremos un morfismo de R−módulos f : M →
N . Consideremos M/ ker(f ) el cociente por el núcleo, sea π : M −→ M/ ker(f ) la
proyección canónica y sea i : Imf (f ) −→ N la inclusión de la imagen en N . El Primer
Teorema de Isomorfı́a afirma que existe un único isomorfismo fe : M/ ker(F ) −→ Im(f )
que hace conmutativo el diagrama siguiente:
f
M N

π i

M/ ker(f ) Im(f )
fe

• Segundo Teorema de Isomorfı́a: Consideramos N ⊆ L dos submódulos de M .


Como L/N es submódulo de M/N tenemos tres proyecciones:
π1 : M −→ M/N, π2 : M −→ M/L, π2 : M/N −→ (M/N )/(L/N ).
e : M/L −→
El Segundo Teorema de Isomorfı́a afirma que existe un único isomorfismo π
(M/N )/(L/N ) haciendo conmutativo el siguiente diagrama:
π1
M M/N

π2 π2

M/L (M/N ) / (L/N )


π
e
• Tercer Teorema de Isomorfı́a: Consideramos N1 , N2 dos submódulos de un R−módulo
M . Tenemos los morfismos siguientes: i : N1 −→ N1 + N2 dado como la inclusión,
tenemos que N1 ∩ N2 es submódulo de N1 y, por tanto, tenemos la proyección π1 :
N1 −→ N1 /(N1 ∩ N2 ) y, finalmente, N2 es submódulo de N1 + N2 con lo que tenemos
la proyección π2 : N1 + N1 −→ (N1 + N2 )/N2 . El Tercer Teorema de Isomorfı́a afirma
que existe un único isomorfismo de R−módulos ei : N1 /(N1 ∩ N2 ) −→ (N1 + N2 )/N2
haciendo conmutativo el siguiente diagrama:
2.2. MÓDULOS, SUBMÓDULOS, MORFISMOS DE MÓDULOS 101

i
N1 N1 + N2

π1 π2

N1 / (N1 ∩ N2 ) (N1 + N2 ) /N2


ei

Definición 44 (Complejos (de cadena) de R−módulos). Se denomina complejo (de ca-


dena) de R−módulos a todo diagrama dado como una secuencia decreciente (sub-indicada por
Z o N, según el caso) de módulos y morfismos:
dn+2 dn+1 dn dn−1
C : ... Mn+1 Mn Mn−1 Mn−2 ...

de tal modo que dn ◦ dn+1 = 0 (o, equivalentemente, Im(dn+1 ) ⊆ ker(dn )) para cada n ∈ Z. A
los elementos de Mn se les dnomina elementos de grado (o dimensión) n. A los morfismos dn
se les denomina morfismos frontera o diferenciales3. A los elementos de ker(dn ) ⊆ Mn se les
denomina ciclos de grado n y a los de Im(dn+1 ) ⊆ Mn se les denomina bordes (de grado n). A
los R−módulos cociente
Hi (C, R) := ker(di )/ Im(di+1 ),
se les denomina módulos de homologı́a del complejo C.

En ocasiones, módulos y morfismos aparecen con ı́ndices en sentido ascendente y en ese caso
hablamos de complejos de co-cadena. Por ahora, nos quedamos con la terminologı́a que será
recordada más adelante.
Definición 45 (Complejos (de co-cadena) de R−módulos). Se denomina complejo de
co-cadena de R−módulos a todo diagrama dado como una secuencia creciente (sub-indicada
por Z o N, según el caso) de módulos y morfismos:
n−2
c cn−1 cn cn+1 . . .
D : ... M n−1 Mn M n+1
de tal modo que cn ◦ cn−1 = 0 (o, equivalentemente, Im(cn−1 ) ⊆ ker(cn )). A los elementos de
M n se les denomina elementos del complejo de grado n. A los elementos de ker(cn ) ⊆ M n se les
denomina co-ciclos de grado n y a los elementos de Im(cn−1 ) ⊆ M n se les denomina co-bordes
de grado n. Al cociente de co-ciclos por co-bordes se le denomina grupo de co-homologı́a del
complejo:
H n (D, R) := ker(cn )/ Im(cn−1 ).

Ejemplo 2.2.47 (Dualidad). El elegir sentido decreciente (en términos de grado) o creciente es
un clásico convecionalismo (discutible salvo en las iterpretaciones más topológicas). Intentemos
explicar la razón del doble sentido (creciente/decreciente) y de las expresiones con prefijo “co-”
(co-cadena, co-ciclo, co-borde, co-homologı́a,...) mediante la dualización. Es decir, veamos que
se puede pasar de un complejo de cadena a un complejo de co-cadena mediante dualización,
lo que explicarı́a la principal deferencia y similitud de ambas nociones. Supongamos dado un
complejo de cadena:
dn+2 dn+1 dn dn−1
C : ... Mn+1 Mn Mn−1 Mn−2 ...

con la propiedad dn ◦ dn+1 = 0. Ahora definamos los R−módulos duales N n := Mn∗ =


HomR (Mn , R). Consideremos el morfismo dn : Mn −→ Mn−1 . Si tomamos h : Mn−1 −→ R
morfismo de R−módulos, componiendo con dn tendrı́amos el morfismo de R−módulos h ◦ dn :
Mn −→ R. Esto se observa con el diagrama siguiente:

3La terminologı́a viene de la Topologı́a Algebraica y los morfismos frontera inducidos por triangulaciones,
ası́ como los términos ciclo, borde para representar, respectivamente ker(di ) e Im(di+1 ).
102 2. MÓDULOS, DETERMINANTES, HAMILTON-CAYLEY

dn
Mn Mn−1

h ◦ dn h

R
Por ello, podemos definir la siguiente aplicación:
d∗n := HomR (dn , R) : HomR (Mn−1 , R) −→ HomR (Mn , R)
h 7−→ h ◦ dn .
Es aplicación porque h ◦ dn es morfismo de R−módulos. Es sencillo, además, probar que d∗n es

un morfismo de R−módulos entre los duales Mn−1 y Mn∗ (i.e. d∗n ∈ HomR (Mn−1∗
, Mn∗ )).
Sabemos que dn ◦ dn+1 = 0 para cada n ∈ Z porque C es un complejo de cadena. Consideremos

ahora f ∈ Mn−1 , es decir un morfismo f : Mn−1 −→ R. Entonces, d∗n (h) = (h ◦ dn ) ∈
HomR (Mn , R) = Mn∗ . Podemos aplicar ahora d∗n+1 al elemento (h◦dn ) ∈ HomR (Mn , R) = Mn∗ .
Tendremos que d∗n+1 (f ◦ dn ) ∈ Mn+1

y se tiene:
∗ ∗ ∗

dn+1 ◦ dn (h) = dn+1 (dn ◦ h) = h ◦ (dn ◦ dn+1 ) = h ◦ 0 = 0.
dn ◦ dn+1 = 0

dn+1 dn
Mn+1 Mn Mn−1

h ◦ dn ◦ dn+1 = 0 h ◦ dn h

R
Es decir,d∗n+1◦ = 0. Escribiendo, para ajustar los ı́ndices, cn−1 := d∗n , tenemos el siguiente
d∗n
complejo de co-cadena, dual del complejo de cadena C:
n−2
c ∗ cn−1 cn ∗ cn+1 . . .
C∗ : . . . Mn−1 Mn∗ Mn+1

En los que respeta a este Capı́tulo usaremos notación ascendente y lo llamaremos solamente
complejos.
Definición 46 (Sucesiones exactas de R−módulos). Las sucesiones exactas de R−módulos
son los complejos de R−módulos:
di−1 di di+1 di+2
C : ... Mi Mi+1 Mi+2 ...

que verifican:
Im(di+1 ) = ker(di ), ∀i.
Se llaman sucesiones exactas cortas a las sucesiones exactas de la forma:
f g
0 M0 M M 00 0
0 00
Donde 0 es el R−módulo nulo, y 0 −→ M , M −→ 0, son los morfismo obvios (y, por ello,
no se representan). A veces abreviamos el término escribiedndo simplemente s.e.c..

Observación 2.2.48 (Exactitud y homologı́a). Obsérvese que dado un complejo de cadena:


dn+2 dn+1 dn dn−1
C : ... Mn+1 Mn Mn−1 Mn−2 ...

Entonces, el complejo de cadena C es una sucesión exacta si y solamente si todos los R−módulos
de homologı́a Hn (C, R) son el módulo 0. Análogamente, dado un complejo de co-cadena:
2.2. MÓDULOS, SUBMÓDULOS, MORFISMOS DE MÓDULOS 103

n−2
c cn−1 cn cn+1 . . .
D : ... M n−1 Mn M n+1
Entonces el complejo D es exacto si y solamente si los R−módulos de co-homologı́a H n (D, R)
son todos nulos.

Observación 2.2.49 (Más observaciones elementales). Como comentarios obvios, supon-


gamos que tenemos una sucesión exacta de R−módulos:
f g
0 M0 M M 00 0
• Como es exacta y 0 −→ M 0 es el morfismo nulo 0, Im(0) = ker(f ) = 0 significa que
necesariamente f ha de ser inyectiva. Algunos autores usan la notación M 0 ,−→ M
• Como es exacta y M 00 −→ 0 es el morfismo nulo 0, ker(0) = M 00 = Im(g) significa que
f ha de ser necesariamente suprayectiva. Algunos autores usan M − M 00 .
• Finalmente, decir que la anterior sucesión es exacta es una forma distinta de escribir
que
M/f (M 0 ) ∼
= M 00 .
• En el caso de espacios vectoriales de dimensión finita, una sucesión exacta como la
anterior, implicarı́a que M ∼
= M 0 ⊕ M 00 . Esto, que es cierto para espacios vectoriales,
no es cierto para módulos. Baste con observar la s.e.c. siguiente:
f g
0 −→ 2Z−−−−−→ Z−−−−→ Z/2Z −→ 0,
donde f es la inclusión y g es la proyección. Claramente Z ∼
6 2Z ⊕ (Z/2Z), porque Z
=
es libre de torsión y 2Z ⊕ (Z/2Z) tiene torsión.

Ejemplo 2.2.50 (Núcleo, Co-núcleo). Dado un morfismo de R−módulos f : M −→ N ,


tenemos una sucesión exacta de la forma siguiente:
i f π
0 ker(f ) M N Coker(f ) 0,

donde i es la inclusión y π es la proyección obvia.

Proposición 2.2.51. Dado un complejo de R−módulos


di−1 di di+1 di+2
C : ... Mi Mi+1 Mi+2 ...

entonces C es exacto si y solamente si para cada i, la sucesión exacta corta siguiente es exacta:
ki di
0 ker(di ) M ker(di+1 ) 0

donde ki es la inclusión canónica.


Demostración. Si la sucesión C es exacta, entonces Im(di ) = ker(di+1 ) para cada i.
Claramente, Im(ki ) = ker(di ) por definición, ası́ que Ci es una sucesión exacta corta. El
recı́proco es igualmente obvio. 

2.2.6. Ejercicios y problemas de la Sección 2.2.


Problema 72 (Axiomas de Peano-Dedekind). Acude a la página web https: // en.
wikipedia. org/ wiki/ Peano_ axioms . Revisa los axiomas de Peano-Dedekind que definen
en conjunto de los números naturales. Copia los axiomas que definen N y, entre ellos, el Prin-
cipio de Inducción. Una vez asumidos puedes aplicar inducción en tus argumentos. Encuentra
el enunciado del Teorema de Dedekind sobre la unicidad de los modelos de números naturales.
Averigua si los axiomas de Peano han sido modificados en algún momento con posterioridad a
1889.
104 2. MÓDULOS, DETERMINANTES, HAMILTON-CAYLEY

2.2.6.1. Breve recordatorio de Teorı́a elemental del Endomorfismo (en caso


de no disponer de formación previa).
Problema 73. Sea(V, +, ·K ) un K−espacio vectorial (i.e. un K−módulo, donde K es un
cuerpo). Sea f : V −→ V un endomorfismo de K−espacios vectoriales. Supongamos dimK (V ) =
n es un espacio vectorial de dimensión finita (i.e. un K−módulo libre de rango finito) y sea
dada una base ordenada, es decir,
B := ({v1 , . . . , vn }, ≤),
donde {v1 , . . . , vn } es una base de V como K−espacio vectorial y ≤ es una relación de orden
total sobre {v1 , . . . , vn }.
Salvo permutación de los subı́ndices de los elementos de la base, se suele suponer que los
subı́ndices están ligados al orden (es decir, se suele suponer que v1 ≤ · · · ≤ vn ) y se suele decir
simplemente: “Sea B := {v1 , . . . , vn } una base ordenada”. Usaremos la segunda expresión,
aunque entenderemos la primera.
i) Pruébese que dado un endomorfismo ϕ : V −→ V (como K−espacio vectorial) y
fijada la base B, existe una única matriz MB (f ) ∈ Mn (K) verificando la siguiente
propiedad:
Para vada v ∈ V si sus coordenadas en la base B son dadas por la siguiente identidad:
v = x 1 v1 + · · · + x n vn ,
entonces ϕ(v) ∈ V tiene coordenadas dadas (en la misma base) mediante:
ϕ(v) = y1 v1 + · · · + yn vn ,
y la relación entre las coordenadas de v y ϕ(v) viene dada por la siguiente identidad:
   
y1 x1
 ..   .. 
 .  = MB (ϕ)  .  .
yn xn
ii) Sean f, g : V −→ V dos endomorfismos de V como K−espacio vectorial, sea λ ∈ K.
Fijemos la base ordenada B precedente. Pruébese que, con las notaciones precedentes,
se tiene:
MB (f + g) = MB (f ) + MB (g), MB (λ ·K f ) = λMB (f ),
y
MB (f ◦ g) = MB (f ) · MB (g),
donde + y ·λ son las operaciones de K−módulo en HomK (V, V ) = EndK (V ), ◦ es la
composición de endomorfismos y las operaciones en todas las expresiones a la derecha
de cada igualdad son las operaciones usuales con matrices.
iii) Pruébese que (EndK (V ), +, ◦) es un anillo (con las operaciones de suma y com-
posición) no conmutativo y con unidad (el neutro para la composición es IdV ). Pruébese,
además, que el siguiente es un isomorfismo de anillos no conmutativos con unidad:
MB : (EndK (V ), +, ◦) −→ (Mn (K), +, ·)
f 7−→ MB (f ).
Pruébese que también es isomorfismo de K−módulos.
iv) Sea (GL(n, K), ·) el grupo de las matrices inversibles n × n con coordenadas K. Es
decir, el conjunto
GL(n, K) := {A ∈ Mn (K) : ∃A0 ∈ Mn (K), AA0 = A0 A = Idn },
donde Idn es la matriz identidad. Pruébese, con las notaciones precedentes, que son
equivalentes:
• f es un isomorfismo de K−espacios vectoriales,
• f es un monomorfismo de K−espacios vectoriales,
• f es un epimorfismo de K−espacios vectoriales,
• MB (f ) ∈ GL(n, K).
• f transforma bases ordenadas de V en bases ordenadas de V .
Problema 74. Con las mismas notaciones e hipótesis del problema precedente:
2.2. MÓDULOS, SUBMÓDULOS, MORFISMOS DE MÓDULOS 105

i) Sean B y B 0 := {w1 , . . . , wn } dos bases ordenadas de V . Pruébese que existe una


única aplicación K−lineal ψ : V −→ V tal que ψ(vi ) = wi . Pruébese que ψ es un
automorfismo de V como K−espacio vectorial. Conclúyase que la matrix MB (ψ) está
en GL(n, K). A la matriz MB (f ) se la suele denominar “matriz del cambio de base
de B a B 0 ” porque, como parece obvio por su propia definición, ψ es el isomorfismo
de “cambio de base”.
ii) Sean B y B 0 dos bases ordenadas de V , sea ψ : V −→ V el automorfismo asociado
a estas dos bases, como en el ı́tem precedente. Pruébese que para cada endomorfismo
f : V −→ V las matrices MB (f ) y MB0 (f ) en las respectivas bases verifican la
siguiente relación:
MB (f )−1 MB0 (f )MB (f ) = MB (f ).
iii) Dos matrices A, B ∈ Mn (K) se denominan semajantes si existe P ∈ GL(n, K)
tal que P AP −1 = B. Pruébese que la relación “ser semejante” es una relación de
equivalencia. Además, dado que MB : EndK (V ) −→ Mn (K) es un isomorfismo de
anillos, pruébese que las siguientes propiedades son equivalentes para dos matrices
A, B ∈ Mn (K):
• Las matrices A y B son semajantes,
• Existe un endormofismo f : V −→ V como K−espacio vectorial y existen dos
bases ordenadas B y B 0 de V tales que
A = MB (f ), AB0 (f ).
En otras palabras, purébese que dos matrices A, B ∈ Mn (K) son semejantes si y
solamente si están asociadas al mismo endomorfismo de V , aunque en bases diferentes.
Problema 75. Sea (Mn (K), +, ·K ) el espacio de matrices n × n con coordenadas en el cuerpo
K.
i) Pruébese que Mn (K) es un K−espacio vectorial de dimensón n2 . Exhı́base una base.
ii) Sea A ∈ Mn (K) una matriz y considérese el subespacio de Mn (K) generado por la
familia siguiente:
2 2
−1
P (A) := {Idn , A, A2 , . . . , An , An },

donde Ai := A · Ai−1 , para i ≥ 2, es la potencia i−ésima de la matriz A. Pruébese


que P (A) es una familia ligada (o, dicho de otro modo, que sus elementos no son
linealmente independientes en Mn (A)). Pruébese que existen a0 , a1 , . . . , an2 ∈ K, no
todos nulos, tales que:
2
n
X
ak Ak = 0.
k=0
iii) Considérese el anillo de polinomios p(X) ∈ K[X] y supongamos que
p(X) = am X m−1 + · · · + a1 X + a0 .
Dada una matriz A ∈ Mn (K) definamos la matriz:
p(A) := am Am + am−1 Am−1 + · · · + a1 A + a0 Idn ∈ Mn (K).
Pruébese que está bien definida.
iv) Considérese el conjunto siguiente:
AnnK[X] (A) := {q ∈ K[X] : q(A) = 0}.
Pruébese que AnnK[X] (A) es un ideal en K[X].
v) Pruébese que el ideal AnnK[X] (A) posee un polinomio no nulo de grado a lo sumo n2 .
Concluir que el ideal AnnK[X] (A) está generado por un polinomio mónico no nulo de
grado a lo sumo n2 . Intenta probar que AnnK[X] (A) está generado por un polinomio
mónico de grado a lo sumo n sin usar el Teorema de Hamilton-Cayley que viene en las
Secciones siguientes. Al polinomio generador de AnnK (A) se le denomina polinomio
mı́nimo de la matriz A.
106 2. MÓDULOS, DETERMINANTES, HAMILTON-CAYLEY

vi) Dadas A, B ∈ Mn (K) dos matrices semejantes y sea P ∈ GL(n, K) tal que P AP −1 =
B, prueba que para cada polinomio h ∈ K[X] se tiene:
P h(A)P −1 = h(B).
Concluye que si dos matrices A y B son semejantes, se tiene:
AnnK[X] (A) = AnnK[X] (B),
y por tanto, dos matrices semejantes poseen el mismo polinomio mı́nimo.
vii) Recuérdese que un valor propio de una matriz A ∈ Mn (K) es una constante λ ∈ K
en el cuerpo tal que existe un vector no nulo v ∈ V \ {0} tal que Av = λv, donde v se
ha escrito como columna. Pruébese que si p ∈ K[X] es un polinomio, se verifica:
p(A)v = p(λ)v.
Conclúyase que si λ ∈ K es valor propio de A, entonces p(λ) = 0 para todo polinomio
p ∈ AnnK[X] (A). Es decir, pruébese que los valores propios de una matriz cuadrada
son la raı́ces de su polinomio mı́nimo y que, por el apartado precendente, el número
de valores propios distintos de una matriz cuadrada A ∈ Mn (K) en un cuerpo K no
puede exceder n2 .
Problema 76. Hágase el mismo análisis que en el problema precedente considerando el anillo
no conmutativo con unidad EndK (V ) en lugar de Mn (K). Conclúyase que el número de valores
propios distintos de un endomorfismo es finito. ( Hint: Usando la estructura de K[X]−módulo
de V descrita en el Ejemplo 2.2.4 precedente, obsérvese que para cada endomorfismo ϕ ∈
EndK (V ), cada polinomio p ∈ K[X] y cada base ordenada B de V , se tiene que:
MB (p(ϕ)) = p(MB (ϕ)).)
Problema 77. Sea R un anillo, a un ideal de R y M un R−módulo. Sea aM el submódulo
producto de a por M . Sea M/aM el R−módulo cociente. Probad que la siguiente correspon-
dencia:
·R/a : (R/a) × (M/aM ) −→ (M/aM )
(x + a, m + aM ) 7−→ xm + aM,
define una estructura de R/a−módulo sobre M/aM .
Problema 78 (Subespacios invariantes de un endomorfismo). Sea V un espacio vectorial
de dimensión finita sobre un cuerpo K y sea ϕ : V −→ V un endomorfismo. Consideremos la
estructura de K[X]−módulo inducida en V por el enfomorfismo ϕ: (V, +, ·K[X] ). Recuérdese
que un subespacio vectorial W de V se denomina ϕ−invariante sii ϕ(W ) ⊆ W . Pruébese que
son equivalentes para cada subespacio W de V :
i) El subespacio W es ϕ−invariante.
ii) W es un submódulo de V visto como K[X]−módulo.
Problema 79 (Cuerpos de Galois). Se denominan cuerpos de Galois a los cuerpos finitos
y para un cuerpo de cardinal q el cuerpo de Galois de cardinal q se denota mediante GFq o
simplemente mediante Fq . Se pide:
i) Pruébese que si un cuerpo K es finito tiene que tener caracterı́stica no nula y, por
tanto, existe un único primo p ∈ N no nulo tal que Fp ⊆ K.
ii) Pruébese que si un cuerpo K es finito de ceracterı́stica p, entonces la extensión de
cuepos Fp ⊆ K es finita (o, equivalentemente, pruébese que [K : Fp ] < +∞ o,
equivalentemente, K es un Fp − espacio vectorial de dimensión finita).
iii) Conclúyase que si K es un cuerpo finito, entonces existe un primo p ∈ N no nulo y
existe n ∈ N tal que su cardinal satisface ](K) = pn . Equivalentemente, conclúyase
que los únicos cuerpos de Galois posibles están son de la forma Fq con q = pn .
iv) Pruébese que no todos los cuerpos de caracterı́stica positiva son finitos ( Hint: Muestra
un ejemplo.)
v) Pruébese que para cualquier primo no nulo p ∈ N y para cualquier n ∈ N existe un
cuerpo de Galois Fpn ( Hint: Revisad los Apuntes de la asignatura “Teorı́a de Galois”
que precede a este curso.)
Problema 80. Consideremos el ideal a := 3Z del anillo Z y el Z−módulo M = Z6 . Probad
que el Z/3Z−módulo M/aM es el espacio vectorial sobre Z/3Z dado como (Z/3Z)6 .
2.2. MÓDULOS, SUBMÓDULOS, MORFISMOS DE MÓDULOS 107

Problema 81 (Caracterización del producto mediante propiedad universal). Probad


que el producto de R−módulos verifica la siguiente propiedad universal: Q
Sea {Mi : i ∈ I} una familia de R−módulos.
Q Para cada i ∈ I, sea πi : i∈I Mi −→ Mi la
proyección canónica. Entonces, el par ( i∈I Mi , {πi : i ∈ I}) verifica que
Dado cualquier otro par (N, {ϕi : N −→ Mi : i ∈ I}), donde N es un R−módulo y
ϕi ∈ HomQ R (N, Mi ) para cada i ∈ I, entonces existe un único morfismo de R−módulos f ∈
HomR (N, i∈I Mi ) tal que
πi ◦ f = ϕi , ∀i ∈ I.
Q
Probad que la anterior propiedad caracteriza de manera única (salvo isomorfismo) a i∈I Mi .
Problema 82 (Caracterización del co-producto mediante propiedad universal). Probad
que el co-producto de R−módulos verifica la siguiente propiedad universal: `
Sea {Mi : i ∈ I} una familia de R−módulos.
` Para cada i ∈ I, sea λi : Mi ,→ i∈I Mi la
inmersión canónica. Entonces, El par ( i∈I Mi , {λi : i ∈ I}) verifica que
Dado cualquier otro par (N, {ϕi : Mi −→ N : i ∈ I}), donde N es un R−módulo y
ϕi ∈ Hom `R (Mi , N ) para cada i ∈ I, entonces existe un único morfismo de R−módulos f ∈
HomR y( i∈I Mi , N ) tal que
f ◦ λi = ϕi , ∀i ∈ I.
`
Prueba que la anterior propiedad caracteriza de manera única (salvo
` isomorfismo) a i∈I Mi .
Cuando se hablar de R−módulos, la notación del co-producto se reemplaza por ⊕ y se
denomina suma directa. En este curso, por tanto, escribiremos :
a
⊕i∈I Mi := Mi .
i∈I

Problema 83. Completa los detalles de la prueba de la Proposición 2.2.36. ( Hint: Puedes
ayudarte de las caracterizaciones de producto y co-producto de módulos descritas en los dos
problemas precedentes).
Problema 84. Probad la siguiente variante del algoritmo de la división de Euclides:
Dados a, b ∈ N dos enteros positivos no nulos, existe q, r ∈ Z tales que:
i) a = qb + r,
ii) 0 ≤ |r| ≤ b/2.
Problema 85 (Morfismos de anillos y estructuras de anillos como R−módulos). Se
trata de probar que para dos anillos R y B, los morfismos de anillos entre R y B y las estructuras
de R−módulo sobre B que satisfacen la ropiedad (2.2.2) están identificadas. Definamos los
siguientes conjuntos:
i) El conjunto de todos los morfismos de anillo entre R y B:
M orf (R, B) := {f : R −→ B : h es morfismo de anillos}.
ii) El conjunto de todas las posibles estructuras de R−módulo sobre B que satisfacen
(2.2.2):
R−M od(B) := {∗R : R×B −→ B : B es R−módulo con la operación ∗R y satisface (2.2.2)}.
Definamos la transformación:
Φ : M orf (R, B) −→ R − M od(R, B)
f 7−→ ∗f ,
donde ∗f es la operación definida por la Identidad (85) de la lista de ejemplos dada en Ejemplo
2.2.2. Pruébese que Φ es una biyección entre esos dos conjuntos y, por tanto, que morfismos
entre anillos R y B es lo mismo que considerar estruturas de R−módulo sobre B que se portan
bien con respecto al producto de B. Las notaciones M orf (R, B) y R − M od(B) no se volverán
a usar y sólo sirven para clarificar la noción de R−álgebra.
Pruébese, finalmente, que:
Una R−álgebra es un anillo (A, +, ·) que posee una estructura de R−módulo (A, +, ·R ) y que
satisface la Identidad (2.2.1)
108 2. MÓDULOS, DETERMINANTES, HAMILTON-CAYLEY

Problema 86. Sea f : S −→ R un morfismo de anillos. Probad que si (M, +, ·R ) es un


R−módulo, la siguiente operación “externa”:
·S : S × M −→ M
(s, m) 7−→ f (s) ·R m
define una estructura de S−módulo sobre M .
Dados M y N dos R−módulos y dado ϕ : M −→ N un morfismo de R−módulos entre M
y N (i.e. ϕ ∈ HomR (M, N )), pruébese que, entonces, ϕ ∈ HomS (M, N ), donde suponemos
en M y en N las respectivas estructuras de S−módulos definidas por el morfismo de anillos
f : S −→ R. En particular, se define un monomorfismo de grupos y S−módulos
HomR (M, N ) ,−→ HomS (M, N ).
Verifica esta última afirmación.
Problema 87. Prueba la Proposición 2.2.32.
Problema 88. Prueba la Proposición 2.2.38. En particular, prueba los siguientes hechos,
relatios a las dos últimas propiedades de esa proposición:
i) Probad que si {Mi : i ∈ I} es una familia cualquiera de R−módulos libres, el
co-producto o suma directa ⊕i∈I Mi tambiés es un R−módulo libre. En particular,
muestra cómo construir una base de ⊕i∈I Mi a partir de una familia {Bi : i ∈ I} de
tal modo que Bi es base de Mi .
ii) Probad que si {MQ 1 , . . . , Mr } es una familia cualquiera de R−módulos libres, el pro-
r
ducto cartesiano i=1 Mi tambiés Qr es un R−módulo libre. En particular, muestra
cómo construir una base de i=1 Mi a partir de una familia {Bi : 1 ≤ i ≤ r} de tal
modo que Bi es base de MQ i.
iii) Reflexiona si el producto i∈I Mi de una familia cualquiera de R−módulos libres
{Mi : i ∈ I} es R−módulo Q libre. (Hint: pensar en el anillo de series de potencials
formales Z[[X]] = ZN = N Z, también conocido como grupo de Baer-Specker. Buscad
en la web, por ejemplo en https: // wildtopology. wordpress. com/ 2014/ 07/ 02/
the-baer-specker-group/ . Explicad lo que se entienda de la prueba.)
Problema 89. Probad las afirmaciones de la Proposición 2.2.43.
Problema 90. Sea N un R−módulo y X un conjunto. Consideremos el conjunto N X de las
aplicaciones de X en el R−módulo N y la operación suma que hace de él un grupo abeliano
(N X , +). Probad que la siguiente es una operación externa:
·R : R × N X −→ NX
(λ, σ) 7−→ λσ : X −→ N,
donde
λσ : X −→ N
x 7−→ λ ·R σ(x).
Probad adicionalmente que
i) (N X , +, ·R ) es un R−módulo.
ii) Para cada R−módulo libre M , de base X, y para cada R−módulo N cualquiera, los
siguientes R−módulos son isomorfos:
HomR (⊕X R, N ) ∼
= NX.
Problema 91 (La filtración p−ádica sobre un anillo R). En este problema estudiaremos
la métrica definida en un anillo R, mediante la filtración p−ádica definida por un ideal p sobre
R. Esta filtración viene dada por la cadena descende de ideales de R siguiente:
R ⊇ p ⊇ p2 ⊇ p3 ⊇ · · · ⊇ pn ⊇ · · ·
i) Probad que la siguiente es una topologı́a sobre R:
T := {U ⊆ R : ∀x ∈ U, ∃n ∈ N, x + pn ⊆ U },
donde x + pn := {x + y : y ∈ pn }.
2.2. MÓDULOS, SUBMÓDULOS, MORFISMOS DE MÓDULOS 109

ii) Probad que en el espacio topológio (R, T ) las siguientes son aplicaciones continuas:
−: R×R −→ R
(a, b) 7−→ a + (−b).
×: R×R −→ R
(a, b) 7−→ a · b.
iii) Probad que la siguiente es una base de entornos de 0 ∈ R para la topologı́a T :
{pn : n ∈ N}.
Probad, asimismo, que la siguiente es una base de entornos de cualquier punto x ∈ R:
{x + pn : n ∈ N}.
iv) Supongamos que la filtración p−ádica verifica la siguiente propiedad:
\
(2.2.3) pn = (0).
n∈N

Probad que la siguiente función (llamada la función de orden de un punto x ∈ R con


respecto a la filtración p−ádica) está bien definida:
ordp : R −→ R ∪ {+∞}
x 7−→ ordp (x) := max{k ∈ N : x ∈ pk },
donde se sobre-entiende que ordp (0) = +∞.
v) Con la hipótesis (2.2.3) del ı́tem anterior, probad que la siguiente aplicación está bien
definida:
| · |p : R −→ R
x 7−→ |x|p := eord1p (x) ,
donde se sobre-entiende que |0|p = 0 y e ∈ R es una constante e > 1 fija. Probad
que esta apicación, llamada valor absoluto p−ádico sobre R, satisface las propiedades
siguientes:
• Es positiva: |x|p ≥ 0, ∀x ∈ R,
• Sólo se anula en x = 0, es decir |x|p = 0 ⇐⇒ x = 0.
• Se porta bien para el producto en el anillo R:
∀x, y ∈ R, |x · y|p ≤ |x|p |y|p .
• Verifica la desigualdad triangular fuerte sobre R, es decir,
∀x, y ∈ R, |x + y|p ≤ max{|x|p , |y|p }.
Se dice que | · |p es un valor absoluto no arquimediano sobre R.
vi) Concluid que la topologı́a definida por la filtración p−ádica sobre R (con la hipótesis
(2.2.3)) es una topologı́a metrizable. Es decir, hay que probar que la siguiente es una
métrica (i.e. distancia) sobre R:
distp : R × R −→ R
(x, y) 7−→ distp (x, y) := |x − y|p .
Probad que si B p (x, ε) es la bola cerrada de centro x ∈ R y radio ε > 0 sobre R con
respecto a la distancia distp , entonces,
1
) = x + pn .
B p (x,
en
Concluir que la topologı́a definida por la métrica distp coincide con la topologı́a T
descrita anteriormente.
Problema 92 (Las métricas p−ádicas sobre Q). Consideremos el anillo Z y el ideal p := pZ,
definido por un elemento primo p ∈ N, p 6= 0. Denotemos por ordp a la función de orden ordp
definida por el ideal p y para cada x ∈ Z, denotemos mediante | · |p el valor absoluto p−ádico
sobre Z definido mediante la igualdad siguiente:
1
|x|p := ord (x) .
p p
110 2. MÓDULOS, DETERMINANTES, HAMILTON-CAYLEY

Pruébese que en Z, el ideal primo p verifica la propiedad (2.2.3) del Problema anterior. Exten-
damos esta métrica al cuerpo Q mediante:
| · |p : Q −→ R
x |x|p
y 7−→ | xy |p := |y|p .

Se pide probar las afirmaciones siguientes:


i) La función | · |p está bien definida y es un valor absoluto no arquimediano sobre Q
(que se denomina valor absoluto p−ádico sobre Q. Esto es, | · |p verifica las siguientes
propiedades:
• Es positiva: |x|p ≥ 0, ∀x ∈ Q,
• Sólo se anula en x = 0, es decir |x|p = 0 ⇐⇒ x = 0.
• Se porta bien para el producto en el cuerpo Q:
∀x, y ∈ Q, |x · y|p = |x|p |y|p .
• Verifica la desigualdad triangular fuerte sobre Q, es decir,
∀x, y ∈ Q, |x + y|p ≤ max{|x|p , |y|p }.
ii) La función distancia que induce es una métrica sobre Q. Es decir, la siguiente función
es una métrica sobre Q:
distp : Q × Q −→ R
(x, y) 7−→ distp (x, y) := |x − y|p .
Probad, asimismo, que si B p (x, ε) es la bola cerrada de centro x ∈ Q y radio ε > 0
sobre Q con respecto a la distancia distp , entonces,
a
B p (0, 1) = ZpZ := { ∈ Q : p - b}.
b
Probad que esta bola es un subanillo del cuerpo de números racionales (llamado loca-
lización de Z en pZ . Pruébese que los siguientes son ideales en ZpZ y hay que hallar
generadores para ellos:
1
B p (0, n ).
p
Conclúyase que la cadena de bolas siguiente:
1 1
B p (0, 1) ⊇ B p (0, n ) ⊇ · · · ⊇ B p (0, n ) ⊇ · · ·
p p
es una filtración q−ádica sobre ZpZ y detectad el ideal.
iii) Fórmula del producto de Weil: Denotemos mediante | · |0 : Q −→ R, el valor absoluto
usual sobre Q. Probad la siguiente igualdad, conocida como Fórmula del producto de
Weil,:  
Y
 |x|p  |x|0 = 1, ∀x ∈ Q.
p∈N, p ≥ 1 es primo
Nótese que hay que probar que este producto es finito antes de poder probar la igualdad.
iv) Buscad en internet referencias relativas al completado del espacio métrico (Q, distp ),
conocido como cuerpo de los números p−ádicos Qp .
Problema 93. Sea K un cuerpo, K[[X]] el anillo de series de potencias formales y m := (X)
el ideal generado por la serie X. Consideremos la filtración m−ádica sobre K[[X]] y sean ord0 y
|·|X respectivamente las funciones de orden y el valor absoluto definidos por este ideal m = (X).
Pruébese que, efectivamente la función de orden y el valor absoluto están bien definidos y
verifican las propiedades adecuadas4. Sea distX la distancia asociada al valor absoluto | · |X .
Probar la equivalencia entre las siguientes propiedades para cualesquiera series f, g ∈ K[[X]]:
i) ord0 (f − g) ≥ k,
ii) |f − g|X ≤ e1k ,
iii) distX (f, g) ≤ e1k ,

4Por lo visto en problemas anteriores, basta con ver que ∩∞ mn = (0) en K[[X]]
n=0
2.3. DETERMINANTE. TEOREMA DE HAMILTON-CAYLEY 111

iv) Si las siguientes son las expensiones como series de Taylor de f y g:


X∞ ∞
X
i
f := ai X , g= bi X i ,
i=0 i=0
Entonces, ai = bi , para todo i ∈ N. 0 ≤ i ≤ k.
Reflexionad sobre la relación entre esta noción de orden ord0 y la introducida en el curso de
variable compleja (orden como cero de f − g). Reflexionad sobre el significado de la métrica
m−ádica en K[[X]].
Problema 94. Pruébese la Ley Modular para submódulos de un R−módulo. Pruébese también
que si a es un ideal de un anillo R y N1 , N2 son dos submódulos de un R−módulo M , entonces
se verifica la distributiva siguiente:
a (N1 + N2 ) = aN1 + aN2 .
Problema 95. Sean X e Y dos conjuntos del mismo cardinal (i.e. dos conjuntos biyectables).
Pruébese que, entonces, los R−módulos RX y RY son isomorfos. Pruébese también que, bajo
las mismas hipótesis, los R−módulos ⊕X R y ⊕Y R también son isomorfos. Discútase si el
recı́proco es cierto en alguno de los casos.
Problema 96. Si M y N son dos R−módulos libres (de rango finito o infinito), entonces
HomR (M, N ) es también un R−módulo libre de rango finito. Pruébese.
Problema 97 (Propiedades de Extensión y contracción de ideales (I)). Sea f : R −→ B
un morfismo de anillos, a ⊆ R un ideal y b ⊆ B otro ideal. Pruébense las siguientes propiedades
(que constituyen la Proposición 2.2.23 del texto):
c e
i) a ⊆ (ae ) , b ⊇ (bc ) .
e c e e c
ii) a = ((a ) ) , b = ((bc ) ) .
e c

iii) Sea C es el conjunto de las contracciones a R de los ideales de B (i.e. C := {f rakbc :


b ideal en B}). Sea E el conjunto de los ideales de B que son extensión de los ideales
de R (i.e.E := {ae : a ideal en R}). Las siguientes son aplicaciones biyectivas (una
inversa de la otra):
Φ : C −→ E
a 7−→ ae .
Φ−1 : E −→ C
b 7−→ bc .
Problema 98 (Propiedades de Extensión y Contracción de Ideales (II)). Pruébese la
Proposición 2.2.24. Es decir, pruébense las afirmaciones siguientes:
Sea f : R −→ B un morfismo de anillos. Sean a1 y a2 dos ideales del anillo R. Se tiene:
e
i) (a1 + a2 ) = ae1 + ae2 .
e
ii) (a1 ∩ a2 ) ⊆ ae1 ∩ ae2 .
e
iii) (a1 a2 ) = ae1 ae2 .
Búsquese algún ejemplo en el que en la propiedad ii) no se de la igualdad.
Problema 99 (Propiedades de Extensión y Contracción de Ideales (III)). Pruébese
la Proposición 2.2.25. Es decir, pruébense las afirmaciones siguientes:
Sea f : R −→ B un morfismo de anillos. Sean b1 y b2 dos ideales del anillo B. Se tiene:
c
i) (b1 + b2 ) ⊇ bc1 + bc2 .
c
ii) (b1 ∩ b2 ) = bc1 ∩ bc2 .
c
iii) (b1 b2 ) ⊇ bc1 bc2 .
Búsquese ejemplos en los que en las propiedades i) y iii) no se de la igualdad.
2.2.6.2. Futuro: Homologı́a Singular.
2.2.6.3. Futuro: Homotopı́a.
2.2.6.4. Futuro: Co-homologı́a de de Rahm.

2.3. Determinante. Teorema de Hamilton-Cayley


En esta Sección recordaremos algunas propiedades básicas del determinante de matrices con
coordenadas en un anillo.
112 2. MÓDULOS, DETERMINANTES, HAMILTON-CAYLEY

2.3.1. Determinante: propiedades básicas.


Definición 47 (Determinante). Sea R un anillo. El determinante n × n es un polinomio
homogéneo de grado n en n2 variables
det n ∈ R[X1,1 , . . . , X1,n , . . . , Xn,1 , . . . , Xn,n ] = R[Xi,j : 1 ≤ i, j ≤ n},
que viene dado por la siguiente expresión:
X n
Y
det n := I(σ) Xi,σ(i) ,
σ∈Sn i=1

donde I(σ) ∈ {±1} ⊆ R Q (es decir, es el ı́ndice de la permutación cuando −1 6= 1 en R) es el


n
coeficiente del monomio i=1 Xi,σ(i) y el resto de términos tienen coeficiente nulo.
También se denomina determinante a la función polinomial que define det n sobre el R−módulo
Mn (R) de matrices m × n con coordenadas en R:
detn : Mn (R) −→ RQ
P n
A := (ai,j )1≤i,j≤n 7−→ σ∈Sn I(σ) i=1 ai,σ(i) .

Definición 48 (Permanente). Se llama permanente a la función


Permn : Mn (R) −→ P QRn
A := (ai,j )1≤i,j≤n 7−→ σ∈Sn i=1 ai,σ(i) .

Observación 2.3.1. Usualmente se omite el sub-ı́ndice n de detn y de Permn , que se sobre-


entiende por el contexto. Nosotros lo omitiremos salvo que sea explı́citamente necesario indi-
carlo.
Observamos también que tanto el determinante como el permanente son polinomios homogéneos
de grado n (recordar Problema 60). Entonces para cada matriz A ∈ Mn (R) y para cada λ ∈ R
se tiene:
det(λA) = λn det(A),
y
Perm(λA) = λn Perm(A),
donde λA es la multiplicación de λ ∈ R por la matriz A del R−módulo Mn (R).

Proposición 2.3.2. Si una matriz M ∈ Mn (R) es tal que posee una fila idénticamente nula
(i.e. todas sus coordenadas en esa fila son 0 ∈ R), entonces
det(M ) = 0, Perm(M ) = 0.
Demostración. Obvio por la propia definición de ambas funciones. En cada término
de la suma aparece un producto de elementos. En cada uno de esos productos aparece una
coordenada de cada fila. Al haber un 0 en cada uno de los productos, todos los productos son
nulos y, en consecuencia, la suma de todos ellos es nula. 

Definición 49 (Función multi-lineal). Sean M1 , . . . , Mn , T una lista finita de R−módulos.


Una función
f : M1 × · · · × Mn −→ T,
se denomina multi-lineal si es morfismo de R−módulos en cada grupo de variables separada-
mente. Es decir, si para cada i, 1 ≤ i ≤ n y para cada familia
Y
m := (m1 , . . . , mi−1 , mi+1 , . . . , mn ) ∈ Mj ,
j6=i

la función
f (m1 , . . . , mi−1 , ·, mi+1 , . . . , mn ) : Mi −→ T
v 7−→ f (m1 , . . . , mi−1 , v, mi+1 , . . . , mn ),
es un morfismo de R−módulos.
2.3. DETERMINANTE. TEOREMA DE HAMILTON-CAYLEY 113

Definición 50 (Función multi-lineal alternada). Con las notaciones de la Definición prece-


dente, sea M un R−módulo y supongamos M = M1 = · · · = Mn . Una función multi-lineal
f : M1 × · · · × Mn = M n −→ T,
se denomina alternada si para cada permutación σ ∈ Sn y para cada lista de elementos
(m1 , . . . , mn ) ∈ M n se tiene
f (mσ(1) , . . . , mσ(n) ) = I(σ)f (m1 , . . . , mn ).
La función se llama simétrica si
f (mσ(1) , . . . , mσ(n) ) = f (m1 , . . . , mn ).

Nótese que se llama simétrica cuando su valor no se modifica tras permutar las coordenadas,
mientras que se llama alternada cuando preserva su valor para las permutaciones del subgrupo
alternado An (ver la definición de An en Proposición 2.3.8) y multiplica su valor por (−1) (i.e.
“cambia de signo”) cuando no lo son.

Teorema 2.3.3. Sea R un anillo. Con las notaciones precedentes, se tiene:


i) El determinante es una función multi-lineal alternada:
n
det : Rn × · · · × Rn = (Rn ) −→ R 
v1
(v1 , . . . , vn ) 7−→ det  ...  ,
 

vn
donde  
v1
 .. 
 .  ∈ Mn (R),
vn
es la matriz cuyas filas son los elementos v1 , . . . , vn ∈ Rn .
ii) El permanente Permn es una función multi-lineal simétrica.
iii) Las siguientes funciones son multi-lineales simétricas:
(n)
Sk : Rn −→ R,
donde
(n)
X Y
sk (α1 , . . . , αn ) := αi .
S⊂[n],](S)=k i∈S
Se las denomina funciones simétricas elementales .
Demostración. Probaremos solamente el caso del determinante, las otras afirmaciones se
siguen por un argumento similar (caso del permanente) o son conocidas (caso de las funciones
simétricas elementales). Es bastante sencillo verificar que es multi-lineal: en cada monomio sólo
aparece una variable por fila con lo que, sacándola como factor común, podemos verificar que
es multi-lineal. Esto se verá con más detalle tras la Fórmula de Laplace. Veamos solamente que
es alternada. Para ello, dada σ ∈ Sn una permutación, podemos definir una transformación
entre matrices de Mn (R) consistente en permutar filas. Es decir, dada la matriz
M := (ai,j )1≤i,j≤n ,
definimos la matriz
Mσ := (aσ(i),j )1≤i,j≤n ,
obtenida permutando las filas de M conforme a las reglas que indique σ. Ahora para cada
σ ∈ Sn , consideremos la siguiente biyección de Sn en sı́ mismo
φσ : S n −→ Sn
τ 7−→ τ ◦ σ −1 .
Obsérse que el ı́ndice satisface I(φσ (τ )) = I(σ)I(τ ). Para concluir escribamos la expresión del
determinante:
X Yn X n
Y
det(M ) := I(τ ) ai,τ (i) = I(φσ (ρ)) ai,φσ (ρ)(i) ,
τ ∈Sn i=1 ρ∈Sn i=1
114 2. MÓDULOS, DETERMINANTES, HAMILTON-CAYLEY

donde simplemete hemos usado que φσ es biyectiva. Ahora, reescribiendo el valor de φσ ten-
dremos
 
X n
Y X n
Y
I(σ)I(ρ) ai,(ρ◦σ−1 )(i) = I(σ)  I(ρ) aσ(t),ρ(t)  = I(σ) det(Mσ ),
ρ∈Sn i=1 ρ∈Sn i=t
−1
donde hemos cambiado t = σ (i) en cada producto, concluyendo ası́ la prueba del enunciado.


Para más información sobre las funciones simétricas elementales, véase la Subsección de prob-
lemas 2.3.4.2.

Corolario 2.3.4. Sea A ∈ Mn (R) una matriz, λ ∈ R un elemento del anillo y sea M (λ, i) ∈
Mn (R) la matriz obtenida multiplicando la fila i de M por λ. Entonces,
det(M (λ, i))) = λ det(M ).
Demostración. Es consecuencia inmediata del hecho de ser det multilineal. 

Corolario 2.3.5. Sea A ∈ Mn (R) una matriz, sea ρ ∈ Si una permutación y denotemos
por Aρ ∈ Mn (R) la matriz obtenida de A permutando sus filas mediante ρ. Es decir, si
A := (ai,j )1≤i,j≤n , la matriz Aρ viene dada mediante la siguiente identidad:
Aρ := (aρ(i),j )1≤i,j≤n .
Entonces, se tiene
det(Aρ ) = I(ρ) det(A).
Demostración. Es consecuencia inmediata del hecho de ser det alternada. 

Corolario 2.3.6. El valor del determinante “cambia de signo” si se permutan dos filas. Esto
es, si M 0 ∈ Mn (R) es una matriz obtenida de otra matriz M ∈ Mn (R) tras permutar dos filas,
entonces,
det(M 0 ) = (−1) det(M ).
Demostración. Obvio por la Proposición precedente, dado que intercambiar dos filas es
aplicar una transposición σ = (r s) que tiene ı́ndice (−1). 

Observación 2.3.7. Una forma inmediata de aplicar los resultados precedentes podrı́a ser
también la siguiente reflexión:
Sea R un anillo y supongamos que satisface la siguiente propiedad:
“El número entero 2 ∈ Z no es anulador de ningún elemento de un anillo R como Z−módulo.”
Una forma de interpretar esta propiedad, de modo equivalente, consiste en afirmar que para
cada a ∈ R, si a + a = 0, entonces a = 0.
Con esta propiedad, sea M ∈ Mn (R) una matriz tal que posee dos filas iguales. Supongamos
que las filas idénticas en M son las filas i y j. Definamos M 0 la matriz obtenida al intercambiar
las filas i y j de M . por los resultados precedentes tendremos:
det(M 0 ) = I((i j)) det(M ) = − det(M ).
Pero, obviamente, M 0 = M con lo que tendremos que
det(M ) = − det(M ).
Y nuestra hipótesis sobre R implicará que det(M ) = 0.
Esta propiedad para matrices con coordeanadas en anillos que satisfacen la hipótesis sugerida es
cierta, también, sin la hipótesis sobre la caracterı́stica de R. Es lo que se indica en la siguiente
proposición.

Proposición 2.3.8. Consideremos el morfismo de grupos dado por el ı́ndice de las permuta-
ciones:
I : Sn −→ Z× .
Se verifica:
2.3. DETERMINANTE. TEOREMA DE HAMILTON-CAYLEY 115

i) El núcleo de I, es decir, el conjunto de las permutaciones de orden par, es un subgrupo


normal de Sn . Llamaremos a este grupo el grupo alternado y lo denotaremos por
An ⊆ Sn .
ii) El cardinal de Sn es 2](An ), por ser isomorfos Z× = {±1} y el grupo cociente:
Sn /An .
iii) La siguiente es una biyección entre An y su complementario en Sn :
Φ := Φ1,2 : An −→ Sn \ An ,
σ 7−→ σ ◦ (1 2).
iv) Si Φ es la biyección anterior, el ı́ndice verifica I(Φ(σ)) = −I(σ), ∀σ ∈ An .
v) Para cada matriz A := (ai,j ) ∈ Mn (R), se tiene:
n
! n
!
X Y X Y
det(A) := ai,σ(i) − ai,Φ(σ)(i) .
σ∈An i=1 σ∈An i=1

vi) Si las filas 1 y 2 de una matriz A son iguales, para cada σ ∈ An se tiene que
n
Y n
Y
ai,σ(i) = ai,Φ(σ)(i) .
i=1 i=1

vii) Si una matriz A tiene dos filas iguales, entonces, su determinante verifica det(A) = 0.
Demostración. Se deja como Problema 101. 

Corolario 2.3.9. Sea dada una matriz M ∈ Mn (R) cuya fila i−ésima es dada por el elemento
u ∈ Rn y cuya fila j−ésima es el elemento v ∈ Rn . Sea M 0 la matriz cuyas filas k−ésimas
coinciden con las filas de M para k 6= i y tal que la fila k−ésima de M 0 es u + λv. Entonces,
det(M 0 ) = det(M ).
Demostración. Basta con recordar que det es multi-lineal. Por tanto,
det(M 0 ) = det(M ) + λ det(M 00 ),
donde M 00 es una matriz idéntica a M en todas las filas distintas de la fila i−ésima. pero en
la fila i−ésima M 00 tiene al elemento v ∈ Rn . Por tanto, M 00 tiene dos filas iguales y, por la
Proposición precedente, det(M 00 ) = 0, con lo que concluimos que det(M 0 ) = det(M ). 

Definición 51 (Transpuesta de una matriz). Llamaremos transpuesta de una matriz A y


lo denotaremos mediante At a la matriz obtenida intercambiando filas por columnas en A.

Proposición 2.3.10. Para cada matriz A ∈ Mn (R), se tiene que det(A) = det(At ). Más aún,
sea τ ∈ Sn una permutación de [n] y sean A ∈ Mn (R) una matriz y sea Aτ la matriz obtenida
de A aplicando la permutación τ a las columnas de A. Es decir, Dada A := (ai,j )1≤ij≤n , se
define
Aτ = ar,τ (s) 1≤r,s≤s ∈ Mn (R),


Entonces,
det(Aτ ) = I(τ ) det(A).
Demostración. Para la primera afirmación, baste con notar que la siguiente es una
biyección sobre el grupo simétrico que preserva el ı́ndice:
−1
: Sn −→ Sn
σ 7−→ σ −1 ,
donde σ −1 es la inversa de σ.
Para la segunda apliquemos el argumento a las matrices transpuestas y el Corolario 2.3.5. Más
explı́citamente, observemos que si At es la transpuesta de A y (At )τ es la matriz obtenida desde
la transpuestas de A permutando sus filas conforme a τ , entonces,
(At )τ = (Aτ )t ,
116 2. MÓDULOS, DETERMINANTES, HAMILTON-CAYLEY

Es decir, transposición de Aτ coincide con permutar filas de la transpuesta de A. Entonces,


tenemos
det(Aτ ) = det((Aτ )t ) = det((At )τ ) = I(τ ) det(At ) = I(τ ) det(A).
Lo que prueba la segunda afirmación. 
2.3.2. La Fórmula de Laplace. El objetivo de esta subsección es dar una prueba de-
tallada de la famosa Fórmula de Laplace (también conocida vulgarmente como la fórmula del
desarrollo del determinante por los elementos de una fila o columna). Hemos elegido una de-
mostración muy detallada usando, precisamente, los caminos que prueban, por inducción en n,
que ](Sn ) = n!. Aunque la notación le da un aire complejo, las ideas subyacentes son muy
elementales y toda la dificultad nace del uso de notaciones precisas.

Notación 2.3.11. Sean i, j ∈ [n] y consideremos el conjunto de las permutaciones que trans-
forman i en j, es decir,
Sn (i, j) = {σ ∈ Sn : σ(i) = j}.
Nótese que Sn (n, n) = StabSn (n) es el estabilizador de n por la acción del grupo simétrico Sm
sobre el conjunto [n] := {1, . . . , n}. Estudiaremos estos conjuntos que definen una partición de
Sn como unión disjunta dada del modo siguiente para cada i ∈ [n]:
n
[
Sn = Sn (i, j).
j=1

Consideremos ahora i ∈ [n] y consideremos la siguiente permutación τi,n ∈ Sn :


τi,n := (n n − 1 · · · i + 1 i).
Es decir, la aplicación biyectiva
τi,n : [n] −→ [n],
dada mediante: 
r, si 1 ≤ r ≤ i − 1
τi,n (r) := n, si r = i
r − 1, si i + 1 ≤ r ≤ n

Observamos que τi,n ∈ Sn (i, n) admite la siguiente descomposición como producto de trans-
posiciones:
τi,n = (n n − 1) ◦ (n − 1 n − 2) ◦ · · · ◦ (i + 2 i + 1) ◦ (i + 1 i).
En particular, el ı́ndice de τi,n satisface
n−i n+i
I(τi,n ) = (−1) = (−1) ,
porque n − i y n + i son equivalentes módulo 2Z. En cuanto a su inversa, observamos que

 r, si 1 ≤ r ≤ i − 1
−1
τi,n (r) := r + 1, si i ≤ r ≤ n − 1
i, si r = n

Lema 2.3.12. Con las anteriores notaciones, la siguiente es una biyección para cualesquiera
ı́ndices i, j ∈ [n]:
φi,j : Sn (n, n) −→ Sn (i, j)
−1
σ 7−→ τj,n ◦ σ ◦ τi,n .
Más aún, para cada σ ∈ Sn (n, n) el ı́ndice de φi,j (σ) satisface:
2n−(i+j)
I(φi,j (σ)) = (−1) I(σ) = (−1)i+j I(σ).
Demostración. La igualdad entre los ı́ndices se sigue, obviamente, del valor de los ı́ndices
de τi,n y τj,n . Es decir, por ser morfismo de grupos, el ı́ndice satisface:
−1 2n−(i+j)
I(φi,j (σ)) = I(τj,n )I(σ)I(τi,n ) = I(τj,n )I(σ)I(τi,n ) = (−1) I(σ).
En cuanto al hecho de ser una biyección, baste con observar, en primer lugar, que para todo
σ ∈ Sn (n, n), φi,j (σ) ∈ Sn (i, j). Pero esto es claro, dado que:
−1 −1 −1
φi,j (σ)(i) = τj,n (σ(τi,n (i))) = τj,n (σ(n)) = τj,n (n) = j.
2.3. DETERMINANTE. TEOREMA DE HAMILTON-CAYLEY 117

De otro lado, podemos definir la aplicación:


ψi,j : Sn (i, j) −→ Sn (n, n)
−1
σ 7−→ τj,n ◦ σ ◦ τi,n .
Es fácil verificar que
φi,j ◦ ψi,j = IdS , ψi,j ◦ φi,j = IdS .
n (i,j) n (n,n)

Por tanto, φi,j es una aplicación que posee inversa y la inversa satisface φ−1
i,j = ψi,j y es, por
tanto, biyectiva. 

Lema 2.3.13. Con las anteriores notaciones, la siguiente aplicación es una biyección:
Φ : Sn (n, n) −→ Sn−1
σ 7−→ σ |[n−1] ,
donde σ |[n−1] es la restricción de σ a [n − 1] = {1, 2, . . . , n − 1}. Además, Φ preserva los
ı́ndices, esto es, I(Φ(σ)) = I(σ), ∀σ ∈ Sn .
Demostración. Es obvio, pero incluimos el detalle de la prueba para ayudar al lector en
su convicción. Lo primero que hay que observar es que Φ está bien definida. Es decir, que la
restricción σ |[n−1] es un elemento de Sn−1 . Esto es obvio porque σ ∈ Sn (n, n). Por tanto,
para todo r ∈ [n − 1], σ(r) 6= n y, por tanto, σ(r) ∈ [n − 1], luego se tiene una aplicación
inyectiva:
σ |[n−1] : [n − 1] −→ [n − 1].
Por ser inyectiva y ser [n − 1] de cardinal finito, concluimos que σ |[n−1] es biyectiva y σ |[n−1] ∈
Sn−1 . Que la aplicación Φ es inyectiva se sigue obviamente de su definción. Es decir, dadas
σ, σ 0 ∈ Sn (n, n), si Φ(σ) = Φ(σ 0 ), entonces,
σ(r) = σ |[n−1] (r) = σ 0 |[n−1] (r) = σ 0 (r), ∀r ∈ [n − 1].
Como, además, σ(n) = n y σ 0 (n) = n (porque ambas están en Sn (n, n)), concluimos que σ = σ 0
y que Φ es inyectiva. No es difı́cil verificar que la siguiente aplicación es la inversa de Φ:
Φ−1 : Sn−1 −→ Sn (n, n)
σ 7−→ σ
e,
donde 
σ(r), si 1 ≤ r ≤ n − 1,
σ
e(r) =
n, si r = n.
Para la relación entre los ı́ndices, obsérvese que si τ ∈ Sn−1 es una transposición, entonces
τe ∈ Sn es también una transposición. Además, si σ ∈ Sn−1 admite una descomposición como
composición de transposiciones:
σ = τ1 ◦ τ2 ◦ · · · ◦ τr ,
r
tenemos que I(σ) = (−1) , mientras que
e = τe1 ◦ τe2 ◦ · · · ◦ τer ,
σ
es también una descomposición de σ e como composición de transposiciones, por lo que I(e
σ) =
r
(−1) , y se tiene la afirmación buscada. 

Lema 2.3.14. Sea R un anillo y sea A ∈ Mn (R) una matriz de la forma siguiente:
 
a1,1 a1,2 ··· a1,n−1 a1,n
 a2,1
 a2,2 ··· a2,n−1 a2,n 
 .. ..  .
A :=  . . 
 
an−1,1 an−1,2 · · · an−1,n−1 an−1,n 
0 0 ··· 0 an,n
Entonces,
det(A) = an,n det(An,n ),
118 2. MÓDULOS, DETERMINANTES, HAMILTON-CAYLEY

donde An,n ∈ Mn−1 (R) es la submatriz de A obtenida suprimiendo la fila y la columna


n−ésimas, esto es:
 
a1,1 a1,2 ··· a1,n−1
 a2,1 a2,2 ··· a2,n−1 
An,n :=  .  ∈ Mn−1 (R).
 
.
 .. .. 
an−1,1 an−1,2 · · · an−1,n−1
Demostración. Consideremos la definición del determinante introducida al comienzo de
la sección y tenemos
X Yn
det(A) := I(σ) ai,σ(i) .
σ∈Sn i=1
Usamos la descomposición de Sn siguiente, válida para cada ı́ndice i:
n
[
Sn = Sn (n, j).
j=1

Ésto nos da una descripción del sumatorio anteror mediante:


 
Xn X n
Y
det(A) =  I(σ) ak,σ(k)  .
j=1 σ∈Sn (n,j) k=1

Ahora bien, por la forma de nuestra matriz, an,σ(n) = 0 para cualquier σ ∈ Sn (n, j) cuando
j 6= n. Por tanto, la última igualdad tiene la forma:
X n−1
Y
det(A) = an,n I(σ) ak,σ(k) .
σ∈Sn (n,n) k=1

Ahora procedemos como en el Lema 2.3.13 y esta última identidad puede escribirse también
mediante:  
X n−1
Y
det(A) = an,n  I(σ) a .
k,σ (k)
σ∈Sn (n,n) k=1 [n−1]

Como la restricción a [n − 1] de las permutaciones en Sn (n, n) preserva el ı́ndice, concluimos


inmediatamente
 
X n−1
Y
det(A) = an,n  I(σ 0 ) ak,σ0 (k)  = an,n det(An,n ).
σ 0 ∈Sn−1 k=1

Lema 2.3.15. Sea R un anillo y sea A ∈ Mn (R) una matriz de la forma siguiente:
 
a1,1 ··· a1,i−1 a1,i a1,i+1 ··· a1,n
 a2,1
 · · · a2,i−1 a2,i a2,i+1 ··· a2,n 
A :=  ... ..  .

 .  
an−1,1 · · · an−1,i−1 an−1,i an−1,i+1 · · · an−1,n 
0 ··· 0 an,i 0 ··· 0
Entonces,
det(A) = (−1)n+i an,i det(An,i ),
donde An,i ∈ Mn−1 (R) es la submatriz de A obtenida suprimiendo la fila n−ésima y la columna
i−ésima, esto es:
 
a1,1 ··· a1,i−1 a1,i+1 ··· a1,n
 a2,1 ··· a2,i−1 a2,i+1 ··· a2,n 
An,i :=  . ∈ Mn−1 (R).
 
.
 .. ..

an−1,1 ··· an−1,i−1 an−1,i+1 ··· an−1,n
2.3. DETERMINANTE. TEOREMA DE HAMILTON-CAYLEY 119

−1
Demostración. Para comenzar, consideremos la permutación τ := τi,n definida más ar-
riba. Esto es, la permutación τ : [n] −→ [n] dada mediante la siguiente formulación:

 s, si 1 ≤ s ≤ i − 1
τ (s) := s + 1, si i ≤ s ≤ n − 1
i, si s = n

−1
Sabemos que I(τ ) = I(τn,i ) = I(τn,i ) = (−1)n+i . Consideremos la matriz Aτ obtenida de
nuestra matriz A permutando las columnas de A mediante la permutación τ . Es un mero
ejercicio de comprobación el verificar que:
 
a1,1 ··· a1,i−1 a1,i+1 ··· a1,n a1,i
 a2,1
 ··· a2,i−1 a2,i+1 ··· a2,n a2,i 

τ
  .. ..  .
A := ai,τ (j) 1≤i,j≤n =  . . 
 
an−1,1 · · · an−1,i−1 an−1,i+1 · · · an−1,n an−1,i 
0 ··· 0 0 ··· 0 an,i
Seguidamente, observamos (es una mera verificación), que se tiene la siguiente igualdad:
(Aτ )n,n = An,i ,
donde (Aτ )n,n es la submatriz de Aτ obtenida suprimiendo la fila n y la columna n. Aplicando
el lema precedente tendremos que
det(Aτ ) = an,i det((Aτ )n,n ) = an,i det(An,i ).
Finalmente, aplicando la Proposición 2.3.10, obtenemos que
det(A) = I(τ ) det(Aτ ) = I(τ )an,i det(An,i ) = (−1)n+i an,i det(An,i ),
como se pretende. 

Proposición 2.3.16 (Fórmula de Laplace para la última fila). Sea A := (ai,j )1≤i,j≤n ∈
Mn (R) una matriz con n filas y n columnas y coordenadas en el anillo R. Entonces, se tiene
n
X
det(A) := (−1)n+i an,i det(An,i ),
i=1

donde An,i ∈ Mn−1 (R) es la submatriz de A obtenida eliminando la fila n−ésima y la columna
i−ésima.
Demostración. Consideremos, para cada i, 1 ≤ i ≤ n, las siguientes matrices obtenidas
a partir de la matriz A:
 
a1,1 ··· a1,i−1 a1,i a1,i+1 ··· a1,n
 a2,1
 · · · a2,i−1 a2,i a2,i+1 ··· a2,n 

 .. ..
Ai :=  . .

 . 
an−1,1 · · · an−1,i−1 an−1,i an−1,i+1 ··· an−1,n 
0 ··· 0 an,i 0 ··· 0
Observamos que si en cada matriz Ai suprimimos su n−ésima fila y su i−ésima columna re-
obtenemos la matriz An,i . Esto es,
(Ai )n,i = An,i .
Finalmente, recordamos que det es una función multi-lineal por lo que tendremos que
X n
det(A) = det(Ai ).
i=1
Aplicando los Lemas predentes, concluimos que
 
det(Ai ) := (−1)n+i an,i det (Ai )n,i = (−1)n+i an,i det (An,i ) .
Y tenemos la prueba definitiva:
n
X
det(A) = (−1)n+i an,i det (An,i ) .
i=1
120 2. MÓDULOS, DETERMINANTES, HAMILTON-CAYLEY

Teorema 2.3.17 (Fórmula de Laplace). Sea A = (ai,j )1≤i,j≤n ∈ Mn (R) una matriz cuadrada
con coordenadas en el anillo R. Entonces, para cada i, 1 ≤ i ≤ n, tenemos:
n
X i+j
det(A) := ai,j (−1) det(Ai,j ),
j=1

donde Ai,j ∈ Mn−1 (R) es la matriz obtenida suprimiendo las filas i y j de la matriz A.
Demostración. Comencemos considerando la permutación τ = τi,n ∈ Sn introducida
anteriormente. Es decir, τ : [n] −→ [n] definida mediante:

 r, si 1 ≤ r ≤ i − 1
τ (r) = τi,n (r) := n, si r = i
r − 1, si i + 1 ≤ r ≤ n

Recordemos que el ı́ndice de esta permutación verifica I(τ ) = I(τi,n ) = (−1)n+i . Consideremos
nuestra matriz A := (ai,j )1≤i,j≤n ∈ Mn (R) y consideremos la matriz Aτ obtenida a partir de
la matriz A permutando sus filas conforme a la permutación τ , es decir,
Aτ := (aτ (i),j )1≤i,j≤n .
Observamos la siguiente identidad:
 
a1,1 a1,2 ··· a1,j ··· a1,n
 .. .. 
 . . 
 
ai−1,1
 ai−1,2 ··· ai−1,j ··· ai−1,n 

Aτ := ai+1,1 ai+1,2 ··· ai+1,j ··· ai+1,n 
.
 . ..
 ..

 . 

 an,1 an,2 ··· an,j ··· an,n 
ai,1 ai,2 ··· ai,j ··· ai,n
Ahora, es un ejercicio de simple comprobación el verificar que el resultado de suprimir la fila
n−ésima y la columna j−ésima de la matriz Aτ es una matriz en Mn−1 (R) coincidente con la
submatriz Ai,j de la matriz A original, esto es,
(Aτ )n,j = Ai,j .
Aplicando la Proposición 2.3.16 a la matriz Aτ obtenemos:
X n   Xn
det(Aτ ) = (−1)n+j aτ (n),j det (Aτ )n,j = (−1)n+j ai,j det (Ai,j ) .
j=1 j=1

Finalmente, como el determinante es una función multi-lineal alternada concluimos


 
n
X
det(A) = I(τ ) det(Aτ ) = (−1)n+i  (−1)n+j ai,j det (Ai,j ) .
j=1

Luego
n
X
det(A) = (−1)2n+i+j ai,j det (Ai,j ) ,
j=1
lo que prueba el enunciado. 

Observación 2.3.18. Un resultado idéntico permitirı́a hacer la descripción del determinante a


partir de una columna:
Xn
i+j
det(A) := ai,j (−1) det(Ai,j ),
i=1
simplemente jugando con la matriz transpuesta de una matriz dada. Omitimos esta discusión
por no aportar nada adicional interesante.
2.3. DETERMINANTE. TEOREMA DE HAMILTON-CAYLEY 121

Observación 2.3.19 (La Fórmula de Laplace no es un buen método para el Cálculo del
Determinante de una matriz). Aunque parezca una fórmula que potencialmente pudiera
servir para el cálculo de un determinante de una matriz n × n, la regla de Laplace no es
un buen algoritmo sino una buena presentación teórica del determinante de una matriz que
sirve para disponer de resultados teóricos relevantes sobre el comportamiento del determinante.
La principal dificultad es que, aún desarrollando el determinante por una fila o columna, el
número de operaciones aritméticas requeridas para calcularlo sigue el mismo patrón que el
uso de la definición directa: hay que hacer n! = ](Sn ) multiplicaciones. Nótese que tener
que hacer n! multiplicaciones para el cálculo de un determinante hace virtualmente imposible
calcular el determinante de una matriz de tamaño 100 × 100 ni por el ordenador ordenador más
potentes y rápido del mundo (se necesitarı́an hacer unas 100100 = 10200 operaciones, lo que es
completamente intratable con la informática imaginable (son más operaciones que el número
estimado de partı́culas del universo5). Tomando como ejemplo, la clasificación Top500 de 2018,
uno de los ordenadores más rápido del mundo podrı́a ser aún el ordenador Summit, IBM Power
System AC922 ), capaz de realizar unas 201 · 1015 operaciones (bit) por segundo. El cálculo
del determinante de una matriz 100 × 100 por la Definición o por el método que se sigue de la
Fórmula de Laplace tardarı́a más de 10180 segundos en terminar sus cálculos, lo que equivale a
más de 10160 millones de años.
En el caso de cuerpos, variantes del método original de C.F. Gauss (sean numéricas o exactas)
muestran que se puede triangular una matriz sin cambiar el valor del determinante. Ni este
método de Gauss, ni sus variaciones inmediatas, funcionan de modo adecuado cuando se trata de
cualquier anillo como se muestra en los Problemas 234 y 235. Por esa razón se han desarrollado
algoritmos eficientes para el cálculo con matrices cuyas coordenadas están en un anillo, que
son, ademś, los más eficientes para el cálculo cuando las coordenadas están en un cuerpo (y
sin hacer ningún tipo de pivoteo). Nótese que el famoso polinomio caracterı́stico de una matriz
M ∈ Mn (K) con coordenadas en un cuerpo es un ejemplo de determinante de una matriz cuyas
coordenadas no viven en un cuerpo sino en un anillo (ver la Subsección 2.3.3 siguiente para
las propiedades y definición del polinomio caracterı́stico). Por eso se han desarrollado técnicas
mucho más eficientes para el cálculo exacto del determinante de una matriz con coordenadas
en un anillo. En este curso presentaremos el método de Csanky-Leverrier-Fadeev-Souraiu en
la Subsección 5.4.3.1. Otros algoritmos clásicos de fácil comprensión son los algoritmos como
el propuesto por S.J. Berkowicz en [Berk, 1984] (el caso de los anillos Z y Z[X1 , . . . , Xn ]
está estudiado con precisión en [KrPa, 1996], por ejemplo). Desde entonces, algoritmos muy
eficientes han sido desarrollados. Resulta destacable el algortimo de V. Neiger y C. Pernet en
[NP, 21] que muestran un algoritmo muy eficiente para el cálculo del polinomio caracterı́stico
de una matriz, aunque su exposición resultarı́a excesiva en un curso como este. Una buena
fuente a actividad, donde se exponen los mejores algoritmos en términos de complejidad y
eficacia es el colectivo LinAlg (https://linalg.org/). No entraremos con detalle en estos
aspectos porque no corresponde a un curso como éste, no especialmente orientado al Álgebra
Lineal.

Observación 2.3.20 (Reglas mnemotécnicas revisitadas: Regla de Sarrus). Es inmedi-


ato que la regla de Laplace implica, sobre matruices 2 × 2 la regla usual del determinante de
tales matrices. Desarrollando por la primera fila:
 
a1,1 a1,2
= (−1)1+1 a1,1 det a2,2 + (−1)1+2 a1,2 det a2,1 = a1,1 a2,2 − a1,2 a2,1 .
 
det
a2,1 a2,2
La regla de Sarrus es una regla mnemotécnica debida al matemático francés Pierre Frédéric
Sarrus (1826–1856). Con esta regla son adoctrinados y entrenados los alumnos de Secundaria y
Bachillerato de todo el mundo para el cálculo de los determinantes de matrices 3×3, haciéndola
popular. Es fácil verificar que esa Regla es correcta a partir de la Fórmula de Laplace. Ası́a,

5No es una medida totalmente aceptable ni definitiva, pero podemos destacar una vieja estimación del
famoso divulgador I. Asimov quien estimó (en base a supuestos más que discutibles) que el número de nucleones
y electrones del universo es de unos 2, 2 · 1079 , cantidad que habrı́a que multiplicar por 2 si contamos la materia
oscura. Pero son estimaciones de juego intelectual sin mucho valor
122 2. MÓDULOS, DETERMINANTES, HAMILTON-CAYLEY

dada una matriz genérica 3 × 3:


 
a1,1 a1,2 a1,3
A := a2,1 a2,2 a2,3  ,
a3,1 a3,2 a3,3
aplicando Laplace se tendrá:
det(A) = (−1)1+1 a1,1 det(A1,1 ) + (−1)1+2 a1,2 det (A1,2 ) + (−1)1+3 a1,3 det (A1,3 ) .
Luego:
det(A) = a1,1 (a2,2 a3,3 − a2,3 a3,2 ) − a1,2 (a2,1 a3,3 − a2,3 a3,1 ) + a1,3 (a2,1 a3,2 − a2,2 a3,1 ) .
Reordenando estos 6 términos (i.e. ](S3 ) = 6), agrupando los de coeficiente positivo por un
lado y los de coeficiente negativo por el otro, reobtenemos la mnemotécnica Regla de Sarrus.

Definición 52 (Matrix Adjunta de una dada). Sea A = (ai,j )1≤i,j≤n ∈ Mn (R). Se define
la matriz adjunta de A como la matriz
t
Adj(A) := ((ci,j )1≤i,j≤n ) ∈ Mn (R),
donde
i+j
ci,j = (−1) det(Ai,j ).

Teorema 2.3.21 (Fórmula de Laplace Generalizada). Con las anteriores notaciones, para
cada matriz A = (ai,j )1≤i,j≤n ∈ Mn (R), se tiene:
A · Adj(A) = Adj(A) · A = det(A)Idn ∈ Mn (R),
donde Idn es la matriz identidad n × n.

Demostración. Para probarlo, bastará con que escribamos las dos matrices:
 
a1,1 a1,2 a1,3 · · · a1,n
 a2,1 a2,2 a2,3 · · · a2,n 
 
A :=  a3,1 a3,2 a3,3 · · · a3,n  .
 
 .. .. .. .
.. 
 . . . 
an,1 an,2 an,3 ··· an,n
Por su parte, después de transponer, tenemos
(−1)1+1 det(A1,1 ) (−1)2+1 det(A2,1 ) (−1)n+1 det(An,1 )
 
···
 (−1)1+2 det(A1,2 ) (−1)2+2 det(A2,2 ) ··· (−1)n+2 det(An,2 ) 
1+3
det(A1,3 ) (−1)2+3 det(A2,3 ) (−1)n+3 det(An,3 ) 
 
Adj(A) :=  (−1)
 ··· .
 .. .. .. 
 . . . 
(−1)1+n det(A1,n ) (−1)2+n det(A2,n ) · · · (−1)n+n det(An,n )
Al mutiplicar tendremos AAdj(A) = (di,j )1≤i,j≤n ∈ Mn (R), donde
n
X
di,j = ai,k (−1)k+j det(Aj,k ).
k=1
Ahora, si i = j, tenemos que
n
X
di,i = ai,k (−1)k+j det(Ai,k ) = det(A),
k=1
conforme a la Fórmula de Laplace. En el caso i 6= j, tendremos que
n
X
di,j = ai,k (−1)k+j det(Aj,k ),
k=1
está relacionado con el determinante de una matriz M obtenida del modo siguiente:
• La fila j−ésima de M es la fila i−ésima de A: (ai,1 , ai,2 , . . . , ai,n )
• Las restantes filas de M son las filas de A.
2.3. DETERMINANTE. TEOREMA DE HAMILTON-CAYLEY 123

Obviamente, las matrices Mj,k = Aj,k y, usando la Fórmula de Laplace, obtenemos que
n
X
di,j = ai,k (−1)k+j det(Aj,k ) = det(M ) = 0,
k=1

porque M posee dos filas iguales: la fila i−ésima y la fila j−ésima. Por tanto, se tiene el
resultado enunciado. 
Corolario 2.3.22. Si A ∈ Mn (R) es una matriz tal que det(A) ∈ R× es una unidad de R,
entonces, A es una matriz inversible y, además,
A−1 = det(A)−1 Adj(A) ∈ Mn (R).

El siguiente resultado se expone con una prueba bruta. Una alternativa correcta pasarı́a por
probar la Fórmula de Cauchy-Binet, pero igualmente este resultado resulta incómodo en la
mayorı́a de sus pruebas. Ası́ que he optado por poner la prueba más directa, sin apoyos, a la
espera de disponer de una prueba elegante e igualmente elemental, válida sobre cualquier anillo.
Teorema 2.3.23 (Determinante del producto de matrices). Sean A, B ∈ Mn (R) dos
matrices, entonces
det(AB) = det(A) det(B).
Demostración. Supongamos que las matrices A y B vienen dadas por la igualdad si-
guiente:
A := (ai,j )1≤i,j≤n , B := (bi,j )1≤i,j≤n , AB := (ci,j )1≤i,j≤n ,
donde
n
X
ci,j := ai,k bk,j .
k=1
Con estas notaciones, tendremos:
n n n
!
X Y X Y X
det(AB) = I(σ) ci,σ(i) = I(σ) ai,ki bki ,σ(i) .
σ∈Sn i=1 σ∈Sn i=1 ki =1

Aplicando la distributiva, considerando el conjunto de ı́ndices [n]n := {1, . . . , n}n , podemos


reescribir esta expresión como:
 
X X Yn

det(AB) =  I(σ) ai,ki bki ,σ(i)  .
σ∈Sn (k1 ,...,kn )∈[n]n i=1

Lo que podemos reescribir también mediante:


n
!
X X Y 
(2.3.1) det(AB) = I(σ) ai,ki bki ,σ(i) .
(k1 ,...,kn )∈[n]n σ∈Sn i=1

Para cada ı́ndice (k := k1 , . . . , kn ) ∈ [n]n , denotemos también por k a la aplicación


k: [n] = {1, . . . , n} −→ [n]
i 7−→ ki
Finalmente, denotemos por Mk a la matriz dada por la igualdad siguiente:
Mk := (ai,ki bki ,j )1≤i,j≤n ∈ Mn (R).
La ecuación (2.3.1) puede reescribirse mediante:
X
(2.3.2) det(AB) = det(Mk ).
k∈[n]n

Afirmación. Con estas notaciones, sea k := (k1 , . . . , kn ) ∈ [n]n . Se verifican las propiedades
siguientes.
i) Si existen i, r ∈ [n] tales que i 6= r y ki = kr , entonces det(Mk ) = 0.
ii) En caso contrario, (si ki 6= kr para cada i, r ∈ [n] con i 6= r) la aplicación k ∈ Sn es
una permutación.
124 2. MÓDULOS, DETERMINANTES, HAMILTON-CAYLEY

Demostración de la Afirmación. La afirmación ii) es evidente: si k : [n] −→ [n] es inyectiva,


entonces es biyectiva y k ∈ Sn . Para la primera observación, veamos, por razones didácticas
de modo explı́cito, quién es la matriz Mk :
 
a1,k1 bk1 ,1 a1,k1 bk1 ,2 · · · a1,k1 bk1 ,n
 a2,k2 bk2 ,1 a2,k2 bk2 ,2 · · · a2,k2 bk2 ,n 
Mk =  .
 
.. .. .. ..
 . . . . 
an,kn bkn ,1 an,kn bkn ,2 ··· an,kn bkn ,n
Si fi denota la fila i−ésima de la matriz Mk obseramos que esa fila tiene la forma siguiente:
fi := (ai,ki bki ,1 , · · · , ai,ki bki ,n ) = ai,ki (bki ,1 , · · · , bki ,n ) ∈ Rn .
Denotemos por bi := (bki ,1 , · · · , bki ,n ) ∈ Rn para cada i ∈ [n].
Supogamos i < r, ambos en [n] y consideremos la matriz M gk (i, r) ∈ Mn (R) que tiene por fila
j−ésima a la fila jésima de Mk siempre que j 6= i, j 6= r. Mientras que, en las filas i−ésima
y r−ésima de M gk (i, r) ∈ Mn (R) hemos reemplazado (respectivamente) las filas i−ésima y
r−ésima de Mk respectivamente por bi y br . En otros términos, tomemos la descripción de
gk (i, r) ∈ Mn (R) por filas:
M
 
g1
 .. 
Mk (i, r) =  .  ,
g
gn
donde para cada j ∈ [n], se tiene

 fj si j 6= i, r
gj := bi si j = i,
br si j = r.

Obsérvese que la matriz Mk se obtiene de M gk (i, r) mediante dos pasos de la operación “multi-
plicar una fila por una columna”:
• Primero, multiplicando la fila i−ésima de M gk (i, r) por ai,k ,
i
• para multiplicar después la fila r−ésima de la matriz resultante por ar,kr .
Aplicando dos veces el Corolario 2.3.4, concluimos que
 
det(Mk ) = ai,ki ar,kr det Mgk (i, r) .

Ahora bien, si i < r y si ki = kr se tiene que bi = br y la matriz Mgk (i, r) tendrı́a dos filas

iguales. Aplicando la Proposición 2.3.8 concluiremos que det M
gk (i, r) = 0 y, por tanto, si k
no es inyectiva, concluimos det(Mk ) = 0 como se enuncia en la afirmación.

Para cada permutación ρ ∈ Sn denotemos por Mρ a la matriz


Mρ = M(ρ(1),ρ(2),...,ρ(n)) .
Ası́, mediante la Afirmación precedente, la Igualdad (2.3.2) se convierte en
X
(2.3.3) det(AB) = det(Mρ ).
ρ∈Sn

Más aún, el determinante de las matrices Mρ viene dado por la siguiente identidad:
X n
Y
det(Mρ ) = I(σ) ai,ρ(i) bρ(i),σ(i) .
σ∈Sn i=1
Qn
Sacando el factor común i=1 ai,ρ(i) de todos los sumandos, este determinante también concide
con la siguiente cantidad:
n
! n
!
Y X Y
(2.3.4) det(Mρ ) = ai,ρ(i) I(σ) bρ(i),σ(i) .
i=1 σ∈Sn i=1
2.3. DETERMINANTE. TEOREMA DE HAMILTON-CAYLEY 125

Ahora, sea Bρ la matriz obtenida permutando las filas de B conforme a una permutación
ρ ∈ Sn (como en el Corolario 2.3.5). Como el determinante es una forma multi-lineal alternada
tendremos: !
X Yn
det(Bρ ) = I(σ) bρ(i),σ(i) = I(ρ) det(B).
σ∈Sn i=1
En consecuencia, la Igualdad (2.3.4) se transforma en
n
! n
!
Y Y
(2.3.5) det(Mρ ) = ai,ρ(i) det(Bρ ) = I(ρ) det(B) ai,ρ(i) .
i=1 i=1

Por tanto, la Identidad (2.3.3) se transforma en la siguiente

(2.3.6)  
X n
Y X n
Y
det(AB) = I(ρ) det(B) ai,ρ(i) = det(B)  I(ρ) ai,ρ(i)  = det(B) det(A),
ρ∈Sn i=1 ρ∈Sr i=1

lo que prueba finalmente el resutado buscado porque R es un anillo conmutativo. 


Corolario 2.3.24. Una matriz A ∈ Mn (R) es inversible si y solamente si det(A) ∈ R× es
una unidad de R. En este caso, det(A−1 ) = det(A)−1 ∈ R× y se ha de tener:
A−1 := det(A)−1 Adj(A).
Por último, si A es una matriz inversible, el determinante de la matriz adjunta verifica
det (Adj (A)) = det(A)n−1 .
Demostración. Ya hemos probado una de las implicaciones en el Corolario 2.3.22 ante-
rior. En cuanto a la otra, si A es inversible, entonces, posee inversa y se verifica:
AA−1 = Idn .
Por tanto, det(AA−1 ) = 1 y se satisface:
det(A) det(A−1 ) = det(AA−1 ) = 1,
con lo que det(A) ∈ R× . En cuanto a la matriz adjunta:
det(A) det(Adj(A)) = det(AAdj(A)) = det(A)n det(Idn ) = det(A)n .
Como det(A) es inversible en R, esta igualdad implica det(Adj(A)) = det(A)n−1 y habremos
terminado. 
Corolario 2.3.25 (El determinante es un morfismo de grupos). Sea R un anillo y sea
(R× , ·) el grupo multiplicativo de sus unidades. Definamos el conjunto
GL(n, R) := {A ∈ Mn (R) : det(A) ∈ R× },
el conjunto de las matrices inversibles con coordenadas en R. Se tiene:
i) (GL(n, R), ·), con la operación “producto de matrices”, es un grupo, no necesariamente
abeliano.
ii) La siguiente correspondencia es un morfismo de grupos:
det : (GL(n, R), ·) −→ (R× , ·)
A 7−→ det(A).
iii) El núcleo ker(det) del morfismo det anterior es un subgrupo normal de GL(n, R).
iv) En los casos R = R o R = C los subgrupos de matrices ortogonales y unitarias son
subgrupos del subgrupo normal ker(det) de matrices unimodulares sobre R o C 6.
Demostración. Mero ejercicio de comprobación. 
6Algunos autores prefieren llamar matrices unimodulares sobre un anillo R simplemente a las matrices
inversibles (i.e. a las matrices en GL(n, R)). Personalmente, prefiero distinguir los dos nombres, siendo unas las
matrices inversibles (i.e. las de GL(n, R)) y otras las unimodulares (i.e. las de U nin (R) = det−1 ({1}) = ker(det))
que forman un subgrupo normal de GL(n, R). De todos modos, evitaré abusar de esta terminologı́a en cuanto
sigue.
126 2. MÓDULOS, DETERMINANTES, HAMILTON-CAYLEY

2.3.3. Polinomios con coeficiente matricial y matrices con coordenadas polino-


miales. Teorema de Hamilton-Cayley. La prueba que sigue es un tanto inhabitual. Se
usa la Fórmula de Laplace Generalizada como único ingrediente técnico esencial y se observa la
intervención de matrices de polinomios (Mn (R[X])) actuando sobre Mn (R), gracias a coincidir
con el anillo de polinomios Mn (R)[X] con coeficientes en el anillo Mn (R) (cf. Ejemplo 1.4.4).
El resto es esencialmente lo esperable.
Definición 53 (Polinomio Caracterı́stico). Sea A ∈ Mn (R) una matriz con coordenadas
en un anillo R. Llamaremos polinomio caracterı́stico de A al polinomio dado mediante :
χ (X) := det(XId − A) ∈ R[X].
A n

Lema 2.3.26. Si A ∈ Mn (R) es un matriz cuadrada con n filas y n columnas y coeficientes en


R, entonces χA (X) es un polinomio mónico de grado n y coeficientes en R, es decir,
n−1
X
χ (X) := X n + ai X i ∈ R[X].
A
i=0

Demostración. Por inducción en n. Es claro que se verifica en el caso n = 1. Para n ≥ 2,


tomemos la Fórmula de Laplace. y escribamos
 
X − a1,1 −a1,2 ··· −a1,n
 −a2,1 X − a2,2 · · · −a2,n 
AX := XIdn − A =  .
 
.. .. ..
 . . . 
−an,1 −an,2 ··· X − an,n
Por la Fórmula de Laplace, queda
n
X
(2.3.7) χ (X) = det(XId − a) = (X − a1,1 ) det((AX )1,1 ) +
A n
(−1)1+j a1,j det((AX )1,j ).
j=2

Analicemos las distintas matrices (AX )1,j . Tenemos dos casos:


• Para el caso j = 1, se tiene (AX )1,1 = XIdn−1 − A1,1 con lo que, por hipótesis
inductiva, det((AX )1,1 ) ∈ R[X] es un polinomio mónico de grado n − 1.
• Para j ≥ 2, la matriz (AX )1,j es una matriz que tiene una primera columna en la
que sólo aparecen elementos de R, la fila j también está formada por elementos del
anillo R y, descartando fila j y columna 1 es una matriz en Mn−2 (R[X]) de la forma
XIdn−2 B. Dicho de otra manera:

(AX )1,j = (Ar,s )1≤r,s≤n−1 .


donde Ar,s ∈ R o Ar,s es un polinomio de grado a lo sumo 1 en X. Por tanto,
X n−1
Y
det ((AX )1,j ) I(σ) Ar,σ(r) .
σ∈Sn i=1

En particular, el grado en X verifica:


n−1
Y
degX (det ((AX )1,j )) ≤ max{degX ( Ar,σ(r) ) : σ ∈ Sn−1 }.
i=1

Luego
n−1
X
degX (det ((AX )1,j )) ≤ max{ degX (Ar,σ(r) ) : σ ∈ Sn−1 } ≤ n − 1.
r=1

Por tanto, concluimos que


degX ((X − a1,1 ) det((AX )1,1 )) = n,
2.3. DETERMINANTE. TEOREMA DE HAMILTON-CAYLEY 127

y será un producto de dos polinomios mónicos de grados respectivos 1 y n − 1 por lo que


(X − a1,1 ) det((AX )1,1 ) ∈ R[X] es un polinomio mónico de grado n. Por su parte, el resto de
los términos de la Identidad (2.3.7) verifican:
 
Xn
degX  (−1)1+j a1,j det((AX )1,j ) ≤ max{degX (a1,j det((AX )1,j )) : 2 ≤ j ≤ n} ≤ n − 1.
j=2

Finalmente, χA (X) es la suma de un polinomio mónico de grado n con otro polinomio de grado
a lo sumo n − 1 y, en consecuencia, χA (X) es un polinomio mónico de grado n. 

Comencemos con una sencilla operación del anillo de polinomios R[X] sobre el R−módulo
Mn (R) de las matrices cuadradas con coordenadas en R.
Proposición 2.3.27 (La operación de R[X] sobre Mn (R)). Sea R un anillo y R[X] el anillo
de polinomios en una variable con coeficientes en R. Entonces, podemos definir una aplicación
externa del grupo aditivo (R[X], +) sobre Mn (R) mediante:
·R[X] : R[X] × Mn (R) −→ MP
n (R)
m
(p(X), M ) 7−→ p(M ) := i=0 ai M i ,
Pm
siendo p(X) := i=0 ai X i ∈ R[X].
Esta operación respeta la operación suma del grupo (R[X], +) sobre Mn (R):

∀p, q ∈ R[X], ∀M ∈ Mn (R), (p + q)(M ) = p(M ) + q(M ).


Además, esta operación tiene un buen comportamiento con respecto al producto de polinomios.
Es decir, dados p, q ∈ R[X], dado h ∈ R[X] el producto de ambos polinomios (i.e. h = p · q) y
dada cualquier matriz M ∈ Mn (R), se tiene:
h(M ) = p(M )q(M ) = q(M )p(M ).
Sin embargo, no induce una estructura de R[X]−módulo sobre Mn (R).
Demostración. Es un ejercicio de mera comprobación. 

Vamos a extender esta operación externa a un anillo no conmutativo con unidad, formado
por las matrices con coeficientes en Mn (R). Recordemos que (Mn (R0 ), +, ·) es un anillo no
conmutativo con unidad para cualquier anillo R0 . Si R es un anillo, y R0 = R[X] es el anillo
de polinomios en una variable con coeficientes en R, entonces (Mn (R[X]), +, ·) también es un
anillo, en general no conmutativo, con unidad. Además, como Mn (R0 ) es un R0 −módulo libre,
también podemos concluir que Mn (R[X]) es un R[X]−módulo libre de rango n2 .
Además, como R ⊆ R[X], tenemos un subanillo Mn (R) ⊆ Mn (R[X]). Por tanto, dado p(X) ∈
R[X] y M (X) ∈ Mn (R[X]) tiene sentido considerar las matrices
p(X)M (X) ∈ Mn (R[X]).
Para ser más precisos, si M := (ai,j (X))1≤i,j≤n , estas matrices producto son, en realidad, el
producto de matrices
  
p(X) 0 ··· 0 a1,1 (X) a1,2 (X) . . . a1,n (X)
 0 p(X) · · · 0   a2,1 (X) a2,2 (X) · · · a2,n (X) 
 
p(X)M (X) =  . .

. . . . .
 .. .. ..   .. .. ..
 

0 0 ··· p(X) an,1 (X) an,2 (X) · · · an,n (X)
Podemos escribir:  
p(X) 0 ··· 0
 0 p(X) ··· 0 
(p(X)Idn ) =  . ,
 
.. ..
 .. . . 
0 0 ··· p(X)
y, además, este tipo de matrices diagonales verifica:
p(X)M (X) = (p(X)Idn )M (X) = M (X)(p(X)Idn ).
128 2. MÓDULOS, DETERMINANTES, HAMILTON-CAYLEY

Incluso podemos considerar el conjunto Mn (R)[X] como el conjunto de la forma:


m
X
Mn (R)[X] := {N ∈ Mn (R[X]) : ∃m ∈ N, ∃B0 , . . . , Bm ∈ Mn (R), N = Bk X k },
k=0

donde Bk X k = Bk · (Idn X k ) = (Idn X k ) · Bk en el sentido de lo discutido anteriormente. Nótese


que si p(X) ∈ R[X] es un polinomio sobre R, hemos identificado p(X) con el polinomio sobre
Mn (R) dado mediante p(X)Idn ∈ Mn (R)[X].

Es un sencillo ejercicio probar la siguiente:


Proposición 2.3.28. Con las anteriores notaciones, se tiene:
i) Mn (R)[X] es un subanillo de Mn (R[X]). Es más, Mn (R)[X] es el menor subanillo
de Mn (R[X]) que contiene a Mn (R) y las matrices {Idn X k : k ∈ N}.
ii) Más aún Mn (R)[X] = Mn (R[X]). Es decir, todo elemento M (X) ∈ Mn (R[X])
admite una única representación de la forma
Xm
M (X) = Mk X k ,
k=0
con Mk ∈ Mn (R), Mm 6= 0.
iii) Dados M (X), N (X) ∈ Mn (R)[X] y sea H(X) = M (X)N (X) ∈ Mn (R)[X]. Si tene-
mos ambas matrices dadas por sus coeficientes en Mn (R):
Xm Xn
M (X) := Mi X i , N (X) := Nj X j ,
i=0 j=0

donde Mi , Nj ∈ Mn (R) y si escribimos


m+n
X
H= Ck X k ,
k=0
entonces, podemos escribir
 
X
(2.3.8) Ck :=  M i Nj  .
i+j=k

Observación 2.3.29. Un detalle importante en la proposición anterior es la identidad descrita


en el apartado iii) (Identidad (2.3.8) anterior):
 
X
Ck :=  M i Nj  .
i+j=k

El lector puede acudir al Ejemplo 1.4.4 pra refrescar ideas. Como en el caso del anillo de
polinomios, esta igualdad es consecuencia de aplicar la operación convolución en Mn (R)[X].Es
decir,
m
! n 
n+m
 
X X X X
Mi X i  Nj X j  = M i X i Nj X j  .
 
M (X) · N (X) = 
i=0 j=0 k=0 i+j=k

Por lo discutido anteriormente, las matrices Idn X i conmutan con cualquier matriz en Mn (R[X]),
con lo que tendremos que tal expresión se corresponde con las propiedades distributivas en
Mn (R[X]):
   
X n+m
X X
Mi X i Nj X j  = Mi Nj  X i+j ,
 
M (X) · N (X) =  
i+j=k k=0 i+j=k

lo que da la identidad descrita en (2.3.8). Pero debe tenerse en cuenta que, en esta “con-
volución”, el orden de multiplicación (Mi Nj ) importa, salvo que todas las matrices Mi y Nj
conmuten entre sı́, lo que es un caso excepcional. Es decir, el orden en el que aparecen los
factores en la Identidad (2.3.8) es relevante.
2.3. DETERMINANTE. TEOREMA DE HAMILTON-CAYLEY 129

Proposición 2.3.30 (La operación de Mn (R[X]) sobre Mn (R)). Con las anteriores nota-
ciones, definamos la correspondencia siguiente:
·Mn (R[X]) Mn (R[X])
Pm × Mn (R) −→ MP
n (R)
m
(M := i=0 Mi X i , A) 7−→ M (A) := i=0 Mi Ai .
Se tiene:
i) La anterior correspondencia define una operación externa de Mn (R[X]) sobre Mn (R)
que respeta la suma. Es decir,
∀M, N ∈ Mn (R[X]), ∀A ∈ Mn (R), (M + N )(A) = M (A) + N (A).
ii) Dicha operación extiende la operación externa de R[X] sobre Mn (R) descrita en la
Proposición 2.3.27 anterior: Es decir, dado p(X) ∈ R[X], consideremos p(X)Idn ∈
Mn (R[X]) y sea A ∈ Mn (R), entonces
(p(X)Idn ) ·Mn (R[X]) A = p(A),
donde p(A) es el valor del polinomio p ∈ R[X] en la matriz A ∈ Mn (R) como en la
Proposición 2.3.27 anterior.
Demostración. Ejercicio de comprobación 
Observación 2.3.31. En La Proposición 2.3.27 observamos que la operación de R[X] sobre
Mn (R) se “porta bien” con respecto a la operación producto en R[X]. En esta nueva operación
debemos ser más cuidadosos: se necesita un hipótesis adicional sobre ciertos elementos en
Mn (R) que conmutan para el producto de matrices. Es lo que se destaca en la siguiente
Proposición, que hemos decidido escribir separadamente.

Proposición 2.3.32. Sean M (X), N (X) ∈ Mn (R[X]) y A ∈ Mn (R). Sea H(X) ∈ Mn (R[X])
dado mediante M (X)N (X) = H(X) (producto en Mn (R[X])). Supongamos que:
m
X n
X
M (X) := Mi X i , N (X) := Nj X j ,
i=0 j=0

con Mi , Nj ∈ Mn (R). Supongamos también que A conmuta en Mn (R) con los coeficientes de
N . Es decir, supongamos que
ANj = Nj A, ∀j, 0 ≤ j ≤ n.
Entonces, se veirifica:
H(A) = M (A) · N (A),
donde · es el producto en Mn (R).
Demostración. Daremos una prueba por simplicidad y por su implicación en el Teorema
de Hamilton-Cayley. Tenemos:
m
X n
X
M (X) := Mi X i , N (X) := Nj X j .
i=0 j=0

Luego
m
X n
X
M (A) := Mi Ai , N (A) := Nj Aj .
i=0 j=0
Entonces,
m
! n

m+n
 
X X X X
M (A)N (A) = M i Ai  Nj Aj  =  M i Ai Nj Aj  .
i=0 j=0 k=0 i+j=k

Usando el hecho de que ANj = Nj A y la distributiva del producto en Mn (R), concluiremos:


 
m
X X
M (A)N (A) =  Mi Nj  Ai+j = H(A).
k=0 i+j=k


130 2. MÓDULOS, DETERMINANTES, HAMILTON-CAYLEY

Teorema 2.3.33 (Teorema de Hamilton-Cayley). Con las anteriores notaciones, sea n ≥


1 un entero positivo, R un anillo y A ∈ Mn (R) una matriz n × n con coordenadas en R.
Sea χA (X) ∈ R[X] en polinomio caracterı́stico de A (conforme a la Definición 53 anterior).
Entonces,
χ (A) = 0, en Mn (R).
A

Demostración. Apliquemos la Fórmula de Laplace Generalizada (ver Teorema 2.3.21


anterior). Consideremos en anillo R0 := R[X], y sea AX la matriz en Mn (R[X]) dada mediante:
AX := (XIdn − A) ∈ Mn (R0 ).
Sea Adj(AX ) la matriz adjunta de AX en Mn (R[X]). Por la Fórmula de Laplace Generalizada
tendremos la siguiente igualdad en Mn (R[X]):
(2.3.9) Adj(AX )AX = Adj(XIdn − A)(XIdn − A) = χA (X)Idn .
Apliquemos ahora la Proposición 2.3.32 precedente. Tenemos, dos matrices en Mn (R)[X] que
podemos denotar por
n−1
X
M (X) = Adj(AX ) := Bi X i , N (X) := Idn X − A.
i=0
Los coeficientes de N (X) son precisamente la matriz identidad Idn y la matriz (−A). Clara-
mente, A conmuta con los coeficientes (en Mn (R)) de N (X). Por tanto, si H(X) = M (X)N (X)
se tendrá:
H(A) = M (A)N (A).
Ahora bien, N (A) = Idn A − A = 0, luego M (A) = 0 en Mn (R). Pero, además, obsérvese que
H(X) = χA (X)Idn ,
con lo que
H(A) = χA (A),
y tendremos que
χ (A) = 0,
A
como querı́amos demostrar. 

Corolario 2.3.34. Sea R un anillo conmutativo con unidad, A ∈ Mn (R) una matriz y sea
N ⊆ Mn (R) el submódulo (como R−módulo) generado por todas las potencias de la matriz A:
N := Rh{An : n ∈ N}i.
Entonces, N es un R−módulo finitamente generado.
Demostración. Usando el Teorema de la División Euclı́dea por polinomios mónicos (Teo-
rema 1.4.15), usando que el polinomio caracterı́stico χA (X) ∈ R[X] es mónico de grado n, es
fácil concluir que para cualquier polinomio q(X) ∈ R[X], existe un polinomio r(X) ∈ R[X] de
grado a lo sumo n − 1 tal que q(A) = r(A). Esto permite concluir que
N := Rh{A0 , A1 , . . . , An−1 }i,
y N será un R−módulo finitamente generado. 

Corolario 2.3.35. Sea K un cuerpo y K ⊆ L una extensión de cuerpos (o, equivalentemente,


L es cuerpo y K es subcuerpo de L). Sea A ∈ Mn (K) una matriz con coordenadas en K.
Entonces, el número de valores propios de A en L está acotado por n y es, por tanto, un
número finito.
Demostración. La primera observación, conocida de cursos previos de Álgebra Lineal,
es que los valores propios de A en L son raı́ces del polinomio caracterı́stico de A. Esto es, si
λ ∈ L es un valor propio de A en L, entonces existe v ∈ Ln no nulo tal que
Av = λv.
Es fácil de verificar que, para cualquier polinomio p ∈ L[X], se tiene:
p(A)v = p(λ)v.
2.3. DETERMINANTE. TEOREMA DE HAMILTON-CAYLEY 131

Por tanto, χA (λ) = 0 para cualquier valor propio λ ∈ L de A en L. Todo lo que resta por ver
es que el número de raı́ces de un polinomio no nulo en un cuerpo es finito. Para ello, baste con
revisar la resolución del Problema 57. 

2.3.4. Ejercicios y problemas de la Sección 2.3.


Problema 100. Búsquese información relativa a la relación entre la evaluación del permanente
de una matriz y el estudio del Matching problem en grafos. Resume y explica la información
obtenida.
Problema 101. Prueba la Proposición 2.3.8.
Problema 102. Probad las siguientes propiedades de las matrices transpuestas:
i) (At )t = A,
ii) (A + B)t = At + B t ,
iii) (AB)t = B t At ,
iv) (λA)t = λ(A)t , ∀λ ∈ R, A ∈ Mn (R).
Problema 103. Sea R un dominio de integridad. Probad que si A ∈ Mn (R) es una matriz y
χ (X) ∈ R[X] es su polinomio caracterı́stico, el término independiente de χ (X) (i.e. χ (0) ∈
A A A
R) se relaciona con det(A) del modo siguiente:
χ (0) := (−1)n det(A).
A

Más aún, supongamos que el polinomo caracterı́stico χA (X) tiene la forma siguiente:
χ (X) := X n + an−1 X n−1 + · · · + a1 X + a0 ∈ R[X].
A

Supongamos det(A) 6= 0. Pruébese que, entonces, la matriz adjunta de A (construida como en


52) verifica:
 
Adj(A) = (−1)n+1 An−1 + an−1 An−2 + · · · + a1 Idn .

Problema 104. Sea R un anillo y A ∈ Mn (R). Definamos el conjunto siguiente:


AnnR[X] (A) := {p ∈ R[X] : p(A) = 0}.
Probad:
i) AnnR[X] (A) es un ideal de R[X], llamado el anulador de A.
ii) AnnR[X] (A) es un ideal no trivial que contiene un polinomio con coeficiente director
unitario (unidad en R× ).
iii) ¿Es AnnR[X] (A) un ideal principal en R[X]?. Intentar demostrarlo si R = K es un
cuerpo o si R = Z. √
iv) Consideremos el dominio de integridad R = Z[ 3 16] dado mediante:
√ √ √
R = Z[ 16] := {a + b 16 + c( 16)2 : a, b, c ∈ Z}.
3 3 3

Pruébese que la siguiente matriz A ∈ M3 (R)


 √
3

√0 2 16
A :=  2 3 16 √0 4 ,
3
4 16 0
• El polinomio caracterı́stico χA (X) ∈ R[X] es un polinomo mónico de grado 3.
Hallarlo.
• La matriz verifica que f ∈ AnnR[X] (A), donde f es el polinomio
√ √
f (X) := 2X 2 − ( 16)2 X − 16( 16) ∈ R[X].
3 3

Probad que no hay ningún polinomio mónico de grado 2 que se anule en A.


• Deducid que AnnR[X] (A) no siempre es un ideal principal en R[X], ni siquiera
cuando R es dominio.
Problema 105. Explica por qué la operación definida por (R[X], +) sobre Mn (R) (en la
Proposición 2.3.27), no define una estructura de R[X]−módulo sobre Mn (R)
132 2. MÓDULOS, DETERMINANTES, HAMILTON-CAYLEY

Problema 106. Igualmente al caso del Problema anterior, explica las dificultades que ves en
la operación del grupo aditivo (Mn (R[X]), +) sobre Mn (R) (según las Proposiciones 2.3.30 y
2.3.32) para que Mn (R) fuera un Mn (R[X])−módulo.

Problema 107. Revisa todas las pruebas de la Sección sobre el determinante (Sección 2.3) y
detecta las erratas que encuentres.

Problema 108. Sea K = Fq un cuerpo finito de caracterı́stica p ∈ N. Considera la matriz


siguiente:
 
1 1 ··· 1
1 1 · · · 1
1 :=  . ..  ∈ Mp (K),
 
 .. .
1 1 1··· 1
donde p es la caracterı́stica del cuerpo. Se pide:
i) Verifica que la matriz 1 ∈ Mp (K) es una matriz simétrica.
ii) Prueba que el polinomio mı́nimo de la matriz 1 es el polinomio m(X) = X 2 ∈ K[X].
Es decir, verifica que

AnnK[X] (A) = (X 2 ) ⊆ K[X].

iii) Prueba que el polinomio caracterı́stico de esta matriz es χ1 (X) = X p ∈ K[X].


iv) Prueba que el orden en 0 del polinomio caracterı́stico no coincide con el rango del
núcleo de la aplicación lineal definida por 1. Es decir,

dimK (ker(A)) 6= ord0 (χ1 (X)).

v) Concluye que la matriz 1 no es diagonalizable sobre ninguna clausura algebraica de


K.
vi) Prueba que la matriz 1 es semejante a la matriz
 
0 0 0 ··· 0
1 0 0 · · · 0
 
0 0 0 · · · 0
 .
 .. .
. · · · .. 
0 0 0 ··· 0

vii) Concluye que el Teorema Espectral no es, en general, cierto en caracterı́stica posi-
tiva( Hint: Para un “recordatorio” del Teorema Espectral ver:
http: // en. wikipedia. org/ wiki/ Spectral_ theorem . )

2.3.4.1. Complejidad Algebraica en unos ejemplos.

Problema 109 (Multiplicación de números complejos). Prueba que existe un modelo de


cálculo tal que para multiplicar dos números complejos a + bi, c + di ∈ C, basta con hacer tres
multiplicaciones de números reales y algunas operaciones de adición.

Problema 110 (Multiplicación rápida de matrices por el método de V. Strassen). A


finales de los años 60, V. Strassen (cf. [Str, 1969]) sorprendió a la comunidad internacional
con un algoritmo que era capaz de multiplicar dos matrices n × n usando menos de O(n3 ) mul-
tiplicaciones sobre el cuerpo base. Este Problema pretende mostrar la idea de Volker Strassen.
Se trata de probar lo siguiente:
i) Sea R un anillo y sean dadas
   
A B E F
, ∈ M2 (R).
C D G H

Definamos los siguientes elementos de R:


2.3. DETERMINANTE. TEOREMA DE HAMILTON-CAYLEY 133



 s1 := (B − D)(G + H) ∈ R
s := (A + D)(E + H) ∈ R

 2


s3 := (A − C)(E + F ) ∈ R


(2.3.10) s4 := H(A + B) ∈ R
s5 := A(F − H) ∈ R




s6 := D(G − E) ∈ R




s7 := E(C + D) ∈ R

Demuéstrese que se verifica:


     
A B E F s + s2 − s4 + s6 s4 + s5
· = 1
C D G H s6 + s7 s2 − s3 + s5 − s7
donde los elementos s1 a s7 son los calculados mediantes las reglas de las Ecuaciones
(2.3.10).
ii) Extiende, mediante una estrategia de divide y vencerás (Divide and Conquer), el
método de Strassen para multiplicar dos matrices M, N ∈ Mn (R).
iii) Concluye que el producto de matrices n × n puede hacerse con O(7log2 n ) = O(nlog2 (7) )
multiplicaciones (y no en O(n3 ) como en el método tradicional).

Problema 111 (Multiplicación rápida de matrices por el método de S. Winograd).


Prueba la siguiente identidad entre matrices con coordenadas en un anillo (debida a Sh. Wino-
grad), como alternativa al método de V. Strassen anterior.
Dadas matrices a, b, c, d, A, B, C, D ∈ Mt (R). la matriz
  
a b A B
P := ∈ M2t (R),
c d C D
satisface:
 
aA + bC w + (c + d)(B − A) + (a + b − c − d)D
P := ,
w + (a − c)(D − B) − d(A − B − C + D) w + (a − c)(D − B) + (c + d)(B − A)
donde
w = aA − (a − c − d)(A − B + D),
Problema 112 (Inversión de matrices triangulares). Sea R un anillo y sea A ∈ Mn (R)
una matriz triangular inferior. Supongamos que A ∈ GL(n, R). Se pide:
i) Probar que todos los elementos de la diagonal principal de A son unidades en R (i.e.
elementos de R× ).
ii) Supongamos que la matriz A se descompone del modo siguiente:
 
B 0
A := .
C D
Probar que
B −1
 
0
A−1 := .
−D−1 CB −1 D−1
iii) Probar que la inversa de la matriz A puede hacerse mediante un proceso iterativo que
hace a lo sumo O(n3 log2 n) multiplicaciones de elementos de R, usando los inversos
de los elementos de la diagonal principal de A como únicas “divisiones”.
Problema 113 (Resolviendo Sucesiones Recurrentes Lineales.). Sea R un anillo y con-
sideremos una serie de valores dados del modo siguiente :
a1 = b1
a2 = c2,1 a1 + b2
a3 = c3,1 a1 + c3,2 a2 + b3
..
.
an = cn,1 a1 + ··· + cn,n−1 an−1 + bn
Una sucesión recurrente lineal es una sucesión {an }n∈N de elementos del anillo R que se genera
mediante un procedimiento como el anterior. El ejemplo más clásico puede ser la sucesión de
Fibonacci :
134 2. MÓDULOS, DETERMINANTES, HAMILTON-CAYLEY

F1 = 1
F2 = 0F1 + 1
F3 = 1F1 + 1F2 + 0
F4 = 0F1 + 1F2 + 1F3 + 0
..
.
Fn = 0F1 + · · · + 1Fn−2 + 1Fn−1 + 0
Se pide:
i) Probar que si tenemos una sucesión recurrente lineal {an }n∈N de elementos del anillo
R, como las anteriores, entonces existen matrices C ∈ Mn×n (R) y una matriz columna
B tales que    
a1 a1
 ..   .. 
 .  := C  .  + B.
an an
ii) Pruébese que si {an }n∈N es una sucesión recurente lineal de elementos del anillo R,
entonces existe una matriz triangular inferior D ∈ GL(n, R) cuyos elementos de la
diagonal principal son todos 1 y tales que
 
a1
 ..  −1
 .  = D B,
an
donde B es el del item anterior.
iii) Usando el Problema precedente, pruébese que para cada n ∈ N, y para cualquier anillo
R, se pueden calcular los n primeros términos de una sucesión recurrente lineal ha-
ciendo O(n3 log2 n) operaciones aritméticas y ninguna división.
2.3.4.2. Sumas de Newton y Funciones simétricas elementales. Vamos a hacer
una serie de problemas relativos al cálculo con sumas de Newton que, más adelante (cf. Sub-
sección 5.4.3.1), nos servirá para justificar algoritmos eficientes para calcular determinantes y
polinomios caracterı́sticos. Supongamos R un dominio de integridad, K = qf (R) su cuerpo
de francciones (cf. la descripción en el Párrafo 3.2.0.1 del Capı́tulo siguiente) y K la clausura
algebraica de K. Sea
f (T ) := T n + a1 T n−1 + a2 T n−2 + · · · + a0
un polinomio mónico con coeficientes en R. Podemos factorizarlo mediante :
n
Y
f (T ) := (T − αi )
i=1

donde las races αi ∈ K son repetidas con su multiplicidad. Vamos a definir dos tipos de
funciones simétricas de las raı́ces de f . Denotemos por [n] := {1, . . . , n} :
• Las funciones simétricas elementales (cf. Teorema 2.3.3): Son las dadas mediante :
(n)
X Y
sk (α1 , . . . , αn ) := αi .
S⊂[n],](S)=k i∈S

Es conocida la siguiente representación de f a partir de sus raı́ces :


n
X
f (T ) := T n + (−1)k sk (α1 , . . . , αn )T n−k
k=1

En otras palabras,
ak := (−1)k sk (α1 , . . . , αn )
• Las sumas de Newton : Son definidas del modo siguiente :
n
(n)
X
Nk (α1 , . . . , αn ) := αik
i=1

Estos dos grupos de funciones simétricas tienen una forma de relacionarse conocida a partir de
Newton que vamos a analizar como una serie de problemas.
2.3. DETERMINANTE. TEOREMA DE HAMILTON-CAYLEY 135

Definición 54. Sea {X1 , . . . , Xn } una lista de variables, sea [n] := {1, . . . , n} y sea R un
anillo.
i) Para cada k, 0 ≤ k ≤ n definiremos el polinomio :
(n)
X Y
σk (X1 , . . . , Xn ) := Xi ∈ R[X1 , . . . , Xn ].
S⊂[n],](S)=k i∈S

(n)
Los llamaremos funciones simétricas elementales. Nótese que σ0 =1
ii) Para cada k ∈ N, definiremos los polinomios :
n
(n)
X
Nk (X1 , . . . , Xn ) := Xik ∈ R[X1 , . . . , Xn ].
i=1
(n)
Los llamaremos sumas de Newton. Nótese que N0 = n.
iii) Definamos la siguiente colección de polinomios auxiliares : Para k ≥ 1, m ≥ 0 :
 
n
(n)
X X Y
F :=
(k,m)
 Xi  Xjm .
j=1 S⊂[n],](S)=k,j6∈S i∈S

Escribamos :
(n) (n)
F(0,m) := Nm (X1 , . . . , Xn ).
Problema 114. Con las notaciones anteriores, pruébense las siguientes propiedades
i) Para cada k, 1 ≤ k ≤ n, se tiene :
(n)
F(k,0) = (n − k)σk (X1 , . . . , Xn )
ii) Para cada k, 1 ≤ k ≤ n, se tiene :
(n) (n) (n) (n)
σk (X1 , . . . , Xn )Nm (X1 , . . . , Xn ) = F(k,m) + F(k−1,m+1) .
iii) Además,
(n) (n) (n)
σ 0 Nm = F(0,m) .
(n) (n) (n)
σ k N0 = nσk .
iv) Para cada k ≥ 1,
(n) (n)
F(k−1,1) = kσk .
Problema 115. Con las notaciones anteriores, pruébese que se verifian las siguientes identi-
dades:
k
(n) (n) (n)
X
(−1)i σk−i Ni = F(k,0) .
i=0

Problema 116 (Newton). Con las notaciones anteriores, sea R un anillo cualquiera y supong-
amos que {1, 2, . . . , n} ⊆ R× . Pruébese que :
i) Para todo k, 1 ≤ k ≤ n :
k
!
(n) 1 X i+1 (n) (n)
σk = (−1) σk−i Ni .
k i=1

ii) Para k = 1 se tiene :


(n) (n)
σ1 = N1 .
iii) Para k = 0 se tiene :
(n)
σ0 = 1.
Problema 117. Usando los problemas precedentes, concluir que las funciones simétricas ele-
mentales se pueden obtener mediante la inversión de una recurrencia lineal a partir de las sumas
de Newton, usando como únicas “divisiones” la inversión de los elementos {1, 2, . . . , n} en R× .
Es decir, Si R un dominio de integridad cuya caracterı́stica sea mayor que n. Entonces, existe
136 2. MÓDULOS, DETERMINANTES, HAMILTON-CAYLEY

un esquema de evaluación sobre R que realiza O(n3 log2 n) operaciones aritméticas y tal que, a
partir de los datos :
1
{ Ni (α1 , . . . , αn ) : 1 ≤ k ≤ n, 1 ≤ i ≤ k},
k
calcula los coeficientes del polinomio
n
Y
(X − αi ).
i=1
CAPı́TULO 3

Dominios de Ideales Principales. Anillos Noetherianos.


Dominios Enclı́deos. Con unas reflexiones sobre
algoritmos de Cálculo del Máximo Común Divisor “ à la
Sylvester”.
(À la recherche du temps perdu)

Et tout d’un coup le souvenir m’est apparu. Ce goût, c’était


celui du petit morceau de madeleine que le dimanche matin à
Combray.... La vue de la petite madeleine ne m’avait rien
rappelé avant que je n’y eusse goûté; .... leur image avait
quitté ces jours de Combray pour se lier à d’autres plus
récents; .... Mais, quand d’un passé ancien rien ne subsiste,
après la mort des êtres, après la destruction des choses,
seules, plus frêles mais plus vivaces, plus immatérielles, plus
persistantes, plus fidèles, l’odeur et la saveur restent encore
longtemps, comme des âmes, à se rappeler, à attendre, à
espérer, sur la ruine de tout le reste, à porter sans fléchir,
sur leur gouttelette presque impalpable, l’édifice immense du
souvenir.
Et dès que j’eus reconnu le goût du morceau de madeleine
trempé dans le tilleul que me donnait ma tante (....), aussitôt
la vieille maison grise sur la rue, où était sa chambre, vint
comme un décor de théâtre s’appliquer au petit pavillon
donnant sur le jardin, ...; ; et avec la maison, la ville, la
Place ..... Et comme dans ce jeu où les Japonais s’amusent
....de même maintenant toutes les fleurs de notre jardin et
celles du parc de M. Swann, et les nymphéas de la Vivonne,
et les bonnes gens du village et leurs petits logis et l’église et
tout Combray et ses environs, tout cela qui prend forme et
solidité, est sorti, ville et jardins, de ma tasse de thé....
Marcel Proust, “À la Recherche du temps perdu”,
B.Grasset & Gallimard, 1913-1927.

137
138 3. DIVISIBILIDAD EN ANILLOS: DIP’S, NOETHER Y DE’S. ALGORITMOS

Índice
3.1. Introducción: DIP’s, Noetherianos y Dominios Euclı́deos. 138
3.2. Dominios de ideales principales, propiedades elementales,
elementos primos e irreducibles. 139
3.2.0.1. Construcción: Cuerpo de Cocientes (o cuerpo de fracciones) de
un Dominio de Integridad 142
3.3. Anillos noetherianos: aplicación del pensamiento noetheriano a la
factorización en dominios de ideales pincipales. 143
3.4. Dominios Euclı́deos 147
3.4.1. Dominios Euclı́deos: Elementos básicos 147
3.4.2. Existencia de factorización en primos en dominios euclı́deos (Opcional) 151
3.4.3. Existen dominios de ideales principales que no son dominios euclı́deos:
Dedekind-Hasse (Opcional) 152
3.4.4. Ejercicios y problemas de las secciones 3.2, 3.3 y 3.4 156
3.4.4.1. Problemas sobre el Lema de Dickson. 158
3.4.4.2. Basissatz de Hilbert en K[X1 , . . . , Xn ] 159
3.5. Sobre la eficiencia del Algoritmo de Euclides en Z 159
3.5.1. Divisiones del algoritmo de Euclides en Z 159
3.6. Eliminación univariada clásica: la Matriz de Sylvester 162
3.6.1. Extensiones algebraicas (Resumen Opcional) 162
3.6.2. Cuerpos algebraicamente cerrados (Resumen opcional) 165
3.6.3. La matriz de Sylvester y el máximo común divisor en K[X] 168
3.6.3.1. Mutiplicar por un polinomio. 168
3.6.3.2. La matriz de Sylvester-Bézout 169
3.6.3.3. Resultante de Sylvester-Bézout 172
3.6.4. Resultante de Sylvester-Bézout y Eliminación: cuando los coeficientes están
en un anillo 172
3.6.5. Ejercicios y problemas de la Sección 3.5 177
3.6.5.1. Ecuación de Pell en el caso m = 2. 177
3.6.5.2. El algoritmo de Berlekamp 179
3.6.5.3. Teorema Pequeño de Fermat y Función de Euler 179
3.6.5.4. El Sistema Criptográfico RSA 180

3.1. Introducción: DIP’s, Noetherianos y Dominios Euclı́deos.


En lo concerniente a este Capı́tulo, rozaremos un poco alguno de los temas que los almunos
deberı́an conocer como pre-Álgebra Conmutativa y nos adentraremos en el universo del pen-
samiento de E. Noether.
Ası́ que comenzaremos revisando la noción de dominio de ideales principales, pero, tras una
rápida revisión, pronto nos adentraremos en el pensamiento de E. Noether quien pergeñó las
primeras formas “modernas” del Álgebra Conmutativa, sobre la que reposa el resto de con-
strucciones ulteriores. La generalización natural de un ideal principal es un ideal finitamente
generado. Del mismo modo, los anillos de Noether (o anillos noetherianos) son la generalización
natural de los anillos principales. Un anillo será noetheriano si todos sus ideales son finita-
mente generados. Esta simple definición requiere de un poco de elaboración adicional y sus
consecuencias (tanto para la factorización de ideales como para la compacidad de la topologı́a
de Zariski, entre otros) se posponen a los Capı́tulos 6 o 7.
La razón última es que los dominios de ideales principales son un caso muy particular y muy
elemental de anillo noetheriano. A tal punto es ası́, que la existencia de factorización en producto
finito primos en los dominios de ideales principales puede interpretarse un caso particular del
Teorema de Lasker-Noether (cf. Teoremas 6.3.23 y 6.3.27). El elemento clave subyacente
es la noción de anillo noetheriano y la caracterización qye daremos en el Teroema 3.3.2 de
este Capı́tulo: Los anillos noetherianos son los anillos introducidos por Emmy Noether (y
continuados por sus alumnos y seguidores) y son los anillos que satisfacen la Condición de
Cadena Ascendente Numerable para ideales. Un pequeño diagrama mnemoténico que expresa
los contenidos estrictos en el caso de dominios serı́a:
DE ( DIP ( DominiosN oetherianos ( DOminiosdeIntegraidad (Ctivos. con unidad).
3.2. DIP-ELEMENTOS PRIMOS E IRREDUCIBLES 139

La estructura del Capı́tulo es la siguiente: Comenzaremos con una revisión de la terminologı́a


de dominios de ideales principales (Sección 3.2). Seguiremos, en la Sección 3.3, definiendo y
estableciendo las propiedades más inmediatas de los anillos noetherianos. En esa misma sección
aplicaremos el pensamiento noetheriano, en la forma más elemental, para mostrar la existencia
de factorización única en DIP’s. Seguidamente, daremos un paso atrás en la abstracción y nos
iremos al caso particular de dominio de ideales principales conocido como dominio euclı́deo
(Sección 3.4). En la Subsección 3.4.3 veremos que los dominios euclı́deos son una clase es-
trictamente contenida en la clase de dominios de ideales principales. Se trata del Teorema de
Dedekind-Hasse que analizamos en la Subsección 3.4.3.
La última parte del Capı́tulo se de dedica a aspectos más algorı́timicos que, en algún sentido,
deberı́an formar parte del conocimiento previo del alumno. Nos dedicaremos a la eliminación
de un cuantificador existencial afectando a una única variable (Teorı́a de la Eliminación, caso
univariado) o, si se prefiere, a reflexionar sobre el cálculo del máximo común divisor de dos
polinomios univariados con coeficientes en un cuerpo. Esto nos lleva al siglo XIX y a los
trabajos de J.J. Sylvester (cf. [Syl, 1840] o [Syl, 1853]) sobre la resultante univariada. A
esto dedicaremos la Sección 3.6.

3.2. Dominios de ideales principales, propiedades elementales, elementos primos e


irreducibles.
Definición 55 (Dominios de Ideales Principales). Un dominio de ideales principales es
un dominio de integridad que es, a la vz, anillo principal. Esto es, satisface, a la vez,
i) R no posee divisores de cero no nulos y,
ii) todos los ideales de R son ideales principales.

Ejemplo 3.2.1. A partir de los Teoremas 2.2.18 y 1.4.39 anteriores, se tienen los siguientes
ejemplos:
i) El anillo Z es un dominio de ideales principales.
ii) El anillo K[X] es un dominio de ideales principales, cuando K es un cuerpo.
iii) El anillo Z[X] es un dominio de integridad, pero no es un anillo principal.
iv) El anillo K[X, Y ], cuando K es un cuerpo, es dominio de integridad pero no es anillo
principal. Para verlo, baste con ver que el ideal m := (X, Y ) no es un ideal principal.
Para verlo, baste con ver que si fuera un ideal principal, entonces, las variables X e
Y poseerı́an un divisor común no unidad. Pero, nótese que m es un ideal propio de
K[X, Y ] porque:
m := {f ∈ K[X, Y ] : f (0, 0) = 0}.
Finalmente, las variables X e Y no pueden tener un divisor no unidad común en
K[X, Y ]. Dejamos como ejercicio, verificar esta última condición.
v) El anillo cociente Z/6Z es un anillo principal, pero no es dominio de integridad.

Notación 3.2.2. Utilizaremos la notación x | y para indicar y ∈ (x) y diremos que x divide a
y.

Lema 3.2.3. Si R es un dominio de integridad, a un ideal de R y a, b dos generadores de a (i.e.


a = (a) = (b)) entonces, existe u ∈ R× tal que ua = b. Es decir,
a = (a) = (b) =⇒ ∃u ∈ R× , ua = b.
Demostración. Obvio dado que b ∈ (a) =⇒ ∃x ∈ R, b = xa y a ∈ (b) =⇒ ∃y ∈ R, a =
yb, entonces
a = yb = yxa =⇒ (1 − yx)a = 0,
con lo que o bien a 6= 0 (e, en ese caso, a = (0) = (b) y, por tanto, b = 0) o bien (1 − xy) = 0
de donde se concluye que x ∈ R× . 
140 3. DIVISIBILIDAD EN ANILLOS: DIP’S, NOETHER Y DE’S. ALGORITMOS

Definición 56. Se dice que dos elementos a, b ∈ R en un dominio de integridad R son asociados
si (a) = (b) o, equivalentemente, si difieren en una unidad de R, es decir si existe u ∈ R× tal
que a = ub. Se denotará mediante a ∼ b.

Nótese que elementos iguales también son asociados.

Definición 57 (Máximo Común Divisor en Dominios de Ideales Principales). Sea R


un dominio de integridad y sea F = {ai : i ∈ I} ⊆ R un conjunto de elementos del anillo.
Llamaremos máximo común divisor de F (en el sentido de dominios de ideales pricnipales)
a cualquier generador del ideal principal a = (F) ⊆ R generador por el conjunto F, si tal
elemento existira. Lo denotaremos mediante gcd(F ).
En el caso finito F = {a1 , . . . , am }, escribiremos gcd(a1 , . . . , am ) para designar su máximo
común divisor, i.e.
gcd(F) = h ⇐⇒ (h) = (F),
y
gcd(a1 , . . . , am ) = h ⇐⇒ (h) = (a1 , . . . , am ).

Observación 3.2.4. Por lo dicho anteriormente, si R es dominio de integridad, cualesquiera


dos máximos comunes divisores h y h0 de una familia F generan el mismo ideal (F ). Por tanto,
son elementos asociados y podemos concluir que el máximo común divisor, de existir, es único
salvo unidades en el anillo.

Proposición 3.2.5. En dominios de ideales principales, toda familia F posee máximo común
divisor.
Demostración. Obvio. 

Observación 3.2.6. Obsérvese que la noción de máximo común divisor antes descrita sólo tiene
sentido en el caso de que el ideal generado por F sea principal. Eso está garantizado cuando
R es dominio de ideales principales, pero no está garantizado en otros anillos, ni siquiera en
dominios de integridad. Si se trata de un ideal (F ) no principal, los elementos de F podrı́an
no tener máximo común divisor en el sentido recedente. Volveremos a este caso en el caso de
dominios de factorización única (en la Sección 6.2 siguiente). De todos modos, tomemos el anillo
R = K[X, Y ] de polinomios en dos variables con coeficientes en un cuerpo y consideremos el ideal
m = (X, Y ). Podemos tener una noción de divisor común de grado máximo de los elementos
X e Y . Ese polinomio serı́a el polinomio 1 y sus asociados en K[X, Y ]. Pero, como ya hemos
discutido, (1) 6= m = (X, Y ) y los elementos {X, Y } no poseen máximo común divisor en el
sentido precedente.

Un resultado clásico (sin cotas) proveniente de la obra precursora de É. Bézout (cf. [Béz, 1779])
es el siguiente, que Bézout probó para polinomios univariados con coeficientes “complejos”.
Sobre el caso de los enteros, se conoce un antecedente parcial en la obra de Claude Gaspard
Bachet (sieur de Méziriac)“Problèmes plaisants & délectables qui se font par les nombres”,
Lyons, France: Pierre Rigaud & Associates, 1624,1 donde el caso Z aparece reflejado como
Proposition XVIII, páginas 18-33:
Teorema 3.2.7 (Identidad de Bézout (sin cotas)). Sea R un dominio de ideales principales
y sea a1 , . . . , an ∈ R un conjunto finito de elementos. Sea h su máximo común divisor .
Entonces, existen x1 , . . . , xn ∈ R tales que
h = x1 a1 + · · · + an xn .
Demostración. Es obvio porque h es el máximo común divisor si y solamente si (h) =
(a1 , . . . , an ), con lo que se tiene que dar la propiedad indicada. 

1https://www.bsb-muenchen-digital.de// web/web1008/bsb10081407/images/index.html?digID=
~
bsb10081407&pimage=38&v=100&nav=0&l=de
3.2. DIP-ELEMENTOS PRIMOS E IRREDUCIBLES 141

Teorema 3.2.8 (Identidad de Bézout (caso infinito)). Sea R un dominio de ideales prin-
cipales y sea F = {ai : i ∈ I} un conjunto cualquiera de elementos de R. Sea h su máximo
común divisor. Entonces, existe un conjunto finito J ⊆ I y existen {xi : i ∈ I} ⊆ R tales que
X
h= xj aj .
j∈J

Demostración. Es obvio por que h es el máximo común divisor si y solamente si (h) =


(F), con lo que se tiene que dar la propiedad indicada. 

Definición 58 (Elementos irreducibles y elementos primos). Sea R un dominio de


integridad.
i) Un elemento q ∈ R no unidad se dice irreducible si o bien q = 0 o bien q 6= 0 y el
ideal (q) = qR ⊆ R que genera es maximal entre los ideales principales propios de R
para la relación de inclusión. Es decir, q = 0 o q 6= 0 y se verifica:
∀a ∈ R, (q) ⊆ (a) =⇒ (a) = (q) ∨ (a) = R.
ii) Un elemento p ∈ R no unidad se dice primo si el anillo cociente R/pR es un dominio
de integridad.

Observación 3.2.9. La definición dada de elementos primos e irreducibles es la usual, aunque


escrita de otro modo. Dejamos al lector la verificación de la propiedad:
• Un elemento q ∈ R que no sea unidad es un elemento irreducible si y solamente si
verifica:
∀a ∈ R, a | q, =⇒ (a ∈ R× ) ∨ (a ∼ p).
• Un elemento p ∈ R que no sea unidad es primo si y solamente si verifica la siguiente
propiedad:
∀a, b ∈ R, p | ab, =⇒ [p | a] ∨ [p | b].

Ejemplo 3.2.10. Se tienen los siguientes ejemplos:


i) Si R es un dominio de integridad, entonces 0 ∈ R es un elemento primo. De hecho, R
es dominio si y solamente 0 es primo.
ii) El elemento 2 ∈ Z es primo e irreducible
√ en Z.
iii) El elemento 2 es irreducible en Z[ −5] pero no es primo, dado que:
√ √
2 | (1 − −5)(1 + −5) = 6,
pero √ √
2 - (1 − −5), 2 - (1 + −5).

La irreducibilidad de 2 en Z[ −5] se prueba del modo siguiente:
√ √ √ √
2 = (a + b −5)(c + d −5) =⇒ 2 = (a − b −5)(c − d −5),
aplicando conjugación en C y dado que a, b, c, d ∈ Z. Entonces, tendremos
√ √ √ √
4 = 22 = (a + b −5)(a − b −5)(c + d −5)(c − d −5) = (a2 + 5b2 )(c2 + 5d2 ).
Por tanto, a2 + 5b2 es un divisor de 4 en Z. Nótese que si b 6= 0, entonces, a2 + 5b2 ≥ 5
y no podrı́a ser un divisor entero de 4. Por tanto, es necesario b = 0 y tendremos que
los únicos casos posibles son
(a, b) ∈ {(±1, 0), (±2, 0)}.
√ √ √
En estos casos o bien (a+b
√ −5) = ±1 y es unidad en Z[ −5] o bien (a+b −5) = ±2
y es asociado a 2 en Z[ −5].

Proposición 3.2.11. Si R es un dominio de integridad, todo elemento p ∈ R que sea primo,


ha de ser irreducible en R.
Demostración. Es consecuencia inmediata de las definiciones. Si p ∈ R es primo y a | p
en R, entonces, ∃b ∈ R tal que p = ab. Por ser p primo, y p | ab, se ha de tener una de las dos
opciones siguientes:
142 3. DIVISIBILIDAD EN ANILLOS: DIP’S, NOETHER Y DE’S. ALGORITMOS

• o bien p | a, en cuyo caso p ∼ a y son asociados


• o bien p | b, en cuyo caso es fácil deducir que a ha de ser una unidad de R.
En cualquier caso, p es irreducible. 

3.2.0.1. Construcción: Cuerpo de Cocientes (o cuerpo de fracciones) de un


Dominio de Integridad. Sea R un dominio de integridad y su subconjunto S := R \ {0}.
Consideremos el conjunto R × S y definamos la siguiente relación:
∀(a, s), (b, r) ∈ R × S, (a, s) ∼ (b, r) ⇐⇒ ar − bs = 0.
Se prueba que
i) La relación ∼ anterior es una relación de equivalencia.
ii) Denotaremos mediante qf (R) o S −1 R al conjunto cociente y a las clases de equivalencia
[(a, s)]∼ ∈ qf (R) la denotaremos mediante as . Definimos la siguientes correspondencias
en qf (R):
+ : qf (R) × qf (R) −→ qf (R), 6 · : qf (R) × qf (R) −→ qf (R)
( as , rb ) 7−→ ar+bs
rs , 6 ( as , rb ) 7−→ ab
rs
Entonces, ambas correspondencias son aplicaciones y (qf (R), +, ·) es un cuerpo que
se denomina cuerpo de fracciones de R.
iii) Todo dominio de integridad es subanillo de su cuerpo de fracciones.
iv) Se tiene, por ejemplo,
√ √
qf (Z) = Q, qf (Z[i]) = Q(i), qf (Z[ m]) = Q( m),
v) El cuerpo de fracciones de K[X] es el cuerpo de funciones racionales en una variable
con coeficientes en K y se denota mediante:
p(X)
K(X) := { : p, q ∈ K[X]}.
q(X)
Se tiene que qf (Z[X]) = qf (Q[X]) = Q(X), luego diversos dominios pueden tener el
mismo cuerpo de fracciones.
Notación 3.2.12 (Cuerpo de funciones racionales (en n variables)). Sea K[X1 , . . . , Xn ]
el anilo de polinomios en n variables sobre el cuerpo K. Llamaremos cuerpo de funciones
razcionales en n variables sobre K, y lo denotaremos mediante, K(X1 , . . . , Xn ) al cuerpo
de fracciones de K[X1 , . . . , Xn ]. A los elementos de K(X1 , . . . , Xn ) se las denomina fun-
ciones racionales K−definibles en n variables . Claramente K[X1 , . . . , Xn ] es un subanillo
de K(X1 , . . . , Xn ) o, equivalenetmente, las operaciones de K(X1 , . . . , Xn ) “extienden” a las
operaciones de K[X1 , . . . , Xn ].

Proposición 3.2.13. Sea R un dominio de integridad y sea F = qf (R). Supongamos que R


verifica la siguiente curiosa propiedad:
“Para todo polinomio f ∈ R[X] de grado 2, si f posee una raı́z en F , entonces el polinomio
factoriza como el producto de dos polinomios de grado 1 en R[X]”.

Entonces, todo elemento de R es irreducible si y solamente si es primo.


Demostración. Supongamos que p ∈ R es irreducible y que existen a, b ∈ R tales que
p | ab. Consideremos el siguiente polinomio con coeficientes en F [X]:
a b
f (X) = p(X − )(X − ).
p p
Es fácil verificar que
 
2 a+b ab
f (X) = pX − p X+ = pX 2 − (a + b)X + r ∈ R[X],
p p
donde ab = pr, para algún elemento r ∈ R. Por tanto, tenemos un polinomio f (X) ∈ R[X] que
posee una solución en F (de hecho, dos ap y pb ). Aplicando la propiedad indicada, tendemos que
f factoriza en producto de dos polinomios de grado 1 en R[X]. Es decir
f (X) = (cX + d)(eX + `), (eX + c), (cX + `) ∈ R[X].
3.3. ANILLOS NOETHERIANOS: FACTORIZACIÓN EN D.I.P.’S 143

Pero eso implicarı́a p = ce y p es irreducible. Luego o bien c o bien e son unidades en R.


Supongamos que c ∈ R× es unidad. Entonces, p = ce =⇒ e = c−1 p. Luego,
f (X) = c(X + c−1 d)(c−1 pX + `).
Luego la raı́z −c−1 d del polinomio f tiene que ser una de sus dos raı́ces. Es decir, se ha de
tener una de las dos opciones siguientes:
a b
= −c−1 d ∈ R ∨ = −c−1 d ∈ R.
p p
Es decir, habremos probado que, tomando x = −c−1 d ∈ R e y = −c−1 d ∈ R, se tiene:
[∃x ∈ R, a = px] ∨ [∃y ∈ R, b = py] .
con lo cual concluimos que p | a o p | b y tendremos que p es un elemento primo. 

Teorema 3.2.14. En un dominio de ideales principales, un elemento p ∈ R es primo si y


solamente si es irreducible.
Demostración. Hemos visto que “primo” =⇒ “irreducible”, ası́ que toca probar la afir-
mación recı́proca. Supongamos que p ∈ R es un elemento irreducible y supongamos que p | ab,
con a, b ∈ R dos elementos no unidades. Supongamos ab = rp, con r ∈ R. Supongamos que
p - a y consideremos el ideal suma (p) + (a) = (p, a) ⊆ R. Como R es dominio de ideales
principales, tendremos que existe un elemento c ∈ R tal que
(c) = (p, a).
Además, p ∈ (p, a) con lo que p ∈ (c) y, por tanto, c | p. Como p es irreducible, caben dos
opciones:
O bien p ∼ c, en cuyo caso (p) = (c) y, en consecuencia, (p) = (p, a), con lo cual a ∈ (p) y p | a,
lo que es imposible por hipótesis.
O bien c ∈ R× es una unidad en R, con lo cual
R = (c) = (a, p),
En este caso, tendremos que existe x, y ∈ R tales que 1 = xp + ya. Luego,
b = b · 1 = b(xp + ya) = xbp + yba = xbp + yrp = (xb + yr)p,
con lo cual habremos concluido que p | b y tendremos probada la primalidad de p. 

3.3. Anillos noetherianos: aplicación del pensamiento noetheriano a la


factorización en dominios de ideales pincipales.
Como ya indicamos en la Introducción, en este Sección nos dedicamos a introducir la noción
de anillo cuyos ideales son finitamente generados. Buscamos la caracterización tradicional de
E. Noether que presupone el Axioma de Elección Dependiente.
Presentaremos un primer ejemplo de argumentación noetheriana, posiblemente un tanto exce-
siva e innecesaria: vamos a demostrar la existencia de factorización de los elementos de dominios
de ideales pincipales como producto de irreducibles. Dado que ya hemos visto que en dominios
de ideales principales primo equivale a irreducible (ver Teorema 3.2.14), podemos usar indis-
tintamente en ambos casos los términos primo e irreducible sin necesidad de explicar que son
la misma noción. La demostración en el caso de dominios de ideales principales usa un ar-
gumento tı́picamente noetheriano. No es una necesidad, pero ejemplifica bien lo que Noether
hará después con esta forma de pensamiento. Posteriormente veremos que, si es un dominio
euclı́deo, este Axioma no es necesario, con el enunciado del Teorema 3.4.10 en la Subsección
3.4.2 posterior.
Comencemos con un axioma esencial para captar el pensamiento noetheriano:
Axioma 3.3.1 (Axioma de Elección Dependiente). Sea X un conjunto no vacı́o y R ⊆
X × X una relación. Supongamos que R satisface la siguiente propiedad:
∀a ∈ X, ∃b ∈ X, aRb.
Entonces, existe una sucesión {xn : n ∈ N} ⊆ X de tal modo que xn Rxn+1 , ∀n ∈ N.
144 3. DIVISIBILIDAD EN ANILLOS: DIP’S, NOETHER Y DE’S. ALGORITMOS

Teorema 3.3.2 (Teorema de Noether sobre la Condición de Cadena Ascendente


numerable para anillos). Sea R un anillo. Asumiendo el Axioma de Elección Dependiente,
las siguiente tres propiedades son equivalentes:
i) Condición de Cadena Ascendente Numerable de Ideales (abreviado CCA):
Toda cadena ascendente numerable de ideales se estabiliza, es decir, dada una cadena
ascendent numerable de ideales de R:
a0 ⊆ a1 ⊆ a2 ⊆ · · · ⊆ an ⊆ · · · ,
existe m ∈ N tal que an = am , para todo m ≥ n.
ii) Todo conjunto no vacı́o de ideales de R posee elemento maximal. Es decir, dado S un
conjunto no vacı́o de ideales de R, entonces existe a ∈ S tal que para cada b ∈ S, si
a ⊆ b, entonces a = b.
iii) Todos los ideales de R poseen un sistema generador de cardinal finito (i.e. son finita-
mente generados).
Demostración. Probemos las distintas implicaciones:
• i) ⇒ ii): Es simplemente el enunciado del Axioma de Elección Dependiente. Es
decir supongamos que R satisface CCA y, razonando por reducción al absurdo, su-
pongamos que existe un conjunto S de ideales de R que no posee elemento maximal.
Consideremos sobre S la relación R :=( dada por la inclusión estricta. Como ningún
elemento de S es maximal, para cada a ∈ S se verificará que ∃ b ∈ S tal que a (
b. Aplicando literalmente el Axioma de Elección Dependiente, existirá una sucesión
{an : n ∈ N} ⊆ S tal que:
a0 ( a1 ( · · · ( an ( · · · .
Pero la existencia de esta cadena ascendente numerable que no se estabiliza contradice
la CCA que se satisface en R.
• ii) ⇒ iii): Claramente los ideales (0) y R = (1) están generados por conjuntos finitos
de generadores. Sea a ( R un ideal propio. Definamos el conjunto:
Sa := {b ⊆ a : b es un ideal finitamente generado}.
Como (0) ∈ Sa , éste es un conjunto no vacı́o y, por ii) posee elementos maximales.
Sea n uno de esos maximales de Sa . Veamos que n = a.
Es claro, por hipótesis, que n ⊆ a. Sea c ∈ a un elemento cualquiera. Como n es un
ideal finitamente generado existirá un conjunto finito {c1 , . . . , cr } de elementos de n
tales que
n = (c1 , . . . , cr ).
Por tanto, el ideal siguiente también es finitamente generado:
n + (c) = (c1 , . . . , cr ) + (c) = (c1 , . . . , cr , c).
Además, como c ∈ a tenemos que n + (c) ⊆ a. Concluimos ası́ que n + (c) ∈ Sa . Pero,
como n ⊆ n + (c) y n es maximal en Sa , sólo nos queda la posibilidad de que
n = n + (c).
Y, en particular, c ∈ n, para cualquier c ∈ a.
• iii) ⇒ i): Supongamos que R satisface la propiedad iii) y consideremos una cadena
ascendente numerable de ideales de R:
a0 ⊆ a1 ⊆ a2 ⊆ · · · ⊆ an ⊆ · · ·
Por ser cadena asecendente, es fácil verificar que el siguiente conjunto
[
a := ai ,
i∈N

es un ideal de R. Por tanto, por la propiedad iii), a está generado por un conjunto
finito de elementos {a1 , . . . , ar }. Pero, como a es una unión, para cada i, 1 ≤ i ≤ r, ha
de existir k(i) tal que ai ∈ ak(i) . Definamos m := max{k(1), . . . , k(r)} y observamos
que
∀i, 1 ≤ i ≤ r, ai ∈ am ,
3.3. ANILLOS NOETHERIANOS: FACTORIZACIÓN EN D.I.P.’S 145

simplemente porque como m ≥ k(i), ak(i) ⊆ am . En conclusión,


a = (a1 , . . . , ar ) ⊆ am .
Por tanto, para cada n ≥ m tendremos:
[
an ⊆ a = ai ⊆ am ⊆ an ,
i∈N
y la cadena se estabiliza a partir del ı́ndice m.


Observación 3.3.3. Usualmente, la prueba de la equivalencia entre estas tres propiedades


(esencialmente la prueba de ii) ⇒ iii) o, equivalentemente, la prueba de ii) ⇒ i) se hace sin
dar relevancia al Axioma de Elección Dependiente. Este aspecto fue destacado por W. Hodges,
en su trabajo de 1974 (cf. [Hod, 1974]). La salida natural es asumir el Axioma de Elección
Dependiente (cf. Axioma 3.3.1), como axioma de nuestra teorı́a de conjuntos subyacente.

Definición 59 (Anillo Noetheriano). Un anillo R se dice noetheriano (o de Noether) si


satisface una cualquiera de las propiedades i) a iii) (y, por tanto, todas) del Teorema 3.3.2
precedente.

Corolario 3.3.4. Los anillos principales son anillos noetherianos. Los cocientes de anillos
noetherianos por cualquiera de sus ideales son noetherianos.
Demostración. La primera de las afirmaciones es obvia, mientras que la segunda se sigue
de lo probado en la Proposición 2.2.28. Si a ( R es un ideal propio de un anillo noetheriano y
si R/a es el anillo cociente, los ideales del cociente R/a son de la forma b/a, donde b es ideal
de R y b ⊇ a. Como R es noetheriano, b es finitamente generado como ideal de R. Ahora,
si {b1 , . . . , br } es un conjunto finito de generadores de b como ideal de R, entonces las clases
módulo a dadas por {b1 + a, . . . , br + a} son un conjunto finito de generadores de b/a como
ideal de R/a. Esta última afirmación es de mera verificación y no tiene dificultades. Lo que
nos permite concluir que todo ideal de R/a es finitamente generado. 

Ejemplo 3.3.5 (Ni todo anillo noetheriano es principal, ni todo anillo noetheriano
es dominio). Como veremos más adelante, no todos los anillos noetherianos son principales:
por ejemplo, los anillos de polinomios K[X1 , . . . , Xn ] son dominios noetherianos que no son
principales para n ≥ 2, como ya hemos visto (cf. la Subsección (de Problemas) 3.4.4.2 y el
Problema 135). Obviamente, no todo anillo noetheriano es dominio, como lo prueban los dos
anillos noetherianos Z/6Z y Q[X]/(X 2 − 1).

Ejemplo 3.3.6 (Hay anillos que no son noetherianos). Consideremos el anillo C 0 (R) de
funciones continuas sobre R. Consideremos el conjunto n ∈ N de los números naturales y para
cada n ∈ N, definamos el siguiente ideal:
an := {f ∈ C 0 (R) : f (i) = 0, ∀i ∈ N, i ≥ n}.
Es evidente que tenemos la cadena ascendente numerable de ideales siguiente:
a0 ⊆ a1 ⊆ · · · ⊆ an ⊆ an+1 ⊆ · · ·
La siguiente es una función continua fn+1 ∈ an+1 \ an :

 1, si x ≤ n,
fn+1 (x) := −x + (n + 1), si n ≤ x ≤ n + 1,
0, si x ≥ n + 1.

Es claro que fn+1 ∈ an+1 , pero fn+1 (n) = 1 6= 0, con lo que fn+1 6∈ an . Esta cadena de
ideales es, por tanto, numerable y estrictamente creciente. Luego, C 0 (R) no verifica la CCA.
Por tanto C 0 (R) no es un anillo noetheriano y podemos concluir, por ejemplo, que en C 0 (R)
existen ideales que no son finitamente generados. Similares resultados son fáciles de obtener
para todos los anillos de la forma C k (R) para 1 ≤ k ≤ ∞.
146 3. DIVISIBILIDAD EN ANILLOS: DIP’S, NOETHER Y DE’S. ALGORITMOS

Corolario 3.3.7. Asumiendo el Axioma de Elección Dependiente, todo anillo noetheriano


posee ideales que son elementos maximales del conjunto de ideales propios con la relación de
orden dada por la inclusión.
Demostración. Se trata de considerar el conjunto siguiente, formado por los ideales pro-
pios de un anillo noetheriano R:
I := {a ( R : a es ideal en R}.
Obviamente, (0) ∈ I 6= ∅. Por tanto, la afirmación ii) del Teorema de Noether nos permite
concluir que I posee algún elemento maximal. 

Observación 3.3.8 (Ideales maximales). Nótese que los elementos maximales m a los que
hace referencia el anterior corolario, satisfacen las siguientes dos propiedades:
• m ( R es un ideal propio de R.
• m es maximal entre los ideales propios de R, es decir, dado a ( R un ideal propio de
R, si m ⊆ a, entonces m = a.
Este tipo de ideales se denominan ideales maximales de un anillo y volveremos sobre ellos en
la Sección 4.2 del Capı́tulo 4.

Corolario 3.3.9. Suponiendo el Axioma de Elección dependiente, todo dominio de ideales


principales que no sea cuerpo, posee elementos primos e irreducibles no nulos.
Demostración. Como R no es cuerpo, podemos considerar el conjunto de sus ideales
propios que es un conjunto no vacı́o:
S := {a : (0) $ a $ R}.
Por ser anillo noetheriano, dicho conjunto posee elemento maximal, usando el Corolario anterior.
Sea m un elemento maximal de S. COmo el anillo es principal, existe p ∈ R tal que m = (p).
Como m es propio y no es el ideal (0), p 6= 0 y p no es unidad en R. Finalmente, m es maximal
entre los ideales principales propios de R, luego p es irreducible y, por ser R dominio de ideales
principales, también es primo. . 

Teorema 3.3.10 (Existencia de factorización en dominios de ideales principales).


Suponiendo el Axioma de Elección Dependiente, en dominios de ideales principales, todo ele-
mento es producto finito de irreducibles y/o unidades.
Demostración. Razonemos por reducción al absurdo. Supongamos que hay elementos
en R que no son producto finito de unidades e irreducibles. De momento, R no puede ser un
cuerpo porque en cuerpos todos los elementos son o primos (el elemento 0) o unidades (todo
elemento R \ {0}). Esto quiere decir que el siguiente conjunto es no vacı́o:
S := {a = (a) : a no es producto finito de irreducibles y/o unidades de R}.
Como R es noetheriano, S posee un elemento maximal m = (p) ∈ S. Veamos que p ha de ser
un elemento irreducible no nulo. Observemos, en primer lugar que:
• Se tiene p 6= 0, porque 0 es primo (e irreducible) y p no puede ser irreducible.
• El elemento p no es unidad en R porque p no es producto de unidades de R.
Es decir, tenemos (0) ( m = (p) ( R. Pero, además, p no es irreducible (erı́a un producto
finito de irreducibles). Por tanto, p es reducible. Por tanto, existen x ∈ R e y ∈ R tales que
p = xy con p - x y p - y. Esto significa que
m $ (x), m $ (y).
Además, ni x ni y pueden ser unidades en R (en otro caso, p dividirı́a al que no fuera unidad).
Por tanto, tenemos
m $ (x) $ R, m $ (y) $ R.
Por la maximalidad de m no puede ser que (x) ∈ S ni (y) ∈ S. Si alguno de ellos estuviera
en S estarı́amos en contradicción con la maximallidad de m. Pero si (x) 6∈ S, siendo un ideal
propio de R, no se cumple la propiedad que define S. Por tanto, x no cumple que no es un
producto finito de irreducibles y/o unidades de R. Es decir, x es producto finito de unidades e
3.4. DOMINIOS EUCLÍDEOS 147

irreducibles de R. Del mismo modo concluimos que y ha de ser un producto finito de unidades
e irreducibles de R. Pero, como p = xy concluirı́amos que p es también un producto finito de
unidades e irreducibles de R, con lo que m 6∈ S, llegando a contradicción con la hipótesis m ∈ S.
Por tanto, no pueden existir x, y ∈ R tales que p = xy con p - x y p - y. Luego p es irreducible
no trivial. 

3.4. Dominios Euclı́deos


Si antes dimos un pequeño salto hacia arriba en términos de abstracción, el propósito ahora es
dar un paso hacia abajo en términos de abstracción: nos vamos a un ejemplo muy particular de
anillos principales. En este caso, la presencia de una cierta función (llamada función euclı́dea)
permite “medir” el número de pasos en algoritmos y el “tamaño” de cocientes y restos. Esto
nos acerca a los aspectos más algorı́tmicos asociados a la divisibilidad y, más adelante, a los
algoritmos de división y cálculo del máximo común divisor en Z y K[X] que ocuparán la sección
siguiente.
3.4.1. Dominios Euclı́deos: Elementos básicos. Se trata de un caso particular de
dominio de ideales principales.
Definición 60 (Función euclı́dea sobre un dominio). Sea R un dominio de integri-
dad. Una aplicación φ : R −→ Z se denomina función euclı́dea sobre R si satisface las dos
propiedades siguientes:
i) φ(ab) ≥ φ(a), ∀a, b ∈ R, b 6= 0.
ii) División Euclı́dea: Si a, b ∈ R con b 6= 0, entonces existen q, r ∈ R tales que
• a = qb + r,
• φ(r) < φ(b).
Llamaremos dominio euclı́deo a todo par (R, φ) donde R es dominio de integridad y φ es un
función euclı́dea sobre R. . También diremos que R admite una función φ euclı́dea.
Ejemplo 3.4.1. Se tienen los ejemplos siguientes:
i) El anillo de los enteros Z posee la función euclı́dea dada por el valor absoluto.
ii) El anillo de polinomios en una variable con coeficientes en un cuerpo posee como
función euclı́dea al grado deg (cf. Teorema 1.4.15 del Capı́tulo anterior) definido del
modo siguiente:
n, si f = an X n + · · · + a0 , an 6= 0

deg(f ) :=
−1, f =0
iii) El “resto” en dominios euclı́deos no es necesariamente único. Ası́, dados a, b ∈ Z,
b 6= 0 y dados q, r ∈ R tales que
a = qb + r, |r| ≤ |b| − 1,
El par (q, r) no es necesariamente único. Por ejemplo,
5 = 2 · 3 − 1 = 1 · 3 + 2,
y los pares (2, −1) y (1, 2) satisfacen la condición ii) de las funciones euclı́deas.
iv) El “resto” y el “cociente” sı́ son únicos en el caso de K[X], cuando K es un cuerpo.
De hecho, algunos autores (cf [Rha, 1962], [Jod, 1967]) han demostrado el siguiente
resultado que no reproduciremos aquı́:
Teorema 3.4.2. Sea (R, φ) un dominio euclı́deo. Supongamos que para cada par
a, b ∈ R, con b 6= 0, el resto y el cociente de la división euclı́dea está determinado de
manera unı́voca. Entonces, o bien R es un cuerpo o bien R = F [X], donde F es un
cuerpo.
v) En cualquier caso (sea o no único el resto) escribiremos rem(a, b) para denotar el
conjunto de todos los restos de la división eculı́dea de dos elementos a, b ∈ R, cuando
(R, ϕ) sea un dominio euclı́deo, poniendo especial atención a que este conjunto puede
tener más de un elemento.
Proposición 3.4.3. Si (R, φ) es un dominio euclı́deo, se verifican las propiedades siguientes:
148 3. DIVISIBILIDAD EN ANILLOS: DIP’S, NOETHER Y DE’S. ALGORITMOS

i) Si b 6= 0, b ∈ R, entonces φ(b) ≥ φ(1).


ii) Más aún, para todo a ∈ R, a 6= 0, φ(a) > φ(0).
iii) Si (a) = (b), entonces φ(a) = φ(b), para cualesquiera a, b ∈ R.
iv) Si a | b y φ(a) = φ(b), entonces (a) = (b), para cualesquiera a, b ∈ R.
v) Un elemento a ∈ R es unidad (i.e. a ∈ R× ) si y solamente si φ(a) = φ(1).
Demostración. La propiedad i) es consecuencia inmediata de la primera propiedad que
ha de verificar una función euclı́dea, esto es, si b 6= 0, se tiene:
φ(b) = φ(b · 1) ≥ φ(1).
Sin embargo, la propiedad ii) es más fuerte por lo siguiente. Sea a ∈ R, a 6= 0. Apliquemos la
división euclı́dea y tendremos que existen q, r ∈ R tales que
0 = qa + r,
y φ(r) < φ(a). Supongamos que φ(a) ≤ φ(0). Entonces, φ(r) ≤ φ(a) − 1 < φ(0), con lo que
tendrı́amos que r 6= 0. Pero R es un dominio de integridad y tenemos que r = (−q) · a. Por
tanto, (−q) 6= 0 y, por la primera de las propiedades de las funciones euclı́deas, concluiremos
que
φ(r) = φ((−q)a) ≥ φ(a),
contradiciendo la hipótesis φ(r) < φ(a). La conclusión será, por tanto, que φ(a) > φ(0) si a 6= 0.
La propiedad iii) es casi evidente. Si alguno de los elementos a, b ∈ R fueran nulo, la propiedad
se sigue de modo evidente. Supongamos que ninguno de los dos es nulo (i.e. a 6= 0 y b 6= 0).
Entonces, (a) = (b) significa que podemos escibir a = ub y b = ra, para algunos valores u, r ∈ R,
Por tanto, de nuevo por la primera propiedad de las funciones euclı́deas, tenemos:
φ(a) = φ(u · b) ≥ φ(b), porque u 6= 0,
φ(b) = φ(r · a) ≥ φ(a), porque r 6= 0,
Para la propiedad iv), supongamos que a | b y φ(a) = φ(b). Supongamos que b 6= 0. En el
caso b = 0, concluirı́amos φ(a) = φ(b) = φ(0), por cuanto se tendrı́a a = 0 y la obvia igualdad
(a) = (b). Con la hipótesis b 6= 0, podemos escribir
a = qb + r,
con φ(r) < φ(b) = φ(a). Pero existe s ∈ R tal que b = sa, por lo que concluimos
a = qb + r = qsa + r =⇒ (1 − qs) · a = r.
Si (1 − qs) 6= 0, por la primera propiedad de las funciones euclı́deas, enonces,
φ(r) = φ((1 − qs) · a) ≥ φ(a) = φ(b) > φ(r).
Lo que nos lleva a contradicción. En conclusión, (1 − qs) = 0, por cuanto s es una unidad en
R y, por lo tanto, b = sa, s ∈ R× , lo que implica a = qb = s−1 b ∈ (b) y, por tanto, (a) ⊆ (b) y
tenemos la igualdad entre los dos ideales.
Para la propiedad v), tenemos que φ(a) ≥ φ(1) siempre, por la propiedad i). Si a ∈ R× es
unidad, entonces, sea s ∈ R× su inverso y tenemos as = 1. Obviamente, a 6= 0 y s 6= 0 porque
son unidades, luego
φ(1) = φ(a · s) ≥ φ(a).
Para la afirmación recı́proca, si φ(a) = φ(1), dado que 1 | a, usando la propiedad iv) nos lleva
a que (1) = (a) y, por tanto, a es una unidad en R× . 

Teorema 3.4.4. Sea R un dominio de integridad. Si R posee alguna función euclı́dea definida
en él, entonces R es un dominio de ideales principales.
Demostración. Recordemos que todo subconjunto de Z acotado inferiormente posee
mı́nimo. El caso del ideal nulo (0) es obvio: es un ideal principal. Sea a un ideal de R,
a 6= (0), y consideremos el conjunto:
Sa := {φ(a) : a ∈ a, a 6= 0}.
Como φ(a) ≥ φ(0), para todo a ∈ R, a 6= 0, el conjunto Sa es un subconjunto de Z acotado
inferiormente. Por tanto, posee un mı́nimo. Sea n := min(Sa ) el mı́nimo de Sa .
3.4. DOMINIOS EUCLÍDEOS 149

Sea a ∈ a un elemento no nulo tal que φ(a) = n (existe porque n es un mı́nimo). Es claro
que (a) ⊆ a. Veamos que se verifica el recı́proco de esta inclusión. Sea b ∈ a otro elemento
cualquiera. Hagamos la división euclı́dea
b = qa + r, φ(r) < φ(a) = n.
Nótese que r ∈ a porque r = b + (−q)a ∈ a. Por tanto, si r 6= 0, φ(r) ∈ Sa . Pero φ(a) = n =
min(Sa ), luego no es posible que φ(r) ∈ Sa y la única posibilidad es que r = 0. En ese caso
tendremos que b = qa, luego a | b o, equivalentemente, b ∈ (a), con lo que habremos probado
la igualdad entre los ideales (a) y a. 

Teorema 3.4.5 (Algoritmo de Euclides). Sea (R, φ) un dominio euclı́deo y sean a, b ∈ R


tales que φ(a) ≥ φ(b). Sea a = (a, b) el ideal que generan. Definamos la siguiente sucesión de
elementos de R:

r0 := a, r1 := b.
Para i ≥ 2, si ri−1 6 0, definamos ri como cualquier elemento que satisface:
=
ri ∈ rem(ri−2 , ri−1 ),
(i.e. ri es un resto euclı́deo de la división de ri−2 por ri−1 ). Si ri− = 0, definamos ri = 0. Se
tiene:
i) Para cada n ∈ N, a = (rn , rn+1 ). Es decir, el ideal a es invariante durante el proceso.
ii) Existe n ∈ N, tal que rn = 0 y rm ≥ 0 para cada m ≥ n.
iii) Sea m ∈ N dado mediante
m := max{n ∈ N : rn 6= 0}.
Entonces, rm := gcd(a, b).
Demostración. Veamos cada airmación:
• La afirmación i) dice que el ideal a no es modificado a lo largo del proceso, con lo que
se convierte en un invariante del algoritmo. Hagamos la prueba por inducción en n.
El caso n = 0 es obvio dado que a = (a, b) = (r0 , r1 ).
Supongamos ahora que el resultado es cierto para el casi n, es decir, sunpogamos
que a = (rn , rn+1 ). Ahora observamos que rn+2 ∈ rem(rn , rn+1 ). Por tanto, existe
qn+2 ∈ R tal que rn = qn+2 rn+1 + rn+2 . Pero esto implica inmediatamente que
rn ∈ (rn+1 , rn+2 ), con lo cual concluimos a ⊆ (rn+1 , rn+2 ). Pero esa misma identidad
nos indica que rn+2 = rn + (−qn+2 )rn+1 , con lo que rn+2 ∈ (rn , rn+1 ) = a y, por
tanto, (rn+1 , rn+2 ) ⊆ a.
• La propiedad ii) es inmediata por lo siguiente: tenemos una cadena descendente de
elementos de Z:
φ(r0 ) ≥ φ(r1 ) > φ(r2 ) > φ(r3 ) > · · · > φ(rj ).
Además, esta cadena descendente está inferiormente acotada porque φ(a) ≥ φ(0), para
todo a 6= 0. Entonces, ha de existir un k tal que rk = 0, como afirma la propiedad ii).
• La propiedad iii) es consecuencia inmediata de las dos anteriores. Dada la definición
de rm (que está bien definido por causa de ii)), y aplicando i) tendremos que rm+1 = 0
y
(a, b) = a = (rm , rm+1 ) = (rm , 0) = (rm ),
y se sigue que rm es el máximo común divisor de a y b por nuestra definición de
máximo común divisor en dominios de ideales principales.


Teorema 3.4.6 (Identidad de Bézout con cotas). Sea (R, φ) un dominio euclı́deo. Sean
a, b ∈ R dos elementos no nulos, y sea h su máximo común divisor.
i) Supongamos que la función euclı́dea φ verifica las propiedades siguientes:
(a) ∀a, b ∈ R, φ(a + b) ≤ φ(a) + φ(b),
(b) ∀a, b ∈ R, φ(ab) ≤ φ(a)φ(b),
(c) ∀a, b ∈ R, φ(ab) = φ(a)φ(b), ∀a, b ∈ R, ab 6= 0.
150 3. DIVISIBILIDAD EN ANILLOS: DIP’S, NOETHER Y DE’S. ALGORITMOS

(d) φ(a) > 0, ∀a ∈ R, a 6= 0.


Entonces, existen x, y ∈ R tales que
h = xa + yb,
con
φ(x) ≤ φ(b), φ(y) ≤ φ(a).
ii) Si, en lugar de las propiedades anteriores, la función euclı́dea φ verifica las siguientes;
(a) ∀a, b ∈ R, φ(a + b) ≤ max{φ(a), φ(b)},
(b) ∀a, b ∈ R, φ(ab) ≤ φ(a) + φ(b),
(c) ∀a, b ∈ R, φ(ab) = φ(a) + φ(b), ∀a, b ∈ R, ab 6= 0.
(d) φ(a) > 0, ∀a ∈ R, a 6= 0.
Entonces, si a, b 6∈ R× (es decir, si ninguno de los dos es unidad) , existen x, y ∈ R
tales que
h = xa + yb,
con
φ(x) < φ(b), φ(y) < φ(a).
Demostración. Supongamos que h es el máximo común divisor de a y b. Entonces,
existen α, β ∈ R tales que
h = αa + βb.
Supongamos que φ(a) ≥ φ(b): Por ser dominio euclı́deo, existen q, x ∈ R tales que
α = qb + x, φ(x) < φ(b).
Entonces,
h = (qb + x)a + βb = xa + (β + qa)b.
Ahora, escribamos y = (β + qa) y tenemos φ(h) ≤ min{φ(a), φ(b)} por ser h | a y h | b. que
φ((β + qa))b) = φ(h − xa).
• En el caso i), el caso β +qa = 0 (o, equivalentemente, h = xa) es evidente y lo dejamos
para el lector. Supongamos queβ + qa 6= 0. Tendremos:
φ(y)φ(b) = φ((β + qa))φ(b) = φ((β + qa))b) ≤ φ(h) + φ(xa).
Luego
φ(y)φ(b) ≤ φ(h) + φ(x)φ(a) ≤ (1 + φ(x))φ(a).
Pero φ(x) ≤ φ(b) − 1 y φ(h) ≤ φ(b), por lo que tendremos:
φ(y)φ(b) ≤ φ(b) + (φ(b) − 1)φ(a) = φ(b)φ(a).
Si b 6= 0, claramente tendremos φ(b) 6= 0 y φ(y) ≤ φ(a).
• En el caso ii), si x 6= 0, tendremos
φ(y) + φ(b) = φ(yb) = φ((β + qa))b) ≤ max{φ(h), φ(xa)} = max{φ(h), φ(x) + φ(a)}.
Como h es un divisor de a, entonces φ(h) ≤ φ(a). De otro lado, como x 6= 0 φ(x) > 0
y φ(x) ∈ Z, Por tanto, φ(x) ≥ 1 y, en conclusión, φ(x) + φ(a) ≥ φ(a) ≥ φ(h). Es decir,
en este caso tendremos:
φ(y) + φ(b) ≤ max{φ(h), φ(x) + φ(a)} = φ(x) + φ(a).
φ(y) + φ(b) ≤ φ(x) + φ(a) ≤ φ(b) − 1 + φ(a) = (φ(a) − 1) + φ(b).
Concluimos que
φ(y) ≤ φ(a) − 1,
como pretendı́amos.
En el caso x = 0, tendremos que el máximo común divisor h de a y b ha de verificar
h = xa + yb = yb.
Por tanto, y es una unidad de anillo, φ(y) = φ(1) y φ(a) ≥ φ(y). Como a no es unidad,
se tiene φ(a) > φ(y) y φ(x) < φ(b) como pretendı́amos.

3.4. DOMINIOS EUCLÍDEOS 151

Los dos casos del Teorema anterior se corresponden con los casos básicos R = Z (caso (i)) y
R = K[X] (caso ii)). Nótese que el caso de K[X] hace pensar que el grado (deg) se comporta
como un logaritmo de un valor absoluto que, sin embargo, es el que aparece en el caso de Z.
Esto se expresa mediante los siguientes Corolarios:
Corolario 3.4.7 (Bézout con cotas en Z). Sean a, b ∈ Z dos enteros no nulos, y sea h su
máximo común divisor. Entonces, existen x, y ∈ R tales que
h = xa + yb,
con
|x| ≤ |b|, |y| ≤ |a|.
Demostración. Basta con observar que el valor absoluto | · | verifica las condiciones indi-
cadas en el Teorema anterior. 
Corolario 3.4.8 (Bézout con cotas en K[X]). Sean f, g ∈ K[X] dos polinomios univariados
no nulos y no unidades (i.e. f, g 6∈ K), y sea h su máximo común divisor.
Entonces, existen α, β ∈ K[X] tales que
h = αf + βg,
con
deg(α) < deg(g), deg(β) < deg(f ).
Demostración. Simplemente recordar (K[X], deg) como dominio euclı́deo. 

Observación 3.4.9. El algoritmo de Euclides no siempre es un algoritmo adecuado para el


cálculo de máximos comunes divisores. Distinguiremos dos casos: Z y K[X]. En el primer caso,
analizaremos el número de divisiones necesarias para calcular el gcd de dos números enteros y
veremos que el algoritmo de Eudlides es mucho más efciente que el mal hábito escrolar de usar
las factorizaciones en números primos. En el segundo caso, trataremos el caso de polinomios
univariados con técnicas de eliminación “à la Sylvester”.
3.4.2. Existencia de factorización en primos en dominios euclı́deos (Opcional).
En la Sección 3.3 anterior, hemos demostrado que todo elemento de un dominio de ideales
principales admite una factorización como producto de elementos primos. También hemos
visto que los dominios euclı́deos son dominios de ideales principales (ver Teorema 3.4.4), con
lo que podı́amos concluir que en los dominios euclı́deos todo elemento se factoriza en producto
finito de primos. Sin embargo, para probar el Teorema 3.3.10 sobre los dominios de ideales
principales, hemos usado el Axioma de Elección Dependiente. Para aquellos puristas que no
deseen admitir este axioma de la Teorı́a de Conjuntos, redemostramos el enunciado, sólo en el
caso de dominios euclı́deos, para lo cual basta con usar que el orden usual de los naturales es
un buen orden.
Teorema 3.4.10 (Existencia de factorización en dominios euclı́deos). Sea (R, φ) un do-
minio euclı́deo. Entonces, todo elemento a ∈ R es producto finito de elementos primos (o irre-
ducibles) y unidades en R. Es decir, para cada a ∈ R, existen u ∈ R× y existen {p1 , . . . , pn } ⊆ R
un conjunto finito de primos tales que
a = up1 · · · pn .
Demostración. Como los dominios euclı́deos son dominios de ideales principales, los el-
ementos son primos si y solamente si con irreducibles. Si a ∈ R× es unidad, ya tenemos la
prueba. Si a ∈ R no es unidad, consideremos el siguiente conjunto.
Sa := {φ(p) : p no es producto finito de irreducibles y unidades, (a) ⊆ (p)} ⊆ Z.
Supongamos que a no es producto de irreducibles y unidades. Entonces, φ(a) ∈ Sa 6= ∅ es
un conjunto no vacı́o de números enteros. Además está acotado inferiormente por φ(1). Todo
conjunto no vacı́o y acotado inferiormente de enteros posee elemento minimal. Por tanto, Sa
posee un mı́nimo.
Sea φ(p) = min(Sa ) ese mı́nimo de tal modo que p no es producto de irreducibles y unidades.
Luego p no es unidad, ni tampoco es irreducible. Pero esto significa que existen x, y ∈ R tales
que:
152 3. DIVISIBILIDAD EN ANILLOS: DIP’S, NOETHER Y DE’S. ALGORITMOS

• p = xy
• x 6∈ R× , y 6∈ R× ,
• x 6∼ p, y 6∼ p.
Esto significa que los siguientes contenidos son estrictos:
(p) $ (x) $ R, (p) $ (y) $ R.
En particular, φ(p) > φ(x) y φ(p) > φ(y) como consecuencia de esos contenidos estrictos. Luego
φ(x) 6∈ Sa , φ(y) 6∈ Sa .
Además, se tiene
(a) ⊆ (x), (a) ⊆ (y).
Por tanto, de las dos condiciones que definen Sa , φ(x) no puede satisfacer la primera de esas
condiciones “x no es producto finito de irreducibles y unidades”. Luego x es producto finito de
unidades e irreducibles. Y lo mismo pasa con y. Es decir,
x = uq1 q2 · · · qn , y = vt1 t2 · · · tm ,
×
donde u, v ∈ R y {q1 , q2 , . . . , qn , t1 , t2 , . . . , tm } son irreducibles en R. Pero, entonces, como
p = xy concluimos:
p = (uv)q1 q2 · · · qn t1 t2 · · · tm ,
y habremos concluido que p es producto finito de irreducibles y unidades. Luego la única opción
es que Sa = ∅ y, por tanto, a debe ser un producto finito de unidades e irreducibles. 

Corolario 3.4.11. Si R es un dominio euclı́deo y no es cuerpo, entonces existen elementos


irreducible no nulos en R, es decir,
{(p) : p es primo en R} =
6 ∅.
Demostración. Basta con observar que si R no es un cuerpo, debe existir un elemento
a ∈ R \ R× y a 6= 0. Entonces a es producto finito de unidades e irreducibles. Pero como no es
unidad, debe haber algún divisor irreducible de a y como a 6= 0 debe haber algún irreducible
no nulo que es divisor de a, luego hay algún irreducible (o primo) no nulo en R. 

3.4.3. Existen dominios de ideales principales que no son dominios euclı́deos:


Dedekind-Hasse (Opcional). Hemos visto que los dominios euclı́deos son dominios de ide-
ales principales. Es conveniente observar que este contenido es estricto. Los ejemplos se conocen
desde [Mtz, 1949], aquı́ usaremos la prueba que se exhiben en [Wls, 1973], basada en el Cri-
terio de Dedekind-Hasse, para probar que nuestro ejemplo es un dominio de ideales principales.
Para probar que no es euclı́deo, usaremos la no existencia de divisor lateral universal descrita
en el Problema 131. Veámos el Ejemplo: Consideremos el anillo
 √ 
1 + −19
R := Z .
2
Lema 3.4.12. El anillo  √ 
1+ −19
R=Z ,
2
no es dominio euclı́deo.
Demostración. Comencemos recordando el conjunto de las unidades de este anillo (que
hemos estudiado en el Problema 46) donde vimos la siguiente igualdad:
  √ ×
1 + −19
Z = {±1}.
2
Seguidamente recordemos el Problema 131. En él vimos que si un aillo no posee divisores
laterales universales, entonces no puede ser dominio euclı́deo para ninguna función euclı́dea
posible. Supongamos que tal divisor lateral universal existe y sea
 √   √ 
1 + −19 1 + −19
u := a + b ∈Z ,
2 2
3.4. DOMINIOS EUCLÍDEOS 153


−19
con a, b ∈ Z ese elemento. Entonces, dado el elemento 2 ∈ Z[ 1+ 2 ], u debe dividir a alguna
de las tres cantidades siguientes:
1 = 2 − 1, 2 = 2 − 0, 3 := 2 + (−1).
Como los divisores laterales universales no son unidades, podemos descartar que u | 1 y nos
quedamos con las otras dos posibilidades.
Definamos la función
h √ i
Φ√−19 : Z 1+ 2−19 −→ Z+
 √ 
2
y 2
1+ −19
7−→ x + 2 − −19y

x+y 2 .

2

Nótese que se trata de multiplicar por el conjugado complejo y, por tanto, da lugar al módulo.
Esto es
  √    √    √ 

1 + −19 1 + −19 1 + −19
Φ −19 x + y = x+y x+y ,
2 2 2
donde · significa conjugado complejo. Por tanto, Φ√−19 calcula el valor absoluto (el módulo)
del número complejo al que se le aplica y, en particular, es un entero positivo. Más aún, nótese
que

y 2 −19y 2
   
1 + −19
= x2 + xy + 5y 2 ∈ Z,

Φ√−19 x + y = x + −
2 2 2
es un número entero siempre que x e y sean enteros. Usaremos esta función y supongamos que
u | 2 o u | 3.
• Supongamos la primera opción: u | 2. Entonces, han de existir x, y ∈ Z tales que
  √    √    √ 
1 + −19 1 + −19 1 + −19
u x+y = a+b x+y = 2.
2 2 2
pero, entonces,
  √    √ 
1 + −19 1 + −19
Φ√−19 a + b Φ√−19 x + y = Φ√−19 (2) = 4.
2 2
Por tanto, el siguiente número entero es un divisor entero positivo de 4:
  √ 
1 + −19

Φ −19 a + b = a2 + ab + 5b2 .
2
Pero eso sólo es posible si b = 0 (porque si b es un entero no nulo, a2 +ab+5b2 ≥ 5 > 4).
En el caso b = 0, necesaiamente u = a ∈ {±2}. Pero, si u es un elemento de
ese conjunto, por ser divisor lateral universal, debe ser divisor de alguno de los tres
elementos siguientes:
 √   √   √ 
1 + −19 1 + −19 1 + −19
− 1, , + 1,
2 2 2
lo que no es posible en ningún caso.
• Supongamos la segunda opción: u | 3. Entonces, han de existir enteros x, y ∈ Z tales
que se da la siguiente igualdad:
  √    √ 
1 + −19 1 + −19
a+b x+y = 3.
2 2
De nuevo, usando Φ√−19 , tendremos que
a2 + ab + 5b2 x2 + xy + 5y 2 = 9.
 

Distingamos dos casos:  


– Si b 6= 0, entonces, a2 + ab + 5b2 > 3, con lo que, forzosamente, a2 + ab + 5b2 =
9 y, x2 + xy + 5y 2 = 1. Pero
 √  √  √ 
1 + −19 1 − −19 1 + −19
1− = ∈Z .
2 2 2
154 3. DIVISIBILIDAD EN ANILLOS: DIP’S, NOETHER Y DE’S. ALGORITMOS

Por tanto, tendremos


  √    √ 
1 + −19 1 − −19
1 = x2 + xy + 5y 2 = x + y

x+y ,
2 2
y, en consecuencia,
  √    √ ×
1 + −19 1 + −19
x+y ∈ Z = {±1}.
2 2
Por tanto, u ∈ {±3} y u debe ser un divisor lateral universal, luego debe dividir,
como en el caso precedente, a alguno de los siguientes elementos:
 √   √   √ 
1 + −19 1 + −19 1 + −19
− 1, , + 1,
2 2 2
lo que no es posible en ningún caso con u ∈ {±3}.
– En el caso b = 0, u = a será un divisor entero de 3 y no es unidad, con lo que
u ∈ {±3} y tenemos la misma dificultad que en el caso anterior.
En conclusión, el anillo √
 
1 + −19
Z
2
no posee divisores laterales universales, con lo que no es dominio euclı́deo. 
Proposición 3.4.13 (Criterio de Dedekind-Hasse). Sea R un anillo cualquiera decimos
que R verifica el criterio de Dedekind-Hasse si verifica lo siguiente:
i) Existe |·| : R −→ N una función definida positiva (i.e. [|a| ≥ 0, ∀a ∈ R], y [|a| = 0 ⇐⇒ a = 0]).
ii) La función | · | satisface:
Para cualesquiera x, y ∈ R no nulos o bien y | x, o bien existen u, v ∈ R tales que
0 < |ux − vy| < |y|.
Si R es un anillo que satisface el Crieterio de Dedekind-Hasse, entonces R un dominio de
ideales principales.
Demostración. Es bastante evidente. Consideremos a un ideal de R, supongamos que
a 6= (0), que ya serı́a un ideal principal, y consideremos el siguiente conjunto no vacı́o de
números naturales:
N := {|a| ∈ N : a ∈ a, a 6= 0}.
Este conjunto posee un mı́nimo, |y| ∈ N , con y ∈ a, y 6= 0. Por tanto, el ideal b = (y) es
principal y b ⊆ a. Ahora consideremos x ∈ a un elemento cualquiera no nulo. Entonces, por
la condición verificada por | · |, o bien y | x (en cuyo caso x ∈ b = (y), o bien existen u, v ∈ R
tales que
0 < |xu − yv| < |y|.
Pero, en este segundo caso, como x, y ∈ a, entonces, ux, vy ∈ a (porque es ideal) y, finalmente,
ux−vy ∈ a. Pero la desigualdad anterior nos dice que ux−vy 6= 0 y contradice la minimalidad de
|y| en N . Por tanto, no se puede dar la segunda condición para ningún x ∈ a y, en consecuencia,
y | x, para todo x ∈ a, con lo que habremos probado la igualdad a = b. 
Lema 3.4.14. El anillo  √ 
1+ −19
R=Z
2
verifica el criterio de Dedekind-Hasse para el cuadrado del valor absoluto complejo.
Demostración. Recuérdese que el cuadrado del valor absoluto complejo es la función
Φ√−19 usada en la demostración del Lema 3.4.12 anterior. Por simplicidad de la notación
escribiremos Φ en lugar de Φ√−19 .
Consideremos x, y ∈ R dos elementos no nulos tales que y - x. Entonces, queremos probar que
existen u, v ∈ R tales que
0 < Φ(ux − vy) < Φ(y).
Pero, nótese que Φ(rs) = Φ(r)Φ(s) (es el cuadrado de la norma usual en C), luego esta última
desigualdad es equivalente a:
3.4. DOMINIOS EUCLÍDEOS 155

 
x
0 < Φ(u − v) < 1.
y
Como y - x, tendremos que existen a, b, c ∈ Z enteros, con c > 0 y gcd(a, b, c) = 1 tales que
  √
x a + b −19
= .
y c
Distingamos varios casos:
• Supongamos c ≥ 5. Como gcd(a, b, c) = 1, existen d, e, f ∈ Z tales que
ae + bd + cf = 1.
√  
Elijamos u = d + e −19 y el producto u xy tiene la forma siguiente:
√ √

   
x a + b −19  (ad − 19be) + (ae + bd) −19
u = d + e −19 = .
y c c
Luego, como ae + bd = 1 − cf , tendremos


 
x (ad − 19be) −19
u = + − f −19.
y c c
Como (ad − 19be), c ∈ Z, podemos aplicar el algoritmo euclı́deo en Z (modificado con
la condición descrita en el Problema 84 y tendremos:
(ad − 19be) = qc + r,
con 0 ≤ |r| ≤ 2c . Por tanto, queda:


 
x r −19
u =q+ + − f −19.
y c c
Esto nos lleva a


 
x r + −19
u − (q − f −19) = .
y c

Poniendo v = (q − f −19), tendremos:
  √
x r + −19
u −v = ,
y c
con lo que queda solemente por probar que si c > 5, se tiene

r + −19 (r2 + 19) r2 19 1 19
Φ( )= 2
≤ 2 + < + < 1.
c c c 36 4 36
En el caso c = 5, tendremos r ≤ 2 y, por tanto,

r + −19 r2 19 4 19
Φ( )≤ 2 + < + < 1.
c c 25 25 25
Quedan sólo los caso c = 2, 3, 4. Veámoslos separamente.
• Si c = 2. Como gcd(a, b, c) = gdc(a, b, 2) = 1, es claro que a y b tienen distinta paridad
(ni ambos son pares, ni ambos son impares, simultáneamente), luego a − b − 1 ∈ 2Z.
Elijamos v dado por:
√  √   √ 
(a − 1) + b −19 (a − b − 1) 1 + −19 1 + −19
v= = +b ∈Z .
2 2 2 2
Elijamos u = 1 y tenemos
 
x 1
Φ(u − v) = Φ( ) < 1.
y 2
156 3. DIVISIBILIDAD EN ANILLOS: DIP’S, NOETHER Y DE’S. ALGORITMOS

• Si c = 3. Como gcd(a, b, c) = gcd(a, b, 3) = 1 tendremos que


a2 + 19b2 = a2 + b2 6= 0 mod 3,
2 2
porque 3 es primo en Z[i] y si 3 | (a + b ), entonces 3 | (a + bi) o 3 | (a − bi). En
cualquiera de las dos opciones, 3 deberı́a ser divisor de a y b simultáneamente, lo que
contradice el hecho gcd(a, b, 3) = 1.
Aplicando división euclı́dea, existirán q, r ∈ N, con r 6= 0 y r < 3 tal que
a2 + 19b2 = q3 + r.

Elijamos u = a − b 19 y v = q ∈ Z, tendremos
(a2 + 19b2 ) (a2 + 19b2 ) − 3q
 
x r
Φ(u − v) = Φ( − q) = Φ( ) = Φ( ) < 1.
y 3 3 3
• Si c = 4. Como gcd(a, b, c) = gcd(a, b, 4) = 1, entonces, a y b no poseen la misma
paridad. En particular, a + b y a − b son ambos impares y no divisibles por 2. Ahora,
obsérves que
a2 + 19b2 = a2 .b2 6= 0 mod 4,
porque 2 - (a + b) y 2 - (a − b). Repetimos el mismo argumento que en el caso 3.
Hallamos cociente y resto de la división de a2 + b2 19 por 4:
a2 + 19b2 = q4 + r,

con u = a − b −19 y v = q, tendremos que
 
x
Φ(u − v) < 1.
y

Teorema 3.4.15 (Un ejemplo de un DIP que no es eculı́deo). El anillo
 √ 
1 + −19
R=Z
2
es un dominio de ideales principales que no es dominio euclı́deo.
Demostración. El Lema 3.4.12 nos muestra que no es un dominio euclı́deo y el Lema
3.4.14 prueba que verifica la condición de Dedekind-Hasse y es, por tanto, un dominio de
ideales principales. 
3.4.4. Ejercicios y problemas de las secciones 3.2, 3.3 y 3.4.
Problema 118. Sea p ∈ N un √ primo. Sea m ∈ Z √ un entero con m ≤ −(p + 1). Prueba que,
entonces, p es irreducible en Z [ m]. Discute si Z[ −5] es dominio√de ideales principales. Si
la respuesta es afirmativa, ¿Será cierto que toda factorización en Z[ −5] es única?.
Problema 119. Sea p ∈ N un primo. Sea mh ∈ Z uni entero con m ≡ 1 mod 4 y m ≤ −(4p+1).

Prueba que, entonces, p es irreducible en Z 1+2 m .

Problema 120. Sea m ∈ Z un entero positivo que no es un cuadrado perfecto. Sea α =


√ √ √ ×
a + b m ∈ Z[ m]. Prueba que si a2 − mb2 ∈ {±1}, entonces α ∈ (Z[ m]) .
Problema 121. Como en el problema previo, sea m ∈ Z √un entero √
positivo que no es un
1+ m 1+ m
cuadrado perfecto y tal que m = 1 mod 4. Sea α = a + b 2 ∈ Z[ 2 ]. Prueba que si se
verifica  
2 1−m 2
a + ab + b ∈ {±1},
4
 √ ×
entonces α ∈ Z[ 1+2 m ] .

Problema 122. Con las notaciones habituales, hay que realizar las siguientes tareas:
• Prueba que el ideal (1 − 3i, 3 − i) es un ideal principal
√ en el anillo de Gauss Z[i].
• Prueba las siguientes
√ relaciones
√ entre ideales de Z[ −5]:
i) (2, 1 + √−5) = (2, 1 − √−5),
ii) (3, 1 + −5) 6= (3, 1 − −5),
3.4. DOMINIOS EUCLÍDEOS 157

√ √
iii) (2, 1 + √−5) 6= (3, 1 + √−5),
iv) (2, 1 + −5) 6= (3, 1 − −5).
Problema 123. Sea R un dominio de integridad. Sean a, b, c ∈ R tales que (a, c) = R. Prueba
que (a, bc) = (a, b).
√ √ √
Problema 124. Prueba que 17 − 3 3 y 83 + 47 3 son asociados en Z[ 3].
√ √
Problema 125. Expresar 2 + 8 −5 como producto de irreducibles √ en Z[ −5]. ¿Es posible
hallar más de una expresión?. Intentar lo mismo con 6. ¿Es Z[ −5] dominio de factorización
única?, ¿será un dominio de ideales principales?.
√ √
Problema
√ 126. Prueba que 10 no es primo en Z[ 10] y probar que sı́ es irreducible. Concluir
que Z[ 10] no es un dominio de ideales principales.
Problema 127. Sea r ∈ Z \ {−2, 0} un entero y consideremos el polinomio:
f (X) := X 3 + rX + 1.
Sea R el anillo cociente Z[X]/(f ). Prueba que R es un dominio de integridad. Sea θ := X + (f )
la clase definida por el elemento X ∈ Z[X]. Prueba que θ ∈ R× .
Problema 128. Sea m ∈ Z un entero sin factores primos múltiples. Definamos la función:

φm : Q[ √ m] −→ Q,
a + b m 7−→ |a2 − mb2 |.
Nótese que √ √ √
φm (a + b m) = |(a + b m)(a − b m)|.
Prueba que se verifican las siguientes propiedades:

i) φm (Z[ m] ⊆ N,
ii) φm (x) = 0√⇐⇒ x = 0,
iii) ∀x, y ∈ Z[ m], φm (xy) = φm √(x)φm (y),
iv) φm (xy) ≥ φm (x), ∀x, y ∈ Z[ m], y 6= 0.
√ √
Problema 129. Sea φm y Z[ m] como en el problema anterior. Prueba que (Z[ m], φm ) es
un dominio euclı́deo si y solamente si se verifica la siguiente propiedad:
√ √ 
∀x, y ∈ Q, ∃a, b ∈ Z, tales que φm (x + y m) − (a + b m) < 1
Problema
√ 130. Prueba que si m ∈ Z es un entero negativo sin factores múltiples, entonces
(Z[ m], φm ) es dominio euclı́deo si y solamente si m ∈ {−2, −1}.
Problema 131 (Divisor Lateral Universal). Sea R un dominio de integridad que no es
cuerpo. Un elemento u ∈ R que no está en R× ∪ {0} se denomina divisor lateral universal en
R si verifica:
∀x ∈ R, ∃z ∈ R× ∪ {0}, tal que u | x − z.
Se pide probar las afirmaciones siguientes :
i) Si (R, φ) es un dominio euclı́deo, entonces posee divisor lateral universal. (Pista:
Elegir un elemento u ∈ R que minimice {φ(x) : x ∈ R, x 6∈ R× ∪ {0}}).
m es un entero sin factores múltiples, tal que m = 2, 3 mod 4 y m < −2, entonces
ii) Si √
Z[ m] no posee divisores√laterales universales y, en consecuencia, no existe ninguna
función euclı́dea sobre Z[ m]. (Pista: si hubiera divisor universal lateral,√entonces
tiene que ser divisor de alguno de los elementos 2 − 1, 2 + 0, 2 + 1 en Z[ m]. Los
√ {±2,√±3}.√ Pero ninguno de esos 4 elementos
únicos divisores laterales posible serán
divide a ninguno de los elementos m − 1, m, m + 1.)
Problema 132. Demuestra que si K es un cuerpo, el anillo de series de potencias formales
en una variable K[[X]] verifica las siguientes propiedades:
i) Los ideales de K[[X]] no nulos son de la forma (X k ), con k ∈ N ( Hint: Usa el orden
en cero discutido en el Problema 93).
ii) Concluye que K[[X]] es un dominio de ideales principales y un anillo noetheriano.
iii) Prueba que su único ideal maximal es el ideal m = (X).
iv) Describe la factoriación en primos de cualquier elemento de K[[X]].
v) ¿Admite K[[X]] una función euclı́dea?.
158 3. DIVISIBILIDAD EN ANILLOS: DIP’S, NOETHER Y DE’S. ALGORITMOS

3.4.4.1. Problemas sobre el Lema de Dickson. En esta Subsección encadenaremos


tres problemas que demuestran una serie de resultados clásicos. De hecho, probaremos que si
K es un cuerpo, entonces el anillo de polinomios K[X1 , . . . , Xn ] satisface la propiedad descrita
en el Teorema 3.3.2: todo ideal de K[X1 , . . . , Xn ] son finitamente generados. Comenzaremos
con un sencillo resultado combinatorio sobre el monoide conmutativo (Nn , +) conocido como
Lema de Dickson (cf. [Dix, 1913]), aunque parece que también era conocido por P. Gourdan.
Aplicaremos el Lema de Dickson para probar la existencia de bases estándar (o de Gröbner) y,
al final, concluiremos el resultado buscado conocido como Hilbert Basissatz para K[X1 , . . . , Xn ].
Recomendamos leer sobre órdenes monomiales, División de Hironaka y los problemas descritos
en la Subsección 1.4.4.2.

Problema 133 (Lema de Dickson). Consideremos el monoide (Nn , +) y consideremos la


relación de orden siguiente:
Dados α = (α1 , . . . , αn ), β = (β1 , . . . , βn ) ∈ Nn , diremos que α es menor que β con respecto al
Orden de Dickson si se satisface
∃ γ ∈ Nn , α + γ = β.
Escribiremos α  β para indicar esa relación. Se pide probar:
i) En el caso n = 1 el orden  es el orden usual en N.
ii) La relación  es una relación de orden sobre Nn . Discutir también si es un orden
monomial (en el sentido de los discutido en la Subsección 1.4.4.2, Problema 67).
iii) Si ≤ es un orden monomial en Nn , para cada α, β ∈ Nn , si α  β, entonces α ≤ β.
En otras palabras, si α es menor que β para el Orden de Dickson, entonces también
sucede que α es menor que β para cualquier orden monomial en Nn .
iv) Para cada α = (α1 , . . . , αn ) ∈ Nn , denotemos por
X α := X1α1 · · · Xnαn ∈ K[X1 , . . . , Xn ],
el monomio cuyos exponentes vienen dados por las coordenadas de α, siendo K un
cuerpo cualquiera. Entonces, para cada α, β ∈ Nn se tiene que
α  β ⇐⇒ X α | X β ,
donde | significa “divide” en K[X1 , . . . , Xn ].
v) Lema de Dickson: Con las notaciones predentes, todos subconjunto no vacı́o S ⊆ Nn
posee un número finito de elementos minimales para el orden . ( Hint: Esta es,
obviamente, la parte más delicada del Problema. Para demostrarlo conviene hacerlo
por inducción en n. Para el caso n = 1 es sencillo de verificar por i). Para n ≥ 2,
se toma la proyección π : Nn −→ Nn−1 . Se considera la proyección π(S) ⊆ Nn−1 que,
por hipótesis inductiva, tiene un número finito de elementos minimales para  sobre
Nn−1 . Ahora basta con analizar las imágenes inversas π −1 ({x}) para cada minimal x
de S.)
Obsérvese que el Lema de Dickson sirve para , aunque no sea un orden monomial para n ≥ 2,
pero será usado para órdenes monomiales que son buen orden en los problemas que siguen,
Problema 134 (Existencia de Bases de Estándar (o de Gröbner)). Probaremos que los
ideales en K[X1 , . . . , Xn ] posee sistema generadores finitos especiales, asociados a los órdenes
monomiales dados. Para probarlo, comencemos definiendo los conjuntos siguientes (ver también
Subsección 1.4.4.2 y Problema 68:
• Para cada α ∈ Nn , definamos su escalón E(α) mediante:
E(α) := α + Nn = {α + β : β ∈ Nn }.
• Dado un monomio X α ∈ K[X1 , . . . , Xn ] denotemos su exponente mediante:
exp(X α ) = α ∈ Nn .
• Sea ≤ un orden monomial en Nn . Para cada polinomio f ∈ K[X1 , . . . , Xn ], supong-
amos que el término director LT (f ) de f con respecto al orden monomial ≤ es
LT (f ) := aX α , llamaremos exponente monomial de f con respecto al orden monomial
≤ sobre Nn a
exp≤ (f ) := α ∈ Nn .
3.5. EFICIENCIA Y ALGORITMO DE EUCLIDES 159

• Dado un ideal a ⊆ K[X1 , . . . , Xn ] llamaremos conjuno de exponentes monomiales del


ideal a con respecto al orden monomial ≤ en Nn al conjunto:
exp≤ (a) := {exp≤ (f ) : f ∈ a}.
Con estas notaciones, se pide probar lo siguiente:
i) Para cada α ∈ exp≤ (a), se tiene que:
E(α) ⊆ exp≤ (a).
n
ii) Sean α1 , . . . , αs ∈ N los elementos minimales de exp≤ (a) para el orden de Dickson
 (como en el Problema precedente). Entonces,
s
[
exp≤ (a) = E(αi ).
i=1
( Hint: El contenido ⊇ es obvio. Para el otro contenido, probar que si µ ∈ exp≤ (a)
entonces ha de existir αi tal que µ ∈ E(αi ).)
iii) Con las notaciones precedentes, sean α1 , . . . , αs ∈ exp≤ (a) los elementos minimales
de exp≤ (a) para el orden de Dickson . Sean f1 , . . . , fs ∈ a elementos en el ideal tales
que
exp≤ (fi ) = αi , 1 ≤ i ≤ s.
Entonces
a = (f1 , . . . , fs ).
( Hint: De nuevo, ⊇ es obvio. Para el otro contenido usar la División de Hironaka
descrita en el Problema 68.)
Los polinomios {f1 , . . . , fs } ⊆ a que satisfacen las propiedades descritas en el apartado iii)
anterior se denominan Base de Gröbner del ideal a.
3.4.4.2. Basissatz de Hilbert en K[X1 , . . . , Xn ]. Para el siguiente problema úsense los
Problemas de la Subsección 3.4.4.1 y, muy especialmente, el Problema 134.
Problema 135 (Hilbert Basissatz para K[X1 , . . . , Xn ]). Se trata de probar la siguiente
afirmación:
Si K es un cuerpo, todo ideal a de K[X1 , . . . , Xn ] es finitamente generado y, por tanto,
K[X1 , . . . , Xn ] es un anillo noetheriano (cf. Definición 59).

3.5. Sobre la eficiencia del Algoritmo de Euclides en Z


3.5.1. Divisiones del algoritmo de Euclides en Z.
Definición 61 (Números de Fibonacci). Se define la sucesión denúmeros de Fibonacci
{Fn : n ∈ N} ⊆ Z como la sucesión dada mediante:
[F0 = 0], [F1 = 1], [∀n ∈ N, n ≥ 2, Fn = Fn−1 + Fn−2 ].
Proposición 3.5.1 (Fórmula de de Moivre-Binet). La sucesión de Fibonacci {Fn : n ∈ N}
satisface:
ϕn − ψ n
(3.5.1) Fn := √ ,
5
donde √ √
1+ 5 1− 5
ϕ := , ψ := .
2 2
Demostración. Consideremos la ecuación con coeficientes en Z siguiente:
X 2 − X − 1 = 0.
Las soluciones de esta ecuación son dadas por:
√ ! √ !
2 1+ 5 1− 5
X −X −1= X − X− = (X − ϕ)(X − ψ).
2 2
Nótese que multiplicando esta ecuación por potencias de X, transformamos la ecuación inicial
en
X n−2 (X 2 − X − 1) = X n − X n−1 − X n−2 .
160 3. DIVISIBILIDAD EN ANILLOS: DIP’S, NOETHER Y DE’S. ALGORITMOS

Como ϕ y ψ son ceros de X 2 − X − 1 también lo serán de estas ecuaciones, con lo que podemos
concluir:
(3.5.2) ϕn − ϕn−1 − ϕn−2 = 0, ψ n − ψ n−1 − ψ n−2 = 0.
Ahora bien, para n = 0 y para n = 1 la identidad 3.5.1 se satisface:

ϕ0 − ψ 0 1−1
0 = F0 = √ = √ ,
5 5

1+ 5

1− 5

5

ϕ1 − ψ 1 2 − 2 2 2 5
F1 = √ = √ = √ = √ = 1.
5 5 5 5
Para n ≥ 1 tendemos, aplicando la hipótesis inductiva:
ϕn−1 − ψ n−1 ϕn−2 − ψ n−2 ϕn−1 + ϕn−2 ψ n−1 + ψ n−2
Fn = Fn−1 + Fn−2 = √ + √ = √ − √ .
5 5 5 5
Usando las identidades de 3.5.2 concluimos:
ϕn−1 + ϕn−2 ψ n−1 + ψ n−2 ϕn ψn ϕn − ψ n
Fn = √ − √ =√ −√ = √ .
5 5 5 5 5


Corolario 3.5.2. Con las anteriores notaciones:


 ϕn 1
Fn = √ + ,
5 2
donde b·c es la función “parte entera”.
Demostración. Baste con observar que
ψn 1
|√ | < .
5 2


EL siguiente resultado es un histórico debido a G. Lamé (cf. [Lm, 1844]) y conocido desde
1844.
Teorema 3.5.3 (Lamé, 1844). Sean a > b > 0 dos números enteros positivos, supongamos
que el algoritmo de Euclides, aplicado a a y b realiza n divisiones. Entonces,
Fn+1 ≤ a, Fn ≤ b.
Demostración. Comencemos considerando la sucesión de divisiones realizadas por el al-
goritmo de Euclides:


 r0 = a,



 r1 = b,


 r0 = q1 r1 + r2 , 0 ≤ r2 ≤ r1 − 1,
.. ..


(3.5.3) . .
r = qi−1 ri−1 + ri , 0 ≤ ri ≤ ri−1 − 1,

i−2




 .. ..
. .




rn−1 = qn rn + rn+1 , rn+1 = 0.

En la que se hacen n divisiones. Podemos revisar esta secuencia de divisiones, para hacer alguna
observación.
Es claro que se tiene:
r0 > r1 > r2 > r3 > · · · > rn−1 > rn > rn+1 = 0.
Es una cadena estrictamente decreciente y, en particular, rn 6= 0 porque, en otro caso, habrı́amos
hecho n − 1 divisiones. Pero, además, por ser decreciente, qi 6= 0 para todo i. Y es que si qi = 0
para algún i, tendrı́amos:
ri−1 = 0ri + ri+1 = ri+1 , 0 ≤ ri+1 < ri < ri−1 ,
lo que nos llevarı́a a contradicción. En particular, tenemos qi ≥ 1 para todo i.
3.5. EFICIENCIA Y ALGORITMO DE EUCLIDES 161

Si comenzásemos por debajo, tendrı́amos que rn+1 = 0, pero rn 6= 0, luego:


rn+1 = 0 = F0
rn ≥ 1 = F1 .
Además, cada qi ≥ 1, luego
rn−1 = qn rn + rn+1 ≥ rn + rn+1 ≥ F0 + F1 = F2 .
Procediento inductivamente, tendremos, por ser qi ≥ 1:

 rn−2 = qn−1 rn−1 + rn ≥ rn−1 + rn ≥ F2 + F1 = F3 ,
..



.




ri−2 = qi−1 ri−1 + ri ≥ ri−1 + ri ≥ Fn−i+2 + Fn−i+1 = Fn−(i−2)+1 ,

(3.5.4) ..
.




r1 = q2 r2 + r3 ≥ r2 + r3 ≥ Fn−1 + Fn−2 = Fn ,




r0 = q1 r1 + r2 ≥ r1 + r2 ≥ Fn−1 + Fn = Fn+1 .

En conclusión, hemos probado que


a = r0 ≥ Fn+1 , b = r1 ≥ Fn .


Definición 62 (Talla de un número natural). Dados dos números naturales a, b ∈ N,


se llama talla de a en base b al número de dı́gitos necesarios para escribir a en base b y lo
denotaremos por `b (a). Es decir el número k ∈ N de elementos a0 , a1 , . . . , ak ∈ {0, 1, . . . , b − 1},
tales que
a := a0 + a1 b + · · · + ak bk .
Obsévese que se tiene que
blogb (a)c ≤ `b (a) ≤ blogb (a)c + 1,
En el caso b = 2, la cantidad `(a) := `2 (a) se denomina altura logarı́mica o talla bit del número
natural a ∈ N.

Corolario 3.5.4. Dados dos números enteros a, b ∈ Z, el número de divisiones necesario para
hallar el máximo común divisor de ambos está acotado linealmente por el número de dı́gitos
necesarios para escribir ambos números. Es decir, el número n de divisiones está acotado por
max{logc (|a|), logc (|b|)} + logc ( ϕ5 )
n≤ .
logc (ϕ)
donde logc es el logaritmo en base c.
Demostración. Si se hacen n divisiones, tenemos que Fn+1 ≤ max{|a|, |b|}. Para n ≥ 0,
se tiene que

ϕn+1
an+1 := √ ≥ Fn+1 ≥ F1 = 1.
5
Como an+1 ≥ 1 se tiene:
ϕn+1 1 ϕn+1 1 1 1 1 ϕn+1 ϕn+1
Fn+1 = b √ + c ≥ √ − = an+1 − ≥ √ an+1 = √ √ = .
5 2 5 2 2 5 5 5 5
Tomando logaritmos tenemos
(n + 1) logc (ϕ) − logc (5) ≤ log(Fn+1 ) ≤ max{logc (|a|), logc (|b|)},
Concluimos
1
(n + 1) ≤ (max{logc (|a|), logc (|b|)} + logc (5)) .
logc (ϕ)
Y, por tanto, tenemos
max{logc (|a|), logc (|b|)} + logc (5)
n≤ − 1.
logc (ϕ)
162 3. DIVISIBILIDAD EN ANILLOS: DIP’S, NOETHER Y DE’S. ALGORITMOS

max{logc (|a|), logc (|b|)} + logc (5) − logc (ϕ) max{logc (|a|), logc (|b|)} + logc ( ϕ5 )
n≤ = .
logc (ϕ) logc (ϕ)


3.6. Eliminación univariada clásica: la Matriz de Sylvester


Una de las aplicaciones clásicas de la Identidad de Bézout con cotas, expresada en el Corolario
3.4.8, es la idea de la matriz, que hoy llamamos de Sylvester, y la idea de resultante que
tendrá fuertes consecuencias en la Teorı́a de la Eliminación del Siglo XIX. La resultante de dos
polinomios aparece descrita por vez primera en el texto de J.J. Sylvester [Syl, 1840], aunque
el término “resultante” es debido a É. Bézout en su trabajo [Béz, 1779]. Cauchy redescubre la
noción de resultante pero, sabiamente, le otorga la prioridad a Sylvester que es quien la tenı́a.
Posteriormente, Sylvester desarrolla en 1853 una forma matricial de la idea original de Bézout
en su trabajo [Syl, 1853]. Aquı́ daremos un tratamiento actualizado (y formalmente completo)
de las ideas de Sylvester.

3.6.1. Extensiones algebraicas (Resumen Opcional). Comencemos con un breve


recordatorio de ciertas propiedades de las extensiones algebraicas de cuerpos y, por extensión,
de los cuerpos algebraicamente cerrados y de las clausuras algebraicas de cuerpos.
Definición 63 (Elementos Algebraicos y Trascedentes). Sea K ⊆ L una extensión de
cuerpos y sea ζ ∈ L un elemento. Decimos que ζ es algebraico sobre K si existe un polinomio
no nulo f ∈ K[X] tal que f (ζ) = 0.
A los elementos de L que no son algebraicos sobre K se les denomina elementos trascendentes
sobre K.

Proposición 3.6.1. Sea K ⊆ L una extensión de cuerpos y sea ζ ∈ L. Definamos :


AnnK (ζ) := {f ∈ K[X] : f (ζ) = 0}.
Entonces,
i) AnnK (ζ) es un ideal principal en K[X], distinto del ideal (0). Denotaremos por
IrrK (ζ) al generador de ese ideal y lo denominaremos polinomio mı́nimo de ζ sobre
K.
ii) El ideal AnnK (ζ) es un ideal primo o, equivalentemente, IrrK (ζ) es un elemento
primo del anillo K[X].
Demostración. La propiedad i) es obvia: si f, g ∈ K[X] se anulan en ζ, también se
anulará f + g y f − g. De otro lado, si f ∈ K[X] y g ∈ AnnK (ζ), entonces f g también se anula
en ζ. Por tanto AnnK (ζ) es un ideal de K[X]. Como existe un polinomio no nulo f ∈ K[X]
que se anula en ζ, entonces f ∈ AnnK (ζ) y este ideal no puede ser el idesl (0). Finalmente,
como K[X] es dominio de ideales principales, AnnK (ζ) es un ideal principal.
Supongamos ahora que f (X) = IrrK (ζ) ∈ K[X]. Veamos que f es irreducible y, por el Teorema
3.2.14, será un elemento primo de K[X]. En primer lugar, f es un polinomio no nulo porque
AnnK (ζ) es un ideal no nulo.
Supongamos, entonces, que f es reducibe en K[X] y que existen g, h ∈ K[X] no unidades tales
que f = gh. Las unidades en K[X] son los elementos no nulos de K (esto es K \ {0}). pero ni
g ni h pueden ser nulos porque f no lo es. De otro lado, sabemos que
0 = f (ζ) = g(ζ)h(ζ).
Esta igualdad se da en L que es un cuerpo y, en particular, un dominio de integridad. Por
tanto, concluimos que o bien g(ζ) = 0 o h(ζ) = 0. Supongamos, sin pérdida de la generalidad,
que g(ζ) = 0. Entonces, g ∈ AnnK (ζ). Como f (X) = IrrK (ζ) genera AnnK (ζ), entonces f | g.
En conclusión, h ha de ser una unidad en K[X] (i.e. un polinomio no nulo de grado 0) y f será
irreducible. 
3.6. ELIMINACIÓN UNIVARIADA CLÁSICA: LA MATRIZ DE SYLVESTER 163

Proposición 3.6.2. Sea K ⊆ L una extensión de cuerpos y sea ζ ∈ L un elemento algebraico


sobre K. Sea f (X) := IrrK (ζ) ∈ K[X] el polinomio mı́nimo de ζ sobre K. Supongamos que
d = deg(f ) es el grado de f . Consideremos el conjunto siguiente:
K(ζ) := {b0 + b1 ζ + · · · + bd−1 ζ d−1 : b0 , . . . , bd−1 ∈ K} ⊆ L.
Entonces,
i) K(ζ) es un subcuerpo de L (un subanillo que es cuerpo) que contiene al cuerpo K.
ii) K(ζ) es un K−espacio vectorial de dimensión d.
Demostración. Es claro que K(ζ) ⊆ L es un subgrupo del grupo aditivo (L, +). Veamos
que es un subanillo. Para ello, consideremos dos elementos
x := b0 + b1 ζ + · · · + bd−1 ζ d−1 ∈ K(ζ), y := c0 + c1 ζ + · · · + cd−1 ζ d−1 ∈ K(ζ).
Consideremos también los polinomios de grado a lo sumo d − 1 siguientes:
g(X) := b0 + b1 X + · · · + bd−1 X d−1 ∈ K[X], h(X) = c0 + c1 X + · · · + cd−1 X d−1 ∈ K[X].
Observamos que g(ζ) = x y h(ζ) = y. Como K[X] es un dominio euclı́deo, existen q, r ∈ K[X]
tales que:
• gh = qf + r
• deg(r) ≤ deg(f ) − 1 = d − 1.
Supongamos r(X) := e0 + e1 X + · · · ed−1 X d−1 .
Ahora tenemos la siguiente cadena de igualdades:
d−1
X
xy = g(ζ)h(ζ) = q(ζ)f (ζ) + r(ζ) = r(ζ) = ek ζ k ∈ K(ζ).
k=0

Como 1 ∈ K ⊆ K(ζ) es inmediato que es un subanillo. Veamos finalmente que es un cuerpo.


Para ello, consideremos un elemento no nulo x := b0 + b1 ζ + · · · + bd−1 ζ d−1 ∈ K(ζ). De
nuevo, definamos el polinomio g(X) := b0 + b1 X + · · · + bd−1 X d−1 ∈ K[X] y tendremos que
g(ζ) = x 6= 0. Como f (X) := IrrK (ζ) es irreducible y g(ζ) 6= 0, entonces f - g. Sea h el
máximo común divisor de f y g. Se tiene que h es un divisor de f y, por ser f irreducible,
entonces o bien h es unidad en K[X] o bien (h) = (f ). Pero si (h) = (f ) , como h | g, entonces
g ∈ (f ) = AnnK (ζ), lo cual no es posible. Por tanto, h es una unidad en K[X]. Las unidades
en K[X] son las unidades de K, es decir, K \ {0}. En conlusión, si h es el máximo común
divisor de f y g, necesariamente h ∈ K \ {0}. En otras palabras, tenemos que K[X] = (f, g)
y que 1 ∈ (f, g). Por la Identidad de Bézout con cotas en K[X] (Corolario 3.4.8), existirán
h1 (X), h2 (X) ∈ K[X] tales que se verifica:
• deg(h1 ) ≤ deg(g) − 1 ≤ d − 2 y deg(h2 ) ≤ deg(f ) − 1 = d − 1,
• 1 = h1 f + h2 g.
Concluiremos la siguiente cadena de igualdades:
1 = h1 (ζ)f (ζ) + h2 (ζ)g(ζ) = h2 (ζ)g(ζ),
porque f (ζ) = 0. Supongamos h2 (X) = c0 + c1 X + · · · + cd−1 X d−1 , con ci ∈ K, 0 ≤ i ≤ d − 1.
Entonces,
h2 (ζ) = c0 + c1 ζ + · · · + cd−1 ζ d−1 ∈ K(ζ), 1 = h2 (ζ)g(ζ) = h2 (ζ)x.
COn lo que habremos probado que x posee inverso en K(ζ). Juntando todo lo probado con-
cluimos que (K(ζ), +, cot) es un cuerpo y es un subcuerpo de K.
De otro lado, por definición del conjunto, se tiene que K(ζ) está generado como K−espacio
vectorial por el conjunto
B := {1, ζ, . . . , ζ d−1 },
con lo que es un K−espacio vectorial de dimensión a lo sumo d. Queda por ver que ese conjunto
es una base de K(ζ). Para probarlo, supongamos que tenemos una combinación lineal igualada
a cero de estos elementos:
d−1
X
bi ζ i = 0.
i=0
164 3. DIVISIBILIDAD EN ANILLOS: DIP’S, NOETHER Y DE’S. ALGORITMOS

De nuevo, consideremos el polinomio


d−1
X
g := bi X i ∈ K[X].
i=0

Si g(ζ) = 0, entonces g(X) ∈ AnnK (ζ) = (IrrK (ζ)). Como IrrK (ζ) es un polinomio no nulo
de grado d, entonces IrrK (ζ) | g(X) y, necesariamente, G(X) es el polinomio nulo, con lo que
sus coeficientes han de verificar b0 = b1 = · · · = bd−1 = 0 que es lo mismo que afirmar que la
familia B es una familia libre y, por tanto, conluimos que B es una base de K(ζ). 

Observación 3.6.3. Obsérvese que, implı́ticamente, la anterior Proposición prueba lo siguiente:


Sea K ⊆ L una extensión de cuerpos, sea ζ ∈ L un elemento algebraico sobre K y sea f (X) =
IrrK (ζ) el polinomio mı́nimo de ζ sobre K. Entonces,
K(ζ) ∼
= K[X]/(f ),
y el anullo residual K[X]/(f ) es un cuerpo.

Definición 64 (Grado de una extensión de cuerpos). Dada una extensión de cuerpos


K ⊆ L, como L es un K−espacio vectorial, llamamos grado de la extensión de cuerpos K ⊆ L
a la dimensión de L como K−espacio vectorial y lo denotaremos mediante [L : K]. Es decir,
[L : K] := dimK (L).
A las extensiones de cuerpos K ⊆ L tales que el grado es finito (i.e. tales que [L : K]∞) se
las denomina extensiones finitas de cuerpos.

Proposición 3.6.4. Sea K ⊆ L una extensión de cuerpos y sea ζ ∈ L un elemento. Son


equivalentes:
i) ζ es algebraico sobre K
ii) Existe un cuerpo intermedio K ⊆ B ⊆ L tal que B es un K−espacio vectorial de
dimensión finita sobre K y ζ ∈ B.
Demostración. La implicaciı́n i) =⇒ ii) es consecuencia inmediata de la Proposición
precedente, simplemente eligiendo B := K(ζ). Para la otra implicación, supongamos que
B es un subcuerpo de L y que B es un K−espacio vectorial de dimensión finita sobre K.
Consideremos ζ ∈ B un elemento cualquiera y consideremos la siguiente aplicación:
ηζ : B −→ B
x 7−→ ζx.
Tenemos que ηζ es un endomorfismo sobre un espacio vectorial de dimensión finita sobre K.
Entonces, por el Teorema de Hamilton-Cayley (ver Teorema 2.3.33), existe un polinomio no
nulo f (X) ∈ K[X] tal que f (ηζ ) es el endomorfismo nulo sobre B. Como 1 ∈ B, tendremos que
el endomorfismo f (ηζ ) aplicado a 1 es cero, es decir, f (ηζ )(1) = 0 en B. Sólo falta observar que
el endomorfismo f (ηζ ) verifica:
f (ηζ )(1) = f (ζ) = 0.
Y tendremos que ζ es algebraico sobre K. 

Lema 3.6.5. Sea K ⊆ L una extensión de cuerpos y sea V un L−espacio vectorial de dimensión
finita. Entonces, si [L : K] < ∞, V es también un K−espacio vectorial de dimensión finita
sobre K.
Demostración. Es un resultado obvio. Es claro que L es un K−espacio vectorial. Ahora,
supongamos los siguientes dos conjuntos:
• Una familia finita de vectores B := {v1 , . . . , vm } que forman una base de V como
L−espacio vectorial.
• Una familia finita de elementos de L: β := {λ1 , . . . , λn } que forman una base de L
como K−espacio vectorial.
3.6. ELIMINACIÓN UNIVARIADA CLÁSICA: LA MATRIZ DE SYLVESTER 165

Entonces, basta con probar que el conjunto siguiente es un sistema generador de V como
K−espacio vectorial:
β · B := {λi vj : 1 ≤ i ≤ n, 1 ≤ j ≤ m}.


Proposición 3.6.6. Sea K ⊆ L una extensión de cuerpos y sean ζ, θ ∈ L dos elementos


algebraicos sobre K. Entonces, ζ + θ y ζθ también son algebraicos sobre K.
En particular, el siguiente es un subcuerpo de L que contiene a K:
alg
K := {ζ ∈ L : ζ es algebraico sobre K}.
alg
A este cuerpo K se le denomina clausura algebraica de K en L.
Demostración. Supongamos ζ, θ ∈ L dos elementos algebraicos sobre K. por la Proposición
3.6.2 precedente, tenemos un cuerpo K1 := K(ζ) que extiende a K y es subcuerpo de L, siendo,
además, una extensión finita de K. Ahora, la extensión K1 ⊆ L verifica que θ es algebrico sobre
K1 (porque ya lo era sobre K ⊆ K1 ). Por tanto, K1 (θ) es una extensión finita de K1 . Por
el Lema 3.6.5 precdente, como K1 es una etensión finita sobre K y K1 (θ) es un K1 −espacio
vectorial finitamente generado, entonces, K1 (θ) es un K−espacio vectorial finitamente gener-
ado y la extensión de cuerpos K ⊆ K1 (θ) es una extnesión finita de cuerpos. Ahora es fácil
observar (por la construcción de las extensiones de la forma K(ζ) en la Proposición 3.6.2) que
los siguientes elementos pertenecen a K1 (θ):=
ζ + θ = g(θ), ζθ = h(θ),
donde
g(X) = X + ζ ∈ K1 [X], h(X) = ζX ∈ K1 [X].
Por tanto, ζ + θ y ζθ son elementos de un cuerpo K1 (θ) que es un K−espacio vectorial de
dimensión finita sobre K. Por la Proposición 3.6.4, concluimos que ζ + θ y ζθ también son
algebraicos sobre K.
alg
La afirmación sobre K se sigue de los hechos siguientes. Obviamente, los elementos ζ ∈ K
alg
están en K porque satisfacen la ecuación no nula f (X) = Xζ ∈ K[X]. En particular,
alg alg
1 ∈ K . Además, como la suma y producto de algebraicos es algebraico, es claro que K
alg
es un subanillo de L. Queda sólo por demostrar que K es un cuerpo. Para ello, como ya
alg
es subanillo, basta con ver que si un elemento ζ ∈ K es no nulo y si ζ −1 es su inverso en
alg alg
L, entonces ζ −1 ∈ K . Ahora bien, si ζ ∈ K es algebraico sobre K, ya hemos visto en la
Proposición 3.6.2 que K(ζ) es un cuerpo. Por tanto, ζ tiene inverso ζ −1 ∈ K(ζ) y ese inverso es
único, con lo que es también el inverso de ζ en L. Por la Proposición 3.6.4, como K(ζ) es una
extensión finita de K, entonces todos sus elementos son algebraicos sobre K. En particular,
alg alg
ζ −1 es algebraico sobre K y ζ −1 ∈ K , con lo que habremos probado que el subanillo K es
un subcuerpo de L. 

3.6.2. Cuerpos algebraicamente cerrados (Resumen opcional). Se trata de una


forma teórica de agrupar a todos los elementos algebraicos sobre un cuerpo o a todas las
clausuras algebraicas posibles de un cuerpo en un sólo cuerpo.
Definición 65 (Cuerpo Algebraicamente Cerrado). Un cuerpo K se dice algebraicamente
cerrado si para todo polinomio f ∈ K[X] \ K (i.e. no nulo y no unidad) existe ζ ∈ K tal que
f (ζ) = 0.

Proposición 3.6.7 (Teorema del Resto (aka Ruffini)). Sea R un dominio de integridad,
f ∈ R[X] un polinomio y sea ζ ∈ R. El resto de la división de f por (X − ζ) (conforme a lo
descrito en el Teorema 1.4.15) es el resultado de eveluar el polinomio f en el punto ζ, es decir
el resto de esa división es f (ζ) ∈ R. En particular, son equivalentes:
i) f (ζ) = 0,
ii) (X − ζ) | f en R[X].
Más aún, si R = K es un cuerpo, son equivalentes
166 3. DIVISIBILIDAD EN ANILLOS: DIP’S, NOETHER Y DE’S. ALGORITMOS

i) El cuerpo K es algebraicamente cerrado


ii) Para todo d ∈ N, d ≥ 1 y para todo polinomio f ∈ K[X] de grado d, existen ζ1 , . . . , ζr ∈
K, distintos dos a dos, y m1 , . . . , mr ∈ K y a ∈ K, a 6= 0 tales que:
• m1 + m2 + · · · + mr = d,
• La siguiente igualdad se da en K[X]:
f = a(X − ζ1 )m1 (X − ζ2 )m2 · · · (X − ζr )mr .
Los elementos ζ1 , . . . , ζr ∈ K se llaman las raı́ces o los ceros del polinomio f en K y los
números entereos positivos m1 , . . . , mr se denominan (respectivamente) las multiplicidades de
esas raı́ces.
Demostración. Para la primera afirmación, apliquemos la división euclı́dea (como en el
Teorema 1.4.15) y tendremos que existen q, r ∈ R[X] tales que deg(r) ≤ deg(X − ζ) − 1 =
1 − 1 = 0 (i.e. r ∈ R es una constante) y se verifica:
f (X) = q(X)(X − ζ) + r(X).
Evaluando en ζ ∈ R en los dos lados obtenemos:
f (ζ) = q(ζ)(ζ − ζ) + r(ζ) = q(ζ)0 − r(ζ) = r(ζ).
Pero como r es una constante r(ζ) = r y tenemos f (ζ) = r = 0 como pretendı́amos. La
implicación (X − ζ) | f =⇒ f (ζ) = 0 es obvia.
Para el caso en que R = K sea un cuerpo algebraicamente cerrado, procedamos por inducción
en d. Para el caso d = 1 la propiedad es obvia porque f = aX + b = a(X + a−1 b) por ser
a ∈ K \ {0}. Tomando ζ = −a−1 b habremos terminado.
Para el caso d ≥ 1, la definición de cuerpo algebraicamente cerrado, nos garantiza que existe
ζ ∈ K tal que f (ζ) = 0. Por tanto, (X − ζ) | f y tendremos que exite g ∈ K[X] tal que
f = (X − ζ)g.
por tanto deg(g) = d − 1 y, por hipótesis inductiva, tendremos que existen ζ1 , . . . , ζr ∈ K,
m1 , . . . , mr ∈ K y a ∈ K, a 6= 0 tales que:
i) m1 + m2 + · · · + mr = d − 1,
ii) La siguiente igualdad se da en K[X]:
g = a(X − ζ1 )m1 (X − ζ2 )m2 · · · (X − ζr )mr .
Luego
f = a(X − ζ)(X − ζ1 )m1 (X − ζ2 )m2 · · · (X − ζr )mr .
y tenemos la afirmación en el caso d.
Nos queda pro probar que si se verifica la propiedad descrita, entonces K es algebraicamente
cerrado. Pero eso es obvio: cualquier polinomio f ∈ K[X] de grado positivo, admite una
factorización como la descrita y, entonces, posee al menos un cero en K. 

Corolario 3.6.8. Si K es un cuerpo algebraicamente cerrado, los elementos irreducibles (y


los elementos primos) de K[X] son:
[
{0} {a(X − ζ) : a ∈ K \ {0}, ζ ∈ K}.

Demostración. Obvio desde la Proposición predente. Lo único que conviene recordar es


que, como K[X] es un dominio de ideales principales (por ser dominio euclı́deo) un elemento
es primo si y solamente si es irreducible (ver Teorema 3.2.14). 

Proposición 3.6.9. Todo cuerpo algebraicamente cerrado tiene cardinal infinito.


Demostración. Supongamos que K = {a1 , . . . , am } fuera un cuerpo finito. Definamos
entonces el siguiente polinomio f ∈ K[X]:
f := (X − a1 )(X − a2 ) · · · (X − am ) + 1.
Claramente f (ζ) = 1 para cualquier ζ ∈ K y, por tanto, f no posee ninguna raı́z en K o, lo
que es lo mismo, K no puede ser algebraicamente cerrado. 
3.6. ELIMINACIÓN UNIVARIADA CLÁSICA: LA MATRIZ DE SYLVESTER 167

Definición 66 (Clausura Algebraica). Si K es un cuerpo, llamamos clausura algebraica de


K al menor cuerpo algebraicamente cerrado que contiene a K.

Observación 3.6.10. El concepto “menor” en la definición anterior debe entenderse como


“menor salvo K−isomorfismo de cuerpos”. Es decir, la clausura algebraica de un cuerpo K
será un cuerpo K algebraicamente cerrado que satisface las siguientes propiedades:
• K es algebraicamente cerrado,
• K ⊆ K (o, salvo isomorfismo, K contiene una copia isomorfa de K),
• Para todo cuerpo L algebraicaente
cerrado que contiene a K, existe ϕ : K −→ L un
morfismo de anillos tal que ϕ K = IdK .
Nótese que la existencia de un morfismo de anillos implica, por ser cuerpos todos ellos, que es
un monomorfismo y, por tanto, K es isomorfo a un subcuerpo de L. De ahı́ viene el concepto
de “menor salvo isomorfismo” usado en la Definición.
Un resultado importante, que no demostraremos en este curso, sino en el curso correspondiente,
afirma lo siguiente.
Teorema 3.6.11 (Existencia de Clausura Algebraica). Suponiendo el Lema de Zorn, todo
cuerpo posee una clausura algebraica y ésta es única salvo isomorfismo de cuerpos. Más aún, la
clausura algebraica de un cuerpo es la mayor extensión algebraica de ese cuerpo. En particular,
si K es la clausura algebraica de K, todos los elementos α ∈ K son algebraicos sobre K, es
decir,
∀α ∈ K, ∃f ∈ K[X] \ K, f (α) = 0.
Finalmente, si K ⊆ L es una extensión algebraica de cuerpos, existe un monomorfismo de
cuerpos ϕ : L −→ K tal que ϕ K = IdK .

Ejemplo 3.6.12. El “Teorema Fundamental del Álgebra” (un Teorema de Análisis) dice que
C es un cuerpo algebraicamente cerrado. Por tanto, los elementos irreducibles de C[X] son los
dados mediante: [
{0} {a(X − ζ) : a ∈ C \ {0}, ζ ∈ C}.
Por la relación entre R y C es fácil deducir que los elementos irreducibles de R[X] son los dados
por la siguiente colección:
[ [
{0} {a(X − ζ) : a ∈ R \ {0}, ζ ∈ R} {a((X − b)2 + c2 ) ; a, c ∈ R \ {0}, b ∈ R}.
Además, C es la clausura algebraica de R. En el caso de Q es claro que Q no es un cuerpo
algebraicamente cerrado porque X 2 + 1 no posee raı́ces en Q. Por ejemplo, el polinomio
√ √
X 4 + 1 = (X 2 − 2X + 1)(X 2 + 2X + 1),
muestra que los irreducibles en Q[X] no tiene por qué ser irreducibles en R[X]. También
puede probarse que Q[X] posee elementos irreducibles de grado tan grande como se quiera. La
clausura algebraica Q de Q son los elementos de C algebraicos sobre Q, es decir,
Q = {ζ ∈ C : ∃f ∈ Q[X], f (ζ) = 0}.
En el caso de cuerpos finitos, consideremos la clausura algebraicas Fq de cualquier cuerpo finito
Fq , de cardinal q := pn , p := caract(Fq ) su caracterı́stica, con p ∈ N primo no nulo. Veamos
que Fq tiene cardinal infinito por el sencillo argumento siguiente:
Consideremos N \ pZ los números naturales que no son múltiplos de p. Consideremos, para
cada n ∈ N \ pZ, el polinomio X n − 1. Este polinomio es libre de cuadrados (no posee factores
múltiples o, equivalentemente, sus raı́ces son simples o, si se prefiere, su discriminante es no
nulo): como nX n−1 6= 0, porque p - n, el máximo común divisor de fn := X n −1 y fn0 := nX n−1
en Fq [X] es 1. Esto significa que no tiene raı́ces múltiples. Por tanto fn tiene n raı́ces distintas
para cada n ∈ N \ pZ. Como N \ pZ es un conjunto no acotado, el siguiente conjunto tiene
cardinal infinito:
{ζ : ∃n ∈ N \ pZ, ζ n − 1 = 0}.
Y es un conjunto cuyos elementos deben estar en Fq porque en la clausura algebraica todo
polinomio se escinde completamente. Luego la clausura algebraica de Fq tiene cardinal infinito.
168 3. DIVISIBILIDAD EN ANILLOS: DIP’S, NOETHER Y DE’S. ALGORITMOS

3.6.3. La matriz de Sylvester y el máximo común divisor en K[X]. Consideremos,


en lo que queda de Subsección, que K la clausura algebraica del cuerpo K de coeficientes. Un
problema evidente es el siguiente: Supongamos que nos dan un cuerpo K cuyos elementos
podemos podemos escribir, o, más generalmente, que podemos “conocer” (un cuerpo primo,
por ejemplo) y nos dan dos polinomios no triviales f, g ∈ K[X]. Nos preguntan la respuesta a
la siguiente pregunta:

∃ζ ∈ K, f (ζ) = g(ζ) = 0?
Obviamente, lo natural serı́a resolver las ecuaciones f (X) = 0 y g(X) = 0 (es decir, hallar
sus raı́ces en K) y compararlas. Pero esto no es eficiente: calcular un cuerpo donde viven las
raı́ces de un polinomio requiere clacular su clausura normal (como en Teorı́a de Galois) y ese
es un problema de gran complejidad. Sin embargo, en el siglo XIX (incluso en el XVIII con
Bézout) ya sabı́an cómo responder a esa pregunta a través del máximo común divisor. Se tiene
el siguiente resultado clásico:
Lema 3.6.13. Dados dos polinomios f, g ∈ K[X] no nulos, son equivalentes:
i) ∃ζ ∈ K, tal que f (ζ) = g(ζ) = 0.
ii) Existe un cuerpo L que extiende a K y existe un elemento ζ ∈ L algebraico sobre K
tal que g(ζ) = f (ζ) = 0.
iii) Si h es un máximo común divisor de f y g en K[X], entonces deg(h) ≥ 1.
Demostración. La equivalencia entre i) y ii) se sigue de la propia noción de clausura
algebraica. Queda , por tanto, le equivaencia entre i) y ii): Para la implicación i) =⇒ ii),
considérese que existe ζ ∈ K tal que f (ζ) = 0 y g(ζ) = 0. Consideremos el siguiente conjunto
a ⊆ k[X] dado mediante:
a := {p(X) ∈ K[X] : p(ζ) = 0}.
Es sencillo comprobar que a es un ideal de K[X]. Además, no es el ideal nulo (i.e. a 6= (0))
porque, como hemos indicado más arriba, todos los elementos de K son algebraicos sobre K.
Esto significa que, como ζ es algebraico sobre K, existe un polinomio no constante p ∈ K[X]
tal que p(ζ) = 0. Luego p ∈ a 6= (0) y, adicionalmente, a 6= (1), porque 1 no se anula en ζ. En
conclusión, a es un ideal propio de K[X] es un dominio de ideales principales, a = (h) es un
ideal principal no nulo y distinto del total. En términos de extensiones de cuerpos, el generador
h es el polinomio mı́nimo de ζ sobre K o, con otras notaciones, h = IrrK (ζ) ∈ K[X]. Como
f (ζ) = g(ζ) = 0, entonces, f, g ∈ a y, por tanto, h | f y h | g y h es no constante. Por tanto,
deg(gdc(f, g)) ≥ 1 y habremos terminado.
Para la implicación iii) =⇒ i), sea h = gcd(f, g) y supongamos deg(h) ≥ 1 (es decir, h no es
constante). Como K es un cuerpo algebraicamente cerrado, todo polinomio no constante posee,
al menos, una raı́z. Es decir, existe ζ ∈ K tal que h(ζ) = 0. Como h es el máximo común
divisor de f y g, h | f y h | g, obviamente se tiene f (ζ) = 0 y g(ζ) = 0 como indica la propiedad
(1). 

La propuesta de JJ. Sylveste consiste en trasnformar estas reflexiones en cálculos de Álgebra


Lineal elemental. Su principal observación para por estudiar cómo es la matriz de multiplicación
por un polinomio:
3.6.3.1. Mutiplicar por un polinomio. Consideremos el conjunto K[X]d formado por
los polinomios univariados de grado a lo sumo d, es decir, K[X]d := {f ∈ K[X] : deg(f ) ≤ d}.
Como se indica en el Problema 47, con las operaciones suma y producto por un escalar en K,
tenemos que:
(K[X]d , +, ·K ),
es un K−espacio vectorial de dimensión d + 1. Una base ordenada de K[X]d como K−espacio
vectorial es la dada por los monomios {1, X, X 2 , . . . , X d } (llamaremos base monomial a toda
base dada por monomios de un K−espacio vectorial). Ahora consideremos un polinomio no
nulo f := am X m + am−1 X m−1 + · · · + a1 X + a0 y supongamos am 6= 0. Es claro que para
cada polinomio g ∈ K[X]d , el polinomio f g es de grado d + m. Esto nos permite definir, una
aplicación
ρf : K[X]m −→ K[X]d+m ,
3.6. ELIMINACIÓN UNIVARIADA CLÁSICA: LA MATRIZ DE SYLVESTER 169

dado mediante:
ρf (g) := f g.
Se tiene:
Proposición 3.6.14. La aplicación ρf : K[X]m −→ K[X]m+d es una aplicación lineal que,
en las respectivas bases monomiales ({1, X, X 2 , . . . , X m } para K[X]m y {1, X, X 2 , . . . , X d+m }
para K[X]d+m ), viene dada por la matriz Sm+1 (f ) ∈ M(d+m+1)×(m+1) (K) (i.e. m + d + 1 filas
y m + 1 columnas), dada mediante la expresión siguiente:
 
a0 0 ··· 0
a1 a0 ··· 0 
 .. .. ..
 
. . 
.
 . . . 

ad ad−1 · · · ad−m 
Sm+1 (f ) :=  .
0
 ad · · · ad−m+1 

0
 0 · · · ad−m+2 

. .. . ..
. .

. . . . 
0 0 ··· ad
Demostración. Supongamos que las coordenadas de un polinomio g ∈ K[X]m en la base
monomial {1, X, X 2 , . . . , X m } son dadas mediante la lista (z0 , z1 , . . . , zm ). En otras palabras,
estamos diciendo que
g = z0 + z1 X + z2 X 2 + · · · + zm X m .
Ahora multiplicamos
f g := c0 + c1 X + c2 X 2 + · · · cm+d X m+d ,
donde X
ck := ai zj .
i+j=k
Escrita esta expresión en forma matricial (suponiendo d ≥ m por simplicidad de la expresión)
tendremos:
···
   
a0 0 0 c0
 a1 a0 ··· 0   c1 
 .. .. .  .. 
   
. . . 
 .
 . . .    . 
  
 am
 am−1 · · · a0  z0

 cm 
 
am+1
 am ··· a1   z1  cm+1 
   

 .. .. .. ..   z2   .. 
 . . . . = .
  ..   . 
   

 ad
 ad−1 · · · ad−m   . 
 cd 
 
 0
 ad · · · ad−m+1  zm

 cd+1 
 
 0
 0 · · · ad−m+2 

 cd+2 
 
 . . . .  . 
 .. .. .. ..  .. 


0 0 ··· ad cd+m


3.6.3.2. La matriz de Sylvester-Bézout. Comencemos con una construcción. Sea


f, g ∈ K[X] dos polinomios no nulos de grados respectivos m y n. Consideremos la siguiente
aplicación lineal
φf,g : K[X]n−1 × K[X]m−1 −→ K[X]m+n−1
(h1 , h2 ) 7−→ h1 f + h2 g.
Teorema 3.6.15 ([Syl, 1853]). Con las notaciones precedentes, se tiene:
i) La aplicación φf,g anterior es una aplicación lineal entre dos K−espacios vectoriales
de dimensión m + n (ambos).
ii) Sea B1 en K[X]n−1 × K[X]m−1 la base del espacio vectorial producto formada a
partir de las bases monomiales K[X]n−1 y K[X]m−1 . Sea B2 la base monomial de
K[X]m+n−1 . Entonces la matriz de φf,g en las bases B1 y B2 es dada mediante:
SylvX (f, g) := (Sn (f ) | Sm (g)) ,
170 3. DIVISIBILIDAD EN ANILLOS: DIP’S, NOETHER Y DE’S. ALGORITMOS

donde Sn (f ) y Sm (g) son las matrices introducidas en la Subsección 3.6.3.1 precedente.


A esta matriz se la denomina la matriz de Sylvester-Bézout de f y g o simplemente
matriz de Sylvescter de f y g.
iii) El subespacio imagen Im(φf,g ) de esta aplicación lineal es dado por la siguiente iden-
tidad:
Im(φf,g ) = {p ∈ K[X]m+n−1 : p ∈ (f, g)},
iv) El máximo común divisor h de f y g no nulos es el polinomio no nulo de menor grado
en Im(φf,g ).
v) El grado del máximo común divisor h = gcd(f, g) de f y g satisface la siguiente
igualdad:
m + n = deg(h) + dimK (Im(φf,g ) = deg(h) + rank (Sylv(f, g)) .
Demostración. Es claro que φf,g es una aplicación lineal bien definida. Es claro también
que ambos espacios (K[X]n−1 × K[X]m−1 de una parte y K[X]m+n−1 de la otra) tienen di-
mensión m + n. Por tanto ∆φf,g es una aplicación lineal entre dos espacios de la misma
dimensión.

Consideremos entonces las bases B1 y B2 referidas en el enunciado:


• En K[X]m−1 y en K[X]n−1 las respectivas bases monomiales. En el producto K[X]m−1 ×
K[X]n−1 la base “producto” de las respectivas bases monomiales:
[
B1 := {(X i , 0) : 0 ≤ i ≤ m − 1} {(0, X j ) : 0 ≤ j ≤ n − 1}.

• En K[X]n+m la base monomial B2 dada mediante


B2 := {1, X, X 2 , . . . , X n+m−1 }.
Supongamos
f := am X m + am−1 X m−1 + · · · + a1 X + a0 ,
y
g := bn X n + bn−1 X n−1 + · · · + b1 X + b0 ,
con am 6= 0 y bn 6= 0. Con las bases B1 y B2 prefijadas, es un sencillo ejercicio de mera
comprobación el conluir que la matriz de φf,g en esas bases tiene la forma: donde
 n m 
z }| { z }| {
 a0 0 ··· 0 b0 0 ··· 0 
··· ··· 0 
 
 a1 a0 0 b1 b0
 .. .. .. .. .. .. .. . 
 
 . . . . . . . .. 
 .. .. .. ..
 
.. .. 
 . . . a0 . . . b0 
..  ∈ Mn+m (K),
 
SylvX (f, g) := (Sn (f ) | Sm (g)) =  .. .. .. ..
 am am−1 · · ·
 . . . . . 

 . . .
. .
.

 0
 am . . bn bn−1 · · · .  
 . .. .. .. .. .. 
 .. . . . 0 bn . . 
 
 . .. .. .. .. .. .. .. 
 .. . . . . . . . 
0 0 · · · am 0 0 · · · bn
Con esto quedan probadas las afirmaciones i) y ii) del enunciado. Pasemos a analizar la
propiedad iii):
Es claro que si p ∈ Im(φf,g ) entonces, existe p1 ∈ K[X]n−1 y p2 ∈ K[X]m−1 tales que p =
φf,g (p1 , p2 ) = p1 f + p2 g. Por tanto, p ∈ (f.g) y teemos la inslución más sencilla
Im(φf,g ) ⊆ (f, g).
De otro lado, consideremos p ∈ K[X]m+n−1 un polinomio de grado a los sumo m + n − 1 en el
ideal (f, g). Por estar en el ideal (f, g) existiráon dos polinomios P1 , P2 ∈ K[X] tales que
p = P1 f + P2 g.
3.6. ELIMINACIÓN UNIVARIADA CLÁSICA: LA MATRIZ DE SYLVESTER 171

Ahora, aplicamos el mismo argumento usado en la Identidad de Bézout con cotas para K[X]
(Corolario 3.4.8). Tomamos p1 := rem(P1 , g), el resto de la división de P1 por g, supongamos
P1 = Q1 g + p1 , con deg(p1 ) ≤ deg(g) − 1 = n − 1 y escribimos
p := p1 f + (P2 + Q1 f )g.
Denotemos por p2 := (P2 + Q1 f ) y el mismo argumento uado en el Corolario 3.4.8 nos dará
deg(p2 ) ≤ deg(f ) − 1 = m − 1. Por tanto, tendremos:
p := p1 f + p2 g = φf,g (p1 , p2 ) ∈ Im(φf,g ),
lo que prueba el otro contenido y completa la prueba de iii).
La propiedad iv) es evidente a partir de la pa prueba del Teorema 3.4.4. COmo K[X] es un
dominio euclı́deo con deg, el máximo común divisor de dos polinomios no nulos f, g ∈ K[X] es
el polinomio no nulo de menor grado en el ideal (f, g). Por iii) los elementos de Im(φf,g ) son
los polinomios de grado menor o igual que m + n − 1 que están en el ideal (f, g). Por tanto, el
polinomio no nulo de menor grado en Im(φf,g ) tiene que ser necesariamente gcd(f, g).
Para la propiedad v) hagamos una pequeña construcción: Supongamos que h = gcd(f, g) es un
polinomio de grado k. Consideremos ahora la familia de polinomios en Im(φf,g ):
β := {h, Xh, X 2 h, . . . , X m+n−1−k h} ⊆ Im(φf,g ).
Todos los elementos de β son múltiplos del máximo común divisor de f u G, por tant, están en
el ideal (f, g). Como, además, es claro que el grado de todos los elementos de β está acotado
por m+n−1, la propiedad iii) nos dice que son elementos de Im(φf,g ). Más aún, los polinomios
de esta familia verifican deg(X i h) = i + k. Es decir, son todos polinomios de grado distinto y
sus grados van desde k (grado de h) hasta m + n − 1 (grado de X m+n−1−k h). Por tanto, si los
escribimos como vectores por sus coeficientes en la base monomial de K[X]m+n−1 observamos
que esas coordenadas determinan una matriz triangular. Es decir, los elementos de la colección
β son linealmente independientes sobre K. Como tenemos una familia de m + n − k polinomios
linealmente independientes sobre K en Im(φf,g ), concluimos
(3.6.1) dim(Im(φf,g )) + deg(h) = dim(Im(φf,g )) + k ≥ m + n.
De otro lado, consideremos la familia β 0 := {1, X, . . . , X k−1 } de elementos en K[X]m+n−1 .
Estos vectores son claramente linealmente independientes en K[X]m+n−1 y designemos por W ⊆
K[X]m+n−1 el K−subespacio vectorial que generan. Obviamente, dim(W ) = k. Observamos
que
(3.6.2) Im(φf,g ) ∩ W = (0).
Esto es consecuencia de iv): si hubiera un polinomio no nulo en W y en Im(φf,g ), serı́a un
polinomio de grado a lo sumo k − 1 en Im(Φf,g ) y eso no es posible porque el grado de h es k.
En conclusión, estamos en presencia de una suma directa de subespacios (i.e. W ⊕ Im(φf,g ) =
W + Im(φf,g )). Por el Tercer Teorema de Isomorfı́a, combinado con la noción de dimensión en
espacios vectoriales de dimensión finita, tendremos
dimK (W + Im(φf,g )) + dimK (W ∩ Im(φf,g )) = dim(W ) + dimK (Im(φf,g )) .
Por la Desigualdad (3.6.1) y la Igualdad (3.6.2) concluimos
dimK (W + Im(φf,g )) + 0 = k + dimK (Im(φf,g )) ≥ k + (m + n − k) = m + n.
Por tanto, W + Im(φf,g ) = K[X]m+n−1 y se tendrá:
m + n = dimK (W + Im(φf,g )) = k + dimK (Im(φf,g )) ,
que demuestra la afirmación v) del enunciado. 

Usualmente, cuando no hay confusión sobre la variable X eliminada, se escribe simplemente


Sylv(f, g). Además el resultado nos dice que podemos conocer el grado del máximo común
divisor de dos polinomios simplemente conociendo el rango de la matriz Sylv(f, g), lo que nos
lleva a pensar en métodos del cálculo del rango de una matriz como los descritos mediante el
método de K. Mulmuley in [Mul, 1986].
172 3. DIVISIBILIDAD EN ANILLOS: DIP’S, NOETHER Y DE’S. ALGORITMOS

3.6.3.3. Resultante de Sylvester-Bézout. Un de los resultados más reconocibles de


la Teorı́a de la Eliminación es la noción de resultante de dos polinomios univariados.
Definición 67 (Resultante de Sylvester-Bézout). Dados dos polinomios f, g ∈ K[X] no
nulos de grados respectivos m y n, llamamos Resultante de Sylvester-Bézout de f y g con
respecto a la variable X al valor:
Res(f, g) := det (Sylvx (f, g)) ∈ K.

Nótese que la resultante de Sylvester Bézout es un polinomio en los coeficientes de f y g. Las


principales propiedades de este objeto se resumen en el siguiente Teorema:
Teorema 3.6.16 (Resultante de Sylvester-Bézout). Sea K un cuerpo y K su clausura
algebraica. Sean f y g dos polinomios no constantes en K[X] de grados respectivos n y m.
Consideremos la matriz Sylv(f, g) ∈ Mn+m (K) y la resultante:
ResX (f, g) := det (SylvX (f, g)) .
Son equivalentes:
i) ∃ζ ∈ K, tal que f (ζ) = g(ζ) = 0
ii) El máximo común divisor h de f y g es un polinomio de grado mayor o igual que 1.
iii) La aplicación lineal φf,g no es un epimorfismo.
iv) El rango de la matriz de Sylvester es menor o igual que n + m − 1,
v) La resultante verifica ResX (f, g) = 0.
Demostración. El enunciado es casi consecuencia inmediata de lo discutido anterior-
mente. Por el Lema 3.6.13 tenemos la equivalencia entre i) y ii). EL resto de las equivalencias
son consecuencia del Teorema 3.6.15 precedente. Como Sylv(f, g) es la matriz de la aplicación
lineal φf,g entre ciertas bases, tenemos que φf,g no es epimorfismo si y solamente si el rango
de Sylv(f, g) es, a lo sumo m + n − 1. Lo que prueba la equivalencia entre iii) y iv). Como
φf,g es una aplicación lineal entre dos espacios vectoriales de la misma dimensión, φf,g no es
epimorfismo si y solamente si no es isomorfismo, lo cual equivale a que cualquier matriz que la
represente tienen determinante nulo (ver Corolario 2.3.22). Esto prueba la equivalencia entre
iv) y v). Finalemente, la afirmación v) del Teorema 3.6.15 prueba la equivalencia entre ii) y
iv). 

3.6.4. Resultante de Sylvester-Bézout y Eliminación: cuando los coeficientes


están en un anillo. Del mismo modo que en los resultados procedentes podemos hacer la
construcción para un anillo R cualquiera, aunque ahora no podemos hablar del máximo común
divisor. Volveremos sobre la idea más adelante. Por ahora, consideremos R[X]n el conjunto de
todos los polinomios con coeficientes en R de grado acotado por n. Es decir,
R[X]n := {f ∈ R[X] : deg(f ) ≤ n}.
R[X]n es un R−módulo libre de base {1, X, X 2 , . . . , X n }. Consideremos dos polinomios f, g ∈
R[X] de grados respectivos n y m y consideremos también el morfismo de R−módulos libres
de rango finito dado mediante las reglas siguientes:
Sf,g : R[X]m−1 × R[X]n−1 −→ R[X]m+n−1
(h1 , h2 ) 7−→ h1 f + h2 g.
Es obvio que la imagen de este morfismo de R−módulos satisface:
Im(Sf,g ) ⊆ (f, g) ∩ R[X]m+n−1 ,
donde (f, g) es el ideal de R[X] generado por f y g. La matriz de Sf,g es las respectivas bases
monomiales de R−módulos libres sigue las mismas pautas que en el caso de que R sea un
cuerpo y se denomina matriz de Sylvester-Bézout con respecto a X. La denotaremos mediante
SylvX (f, g) ∈ Mn+m (R) y llamaremos resultante de f y g con respecto a X a su determinante,
que denotaremos mediante
ResX (f, g) := det (SylvX (f, g)) ∈ R.
Proposición 3.6.17. Con las notaciones precedentes, se tienen las siguientes propiedades:
3.6. ELIMINACIÓN UNIVARIADA CLÁSICA: LA MATRIZ DE SYLVESTER 173

i) ResX (f, g) está en el ideal contracción a R del ideal (f, g) generado por f y g en
R[X]. Es decir, ResX (f, g) ∈ (f, g)c = (f, g) ∩ R. Se suele denomiar a ResX (f, g) el
elemento elminante del ideal (f, g) en R. Si, a su vez, R es un anillo de polinomios
con coeficientes en un cuerpo, se le denomina “polinomio eliminante en una variable”.
ii) Si ResX (f, g) ∈ R× es una unidad en R, entonces el ideal (f, g) = R[X].
iii) Si uno de los polinomios es mónico, entonces (f, g) ∩ R[X]m+n−1 = Im(Sf,g ). En este
caso, si R es dominio de integridad, (f, g) = R[X] si y solamente si ResX (f, g) ∈ R× .
Demostración. Los resultados son muy similares al caso K[X] (Teorema 3.6.16), con el
debido cuidado al tener coeficientes en un anillos R y no en un cuerpo.
i) Para este resultado recuérdese la Fórmula de Laplace Generalizada (Teorema ??) y
sea Adj(S) la matriz adjunta de la matriz de Sylvester SylvX (f, g) ∈ Mm+n (R).
Tendremos que
ResX (f, g)Idn+m = det (SylvX (f, g)) Idn+m = SylvX (f, g)Adj(S).
Supongamos que, descrita por columnas, la matriz adjunta toma la forma:
 
c1,1 c1,2 ··· c1,n+m
 c2,1 c2,2 ··· c2,n+m 
Adj(S) :=  . .
 
. . ..
 .. .. .. . 
cn+m,1 cn+m,2 · · · cn+m,n+m
Tendremos, en particular, que las primeras columnas verifican:
   
ResX (f, g) c1,1
 0   c2,1 
 = SylvX (f, g)  ..  .
   
 ..
 .   . 
0 cn+m,1
Consideremos ahora los dos polinomios siguientes:
h1 := c1,1 + c2,1 X + · · · + cm,1 X m−1 ∈ R[X]m−1 ,

h2 := cm,1 + cm+1,1 X + · · · + cn+m,1 X n−1 ∈ R[X]n−1 .


Entonces, el polinomio h := h1 f + h2 g ∈ (f, g) ∩ R[X, y]n+m−1 (i.e. está en el ideal
generado por f y h en R[X]. Pero si los coeficientes de h fueran
h := d0 + d1 X + d2 X 2 + · · · + dn+m−1 X n+m−1 ,
entonces satisfarı́an:
   
d0 c1,1
 d1   c2,1
 = SylvX (f, g)  .
   
 .. ..
 .    .
dn+m−1 cn+m,1
Por tanto,
h := ResX (f, g) + 0X + 0X 2 + · · · 0X n+m−1 = ResX (f, g) ∈ (f, g) ∩ R,
como se pretendı́a.
ii) Por lo anterior, si ResX (f, g) ∈ R× , como las unidades de R× son unidades en R[X],
fácilmente se concluye que (f, g) = R[X].
iii) Para esta afirmación retomemos el Teorema 1.4.15 anterior. Supongamos h = pf +qg ∈
R[X] es un polinomio cuyo grado en X es menor o igual que n + m − 1. Apliquemos
la división de p por g (que puede hacerse porque g es mónico, ver Teorema 1.4.15):
p = p1 g + r,
donde r ∈ R[X] es un polinomio de grado estrictamente menor que el grado de g con
respecto a X. De hecho r ∈ R[X]m−1 . Reescribamos la presentación de h mediante:
h = rf + (q + p1 f )g.
174 3. DIVISIBILIDAD EN ANILLOS: DIP’S, NOETHER Y DE’S. ALGORITMOS

Como deg(h) ≤ n + m − 1 y deg(r1 f ) ≤ deg(r1 ) + deg(f ) ≤ (m − 1) + n, concluiremos


que
deg ((q + p1 f )g) ≤ n + m − 1.
Pero, como g es mónico el grado del producto es la suma de los grados (las unidades
no son divisores de cero en R). Es decir,
deg(g) + deg(q + p1 f ) = deg((q + p1 f )g) ≤ n + m − 1.
Como deg(g) = m, entonces el polinomio s := (q + p1 f ) tiene grado a lo sumo n − 1
y tendremos
h = rf + sg, con r ∈ R[X]m−1 y s ∈ R[X]n−1 ,
por tanto f ∈ Im(Sf,g ). Como ya habı́amos indicado que Im(Sf,g ) ⊆ (f, g)∩R[X]n+m−1 ,
la prueba de la primera parte de iii) está concluida.
Para la segunda parte, ya hemos visto una de las implicaciones. Supongamos, en cam-
bio que (f, g) = R[X]. En ese caso, por la primera parte, concluimos que Im(Sf,g ) =
R[X]m+n−1 . Por tanto, Sf,g es un epimorfismo de R−módulos libres. Consideremos
ahora el cuerpo de fracciones de R (i.e. K := qf (R), como en la Subsección 3.2.0.1).
Y consideremos la extensión de Sf,g dada mediante
φf,g : K[X]n−1 × K[X]m−1 −→ K[X]m+n−1 .
Como (f, g) = R[X], entonces 1 ∈ (f, g) y también 1 ∈ (f, g)e , donde (f, g)e es la
extensión del ideal (f, g) al anillo K[X]. Por el Teorema 3.6.16, φf,g es un epimorfismo
y, por tanto, un isomorfismo entre dos K−espacios vectoriales de la misma dimensión.
En particular, φf,g es un monomorfismo y, como se tiene que

φf,g R[X] ×R[X] = Sf,g ,
n−1 m−1

concluimos que Sf,g es también un monomorfismo. En suma, Sf,g es un isomorfismo


de R−módulos libres de rango finito y, por tanto, su determinante es una unidad en
R.

Ejemplo 3.6.18 (Proyectando o Eliminando via Resultante). Sea K un cuerpo alge-
braicamente cerrado. Sean f, g ∈ K[X1 , . . . , Xn ] dos polinomios en n variables con coeficientes
en K, de grados respectivos d y r con respecto a la variable Xn . Supongamos d ≥ 1 y r ≥ 1.
Supongamos:
f := ad Xnd + ad−1 Xnd−1 + · · · + a0 ∈ K[X1 , . . . , Xn−1 ][Xn ],
g := br Xnd + br−1 Xnr−1 + · · · + b0 ∈ K[X1 , . . . , Xn−1 ][Xn ],
donde ai , bj ∈ K[X1 , . . . , Xn−1 ], para cada i, 0 ≤ i ≤ d, y cada bj , con 0 ≤ j ≤ r. Donde,
además, ad , br ∈ K[X1 , . . . , Xn−1 ] \ {0}. Los polinomios f y g definen las siguientes hiper-
superficies en An (K) := Kn :
V1 := VA (f ) := {x ∈ An (K) : f (x) = 0},
V2 := VA (g) := {x ∈ An (K) : g(x) = 0}.
Consideremos, además, la proyección canónica πn : Kn −→ Kn−1 que “olvida” la última coor-
denada. Nos queremos hacer preguntas sobre la proyección πn (V1 ∩ V2 ) y sobre la intersección
V1 ∩ V2 de ambas hiper-superficies. Obsérvese que
πn (V1 ∩ V2 ) = {x ∈ Kn−1 : ∃ζ ∈ K, (x, ζ) ∈ V1 ∩ V2 }.
Por el apartado i) de la Proposición 3.6.17 concluimos que ResXn (f, g) ∈ (f, g)c = (f, g) ∩
K[X1 , . . . , Xn−1 ]. Es decir, ResXn (f, g) están en el anillo K[X1 , . . . , Xn−1 ] y está en el ideal
(f, g). Por tanto,
∀ζ ∈ Kn , f (ζ) = 0, g(ζ) = 0 =⇒ ResXn (f, g)(ζ) = 0.
O, equivalentemente, como ResXn (f, g) es un polinomio que sólo depende de las variables
X1 , . . . , Xn−1 , se tendrá:
∀ζ := (ζ1 , . . . , ζn ) ∈ Kn , ζ ∈ V1 , ζ ∈ V2 =⇒ ResXn (f, g)(ζ1 , . . . , ζn−1 ) = 0.
3.6. ELIMINACIÓN UNIVARIADA CLÁSICA: LA MATRIZ DE SYLVESTER 175

Como (ζ1 , . . . , ζn−1 ) = πn (ζ), habremos probado que


πn (V1 ∩ V2 ) ⊆ VA (ResXn (f, g)) := {x ∈ Kn−1 : ResXn (f, g) = 0}.
Sea ζ := (ζ1 , . . . , ηn ) ∈ Kn y consideremos los polinomios
F (Xn ) := ad (ζ1 , . . . , ζn−1 )Xnd + ad−1 (ζ1 , . . . , ζn−1 )Xnd−1 + · · · + a0 (ζ1 , . . . , ζn−1 ) ∈ K[Xn ],
G(Xn ) := br (ζ1 , . . . , ζn−1 )Xnd + br−1 (ζ1 , . . . , ζn−1 )Xnr−1 + · · · + b0 (ζ1 , . . . , ζn−1 ) ∈ K[Xn ].
Supongamos que ad (ζ1 , . . . , ζn−1 ) 6= 0 y que br (ζ1 , . . . , ζn−1 ) 6= 0 y consideremos la matriz de
Sylvester con respecto a Xn asociada a F y G: SylvXn (F, G). De otro lado, consideremos
la matriz de Sylvester de f y g con respecto a la variable Xn : SylvXn (f, g). Observamos
que SylvXn (f, g) es una matriz cuyas coordenadas están en K[X1 , . . . , Xn−1 ]. Escribiremos
SylvXn (f, g)(ζ1 , . . . , ζn−1 ) ∈ M(d+r) (K) para designar a la matriz obtenida sustituyendo las
variables X1 , . . . , Xn−1 de las coordenadas de la matriz SylvXn (f, g) por los valores ζ1 , . . . , ζn−1 .
Observamos que
SylvXn (F, G) = SylvXn (f, g)(ζ1 , . . . , ζn−1 ).
De otro lado, como ResXn (f, g) es el determinante de la matriz SylvX−n (f, g), y el determinante
es un polinomio en las coordenadas de las matrices, si sustituimos las variables X1 , . . . , Xn−1
por la constantes ζ1 , . . . , ζn−1 de los polinomios que forman las coordenadas de la matriz
SylvXn (f, g) y procedemos, después, calculando el determinante de esa matriz produce el mismo
resultado que si calculamos el determinante de la matrix SylvXn (f, g) (que es un polinomio en
K[X1 , . . . , Xn−1 ]) luego sustituimos las variables X1 , . . . , Xn−1 por las constantes ζ1 , . . . , ζn−1 .
Es decir, se tiene:

det SylvXn (f, g)(ζ1 , . . . , ζn−1 ) = ResXn (f, g)(ζ1 , . . . , ζn−1 ).
Por tanto, tenemos la propiedad siguiente para cualquier punto ζ 0 := (ζ1 , . . . , ζn−1 ) ∈ Kn−1 :
si ad (ζ 0 ) 6= 0 y br (ζ 0 ) 6= 0, entonces:
ResXn (f, g)(ζ 0 ) = 0 =⇒ ResXn (f (ζ1 , . . . , ζn−1 , Xn ), g(ζ1 , . . . , ζn−1 , Xn )) = 0,
Como F (Xn ) := f (ζ1 , . . . , ζn−1 , Xn ) y G(Xn ) := (ζ1 , . . . , ζn−1 , Xn ) son univariados de grados
respectivos d y r, si su resultante es nula es porque existe θ ∈ K tal que
F (θ) := f (ζ1 , . . . , ζn−1 , θ) = 0, G(θ) := g(ζ1 , . . . , ζn−1 , θ) = 0.
En otras palabras, hemos probado que
VA (ResXn (f, g)) \ (VA (ad ) ∪ VA (br )) ⊆ πn (V1 ∩ V2 ),
donde
VA (ResXn (f, g)) \ (VA (ad ) ∪ VA (br )) := VA (ResXn (f, g)) \ {ζ 0 ∈ Kn−1 : ad (ζ 0 ) 6= 0, br (ζ 0 ) 6= 0}.
Por lo anterior, habremos probado:
VA (ResXn (f, g)) \ (VA (ad ) ∪ VA (br )) = πn (V1 ∩ V2 ) \ (VA (ad ) ∪ VA (br )) .
En particular, si f y g son mónicos con respecto a la variable Xn , tendremos que los ceros
de la resultante son exactamente los puntos de la proyección de la intersección. Es decir si
ad , bf ∈ K× , se tiene:
VA (ResXn (f, g)) = πn (V1 ∩ V2 ).
Finalmente, vamos con una forma de usar la resultante que es esencialmente para detectar si
una intersección de dos hiper-superficies es o no vacı́a. Usando la afirmación ii) en Proposición
×
3.6.17 tendremos que si ResX−n (f, g) ∈ (K[X1 , . . . , Xn−1 ]) = K× (si es una constante no
nula), entonces 1 ∈ (f, g) y concluimos que existe h1 , h2 ∈ K[X1 , . . . , Xn ] tales que
1 := h1 f + h2 g.
Debe notarse que no estamos usando la Identidad de Bézout (Teorema 3.2.7) dado que si n ≥ 2
el anillo K[X1 , . . . , Xn ] no es dominio de ideales principales. Si existiera ζ ∈ V1 ∩ V2 , entonces,
1 = h1 (η)f (ζ) + h2 (ζ)g(ζ) = 0 + 0 = 0,
lo que nos llevarı́a a contradicción. Por tanto, hemos probado que
ResXn (f, g) ∈ K× =⇒ V1 ∩ V2 = ∅,
176 3. DIVISIBILIDAD EN ANILLOS: DIP’S, NOETHER Y DE’S. ALGORITMOS

o, equivalentemente,
ResXn (f, g) ∈ K× =⇒ ¬ [∃x ∈ Kn , f (x) = g(x)) = 0] .
Finalmente, supongamos que f y g son mónicos con respecto a la variable Xn , y si suponemos
que ResXn (f, g) 6∈ K× (es decir ResXn (f, g) es o bien el polinomio nulo o bien un polinomio no
constante). Como K es un cuerpo algebraicamente cerrado, entonces existe ζ 0 ∈ Kn−1 tal que
ResXn (f, g)(ζ) = 0. Por el enunciado del Problema 160, ha de existir un punto ζ 0 ∈ Kn−1 tal
que ResXn (f, g)(ζ 0 ) = 0. Como f y g son mónicos con respecto a Xn sabemos que πn (V1 ∩ V2 )
es el conjunto de ceros en Kn−1 de ResXn (f, g). En ese caso, V1 ∩ V2 6= ∅ (la proyección del
vacı́o es el vacı́o). Por tanto, hemos probado que, si f y g son mónicos con respecto a la variable
Xn , se tiene:
ResXn (f, g) 6∈ K× ⇐⇒ ∃ζ ∈ Kn , f (ζ) = g(ζ) = 0.

Lo discutido en este Ejemplo se resume en la siguiente Proposición:


Proposición 3.6.19 (Preludio del Nullstellensatz). Sea K un cuerpo algebraicamente cer-
rado. Sean f, g ∈ K[X1 , . . . , Xn ] dos polinomios en n variables con coeficientes en K, de grados
respectivos d y r con respecto a la variable Xn . Supongamos d ≥ 1 y r ≥ 1. Supongamos:
f := ad Xnd + ad−1 Xnd−1 + · · · + a0 ∈ K[X1 , . . . , Xn−1 ][Xn ],
g := br Xnd + br−1 Xnr−1 + · · · + b0 ∈ K[X1 , . . . , Xn−1 ][Xn ],
donde ai , bj ∈ K[X1 , . . . , Xn−1 ], para cada i, 0 ≤ i ≤ d, y cada bj , con 0 ≤ j ≤ r. Donde,
además, ad , br ∈ K[X1 , . . . , Xn−1 ] \ {0}. Los polinomios f y g definen las siguientes hiper-
superficies en An (K) := Kn :
V1 := VA (f ) := {x ∈ An (K) : f (x) = 0},
V2 := VA (g) := {x ∈ An (K) : g(x) = 0}.
Sea πn : Kn −→ Kn−1 la proyección que “olvida” la última coordenada de los puntos en Kn .
Sea ResXn (f, g) ∈ K[X1 , . . . , Xn−1 ] la resultante de f y g con respecto a la variable Xn . Se
tienen las siguientes propiedades:
i) La proyección de la intersección está contenida en la hiper-superficie definida por la
resultante de f y g. Es decir,
πn (V1 ∩ V2 ) ⊆ VA (ResXn (f, g)) := {x ∈ Kn−1 : ResXn (f, g) = 0}.
ii) Fuera de las hipersuperficies donde se anulan los coeficientes directores, los ceros de
la resultante ResXn (f, g) coinciden con la proyección de la intersección. Es decir:
VA (ResXn (f, g)) \ (VA (ad ) ∪ VA (br )) = πn (V1 ∩ V2 ) \ (VA (ad ) ∪ VA (br )) ,
donde
(VA (ad ) ∪ VA (br )) := {ζ 0 ∈ Kn−1 : ad (ζ 0 ) 6= 0, br (ζ 0 ) 6= 0}.
iii) En particular, si f y g son mónicos con respecto a la variable Xn , tendremos que los
ceros de la resultante son exactamente los puntos de la proyección de la intersección.
Es decir si ad , bf ∈ K× , se tiene:
VA (ResXn (f, g)) = πn (V1 ∩ V2 ).
iv) Si la resultante es una constante no nula, entonces V1 ∩ V2 = ∅. Es decir,
ResXn (f, g) ∈ K× =⇒ ¬ [∃x ∈ Kn , f (x) = g(x)) = 0] .
v) Si f y g son mónicos con respecto a la variable Xn , se tiene:
ResXn (f, g) 6∈ K× ⇐⇒ ∃ζ ∈ Kn , f (ζ) = g(ζ) = 0.
Observación 3.6.20. Veremos más adelante que basta con que uno de los dos polinomios f o
g sea mónico para disponer de las equivalencias. También veremos cóno la última afirmación
preludia el Nullstellensatz (ver Teorema 8.5.2). Nótese, además, que he usado la expresión
“eliminación”. La idea viene del término “eliminación de cuantificadores” de la Lógica: se
trata de eliminar cuantificadores en una expresión matemática que los tiene. Ası́, la expresión
∃ζ ∈ Kn , f (ζ) = g(ζ) = 0,
3.6. ELIMINACIÓN UNIVARIADA CLÁSICA: LA MATRIZ DE SYLVESTER 177

contiene un cuantificador existencial ∃ y se pretende “eliminar”, es decir, quitarlo de esa ex-


presión, modificando la expresión hasta hallar otra equivalente en la que no haya cuantificadores.
La resultante ayuda en esta tarea dado que, en el caso de que ambos polinomios sean mónicos,
hemos probado que la expresión anterior es equivalente a la siguienet:
ResXn (f, g) 6∈ K× .
Ese es el espı́ritu del Nullstellensatz de Hilbert-Kronecker-Netto que analizaremos en el Capı́tulo
8.
3.6.5. Ejercicios y problemas de la Sección 3.5.
Problema 136. Usando las matrices Sm (f ) que se describen en la Sección 3.6, hay que probar
que la división euclı́dea en el anillo de polinomios es, en realidad, la resolución de un sistema
de ecuaciones lineales compatible y determinado. Describe ese sistema de ecuaciones.
Problema 137. Prueba las siguientes afirmaciones:
i) Verificar que si K = Q es el cuerpo de los racionales, el siguiente conjunto no es ideal
en Q[X]:
{f ∈ Q[X] : f (0) ∈ Z}.
ii) Verificar que si a ∈ Q, el conjunto siguiente es un ideal principal de Q[X]:
ma := {f ∈ Q[X] : f (a) = 0}.
Hallar un generador. Comprobar que ma no es subanillo de Q[X] y que 1 6∈ ma .
iii) Si a ∈ C es un número complejo, algebraico sobre Q. Describir quién es el siguiente
conjunto:
ma := {f ∈ Q[X] : f (a) = 0}.
¿ Es ideal principal?, ¿Quién es su generador?.
iv) Hacer el mismo análisis de ma cuando a ∈ C es un número trascendente sobre Q.
Problema 138. Verifica el número de divisiones para hallar el máximo común divisor mediante
el método de Euclides en los casos siguientes. Intenta comparar con aplicar el método escolar
basado en la Criba de Eratóstenes.
i) a = 8633, b = 4171
ii) a = 15251, b = 1751,
iii) a = 123521, b = 20467,
iv) a = 942373, b = 6589,
v) a = 1015103, b = 1073287.
3.6.5.1. Ecuación de Pell en el caso m = 2. Se conoce como ecuación de Pell a la
resolución de la ecuación X 2 − mY 2 − 1 = 0, con m ∈ N un entero positivo y soluciones no
triviales (x, y) ∈ Z2 . En esta secuencia de problemas √
estudiaremos la ecuación de Pell en el
caso m = 2 y estudiaremos el grupo de las unidades Z[ 2]× .
Problema
√ 139 (Ecuación de Pell √ en el caso m = 2. Parte I). Consideremos el anillo
Z[ 2] y las dos inmersiones de Q( 2) en C:

I, σ : Q( 2) ,→ C,
√ √ √
√ I es la inclusión canónica y σ(a + b 2) = a − b 2. Nótese que tanto Z[ 2] como
donde
σ(Z[ 2]) son subconjuntos de la recta real R. Se pide:

i) Probar que para cada λ ∈ Z[ 2], se tiene
λ + σ(λ)
∈ Z.
2
√ ×
ii) Probar que si λ ∈ Z[ 2] es una unidad, entonces λσ(λ) ∈ {±1}.
√ −1 √
iii) Probar que 1 + 2 = 2 − 1.
√ √
iv) Probar que si λ ∈ Z[ 2]× , λσ(λ) = 1 y si 1 ≤ λ < 1 + 2, entonces
√ √
2 λ + σ(λ) 2
≤ <1+ .
2 2 2
Concluir que, entonces, λ + σ(λ) = 2.
178 3. DIVISIBILIDAD EN ANILLOS: DIP’S, NOETHER Y DE’S. ALGORITMOS

√ ×
v) En las condiciones
√ del item precedente, concluir que si λ ∈ Z[ 2] es una unidad y si
1 ≤ λ < 1 + 2, entonces λ = 1.

Problema 140 (Ecuación de Pell en el caso m = 2. Parte II). Con las notaciones del
problema precedente, se pide:
√ √
i) Probar que si λ ∈ Z[ 2], 1 < λ < 1 + 2 y si λσ(λ) = −1, entonces

−1 < σ(λ) < 1 − 2.
√ √
ii) Con las condiciones del item precedente, concluir que si λ ∈ Z[ 2], 1 < λ < 1 + 2 y
λσ(λ) = −1, entonces
λ + σ(λ)
0< < 1,
2
y, por tanto, este caso no es posible. √ √
iii) Concluir que no hay unidades
√ × λ ∈ Z[ 2]× tales que 1 < λ < 1 + 2.
iv) Probar que si λ ∈ Z[ 2] es una unidad tal que λ > 1, entonces, existe un único
número natural n ∈ N positivo tal que
 √ n  √ n+1
1+ 2 ≤λ< 1+ 2 .
√ m √ √
v) Probar que { 1 + 2 : m ∈ Z} ⊆ Z[ 2]× . Concluir que si λ ∈ Z[ 2]× es una
unidad tal que λ > 1 y si n es el exponente del item precedente, entonces
λ  √ 
1 ≤ η := √ n < 1 + 2 ,
1+ 2

y, η ∈ Z[ 2]× . √
vi) Concluir que si λ√∈ Z[ 2]× es una unidad y si λ > 1, entonces, existe un único n ∈ N
n
tal que λ = 1 + 2 .

Problema 141 (Ecuación de Pell en el caso m = 2. Parte III). Con las notaciones del
problema precedente, se pide:

i) Probar que si λ ∈ Z[ 2]× es una unidad y si 0 √< λ < 1, entonces 1/λ es una unidad
que satisface 1/λ > 1. Concluir que si λ ∈ Z[ 2]× es una unidad y si 0 < λ < 1,
entonces existe n ∈ N positivo tal que
 √ −n
λ= 1+ 2 .
√ √
ii) Probar que si λ ∈ Z[ 2]× es una unidad y si −1 < λ < 0, entonces −1/λ ∈ Z[ 2]× y
−1/λ > 1. Concluir que, en este caso, existe n ∈ Z tal que
 √ n
η =− 1+ 2 .

iii) De modo análogo al item precedente, probar que si si λ ∈ Z[ 2]× es una unidad y si
λ < −1, entonces existe n ∈ Z tal que
 √ n
η =− 1+ 2 .

iv) Concluir la siguiente igualdad que caracteriza las unidades de Z[ 2]× :
√  √ n
Z[ 2]× := {± 1 + 2 : n ∈ Z}.

Problema 142 (Ecuación


√ de Pell en el caso m = 2. Parte IV). Probar que el grupo
multiplicatizo (Z[ 2]× , ·) es isomorfo al grupo producto Z× × Z, donde la operación en Z× es
el producto y la operación en Z es la suma de números enteros.
3.6. ELIMINACIÓN UNIVARIADA CLÁSICA: LA MATRIZ DE SYLVESTER 179

3.6.5.2. El algoritmo de Berlekamp. La siguiente serie de problemas muestra un al-


goritmo de factorización de polinomios sobre un cuerpo finito, conocido como algoritmo de
Berlekamp ([Be, 1970]).
Problema 143. Pruébese la siguiente propiedad, base del algorimo de factorización de Berlekamp;
Sea Fq el cuerpo finito de q elementos. Sea g ∈ Fq [T ] un polinomio cualquiera, entonces, se
tiene : Y
g(T )q − g(T ) := (g(T ) − x)
x∈Fq
Qr
Problema 144. Supongamos ahora que f := i=1 fi es una factorización de un polinomio
f ∈ Fq [T ], sabiendo que
gcd(fi , fj ) = 1,
i.e. suponemos que f no posee factores irreducibles múltiples.
Consideremos el anillo cociente :
R := Fq [T ]/(f )
Para cada g ∈ Fq [T ], denotemos por g ∈ R su clase módulo f . Pruébese la siguiente afirmación :
Para cada g ∈ Fq [T ] tal que g q − g = 0 es cierta en R, y para cada factor irreducible fi de f ,
existe un único xi ∈ Fq tal que :
f | g(T ) − xi
en Fq [T ].
Problema 145. Con las anteriores notaciones, pruébese la siguiente afirmación:
Para cada punto (x1 , . . . , xr ) ∈ Frq existe un polinomio g ∈ Fq [T ] de grado estrictamente menor
que el grado de f tal que :
gq − g = 0 en R y g + (fi ) = xi + (fi ) en Fq [T ]/(fi ).
( Hint: Se requiere el uso del Teorema Chino de los Restos en Fq [T ]. Buscar información más
adelante en este mismo texto.)
Problema 146. Con las anteriores notaciones, pruébese la afirmación siguiente:
El conjunto de polinomios g ∈ Fq [T ] de grado menor estricto que el grado de f y tales que
g q − g = 0 en R es un Fq −espacio vectorial cuya dimensión coincide con el número de factores
irreducibles de f .
Problema 147. Defı́nase, usando los Problemas precedentes, un algoritmo que decide si un
polinomio univariado f ∈ Fq [T ], sin factores múltiples, es irreducible o no en Fq [T ].
Problema 148. Diseña un algoritmo que factorice polinomios con coeficientes en el cuerpo
finito Fp , donde p ∈ N es un primo no nulo.
Trata de estimar cuántas operaciones en el cuerpo de coeficientes (operaciones en {+, −, ×, ·−1 }
y tests de signo = 0?) son necesarias para factorizar un polinomio univariado con ese método.
3.6.5.3. Teorema Pequeño de Fermat y Función de Euler.
Problema 149 (Función de Euler). Definiremos la función de Euler φ : N \ {0} −→ N del
modo siguiente :
φ(n) := ]{m ∈ N : m ≤ n, gcd(m, n) = 1}.
Se pide probar las siguientes afirmaciones:
i) La función de Euler es el cardinal del grupo multiplicativo de las unidades de Z/nZ),
es decir,  
×
φ(n) = ] (Z/nZ) .
ii) Para cada número natural n ∈ N, n ≥ 2, las siguientes propiedades son equivalentes :
(a) n ∈ Z es primo,
(b) Z/nZ es un dominio de integridad.
(c) Z/nZ es un cuerpo
(d) φ(n) := n − 1
(e) (Z/nZ)× con la operación producto es un grupo abeliano de orden n − 1.
180 3. DIVISIBILIDAD EN ANILLOS: DIP’S, NOETHER Y DE’S. ALGORITMOS

Problema 150 (Teorema Pequeño de Fermat (versión débil)). Probar la siguiente afir-
mación:
Sea p ∈ N un número primo y n ∈ N un número natural, entonces
φ(pn ) = pn − pn−1 .
Probar, como consecuencia el teorema Pequeño de Fermat:
Dado n ∈ N un número primo, n ≥ 2. Entonces, para cada x ∈ Z/nZ \ {0}, se tiene :
xn−1 ≡ 1 mod n.
Verifica que esta propiedad no caracteriza a los números primos. Desgraciadamente hay más
números que los números primos verificando esta propiedad. Son los llamados números de
Carmichael. El más pequeño número de Carmichael conocido que no es primo es 561. Prueba
que no es primo y sı́ verifica la condición del Teorema Pequeño de Fermat. Busca información
adicional sobre los números de Carmichael en Wikipedia e incorpóralo al Problema.
Problema 151 (Teorema Pequeño de Fermat (versión fuerte)). Prueba el siguiente
enunciado usado por [Pr, 1975]:
Un número natural n ∈ N, n ≥ 2 es un número primo si y solamente si una cualquiera de las
siguienets condiciones son equivalentes :
i) (Z/nZ)× es un grupo cı́clico de orden n − 1,
ii) La ecuación X n−1 − 1 posee una raı́z primitiva en el anillo Z/nZ.
Problema 152. Prueba que la función de Euler satisface: φ(1) = 1 y para n ≥ 2 se tiene:
X
φ(m) = n
m|n

Problema 153 (La función de Euler es multiplicativa). Prueba que la función de Euler
es multiplicativa. Es decir, dados n, m ∈ N, n, m ≥ 2 dos números naturales coprimos (i.e.
gcd(m, n) = 1), entonces
φ(nm) = φ(n)φ(m).
Concluir que si p y q son dos primos no nulos y distintos en Z, entonces
φ(pq) = (p − 1)(q − 1).
Hint: usa el teormea de los Chinos sobre Z (visto en Introducción al Lenguaje Matemático) o
la versión más avanzada en Teorema 5.2.2.
3.6.5.4. El Sistema Criptográfico RSA. Lo que sigue es una serie de problemas que
explican el funcionamiento interno del sistema criptográfico RSA a través de una serie de sen-
cillos problemas (cf. [RSA, 1978]).
Problema 154 (RSA: Definición de Clave Pública). Se trata de suponer una red de
usuarios (tipo internet o cualquier red social) que ponen a disposición de todo el mundo una
clave pública. Si los mimebros de esa red son los elementos de un conjunto I, cada individuo
publicará una clave pública Ni que será visible para todo miembro de la red. El siguiente proceso
determina como un individuo i prepara su clave pública Ni := (n, e).
• El individuo i elige dos números primos grandes que ólo él conoce y que denotaremos
por p y q. Para ello usará distintos Tests de Primalidad disponibles en el mercado.
• El individuo prepara su clave pública n := pq, pero se reserva el coocimiento de p y
q. Adicionalmente, calcula la función de Euler φ(n) = (p − 1)(q − 1). Prueba que
existen primos p y q tales que p < q < 2p, para p suficentemente grande. Pruébese que
n y φ(n) son co-primos en este caso. El valor de la función de Euler φ(n) se oculta
provisionalmente para preparar las claves.
• Seguidamente el individuo halla un elemento e ∈ N tal que 1 < e < φ(n) y tal que
gcd(e, φ(n)) = 1. Pruébese que ese elemento e existe.
• Pruébese que, en el caso p < q < 2p, el resto e de la división de n por φ(n) puede ser
elegido para ese propósito. Pruébese que ese resto vale e = p + q − 1. Nótese que, sin
embargo, eligiendo e como ese resto, cualquier agente de la red pública descubrirá los
mensajes que se envı́en hacia el miembro que haya elegido e como clave.
3.6. ELIMINACIÓN UNIVARIADA CLÁSICA: LA MATRIZ DE SYLVESTER 181

• Pruébese que el número e elegido anteriomente posee inverso en el anillo cociente


Z/φ(n)Z.
• Hállese el inverso d ∈ N de e en Z/φ(n)Z. Hint: usar la Identidad de Bézout con
cotas en Z (ver Corolario 3.4.7).
El usuario define su clave pública como el par de números enteros (n, e). El usuario se guarda
su clave privada d y tira todo el resto de la infromación y los cálulos realizados. Verifica que si
se conoce el valor de la función de Euler φ(n), se puede conocer la clave privada d. Verifica que
la función de Euler se puede conocer a partir de los dos primos p y q. Deduce que factorizar
número enteros dados como producto de dos primos, permite “romper” la clave privada de todo
usuario de esa red encriptada.
Problema 155. Verifica que, en el sistema de clave pública anterior, si de un usuario i se
conocen su clave pública (n, e) y su clave privada d, se pueden hallar los dos números primos
p y q de la factorización de n. Verifica también que se puede calcular fácilmente la función de
Euler φ(n) a partir de n, d y e.
Problema 156 (Codificación y decodificación de un mensaje en RSA). Los mensajes
se presentan como números, bien usando usna asignación de números de dos dı́gitos a cada
sı́mbolo del teclado o por otro medio (alfabeto ASCII, por ejemplo, buscar en wiki ASCII y
su codificación en base 2). El individuo i (con clave pública (ni , ei ) quiere enviar un mensaje
M ∈ N al individuo j (con clave pública (nj , ej )). Para empezar elige M con gcd(M, nj ) = 1
×
(es decir, M ≤ nj − 1 y M ∈ (Z/nj Z) ). En caso de que no sea ası́, el individuo i trocea M en
varias partes, cada una de las cuales es menor que nj − 1 y es unidad. Proceden como sigue:
i) El emisor i del mensaje procede como sigue :
• Calcula el criptograma C := M ej (mod nj ) y lo expone públicamente. Manda un
mensaje al individuo j indicándole que le ha dejado un mensaje. Todo el mundo
puede leer el Criptograma C y todos saben que es para el individuo j de parte de
i.
Prueba que el individuo i puede escribir el criptograma C con el sólo conocimiento de
su mensaje y la clave pública del individuo j.

ii) El receptor j del mensaje procede como sigue:


• Calcula el criptograma C 0 := C dj (mod nj ) y lee el mensaje.
Prueba que el receptor j puede hallar C 0 y que recupera el mensaje original M de i,
es decir, prueba que
C 0 = M mod nj .
Problema 157. Usando en sistema criptográfico de clave pública RSA anterior, con varios
usuarios
{(ni , ei ) : i ∈ I},
de tal modo que cada usuario y sólo cada usuario, conoce su clave privada di . Supongamos
que tres individuos i, j, k realizan las tareas siguientes: i envı́a a j el mensaje M siguiendo el
procedimiento anterior. El individuo k puede ver:
• Las claves públicas de i y j : (ni , ei ), (nj , ej ).
• El criptoograma C publicado por i como mensaje a j.
Intenta definir el procedimiento algorı́tmico que debe seguir el individuo k para descrifrar en
mensaje M a partir de esta información. Deduce si es fácil o difı́cil factorizar números enteros.
Explica el error que se produce cuando, en los algoritmos escolares, se enseña a clacular el
máximo común divisor de dos números enteros. Busca en wikipedia algunos de los sistemas de
comunicación segura basados en RSA (ssh, PGP, SSL/TLS, S/MIME). Resume lo que entiendas
sobre estos protocolos.
Problema 158 (Autentificación y Firma Digital). De nuevo supongamos una read formada
por individuos de los que se conocen sus claves públicas:
{(ni , ei ) : i ∈ I}.
Los individuos quieren enviarse mensaje encriptados con la conidicón de que el receptor pueda
verificar que el emisor es el individuo previsto y no otro individuo de la red
182 3. DIVISIBILIDAD EN ANILLOS: DIP’S, NOETHER Y DE’S. ALGORITMOS

haciéndose pasar por él.

El individuo i de clave (ni , ei ) quiere enviar un mensaje M cifrado y firmado al individuo j (de
clave (nj , ej )). Procede como sigue:
• Calcula la siguiente cntidad que sólo él conoce porque s’olo es conoce su clave privada
propia di :
C1 := M di mod ni .
• Calcula:
e
C2 := C1 j mod nj .
y lo hace público a toda la red.
El individuo j puede recuperar la información oroginal sin conocer la clave pribada di del emisor.
Además, puede estar seguro de que esa informaciń viene “firmada” por el individuo i. Procede
como sigue:
• El individuo j debe calcular:
d
C3 := C2 j mod nj ,
y lo puede conocer porque C2 es público y dj es su clave privada que sólo j conoce.
• Posteriormente el individuo j calcula:
C4 := C3ei mod ni .
Verifica que el individuo j puede calcular C4 y que se verifica:
M = C4 mod ni .
Explica por qué ese mensaje de i para j viene firmado por i con su clave digital (privada).
Problema 159. Un sistema de clave pública es seguro por la razón siguiente: En un sistema
basado en “libro de claves”, basta con que un miembro externo a un red {ci : i ∈ I} sobre el
libro de claves de uno de los miembros ci de la red para disponer de toda la información que
los miembros de la red están distribuyendo unos a otros. Es el fallo de sistemas tipo la famosa
máquina Enigma (busca en internet). En cambio en sistema de clave pública (tipo RSA) este
problema no se produce: si alguien roba la clave privada de un miembro, sólo podrá descrifrar
la información que emita el individuo robado, pero no podrá disponer de otra información
circulando en esa red y que no involucre al individuo robado. Explica la razón.
Problema 160. Sea K un cuerpo algebraicamente cerrado y sea p ∈ K[X1 , . . . , Xn ] un poli-
nomio no constante, es decir p 6∈ K× . Entonces, existe un punto ζ ∈ Kn tal que p(ζ) = 0.
( Hint: Por inducción en el número de variables).
CAPı́TULO 4

Ideales Primos y Maximales. Módulos Libres. Con una


coda sobre la Forma Normal de Smith
(Le temps retrouvé)

“Cubum autem in duos cubos, aut quadratoquadratum in


duos quadratoquadratos & generaliter nullam in infinitum
ultra quadratum potestatem in duos eiusdem nominis fas est
dividere cuius rei demonstrationem mirabilem sane detexi.
Hanc marginis exiguitas non caperet”.
Traducción Libre: Es imposible separar un cubo en dos
cubos, una potencia cuarta en dos potencias cuartas o, en
general, una potencia mayor que dos en dos potencias
similares. He encontrado una maravillosa verdadera prueba
de este hecho. Pero no cabe en este margen estrecho.

P. de Fermat, en “Arithmetica” de Diofanto de


Alejandrı́a.

183
184 4. PRIMOS, MAXIMALES. MÓDULOS LIBRES. FORMA NORMAL DE SMITH

Índice
4.1. Introducción 184
4.1.1. Motivación: El ejemplo de las ecuaciones diofánticas lineales:
Diagonalización, forma normal de Smith y aplicaciones. 185
4.2. Ideales primos e ideales maximales. La noción de rango de un
R−módulo libre. 187
4.2.1. Las nociones y primeras propiedades 187
4.2.2. La noción de rango de un R−módulo libre 192
4.2.3. Generación finita sobre anillos noetherianos es hereditaria 196
4.3. Proyectivos, libres y dominios de ideales principales 197
4.4. Libres y Libres de Torsión sobre dominios de ideales principales 204
4.4.1. Libres de Torsión sobre dominios de ideales principales 204
4.4.2. Libres de torsión sobre dominios euclı́deos (Opcional) 208
4.4.3. Ejercicios y problemas de las secciones 4.2 y 4.3 211
4.4.3.1. Forma (Canónica Racional) de Frobenius de un endomorfismo 212
4.5. Diagonalización de Matrices sobre un DIP 217
4.5.1. Motivaciones 217
4.5.1.1. Ecuaciones diofánticas 217
4.5.2. Matrices de operaciones elementales en GL(2, R) 218
4.5.2.1. Tipo 1: Intercambio de Filas o columnas. 218
4.5.2.2. Tipo 2: Multiplicar a una fila (o columna) por una unidad del
anillo. 218
4.5.2.3. Tipo 3: Sumar a una fila (o columna) un múltiplio de otra fila
(o columna). 219
4.5.2.4. Tipo 4: Encontrar el máximo común divisor. 219
4.5.3. Generalizando a matrices m × n: Operaciones elementales sobre DIP’s 220
4.5.4. Matrices elementales particulares 222
4.5.5. Orlar una matriz 225
4.5.6. “Algoritmo”: Hacer ceros por filas o columnas 226
4.5.6.1. El Caso de Dominios de Ideales Principales. 226
4.5.6.2. El Caso de Dominios Euclı́deos. 226
4.5.7. Hacer ceros en filas y columnas 228
4.5.7.1. El caso de Dominios de Ideales Principales 228
4.5.7.2. El caso de dominios euclı́deos 230
4.5.8. Diagonalización de una matriz sobre un DIP: “algoritmo” primario 230
4.5.9. Resolución de ecuaciones lineales diofánticas 231
4.6. Forma Normal de Smith 234
4.6.1. Estructura de grupos abelianos finitamente generados 237
4.7. Forma de Frobenius y Factores Invariantes de un endomorfismo
sobre un espacio vectorial de dimensión finita. 241
4.7.1. Factores invariantes de un endomorfismo 241
4.7.2. Forma de Frobenius de un endomorfismo: factores invariantes en K[X] 242
4.7.3. El álgebra R[X]/(f ), con f ∈ R[X]mon . 242
4.7.3.1. La Estructura de K[X]−módulo que define un endomorfismo. 245
4.7.4. Ejercicios y problemas de la Sección 4.5 251
4.7.4.1. Ecuaciones Diferenciales Ordinarias Homogéneas 254

4.1. Introducción
Este Capı́tulo pretende, sobre todo establecer las claves de los módulos libres de rango finito y la
clasificación de los grupos abelianos finitamente generados. Pero los elementos que intervienen
en las demostraciones elegidas hacen conveniente explorar un espectro más amplio y más propio
del Álgebra Conmutativa. Ası́, comenzaremos revisando las nociones de ideal primo e ideal
maximal y los sustratos de los espacios Spec(R) y MaxSpec(R) donde forman un grafo orientado
no necesariamente finito. Nos facilitará poder definir la noción de rango de un R−módulo libre.
A esto dedicaremos la Sección 4.2.
Seguidamente retomamos las condiciones noetherianas, esta vez orientóndonos a los módulos
finitamente generados sobre anillos noetherianos. En realidad, este estudio es un artificio en
4.1. INTRODUCCIÓN 185

la medida en que lo que nos interesa es el caso de dominios de ideales principales. Pero la
demostración de que la propiedad de generación finita es hereditaria para dominios de ideales
principales o para anillos noetherianos es la misma, ası́ que hemos ptado por darle un poco
más de generalidad. En la Sección ?? estudiaremos con más detalle estos módulos y aquı́ nos
limitaremos a tratar esa condición hereditaria. En todo caso, sigue el pensamiento noetheriano
que, subrepticiamente, se esconde en estas notas.
También dedicaremos un esfuerzo a introducir los módulos proyectivos en la Sección 4.3. Aquı́,
nos interesa fundamentalmente el caso de módulos sobre dominios de ideales principales, noción
que es equivalente a la de módulo libre en el caso finitamente generado. No será equivalente en
el caso más general. Esta equivalencia no será cierta para el caso de anillos de coeficientes más
generales, de ahı́ un tratamiento más amplio en la Sección ??.
El uso de la terminologı́a de módulos proyectivos sobre dominios de ideales principales nos per-
mite una demostración más directa y elegante del Teorema de Dedekind, del que nos ocuparemos
en la Sección 4.3.
Disponiendo ya del Teorema de Dedekind, es sencillo probar que un módulo sobre un DIP
es libre y de rango finito si y solamente si es finitamente generado y libre de torsión (i.e. el
módulo no posee divisores de cero en el anillo). A eso dedicamos la Sección ??. De nuevo,
la equivalencia no será cierta para anillos más generales, exceptuando el caso del Teorema de
Quillen-Suslin.
Finalmente, debemos ocuparnos de la motivación de estos estudios, que será también, el punto
de partida del Tema.

4.1.1. Motivación: El ejemplo de las ecuaciones diofánticas lineales: Diagonal-


ización, forma normal de Smith y aplicaciones. Hasta aquı́ la abstracción del Capı́tulo,
pero es necesario finalizar con respuestas a preguntas de carácter más terrestre que subyacen
a todo el discurso. La primera pregunta es ¿por qué trabajar con módulos sobre anillos?. Y,
más técnicamente, ¿por qué preocuparse por grypos abelianos finitamente generados (esto es,
Z−módulos)?. El origen está en las ecuaciones diofánticas lineales, esto es, se trata de enfrentar
el siguiente
Problema Clásico 4.1.1 (Ecuaciones diofánticas lineales). Sean dados:
i) Una matriz A ∈ Mm×n (Z) con m filas, n columnas y coordenadas enteras.
ii) Un elemento B ∈ Zm dado como columna.
iii) Una columna de variables X:
 
X1
 X2 
X :=  .  .
 
 .. 
Xn
Resolver el sistema de ecuaciones lineales diofántico:
(4.1.1) AX = B.
Para resolverlo se deben responder las siguientes preguntas:
• Q1: ¿Es el sistema (4.5.1) compatible (consistente o satisfactible) sobre Z n ?. Es decir,
respóndase a la siguiente pregunta:
∃x := (x1 , . . . , xn ) ∈ Zn , Axt = B?,
donde xt significa traspuesta de x.
• Q2 Si el sistema (4.5.1) es compatible en el sentido de Q1, hallar una solución par-
ticular x0 ∈ Rn de ese sistema.
• Q3 Da una descripción completa del conjunto de todas las soluciones del sistema
(4.5.1).
Obviamente, a la manera clásica, las soluciones completas (Pregunta Q3) están relacionads con
el conocimiento del conjunto de soluciones del sistema homogéneo asociado:

(4.1.2) AX = 0t ,
186 4. PRIMOS, MAXIMALES. MÓDULOS LIBRES. FORMA NORMAL DE SMITH

donde 0t es la traspuesta del vector (0, . . . , 0) ∈ Zm .


El conjunto de las soluciones de este sistema de ecuaciones es un submódulo de Zn y, por ser Zn
noetheriano, es un Z−módulo finitamente generado. El Teorema de Dedekind nos dirá que es un
submóudlo libre del módulo libre Zn y que tiene rango acotado por n. Esto, por sı́, ya justifica
el intento de comprender los módulos finitamente genrados sobre anillo noetherianos y, de paso,
los Z−módulos finitamente generados (que no es otra cosa que los grupos abelianos finitamente
generados). Más aún, las preguntas Q1 y Q2 requieren de alguna forma de diagonalización de
matrices aunque,a diferencia del caso de matrices sobre un cuerpo, con los anillos no disponemos
de elemento inverso salvo que el elemento sea unidad.
A partir de este sencillo ejemplo, entramos en la diagonalización (hasta donde es posible) de
matrices sobre un DIP (a lo que dedicamos la Sección 4.5, donde daremos un pseduo-algoritmo
de digonalización de matrices sobre un DIP, para el cual la condición noetheriano es esencial
para probar la finitud de los cálculos sobre un Input dado.
Si bien la mera “diagonalización sobre un DIP” puede ser suficiente para responder a las pregun-
tas Q1, Q2 y Q3 anteriores, es calro que un matemático se siente intrigado por aspectos como
la unicidad de las diagonalizaciones y esto conduce a un resultado clásico del matemático H.J.S.
Smith (cf. [Smith, 1861]) quien establece una forma natural de escribir esa diagonalización
y que es conocida como Forma Normal de Smith. Los elementos de la diagonal son únicos
salvo unidades si están ordenados por divisibilidad y se conocen como factores invariantes de
la matriz. A establecer este resultado dedicamos la Sección 4.6.
Dos aplicaciones naturales (en dos contextos, sólo aparentemente, distintos) se siguen de la
exploración de las ideas de Smith. La primera es el Primer Teorema de Estructura de los
grupos abelianos finitamente generados (Teorema 4.6.3 de la Subsección 4.6.1). Dicho Teorema
establece que todo grupo abeliano finitamente generado es isomorfo a un único Z−módulo de
la forma: !
Yr
(Z/di Z) × Zr ,
i=1
donde d1 , . . . , dr ∈ N son números enteros positivos (di > 0) y Zr es la “parte” libre de torsión
del grupo abeliano.
La segunda aplicación tiene que ver con Teorı́a del Endomorfismo. Dado un endomorfismo
f : V −→ V , sobre un espacio vectorial V de dimensión finita sobre un cuerpo K, disponemos
de una estructura de K[X]−módulo sobre K. Esta estructura induce una relación de seme-
janza entre matrices que proviene de isomorfismos de K[X]−módulos y permiten descomponer
una matriz (salvo semejanza) en suma diaginal de matrices compañeras. Esto se expone y se
explica (con más dedicación de lo que es habitual en los textos de ÁLgebra Lineal al uso) en la
Subsección 4.7. Esencialmente, toda matriz cuadrada M ∈ Mn (K), donde K es un cuerpo, es
semejante a una matriz suma diagonal de matrices compañeras, esto es de la forma:
 
C(f1 ) 0 0 0
 0 C(f2 ) 0 0 
(4.1.3) ..  ,
 
 .. .. . .
 . . . . 
0 0 0 C(fr )
donde C(fi ) quiere decir matriz compañera del polinomio fi ∈ K[X] y fi | fi−1 , para cada
i. Esta forma se conoce como Forma de Frobenius de un endomorfismo y se presenta en esta
Sección. Los polinomios f1 , . . . , fr ∈ K[X] son precisamente los factores invariantes de XIdn −
M como matrix en Mn (K[X]), recordando que K[X] es un dominio de ideales principales.
Una de las consecuencias clásicas más inmediatas es que toda ecuación diferencial lineal ho-
mogénea con coeficientes constantes es equivalente (salvo semejanza) a una unión independiente
(suma diagonal) de ecuaciones diferenciales lineales homogéneas de la forma más simple:
dx d(n−1) x dn x
(4.1.4) a0 x + a1 + · · · + an−1 (n−1) + n = 0.
dt dt dt
donde a0 , . . . , an−1 ∈ R. Con las condiciones iniciales en un punto t0 ∈ R dadas mediante:
dx dn x
x(t0 ) = v0 , (t0 ) = v1 , . . . , n (t0 ) = vm .
dt dt
4.2. PRIMOS, MAXIMALES, RANGO 187

En este sentido, los R[X]−módulos se encuentran con esta manera de descomponer las ecua-
ciones diferenciales lineales y, además, esta descomposición es algorı́tmicamente calculable en
tanto en cuanto los coeficientes de las matrices ivolucradas vvan en un cuerpo computable.
Ciertamente, los objetivos se podrı́an haber abordado con menos aparato teórico, pero el aparto
teórico tiene sus orı́genes en la comprensión de los fenómenos subyacentes al caso particular,
un fenómeno común en Matemáticas.

4.2. Ideales primos e ideales maximales. La noción de rango de un R−módulo


libre.
4.2.1. Las nociones y primeras propiedades.

Definición 68 (Ideales Primos o Maximales. Anillos Locales.). Sea R un anillo:


i) Un ideal propio p ( R, se llama primo si el anillo cociente R/p es un dominio de
integridad. Denotaremos por Spec(R) al conjunto de todos los ideales primos del anillo
R y lo denominaremos espectro primo de R.
ii) Un ideal propio m ( R, se llama maximal si el anillo cociente R/m es un cuerpo.
Denotaremos por MaxSpec(R) al conjunto de todos los ideales maximales del anillo R
y lo denominaremos espectro maximal de R.
Un anillo se dice anillo semi-local si su espectro maximal es finito (i.e. MaxSpec(R) es un
conjunto finito. El anillo se dice local si sólo posee un ideal maximal (i.e. ] (MaxSpec(R)) = 1).

Ejemplo 4.2.1.
i) Un anillo R es dominio de integridad si y solamente si (0) ∈ Spec(R).
ii) Todo ideal maximal es obviamente primo (y tenemos MaxSpec(R) ⊆ Spec(R)), pero
el recı́proco no es cierto en general. Ası́, (0) ∈ Spec(Z) \ MaxSpec(Z) 6= ∅.
iii) Obviamente si K es un cuerpo Spec(K) = MaxSpec(K) = {(0)} y ambos espectros
están constituidos por un único elemento. En particular, los cuerpos son anillos locales.
iv) En un dominio de ideales principales, un ideal p = (p) es un ideal primo si y solamente
si el generador p es un elemento primo o, equivalentemente, irreducible.
v) En un dominio de ideales principales, los ideales maximales son los ideales primos no
nulos.
vi) Consideremos K un cuerpo, K[X1 , . . . , Xn ] el anillo de polinomios en n variables con
coeficientes en K. Consideremos x = (z1 , . . . , zn ) ∈ K n un punto en el espacio afı́n
n−dimensional sobre K y consideremos la siguiente función:
evx : K[X1 , . . . , Xn ] −→ K
p(X1 , . . . , Xn ) 7−→ p(x) := p(z1 , . . . , zn ).
Es sencillo observar que evx es un morfismo de anillos y que es un epimorfismo. El
núcleo de evx viene dado por la siguiente identidad:

ker(evax ) = {p ∈ K[X1 , . . . , Xn ] : p(x) = 0}.

Denotaremos por mx al ker(evζ ) y obseramos que mx es un ideal maximal porque

K[X1 , . . . , Xn ]/mx ∼
= K.
De hecho, tenemos una identificación del espacio afı́n K n con una parte del espectro
maximal y del espectro primo, es decir,

Kn ∼
= {mx : ζ ∈ K n } ⊆ MaxSpec(K[X1 , . . . , Xn ]) ⊆ Spec(K[X1 , . . . , Xn ]).
Una aplicación recursiva de la división euclı́dea por un polinomio mónico (cf. Teo-
rema 1.4.15) prueba fácilmente que mx es el ideal generado por los polinomios {X1 −
z1 , . . . , Xn − zn }, donde x = (z1 , . . . , zn ). Es decir:

mx = (X1 − z1 , . . . , Xn − zn ).
188 4. PRIMOS, MAXIMALES. MÓDULOS LIBRES. FORMA NORMAL DE SMITH

vii) Una construcción análoca puede hacerse en cualquier anillo de funciones razonable
(R−álgebras o C−álgebras, por ejemplo). Ası́, consideremos el anillo C (C) de fun-
ciones continuas sobre un espacio topológico (X, T ). Consideremos x ∈ X un punto
cualquiera y definamos:
evx : C (X) −→ R
f 7−→ f (x).
De nuevo es un morfismo de anillos, de nuevo es epimorfismo porque es una R−álgebra
(y contiene a las constantes) y, de nuevo, tenemos un ideal maximal dado por el núcleo:
mx := ker(evx ) = {f ∈ C (X) : f (x) = 0}.
Con lo que tenemos una identificación:
X∼ = {mx : ζ ∈ X} ⊆ MaxSpec(C (X)) ⊆ Spec(C (X)).
Volveremos a estas ideas con el Nullstellensatz.
viii) El anillo de series de potencias formales K[[X]] es un anillo local cuyo único ideal
maximal m es el ideal generado por X, i.e. m = (X).
ix) Obviamente, y ya hemos visto ejemplos, los ideales primos y maximales no tienen por
qué ser principales. El ejemplo más inmediato, tras los anteriores, podrı́a ser el ideal
m := (3, X 2 + 1) en Z[X] que es un ideal maximal no principal, cuyo cociente es el
cuerpo de 3 elementos, i.e. Z[X]/m = F3 .
x) Los anillos para los cuales MaxSpec(R) = Spec(R) se denominan anillos de dimensión
cero y si verifican ciertas condiciones de cadena, los llamaremos anillos de Artin (pero
esto corresponde a capı́tulos más avanzados del curso).
xi) Los conjuntos Spec(R) y MaxSpec(R) son conjuntos parcialmente ordenados con re-
specto a la inclusión ⊆. Con esta ordenación tiene una estructura de grafo orientado.
La longitud del camino más largo en Spec(R) se denominará la dimensión de Krull de
R y tiene sentido cuando R es un anillo noetheriano.

Proposición 4.2.2. Las siguientes son caracterizaciones alternativas de ideales primos y ma-
ximales en un anillo R:
• Un ideal p ( R es primo si verifica:
∀x, y ∈ R, xy ∈ p =⇒ (x ∈ p) ∨ (y ∈ p).
• Un ideal m ( R es maximal si y solamente si es maximal en el conjunto de los ideales
propios a ( R, ordenados por la inclusión. Es decir m ( R es maximal si y solamente
si para cualquier ideal propio a ( R, se tiene
m ⊆ a =⇒ m = a.
Demostración. Para la primera de las afirmaciones obsérvese que xy ∈ p es equivalente
a
(x + p)(y + p) = 0, en R/p,
mientras que x ∈ p e y ∈ p son respectivamente equivalentes a
x + p = 0, y + p = 0, en R/p.
Con estas observaciones es clara la equivalencia entre las afirmaciones R/p es dominio de inte-
gridad y la descrita en la primera de las afirmaciones de esta proposición.

Para la segunda afirmación, supongamos que R/m es un cuerpo. Y sea a ( R un ideal propio
de R tal que m ⊆ a. Por la Proposición 2.2.28, el ideal a/m es un ideal del anillo cociente R/m.
Como R/m es un cuerpo y a 6= m, entonces necesariamente
a/m = (0 + m) ⊆ R/m,
con lo que concluiremos que a = m y tendremos la maximalidad de m entre los ideales propios
de Rcon la inclusión ⊆ como relación de orden.
Recı́procamente, si m es un elemento maximal entre los ideales propios de R, entonces el cociente
R/m sólo puede poseer dos ideales: R/m y (0 + m). Supongamos ahora un elemento f ∈ R tal
4.2. PRIMOS, MAXIMALES, RANGO 189

que f + m 6= 0 + m en R/m. Esto implica que f 6∈ m y, por tanto, tendremos un contenido


estricto de ideales:
m ( m + (f ) ⊆ R.
Como m es un elemeno maximal entre los ideales propios de R, tendremos que m + (f ) = R.
En particular, existirán g ∈ R y m ∈ m, tales que
1 = m + f g.
Pero, entonces,
1 + m = f g + m = (f + m)(g + m),
lo que significa que f + m ∈ (R/m)× es una unidad. Por tanto,
R/m \ {0 + m} = (R/m)× ,
y R/m es un cuerpo. 

Observación 4.2.3. Obsérvese que hemos probado que un anillo R es cuerpo si y solamente si
{(0)} = MaxSpec(R) = Spec(R).
Nótese que (0) ∈ Spec(R) si y solamente si R es dominio de integridad y la equivalencia se sigue
de la prueba de la afirmación ii) anterior.

Corolario 4.2.4. Sea R un dominio de ideales principales, entonces


MaxSpec(R) := {(p) : p es irreducible y p 6= 0}.
Es decir, los maximales en los dominios de ideales principales son los ideales primos no nulos
o, equivalentemente, los generados por elementos irreducibles.
Demostración. El resultado es consecuencia inmediata del Teorema 3.2.14. Lo que vamos
a hacer es dar una demostración equivalente, pero descriptiva en términos de ideales maximales.
Supongamos que p 6= 0 es un elemento irreducible de un dominio de ideales principales y sea
m := (p) el ideal que genera. Supongamos a un ideal propio de R tal que
m ⊆ a ( (1) = R.
Entonces, a = (a) por ser R un dominio de ideales principales y a | p. Como p· es irreducible
concluiremos que o bien a ∈ R× ∆ (lo que no es el caso porque (a) = a ( R) o bien a ∼ p (i.e.
son asociados) con lo que (p) = (a) o, equivalentemente, m = a y tenemos la maximalidad de
m. Recı́procamente, si m ∈ MaxSpec(R) es un ideal maximal de R y dado que R es dominio de
ideales principales, existe q ∈ R tal que m = (q). Veamos que q es necesariamente irreducible.
Porque si x | q, entonces, si x 6∈ R× (i.e. x no es unidad), entonces, tenemos m ⊆ (x) ( R, la
maximalidad de m nos indica que m = (x) lo que implica que q ∼ x y hemos probado que q es
irreducible. Dado que los ideales maximales son primos, todo elemento irreducible no nulo es
primo por generar un ideal primo. 

Corolario 4.2.5. Si a ( R es un ideal de un anillo R, podemos observar:


i) Los ideales primos del anillo cociente R/a está biyectivamente identificados con los
ideales primos de Spec(R) que contienen al ideal a, mediante la transformación
p 7−→ p/a.
En particular, se tiene:
Spec(R/a) := {p/a : p ⊇ a, p ∈ Spec(R)}.
ii) Los ideales maximales del anillo cociente R/a está biyectivamente identificados con los
ideales maximales de MaxSpec(R) que contienen al ideal a, mediante la transformación
p 7−→ p/a.
En particular, se tiene:
MaxSpec(R/a) := {p/a : p ⊇ a, p ∈ MaxSpec(R)}.
190 4. PRIMOS, MAXIMALES. MÓDULOS LIBRES. FORMA NORMAL DE SMITH

Demostración. Retomamos la Proposición 2.2.28 y los Teoremas de Isomorfı́a. A partir


de los Teoremas de Isomorfı́a, tenemos para cada ideal b ( R de R que contiene a a el ideal del
anillo cociente b/a dado mediante:
b/a := {x + a : x ∈ b}.
Además, tenemos el isomorfismo de anillos:
 
R/a
ϕ: /b/a −→ R/b
.
(x + a) + (b/a) 7−→ x+b
Por tanto, se tiene:
 
R/a
• R/b es dominio de integridad si y solamente si /b/a es dominio de integridad.
Traducido, esto significa b ∈ Spec(R)

siy solamente si b/a ∈ Spec(R/a).
R/a 
• R/b es cuerpo si y solamente si / b/a es cuerpo. Traducido, esto significa
b ∈ MaxSpec(R) si y solamente si b/a ∈ MaxSpec(R/a).
La identificación entre los ideales de R/a y los ideales en R que contienen a a ya fue discutida
en la Proposición 2.2.28, lo que completa la demostración. 

Recordemos de la Proposición 1.4.9 la noción de contracción de un ideal a través de un morfismo


de anillos.
Proposición 4.2.6 (Contracción de primos y maximales). Sea f : R −→ T un morfismo
de anillos y q ∈ Spec(T ) un ideal primo de T . Entonces, la contracción qc := f −1 (q) es un
ideal primo de R. No sucede lo mismo, en general, si reemplazamos “primo” por “maximal”.
Demostración. Consideremos f : R −→ T y la componemos con la proyección π : T −→
T /q y tendremos el morfismo de anillos:
π ◦ f : R −→ T /q.
Usando el primer Teorema de Isomorfı́a (Teorema 2.2.26), tendremos una aplicación inyectiva
(y morfismo de anillos):
ϕ : R/ker(π ◦ f ) −→ T /q.
Con lo que R/ker(π ◦f ) está indentificado con un subanillo de T /q. Además, como q es un ideal
primo de T , el cociente T /q es un dominio de integridad y también son dominios de integridad
todos sus subanillos. En particular, R/ker(π ◦ f ) es un dominio de integridad. Lo único que
falta para probar el enunciado es probar la siguiente igualdad:
−1
ker(π ◦ f ) = (π ◦ f ) ((0)) = f −1 (ker(π)) = f −1 (q) = qc .
Para el caso de los ideales maximales baste con considerar le inclusión i : Z −→ Q y observar
que (0) ∈ MaxSpec(Q), mientras que (0) = i−1 ((0)) no es ideal maximal en Z. 

En el enunciado que sigue utilizaremos el Lema (o Axioma) de Zorn. En todo caso, para aquellos
anillos que interesan en este curso (los anillos noetherianos) el enunciado se puede probar sin
el Lema de Zorn, aunque con el Axioma de Elección Dependiente. Recuérdese que un conjunto
parcialmente ordenado (T, ≤) se denomina cadena si la relación de orden ≤ es una relación de
orden total. Dado un conjunto parcialmente ordenado (S, ≤) llamaremos cadena en (S, ≤) a
todo subconjunto T ⊆ S tal que con la relación de orden inducida por la de S, se tenga que
(T, ≤) es una cadena. El Axioma de Zorn se enuncia del modo siguiente:

Axioma 4.2.7 (Lema de Zorn). Sea (S, ≤) un conjunto parcialmente ordenado. Si, para toda
cadena T ⊆ S existe cota superior en (S, ≤), entonces, existe elemento maximal en (S, ≤).

Se tiene:
Teorema 4.2.8. Asumiendo el Lema de Zorn, todo anillo R posee al menos un ideal maximal
(i.e. MaxSpec(R) 6= ∅).
4.2. PRIMOS, MAXIMALES, RANGO 191

Demostración. Para demostrarlo, consideremos el conjunto I(R) de todos los ideales


a ( R. Ordenemos I(R) con la inclusión y tendremos el conjunto parcialmente ordenado
(I(R), ⊆).
Sea T ⊆ I(R) una cadena en (I(R), ⊆). Supongamos
T := {ai : i ∈ I}.
Entonces, se puede comprobar fácilmente que se verifica:
S
• El conjunto a := i∈I ai es un ideal de R. Para ello, obsérvese que si x, y ∈ a, entonces
existen i, j ∈ I tales que x ∈ ai , y ∈ aj . Por ser T cadena tendremos ai ⊆ aj o aj ⊆ ai .
En el primer caso, x, y ∈ aj o, en el segundo, x, y ∈ ai . Por ser ai y aj ideales, ésto
implica que, en el primer caso, x + y ∈ aj ⊆ a o, en el segundo caso, x + y ∈ ai ⊆ a.
En cualquier caso, x + y ∈ a. Con mayor facilidad se probarı́a que ∀x ∈ R, ∀y ∈ a, se
ha de tener xy ∈ a.
• 1 6∈ a. Esto es más simple, dado que ai ∈ I(R), tenemos 1 6∈ ai , para todo i ∈ I, con
lo que 1 6∈ a y habremos terminado.
Es claro, además, que a es una cota superior de T en I(R). En consecuencia, aplicando el Lema
de Zorn, debe existir un elemento maximal en I(R) y por lo antedicho, ese elemento maximal
está en MaxSpec(R). 

Corolario 4.2.9. Asumiendo el Lema de Zorn, si a ( R es un ideal de R, entonces, existe un


ideal maximal m ∈ MaxSpec(R), tal que a ⊆ m. Adicionalmente, existirá p ∈ Spec(R) tal que
a ⊆ p.
Demostración. A partir de la Proposición 2.2.28, tenemos que los ideales del anillo co-
ciente R/a están identificados con los ideales de R que contienen a a. Además, el corolario
4.2.5 anterior identifica los maximales del coeciente R/a con los maximales de R que contienen
a a. En consecuencia, si R/a tiene algún maximal es de la forma m/a, siendo m ∈ MaxSpec(R)
y m ⊇ a. Ası́, la Proposición anterior, que asume el Lema de Zorn, implica la existencia de
ideales maximales que contienen al ideal a. 

Corolario 4.2.10. Con las mismas hipótesis, si R es un anillo, sus unidades son los elementos
que no pertenecen a ningún ideal maximal. Es decir,
 
\ [
R× := (R \ m) = R \  m .
m∈MaxSpec(R) m∈MaxSpec(R)

Demostración. Si un elemento x ∈ R no es unidad, entonces, el ideal (x) que genera


satisface (x) ( R. Existirá un maximal m ⊇ (x) y, por tanto, x ∈ m. Recı́procamente, si x ∈ m,
con m ∈ MaxSpec(R), entonces x 6∈ R× . Pues si x fuera unidad en R, tendrı́amos que existe
x0 ∈ R, tal que x0 x = 1 y, en particular, concluirı́amos
1 = x0 x ∈ m = R,
contradiciendo el hecho m ( R. 

Observación 4.2.11. Ejemplos triviales de anillos conmutativos sin uniddad que no tienen
ideales maximales propios pueden verse en [Hen, 75].

Proposición 4.2.12. Se tienen las siguientes propiedades para un anillo R:


i) Sean a, b0 , b1 , . . . bs una familia de ideales propios de tal modo que:
• a ⊆ ∪si=0 bi ,
• b0 ∈ Spec(R).
Entonces, existe un subconjunto propio J ( {0, 1, . . . , s} tal que
a ⊆ ∪j∈J bj .
ii) Sean p1 , . . . , pn ∈ Spec(R) ideales primos y sea a un ideal propio contenido en ∪ni=1 pi .
Entonces, existe i tal que a ⊆ pi .
192 4. PRIMOS, MAXIMALES. MÓDULOS LIBRES. FORMA NORMAL DE SMITH

iii) Sean a1 , . . . , am ideales propios de R y sea p un ideal primo que contiene a la inter-
sección ∩mi=1 ai . Entonces, p ⊇ ai para algún i.

Demostración. El resultado está tomado de [AtMc, 1969] y [Rag et al., 1975] combi-
nados. Haremos la prueba de cada propiedad:
i) Supongamos que a ⊆ ∪si=0 bi . Razonemos por reducción al absurdo, si el resultado
fuera falso, entonces para cada i ∈ {0, . . . , s}, debe existir algún elemento xi ∈ a que
no es miembro de la unión ∪j6=i bj . Considero el elemento
x := x0 + x1 · · · xs .
Como todos los xi ’s son elementos de a, es claro que Qs x ∈ a. De otro lado, no es posible
que x ∈ b0 . Porque si x ∈ b0 , entonces x − x0 = i=1 xi ∈ b0 . Pero, por construcción
xi 6∈ ∪j6=i bj . Por tanto, xi 6∈ b0 lo cual contradice la primalidad de b0 .
ii) Usamos la propiedad i). Si a está, contenido en una unión finita de primos p1 , . . . , pn .
Consideremos J ⊆ {1, . . . , m} un sunconjunto de cardinal minimal tal que
a ⊆ ∪j∈J pj .
Pero si J tiene cardinal mayor o igual que 2, como todos ellos son primos, la propiedad
i) implicarı́a que J no es minimal. Por tanto, ](J) = 1 y tenemos la afirmación ii).
iii) De nuevo, por reducción al absurdo, supongamos que p no contiene a ningı́n ai . Esto
es ası́ porque, para cada i, existe xi ∈ ai \ p. Pero, entonces, el elemento
x = x1 · · · xm ∈ ∩m
i=1 ai ,

no puede estar en el ideal p, lo que contradice nuestra hipótesis de p ⊇ ∩m


i=1 ai .


4.2.2. La noción de rango de un R−módulo libre. En el Capı́tulo anterior (ver, por


ejemplo, la Definición 41) hemos usado la expresión R−módulo libre de rango finito. Pero, en
realidad, no hemos definido qué es el rango. Pasamos a analizarlo ahora. El punto de partida
es la noción de dimensión en espacios vectoriales sobre un cuerpo. Sin emargo, incluso esta
noción requiere de algunos comentarios previos.
Observación 4.2.13 (Axioma de Elección y Existencia de Bases). El Axioma de Elección
es un Axioma adicional de la Teorı́a de Conjuntos y que puede enunciarse del modo siguiente:
Axioma 4.2.14 (de Elección). Dada una familia no vacı́a Q de conjuntos no vacı́os {Si : i ∈ I}
existe un elemento en el producto cartesiano (xi ) : i ∈ I ∈ i∈I Si .
Se trata de un Axioma adicional introducido por E. Zermelo (cf. [Zer, 1904]) en 1904 para
poder demostrar el Teorema sobre el Buen Orden (Todo conjunto admite un Buen Orden).
Desde entonces se ha mostado una buena herramienta añadible a los Axiomas de la Teorı́a de
Conjuntos que permiten , por ejemplo, probar el teorema de Tichonoff (Producto de Compactos
es Compacto). En matemáticas Constructivistas no es usualmente aceptado.
En 1984, A. Blass (cf. [Bls, 1984]) demostró que con la axiomática de Zermelo-Frenkel, el
Axioma de Elección es equivalente a la Existencia de Base para cualquier espacio vectorial.
Observación 4.2.15 (Lema de Zorn e Igualdad de los cardinales de las bases). Es
probable que los alumnos hayan visto que en espacios vectoriales finitamente generados, dos
bases cualesquiera tienen la misma cardinalidad. Es un resultado popularmente conocido como
el “Teorema del Reemplazamiento” porque muetra cómo se van reemplazando elementos de
un sistema linealmete independiente por elementos de un sistema generador hasta encontrar
una base dentro de dicho sistema generador. Para la dimensión infinita se necesita algo más
sofisticado, incluyendo el Lema de Zorn, la tricotomı́a de los cardinales (i.e. que todos los
cardinales son comparables) y el Ultrafilter Lemma como axiomas adicionales de la Teorı́a
de Conjuntos (ZFA o similares). De hecho, H. Läuchli (cf. [Lau, 1962]) mostró en 1962 un
ejemplo de axiomática de ZFA con un espacio vectorial que posee dos bases de distinto cardinal.
Observación 4.2.16 (Equivalencia entre estos Axiomas Adicionales). B.L. van de Waer-
den (1903-1996) fue un alumno de doctorado de E. Noether y quedó fuertemente influenciado por
su pensamiento.Su libro en dos volúmenes ([vdW, 1930], [vdW, 1931]), escrito cuando sólo
4.2. PRIMOS, MAXIMALES, RANGO 193

tenı́a 27 años, a partir de los semiarios impartidos por E. Noether y E. Artin, sigue conteniendo
una visión interesante del Álgebra Moderna, de los primeros fundamentos de la Geometrı́a Al-
gebraica, entendida como Teorı́a de la Eliminación clásica. Bajo su impulso se empezaron a
estudiar las interacciones entre estos axiomas adicionales a la Teorı́a de Conjuntos, que desem-
bocaron en el siguiente:
Teorema 4.2.17. Bajo los Axiomas de Zermelo-Fraenkel para Teorı́a de Conjuntos, los si-
guientes Axiomas son equivalentes (e independientes de ZF)
i) Axioma de Elección.
ii) Lema de Zorn
iii) Principio de Buena Ordenación: Todo conjunto X admite un buen orden.
iv) Compatibilidad de Cardinales (también llamado Teorema de Bernstein) Dados dos
conjuntos X e Y , existe o bien una biyección entre ellos o una biyección entre Y y un
subconjunto de X o, recı́procamente, una biyección entre X y un subconjunto de Y .
La prueba, desgracidamente, se sale de este curso, pero se pueden localizar fácilmente textos
con pruebas correctas en la red.
A partir de ahora asumiremos tanto el Axioma de Elección como el Lema de Zorn. Y añadiremos,
con prevención, el siguiente Axioma de la Dimensión de Espacios Vectoriales:
Axioma 4.2.18 (Existencia de dimensión en espacios vectoriales). Sea K un cuerpo, sea
V un espacio vectorial. Entonces,
i) V posee una base como espacio vectorial (equivalente al Lema de Zorn).
ii) Dadas β1 y β1 dos bases de V como K−espacio vectorial. Entonces β1 y β2 son
conjuntos biyectables (demostrable a partir del Lema del Ultrafiltro).
Al cardinal de cualquiera de sus bases, lo llamaremos dimensión de V sobre K.

Recomendamos al lector revisar la noción de base de un R−módulo introducida en la Definición


40. Recuérdese también la noción de R−módulo libre y sus propiedades elementales discutidas
en la Proposición 2.2.38.
Ejemplo 4.2.19. i) Si M es un R−módulo libre de rango finito, entonces existe n ∈ N
tal que M es isomorfo a algún Rn . Queda por probar que Rn no es isomorfo a Rm
cuando m 6= n.
ii) El R−módulo R[X1 , . . . , Xn ] tiene por base el conjunto de todos los monomios
{X µ : µ ∈ Nn },
iii) El R−módulo Hd (X1 , . . . , Xn ) de los polinomios homogéneos en n variables y de grado
d tiene por base
{X µ : µ = (µ1 , . . . , µn ) ∈ Nn , |µ| = µ1 + · · · + µn = d},
que es un conjunto de cardinal d+n−1

n−1 .
iv) El R−módulo de las matrices Mn×m (R) posee una base de cardinal nm.

Lema 4.2.20. Sea R un anillo, M un R−módulo, m ∈ MaxSpec(R) un ideal maximal de R.


Denotemos por k(m) := R/m el cuerpo residual. Consideremos la estructura de k(m)−espacio
vectorial inducida en M/mM conforme a lo indicado en el Problema 77.
Supongamos que M es un R−módulo libre y sea B una base de M como R−módulo libre.
Denotemos por B/m al subconjunto de M/mM dado mediante:
B/m := {b + mM : b ∈ B}.
En tonces, se tiene:
i) El conjunto B/m es una base de M/mM como k(m)−espacio vectorial.
ii) Los conjuntos B y B/m son biyectables y, en particular, tiene el mismo cardinal.
Demostración. Hagamos la prueba de cada parte por separado. Supongamos B := {mi :
i ∈ I} por simplicidad de la lectura.
194 4. PRIMOS, MAXIMALES. MÓDULOS LIBRES. FORMA NORMAL DE SMITH

• Prueba de i): Veamos, en primer lugar, que B/m es sistema generador del k(m)−espacio
vectorial M/mM .
Dado m+mM ∈ M/mM un elemento cualquiera, como m ∈ M , y B es sistema gener-
ador, sabemos que existe un conjunto finito J ⊆ I y un subconjunto {λi ∈ R : i ∈ J}
tal que X
m= λi mi .
i∈J
Tomando clases módulo mM , tendremos:
X
m + mM = (λi + m)(mi + mM ).
i∈J

Como λi + m ∈ k(m) y J es finito, concluiremos que para cualquier m + mM ∈ M/mM


está en el subespacio generado por B/m y, por tanto, este conjunto es generador de
M/mM como k(m)−espacio vectorial.
En cuanto a ser familia libre,supongamos que existe J ⊆ I y existen {λi ∈ R : i ∈ J}
tales que X
(λi + m)(mi + mM ) = 0 + mM, en M/mM .
i∈J
Es decir, X
λi mi ∈ mM.
i∈J
Por tanto, existirá otro conjunto finito T ⊆ I y constantes {θk ∈ m : k ∈ T } tales
que X X
λi mi = θk mk .
i∈J k∈T
Esta identidad se transforma en la siguiente:
X X X
(λi − θk )mk + λi mi + (−θk )mk = 0.
i∈J∩T i∈J\T k∈T \K

Concluiremos que
i) Para cada i ∈ J ∩ T , λi = θi ∈ m. Luego λi + m = 0 + m, para todo i ∈ J ∩ T .
ii) Para cada i ∈ J \ T , λi = 0. Luego λi + m = 0 + m, para todo i ∈ J \ T .
iii) Para cada k ∈ T \ J, θk = 0.
Habremos concluido que λi + m = 0, para todo i ∈ J y, por tanto, B/m es un sistema
de vectores linealmente independientes en el k(m)− espacio vectorial M/mM .
• Prueba de ii): Se parece mucho a la prueba del apartado i). en primer lugar conside-
remos la siguiente aplicación, que es, por definición, suprayectiva:
Φ: B −→ B/m
m 7−→ m + mM.
Si no fuera inyectiva, existirı́an mi1 , m2 ∈ B, con i1 , i2 ∈ I tales que mi1 − mi2 ∈ mM .
Esto implica que tenemos una combinación lineal no trivial en M/mM .
(1 + m)(mi1 + mM ) + (−1 + m)(mi2 + mM ) = 0 + mM.
Pero como B/m es base, esta combinación lineal igualada a cero, con coeficientes en
k(m) no es posible, con lo que llegamos a contradicción.


Corolario 4.2.21 (Teorema de Existencia de rango de R−módulos libres). Asumiendo


el Axioma de la Existencia de dimensión para espacios vectoriales, dos bases de un R−módulo
libre tienen el mismo cardinal. En el caso de R−módulos de rango finito (i.e. que poseen, al
menos, una base de cardinal finito), el resultado es cierto sin necesidad de ampliar la axiomática
de nuestra Teorı́a de Conjuntos. En particular Rn es isomorfo a Rm si y solamente si n = m.
Un módulo es de rango finito n si y solamente si es isomorfo a Rn .
Demostración. Son consecuencia inmediata del Lema previo. 
4.2. PRIMOS, MAXIMALES, RANGO 195

Definición 69 (Rango de un R−módulo libre). Dado un R−módulo libre, llamaremos


rango como R−módulo (o simplemente rango si el anillo R se sobre-entiende) al cardinal de
una cualquiera de sus bases y lo denotaremos mediante:
rankR (M ).
Un R−módulo es libre de rango finito si y solamente si rankR (M ) ∈ N.

Observación 4.2.22 (No se da el Teorema del Reemplazamiento). En espacios vecto-


riales sobre un cuerpo se da el conocido como Teorema del Reemplazamiento (“Todo sistema
generador de un K−espacio vectorial V finitamente generado contiene una base de V ”). Este
Teorema se usa para denotar la estructura de matroide de las bases contenidas en un sistema
generador y que, en particular, permite encontrar bases como cualquier subconjunto de vectores
linealmente independientes y maximal con esa propiedad dentro de un sistema generador. Esto
no se da en módulos libres ni en el caso de dominios de ideales principales. Por ejemplo, Z
admite como sistema generador como Z−módulo al conjunto {2, 3} (i.e. Z = Zh{2, 3}i). Sin
embargo, ningún subconjunto de {2, 3} es una base de Z como Z−módulo libre.

Corolario 4.2.23. Si un R−módulo M es libre de rango n, y m ∈ MaxSpec(R) es un ideal


n
maximal de R, entonces M/mM es isomorfo como R/m− espacio vectorial a (R/m) .
Demostración. Obvio. 

Ejemplo 4.2.24. Sea K un cuerpo y sea f ∈ K[X] un polinomio no nulo. Entonces, el anillo
cociente K[X]/(f ) no es un K[X]−módulo libre. Simplemente porque todo K[X]−módulo libre
tiene que tener dimensión infinita como espacio vectorial sobre K, mientras que K[X]/(f ) es
un K−espacio vectorial finitamente generado.

Corolario 4.2.25. Si M y N son dos R−módulos libres también lo es M ⊕ N . Más aún, si


M y N son dos R−módulos libres de rango finito, M ⊕ N también lo es y el rango verifica:
rankR (M ⊕ N ) = rankR (M ) + rankR (N ).
Demostración. Sean M = (⊕X R) y N = (⊕Y R) dos R−módulos libres. La primera
afirmación es cierta dado que
(⊕X R) ⊕ (⊕Y R) = ⊕X ∪Y
˙ R,
˙ denota la unión “disjunta” de X e Y , lo que se puede describir mediante:
donde X ∪Y
\
˙ := (X × {0}) ({0} × Y ) ⊆ .
X ∪Y
La segund afimación es consecuencia de esta descripción. Sin embargo, por ayudarnos, recorde-
mos que M ⊕ N = M × N y que si tenemos dos bases B1 := {m1 , . . . , mr } B2 := {n1 , . . . , ns }
respectivamente de M y N , es sencillo verificar que la siguiente es una base de M × N como
R−módulo libre:
B := {(m1 , 0), . . . , (mr , 0)} ∪ {(0, n1 ), . . . , (0, ns )} ⊆ M × N.
La base B tiene cardinal r +s (lo que implica la igualdad de rangos, y no es sino la construcción,
en el caso finito de la construcción B1 ∪B
˙ 2


Proposición 4.2.26. Sea M y N dos R−módulos libres de rangos respectivos m y n. Entonces,


existe un isomorfismo de R−módulos entre HomR (M, N ) y Mn×m (R). En particular, cuando
M y N son R−módulos libres de rango finito, HomR (M, N ) también lo es y su rango coincide
con rankR (M ) rankR (N ).
Demostración. Sin pérdida de la generalidad podemos suponer que M = Rm y N = Rn .
Podemos, además, fijar dos bases ordenadas β1 en M y β2 en N . Sin pérdida de la generalidad,
podemos suponer que son las llamadas bases canónicas. Ahora, para cada ϕ ∈ HomR (M, N ),
definamos la matrix M (ϕ) ∈ Mn×m (R) cuyas columnas sean las imágenes (en Rn ) de los
elementos de la base β1 . M (ϕ) es una matriz con n filas y m columnas. Queda como ejercicio
comprobar que M : HomR (M, N ) −→ Mn×m (R) es un isomorfismo de R−módulos. Es el
mismo argumento obvio ya hecho en el caso del Álgebra Lineal. 
196 4. PRIMOS, MAXIMALES. MÓDULOS LIBRES. FORMA NORMAL DE SMITH

4.2.3. Generación finita sobre anillos noetherianos es hereditaria. Retomemos


los R−módulos finitamente generados, pero esta vez supondremos que el anillo R es un anillo
noetheriano (ver Definición 59 de la Sección 3.3). Observaremos que los submódulos de módulos
finitamente generados sobre anillos noetherianos son también finitamente generados (es decir
que la condición es hereditaria para submódulos). Observamos que esta condición es heredi-
taria para sus submódulos. Más adelante, en la Sección ??, retomaremos el asunto de modo
más general usando sucesiones exactas cortas y expresando simplemente que si R es un anillo
noetheriano, un R−módulo es noetheriano si y solamente es finitamente generado.

Proposición 4.2.27. Sea R un anillo noetheriano y M un R−módulo finitamente generado.


Entonces, todos los submódulos de M son finitamente generados.
Demostración. Demostraremos el resultado por inducción en µ(M ) que denota el número
mı́nimo de generadores de M (ver Definición 33).

En el caso µ(M ) = 1, tenemos que M está generado por un conjunto formado por un
único elemento. Esto es, tenemos M = Rha1 i. Ahora, consideramos el siguiente morfismo
de R−módulos:
π : R −→ M
x 7−→ xa.
Es evidente que π es suprayectiva (porque {a1 } genera M ). Sea a := ker(π) el núcleo de π
que es un submódulo de R (y, por tanto, un ideal de R). Por el Primer Teorema de Isomorfı́a
(ver la Subsección 2.2.2) tendremos un isomorfismo de R−módulos entre R/a y M . Por ese
isomorfismo, los submódulos de M son los submódulos de R/a que son los ideales de R/a. Por
la Proposición 2.2.28, los ideales de R/a) son los ideales de R que contienen a a. Como R es
un anillo noetheriano, sus ideales son finitamente generados (recuérdese el Teorema 3.3.2). Por
tanto, los ideales del cociente R/a también son finitamente generados y, en conclusión, cualquier
módulo isomorfo a un ideal de R/a es finitamente generador. En particular, los submódulos de
M son finitamente generados.

En el caso µ(M ) = n ≥ 2, consideremos un sistema minimal de generadores de M β :=


{a1 , . . . , an }. Consideremos el submódulo M1 de M generado por {a2 , . . . , an }, es decir
M1 := Rha2 , . . . , an i.
Se tiene que M1 es finitamente generado y µ(M1 ) ≤ n − 1 y, aplicando la hipótesis inductiva,
todo submódulo de M1 es finitamente generado. En particular, N ∩ M1 es finitamente generado
y puedo suponer:
N ∩ M1 := Rhc1 , . . . , cr i,
donde {c1 , . . . , cr } ⊆ N . De otro lado, consideremos el siguiente morfismo de R−módulos:
π: M −→ M/M1
x 7−→ x + M1 .
El morfismo π es suprayectivo y es fácil ver que
M/M1 := Rha1 + M1 i,
siendo µ(M/M1 ) ≤ 1. Por lo discutido en el caso µ(M ) = 1 anterior, todo submódulo de M/M1
es finitamente generado. Ahora consideremos la restricción

π N : N −→ M/M1 .

Entonces, π N (N ) = π(N ) = Rhb1 + M1 , . . . , bs + M1 i es finitmente generado con bi ∈ N , para
todo i, 1 ≤ i ≤ s.

Considero el conjunto
β 0 := {c1 , . . . , cr } ∪ {b1 , . . . , bs },
Y probemos que
N = Rhβ 0 i,
con lo que habrı́amos probado que N es finitamente generado. Para ver esta igualdad, comence-
mos observando que c1 , . . . , cr ∈ N ∩ M1 ⊆ N y b1 , . . . , bs ∈ N , con lo cual β 0 ⊆ N y como
4.3. PROYECTIVOS, LIBRES Y DOMINIOS DE IDEALES PRINCIPALES 197

Rhβ 0 i es el menor submódulo que contiene a β 0 , tendremos una primera inclusión Rhβ 0 i ⊆ N .
Para la otra inclusión, consideremos m ∈ N un elemento cualquiera. Consideremos su imagen
π(m) = m + M1 ∈ π(N ) ⊆ M/M1 .
Entonces, existirán λ1 , . . . , λs ∈ R tales que
s
X
π(m) = m + M1 = λi (bi + M1 ),
i=1
o, equivalentemente,
s
X
m− λi bi ∈ M1 .
i=1
Como m ∈ N y b1 , . . . , bs ∈ N , se tiene, en realidad,
Xs
m− λi bi ∈ M1 ∩ N.
i=1
Por tanto, como M1 ∩ N = Rhc1 , . . . , cr i, existirán θ1 , . . . , θr ∈ R tales que
X s Xr
m− λ i bi = θi ci ,
i=1 i=1
y, por tanto,
s
X r
X
m= (−λi )bi + θi ci ∈ Rhβ 0 i,
i=1 i=1
con lo que habremos probado N ⊆ Rhβ 0 i y R es finitamente generado. 

En particular, como los dominios de ideales principales son anillos noetherianos se tiene:
Proposición 4.2.28. Sea R un anillo dominio de ideales principales y M un R−módulo fini-
tamente generado. Entonces, todos los submódulos de M son finitamente generados.

4.3. Proyectivos, libres y dominios de ideales principales


Definición 70 (Módulo Proyectivo). Un R−módulo P se dice proyectivo si y solamente
si se verifica la siguiente propiedad:
Para cada R−módulo M y para cada epimorfismo de R−módulos π : M −→ P , existe un
morfismo g : P −→ M tal que π ◦ g = IdP .

Observación 4.3.1 (Lifting Property). La Propiedad descrita en la definición de módulo


proyectivo precedente se conoce también como Lifting Property y, gráficamente, se puede ree-
scribir del modo siguiente:
Se dice que un módulo es proyectivo si satisface:
Dado un epimorfismo de R−módulos f : N −→ M cualquiera y dado cualquier morfismo de
R−módulos g : P −→ M , entonces existe un morfismo de R−módulos h : P −→ N tal que
g ◦ h = f . Gráficamente, dado un diagrama como el siguiente, en el que la sucesión horizontal
es exacta :
P
g

N M 0
f
entonces existe h : P −→ N tal que el siguiente diagrama es conmutativo:
P
∃h g

N M 0
f
198 4. PRIMOS, MAXIMALES. MÓDULOS LIBRES. FORMA NORMAL DE SMITH

Lema 4.3.2. Con las notaciones precedentes, un R−módulo es proyectivo si y solamente si se


verifica:
Para cada R−módulo libre F y para cada epimorfismo de R−módulos π : F −→ P , existe un
morfismo g : P −→ F tal que π ◦ g = IdP .
Demostración. Obviamente, si el R−módulo P es proyectivo se satisface esta propiedad.
De otro lado, hemos visto que todo R−módulo es la imagen por un epimorfismo de un R−módulo
libre (Proposición 2.2.41). Supongamos que se verifica la propiedad anterior para R−módulos
libres y sea
π : M −→ P,
un epimorfismo de R−módulos, donde M es un R−módulo cualquiera. Por la Proposición
2.2.41, existe un R−módulo libre F y un epimorfismo de R−módulos h : F −→ M . Tenemos
el siguiente diagrama de R−md́ulos y morfismos::

h
F M

Como π ◦ h es epimorfismo (por ser coposición de epimorfismos), entonces existe g : P −→ F


tal que (π ◦ h) ◦ g = IdP .

h
F M

∃g π

Entonces, tomando ge := h ◦ π tendremos que fe : P −→ M satisface


π ◦ ge = IdP .


Lema 4.3.3. Todo módulo libre es proyectivo.


Demostración. Lo haremos para el caso de rango finito, aunque la prueba es la misma en
el caso de bases no necesariamente finitas utilizando la Proposición 2.2.36. Sea F un R−módulo
libre de rango finito, sea {e1 , . . . , es } es una base de F como R−módulo libre y sea f : M −→ F
un epimorfismo. Del mismo modo que en la Proposición 2.2.36 podemos construir un morfismo
g : F −→ M del modo siguiente:
Por ser f epimorfismo, existen m1 , . . . , ms ∈ M tales que f (mi ) = ei , para cada i, 1 ≤ i ≤ s.
Definamos
g: F −→ M
x1 e1 + · · · + xs es 7−→ x1 m1 + · · · + xs ms .
Es fácil verificar que g es un morfismo de R−módulos y que verifica la condición indicada. 

Observación 4.3.4. De hecho, no se necesita la condición de finitud del rango, como uno puede
fácilmente verificar.

La siguiente es una prueba del Teorema de Dedekind para el caso de rango finito. La incluimpos
porque no depende del Axioma de Zorn.
4.3. PROYECTIVOS, LIBRES Y DOMINIOS DE IDEALES PRINCIPALES 199

Teorema 4.3.5 (Teorema de Dedekind (para módulos libres finitamente generados


sobre un DIP)). Si R es un dominio de ideales principales, todo submódulo de un R−módulo
libre y de rango finito es libre. Más concretamente, si M es un R−módulo libre de rango finito
y si F es un submódulo de M , entonces F es libre de rango finito y satisface:
rankR (F ) ≤ rankR (M ).
Demostración. Basta con hacer el caso M = Rn . Supongamos que N es un submódulo
de Rn y demostremos, por inducción en n, que N es un R−módulo libre. Para ello, recordemos
que en el caso n = 1, los submódulos de R son los ideales del anillo R y son principales, luego
son libres. Además, como R es un dominio de ideales principales, todo los ideales de R son
principales y, por tanto, su rango está acotado por 1.
Supongamos el resultado cierto para n − 1 y veamos el caso n. Comencemos considerando la
proyección canónica π1 : Rn −→ Rn−1 que “olvida” la primera coordenada. Consideremos el
submódulo π1 (N ) ⊆ Rn−1 . Por hipótesis inductiva, π1 (N ) es un R−módulo libre. Por tanto,
tenemos un epimorfismo de R−módulos:

π := π1 : N −→ π1 (N ),
N
dado por la restricción de π1 a N . Como π1 (N ) es libre, es, por tanto, proyectivo, y ha de
existir un morfismo de R−módulos g : π1 (N ) −→ N tal que π ◦ g = Idπ1 (N ) .
Finalmente, definamos la siguiente aplicación, recordando que, en el caso finito, producto y
suma directa coinciden:
f : N −→ π1 (N ) ⊕ ker(π)
n 7−→ (π1 (n), n − g (π1 (n))) .
En primer lugar, veamos que está bien definida, para lo cual sólo tenemos que ver que para
cada n ∈ N , n − g(π1 (n)) ∈ ker(π). Esto es evidente porque
π (n − g (π1 (n))) = π(n) − π (g(π1 (n))) = π(n) − π1 (n) = 0,

porque π ◦ g = Idπ1 (N ) y π = π1 N .
Ahora observemos que ker(π) = ker(π1 ) ∩ N . Pero ker(π1 ) = R × {0}n−1 por definición de
π1 . Luego ker(π1 ) es un R−módulo libre de rango 1 (por ser isomorfo a R) y N ∩ ker(π1 )
es un submódulo de un R−módulo libre de rango 1. Por lo visto en el caso de rango 1,
ker(π) = ker(π1 ) ∩ N es un R−módulo libre.
Finalmente, es fácil verificar que f es un isomorfismo de R−módulos. Es evidente que es
morfismo. Ahora, si (m1 , m2 ) ∈ π1 (N ) ⊕ ker(π), considero el elemento:
n := g(m1 ) + m2 ∈ N.
Nótese que π(n) = π(g(m1 )) + π(m2 ) = m1 porque π ◦ g = Idπ1 (N ) y π(m2 ) = 0 porque
m2 ∈ ker(π). De otro lado,
n − g (π1 (n)) = (g(m1 ) + m2 ) − g (π1 (n)) = (g(m1 ) + m2 ) − g(m1 ) = m2 .
Por tanto, f es un epimorfismo de R−módulos. En cuanto a la inyectividad,
(0, 0) = f (n) = (π1 (n), n − g (π1 (n))) ,
implica que π(n) = π1 (n) = 0, luego g (π1 (n)) = 0 y, por tanto, n − g (π1 (n)) = n = 0, lo que
implica la inyectividad. Por último, para la prpiedad de los rangos, tenemos que
rankR (N ) = rankR (π(N ) ⊕ ker(π)) = rankR (π(N )) + rankR (ker(π)) .
Ahora es claro que π(N ) es submódulo de Rn−1 y, por hipótesis inductiva, rankR (π(N )) ≤ n−1.
Por su parte, ker(π) es isomorfo a un submódulo de R, con lo que rankR (ker(π)) ≤ 1. Con lo
que concluimos que
rankR (N ) = rankR (π(N )) + rankR (ker(π)) ≤ n,
como pretendı́amos. 

En general, los módulos proyectivos no tienen por qué ser libres aunque dejaremos la discusión
para más adelante en el texto.
Corolario 4.3.6. Si R es un dominio de ideales principales y M es un R−módulo libre, son
equivalentes:
200 4. PRIMOS, MAXIMALES. MÓDULOS LIBRES. FORMA NORMAL DE SMITH

i) M es de rango finito,
ii) M es finitamente generado.
Además, en ese caso rankR (M ) = µ(M ), donde µ(M ) es el mı́nimo de los cardinales de los
sistemas generadores de M .
Demostración. La implicación i) =⇒ ii) se da obviamente: todo R−módulo libre de
rango finito es finitamente generado.
Para la otra, se trata de probar que el rango de un R−módulo libre finitamente generado
coincide con µ(M ). Para ello observemos que, por ser M finitamente generado, supongamos
µ(M ) = n y existe un sistema generador G := {m1 , . . . , mn } de M formado por n elementos.
Entonces, existe un epimorfismo de R−módulos π : Rn −→ M , donde π(ei ) = mi para cada i,
1 ≤ i ≤ n, siendo {e1 , . . . , en } la base “canónica” de Rn como R−módulo libre.
Por ser proyectivo, existe un morfismo g : M −→ Rn tal que π ◦ g = IdM . En particular, g es
monomorfismo y, por tanto, M y su imagen g(M ) ⊆ Rn son isomorfos como R−módulos. Como
g(M ) es submódulo de un R−módulo libre de rango finito, por el Teorema precedente, g(M )
es libre de rango finito y también lo será M . Además, rankR (M ) = rankR (g(M )) ≤ n = µ(M ).
Para probar la igualdad rankR (M ) = µ(M ). Nótese que si M es libre de rango finito, una
base de M es un sistema generador de M y, dado que µ(M ) es un mı́nimo, entonces tenemos
µ(M ) ≤ rankR (M ) y tenemos la igualdad buscada. 

Corolario 4.3.7. Si R es un dominio de ideales principales y M es un R−módulo, son equiv-


alentes:
i) M es un módulo libre de rango finito
ii) M es un R−módulo proyectivo finitamente generado.
Demostración. Ya hemos visto que i) =⇒ ii) en el Lema 4.3.3 precedente. De otro lado,
supongamos que M es un R−módulo finitamente generado y proyectivo. Por ser finitamente
generado, existirá un epimorfismo
π : F := Rn −→ M,
donde F es un R−módulo libre de rango igual al número mı́nimo de generadores de M . Como
M es proyectivo, existirá
g : M −→ F,
tal que π ◦ g = IdM . Por tanto, g es un monomorfismo y tendremos, por restricción del rango
en g, un isomorfismo de R−módulos:
g : M −→ g(M ).
En otras palabras, M es isomorfo a un submódulo de F y, por el Teorema precedente, g(M ) es
libre de rango satisfaciedo rankR (g(M )) ≤ rankR (F ) = n. De ello concluimos que M (que es
isomorfo a g(M )) ha de ser también libre. 

Observación 4.3.8. La condición de ser dominio de ideales principales es crucial para el Teo-
rema 4.3.5 anterior y para su Corolario. El ideal maximal m := (X, Y ) ∈ MaxSpec (K[X, Y ])
es un submódulo de un K[X, Y ]−módulo libre como es K[X, Y ]. Sin embargo, no puede
ser libre. Si fuera libre poseerı́a una base de cardinal menor que el rango de K[X, Y ] como
K[X, Y ]−módulo libre, que es de rango 1. Es decir si m fuera libre serı́a un ideal principal,
pero no lo es como ya hemos visto anteriormente. En cambio, la condición de ser finitamente
generado es superfua. El Teorema de Dedekind, que usa el Lema de Zorn, demuestra que todo
subgrupo de un grupo abeliano libre es un grupo abeliano libre. Dejamos la prueba como
problema.

Camuflada en la prueba del Teorema precedente hemos usado la prueba de la siguiente Proposición:
Proposición 4.3.9. Las siguientes propiedades son equivalentes para un R−módulo P :
i) P es un R−módulo proyectivo (i.e. satisface la lifting property).
ii) El R−módulo P es un sumando directo de un R−módulo libre. Es decir, existe un
R−módulo Q tal que F ∼ = P ⊕ Q es un R−módulo libre.
iii) Toda sucesión exacta corta como la siguiente:
4.3. PROYECTIVOS, LIBRES Y DOMINIOS DE IDEALES PRINCIPALES 201

f g
0 M0 M P 0,
es escindida. Esto es, existe una sucesión exacta corta de la forma:
λ π
0 M0 M0 ⊕ P P 0,
donde λ : M 0 ,−→ M 0 ⊕P es la inclusión canónica, y π : M 0 ⊕P −→ P es la proyección
canónica y existe un isomorfismo ψ : M −→ M 0 ⊕ P tal que es siguiente diagrama es
conmutativo:
f g
0 M0 M P 0

IdM 0 ψ IdP
λ π
0 M0 M0 ⊕ P P 0

Demostración. Hagamos las distinas implicaciones:


• i) =⇒ ii): El R−módulo P es la imagen por un epimorfismo π : F −→ P de un
R−módulo libre. Como P es proyectivo, existe g : P −→ F tal que
π ◦ g = IdP .
Observamos que g es inyectiva (porque π◦g lo es) y, por tanto, tenemos un isomorfismo
de R−módulos
g : P −→ g(M P ).
Veamos que g(P ) es un sumando directo de F y habremos terminado. Para ello,
consideremos K := ker(π) y el morfismo:
ψ : g(P ) ⊕ K −→ F
(n, e) 7−→ n + e.
Veamos que ψ es un isomorfismo y tendremos ii):
Es claro que está bien definido y que es un morfismo de R−módulos. Veamos que
es inyectiva y consideremos (n1 , e1 ) ∈ ker(ψ). Entonces, n1 + e1 = 0 o, equivalente-
mente, n1 = −e1 ∈ K = ker(π). Pero n1 ∈ g(P ) con lo que existirá m1 ∈ P tal que
n1 = g(m1 ). Por tanto, g(m1 ) ∈ ker(π) y, al mismo tiempo m1 = π(g(m1 )). Por tanto,
m1 = 0 y, en consecuencia, n1 = g(m1 ) = g(0) = 0. Finalmente, e1 = −n − 1 = 0 y ψ
es monomorfismo.
Supongamos ahora n ∈ F . Tomemos π(n) ∈ P y consideremos g(π(n)) ∈ F . Obser-
vamos que
π (n − g(π(n))) = π(n) − π(g(π(n)) = π(n) − π(n) = 0.
Por tanto, n − g(π(n)) ∈ ker(π). Obviamente, g(π(n)) ∈ g(P ) porque π(n) ∈ P y
concluimos que
ψ(g(π(n)), n − g(π(n))) = n,
con lo que ψ es suprayectiva. Por tanto, ψ es un ismorfismo de R−módulos y P es
isomorfo a un sumando directo de F .
• ii) =⇒ iii): Como en la prueba precedente, por ser P proyectivo, existirá h : P −→ M
un morfismo de R−módulos tal que g ◦ h = IdP . En particular, h es un monorfismo
de R−módulos. Considero el morfismo de R−módulos siguiente:
ψ: M −→ P ⊕ M0
−1
m 7−→ (g(m), f (m − h(g(m)))).
Veamos, en primer lugar, que está bien definida. Comencemos verificando que m −
h(g(m)) ∈ ker(g). Esto es obvio porque:
g (m − h(g(m))) = g(m) − (g ◦ h)(g(m)) = g(m) − g(m) = 0.
De otro lado, la sucesión exacta corta inicial era exacta con lo que Im(f ) = ker(g). Es
decir, m − g(h(m)) Im(f ). Pero f : M 0 −→ Im(f ) es un isomorfismo de R−módulos,
con lo que tiene sentido considerar la imagen inversa de todos los elementos de Im(f ).
En particular, tiene sentido considerar f −1 (m − h(g(m))) y tenemos bien definido ψ.
202 4. PRIMOS, MAXIMALES. MÓDULOS LIBRES. FORMA NORMAL DE SMITH

Veamos que ψ es un isomorfismo. Para ello, veamos que es inyectiva. Pero si m ∈ M


es tal que ψ(m) = (0, 0) entonces, g(m) = 0, luego h(g(m)) = 0 y tendremos que
(0, 0) = ψ(m) = (0, m − h(g(m))) = (0, m),
de donde concluimos que m = 0 y ψ es un monomorfismo de R−módulos.
En cuanto a la suprayectividad, si (n1 , e1 ) ∈ P ⊕ M 0 , observamos que f (e1 ) ∈ M y es
un elemento del núcleo de g. Considero el siguiente elemento de M :
m := h(n1 ) + f (e1 ) ∈ M.
Entonces, tenemos que:
ψ(m) = (g(m), f −1 (m − h(g(m))) .
Pero
g(m) = g(h(n1 ) + f (e1 )) = g(h(n1 )) + g(f (e1 )) = n1 + 0 = n1 ,
mientras que
−1
f (m − h(g(m))) = f −1 (m − h(n1 ))) = f −1 (h(n1 ) + f (e1 ) − h(n1 )) = f −1 (f (e1 )) = e1 .
Con lo que concluimos que ψ(m) = (n1 , e1 ) y ψ es un epimorfismo. Como ya probamos
que ψ es monomorfismo, entonces es un isomorfismo de R−módulos.
Para concluir, basta con observar que el siguiente diagrama es conmutativo con las
funciones que hemos definido, lo cuale s un mero ejercicio de verificación:
f g
0 M0 M P 0

IdM 0 ψ IdP
λ π
0 M0 M0 ⊕ P P 0
• iii) =⇒ ii) : El R−módulo P es siempre la imagen de un epimorfismo que parte de
una R−módulo libre o, equivalentemente, existe una sucsesión exacta corta como la
siguiente:
f g
0 K F P 0,

donde F es un R−módulo libre. Por iii) esa sucesión exacta corta es escindida y, en
particular, existe un isomorfismo ϕ = ψ −1 : K ⊕ P −→ F . Pero eso ya significa que
F = ϕ(K) ⊕ ϕ(P ), con lo que ϕ(P ) es un sumando directo de un R−ódulo libre (i.e.
F ) y P y ϕ(P ) son, obviamente, isomorfos.
• ii) =⇒ i): Supongamos que P es un sumando directo de un R−módulo libre F = Q⊗P
y consideremos un epimorfismo π : M −→ P . Entonces, tengo un epimorfismo de
Q ⊕ M en F dado mediante:
ψ : Q⊕M −→ Q⊕P =F
(q, m) 7−→ (q, π(m)).
Es claramente epimorfismo por serlo π y, como F es un R−módulo proyectivo, existe
un morfismo φ : F −→ Q ⊕ M tal que
ψ ◦ φ = IdF = IdQ⊕P .
Escribamos φ := (φ1 , φ2 ) y reescribamos φ como el morfismo
φ: Q⊕P −→ Q⊕M
(e, n) 7−→ (φ1 (e, n), φ2 (e, n)).
Componiendo con ψ observamos que para (0, n) ∈ {0} ⊕ P se tiene:
(0, n) = ψ(φ((0, n))) = ψ(φ1 (0, n), φ2 (0, n)) = (φ1 (0, n), π(φ2 (0, n))).
En particular, concluimos las dos igualdades siguientes para cada n ∈ P :
φ1 (0, n) = 0, π(π2 (0, n)) = n.
4.3. PROYECTIVOS, LIBRES Y DOMINIOS DE IDEALES PRINCIPALES 203

Definamos
Φ: P −→ M
n 7−→ φ2 (0, n).
Se trata de un morfismo de R−módulos y, por lo visto anteriormente,

π(Φ(n)) = π(φ2 (0, n)) = n.

Con lo que P hi satisface la propiedad buscada y P es un R−módulo proyectivo.




Corolario 4.3.10. Todo R−módulo finitamente generado es el co-núcleo de un morfismo en-


tre módulos libres. Es decir, existe una matriz A ∈ Mm×n (R) que define un morfismo de
R−módulos
ϕA : Rn −→ Rm ,
(x1 , . . . , xn ) 7−→ ϕA (x1 , . . . , xn ) := (y1 , . . . , ym ),
dado mediante:
   
y1 x1
 y2   x2 
ϕA (x1 , . . . , xn ) = (y1 , . . . , ym ) ⇐⇒   = A .
   
.. ..
 .   . 
ym xn

De tal modo que M es el co-núcleo de ϕA , esto es,

M∼
= Rm / Im(ϕA ).

Demostración. Por ser M finitamente generado, existe un epimorfismo π : Rm −→ M


de R−módulos. Por el Primer Teorema de Isomorfı́a, tendremos que

M∼
= Rm /K, K = ker(π).

Como K es un submódulo de Rn , existe, a su vez, un R−módulo libre de rango finito Rn y


un morfismo suprayectivo de R−módulos ψ : Rn −→ K. Obviamente, ψ puede verse como un
morfismo entre R−módulos libres ψ : Rn −→ Rm , tal que su imagen verifica Im(ψ) = K =
ker(π). Entonces, M es el co-núcleo de ψ. Ahora, aplicando la Proposición 4.2.26, tenemos que
necesariamente ψ ha de ser de la forma ϕA para alguna matriz A ∈ Mm×n (R). 

Corolario 4.3.11. Si R es un dominio de ideales principales, un R−módulo M es finitamente


generado si y solamente si es el cociente de dos R−módulos libres de rango finito.

Demostración. Usando el Corolario precedente, si M es un R−módulo finitamente ge-


nerado, entonces es un co-núcleo de un morfismo entre dos R−módulos libres. Es decir,

M∼
= Coker(π),

donde π : Rn −→ Rm es un morfismo de R−módulos. Pero, por el Teorema precedente,


Im(π) ⊆ Rm será un R−módulo libre y

M∼
= Coker(π) = Rm / Im(π),

resulta ser un cociente de dos R−módulos libres de rango finito. La otra implicación es evidente.

204 4. PRIMOS, MAXIMALES. MÓDULOS LIBRES. FORMA NORMAL DE SMITH

4.4. Libres y Libres de Torsión sobre dominios de ideales principales


4.4.1. Libres de Torsión sobre dominios de ideales principales.
Definición 71 (Elemento de torsión). Sea M un R−módulo. Para cada m ∈ M , llamare-
mos anulador de m y lo denotaremos por AnnR (m) ⊆ R, al siguiente conjunto:
AnnR (m) := {λ ∈ R : λm = 0}.
Se trata de un ideal de R y lo llamaremos ideal anulador del elemento m. Un elemento m ∈ M
se denomina elemento de torsión si su anulador AnnR (m) 6= (0) es un ideal no nulo de R o,
equivalentemente, si se satisface:
∃λ ∈ R \ {0}, λm = 0.
Denotaremos por T orR (M ) al conjunto de los elementos de torsión de M .
Un módulo que no posee elementos de torsión no nulos se denomina R−módulo libre de torsión.

Observación 4.4.1. Si R es un dominio de integridad, el conjunto T orR (M ) es un submódulo


de M . En general, si R no es dominio de integridad, T orR (M ) no necesariamente es submódulo.
La razón es que, en ese caso, puede no ser subgrupo para la suma. Por ejemplo, si R := Z/6Z
y si M = Z/6Z, los elementos de torsión son los divisores de cero de Z/6Z que es dado como
la unión de los ideales (2Z/6Z) ∪ (3Z/6Z). Y claramente, (2 + 6Z) + (3 + 6Z) = 5 + 6Z no es
elemento de torsión porque es unidad en el anillo. En general, si R es un anillo y M = R es
visto como R−módulo sobre sı́ mismo, los elementos de torsión de M son, precisamente, los
divisores de cero de R. Por eso, en general, a los elementos de torsión se les denomina también
divisores de cero del R−módulo. Conservaremos nuestra terminologı́a con T orR (M ) porque nos
ocuparemos, en este Capı́tulo, solamente del caso de anillos R que son dominios de integridad.

Estas observaciones se resumen en la siguiente:


Proposición 4.4.2. Sea R un dominio de integridad y M un R−módulo. Entonces T orR (M ) ⊆
M es un submódulo y el R−módulo cociente
M/T orR (M ),
es libre de torsión.
Demostración. Ya hemos observado que si R es dominio de integridad T orR (M ) es
submódulo. Veamos que el cociente es libre de torsión. Para ello, sea m + T orR (M ) un
elemento de torsión del módulo cociente y sea λ ∈ R un elemento no nulo tal que:
λ ∈ AnnR (m + T orR (M )).
Esto significa que λm ∈ T orR (M ), luego existe un elemento m0 ∈ T orR (M ) tal que λm = m0 .
entonces, existe ξ ∈ R \ {0} tal que ξm0 = 0. Finalmente, (λξ) ∈ AnnR (m) y, como R es
dominio de integridad, λξ ∈ AnnR (m) \ {0}. Por tanto, m ∈ T orR (M ) o, equivalentemente,
m + T orR (M ) = 0 + T orR (M ). 

Proposición 4.4.3. Sea R un dominio de integridad y M un R−módulo libre. Entonces M es


libre de torsión.
Demostración. Como M es libre posee una base β := {mi : i ∈ I}. Si m ∈ M fuera un
elemento no nulo y de torsión, tendrı́amos que existe J ⊆ I un conjunto finito y {λj : j ∈ J}
tales que X
m= λj mj .
j∈J
Como m 6= 0, J es no vacı́o y algunos de los λj han de ser no nulos. De hecho, podemos suponer
que todos son no nulos (i.e. podemos suponer que λj 6= 0, ∀i ∈ J 6= ∅).
Como m es un elemento de torsión, existe λ ∈ R, λ 6= 0, tal que se verifica:
 
X X
0 = λm = λ  λj mj  = (λλj ) mj .
j∈J j∈J
4.4. LIBRES Y LIBRES DE TORSIÓN SOBRE DOMINIOS DE IDEALES PRINCIPALES 205

Pero como β es base, entonces debemos tener:

λλj = 0, λj 6= 0, ∀j ∈ J.

Como R es un dominio de integridad, entonces se tiene que producir λ = 0 y habremos llegado


a contradicción. 

Ejemplo 4.4.4. Se tienen los siguientes ejemplos:


i) Todo R−módulo de la forma Rn es libre de torsión cuando R es dominio. Por ejemplo,
Zm es Z−módulo libre de torsión, K[X]n es un K[X]−módulo libre de torsión.
ii) Si R es un dominio, R[X1 , . . . , Xn ] es un R−módulo libre de torsión. Lo mismo se
puede decir de Hd (X1 , . . . , Xn ).
iii) Todos los grupos cı́clicos finitos poseen elementos de torsión no nulos. Por ejemplo,
todos los Z−módulos de la forma Z/mZ, con m ∈ N, m ≥ 2.
iv) La existencia de elementos de torsión no nulos depende del anillo y no solamente
del conjunto de elementos de M . Nótese que los Z/mZ−módulos (Z/mZ)n son
Z−módulos que poseen elementos de torsión no nulos, pero, si p ∈ N es primo, los
Z/pZ−módulos (Z/pZ)n son Z/pZ−espacio vectoriales y son libres de torsión como
Z/pZ−módulos. En cambio, si m ∈ N es no primo, los Z/mZ−módulos (Z/mZ)n
también poseen elementos de torsión como Z/mZ−módulos. Por ejemplo, el elemento
(2 + 6Z, 0 + Z/6Z) en (Z/6Z)2 es un elemento de torsión no nulo sobre Z/6Z, dado
que
AnnZ/6Z ((2 + Z/6Z, 0 + Z/6Z)) = (3 + Z/6Z) ⊆ Z/6Z.
v) Argumentos similares al apartado anterior pueden construirse cuando se tratan módulos
sobre K[X].

Vamos a proceder a caracterizar la condición de ser libre de torsión en el caso de R−módulos


libres finitamente generados sobre un dominio de ideales principales en las páginas siguientes.

Teorema 4.4.5. Sea R un dominio de ideales principales y M un R−módulo finitamente


generado y libre de torsión. Entonces, todo sistema generador de M de cardinal minimal es
base de M .
Es decir, si R es dominio de ideales principales, las siguientes propiedades son equivalentes para
un R−módulo M :
i) M es libre de torsión y finitamente generado.
ii) M es libre de rango finito.
iii) M es proyectivo y finitamente generado.

Demostración. La equivalencia entre ii) y iii) ya se ha discutido en el Corolario 4.3.7


anterior. La otra equivalencia se sigue de la primera afirmación del enunciado: se trata de
ver que todo conjunto minimal de generadores de un R−módulo libre de torsión finitamente
generado sobre un DIP es una base como R−módulo libre. Supongamos que S := {e1 , . . . , em }
es un conjunto minimal de generadores de M como R−módulo, que existe porque M es finita-
mente generado. Dentro de ese conjunto podemos elegir un subconjunto maximal de elementos
linealmente independientes sobre R. Salvo reordenación de los ı́ndices, podemos suponer que
existe s ≤ m tal que S := {e1 , . . . , es } son un conjunto maximal de elementos de S linealmente
independientes sobre R. Existe con s ≥ 1 por ser libre de torsión. Sea F el submódulo que
genera S, que es un R−módulo libre. Si s = m, entonces F = M y habremos terminado.
Supongamos que fuera posible que s < m. Entonces, para cada i, s + 1 ≤ i ≤ m, existe λi ∈ R
no nulo tal que λi ei ∈ F . Basta con ver que {e1 , . . . , es , ei } ha de verificar una combinación
lineal no trivial igualada aQcero y que, en esa combinación lineal, el coeficiente de ei ha de ser
m
no nulo. Definamos Λ := i=s+1 λi ∈ R. Tenemos que Λ 6= 0 en R porque R es un dominio de
integridad. Definamos la aplicación siguiente:

Λ: M −→ M
m 7−→ Λm.
206 4. PRIMOS, MAXIMALES. MÓDULOS LIBRES. FORMA NORMAL DE SMITH

Es un endomorfismo de R−módulos y su imagen Λ(M ) está contenida en F . Para verlo,


observemos que Λej ∈ F para 1 ≤ j ≤ s porque ej ∈ F . De otro lado,
 
Y
Λei =  λk  λi ei ∈ F,
k6=i

porque λi ei ∈ F . Como Λ(M ) ⊆ F y F es libre de rango finito, por el Teorema 4.3.5 precedente,
Λ(M ) es un R−módulo libre y su rango verifica
rankR (Λ(M )) ≤ rankR (F ) = s.
Podemos reescribir el morfismo de R−módulos Λ por restricción del rango:
Λ: M −→ Λ(M )
m 7−→ Λm.
De momento tenemos un morfismo suprayectivo por obvias razones y, como M es libre de
torsión, entonces Λ debe ser un monomorfismo. Nótese de Λ 6= 0, luego Λm = 0 implica m = 0
en M por ser M libre de torsión.
En conclusión, M es isomorfo a un R−módulo libre de rango menor que s < m, con lo que
tiene un sistema generador con, a lo sumo, s elemetos (la imagen inversa de la base de Λ(M ))
que tiene, a lo sumo, s elementos). En suma, si s < m, habrı́amos llegado a contradicción con
la minimalidad de m entre los cardinales de los sistemas de generadres de M . 

Corolario 4.4.6. Si R es un dominio de ideales principales y M es un R−módulo libre de


torsión finitamente generado, todo conjunto generador de cardinal minimal es una base de M
como R−módulo libre.
Demostración. Es exactamente lo que se prueba en el Teorema precedente. 

Corolario 4.4.7. Si R es un dominio de ideales principales y M es un R−módulo finitamente


generado, El R−módulo cociente:
M/T orR (M ),
es un R−módulo libre de rango finito.
Demostración. Ya hemos visto que M/T orR (M ) es libre de torsión en una Proposición
pecedente y, como M es finitamente generado, entonces también es R−módulo finitamente
generado el cociente M/T orR (M ). Por tanto, el Teorema precedente nos dice que M/T orR (M )
es libre de rango finito. 

Ejemplo 4.4.8. Los siguientes ejemplos son también ejemplos donde los módulos lo son sobre
dominios euclı́deos.
i) Los Z−módulos libres de torsión y finitamente generados son los isomorfos a Zn . Todo
submódulo de Zn es libre y de rango finito. Pero el rango del submódulo no es siempre
estrictamente menor que el rango del módulo libre del que partı́amos. Por ejemplo,
3
(2Z) es un Z−módulo libre de rango 3 que es submódulo de Z3 que también es libre
de rango 3, pero no son iguales.
ii) Los K[X]−módulos libres de torsión y finitamente generados son los isormorfos a
K[X]n . Lo mismo se aplica a sus submódulos y al rango.
iii) En el Ejemplo de la Teorı́a del endomorfismo (ver 2.2.4), la estructura de K[X]−módulo
del espacio vectorial V , de dimensión finita sobre K, con respecto a un endomorfismo
ϕ : V −→ V no es la estructura de un K[X]−módulo libre. En particular no es libre
de torsión y todos los elementos v ∈ V poseen anulador no trivial. De hecho, el ideal
AnnK[X] (v) := {p ∈ K[X] : p ·K[X] v = p(ϕ)(v) = 0},
es un ideal principal en K[X] generado por un polinomio que se denomina polinomio
mı́nimo del endomorfismo ϕ con respecto al vector v.

Observación 4.4.9 (Contraejemplos). Las hipótesis del Teorema 4.4.5 precedente son in-
evitables.
4.4. LIBRES Y LIBRES DE TORSIÓN SOBRE DOMINIOS DE IDEALES PRINCIPALES 207

i) Sobre dominios de ideales principales, hay módulos libres de torsión que no son libres,
porque no son finitamente generados. A modo de ejemplo, Q es un Z−módulo libre de
torsión. Ahora bien, cualesquiera dos números racionales son linealmente dependientes
sobre Z (ver Problema 166). Por tanto, si Q es un Z−módulo libre, la base sólo puede
tener un elemento y Q serı́a libre de rango 1. Pero, entonces, todos los números
racionales tendrı́an el mismo denominador, lo que no es el caso.
ii) Sobre anillos que no son dominios de ideales principales, hay módulos libres de torsión
y finitamente generados que no son libres. El ejemplo más simple es el anillo K[X, Y ]
y el ideal m := (X, Y ). Se trata de un ideal de un dominio de integridad, ası́ que es
un módulo libre de torsión. Es claro, por su definición que es un ideal (y, por tanto,
un módulo) finitamente generado sobre K[X, Y ]. Sin embargo, no es libre. Si fuera
libre, entonces serı́a un ideal principal (ver Problema 167) y ya hemos indicado que m
no es un ideal principal en los Ejemplos 3.2.1.

Teorema 4.4.10. Sea R un dominio de ideales principales. Entonces, todo módulo finitamente
generado M , admite una descomposición de la forma:
M∼ = F (M ) ⊕ T orR (M ),
donde F (M ) ∼
= M/T orR (M ) es un R−módulo libre de rango finito.
Demostración. Para ello, consideremos el R−módulo cociente:
F (M ) := M/T orR (M ).
Por la Proposición 4.4.2, M/T orR (M ) es libre de torsión y finitamente generado y por el
Teorema 4.4.5 es un R−módulo libre. Consideremos la proyección canónica
π : M −→ M/T orR (M ) = F (M ).
Por el Lema 4.3.3, F (M ) es un R−módulo proyectivo. Tenemos la sucesión exacta corta:
i π
0 T orR (M ) M M/T orR (M ) 0,

donde i es la inclusión y π es la proyección canónica. Como M/T orR (M ) es proyectivo, por el


apartado iii) de la Proposición 4.3.9, esta sucesión exacta corta es escindida. Existirá entonces
un isomorfimos de R−módulos ψ : M −→ T orR (M ) ⊕ M , lo que concluye la prueba del
enunciado. 

Corolario 4.4.11. En particular, todo grupo abeliano finitamente generado es el cociente de


dos Z−módulos libres de rango finito.
Demostración. Ver Corolario 4.3.11. 

Corolario 4.4.12 (Estructura de Grupos Abelianos Finitamente Generados (Parte


I)). Sea G un grupo abeliano finitamente generado, entonces, existen r, m ∈ N, G es isomorfo
al producto de grupos abelianos:
Zr × G1 ,
donde G1 = T orZ (G) es un grupo abeliano finito (i.e. de cardinal finito) igual a m formado por
los elementos de torsión de G.
Demostración. Por el resultado precedente, como Z es un dominio de ideales principales
y G es un Z−módulo finitamente generado, podemos concluir que
G := F (G) × T orZ (G).
Como F (G) es libre y finitamente generado, entonces F (G) = Zr y nos queda por analizar
solamente T orZ (G) y probar que es un grupo abeliano de cardinal finito.
Ahora, T orZ (G) es un Z−módulo finitamente generado porque G es finitamente generado y Z
es un anillo noetheriano (cf. Proposición 4.2.27) y, además, todos sus elementos son de torsión.
Sea {g1 , . . . , gt } un sistema generador de cardinal minimal de T orZ (G). Definamos:
ϕ: Zt −→ T or (G)
Pt Z
(x1 , . . . , xt ) 7−→ i=1 xi gi .
208 4. PRIMOS, MAXIMALES. MÓDULOS LIBRES. FORMA NORMAL DE SMITH

Claramente, ϕ es un morfismo suprayectivo de Z−módulos y denotemos por K su núcleo. De


otro lado, como g1 , . . . , gt son todos elementos de torsión, para cada i, 1 ≤ i ≤ t, existe mi ∈ N,
mi ≥ 1 tal que mi gi = 0 en G (es decir, mi ∈ AnnZ (gi )). Entonces, es fácil observar que el
siguiente subgrupo libre de Zt está contenido en K:
t
Y
mi Z ⊆ K.
i=1
Por tanto, usando el Primer y el Segundo Teorema de Isomorfı́a, observamos que
 Q 
t t
Z / mi Z
T orZ (G) ∼
= Zt /K ∼
i=1

= / Q
t
 .
K/ i=1 mi Z
Q 
t
Por tanto, T orZ (G) es un cociente del grupo abeliano G0 := Zt / i=1 mi Z , por un subgrupo
suyo. Pero, el grupo G0 es un grupo abeliano de cardinal finito: es un producto de grupos
cı́clicos
Yt
G0 := (Z/mi Z) ,
i=1
luego también es de cardinal finito cualquiera de sus cocientes. Hemos probado ası́ que T orZ (G)
es un grupo abeliano de cardinal (orden) finito. 

Observación 4.4.13. Veremos más adelante que todo grupo abeliano finito es un producto
finito de grupos cı́clicos y por tanto, T orZ (G) es un producto finito de grupos cı́clicos de orden
finito.

Corolario 4.4.14 (Conjunto de Soluciones de un sistema lineal homogéneo de ecua-


ciones diofánticas). Todo conjunto de soluciones de un sistema lineal de ecuaciones diofánticas
homogéneas es un Z−módulo libre. Es decir, sea dada una matriz A ∈ Mn×m (Z) con n filas,
m columnas y coordenadas en Z. Consideremos el conjunto de soluciones del sistema de ecua-
ciones lineales diofánticas homogéneo definido por A:
   
x1 0
 x2   0 
(x1 , . . . , xn ) ∈ Zn , A  .  =  .  ∈ Zm .
   
 ..   .. 
xn 0
El conjunto de soluciones diofánticas de este sistema homogéneo es un Z−módulo libre (submódulo
de Zn ) de rango finito.
Demostración. Es obvio que el conjunto de soluciones es submódulo de Zn (por ser
homogéneas). Entonces, por lo visto anteriormente, es libre de torsión y, por tanto, es un
Z−módulo libre. 

4.4.2. Libres de torsión sobre dominios euclı́deos (Opcional). En la Sección prece-


dente (Subsección 4.4.2 hemos demostrado el Teorema 4.4.5 que muestra que en el caso de
módulos finitamente generados sobre un dominio de ideales principales, libre equivale sobre
libre de torsión. Ahora vamos a hacer una prueba distinta en el caso de dominios euclı́deos. La
razón de incluir este segundo enunciado es que contiene una cierta forma de poder controlar
cómo se produce este resultado en función del crecimiento y decrecimiento de los coeficientes.
Lo dejamos como Subsección opcional del curso.

Proposición 4.4.15. Sea (R, φ) un dominio euclı́deo y sea M un R−módulo finitamente gen-
erado. Sea β := {a1 , . . . , an } un sistema generador de M y sea Λ := (λ1 , . . . , λn ) ∈ Rn una
lista de elementos de R (tantos como elementos tiene el sistema generador). Supongamos que
gcd(λ1 , . . . , λn ) = (1).
Entonces, existe un sistema generador de M con el mismo cardinal que β
β 0 := {b1 , . . . , bn },
4.4. LIBRES Y LIBRES DE TORSIÓN SOBRE DOMINIOS DE IDEALES PRINCIPALES 209

de tal modo que


n
X
b1 ; = λi ai .
i=1

Demostración. Dada una lista Λ = (λ1 , . . . , λn ) ∈ Rn , definamos el conjunto: J(Λ) :=


{i ∈ {1, . . . , n} : λi 6= 0}, y la función:
r
X
Φ(Λ) := φ(λi ).
i=1

Nótese que si gcd(λ1 , . . . , λn ) = 1, necesariamente J(Λ) 6= ∅.

Comencemos observando que la propiedad se verifica si alguno de los λi es unidad en R: Porque


si existe i ∈ J(Λ) tal que λi ∈ R× , podemos suponer, reordenando los elementos de la base y
de la lista si fuera necesario, que i = 1 y que λ1 ∈ R× . En ese caso, el conjunto
β 0 := {b1 , a2 , . . . , an },
Pn
con b1 := i=1 λi ai , es también un sistema generador de M , dado que
n
!
X
−1 −1
a1 := λ1 b1 − λ1 λi ai .
i=2
Y la afirmación se verifica obviamente.
Nótese que como gcd(λ1 , . . . , λn ) = 1, J(Λ) 6= ∅ y necesariamente se ha de tener:
Φ(Λ) ≥ φ(1) + (n − 1)φ(0) > nφ(0).
La razón es simple. Como hemos visto, en la Proposición 3.4.3, que φ(a) > φ(0) para todo
a ∈ R, a 6= 0, y que φ(a) ≥ φ(1), si a 6= 0. Podemos suponer, por ejemplo, que 1 ∈ J(Λ) 6= ∅ y,
por tanto,
Xn
Φ(Λ) ≥ φ(λ1 ) + φ(λi ) ≥ φ(λ1 ) + (n − 1)φ(0) ≥ φ(1) + (n − 1)φ(0).
i=2

Como Φ(Λ) ∈ Z y Φ(Λ) ≥ φ(1)+(n−1)φ(0), probaremos la Proposición por inducción en Φ(Λ).

Supongamos Φ(Λ) = φ(1) + (n − 1)φ(0). Como J(Λ) 6= ∅, podemos suponer, reordenando los
ı́ndices si fuera necesario que 1 ∈ J(Λ), es decir, λ1 6= 0. Entonces tenemos,
n
X
(φ(λ1 ) − φ(1)) + (φ(λi ) − φ(0)) = 0.
i=1

Como φ(λ1 ) − φ(1) ≥ 0 y φ(λi ) − φ(0) ≥ 0 para todo i, 2 ≤ i ≤ n, esta suma es una suma de
enteros positivos igualada a cero, por cuanto, tendrı́amos:
φ(λ1 ) − φ(1) = 0, φ(λ2 ) − φ(0) = 0, . . . , φ(λ2 ) − φ(0) = 0.
Por tanto λ1 ∈ R× y λi = 0, 2 ≤ i ≤ n. Pero, entonces, estarı́amos en el caso que ya hemos
visto que se verifica por defecto.
Supongamos ahora que Φ(Λ) = m > φ(1). Si alguno de los λi es unidad, ya habremos
terminado. Supongamos, entonces, que ninguno de los λi es unidad. Supongamos
Λ := (λ1 , . . . , λn ),
con la propiedad gcd(λ1 , . . . , λn ) = 1. Entonces, el conjunto J(Λ) no puede ser un conjunto de
cardinal 1. Porque si J(Λ) tuviera un sólo elemento, por ejemplo J(Λ) = {i}, tendrı́amos
gcd(λ1 , . . . , λn ) = gcd(0, . . . , 0, λi , 0, . . . , 0) = λi .
Como Φ(Λ) = m > φ(1) + (n − 1)φ(0), concluirı́amos que
Φ(Λ) = φ(λi ) + (n − 1)φ(0) = m > φ(1) + (n − 1)φ(0),
con lo que λi no serı́a unidad de R y, por tanto, gcd(λ1 , . . . , λn ) 6= 1, contradiciendo nuestras
hipótesis.
210 4. PRIMOS, MAXIMALES. MÓDULOS LIBRES. FORMA NORMAL DE SMITH

Dado que J(Λ) posee más de un elemento, podemos suponer que 1, 2 ∈ J y que φ(λ1 ) ≥ φ(λ2 ).
Además, como ninguno de los dos es unidad, se tiene:
φ(λ1 ) ≥ φ(λ2 ) > φ(1) ≥ 0.
Podemos aplicar divisón euclı́dea y tendremos que existen q, r ∈ R tales que
λ1 = qλ2 + r, φ(r) < φ(λ2 ) ≤ φ(λ1 ).
Ahora consideremos la lista
Λ1 := (r, λ2 , . . . , λn ) ∈ Rn .
Nótese que gcd(r, λ2 , . . . , λn ) = 1 porque se tiene la coincidencia de ideales:
a := (r, λ2 , . . . , λn ) = (λ1 , λ2 , . . . , λn ) = b.
Para verlo, es claro que b ⊆ a, dado que λ1 = qλ2 + r ∈ b. Pero también se tiene que a ⊆ b,
dado que r = λ1 − qλ2 ∈ b.
De otro lado, se tiene
n
X n
X
Φ(Λ1 ) = φ(r) + < φ(λ1 ) + φ(λi ) = Φ(Λ).
i=2 i=2

Consideremos ahora la lista de elementos de M dada mediante:


β1 := {a1 , (a2 + qa1 ), a3 , . . . , an },
junto con la lista Λ1 antes introducida. Observamos que β1 es un sistema generador de M .
Para verlo, sea N el submódulo de M generador por β1 . Es claro que {a1 , a3 , . . . , an } ⊆ N .
Pero además,
a2 = (−1)a1 + (a2 + qa1 ) ∈ N,
con lo cual β ⊆ N y M ⊆ N ⊆ M .
Como Φ(Λ1 ) < Φ(Λ) podemos aplicar la hipótesis inductiva al par (β1 , Λ1 ) y existirá un sistema
generador β 0 := {b01 , b02 , . . . , b0n } de M tal que
b01 = ra1 + λ2 (a2 + qa1 ) + λ3 a3 + · · · λn an .
Ahora bien, el conjunto β es un conjunto de generadores de M que verifica:
b01 = (qλ2 + r)a1 + λ2 a2 + · · · + λn an = λ1 a1 + λ2 a2 + · · · + λn an ,
y β 0 verifica la propiedad enunciada para el (β, Λ), con lo que la Proposición queda demostrada
por inducción. 

Teorema 4.4.16. Sea (R, φ) un dominio euclı́deo y M un R−módulo libre de torsión y finita-
mente generado. Entonces, todo sistema generador de M de cardinal minimal es base de M .
En particular, si (R, φ) es euclı́deo y M es finitamente generado, entonces,
M es libre de torsión ⇐⇒ M es libre
Demostración. La segunda afirmación es consecuencia de la primera. Si M es finita-
mente generador, existe un sistema generador de M de cardinal minimal y, por tanto, si M es
libre de torsión, entonces ese sistema generador es base de M como R−módulo, por cuanto M
es libre. Para la otra implicación véase la Proposición 4.4.3 anterior.

Para la primera afirmación usaremos la Proposición 4.4.15 anterior. Sea β = {a1 , . . . , an } ⊆ M


un sistema generador minimal de M . Supongamos que β no fuera libre. Entonces, existe una
lista (λ1 , . . . , λn ) ∈ Rn de elementos no todos nulos tales que
λ1 a1 + · · · + λn an = 0.
Como R es dominio de ideales principales, sea h = gcd(λ1 , . . . , λn ) ∈ R. Como no todos los
λi son nulos y R es dominio, necesariamente se ha de tener h 6= 0. La identidad anterior será
ahora:
h (λ01 a1 + · · · + λ0n an ) = 0,
4.4. LIBRES Y LIBRES DE TORSIÓN SOBRE DOMINIOS DE IDEALES PRINCIPALES 211

donde λ0i h = λ. Sea m := (λ01 a1 + · · · + λ0n an ) entonces hm = 0 y m es un elemento de torsión


de M . Como M es libre de torsión, entonces m ha de ser nulo, esto es, tenemos
(λ01 a1 + · · · + λ0n an ) = 0.
Pero, además gcd(λ01 , . . . , λ0n ) = 1, por ser hλ0i = λi y h = gcd(λ1 , . . . , λn ). Por tanto estamos
en las hipótesis de la Proposición 4.4.15 anterior con
β := {a1 , . . . , an },
y
Λ := (λ01 , . . . , λ0n ).
Por tanto, debe existir un sistema genedaor de M
β 0 := {b1 , . . . , bn },
donde
n
X
b1 = λ0i ai = 0.
i=1
Pero entonces, el siguiente conjunto
β 00 := {b2 , . . . , bn },
genera M como R−módulo y tiene cardinal n − 1, lo que contradice la minimalidad del cardinal
de β como generador de M . 

Obsérvese que, en este caso, el Teorema 4.3.5 pasa a ser un Corolario.


Corolario 4.4.17. Si (R, φ) es un dominio euclı́deo, todo submódulo de un R−módulo libre
finitamente generado es libre.
Demostración. Si M es un R−módulo libre finitamente generado, entonces es libre de
torsión. Si M es libre de torsión, todo submódulo suyo es libre de torsión. Además, por la
Proposición 4.2.27 todo submódulo de M es finitamente generado (porque R es dominio de
ideales principales y M es finitamente generado. Entonces, N es libre de torsión y finitamente
generado sobre un dominio euclı́deo, luego M es un R−módulo libre de rango finito. 
4.4.3. Ejercicios y problemas de las secciones 4.2 y 4.3.
Problema 161. Pruébese la Proposición 4.2.28. Es decir, pruébese que si R es un anillo
noteheriano y M es un R−módulo finitamente generado, todo submódulo de M es también
finitamente generado. ( Hint: Seguir la estructura de la demostración de la Proposición 4.2.27,
adaptando el argumento al caso en que R es noetheriano, aunque no sea DIP.)
Problema 162. Hallar Spec(Z[X]) y MaxSpec(Z[X]).
Problema 163. Dar ejemplos de K[X]−módulos que tengan las propiedades que se indican a
continuación:
i) Un ejemplo de un K[X]−módulo M que posee elementos de torsión, pero existe un
polinomio f ∈ K[X] tal que M es un K[X]/(f )−módulo libre de torsión.
ii) Un ejemplo de un K[X]−módulo M que posee elementos de torsión, y tal que existe
f ∈ K[X] tal que M posee elementos de torsión no nulos como K[X]/(f )−módulo.
Problema 164. Prueba que si K es un cuerpo de cardinal infinito y si f ∈ K[X1 , . . . , Xn ] es
un polinomio no nulo, entonces existe (x1 , . . . , xn ) ∈ K n tal que p(x1 , . . . , xn ) 6= 0.
Problema 165 (Polinomio mı́nimo de un endomorfismo). Sea V un espacio vectorial de
dimensión finita sobre K, sea ϕ : V −→ V un endomorfismo, Sea
·K[X] : K[X] × V −→ V
(p(X), v) 7−→ p(ϕ)(v) ∈ V,
la operación de que hace que V sea un K[X]−módulo, como se discute en el Ejemplo 2.2.4.
Para cada v ∈ V , denotemos por µv ∈ K[X] el polinomio generador de AnnK[X] (V ) tal y como
se define en el Ejemplo 4.4.8. Sea
β := {v1 , . . . , vn }
una base de V como K−espacio vectorial. Prueba:
212 4. PRIMOS, MAXIMALES. MÓDULOS LIBRES. FORMA NORMAL DE SMITH

i) Existe un polinomio mónico y de grado n p ∈ K[X] tal que para todo v ∈ V p ∈


AnnK[X] (v).
ii) Los polinomios µv ∈ K[X] tienen todos grado acotado por n.
iii) Sea h(X) el mı́nimo común múltiplo de {µv1 , . . . , µvn } en K[X]. Entonces h ∈
AnnK[X] (v), para todo v ∈ V .
iv) Concluir que el h anterior es el polinomio de mı́nimo grado tal que h(ϕ) = 0 como
endomorfismo. Este polinomio es el polinomio mı́nimo de ϕ y se denotará mediante
µϕ .
v) Prueba el siguiente resultado (conocido como el Avoidance Lemma):
Lema 4.4.18 (Avoidance Lemma). Sea K un cuerpo infinito y sea V un es-
pacio vectorial no nulo. Entonces, V no se puede escribir como unión de dos o más
subespacios propios distintos. Es decir, si V = W1 ∪ · · · ∪ Wr , con r ≥ 2, entonces
existe i ∈ {1, . . . , r} tal que V = Wi . Discute un enunciado si K no es infinito.
vi) Prueba que si K es un cuerpo infinito, existe un vector v ∈ V tal que
µv = µϕ .
Problema 166. Probar que Q es un Z−módulo libre de torsión. Pruébese asimismo que cua-
lesquiera dos números racionales son linealmente dependientes sobre Z. Concluir que si Q fuera
un Z−módulo libre, entonces tendrı́a rango 1.
Problema 167. Probar que si R es un dominio de integridad y a es un ideal de R que es,
además, libre como R−módulo, entonces a ha de ser un ideal principal.
4.4.3.1. Forma (Canónica Racional) de Frobenius de un endomorfismo. Los ejer-
cicios que siguen muestran la presentación de todo endomorfismo como suma diagonal de ma-
trices compañeras sobre el cuerpo de base.
Problema 168 (Matriz compañera de un polinomio). Sea R un anillo y sea f (X) ∈ R[X]
un polinomio mónico con coeficientes en R. Supongamos:
f (X) := X n + an−1 X k−1 + · · · + a1 X + a0 .
Se denomina matriz compañera de f a la matriz
 
0 0 0 ··· 0 −a0
 1
 0 0 ··· 0 −a1 

 0 1 0 ··· 0 −a2 
C(f ) :=  0 .
 
 0 1 ··· 0 −a3 
 .. .. .. . . .. .. 
 . . . . . . 
0 0 0 ··· 1 −an−1
Se pide:
i) Hallar las matrices compañeras de los siguientes polinomios:
X 3 − 2X + 1, X 2 − 2X − 1, X 5 − 3X 3 + X + 1.
ii) Supongamos R = K es un cuerpo. Considera el ideal a := (f ) generado por f en K[X]
y el anillo cociente K[X]/a. Prueba que K[X]/a es un espacio vectorial de dimensión
finita sobre K y que la siguiente es una base de K[X]/a como K−espacio vectorial:
β := {1 + a, X + a, . . . , X n−1 + a}.
iii) Hallar la dimensión de K[X]/a como K−espacio vectorial.
iv) Con las mismas notaciones, consideremos la siguiente correspondencia:
ηX := K[X]/a −→ K[X]/a
h+a 7−→ Xh + a.
Prueba que ηX es aplicación, probar que es un endomorfismo de K[X]/a como K−espacio
vectorial y probar que la matriz de coordenadas de ηX en la base β es justamente la
matriz compañera C(f ) del polinomio f dado.
4.4. LIBRES Y LIBRES DE TORSIÓN SOBRE DOMINIOS DE IDEALES PRINCIPALES 213

v) Con las mismas notaciones, para cada polinimio g ∈ K[X] definamos la siguiente
correspondencia:
ηg := K[X]/a −→ K[X]/a
h+a 7−→ gh + a.
Prueba que es un endomorfismo de espacios vectoriales (que se denomina homotecia
de razón g de K[X]/a y que es un endomorfismo de K[X]−módulos. Prueba que se
dan las siguientes propiedades:
ηg1 +g2 = ηg1 + ηg2 , ηg1 g2 = ηg2 ◦ ηg1 = ηg1 ◦ ηg2 , ∀g1 , g2 ∈ K[X].

η0 = 0, η1 = IdK[X]/a .
vi) Prueba que la matriz de ηg en la base β anterior es
g(C(f )) ∈ Mn (K),
donde C(f ) es la matriz compañera de f y g(C(f )) es el resultado de evaluar g en
X = C(f ) matricialmente.
Problema 169. Con las mismas notaciones, si v ∈ V es un vector y µv es un polinomio de
grado k, el siguiente subespacio vectorial de V es submódulo como K[X]−módulo:
W (v, ϕ) := Khv, ϕ(v), ϕ2 (v), . . . , ϕk−1 (v)i.
(Pista: probar que es invariante con respecto a ϕ) Se pide también:
i) La dimensión de W (v, ϕ) es k. (Pista: probar que {v, ϕ(v), ϕ2 (v), . . . , ϕk−1 (v)} son
linealmente independientes sobre K).
ii) Consideremos la restricción de ϕ al subespacio W (v, ϕ) (tiene sentido porque W (v, ϕ)
es subespacio invariante):

φ := ϕ W (v,ϕ) : W (v, ϕ) −→ W (v, ϕ)
w 7−→ ϕ(w).
Prueba que existe una base β de W (v, ϕ) tal que la matriz de φ en esa base β es la
matriz compañera del polinomio mı́nimo de f en v. (Pista: usar
β := {v, ϕ(v), ϕ2 (v), . . . , ϕk−1 (v)}).
Problema 170. Con las notaciones de los problemas anteriores, sea ϕ : V −→ V un endo-
morfismo de un espacio vectorial V de dimensión n sobre un cuerpo K. Sea v ∈ V un vector
no nulo y sea µv el polinomio mı́nimo de ϕ en v. Supongamos que el grado de µv es k. Prueba
que se puede encontrar un subespacio V1 ⊆ V de dimensión n − k, tal que:
M
V = W (v, ϕ) V1 ,

y se satisface la siguiente propiedad: Existe una base {wk+1 , . . . , wn } de V1 tal que para todo i,
1 ≤ i ≤ n − k, existen ci ∈ K y hi ∈ V1 tales que
ϕ(wi ) = ci v + hi .
( Pista: Completa la base {v, ϕ(v), ϕ2 (v), . . . , ϕk−1 (v)} de W (v, ϕ) hasta obtener una base de
V : β0 := {v, ϕ(v), ϕ2 (v), . . . , ϕk−1 (v), uk+1 , . . . , un }. Denotemos por V0 el subespacio generado
por {uk+1 , . . . , un }. Para cada i, k + 1 ≤ i ≤ n, la imagen de ui a través de ϕ será de la forma:
k−1
X
ϕ(ui ) = c0 v + cj f j (v) + λui + hi ,
j=1

donde
• c0 , c1 , . . . , ck−1 , λ ∈ K,
• hi es un elemento del subespacio de V0 generado por los elementos que la base de V0
que no son ui . Es decir,
hi ∈ Kh{ut : t 6= i}.
214 4. PRIMOS, MAXIMALES. MÓDULOS LIBRES. FORMA NORMAL DE SMITH

Con estas notaciones, construye una solución (x0 , . . . , xk−2 ) ∈ K n−2 del siguiente sistema de
ecuaciones lineales: 

 Xk−2 + ck−1 = 0,


 Xk−3 + c k−2 + λX k−2 = 0
.



 ..

 Xt + ct+1 + λXt+1 = 0

 ..
.




X0 + c1 + λX1 = 0.

Es decir, prueba que este sistema es compatible y considera (x0 , . . . , xk−2 ) ∈ K n−1 una solución.
Define c00 := c0 + λx0 . Define:
k−2
X
wi := ui + xi f t (v).
t=0

Verifica que, construyendo iterativamente wk+1 , . . . , wn , el subespacio V1 := Khwk+1 , . . . , wn i


generador por estos elementos verifica las condiciones indicadas, con
ϕ(wi ) = c0i v + Hi ,
con Hi ∈ V1 .) Adicionalmente, prueba que el conjunto β siguiente es base de V :
β := {v, ϕ(v), ϕ2 (v), . . . , ϕk−1 (v), wk+1 , . . . , wn }.
Prueba que la matriz de ϕ en la base β anterior tiene la forma siguiente:
 
C(µv ) N
M (ϕ) := ,
0 M
donde
• C(µv ) ∈ Mk (K) es la matriz compañera del polinomio mı́nimo µv ,
• 0 ∈ M(n−k)×k (K) es la matriz nula con n − k filas y k columnas,
• La matriz N ∈ Mk×(n−k) (K) es una matriz con k filas y n − k columnas en la que
sólo la primera fila puede contener elementos no nulos y tiene la forma:
 0
ck+1 c0k+2 · · · c0n

 0 0 ··· 0 
N :=  . ..  .
 
. ..
 .. .. . . 
0 0 ··· 0
• La matriz M ∈ Mn−k (K) es una matriz cualquiera con n − k filas y columnas.
Problema 171. Con las notaciones de los problemas anteriores, sea ϕ : V −→ V un endo-
morfismo de un espacio vectorial V de dimensión n sobre un cuerpo K. Sea v ∈ V un vector
no nulo y sea µv el polinomio mı́nimo de ϕ en v. Supongamos que el grado de µv es k. Sea
V1 ⊆ V un subespacio de dimensión n − k, y sea una base {w1 , . . . , wn−k } de V1 tal que para
todo i, 1 ≤ i ≤ n − k, existen ci ∈ K y ωi ∈ V1 tales que
ϕ(wi ) = ci v + ω1 .
Sea β la siguiente base de V construida en el problema precedente :
β := {v, ϕ(v), ϕ2 (v), . . . , ϕk−1 (v), wk+1 , . . . , wn }.
Supongamos que la matriz de ϕ en la base β tiene, como en el problema precedente, la forma
siguiente:
 
C(µv ) N
M (ϕ) := ,
0 M
donde
• C(µv ) ∈ Mk (K) es la matriz compañera del polinomio mı́nimo µv ,
• 0 ∈ M(n−k)×k (K) es la matriz nula con n − k filas y k columnas,
4.4. LIBRES Y LIBRES DE TORSIÓN SOBRE DOMINIOS DE IDEALES PRINCIPALES 215

• La matriz N ∈ Mk×(n−k) (K) es una matriz con k filas y n − k columnas en la que


sólo la primera fila puede contener elementos no nulos y tiene la forma:
 
ck+1 ck+2 · · · cn
 0 0 ··· 0 
N :=  . ..  .
 
. .
. . .
 . . . . 
0 0 ··· 0
• La matriz M ∈ Mn−k (K) es una matriz cualquiera con n − k filas y columnas.
Prueba que si existe i, k + 1 ≤ i ≤ n tal que ci 6= 0, entonces el polinomio mı́nimo asociado a ϕ
con respecto al vector wi tiene grado estrictamente mayor que el grado del polinomio mı́nimo
µv , es decir, probar que
deg(µwi ) > deg(µv ).
(Pista: Prueba que los vectores siguientes son linealmente independientes en V :
{wi , f (wi ), . . . , f k−1 (wi ), f k (wi )}.
Para ello, hallar sus coordenadas en la base β a partir de las matrices dadas.)
Problema 172. Deducir del problema anterior que si K es un cuerpo (finito o infinito) y si
V es un espacio vectorial de dimensión finita sobre K, y si ϕ : V −→ V es un endomorfismo,
entonces existe un vector v ∈ V tal que µv es igual al polinomio mı́nimo de ϕ.
Problema 173 (Existencia de forma canónica cı́clica (racional o de Frobenius) de
un endomorfismo). Prueba que si ϕ : V −→ V es un endomorfismo de un espacio vectorial
de dimensión finita n sobre K, existen polinomios f1 (X), . . . , fr (X) tales que
r
Y
fi = χA (X),
i=1
y existe una base β de V tal que la matriz de ϕ en la base β es de la forma:
 
C(f1 ) 0 0 ··· 0

 0 C(f2 ) 0 ··· 0  
M (ϕ) := 
 0 0 C(f 3 ) · · · 0  ,
 .. .. .. .. 
 . . . . 
0 0 0 · · · C(fr )
donde los 00 s son matrices nulas de tallas adecuadas y las matrices C(f1 ), . . . , C(fr ) son respec-
tivamente las matrices compañeras de f1 , . . . , fr . probar que los polinomios fi pueden elegirse
de tal modo que fi | fi−1 . En este caso, se dice que los polinomios {f1 , . . . , fr } son los factores
invariantes de ϕ. Se llama forma canónica racional (también forma cı́clica o forma canónica
de Frobenius, según los autores).
Problema 174 (Interpolación de Polinomios). Sea K un cuerpo y sean α1 , . . . , αn ∈ K ele-
mentos del cuerpo. Se denomina matriz de Vandermonde (Alexandre-Théophile Vandermonde)
n × m sobre K determinada por esta lista de valores, a la matriz:
1 α1 α12 · · · α1m
 
1 α2 α22 · · · α2m 
V dMn×m (α1 , . . . , αn ) :=  . ..  .
 
. ..
. . . 
1 αn αn2 · · · αnm
En el caso m = n − 1 escibiremos simplemente
V dM (α1 , . . . , αn ) = V dMn×m (α1 , . . . , αn ).
Se pide:
i) Considerar el K−espacio vectorial K[X]m de los polinomios univariados de grado
acotado por m. Y para el punto α := (α1 , . . . , αn ) ∈ K n , consideremos la aplicación
siguiente:
evalα : K[X]m −→ Kn
f 7−→ (f (α1 ), . . . , f (αn )).
216 4. PRIMOS, MAXIMALES. MÓDULOS LIBRES. FORMA NORMAL DE SMITH

Prueba que es una aplicación lineal entre K−espacios vectoriales. Considerar en


K[X]m la base monomial {1, X, X 2 , . . . , X m } y en K‘n la base canónica. probar que
la matriz de evalα en esas bases es la matriz de Vandermone, es decir, probar que:

M evalα = V dMn×m (α1 , . . . , αm ).
ii) Prueba que, en el caso m = n − 1, el determinante de la matriz de Vandermonde
verifica
Y
det (V dM (α1 , . . . , αn )) = (αi − αj ) .
i<j

iii) Prueba que el determinante de la matriz de vandermondeQn V dM (α1 , . . . , αn ) está rela-


cionado con el discriminante del polinomio f (X) := i=1 (X − αi ).
iv) Prueba que si m = n − 1, la aplicación lineal evalα es un isomorfismo de K−espacio
vectoriales si y solamente si αi 6= αj , ∀i 6= j.
v) Prueba que si m = n − 1, la aplicación lineal evalα es suprayectiva si y solamente si
αi 6= αj , ∀i 6= j.
vi) Concluir que si m ≥ n − 1 la aplicación lineal evalα es suprayectiva si y solamente si
αi 6= αj , ∀i 6= j.
Se llaman procedimientos de interpolación a todo procedimiento de resolución del sistema de
ecuaciones lineales:    
A0 b1
 A1   b2 
V dMn×m (α1 , . . . , αn )  .  =  .  ,
   
 ..   .. 
Am bn
donde los datos son el vector (b1 , . . . , bn ) ∈ K n y el punto α = (α1 , . . . , αn ) ∈ K n , además del
grado m. A toda solución de ese sistema de ecuaciones (a0 , . . . , am ) ∈ K m+1 le corresponde un
único polinomio solución
f = am X m + · · · a1 X + a0 ∈ K[X]m .
Prueba que un problema de interpolación posee solución si αi 6= αj , ∀i 6= j.
Problema 175 (Interpolación de Lagrange). Sea K un cuerpo que tiene, al menos, n
elementos distintos α1 , . . . , αn ∈ K. Sea (b1 , . . . , bn ) ∈ K n un punto en el espacio afı́n
n−dimensional y sea m ≥ n − 1. Consideremos el Problema de Interpolación definido por
estos tres elementos sobre K.
   
A0 b1
 A1   b2 
V dMn×m (α1 , . . . , αn )  .  =  .  .
   
 ..   .. 
Am bn
Se pide:
i) Interpolación de Lagrange: Probar que el siguiente polinomio es la única solución
de grado menor o igual que n − 1 en K[X]m del problema de interpolación anterior:
n Q
j6=i (X − αj )
X
fLg := bi Q .
i=1 j6=i (αi − αj )

ii) Probar que si f, g ∈ K[X] son dos soluciones del Problema de Interpolación, entonces,
f − g es una solución del Problema de Interpolación homogéneo:
   
A0 0
 A1  0
V dMn×m (α1 , . . . , αn )  .  =  .  .
   
 ..   .. 
Am 0
Probar que el conjunto de soluciones de este Problema de Interpolación homogéneo es
la intersección n ∩ K[X]m , donde n es el ideal dado mediante: n := ∩ni=1 mαi .
4.5. DIAGONALIZACIÓN DE MATRICES SOBRE UN DIP 217

iii) Con las notaciones anteriores, probar que el conjunto de todas las soluciones del Prob-
lema de Interpolación inicial es dado mediante:
fLg + (n ∩ K[X]m ) = {fLg + h : h ∈ n ∩ K[X]m }.
Problema 176. Sea K un cuerpo cualquiera y p ∈ K[X] un polinomio de grado a lo sumo n.
Prueba que p no puede tener más de n raı́ces distintas en K. (Pista: recordar qué raı́ces son
las soluciones de la ecuación p(X) = 0. Prueba la afirmación usando el Problema precedente).
Problema 177. Sea K un cuerpo cualquiera y A ∈ Mn (K) una matriz cuadrada. Se pide:
i) Prueba que A no puede tener más de n valores propios distintos.
ii) Prueba que si A posee n valores propios distintos, entonces es diagonalizable.
iii) Prueba que el recı́proco de la afirmación anterior no es cierto.
( Hint: Aplicar interpolación al polinomio caracterı́stico (para la afirmación i). Para las otras
usar la forma cı́clica del endomorfismo.)
Problema 178. Lee el extracto de texto que aparece descrito al principio del Capı́tulo. La “es-
cena” descrita es un clásico, amplia y universalmente reconocible para cualquiera mı́nimamete
educado, sin necesidad de acudir a Wikipedia. Explica quién fue su autor, a qué obra pertenece,
qué papel juega la evocación y la decadencia en su contenido semántico y sintático. ¿Tiene la
obra de este autor, y en especial el tı́tulo de su obra, algo que ver con el contenido del Capı́tulo?.

4.5. Diagonalización de Matrices sobre un DIP


En la Sección 4.3 y en la Subsección 4.4.2 hemos visto que sobre dominios de ideales principales
y sobre dominios euclı́deos, en el caso de módulos finitamente generados, libre equivale a libre
de torsión. Vamos a ver esta idea en acción a través de la diagonalización de matrices sobre
ambos casos de anillos. La idea es originaria del matemático británico Henry J. Stephen Smith
en 1861 (cf. [Smith, 1861]).

4.5.1. Motivaciones.
4.5.1.1. Ecuaciones diofánticas. La forma normal de Smith nos permitirá analizar sis-
temas de ecuaciones lineales sobre un DIP y nos permitirá disponer de “algoritmos” en el caso
de que ese anillo sea un dominio euclı́deo. En esencia, sean dados
i) Una matriz A ∈ Mm×n (R) con m filas, n columnas y coordenadas en un dominio de
ideales principales R.
ii) Un elemento B ∈ Rm dado como columna.
iii) Una columna de variables X:
 
X1
 X2 
X :=  .  .
 
 .. 
Xn
el objetivo consiste en resolver el sistema de ecuaciones siguiente:
(4.5.1) AX = B.
Se trata de resolver y responder a las siguentes preguntas:
• ¿Es el sistema (4.5.1) compatible sobre Rn ?. Es decir, responde a la siguiente pregunta:
∃x := (x1 , . . . , xn ) ∈ Rn , Axt = B?,
donde xt significa traspuesta de x.
• Si el sistema (4.5.1) es compatible, hallar una solución particular x0 ∈ Rn de ese
sistema.
• Da una descripción completa del conjunto de todas las soluciones del sistema (4.5.1).
Para la tercera de las preguntas ya tenemos una resuesta parcial. Supongamos que x0 ∈ Rn
es una solución particular del sistema (4.5.1). Entonces, consideramos el conjunto K ⊆ Rn de
todas las soluciones del sistema homogéneo asociado al sistema (4.5.1) anterior. Es decir, el
sistema:
218 4. PRIMOS, MAXIMALES. MÓDULOS LIBRES. FORMA NORMAL DE SMITH

(4.5.2) AX = 0,
donde 0 es el vector columna formado solamente por ceros. Entonces se tiene:
Proposición 4.5.1. Con las anteriores notaciones, supongamos que existe x0 ∈ Rn una
solución particular de un sistema de ecuaciones del tipo (4.5.1) anterior y sea K ⊆ Rn el
conjunto de las solciones del sistema (4.5.2) homogéneo asociado. Entonces, el conjunto de
todas las soluciones del sistema (4.5.1) es dado por el conjunto:
x0 + K := {x0 + u : u ∈ K} ⊆ Rn .
Más aún, K es un submódulo libre de Rn de rango a lo sumo n. Una descripción completa de
las soluciones de un sistema (4.5.1) compatible vendrı́a dada por la siguiente información:
i) La solución particular x0 ∈ Rn ,
ii) Una base de K como R−módulo libre: β := {v1 , . . . , vn } ⊆ Rn .
El conjunto de todas las soluciones del sistema (4.5.1) en forma paramétrica vendrı́a dado por:
m
X
x0 + K := {x0 + ti vi : (t1 , . . . , tm ) ∈ Rm }.
i=1

Demostración. No hay mucho que demostrar en virtud de todo lo discutido en secciones


precedentes. Es obvio. 
4.5.2. Matrices de operaciones elementales en GL(2, R). Comencemos recordando
cómo son las matrices de GL(n, R) (ver Corolario 2.3.22).
Corolario 4.5.2. Si A ∈ Mn (R) es una matriz tal que det(A) ∈ R× es una unidad de R,
entonces, A es una matriz inversible y, además,
A−1 = det(A)−1 Adj(A) ∈ Mn (R).
El recı́proco es obviamente cierto.
Consideraremos varios tipos de matrices regulares en GL(2, R) en Esta subsección.
4.5.2.1. Tipo 1: Intercambio de Filas o columnas. Se describen en el enunciado
siguiente:
Lema 4.5.3 (Tipo 1: Intercambiar filas o columnas). Consideremos la matriz
 
0 1
P := ∈ M2 (R).
1 0
i) La matriz P ∈ GL(2, R) y la inversa es ella misma.
ii) Su determinante verifica det(P ) = −1.
iii) Para cada matriz A ∈ M2×n (R), con 2 filas y n columnas, P A es la matriz obtenida
intercambiando las filas 1 y 2 de la matriz A.
iv) Para cada matriz A ∈ Mm×2 (R), con m filas y 2 columnas, la matriz AP es la matriz
obtenida intercambiando las columnas 1 y 2 de la matriz A.
Demostración. Obvio. 

4.5.2.2. Tipo 2: Multiplicar a una fila (o columna) por una unidad del anillo.
Lema 4.5.4 (Multiplicar a una fila (o columna) por una unidad del anillo). Sea u ∈ R×
una unidad en el anillo R. Consideremos la matriz
 
u 0
U := ∈ GL(2, R),
0 1
cuya inversa es la matriz:
u−1 0
 
U :=−1
∈ M2 (R),
0 1
cuyo determinante verifica det(P ) = u ∈ R∗.
Se verifican las propiedades siguientes:
i) Para cada matriz A ∈ M2×n (R), con 2 filas y n columnas, la matriz U A es la matriz
obtenida multiplicando la fila 1 de A por u.
4.5. DIAGONALIZACIÓN DE MATRICES SOBRE UN DIP 219

ii) Para cada matriz A ∈ Mm×2 (R), con m filas y 2 columnas, la matriz AU es la matriz
obtenida multiplicando la columna 1 de la matriz A por u.
Demostración. Obvio. 

4.5.2.3. Tipo 3: Sumar a una fila (o columna) un múltiplio de otra fila (o


columna).
Lema 4.5.5 (Sumar a una fila o columna un múltiplo de otra fila o columna). Sea
a ∈ R un elemento cualquiera en el anillo R. Consideremos la matriz
 
1 0
P := ∈ GL(2, R),
a 1
cuya inversa es la matriz:
 
1 0
P −1
:= ∈ M2 (R),
−a 1
y cuyo determinante verifica det(P ) = 1.
Se verifican las propiedades siguientes:
i) Para cada matriz A ∈ M2×n (R), con 2 filas y n columnas, la matriz P A es la matriz
obtenida sumando a la fila 2 de A su fila 1 multiplicada por a.
ii) Para cada matriz A ∈ Mm×2 (R), con m filas y 2 columnas, la matriz AP es la matriz
obtenida sumando a la columna 1 de la matriz A la columna 2 multiplicada por a.
Demostración. Obvio. 

4.5.2.4. Tipo 4: Encontrar el máximo común divisor. Consideremos la siguiente


construcción. Supongamos que R es un dominio de ideales principales. Sean a, b ∈ R dos
elementos en un dominio de ideales principales y sea h su máximo común divisor. Distinguiremos
dos casos:
• Supongamos que a | b. En estecaso h = gcd(a, b) = a. Entonces, definimos la matriz
siguiente (que pertenece al Tipo 3):
   
α β 1 0
P := = ,
−τ σ −q 0
donde b = qa.
• En otro caso, sean α, β ∈ R dos elementos que verifican la identidad de Bézout para
a y b. Es decir,
αa + βb = h.
Sean σ, τ ∈ R los elementos dados mediante:
a b
σ := , τ := .
h h
Definamos la matriz  
α β
P := .
−τ σ
Lema 4.5.6 (Encontrar el máximo común divisor.). Con las anteriores notaciones, sea
P ∈ M2 (R) la matriz definida en cualquiera de los dos casos que denotaremos por:
 
α β
P := .
−τ σ
Se tiene:
i) La matriz P es una matriz inversible. En ambos casos la matriz inversa P −1 viene
dada por:
 
−1 σ −β
P := .
τ α
ii) En ambos casos det(P ) = 1.
220 4. PRIMOS, MAXIMALES. MÓDULOS LIBRES. FORMA NORMAL DE SMITH

iii) Supongamos dada una matriz A ∈ M2×n (A) de la forma siguiente:


 
a ··· c ···
A := .
b ··· d ···

Entonces, se tiene:
 
h ··· ∗···
PA = ,
0 ··· ∗···

Es decir, en la columna primera hemos reemplazado los elementos {a, b} por su máximo
común divisor y 0.
iv) Con las mismas notaciones, supongamos que la matriz A es dada mediante:
 
a b
 .. .. 
. .
 c d .
A :=  
 
.. ..
. .

Entonces, se tiene:
 
h 0
 .. .. 
 . .
 ∗ ∗ ,
AP =  
 
.. ..
. .
Es decir, en la fila primera hemos reemplazado los elementos {a, b} por su máximo
común divisor y 0.

Demostración. Hagamos la descripción mediante operaciones por fila. Es claro que se


tiene:
    
α β a ··· c ··· αa + βb ··· ∗ ···
= .
−τ σ b ··· d ··· (−τ )a + σb · · · ∗ · · ·
Es claro que h = αa + βb y que
b a
(−τ )a + σb = − a + b = 0.
h h


4.5.3. Generalizando a matrices m × n: Operaciones elementales sobre DIP’s.


Comenzamos con la descripción de la construcción de la Forma Normal de Smith de una matriz.
La siguiente es una definición de las matrices Elementales por filas sobre un dominio de ideales
principales.

Proposición 4.5.7. [Matrices Elementales sobre un dominio de integridad] Sean dados


m, n ∈ N dos enteros positivos y R un dominio de integridad. Sea P ∈ M2 (R) una matriz
inversible sobre R, dada mediante:
 
α β
P := ,
σ τ
con inversa
 
−1 τ −β
P := ε ,
−σ α

con ε = det(P )−1 ∈ R× .


4.5. DIAGONALIZACIÓN DE MATRICES SOBRE UN DIP 221

Para r = m ∨ n. Para 1 ≤ i, j ≤ r, consideremos las matrices Ei,j (P ) ∈ Mr (R) siguientes:

 
1 0
 .. 

 . 

0 1 
 

 α β 

Ei,j (P ) := 
 .. .

 . 

 σ τ 


 1 0
 .. 
 . 
0 1

Estas matrices, verifican las propiedades siguientes:

i) Las matrices Ei,j (P ) matrices inversibles en Mr (R) y sus inversas son Ei,j (P −1 ), es
decir Ei,j (P )Ei,j (P −1 ) = Idr .
ii) Para cada matriz A ∈ Mm×n (R), con m filas y n columnas, de la forma:

∗ ∗
 
 .. 

 . 

∗ ∗ 
 

 a c 

A := 
 .. ,

 . 

 b d 


 ∗ ∗
 .. 
 . 
∗ ∗

donde ∗ representa elementos de R. Entonces, tomando r = m, la matriz Ei,j (P )A


es la matriz con una forma como la siguiente:

∗ ∗
 
 .. 

 . 

∗ ∗ 
 

 αa + βb αc + βd 

Ei,j (P )A := 
 .. ,

 . 

 σa + τ b σc + τ d 


 ∗ ∗
 .. 
 . 
∗ ∗

es decir,
• la fila i−ésima de Ei,j (P )A es la suma de la fila i−ésima de A multiplicada por
α más la fija j−ésima de A multiplicada por β,
• la fila j−ésima de Ei,j (P )A es la suma de la fila i−ésima de A multiplicada por
σ más la fija j−ésima de A multiplicada por τ ,
dejando sin modificar el resto de filas.
iii) Para cada matriz A ∈ Mm×n (R), con m filas y n columnas, como en el ejemplo
anterior, tomando r = n, la matriz AEi,j (P ) es la matriz de la forma:
222 4. PRIMOS, MAXIMALES. MÓDULOS LIBRES. FORMA NORMAL DE SMITH

∗ ∗
 
 .. 

 . 

∗ ∗ 
 

 αa + σc βa + τ c 

AEi,j (P ) := 
 .. ,

 . 

 αb + σd βb + τ d 


 ∗ ∗
 .. 
 . 
∗ ∗
es decir,
• la columna i−ésima de AEi,j (P ) es la suma de la columna i−ésima de A multi-
plicada por α más la columna j−ésima de A multiplicada por σ,
• la columna j−ésima de AEi,j (P )A es la suma de la columna i−ésima de A mul-
tiplicada por β más la columna j−ésima de A multiplicada por τ ,
dejando sin modificar el resto de columnas.
A las matrices Ei,j (P ) anteriores se las denomina matrices elementales sobre un dominio de
ideales principales R.
Demostración. Ejercicio de mera comprobación. 
4.5.4. Matrices elementales particulares. Sea R un dominio de ideales principales.
Consideraremos las siguientes clases de matrices elementales:
Corolario 4.5.8 (Intercambiar dos filas o dos columnas). Consideremos la matriz
 
0 1
P := ∈ M2 (R).
1 0
Sea r = m ∨ n, entonces, las matrices
Ei,j := Ei,j (P ),
verifican las propiedades siguientes:
i) Son matrices inversibles en Mr (R) y sus inversas son ellas mismas, es decir Ei,j
2
=
Idr .
ii) Para cada matriz A ∈ Mm×n (R), con m filas y n columnas, tomando r = m, la matriz
Ei,j A es la matriz obtenida intercambiando las filas i y j de la matriz A.
iii) Para cada matriz A ∈ Mm×n (R), con m filas y n columnas, tomando r = n, la matriz
AEi,j es la matriz obtenida intercambiando las columnas i y j de la matriz A.
Demostración. Basta con aplicar la Proposición 4.5.7. 
Corolario 4.5.9 (Multiplicar una fila o columna por una unidad). Sea u ∈ R× una
unidad en el anillo R. Consideremos la matriz
 
u 0
P := ∈ M2 (R),
0 1
cuya inversa es la matriz:
u−1
 
0
P −1
:= ∈ M2 (R),
0 1
Sea r = m ∨ n, entonces, las matrices
Ti (u) := Ei,j (P ),
verifican las propiedades siguientes:
i) Son matrices inversibles en Mr (R) y sus inversas son dadas por la inversa de P , es
decir Ti (u)Ti (u−1 ) = Idr .
ii) Para cada matriz A ∈ Mm×n (R), con m filas y n columnas, tomando r = m, la matriz
Ti (u)A es la matriz obtenida multiplicando la fila i de A por u.
4.5. DIAGONALIZACIÓN DE MATRICES SOBRE UN DIP 223

iii) Para cada matriz A ∈ Mm×n (R), con m filas y n columnas, tomando r = n, la matriz
ATi (u) es la matriz obtenida multiplicando la columna i de la matriz A por u.

Demostración. De nuevo, basta con aplicar la Proposición 4.5.7. 

Corolario 4.5.10 (Sumar a una fila o columna un múltiplo de otra fila o columna).
Sea a ∈ R un elemento cualquiera en el anillo R. Consideremos la matriz
 
1 0
P := ∈ M2 (R),
a 1
cuya inversa es la matriz:
 
1 0
P −1
:= ∈ M2 (R),
−a 1
Sea r = m ∨ n, entonces, las matrices

Si,j (a) := Ei,j (P ),

verifican las propiedades siguientes:


i) Son matrices inversibles en Mr (R) y sus inversas son dadas por la inversa de P , es
decir Si,j (a)Si,j (−a) = Idr .
ii) Para cada matriz A ∈ Mm×n (R), con m filas y n columnas, tomando r = m, la matriz
Si,j (a)A es la matriz obtenida sumando a la fila i de A su fila j multiplicada por a.
iii) Para cada matriz A ∈ Mm×n (R), con m filas y n columnas, tomando r = n, la matriz
ASi,j (a)) es la matriz obtenida sumando a la columna i de la matriz A la columna j
multiplicada por a.

Demostración. De nuevo, basta con aplicar la Proposición 4.5.7. 

Corolario 4.5.11 (Reemplazar dos elementos de una columna (o fila) por su máximo
común divisor). Sean a, b ∈ R dos elementos en un dominio de ideales principales y sea h su
máximo común divisor. Distingamos dos casos:
• Si a | b, definamos:
   
α β 1 0
P := = ,
−τ σ −q 1
donde b = qa.
• En otro caso, sean α, β ∈ R dos elementos que verifican la identidad de Bézout para
a y b. Es decir,
αa + βb = h.
Sean σ, τ ∈ R los elementos dados mediante:
a b
σ := , τ := .
h h
Y definamos la matriz P ∈ M2 (R) mediante:
 
α β
P := .
−τ σ
Se tiene:
i) La matriz P es una matriz inversible, con matriz inversa:
 
σ −β
P −1 := .
τ α

Por tanto, la matriz Ei,j (P ) asociada a esta operación elemental (en el sentido de la
Proposición 4.5.7 anterior) es inversible.
224 4. PRIMOS, MAXIMALES. MÓDULOS LIBRES. FORMA NORMAL DE SMITH

ii) Supongamos dada una matriz A ∈ Mm×n (A) de la forma siguiente:


∗ ∗
 
 .. 

 . 

∗ ∗ 
 

 a c 

A := 
 . .. .

 

 b d 


 ∗ ∗
 .. 
 . 
∗ ∗
Entonces, se tiene:
∗ ∗
 
 .. 

 . 

∗ ∗ 
 

 h ∗ 

Ei,j (P )A = 
 .. ,

 . 

 0 ∗ 


 ∗ ∗
 .. 
 . 
∗ ∗
Es decir, en la columna i−ésima hemos reemplazado los elementos {a, b} por su
máximo común divisor (en el lugar (i, i)) y 0 (en el lugar (j, i)).
iii) Con las mismas notaciones, supongamos que la matriz A es dada mediante:
∗ ∗
 
 .. 

 . 

∗ ∗ 
 

 a b 

A := 
 . .. .

 

 c d 


 ∗ ∗
 .. 
 . 
∗ ∗
Entonces, se tiene:
∗ ∗
 
 .. 

 . 

∗ ∗ 
 

 h 0 

AEi,j (P ) = 
 .. ,

 . 

 ∗ ∗ 


 ∗ ∗
 .. 
 . 
∗ ∗
Es decir, en la fila i−ésima hemos reemplazado los elementos {a, b} por su máximo
común divisor (en el lugar (i, i)) y 0 (en el lugar (i, j)).
Demostración. Para la propiedad i) basta con observar que:
a b αa + βb
det(P ) = ασ − (−τ )β = α +β = = 1.
h h h
4.5. DIAGONALIZACIÓN DE MATRICES SOBRE UN DIP 225

El resto se sigue de la Proposición 4.5.7. 


4.5.5. Orlar una matriz. Sea dada una matriz A ∈ Mm×n (R), donde R es un dominio
de ideales principales.
Orlar1 la matriz A: La matriz orlada de una matriz A consiste en añadir a la matriz A las
matrices identidades correspondientes del modo siguiente:
 
Idm A
Orl(A) := .
0 Idn
A lo largo de proceso iremos haciendo cambios sobre Orl(A) cion las reglas siguientes: Supong-
amos que tenemos una matriz orlada de la forma:
 
S B
Orl := .
0 T
• Regla por filas: Cada vez que realicemos un cálculo sobre B por filas, se hará a lo
largo de toda la fila de Orl (es decir, afectará a la fila de B y a la fila correspondiente
de S).
• Regla por columnas: Cada vez que realicemos un cálculo sobre B por columnas,
se hará a lo largo de toda la columna de Orl (es decir, afectará a B y a la columna
correspondiente de T ).
Proposición 4.5.12. Supongamos Dada una matriz orlada
 
S A
M := ,
0 T
donde S ∈ GL(m, R) y T ∈ GL(n, R) y A ∈ Mm×n (R). Supongamos que, tras un número
finito de pasos de los anteriores sobre M (tanto por filas como por columnas) obtenemos una
nueva matriz orlada  0 
S B
N := .
0 T0
Entonces, S 0 ∈ GL(m, R), T 0 ∈ GL(n, R) y se verifica:
S −1 AT −1 = (S 0 )−1 B(T 0 )−1 .
Más aún, si  
Idm A
M = Orl(A) = ,
0 Idn
entonces
S 0 AT 0 = B.
Demostración. En primer lugar observamos que si S ∈ GL(m, R) y T ∈ GL(n, R), tras
relizar un número finito de operaciones por filas y columnas de las indicadas, las matrices S 0
y T 0 se optienen multiplicando cada una de ellas por un número finito de matrices del tipo
Ei,j (P ) inversibles con respecto al anillos R (a S la multilicamos por la izquierda y a T la
multiplicamos por la derecha). En otras palabras, hemos seleccionado una serie de matrices
regulares P1 , . . . , Ps ∈ GL(m, R) y Q1 , . . . , Qr ∈ GL(n, R) tales que
!  
Ys Yr
S0 = Pi S, T 0 := T  Qj  ,
i=1 j=1

mientras que, por las reglas descritas, A es afectado por ambos tipos de operacioes:
s
!  r 
Y Y
B := Pi A  Qj  .
i=1 j=1

1De acuerdo con el Diccionario de la R.A.E. orlar significa “ Adornar un vestido u otra cosa con guarniciones
al canto. Poner la orla en el escudo.” Recuérdese que “orla” significa: “ Orilla de paños, telas, vestidos u otras
cosas, con algún adorno que la distingue. Adorno que se dibuja, pinta, graba o imprime en las orillas de una
hoja de papel, vitela o pergamino, en torno de lo escrito o impreso, o rodeando un retrato, viñeta, cifra, etc.”..
226 4. PRIMOS, MAXIMALES. MÓDULOS LIBRES. FORMA NORMAL DE SMITH

Obviamente, como GL(m, R) y GL(n, R) son grupos y las matrices Pi y Qj son inversibles,
S 0 ∈ GL(m, R) y T 0 ∈ GL(n, R). Además, obviamente, se tendrá:
 !−1   s !  r   −1 
s
Y Y Y r
 Y 
(S 0 )−1 B(T 0 )−1 = S −1 Pi Pi A  Qj   Qj T −1  .
 
i=1 i=1 j=1 j=1

Lo que se traduce en cancelaciones:


(S 0 )−1 B(T 0 )−1 = S −1 AT −1 ,
como se afirma en el enunciado. Si, además, S = Idm y T = Idn , entonces, esa identidad se
convierte en
B = S 0 AT 0 .


4.5.6. “Algoritmo”: Hacer ceros por filas o columnas.


4.5.6.1. El Caso de Dominios de Ideales Principales. Supongamos dada una matriz
A ∈ Mm×n (R) donde R es un dominio de ideales principales. Supongamos que la matriz A
tiene la forma:  
a1 ∗ · · · ∗
 a2 ∗ · · · ∗
A :=  . . ,
 
 .. ..
. .. 
am ∗ ··· ∗

Proposición 4.5.13. Con las anteriores notationes, existe un número finito de operaciones
elementales por filas (i.e. multiplicar por matrices del tipo Ei,j (P )) que permiten transformar
Orl(A) en una matriz
 
S B
Orl := ,
0 T
tal que SAT = B, S y T son producto de matrices elementales Ei,j (P ) y B tiene la forma:
 
h ∗ ··· ∗
 0 ∗ · · · ∗
B :=  . . ,
 
 .. ..
. .. 
0 ∗ ··· ∗
donde h = gcd(a1 , . . . , am ).
Un resultado idéntico se obtiene reemplazando filas por columnas en la descripción anterior.
Demostración. Usaremos la Proposición 4.5.7 y el Corolario 4.5.11. No pondremos las
operaciones en la matriz orlada para evitar repeticiones. A partir de esa Proposición es claro
que podemos multiplicar por una matriz de tipo E1,2 (P ) para obtener una nueva matriz con la
forma siguiente:
 
h1 ∗ · · · ∗
 0 ∗ · · · ∗
 
E1,2 (P )A :=  a3 ∗ · · · ∗ ,
 
 .. . .
. . .. 
 . 
am ∗ ··· ∗
donde h1 = gcd(a1 , a2 ). Repitiendo el proceso (un humilde for i = 2 to m do) con a3 hasta
am , obtendremos el resultado apetecido. 

4.5.6.2. El Caso de Dominios Euclı́deos. En el caso de dominios de ideales principales


anterior, hemos supuesto que nos “dan” a cada paso tanto el mácimo común divisor como los
ceoficientes de una identidad de Bézout. Pero eso no suele ser lo habitual, incluso podrı́a no ser
algoritmizable. Por eso nos ocupamos de un caso más cercano a la algorı́tmica: el caso euclı́deo.
4.5. DIAGONALIZACIÓN DE MATRICES SOBRE UN DIP 227

Supongamos ahora (R, φ) un dominio euclı́deo y una matriz A ∈ Mm×n (R). Supongamos que
la matriz A tiene la forma:  
a1 ∗ · · · ∗
 a2 ∗ · · · ∗
A :=  . . ,
 
 .. ..
. .. 
am ∗ · · · ∗
Proposición 4.5.14. Supongamos que a1 6= 0 por simplicidad. Con las anteriores notationes,
existe un número finito de operaciones elementales por filas (i.e. multiplicar por matrices del
tipo Ei,j (P )), con los tipos 1 a 3, que permiten transformar Orl(A) en una matriz
 
S B
Orl := ,
0 T
tal que SAT = B, S y T son producto de matrices elementales Ei,j (P ) y B tiene la forma:
 
h ∗ ··· ∗
 0 ∗ · · · ∗
B :=  . . ,
 
 .. ..
. .. 
0 ∗ ··· ∗
donde h = gcd(a1 , . . . , am ).
Un resultado idéntico se obtiene reemplazando filas por columnas en la descripción anterior.
Demostración. Usaremos fundamentalmente el Algoritmo de Euclides para el cálculo del
máximo común divisor (cf. Teorema 3.4.5). El proceso se descompone del modo siguiente. En
primer lugar, aplicamos el siguiente algoritmo (escribimos solamente el efecto sobre la matriz
A,aunque debe entenderse que las operaciones realizadas se extienden a la matriz orlada):
Supongamos como hipótesis que
φ(a1,1 ) = min{φ(ai,1 ) : 1 ≤ i ≤ m} > φ(0).

Algoritmo 4.5.15 (Reemplazar por Restos).

Input: A ∈ Mm×n (R).


φ(a1,1 ) = min{φ(ai,1 : 1 ≤ i ≤ m}
for i = 2 to m do

* Hallar cociente qi := quo(ai,1 , a1,1 ) y resto ri := rem(ai,1 , a1,1 )


de la división Euclı́dea de ai,1 por a1,1 .
% con φ(ri ) < φ(a1,1 ), incluyendo el caso ri = 0
* Restar a la fila i la fila 1 multiplicada por qi
od
Output: La matriz orlada resultado de estas operaciones.

Es obvio que este procedimiento nos devuelve una matriz orlada


 0 
S B
N := ,
0 T0
donde B tiene la forma siguiente:
 
a1 ∗ ··· ∗
 r2 ∗ ··· ∗
B :=  . ..  .
 
 .. ..
. .
rm ∗ ··· ∗
Ahora se pueden dar dos situaciones:
• O bien ri = 0, i = 2, . . . , m, en cuyo caso hemos terminado.
• O bien existe ri 6= 0 con φ(ri ) < φ(a1 ).
228 4. PRIMOS, MAXIMALES. MÓDULOS LIBRES. FORMA NORMAL DE SMITH

Esto nos lleva al algoritmo siguiente (de nuevo describo el algoritmo solamente sobre la matriz
de interés, asumiendo que el lector es consciente de la presencia de las matrices de cambio de
base)):

Algoritmo 4.5.16 (Hacer Ceros en primera Columna (DE)).

Input: A ∈Mm×n (R). 


h ∗ ··· ∗
0 ∗ · · · ∗
while A 6=  . ..  , do
 
 .. ..
. .
0 ∗ ··· ∗
* Hallar j tal que
φ(aj,1 ) = min{φ(ai,1 ) : 1 ≤ i ≤ m}.
* Intercambiar fila 1 y fila j.
*Reemplazar por restos en la primera columna.
return
Output: La matriz orlada resultado de estas operaciones.

Obviamente, el procedimiento irá reemplazando el elemento que aparece en el lugar (1, 1) por un
elemento con menor valor de φ. Como en la Demostración del Algoritmo de Euclides (Teorema
3.4.5), al cabo de un número finito de pasos encontraremos una matriz de la forma deseada. 

4.5.7. Hacer ceros en filas y columnas.


4.5.7.1. El caso de Dominios de Ideales Principales. Supongamos, de nuevo que R
es un dominio de ideales principales y supongamos dada una matriz A ∈ Mm×n (R) de la forma:
 
a1,1 a1,2 · · · a1,n
 a2,1 ∗ ··· ∗ 
A :=  . ..  .
 
 .. . .. . 
am,1 ∗ ··· ∗

Proposición 4.5.17. Supongamos que, con estas notaciones, realizamos de manera alternativa
las operaciones hacer ceros por columna o hacer filas en la primera fila y primera columna.
Entonces, tras una número finito de aplcaciones de matrices Ei,j (P ) (por filas y por columnas)
obtendremos una nueva matriz de la forma:
 
h1,1 0 · · · 0
 0 ∗ · · · ∗
A0 :=  . ..  .
 
. . .
 . . .
0 ∗ ··· ∗

Demostración. Usaremos el algoritmo hacer ceros por filas y hacer ceros por columnas y
la condición de Dominio de Ideales Principales y el subalgoritmo (por filas o columnas) descrito
en la Proposición 4.5.13. Tras aplicar este procedimiento, llegamos a una matriz de la forma:
 
h b1,2 ··· b1,n
0 ∗ ··· ∗ 
B :=  . ..  .
 
 .. ..
. . 
0 ∗ ··· ∗
Ahora tocarı́a hacer ceros por columnas. Pero debemos observar que aplicamos las matrices
Ei,j (P ) por la derecha, donde P es del tipo 4. Esto significa que, trabajando una sola vez con
la primera y segunda columnas, la nueva matriz tendrá la forma:
4.5. DIAGONALIZACIÓN DE MATRICES SOBRE UN DIP 229

h0
 
0 c1,3 · · · c1,n
 c2,1 ∗ ∗ ··· ∗
B 0 :=  . ..  ,
 
 .. ..
. .
cm,1 ∗ ∗ ··· ∗
donde la primera columna de B 0 se obtiene como combinación de las dos primeras columnas de
B. Es decir,  0     
h h b1,2
 c2,1  0  b2,2 
 ..  = α  ..  + β  ..  ,
     
 .  .  . 
cm,1 0 bm,2
donde
h0 := gcd(h, b1,2 ), αh + βb1,2 = h0 .
En particular: ¡Hemos perdido la condición de que todas las coordenadas de la primera columna
sean nulas a partir de la segunda!.
Esto es lo que obliga a definir un algoritmo como el siguiente (de nuevo se describe usando
solamente la matriz sobre la que se trabaja prioritariamente, dejando las matrices de la orla a
la discrecionalidad del lector):

Algoritmo 4.5.18 (Hacer Ceros en primera fila y primera columna).

Input: A ∈Mm×n (R). 


h 0 ··· 0
0 ∗ · · · ∗
while A 6=  . ..  , do
 
 .. ..
. .
0 ∗ ··· ∗
* Hacer ceros en fila 1 de A. Guardar en A el resultado.
* Hacer ceros en columna 1 de A. Guardar en A el resultado.
return
Output: La matriz orlada conteniendo estas operaciones.

Llamemos hi al resultado escrito en el lugar (1, 1) de la matriz obtenida tras i pasos por el ciclo
while. Observamos que, en cada caso, hi | hi−1 puesto que hi el máximo común divisor de
hi−1 con elementos de la primera fila o la primera columna. Por tanto, tenemos una cadena de
ideales en R. Definamos ai = (hi ) ⊆ R el ideal generado por hi . Entonces, tenemos una cadena
ascendente de ideales de R:
a0 ⊆ a1 ⊆ · · · ⊆ an ⊆ · · · ⊆ R,
donde h0 = a1,1 . Ahora interviene la condición noetheriana de los dominios de ideales princi-
pales (cf. Teorema 3.3.2). Es decir, existe r ∈ N tal que at = ar , ∀t ≥ r. Es decir, la cadena se
estabiliza a partir del lugar r.
Supongamos, sin pérdida de la generalidad, que hr se obtuvo dentro del ciclo while después de
hacer ceros en la primera columna y tenemos una matriz de la forma:
 
hr k1,2 · · · k1,n
0 ∗ ··· ∗ 
Ar :=  . ..  .
 
. . .
. . . 
0 ∗ ··· ∗
La siguiente operación serı́a hacer ceros en la primera fila y poner, en lugar de hr a hr+1 que es
hr+1 = gcd(hr , k1,2 , . . . , k1,n ).
Pero, como ar = ar+1 , hr y hr+1 son elementos asociados de R, luego también podemos escribir
hr = gcd(hr , k1,2 , . . . , k1,n ).
230 4. PRIMOS, MAXIMALES. MÓDULOS LIBRES. FORMA NORMAL DE SMITH

Esto quiere decir que hr | k1,i para todo i, 2 ≤ i ≤ n. Por tanto, al realizar el proceso de hacer
ceros en la primera fila de la nueva matriz podemos, simplemente, restar a cada columna, la
k
primera columna multiplicada por h1,i r
∈ R y obtendremos una matriz de la forma deseada. 

4.5.7.2. El caso de dominios euclı́deos. El procedimiento es exactamente el mismo y


la misma dificultad descrita en la Demostración del caso de Dominios de Ideales Principales
aparece en el caso euclı́deo. Por tanto, las mismas razones de establidad de la condición noethe-
riana nos garantizan que el proceso se establiza.

4.5.8. Diagonalización de una matriz sobre un DIP: “algoritmo” primario. Usa-


remos los subalgoritmos descrito en Subsecciones precedentes.

Algoritmo 4.5.19 (Diagonalización simple de una matriz en Mn (R)).

Input: Una matriz A ∈ Mm×n (R), con m ≥ n de la forma:


 
a1,1 a1,2 ··· a1,n
 a2,1 a2,2 ··· a2,n 
A :=  . ..  .
 
 .. ..
. . 
am,1 am,2 ··· am,n
Inicializar:
P := Idm , Q := Idn , B := A.
k := 1 
P B
C := .
0 Q
bi,j := el elemento de R que ocupa el lugar (i, j) de la submatriz B de C.
Hacer ceros en la fila y columna k−ésimas. La matriz resultante se “guarda” en la
matriz C, eliminando la matriz precedente.
while k < min{m, n} do
while ∃i, j, k < i ∨ k < j, bi,j 6= 0 do
* Intercambiar filas y columnas hasta tener en el lugar k+1, k+1
un elemento no nulo.
* Hacer ceros en la fila y columna k + 1.
* Guardar en la matriz C los resultados de la acción precedente:
 
P B
C :=
0 Q
od
k := k + 1
od
Ouput: La matriz C que contiene como submatrices a las matrices P ∈ GL(m, R), Q ∈
GL(n, R) y B tales que P AQ = B y, además, B es diagonal y tiene la forma:
 
a1 0 ··· 0
 0 a2 ··· 0 
.. .. 0 
 
B := 
 ..  ∈ Mm×n (R),
 . . . 
 0 0 ··· ar 
0 0

Proposición 4.5.20. En anterior procedimiento, permite transformar cualquier matriz A con


coordenaas en un dominio de ideales principales en una matriz diagonal B y permite hallar las
4.5. DIAGONALIZACIÓN DE MATRICES SOBRE UN DIP 231

matrices regulares P y Q (como producto finito de las operaciones elementales realizadas) tales
que
 
a1 0 · · · 0
 0 a2 · · · 0 
0 
P AQ = B =  ... ..
 
 ..  ∈ Mm×n (R).
 . . 
 0 0 ··· ar 
0 0

Demostración. En realidad, todo es consecuencia del hecho de poder llegar a una matriz
de la forma:  
h 0 ··· 0
 0 ∗ · · · ∗
B :=  . ..  .
 
 .. .
0 ∗ ··· ∗
Esto se obtiene por el procedimiento de hacer ceros en primera fila y primera columna descrito
en la Proposición 4.5.17 que, a su vez se sigue de la condición notheriana. Seguidamente se
trata de hacer ceros en la primera fila y columna de la submatriz
 
∗ ··· ∗
B 0 :=  ... ..  .

.
∗ ··· ∗


4.5.9. Resolución de ecuaciones lineales diofánticas. Se denominan ecuaciones diofánticas


lineales a ecuaciones lineales del tipo siguiente:
(4.5.3) AX = B,
donde
i) A ∈ Mm×n (Z) es una matriz con m filas y n columnas con coordenadas en Z. Podemos
suponer:
 
a1,1 · · · a1,n
A :=  ... .. ..  .

. . 
am,1 ··· am,n
ii) X es un vector columna de variables:
 
X1
X :=  ... 
 

Xn
iii) B es un vector columna con coordenadas en Z:
 
b1
B :=  ...  ∈ Zm .
 

bm
El objetivo del estudio de las ecuaciones lineales diofánticas es estudiar la existencia de solu-
ciones en Zn de ecuaciones del tipo descrito en la identidad (4.5.3) anterior. Es decir, estudiar:
      
x1 a1,1 · · · a1,n x1 b1
 ..  n  .. . . .
.   ..   .. 
∃ .  ∈ Z ,  . . .  .  =  . .
xn am,1 ··· am,n xn bm
El siguiente resultado no sólo caracteriza la existencia, sino que también caracteriza las solu-
ciones en caso de que existan.
232 4. PRIMOS, MAXIMALES. MÓDULOS LIBRES. FORMA NORMAL DE SMITH

Corolario 4.5.21. Sea dada una ecuación diofántica lineal


AX = B,
con A ∈ Mm×n (Z), B ∈ Z columna y X una columna de variables, como en las notaciones
m

anteriores. Sean P ∈ GL(m, Z) y Q ∈ GL(n, Z) dos matrices inversibles sobre Z y sea D ∈


Mm×n (Z) la matriz diagonal obtenida tras aplicar el algoritmo precedente, es decir,
 
d1 0 · · · 0
 0 d2 · · · 0 
 .. .. 0
 
D :=  . ..  ∈ Mm×n (Z),

 . . 
 0 0 · · · dr 
0 0
de tal modo que
P AQ = D.
Sea
b01
 

B 0 := P B =  ...  ∈ Zm .
 

b0m
Entonces,
i) El sistema de ecuaciones es compatible sobre Zn (es decir posee soluciones en Zn ) si
y solamente si se verifican las siguientes propiedades:
(a) b0i = 0, para todo i, con r + 1 ≤ i ≤ m.
(b) dj | b0j , para todo j, con 1 ≤ j ≤ r.
ii) Si el sistema es compatible sobre Zn , entonces, una solución del sistema viene dada
por la siguiente identidad:
 b0 
1

 d.1 
.
.
 
x1  b0r 
 .. 
X0 :=  .  = Q  dr  ∈ Zn ,
 
0
xn  
.
 .. 
0
n
iii) Si el sistema es compatible sobre Z , el conjunto de todas las soluciones del sistema
AX = B viene dado por el conjunto siguiente:
X0 + N := {X0 + z : z ∈ N },
donde N es el submódulo libre de Zn generado por las n − r últimas columnas de Q.
Demostración. Nótese que Q : Zn −→ Zn define un isomorfismo dado que Q es una
matriz inversible sobre Z. Esto significa que podemos considerar un “cambio de variables” del
modo siguiente:    
Y1 X1
Y =  ...  = Q−1 X = Q−1 X :=  ... 
   

Yn Xn
Y podemos considerar un nuevo sistema de ecuaciones lineales diofánticas lineales dado medi-
ante:
(AQ)Y = B.
Nótese que se tiene la obvia propiedad siguiente:
     
y1 x1 y1
 ..  n  ..   ..  n
 .  ∈ Z satisface (AQ)Y = B ⇔  .  = Q  .  ∈ Z satisface AX = B.
yn xn yn
Las condiciones de compatibilidad y los tipos de soluciones se preservan con la identificación
propuesta.
4.5. DIAGONALIZACIÓN DE MATRICES SOBRE UN DIP 233

Ahora consideremos la ecuación (AQ)Y = B y recordemos que P ∈ GL(m, Z) es una matriz


inversible. Por tanto, podemos considerar una nueva ecuación lineal diofántica:

(P AQ)Y = B 0 ,

donde B 0 := P B es la matriz columna descrita en el enunciado. Es obvio que se tiene la


equivalenecia:
   
y1 y1
 ..  n  ..  n
 .  ∈ Z satisface (AQ)Y = B ⇔  .  ∈ Z satisface (P AQ)Y = B 0 .
yn yn

Ahora, como P AQ = D es una matriz diagonal, observamos que la ecuación (P AQ)Y = B 0


tiene la forma siguiente:
b01

 d1 Y1 =
b02



 d2 Y2 =
..



.



dr Yr = b0r
0
 0 = br+1




 ..
.




0 = b0m

Ahora es evidente que este sistema de ecuaciones posee soluciones en Zn si y solamente si se


satisface: dj | b0j , 1 ≤ j ≤ r y b0i = 0, r + 1 ≤ i ≤ m, con lo que tenemos la primera de las
propiedades indicadas.
De otro lado, una “solución particular” a esta última ecuación serı́a la dada mediante
 b0 
1

 d.1 
.
.
 b0r 
 dr  ∈ Zn .
 
0
 
.
 .. 
0

Pero como sabemos que las soluciones de esta ecuación están relacionadas con las soluciones de
la ecuación AX = B a través de Q tendremos que una solución particular del sistema AX = B
es la dada mediante:
 b0 
1

 d.1 
.
.
 
x1  b0r 
 ..  n
 .  = Q  dr  ∈ Z ,
 
0
xn  
.
 .. 
0

y tenemos probada la afirmación ii) del enunciado. Para estudiar el conjunto de todas las
soluciones, baste con observar que se tiene la siguiente propiedad:
Dados x, z ∈ Zn soluciones del sistema AX = B, entonces x − z ∈ Zn es solución del sistema
AX = 0, donde 0 es el vector columna en Zm con coordenadas todas nulas. Por tanto, se
trata de estudiar cómo son todas las soluciones del sistema “homogéneo” AX = 0. De nuevos,
usando Q y P podemos observar que las soluciones de AX = 0 son dadas mediante QN , donde
N ⊆ Zn es el conjunto de las las soluciones del sistema homogéneo (AQ)Y = 0. Por ser P
inversible las soluciones de (AQ)Y = 0 con las solciones de (P AQ)Y = 0 y, de nuevo, son las
234 4. PRIMOS, MAXIMALES. MÓDULOS LIBRES. FORMA NORMAL DE SMITH

soluciones del sistema DY = 0 dado mediante:




 d1 Y1 = 0


 d 2 Y2 = 0
..



.



dr Yr = 0
0 = 0





 ..
.




0 = 0

O, equivalentemente, 

 d1 Y1 = 0
 d2 Y2

= 0
..


 .
dr Yr = 0

Luego las soluciones del sistema (P AQ)Y = 0 son los elementos de N := {0}r × Zn−r ⊆ Zn .
Concluiremos ası́ que las soluciones del sistema “homogéneo” original son los elementos del
siguiente conjunto:
Q {0}r × Zn−r .


Pero este submódulo es un submódulo libre de Zn y es, simplemente, el submódulo generado


por las imágenes a través de Q de los generadores de ({0}r × Zn−r ) que era un submóudlo
libre. Es decir, si ei Zn es el elemento de Zn (dado en columna) cuyas coordenadas son nulas
exceptuando la coordenada i−ésima que es 1 (i.e. la base “canónica” de Zn ). Entonces, un
sistema generador (y base como Z−módulo libre) de Q ({0}r × Zn−r ) es dada por:
Qer+1 , . . . , Qen .
Es obvio que estos n−r elementos son, precisamente, las n−r últimas columnas de Q y tenemos
probada la afirmación iii). 

4.6. Forma Normal de Smith


Ahora se trata de explorar una cierta unicidad en la forma final de la matriz diagonal. Es decir,
tratamos de determinar unicidad sobre los elementos que aparecen en la diagonal principal. En
este caso, las aplicaciones serán fundamentalmente las que corresponden a la clasificación de
grupos abelianos finitamente generados y de torsión y a la Teorı́a del Endomorfismo.
Usaremos los subalgoritmos descrito en Subsecciones precedentes.

Algoritmo 4.6.1 (Cálculo de la Forma Normal de Smith de una matriz en Mm×n (R)).

Input: Una matriz A ∈ Mm×n (R), con m ≥ n de la forma:


 
a1,1 a1,2 ··· a1,n
 a2,1 a2,2 ··· a2,n 
A :=  . ..  .
 
 .. ..
. . 
am,1 am,2 ··· am,n
Inicializar
P := Idm , Q := Idn , B := A.
k := 1 
P B
C := .
0 Q
bi,j := el elemento de R que ocupa el lugar (i, j) de la submatriz B de C.

Aplicar el Algoritmo de Diagonalización simple anterior para obtener:


 
P D
C := ,
0 Q
4.6. FORMA NORMAL DE SMITH 235

donde D es una matriz diagonal:


 
a1 0 ··· 0
 0 a2 ··· 0 
.. .. 0 
 
D := 
 ..  ∈ Mm×n (R).
 . . . 
 0 0 ··· ar 
0 0
Sumar a la primera fila las demás filas para obtener:
 
P B
C := ,
0 Q
donde B es una matriz de la forma:
 
a1 a2 ··· ar
 0 a2 ··· 0 
0 
B :=  ... ..
 
 ..  ∈ Mm×n (R).
 . . 
 0 0 ··· ar 
0 0
Hacer ceros en la primera fila hasta obtener:
 
P B
C := ,
0 Q
donde B es una matriz de la forma:
 
b1,1 0 ··· 0
 b2,1 b2,2 ··· b2,r 
0 
B :=  ... ..
 
 ..  ∈ Mm×n (R),
 . . 
 br,1 br,2 ··· br,r 
0 0
donde b1,1 = gcd(a1 , . . . , ar ). % Obsérvese que b1,1 | bi,j para todo i, j
Hacer ceros en la primera columna hasta obtener:
 
P B
C := ,
0 Q
donde B es una matriz diagonal:
 
d1 0 ··· 0
 0 b2,2 ··· b2,r 
0 
B :=  ... ..
 
 ..  ∈ Mm×n (R),
 . . 
 0 br,2 ··· br,r 
0 0
donde d1 := b1,1
% Obsérvese que b1,1 sigue siendo un divisor de todos los términos de la submatriz
B 0 := (bi,j )2≤i,j≤r .
Proceder igualmente con la submatriz B 0 dada mediante:
 
b2,2 ··· b2,r
 .. .. .. 0 

B 0 :=  .
 . .  ∈ Mm×n (R).
 br,2 ··· br,r 
0 0
Ouput: La matriz C que contiene como submatrices a las matrices P ∈ GL(m, R), Q ∈
GL(n, R) y B tales que P AQ = B y, además, B es diagonal y tiene la forma:
236 4. PRIMOS, MAXIMALES. MÓDULOS LIBRES. FORMA NORMAL DE SMITH

 
d1 0 ··· 0
 0 d2 ··· 0 
.. .. 0 
 
B := 
 ..  ∈ Mm×n (R),
 . . . 
 0 0 ··· dr 
0 0
de tal modo que di | di+1 , 1 ≤ i ≤ r − 1.

Teorema 4.6.2 (Forma Normal de Smith). El anterior procedimiento es, de hecho, un


rocedimiento que termina en la forma indicada en un número finito de pasos para cualquier
matriz A cuyas coordenadas están en un dominio de ideales principales. La matriz diagonal
resultante se llama la Forma Normal de Smith de A y es única salvo unidades en el anillo R.
Más aún, los elementos d1 , . . . , dr de la diagonal se llaman los factores invariantes de A. Se
verifica, además, que di es dado por la regla siguiente:
Sea gi (A) el máximo común divisor de los menores i×i de la matriz A. Supongamos g0 (A) = 1.
Entonces,
gi (A)
di = ,
gi−1 (A)
o, equivalentemente,
gi−1 (A)di = gi (A).
Demostración. Lo primero que hay que probar es que el proceso anterior alcanza el
objetivo indicado en un número finito de pasos. Para ello comenzamos con la diagonalización
simple de la Subsección precedente. Haciendo las operaciones indicadas llegamos a una matriz
de la forma:  
P B
C := ,
0 Q
donde B es una matriz de la forma:
 
a1 a2 · · · ar
 0 a2 · · · 0 
 .. . 0 
 
(4.6.1) B :=  . . . . ..  ∈ Mm×n (R).
 
 0 0 · · · ar 
0 0
Ahora, hacemos ceros en la primera file. Pero, como se indicó en su momento (Proposición
4.5.13 anterior), se obtendrá una matriz de la forma:
 0
P B0

C := ,
0 Q0
donde B es una matriz de la forma:
 0
···

b1,1 0 0
 b02,1 b02,2 · · · b02,r 
0 
 
 .. . .
0
B :=  . .. ..  ∈ Mm×n (R),
 
0 0
 br,1 br,2 · · · br,r0 
0 0
donde b01,1 = gcd(a1 , . . . , ar ). Obsérvese, además, que todas las operaciones por filas o columnas
(Tipos 1 a 4) suponen hacer combinaciones lineales (con coeficientes en R) de las coordenadas
de la matriz original. Si nos fijamos en la matriz B de la Identidad (4.6.1) anterior, todas las
coordenadas de la matriz B 0 son combinaciones lineales (con coeficientes en R) de elementos en
el conjunto {a1 , . . . , ar }. Luego
b0i,j ∈ a,
donde a es el ideal generado por {a1 , . . . , ar }. En suma, como b01,1 = gcd(a1 , . . . , ar ), se tiene
que a = (b01,1 ) = b01,1 R y, por tanto, b01,1 | b0i,j para cualesquiera i, j.
Repitiendo el mismo procedimiento con la submatriz indicada, se obtiene el resultado apetecido.
En cuanto a la condición de los factores invariantes en términos de los máximos comunes
4.6. FORMA NORMAL DE SMITH 237

divisores de los menores de la matriz inicial, basta también con aplicar inducción. El caso k = 1
es claro. El paso inductivo se basa en que las matrices P y Q usadas para las transformaciones
son producto de matrices elementales de las descritas anteriormente y no modifican el máximo
común divisor de los menores. Omitimos el detalle. 

4.6.1. Estructura de grupos abelianos finitamente generados.


Teorema 4.6.3 (Estructura de Grupos Abelianos Finitamente Generados). Sea (G, +)
un grupo abeliano finitamente generado. Entonces, G es isomorofo como grupo a una descom-
posición:
G∼= Zm ⊕ T orZ (G),
donde T orZ (G) son los elementos de torsión de G. Además, existen d1 , . . . , dr ∈ N, di ≥ 1,
verificando di | di+1 y se tiene:
r
Y
T orZ (G) := (Z/di Z) .
i=1

Además, los elementos d1 , . . . , dr son únicos y se denominan factores invariantes del grupo G.
Demostración. Comencemos recordando que todo grupo abeliano finitamente generado
es el co-núcleo de un morfismo entre Z−módulos libres finitamente generados, es decir, existe
una matriz A ∈ Mm×n (Z) que define un morfismo de Z−módulos A : Zn −→ Zm , de tal modo
que G es isomorfo al cociente:
Zm / Im(A) ∼
= G.
Más correctamente, tenemos una sucesión exacta
Zn −→ Zm −→ G −→ 0.
Ahora bien, usando la forma normal de Smith de A podemos disponer de isomorfismos de los
Z−módulos (dados por las matrices P y Q que nos conducen a un diagrama conmutativo de
Z−módulos que tiene la forma siguiente:
A
Zn −→ Zm −→ G −→ 0
Q ↓ ↓ P ↓
Zn −→ Zm −→ G −→ 0
D
donde D es una matriz diagonal, que puedo suponer de la forma:
 
d1 0 · · · 0
 0 d2 · · · 0 
 .. .. 0
 
D :=  . ..  ∈ Mm×n (Z).

 . . 
 0 0 · · · dr 
0 0
La conclusión obvia es que G es también isomorfo al cociente siguiente como Z−módulo:
Zm / Im(D) ∼
= G.
Ahora bien, por ser D diagonal es obvio que el cociente tiene la forma:
r
!
∼ Z / Im(D) = ∼
Y
m
G= (Z/di Z) ⊕ Zn−r .
i=1

Este isomorfismo indica obviamente que


r
!
T orZ (G) ∼
Y
= (Z/di Z) ,
i=1

y se sigue la existencia en el Teorema de Estructura. La unicidad se puede probar de varias


maneras, una de las más elegantes es la de [Gen, 1976] que no tiene en cuenta la existencia
de factorización única en Z. Comencemos con la siguiente Afirmación:
238 4. PRIMOS, MAXIMALES. MÓDULOS LIBRES. FORMA NORMAL DE SMITH

Afirmación. Sea M un grupo abeliano finito y supongamos que M admite dos descomposi-
ciones: ! !
r s
M∼ (Z/di Z) ∼
Y Y
= = (Z/gi Z) ,
i=1 i=1
de tal modo que ninguno de los di ’s ni ninguno de los gj ’s es unidad en Z y se satisface di | di+1
y gi | gi+1 . Entonces,
r = s.
Demostración de la Afirmación. Para empezar tenemos que el orden del grupo M satisface:
r
Y s
Y
] (M ) = di = gj .
i=1 j=1

Por tanto, dado que ninguno


Qrde estos dos productos es una unidad, los elementos de MaxSpec(Z)
Qs
que contienen al producto i=1 di son los mismos maximales que contienen al producto j=1 gj .
De otro lado, la condición sobre divisibilidad nos dice que los maximales que contienen a
cualquiera de esos productos son exactamente los maximales de Z que contienen a d1 y/o
a g1 . Elijamos m ∈ MaxSpec(Z) un ideal maximal tal que
r
Y s
Y
di = gj ∈ m.
i=1 j=1

Ahora consideremos el Z−módulo mM . Es sencillo observar que:


r s
(m/di Z) ∼
Y Y
mM = = (m/gj Z) .
i=1 j=1

Seguidamente, tenemos el Z/m−espacio vectorial M/mM que admite las siguientes dos repre-
sentaciones:
r r
M/mM ∼ ((Z/di Z) / (m/di Z)) ∼
Y Y
= = (Z/m) ,
i=1 i=1
y
s s
M/mM ∼ ((Z/gj Z) / (m/gj Z)) ∼
Y Y
= = (Z/m) ,
j=1 j=1
donde hemos usado el Segundo Teorema de Isomorfı́a. Pero, entonces, tenemos la siguiente
igualdad de dimensiones entre espacios vectoriales sobre Z/m:
dimZ/m (M/mM ) = r = s.
Con lo que hemos concluido que r = s.
Tenemos ası́ dos descomposiciones de la forma siguiente:
r
!  r 
∼ ∼
Y Y
(4.6.2) M = T orZ (G) = (Z/di Z) = (Z/gi Z) ,
i=1 j=1

De tal modo que ninguno de los di ’s ni ninguno de los gj ’s es unidad en Z y se satisface di | di+1
y gi | gi+1 .
Consideremos x ∈ Z y la siguiente homotecia

ηx : M −→ M
m 7−→ xm.
Es un morfismo de grupos abelianos que, obviamente, se interpreta sobre las dos descomposi-
ciones del modo obvio:
Qr Qr
ηx : ( i=1 (Z/di Z)) −→ ( i=1 (Z/di Z))
(h1 + (d1 ), . . . , hr + (dr )) 7−→ (xh1 + (d1 ), . . . , xhr + (dr )).
Q  Q 
r r
ηx : j=1 (Z/gi Z) −→ j=1 (Z/gi Z)
(h1 + (g1 ), . . . , hr + (gr )) 7−→ (xh1 + (g1 ), . . . , xhr + (gr )).
4.6. FORMA NORMAL DE SMITH 239

Dado que todos son enteros positivos, podemos suponer que existe t ≤ r tal que 1 ≤ t y di = d1 ,
para 1 ≤ i ≤ t y dj > d1 para t + 1 ≤ j ≤ r. Supongamos x = d1 y consideremos la homotecia
ηd1 precedente. Tenemos que, dado que d1 | di , por la primera forma se tiene:
r
Y
Im(ηd1 ) = (d1 Z/di Z) ,
i=1

por lo que el co-núcleo toma la forma:


r r
Coker(ηd1 ) ∼ ((Z/di Z) / (d1 Z/di Z)) ∼
Y Y r
= = (Z/d1 Z) = (Z/d1 Z) .
i=1 i=1

De otro lado, observamos que


r r
((d1 Z + gi Z) /gi Z) ∼
Y Y
Im(ηd1 ) = = (qi Z/gi Z) ,
i=1 i=1

donde qi := gcd(d1 , gi ). Por tanto, el conúcleo tomará la forma:


r
Coker(ηd1 ) ∼
Y
= (Z/qi Z) .
i=1

Dado que el co-núcleo no depende de la representación, obtendremos que:


r
Y
dr1 = gcd(gi , d1 ).
i=1

Qr supongamos que d1 ≥ g1 en la descomposición de la igualdad


Usando esta descomposición,
(4.6.2). Entonces, si dr1 = i=1 gcd(gi , d1 ), como d1 ≥ gcd(gi , d1 ), para que se de esta igualdad
es necesario que d1 = gcd(gi , d1 ) para cada i y, por tanto, tendrı́amos que d1 ≤ g1 , con lo cual
d1 = g1 . Del mismo modo se harı́a en el otro caso, intercambiando los roles de d1 y g1 .
Podemos ası́ suponer que existe k ≤ r tal que di = gi para cada 1 ≤ i ≤ k. Veamos qué sucede
para el caso k + 1. Suponemos que dk+1 ≥ gk+1 y usamos la homotecia de razón x = dk+1 .
Obsérvese que, como di | di+1 se tendrá:
r r
Im(ηdk+1 ) ∼
Y Y
= (dk+1 Z/di Z) = (dk+1 Z/di Z) ,
i=1 i=k+1

porque dk+1 Z/di Z = 0 para 1 ≤ i ≤ k (porque di | dk+1 en esos casos). De otro lado, como
gi = di para 1 ≤ i ≤ k, la imagen tendrá también la forma siguiente:
r r
Im(ηdk+1 ) ∼
Y Y
= ((dk+1 Z + gj Z) /gj Z) = (pj Z/gj Z) ,
j=k+1 j=k+1

donde pj := gcd(dk+1 , gj ). Tomando los conúcleos de nuevo, tendremos:


k
!  r 
k
!  r 

Coker(ηdk+1 ) ∼ Z/dk+1 Z ∼
Y Y Y Y
= Z/di Z ×  = Z/gi Z ×  Z/pj Z .
i=1 j=k+1 i=1 j=k+1

Como di = gi , 1 ≤ i ≤ k y estamos ante un grupo finito, tendremos:


 
Yk k
Y r−k
Y
di dr−k

k+1 = gi  pj  ,
i=1 i=1 j=1

lo que implica
r
Y
dr−k
k+1 = gcd(dk+1 , gj ).
j=k+1
Usando el mismo argumento que en el caso d1 , concluiremos que dk+1 ≤ gk+1 y, en particular,
dk+1 = gk+1 .
Por tanto, di = gi para cada i, 1 ≤ i ≤ r y tenemos la unicidad buscada. 
240 4. PRIMOS, MAXIMALES. MÓDULOS LIBRES. FORMA NORMAL DE SMITH

Corolario 4.6.4. Sea (G, +) y (G0 , +) dos grupos abelianos libres. Supongamos que G es sub-
grupo de G0 y que ambos tienen el mismo rango como Z−módulos: rankZ (G) = rankZ (G0 ) = n.
Sea B 0 := {u1 , . . . , un } una base cualquiera de G0 y sea B := {v1 , . . . , vn } una base cualquiera
de G. Sea A ∈ Mn (Z) la matriz cuyas columnas son las coordenadas de los vectores de la base
B de G en la base B 0 de G0 . Supongamos que det(A) 6= 0. Entonces, el grupo cociente G0 /G
es un grupo abeliano finito y su orden satisface:
] (G0 /G) = | det(A)|.
Demostración. Consideremos la Forma Normal de Smith de A y las matrices de la trans-
formación P, Q ∈ GL(n, Z) de tal modo que
 
f1 0 · · · 0
 0 f2 · · · 0 
(4.6.3) P AQ = N :=  . ..  ,
 
 .. ..
. .
0 0 · · · fn
donde f1 , . . . , fn son los factores invariantes. Nótese que son todos no nulos porque det(A) 6= 0.
De hecho, tenemos que la matriz A es la matriz del morfismo de Z−módulos que, en términos
de coordenadas, viene dado del modo siguiente:
0
A: G 7−→ G 
x1
 .. .
(x1 , . . . , xn ) 7−→ A . 
xn
0
Obsérvese que se trata de la inclusión de G en G escrita en las coordenadas de las distintas
bases. Entonces, la Igualdad (4.6.3) se transforma en el siguiente diagrama conmutativo de
Z−módulos:

A
G G0

Q N

G G0
P

A partir de este diagrama, concluimos que los siguientes grupos abelianos son isomorfos:
G0 /G ∼
= G0 / Im(A) ∼
= G0 / Im(N ).
Ahora bien, como N es una matriz diagonal, es obvio que
n
G0 / Im(N ) ∼
Y
= Z/fi Z.
i=1

En particular, el grupo cociente G0 /G es un grupo finito y su orden satisface las siguientes


igualdades.
n
Y
0
] (G / Im(N )) = |fi | = | det(N )|.
i=1
Por la Igualdad (4.6.3) y dado que | det(P )| = | det(Q)| = 1 por ser matrices regulares sobre Z,
concluimos:
] (G0 /G) = ](G0 / Im(N )) = | det(N )| = | det(P ) det(A) det(Q)| = | det(A)|,
lo que demuestra el enunciado. 

Argumentos similares a los del Teorema 4.6.3 se aplican a cualquier dominio de ideales prin-
cipales, dando lugar al Teorema General de Estuctura de R−módulos finitamente generados
sobre un DIP:
4.7. FORMA DE FROBENIUS Y FACTORES INVARIANTES 241

Teorema 4.6.5 (Estructura de Módulos Finitamente Generados sobre DIP). Sea R


un dominio de ideales principales y M un R−módulo finitamente generado. Entonces, M es
isomorofo como R−módulo a una descomposición:
M∼
= Rm ⊕ T orR (M ),
donde T orR (M ) son los elementos de torsión de G, i.e.
T orR (M ) := {m ∈ M : AnnR (m) 6= (0)}.
Además, existen d1 , . . . , dr ∈ R verificando di | di+1 y se tiene:
r
Y
T orR (M ) := (R/di R) .
i=1

Además, los elementos d1 , . . . , dr son únicos (salvo unidades en R) y se denominan factores


invariantes del módulo M .
Demostración. Misma prueba que el caso de Z. 

4.7. Forma de Frobenius y Factores Invariantes de un endomorfismo sobre un


espacio vectorial de dimensión finita.
4.7.1. Factores invariantes de un endomorfismo.
Teorema 4.7.1 (Factores Invariantes de un Endomorfismo). Sea K, sea V un K−espacio
vectorial de dimensión finita sobre K y sea ϕ : V −→ V un endomorfismo de V . Sea M la
matriz de ϕ en cualquier base de V y consideremos la matriz:
XIdn − M ∈ Mn (K[X]),
donde n = dimK (V ). Entonces, existen:
• Matrices P, Q ∈ GL(n, K[X]) (o, equivalentemente, det(P ) ∈ K \ {0}, det(Q) ∈
K \ {0})
• Un entero positivo r ∈ N, r ≥ 1, y polinomios mónicos f1 , . . . , fr ∈ K[X] tales que
fi | fi+1 , para 1 ≤ i ≤ r − 1.
Tales que
 
Idn−r 0

 f1 0 · · · 0  
P · (XIdn − M ) · Q = 
 0 f2 · · · 0 
0

.. .. . 
. .. 

 .
0 0 ··· fr
Tanto el entero positivo r ∈ N como los polinomios mónicos f1 , . . . , fr son únicos satisfaciendo
estas propiedades. Además, satisfacen
r
Y
(4.7.1) χM (X) = fi (X).
i=1

A los polinomios mónicos f1 , . . . , fr ∈ K[X] se les denomina factores invariantes del endomor-
fismo ϕ (o de la matriz M ).
Demostración. Como K[X] es un dominio de ideales principales, lo único que manifiesta
este enunciado es la existencia de factores invariantes de la matriz XIdn − M ∈ Mn (K[X]).
Lo único a observar, para tener la Igualdad (4.7.1), es que las unidades del anillo K[X] vienen
dadas por K[X]× = K \ {0}. Por la propiedad del producto de los determinantes, se ha de
tener:
Y r
det(P ) det (XIdn − M ) det(Q) = fi ,
i=1
Como el polinomio caracterı́stico es mónico y los polinomios fi ’s elegidos son también mónicos,
entonces det(P ) det(Q) = 1 y se tiene la igualdad buscada. 
242 4. PRIMOS, MAXIMALES. MÓDULOS LIBRES. FORMA NORMAL DE SMITH

4.7.2. Forma de Frobenius de un endomorfismo: factores invariantes en K[X].


En la subsección precedente hemos introducido los factores invariantes de un endomorfismo
dado por una matriz M ∈ Mn (K) a partir de la matriz XIdn − M ∈ Mn (K[X]). Sin embargo,
no parece inmediato que estos objetos tengan algo que ver con la naturaleza intrı́nseca del
endomorfismo en cuestión. En esta subsección mostraremos que esos factores inavariantes que
surgen de la forma normal de Smith de la matriz XIdn − M tienen ua interpretación natural
en la forma de Frobenius de un endomorfismo que ya vimos en la Subsección 4.7.2 y, muy
particularmente, en el Problema 173 precedente.
Comencemos recordando lo descrito sobre la matriz compañera de un polinomio mónico en el
Problema 168
4.7.3. El álgebra R[X]/(f ), con f ∈ R[X]mon . Sea R un anillo y supongamos f :=
X n + an−1 X n−1 + · · · + a1 X + a0 ∈ R[X]mon , un polinomio univariado mónico Consideremos
el anillo cociente A := R[X]/(f ). Siguiendo las ideas del Problema 168 tenemos el siguiente
enunciado:
Proposición 4.7.2. Con las anteriores notaciones, se tiene:
i) El anillo cociente A = R[X]/(f ) es un R−módulo libre de rango finito una de cuyas
bases es la siguiente:
B0 := {1 + (f ), X + (f ), . . . , X n−1 + (f )}.
En paricular, el rango de A como R−módulo libre satisface:
rankR (A) := deg(f ) = n.
ii) Dado X ∈ R[X], podemos definir la aplicación:
ηX : R[X]/(f ) −→ R[X]/(f )
h + (f ) 7−→ Xh + (f ),
es un endomorfismo de R[X]/(f ) como R−módulo. Más aún, la matriz MX ∈
Mn (R), de ηX en la base B0 anterior, es, justamente, la matriz compañera de f ,
esto es,  
0 0 0 ··· −a0
1 0 0 · · · −a1 
 
0 1 0 · · · −a2 
MX := C(f ) = 0 0 1 · · · .
 
 −a3 

 .. .. . . .. .. 
. . . . . 
0 0 0 · · · −an−1
La matriz MX se denomina también el tensor de multiplicación de la R−álgebra
R[X]/(f ).
iii) Dado g ∈ R[X], podemos definir la aplicación:
ηg : R[X]/(f ) −→ R[X]/(f )
h + (f ) 7−→ gh + (f ).
De nuevo, ηg es un endomorfismo de R−módulos. Además, dados g1 , g2 ∈ R[X] y
λ ∈ R se tiene:
ηg1 +g2 = ηg1 + ηg2 , ηg1 ·g2 = ηg1 ◦ ηg2 , ηλg1 = ληg1 .
A los endomorfismos ηg se les denomina homotecias de razón g sobre R[X]/(f ).
iv) En particular, la matriz Mg ∈ Mn (R), de ηg en la base B0 anterior, es, justamente,
Mg := g(MX ) = g(C(f )).
v) Denotemos por g := g + (f ) ∈ R[X]/(f ) la clase residual de g módulo el ideal (f ).
Se tiene que la homotecia ηg sólo depende de la clase residual g. Y definamos los
siguientes dos subconjuntos de R[X]:
AnnR[X] (Mg ) := {m(X) ∈ R[X] : m(Mg ) = 0 ∈ Mn (R)},
AnnR[X] (g) := {m(X) ∈ R[X] : m(g) = 0 + (f ) ∈ R[X]/(f )},
es decir,
AnnR[X] (g) = {m(X) ∈ R[X] : m(g) ∈ (f )}.
4.7. FORMA DE FROBENIUS Y FACTORES INVARIANTES 243

Ambos conjuntos son ideales de R[X] y son iguales, i.e.


AnnR[X] (Mg ) = AnnR[X] (g).
vi) Más aún, existe un polinomio mónico χ ∈ R[T ]mon tal que χ(g) = 0 + (f ).
Demostración. Repetimos los resultados por afirmación:
i) Como se observa en el Teorema 1.4.15, la división euclı́dea con resto es factible siem-
pre que el divisor sea un polinomio mónico. El resto de esa división determina los
coeficientes de cualquier h ∈ R[X]/(f ). La unicidad deterina que B0 es base.
ii) Es obvio que se trata de un endomorfismo de R−módulos y es clara también la manera
de determinar la matriz de ηX en la base B0 .
iii) Es de mera comprobación a partir de las definiciones.
iv) Se sigue de aplicar las igualdades precesentes a la expansión monomial de g(X).
v) Es inmediato (por las meras definiciones) que ambos son ideales de R[X]. También es
claro que si g1 − g2 ∈ (f ) se tiene que
ηg1 (h + (f )) = g1 h + (f ) = g2 h + (f ) = ηg2 (h + (f )),
para cualquier h + (f ) ∈ R[X]/(f ).
Finalemente, usando las propiedades descritas en el apartado iii) precedente, obser-
vamos que para cada m(X) ∈ R[X] se tiene:
m(ηg ) = ηm(g) : R[X]/(f ) −→ R[X]/(f ).
Por tanto, m(ηg ) = 0 como endomorfismo si y solamente si
ηm(g) (h + (f )) = m(g)h + (f ) = 0 + (f ) ∈ R[X]/(f ).
Ası́ pues, si m ∈ AnnR[X] (Mg ) es porque m(ηg ) = 0 como endormismo y, por tanto,
m(ηg )(1 + (f )) = m(g) + (f ) = 0 + (f ) ∈ R[X]/(f ).
Luego m(g) = m(g) + (f ) = 0 + (f ) y m ∈ AnnR[X] (g).
Para el otro contenido, si m(g) = 0 + (f ), entonces m(g) ∈ (f ) y, en paricular,
m(ηg ) = ηm(g) = 0 como endomorfismos. Por tanto m(Mg ) = 0 como matriz y
tenemos el otro contenido.


Proposición 4.7.3. Con las mismas notaciones que en la proposición precedente, daod f ∈
R[X]mon un polinomio mónico, y dada g ∈ R[X], definamos la resultante de f y g mediante:
ResX (f, g) := det(Mg ) = det(g(C(f )),
donde C(f ) es la matriz compañera de f . Se tiene:
i) Se verifica:
ResX (f, g) ∈ (f, g)c = (f, g) ∩ R.
ii) Se tiene ResX (f, g) ∈ R× si y solamente si 1 ∈ (f, g).
Demostración. Las afirmaciones una tras otra:
i) Recordemos el Problema 103 y sea XMg (X) ∈ R[X] el polinomio caracterı́stico de Mg .
Supongamos,
χMg (X) := X n + bn−1 X n−1 + · · · + b1 X + b0 ,
donde
b0 = (−1)n det(Mg ) = (−1)n Resx (f, g).
Ahora, por el aparatado v) de la Proposición precedente y por el Teorema de Hamilton-
Cayley, tendremos que
χMg (Mg ) = 0 =⇒ χMg (g) ∈ (f ).
Es decir, se tiene
g(g n−1 + bn−1 g n−2 + · · · + b1 ) + b0 ∈ (f ).
Luego b0 ∈ (f, g) y, por tanto, ResX (f, g) = (−1)n b0 ∈ (f, g).
244 4. PRIMOS, MAXIMALES. MÓDULOS LIBRES. FORMA NORMAL DE SMITH

ii) Por el ı́tem precedente, si ResX (f, g) ∈ R× es una unidad de R, entonces, 1 ∈ (f, g)c ⊆
(f, g). Recı́procamente, si 1 ∈ (f, g) en R[X], es porque g es una unidad en R[X]/(f ).
Es decir, porque existe h ∈ R[X] tal que
hg + (f ) = 1 + (f ).
En particular, se tiene la siguiente igual de homotecias:
ηh ◦ ηg = ηhg = η1 ,
lo que conlleva la igualdad matricial:
Mh Mg = Mhg = M1 = Idn ,
donde la última igualdad se sigue porque la homotecia η1 es la identidad como endo-
morfismo de R[X]/(f ). Como el determinante es un morfismo de grupos (cf. Teorema
2.3.23), tendremos que
det(Mh Mg ) det(Mh ) det(Mg ) = det(Mgh ) = det(Idn ) = 1.
Luego det(Mg ) ∈ R× y la resultante ResX (f, g) = det(Mg ) ∈ R× .


Corolario 4.7.4. Con las notaciones precedentes, supongamos R = K un cuerpo, f ∈ K[X]mon


un polinomio mónico de grado n y g ∈ K[X]. Se tiene:
i) El polinomio mı́nimo de la matriz compañera C(f ) es justamente f , es decir
mC(f ) = χC(f ) = f,
donde mC(f ) es el polinomio mı́nimo de C(f ).
ii) Si K es la clausura algebraica de K son equivalentes:
(a) gcd(f, g) = 1,
(b) ∃ζ ∈ K, f (ζ) = g(ζ) = 0,
(c) ResX (f, g) = 0.
Demostración. Retomemos la afirmación v) de la Proposición 4.7.2 anterior. Tomemos
g = X y X = X + (f ) en K[X]/(f ) la matriz MX = C(f ). Entonces, se tiene que
AnnK[X] (C(f )) = {m ∈ K[X] : m(X) = 0} = {{m ∈ K[X] : m(X) ∈ (f )}.
Como K[X] es un dominio de ideales principales, AnnK[X] (C(f )) es un ideal principal cuyo
generador es, precisamente, el polinomio mı́nimo de la matriz C(f ), que denotaremos por
mC(f ) . Pero, al mismo tiempo, el polinomio f es el polonomio no nulo de menor grado tal que
f (X) ∈ (f ). luego
mC(f ) = f ∈ K[X].
En particular, el grado del polinomio mı́nimo de C(f ) es n = deg(f ). Pero el polinomio
caracterı́stico de C(f ) también tiene grado n y, como mC(f ) es divisor de χC(f ) , concluimos la
igualdad:
mC(f ) = χC(f ) = f.
Para la aformación ii) el Corolario ?? precedente, aplicado al caso n = 1 ya nos indica la
equivalencia entre (a) y (c). Para la equivalencia de (a) y (b) nos remontamos al Lema 3.6.13. 

Lema 4.7.5. Sean f1 , . . . , fr ∈ K[X] una familia finita de polinomios mónicos, Sea
r
Y
V := K[X]/(fi (X)),
i=1

el espacio vectorial dado como el producto cartesiano de las K−álgebras cociente. Consideremos
el endomorfismo:
ηX : V −→ V
(h1 + (f1 ), . . . , hr + (fr )) 7−→ (Xh1 + (f1 ), . . . , Xhr + (fr )).
4.7. FORMA DE FROBENIUS Y FACTORES INVARIANTES 245

Entonces, existe una base de V en la que la matriz de ηX en esa base es de la forma suma
diagonal de las matrices compañeras de f1 , . . . , fr . Es decir, la matriz es la dada por:
 
C(f1 ) 0 0 0
 0 C(f2 ) 0 0 
M (ϕ) :=  .
 
.. .. .. ..
 . . . . 
0 0 0 C(fr )
Demostración. A partir de la Proposición precedente es obvio que toma esa forma
tomando para V la base del producto cartesiano de cada uno de los espacios vectoriales
K[X]/(fi ) según se describe en el apartado ii) de la Proposición precedente. 

Observación 4.7.6. En el caso del Problema 173 se observa que cada fi es divisible por el
siguiente. En el enunciado que acabamos de dar la condición de divisibilidad no es necesaria.

4.7.3.1. La Estructura de K[X]−módulo que define un endomorfismo. Sea V un


espacio vectorial de dimensión n sobre un cuerpo K, ϕ : V −→ V un endomorfismo y sea
(V, +, ·K[X] ) la estructura de K[X]−módulo inducida sobre V por el endomorfismo ϕ (como en
el Ejemplo 2.2.4 del primer Capı́tulo). Entonces, V es un K[X]−módulo finitamente generado
y totalmente de torsión (i.e. V = T orK[X] (V ) como consecuencia del Teorema de Hamilton-
Cayley, Teorema 2.3.33).
Supongamos que dimK (V ) = n es la dimensión de V como K−espacio vectorial. Sea
(4.7.2) B := {v1 , . . . , vn },
una base cualquiera de V y sea M = M (ϕ) ∈ Mn (K) la matriz de ϕ en esa base.
En primer lugar, como V es un K−espacio vectorial generado por B, entonces B es también
un sistema generador de V como K[X]−módulo. En particular, existe un epimorfismo de
K[X]−módulos (y de espacios vectoriales sobre K) de la forma:
π : K[X]n −→ V.
De hecho, consideremos la base usual del K[X]−módulo libre K[X]n dada por:
(4.7.3) T := {e1 , . . . , en } ⊆ K[X]n ,
donde ei := (0, . . . , 0, 1, 0, . . . , 0) ∈ K[X]n , es decir todas sus “coordenadas” son nulas excepto
la coordenada que ocupa el lugar i que es 1 ∈ K ⊆ K[X].
El epimorfismo de K[X]−módulos π : K[X]n −→ V es el único morfismo de K[X]−módulos
tal que
π(ei ) = vi , 1 ≤ i ≤ n.
Lema 4.7.7. Con las notaciones precedentes, sea (p1 , . . . , pn ) ∈ K[X]n un elemento cualquiera
del K[X]−módulo libre K[X]n . Entonces,
n
X
π(p1 , . . . , pn ) := pi (ϕ)(vi ),
i=1

donde pi (ϕ) : V −→ V es el enfomorfismo de V en notación usual.


Demostración. Es un resultado obvio teniendo en cuenta la definición de la estructura
de K[X]−módulo que ϕ induce en V . Pero lo ponemos a modo de recordatorio de esa idea.
Nótese que:
n
X n
X n
X
π(p1 , . . . , pn ) = π(pi ei ) = pi (X) ·K[X] π(ei ) = pi (X) ·K[X] vi ,
i=1 i=1 i=1

por ser morfismo de K[X]−módulos y satisfacerse π(ei ) = vi , donde ·K[X] es la operación


externa (con escalares en K[X]) definida sobre V por ϕ. Pero esa operacón externa significa:
pi (X) ·K[X] vi := pi (ϕ)(vi ), 1 ≤ i ≤ n.
Y tenemos probado el enunciado. 
246 4. PRIMOS, MAXIMALES. MÓDULOS LIBRES. FORMA NORMAL DE SMITH

Ahora retomemos la matriz M ∈ Mn (K) de ϕ en la base B y definamos la matriz


MX := XIdn − M ∈ Mn (K[X]).
Consideremos el endomorfismo de K[X]−módulos libres ΦX : K[X]n −→ K[X]n cuya matriz
en la base T de K[X]n , descrita en la Identidad (4.7.3), es la matriz MX . Entendiendo que
ambos K[X]−módulos tienen fijada la misma base. Entonces, tenemos:
Proposición 4.7.8. Con estas notaciones se tiene:
i) El morfismo ΦX es un monomorfismo de K[X]−módulos.
ii) El espacio vectorial V es isomorfo como K[X]−módulo al Co-núcleo de ΦX . Es decir,
V ∼
= K[X]n / Im(ΦX ).
Dicho de otro modo, la siguiente es una sucesión exacta corta de K[X]−módulos:
ΦX π
0 K[X]n K[X]n V 0

Demostración. Ser sucesión exacta corta ((cf. Subsección 2.2.5 del Capı́tulo 2)) equivale
a las propiedades i) y ii) del enunciado. Probemos, por tanto, esas propiedades i) y ii). Para
la propiedad i) recordemos la noción de polinomio caracterı́stico de un endomorfismo. Es decir,
el polinomio descrito en la Definición 53 siguiente:
χM (X) := det(XIdn − M ) ∈ K[X].

Se trata de un polinomio mónico de grado n y, por tanto, es no nulo. En particular, considerando


el cuero de fracciones K(X) del anillo K[X], se tiene que la matriz XIdn − M ∈ Mn (K(X))
es inversible (i.e. XIdn − M ∈ GL(n, K(X))). por tanto, para cualesquiera (p1 , . . . , pn ) ∈
K[X]n ⊆ K(X)n , si se tiene:
   
p1 0
 ..   .. 
(XIdn − M )  .  =  .  ,
pm 0
entonces,
   
p1 0
 ..   .. 
 .  = . ,
pm 0
y ΦX es momomorfismo de K[X]−módulos. Además, su imagen Im(ΦX ) es un submódulo libre
de K[X]n . Más aún, supongamos que la matriz M viene dada por:
 
a1,1 · · · a1,n
M :=  ... .. ..  .

. . 
an,1 ··· an,n
Las columnas de la matriz M son las coordenadas en la base B de las imágenes de los elementos
de la base B por el morfismo ϕ. Por su parte, Im(ΦX ) es el submódulo libre de rango n de
K[X]n generado por los elementos (descritos en columna) siguientes:
 
X − a1,1
 −a2,1  Pn
ΦX (u1 ) :=   = (X − a1,1 )e1 + k=2 (−ak,1 )ek ,
 
..
 . 
−an,1
..
  .
−a1,1
 −a2,1  P
n−1
ΦX (un ) :=   = k=1 (−ak,n )ek + (X − an,n )en .
 
..
 . 
X − an,1
4.7. FORMA DE FROBENIUS Y FACTORES INVARIANTES 247

El Lema precedente nos permite concluir que:


n
X
(π ◦ ΦX )(ei ) := π(ΦX (ei )) = (X − ai,i ) ·K[X] π(ei ) + (−ai,k ) ·K[X] π(ek ),
k=1,k6=i

o lo que es lo mismo:
n
X
(π ◦ ΦX )(ei ) = (ϕ − ai,i IdV )(vi ) + (−ak,i )vk .
k=1,k6=i
Pn
Ahora nótese que ϕ(ei ) = k=1 ak,i vk , lo que nos permite concluir que
n
X
(π ◦ ΦX )(ei ) = ϕ(ei ) − (−ak,i )vk = 0.
k=1

Con ello hemos probado que


π ◦ ΦX = 0.
En particular,
Im(ΦX ) ⊆ ker(π).
Ahora observemos que, como π es un epimorfismo de K[X]−módulos, tenemos un isomorfismo
de K[X]−módulos asociado al 1er. Teorema de Isomorfı́a:
K[X]n / ker(π) ∼
= V.
Como es isomorfismo de K[X]−módulos, también es isomorfismo de K−espacios vectoriales.
En particular, K[X]n / ker(π) es un K−espacio vectorial de dimensión n.
De otro lado, el 2o. Teorema de Isomorfı́a indica que tenemos un isomorfismo de K− espacios
vectoriales de la forma:
(K[X]n / Im(ΦX )) / ∼ n
(ker(π)/ Im(ΦX )) = K[X] / ker(π).
Ahora, si probamos que K[X]n / Im(ΦX ) es K−un espacio vectorial de dimensión finita y si
probamos que se tiene:
(4.7.4) dimK (K[X]n / Im(ΦX )) = n,
entonces tendremos la siguiente igualdad de dimensiones entre K−espacios vectoriales de di-
mensión finita:
dimK (K[X]n / Im(ΦX ))−dim (ker(π)/ Im(ΦX )) = n dim (ker(π)/ Im(ΦX )) = dimK (K[X]n / ker(π)) = n.
Con lo que concluirı́amos que
dimK (ker(π)/ Im(ΦX )) = 0,
o, equivalentemente,
Im(ΦX ) = ker(π),
lo que conluye la prueba de que la sucesión de K[X]−módulos del enunciado es una sucesión
exacta corta.

A partir de ahora trataremos de probar simplemente la Igualdad (4.7.4) precedente.


Para ello, observemos que podemos definir un morfismo de K[X]−módulos que sigue siendo
epimorfismo:
e : K[X]n / Im(ΦX ) −→
π V
(4.7.5)
h + Im(ΦX ) 7−→ π(h).
La buena definición de este morfismo es consecuencia del contenido de submódulos Im(ΦX ) ⊆
ker(π). Y sigue siendo epimorfismo por la misma razón. Es epimorfismo de K[X]−módulos y,
en particular, es epimorfismo de K−espacios vectoriales porque K ⊆ K[X].
248 4. PRIMOS, MAXIMALES. MÓDULOS LIBRES. FORMA NORMAL DE SMITH

Ahora calculemos la forma normal de Smith de la matriz XIdn − M que tendrá la forma para
P, Q ∈ GL(n, K[X]):
 
Idn−r 0
 f1 · · · 0 
P (XIdn − m)Q :=  ,
 
0 . .
 0 . 0
0 · · · fr
donde Idn−r es la matriz identidad con n−r filas y columnas, y f1 , . . . , fr ∈ K[X] son polinomios
mónicos verificando fi | fi+1 para cada i, 1 ≤ i ≤ r − 1. En particular, existe una unidad
u ∈ K[X]× = K \ {0} tal que:
Yr
χM (X) := u fi (X).
i=1
Por lo tanto, salvo las matrices P, Q ∈ GL(n, K[X]), el cociente de K[X]n por Im(ΦX ) es
isomorfo como K[X]−módulo a:
r
K[X]n / Im(ΦX ) ∼
Y
= (K[X]/(fi )) .
i=1
Esto significa que también son isomorfos como K−espacios vectoriales y, en particular, ten-
dremos que la dimensión como K−espacio vectorial satisface:
Xr
dimK (K[X]n / Im(ΦX )) = deg(fi ) = deg(χM (X)) = n.
i=1
En particular, el epimorfismo π
e de la Ecuación (4.7.5) es un epimorfismo entre dos espacios
vectoriales de la misma dimensión. Es, por tanto, un isomorfismo de K−espacios vectoriales y
de K[X]−módulos y queda probada la Igualdad (4.7.4) y el enunciado. 

A continuación, demostramos la existencia de la forma de Frobenius de un endomorfismo so-


bre un espacio vectorial de dimensión finita (también llamada, según diversos autores forma
canónica racional o forma cı́clica del endomorfismo).
Teorema 4.7.9 (Existencia de forma de Frobenius de un endomorfismo). Sea V un
espacio vectorial de dimensión n sobre un cuerpo K, ϕ : V −→ V un endomorfismo y sea
(V, +, ·K[X] ) la estructura de K[X]−módulo inducida sobre V por el endomorfismo ϕ. Sea M
la matriz de ϕen una base cualquiera de V y sea XIdn − M ∈ Mn (K[X]) la matriz definida
anterioremente. Sea f1 , . . . , fr ∈ K[X] los factores invariantes (mónicos) que no son unidades
entre los de la matriz XIdn − M ∈ Mn (K[X]) (cf. Teorema 4.7.1 precedente), con la propiedad
fi | fi+1 , 1 ≤ i ≤ r − 1.

Entonces, V es isomorfo como K[X]−módulo (y como K−espacio vectorial) a:


r
V ∼
Y
= K[X]/(fi (X)).
i=1
En particular, existe una base Θ de V en la que la matriz de ϕ en esa base toma la forma
siguiente :
 
C(f1 ) 0 0 0
 0 C(f 2) 0 0 
(4.7.6) M (ϕ) :=  . ,
 
. .. ..
 .. .. . . 
0 0 0 C(fr )
siendo C(fi ) la matriz compañera del polinomio fi ∈ K[X].
Además, el polinomio fr será el polinomio mı́nimo del endomorfismo ϕ (y de la matriz M ), i.e.
fr = mM (X) ∈ K[X].
En cuanto al caracterı́stico, se tendrá:
r
Y
χM (X) := fi ,
i=1
4.7. FORMA DE FROBENIUS Y FACTORES INVARIANTES 249

donde χM (X) = det(XIdn − M ) es el polinomio caracterı́stico de M.


Demostración. Esencialmente se ha visto en la demostración predente que hay un iso-
morfismo
Yr
θ: K[X]/(fi (X)) −→ V,
i=1
que es isomorfismo de K[X]−módulos y de K−espacios vectoriales.
Para concluir, consideremos el siguiente diagrama conmutativo
Qr θ
i=1 K[X]/(fi (X)) V

ηX ϕ

Qr θ
i=1 K[X]/(fi (X)) V

Para verificar que es un diagrama conmutativo basta con recordar (una vez más) la operación
·K[X] que ϕ induce sobre V . Ahora consideremos en la columna izquierda la base Θ de
Qr
i=1 K[X]/(fi (X)) en la que la matriz de ηX sea la suma diagonal de matrices compañeras de-
scrita en la identidad (4.7.6) anterior. Entonces, trasladando la base Θ a través del isomorfismo
θ a una base β := θ(Θ) de V tendremos una base de V en la que la matriz de ϕ es precisamente
la matriz M (ϕ) de la identidad (4.7.6) anterior. Y, por tanto, toda matriz admite forma de
Frobenius.
El lo que respecta al polinomio fr , retomemos la Proposición 4.7.2 precedente. Observa-
mos que el anulador de una matriz depende solamente de su clase de semejanza. Es decir,
si M, M 0 ∈ Mn (K) son dos matrices semejantes, entonces
AnnK[X] (M ) = {m ∈ K[X] : m(M ) = 0} = {m ∈ K[X] : m(M 0 ) = 0} = AnnK[X] (M 0 ).
Y el polinomio mı́nimo de una matriz es, precisamente, el generador de AnnK[X] (M ). Supong-
amos, como en el enunciado que la matriz M es semejante a la suma diagional de matrices
compañeras siguiente:
 
C(f1 ) 0 0 0
 0 C(f2 ) 0 0 
FM :=  . ..  ,
 
. .
 .. .. .. . 
0 0 0 C(fr )
de la identidad (4.7.6) precedente, con fi | fi+1 . Consideremos un polinomio m ∈ K[X] y
tendremos:  
m(C(f1 )) 0 0 0
 0 m(C(f2 )) 0 0 
m(FM ) =  .
 
.. .. . .. .
..
 . . 
0 0 0 m(C(fr ))
Por tanto, m(FM ) = 0 si y solamente si
m(C(fi )) = 0, ∀i, 1 ≤ i ≤ r.
Pero el Corolario 4.7.4 nos indica que los polinomios mı́nimos de las matrices compañeras C)fi )
son precisamente los polinomios fi ∈ K[X]. Por tanto, concluimos que para cada polinomio
m ∈ K[X] se tiene:
m(M ) = 0 ⇔ m(FM ) = 0 ⇔ fi | m, ∀i, 1 ≤ i ≤ r.
Como fi | fi+1 para cada i se tiene:
fi | m, ∀i, 1 ≤ i ≤ r ⇐⇒ fr | m.
250 4. PRIMOS, MAXIMALES. MÓDULOS LIBRES. FORMA NORMAL DE SMITH

En conclusión fr es el generador de AnnK[X] (M ) y es, por tanto, el polinomio mı́nimo mM de M .

En lo que respecta al polinomio caracterı́stico, recordemos que también es un invariante de la


clase de semejanza. Además, tenemos la identidad
 
XIdn1 − C(f1 ) 0 0 0
 0 XId n 2 − C(f 2 ) 0 0 
XIdn − FM =  ,
 
.. .. .. ..
 . . . . 
0 0 0 XIdn2 − C(fr )
donde ni = deg(fi ). Como el determinante multiplica los determinantes de los bloques de
matrices, concluiremos
r
Y r
Y
χM (X) = χFM (X) = det(XIdn − FM ) = det(XIdni − C(fi )) = χC(fi ) (C).
i=1 i=1

Por el Corolario 4.7.4 precedente, el polinomio caracterı́stico de C(fi ) es el propio polinomio fi


con lo que habremos concluido:
r
Y
χM (X) = χFM (X) = fi ,
i=1
lo que prueba la última afirmación de enunciado.


Corolario 4.7.10 (Teorema de Hamilton-Cayley). Sea M ∈ Mn (K) una matriz cuadrada,


sean g1 , . . . , gr ∈ K[X] los factores invariantes mónicos y no unidad, dados en orden creciente
de grados, de la matrix XIdn − M ∈ Mn (K[X]), entonces se verifica el Teorema de Hamilton-
Cayley. i.e. χM (M ) = 0.
Demostración. Nótese que si M denota el endomorfismo de K‘n determinado por M ,
la estructura de K[X]−módulo que M induce sobre K n hace que haya un isomorfismo de
K[X]−módulos (y, por ende, de K−espacios vectoriales) de la forma:
r
= K[X]n / Im((XIdx − M ) ∼
Kn ∼
Y
= K[X]/(gi ).
i=1

Como gr es el mı́nimo común múltiplo de g1 , . . . , gr , entonces, el anulador en K[X] del tercer


K[X]−módulo satisface:
Y r
(gr ) := AnnK[X] ( K[X]/(gi )).
i=1
n
Luego gr ∗K[X] v = 0 para cada v ∈ K . Pero esto significa que
0 = gr ∗K[X] v = gr (M )(v), ∀v ∈ V.
Luego gr (M ) = 0 y, como gr es un divisor de χM , entonces χM (M ) = 0 y concluimos una
prueba alternativa del Teorema de Hamilton-Cayley (Teorema 2.3.33 anterior). 

Corolario 4.7.11 (Matrices cuyo polinomio mı́nimo coincide con su caracterı́stico).


Sea K un cuerpo cualquiera, M ∈ Mn (K) la matriz de un endomorfismo ϕ : V −→ V , donde
V es un K−espacio vectorial de dimensión n. Son equivalentes:
i) El polinomio mı́nimo y el polinomio caracterı́stico de ϕ coinciden.
ii) El polinomio mı́nimo y el polinomio caracterı́stico de M coinciden.
iii) La matriz M es semejante a una matriz compañera C(f ) de un polinomio mónico
f ∈ K[X] de grado n.
iv) Existe un polinomio mónico f ∈ K[X] de grado n y un isomorfismo de K−espacios
vectoriales Φ : V −→ K[X]/(f ) tal que el siguiente diagrama es conmutativo:
4.7. FORMA DE FROBENIUS Y FACTORES INVARIANTES 251

Φ
V K[X]/(f )

ϕ ηX

V K[X]/(f )
Φ

Demostración. Por el Teorema de la Existencia de Froma de Frobenius precdente, si M


es una matriz cuyo polinomio caracterı́stico χM coincide con su polinomio mı́nimo mM , la forma
de Frobenius de FM de M debe satisfacer
 
C(f1 ) 0 0 0
 0 C(f2 ) 0 0 
FM :=  . ..  ,
 
. .
 .. .. .. . 
0 0 0 C(fr )
donde
fr = mM ,
Yr
χM (X) = fi .
i=1
Pero ambas propiedades combinadas con χM (X) = mM se satisfacen si y solamente si r = 1,
FM = C(fr ) y tenemos todas de las equivalencias del enunciado en una sola. 

Observación 4.7.12. En otras palabras, el anterior corolario simplemente dice que una matriz
(o un endomorfismo) verifican que su polinomio mı́nimo y su polinomio caracterı́stico coinciden
si y solamente si la matriz (o el endomorfismo) es simplemente la matriz de la homotecia ηX
pero en una base equivocada.

4.7.4. Ejercicios y problemas de la Sección 4.5.


Problema 179. Calcular la forma Normal de Smith de las siguientes matrices sobre Z:
i)  
2 1
5 3
ii)  
2 −1 2
−6 3 6
iii)  
1 0 0
0 2 0
0 0 3
iv)  
9 8 7
6 5 4
3 2 1
Problema 180. Discutir si son compatibles y, en su caso, resolver los siguientes sistemas de
ecuaciones lineales diofánticos:
i) 
 X1 + X2 + 3X3 = 3
X1 + 3X2 + 5X3 = 7
X1 − 2X2 = −3

252 4. PRIMOS, MAXIMALES. MÓDULOS LIBRES. FORMA NORMAL DE SMITH

ii)

4X1 + 2X2 + 6X3 = 0
X1 + 2X2 = 3
iii)

 X1 + 2X2 + X3 + 2X4 = 3
X1 + X3 = 2
3X1 + 3X3 + 4X4 = 2

Problema 181. Prueba que para todo dominio de ideales principales R y para cada número
natural n ∈ N, los submódulos de rango r de Rn coinciden con los conjuntos de soluciones de
sistemas de ecuaciones homogéneos de la forma BX = 0, donde B ∈ M(n−r)×n (R) es una
matriz con n − r filas y n columnas de rango n − r.
Problema 182. Prueba que si M y N son dos R−módulos libres de rango finito, se tiene:
rankR (M ⊕ N ) = rankR (M × N ) = rankR (M ) + rankR (N ).
Prueba que si M es un submódulo de N con las anteriores condiciones, no es cierto que si
rankR (M ) = rankR (N ), entonces M = N .
Problema 183. Reflexionar sobre el significado del Teorema de Estructura para módulos fini-
tamente generados sobre DIP en el caso R = K[X] y M la estructura de K[X]−módulo definida
sobre un espacio vectorial finitamente generado V por un endomorfismo de K−espacios vecto-
riales f : V −→ V . ¿Tiene algo que ver con la forma de Frobenius del endomorfismo?.
Problema 184. Hallar la Forma Normal de Smith sobre Q[X] de la siguiente matriz:
 
X −2 −1 0 0
 0
 X −2 0 0 
 0 0 X −2 0 
0 0 0 X −2
Problema 185. Hacer lo mismo que en el problema anterior para las siguientes matrices:
 
X −2 −1 0 0
 0
 X −2 0 0  
 0 0 X −2 −1 
0 0 0 X −2
 
X −2 −1 0 0
 0
 X −2 −1 0  
 0 0 X −2 −1 
0 0 0 X −2
 
X −2 −1 0 0
 0
 X −2 0 0  
 0 0 X −3 −1 
0 0 0 X −3
 
X −2 0 0 0
 0
 X −2 0 0  
 0 0 X −3 0 
0 0 0 X −3
Problema 186. Considerar el grupo abeliano libre Zn y varios subgrupos que se citan a contin-
uación. Hallar la estructura del subgrupo de los elementos de torsión del grupo cociente Zn /H.
Decidir, en cada caso, si el grupo cociente es completamente de torsión o si su descomposición
posee “parte libre de torsión” (i.e. decidie si T or(Zn /H) = Zn /H en cada caso.
i) Supongamos n = 2 y H1 es el subgrupo de Z2 generado por {(1, 2), (3, 4)}.
ii) Supongamos n = 2 y H2 es el subgrupo de Z2 generado por {(2, 3)}.
iii) Supongamos n = 3 y H3 es el subgrupo de Z2 generado por {(1, 1, 1), (2, 4, 6), (3, 7, 11)}.
4.7. FORMA DE FROBENIUS Y FACTORES INVARIANTES 253

iv) Supongamos n = 3 y H4 es el subgrupo dado como la imagen del morfismo de grupos


siguiente:
A: Z2 −→ Z3
(x, y) 7−→ (2x − 2y, 4x + 2y, 2y).
Observar que, en este caso Z3 /H4 es el Co-núcleo de A.
v) Supongamos n = 3 y H5 es el subgrupo dado como la imagen del morfismo de grupos
siguiente:
A: Z3 −→ Z3
(x, y, z) 7−→ (x + 2y + 3z, x + 4y + 7z, x + 6y + 11z).
Observar que, en este caso Z3 /H5 es el Co-núcleo de B.
Problema 187 (Retı́culos). Sea denomina retı́culo de dimensión n en Rn al Z−módulo libre
generado por una base de Rn . Se denota mediante Λ(β) := Zh{v1 , . . . , vn }i al retı́culo generado
en Rn por la base β := {v1 , . . . , vn }. Se llama paralelepı́pedo fundamental de un retı́culo Λ(β)
al polı́topo determinado por los puntos v1 , . . . , vn ∈ Rn y el origen. Es decir, el conjunto
X n
P(β) := { ti vi : ti ∈ [0, 1], }.
i=1
Se llama volumen de un retı́culo Λ(β) al volumen de su paralelepı́pedo fundamental.
i) Sea Λ(β) un retı́culo con paralelepı́pedo fundamental P(β). Sea M la matriz cuyas
columnas están formadas por las coordenadas de los vectores de la base β. Probar que
se satisface: p
vol(Λ(β)) =| det(M ) |= det(M t M ).
ii) Sean Λ un retı́culo y P ∈ GL(n, Z) una matriz inversible sobre Z. Pruébse que el
conjunto P Λ siguiente es también un retı́culo:
P Λ := {w ∈ Rn : ∃v ∈ Λ, wt = P v t }.
Pruébese también que vol(Λ) = vol(P Λ) para calquier P ∈ GL(n, Z).
iii) Sean Λ ⊆ Λ0 dos retı́culos, siendo Λ un submódulo de Λ0 del mismo rango (y, por
tanto, libre). Probar que vol(Λ) ≥ vol(Λ0 ).
iv) Con las condiciones anteriores, pruébese que el Z−módulo cociente Λ0 /Λ es un grupo
abeliano finito y que su orden satisface:
vol(Λ)
] (Λ0 /Λ) = .
vol(Λ0 )
v) Busca en internet el enunciado del Teorema del Cuerpo Convexo de Minkowski. Busca
también una demostración y trata de entenderla. Explica su significado.
vi) Sea K ⊆ Rn un cerrado convexo y acotado y sea Λ ⊆ Rn un retı́culo. Trata de estabecer
una relación entre el volumen de K, el volumen del paralelepı́pedo fundamental de Λ y
el número de puntos de la intersección de K con Λ. Diseña un algoritmo que aproxime
el volumen de un conjunto convexo mediante el número de puntos ](Λ ∩ K).
Problema 188. Sean a1 , . . . , as ∈ Z números enteros dados y sea h su máximo común divisor.
Consideremos la ecuación diofánticas:
(4.7.7) a1 X1 + · · · + as Xs = h.
Consideremos el conjunto de las soluciones (x1 , . . . , xs ) ∈ Zs de este sistema y lo denotamos
por S. Hay que probar que
S = (x1 , . . . , xs ) + Syz(a1 , . . . , as ),
donde (x1 , . . . , xs ) es una solución de la ecuación (4.7.7) y Syz(a1 , . . . , as ) es el Z−módulo de
las Syzygı́as de Hilbert de la lista (a1 , . . . , as ) ∈ Zs dado mediante:
s
X
Syz(a1 , . . . , as ) = {(y1 , . . . , ys ) ∈ Zs : yi ai = 0}.
i=1
Pruébese también que Syz(a1 , . . . , as ) es un Z−módulo libre de rango acotado por s. Con-
strúyase un algoritmo tal que dada una ecuación como (4.7.7), el algoritmo devuelve todas sus
soluciones (o, al menos, una descripción explı́tica de las mismas).
254 4. PRIMOS, MAXIMALES. MÓDULOS LIBRES. FORMA NORMAL DE SMITH

Problema 189 (Hilbert’s Tenth Problem). Busca en Wikipedia información sobre el Prob-
lema X de Hilbert. Escribe su enunciado. Escribe también el enunciado del Teorema de
Matjasevich (cf. [Matj, 1970]), fuertemente basados en los trabajos de Julia Robinson (cf.
[Rob, 1950], [Rob, 52]), aunque algunos historiadores añaden el nombre de M. Davis (cf.
[Dav, 49]) y el nombre de Hilary W. Putnam. Dicho enunciado afirma que no existe algo-
ritmo que decida si una ecuación polinomial con coefcientes enteros posee una solcuión entera.
Usando este resultado, prueba el siguiente:
“ No existe ningún algoritmo que resuelva el siguiente problema:
Dada una familia de polinomios de grado a lo sumo 2, cada uno de los cuales sólo depende de, a
lo sumo, tres variables, f1 , . . . , fs ∈ Z[X1 , . . . , Xn ], decide si existe una solución x ∈ Zn común
a todos ellos”.
Concluye que, en lo concerniente a la decisión de la existencia de solcuiones diofánticas para
ecuaciones polinomiales de grado 2 o superior, no es posible obtener algoritmos. ( Hint: Prueba
que toda ecuación polinomial con coeficientes enteros, se puede escribir como varias ecuaciones
polinomiales de grado 2 con coeficientes enteros, cada una de las cuales involucra a lo sumo
tres variables).
4.7.4.1. Ecuaciones Diferenciales Ordinarias Homogéneas. En este bloque de prob-
lemas, consideraremos dos maneras de presentar ecuaciones diferenciales ordinarias homogéneas
con coeficientes constantes, para un valor inicial dado. De una parte, una sola ecuación difer-
encial de orden n y de la otra un sistema de ecuaciones diferenciales lineales con coeficientes
constantes.
i) Una sola ecuación diferencial de orden n: Esto es, se considera una ecuación diferencial
ordinaria lineal y homogénea con coeficientes constantes. Es decir, consideramos una
ecuación diferencial de la forma:
(4.7.8) a0 f + a1 f 0 + · · · + an−1 f (n−1) + f (n) = 0.
donde a0 , . . . , an−1 ∈ R. Con las condiciones iniciales en un punto x0 ∈ R dadas
mediante:
f (x0 ) = v0 , f 0 (x0 ) = v1 , . . . , f (n) (x0 ) = vm .
ii) Un sistema de ecuaciones diferenciales homogéneo con coeficientes constantes: En
este caso se trata de considerar una matriz A ∈ Mn (R), un vector (expresado como
columna) b ∈ Rn y una sucesicón de n funciones {X1 (t), . . . , Xn (t)} que son las
incógnitas a resolver. Denotaremos por Ẋ al vector de las derivadas de las funciones
y por X al vector de las funciones a encontrar. Es decir,
 0   
X1 (t) X1 (t)
 X20 (t)   X2 (t) 
Ẋ :=  .  , X :=  .  .
   
 ..   .. 
Xn0 (t) Xn (t)
Se considera el siguiente sistema de ecuaciones diferenciales lineales homogéneas con
coeficientes constantes:
(4.7.9) Ẋ = AX,
con la condición inicial
X(x0 ) = b ∈ Rn .
Problema 190. Pruébese los siguiente:
i) Las ecuaciones diferenciales ordinarias del tipo descrito en la ecuación (4.7.8) son un
caso particular de los sistema de ecuaciones del tipo descrito en la ecuación (4.7.9).
Hint: Introduce variables para las funciones, usando X1 := f, X1 := f 0 , . . . , Xn :=
f (n−1) , Xn+1 := f (n) . ¿Qué tipo de matriz aparece como matriz de coeficientes?.
ii) Toda ecuación dferencial lineal homogénea con coeficientes constantes del tipo descrito
en la ecuación (4.7.9) se puede transformar, salvo un cambio lineal de coordenadas,
P ∈ GL(n, R) en una suma diagonal de ecuaciones diferenciales lineales del tipo de-
scrito en (4.7.8). Hint: Úsese la forma de Frobenius de la matriz A de coeficientes.
4.7. FORMA DE FROBENIUS Y FACTORES INVARIANTES 255

Ası́, el sistema (4.7.9) se transforma en un sistema de la forma:


 
C(p1 ) 0 ··· 0
 0 C(p2 ) · · · 0 
 −1
Ẋ = P  .  P X,

. . .
 . . 0 
0 0 ··· C(pr )
donde p1 , . . . , pr ∈ R[X] son polinomios mónicos, las matrices C(pi ) son las matrices
compañeras de esos polinomios y
Yr
pi (X) = χA (X),
i=1
es el polinomio caracterı́stico de A. Haciendo el cambio de “variables”
Y := P −1 X,
se obtienen las ecuaciones del tipo (4.7.8) indicadas.
CAPı́TULO 5

El Teorema Chino de los Restos (Opcional)


(..nanos gigantum humeris insidentes)

“..What Descartes did was a good step.


You have added much several ways, and
especially in taking the colours of thin
plates into philosophical consideration. If
I have seen a little further it is by
standing on the shoulders of Giants”.
I. Newton, 1676

Índice
5.1. Introducción 257
5.2. El anillo producto y el Teorema Chino de los Restos 258
5.3. El Teorema Chino de los Restos en el caso R = Z 260
5.3.1. En relación con el problema de Sun Tzu. 261
5.3.2. En computación: cálculo del determinante por algoritmos modulares. 262
5.3.2.1. La Búsqueda de un Buen Número Primo. 265
5.3.2.2. Tests de Primalidad. 265
5.3.2.3. Combinando el Teorema de Densidad y los Tests de Primalidad. 266
5.3.2.4. La Estrategia Final. 267
5.3.3. Secretos compartidos. 268
5.3.4. Grupos abelianos finitamente generados: estructura, divisores elementales. 269
5.3.5. Ejercicios y problemas de la Sección 5.3 271
5.3.5.1. El Test de G. Miller y M.O. Rabin 272
5.4. El Teorema Chino de los Restos en el caso R := K[X]: Forma de
Jordan. 275
5.4.1. La forma canónica de Jordan: divisores elementales en K[X]. 275
5.4.2. Teorı́a del endomorfismo y el máximo común divisor en K[X]. 278
Otra demostación (más explı́cita) de la correctitud del algoritmo. 283
5.4.3. Ejercicios y problemas de la Sección 5.4 287
5.4.3.1. El algoritmo de Csanky-Leverrier-Fadeev-Souriau. 289

5.1. Introducción
En esta Sección recordaremos el teorema Chino de los Restos y algunas de sus aplicaciones más
notables. Aunque se desconoce su origen preciso, las fuentes más clásicas apuntan al texto Sun
Zi suan-ching (traducido, malamente, como “Las Matemáticas Clásicas de Sun Zi”), publicado
en el tercer siglo antes de Cristo por Sun Tzu. Reaparece, con otros resultados interesantes
como el método de Newton, en 1274 en un texto de Qin Jiushao titulado Shushu Chiu-zhang.
El Problema que trata es el siguiente:
Problema Clásico 5.1.1. ¿Cuál es el número entero más pequeño tal que
f ≡ 2 mod 11, f ≡ 3 mod 5, f ≡ 2 mod 7?.
En todo caso, sigue este Capı́tulo formando parte del conjunto de requisitos aunque, aderezado
de forma conveniente, puede permitir revisar otros requisitos (fundamentalmente la Forma
Canónica de C. Jordan o la Clasificación de Grupos Abelianos finitamente generados) y algunas
aplicaciones de la misma. Como “novedad”, se expone un algoritmo de cálculo del máximo
común divisor en K[X], usando Álgebra Lineal en dimensión mı́nima (lo que es un preludio
257
258 5. TEOREMA CHINO DE LOS RESTOS

a los algoritmos de la Escuela TERA-Kronecker). EL aderezo vuelve a ser el de un curso de


Álgebra Conmutativa por la terminologı́a usada.

5.2. El anillo producto y el Teorema Chino de los Restos


Proposición 5.2.1 (Anillo Producto). Sean {Ri : 1 ≤ i ≤ r} una colección finita de
anillos. Definamos las operaciones siguientes:
Qr Qr Qr
+: ( i=1 Ri ) × ( i=1 Ri ) −→ ( i=1 Ri )
(5.2.1)
((x1 , . . . , xr ), (y1 , . . . , yr )) 7−→ (x1 + y1 , . . . , xr + yr ),
y
Qr Qr Qr
·: ( i=1 Ri ) × ( i=1 Ri ) −→ ( i=1 Ri )
(5.2.2)
((x1 , . . . , xr ), (y1 , . . . , yr )) 7−→ (x1 y1 , . . . , xr yr ).
Se verifican las propiedades siguientes:
Qr
i) El conjunto ( i=1 Ri , +, ·) es un anillo Q conmutativo con unidad. El elemento neutro
r
para la suma es el elementoQ(0, . . . , 0) ∈ i=1 Ri y el elemento neutro para el producto
r
es el elemento (1, . . . , 1) ∈ i=1 Ri .
ii) Cualquiere
Qr elemento de la forma (x1 , . . . , xr ) con algún xi = 0, es un divisor de cero
de i=1 Ri .
Qr
Al anillo i=1 Ri se le denomina anillo producto de los anillos en la familia {Ri : i ∈ I}.
Qr
Demostración. Para comprobar que ( i=1 Ri , +, ·) es un anillo conmutativo con Qr unidad,
recuérdese el producto de grupos abelianos, lo que nos daráQla condición de grupo en ( i=1 Ri , +)
r
y el elemento neutro para la suma dado por (0, . . . , 0) ∈ i=1 Ri . Verificar que es anillo con la
operación producto es mera comprobación de las propiedades a partir de las que verifica cada
uno de los Ri . La otra propiedad señalada es obvia. 
Definición 72 (Ideales co-maximales). Dos ideales a y b de un anillo R se denominan
co-maximales si a + b = R.
Algunos autores prefieren el término “co-primo” en lugar de co-maximales, es una cuestión de
gusto. Aquı́ elegiremos el término co-maximal como queda dicho.
Teorema 5.2.2 (Teorema Chino de los Restos). Sea {ai : 1 ≤ i ≤ n} un conjunto finito
de ideales en un anillo R. Supongamos que son dos a dos co-maximales (i.e. ai + aj = R,
∀i 6= j) y consideremos el morfismo de anillos:
Qn
Φ : R −→ i=1 (R/ai )
(5.2.3)
a 7−→ (a + a1 , a + a2 , . . . , a + an ).
Se tiene:
i) Φ es un epimorfismo de anillos.
ii) El núcleo verifica:
n
Y
ker(Φ) = ∩ni=1 ai = ai .
i=1
iii) φ induce un isomorfismo de anillos:
Qn
Φ
e: R/ (∩ni=1 ai ) −→ i=1 (R/ai )
(5.2.4)
x + (∩ni=1 ai ) 7−→ (x + a1 , x + a2 , . . . , x + an ).
Demostración. Comencemos observando que Φ está bien definida dado que es la com-
posición de los dos morfismos de anillo siguientes:
Qn
i : R −→ Rn := i=1 R
(5.2.5)
x 7−→ (x, x, . . . , x).
y
Qn n
Qn
(5.2.6) i=1 πi : R −→ i=1 (R/ai ) ,
donde πi : R −→ R/ai es la proyección canónica. A partir de aquı́, probemos las propiedades
descritas.
5.2. EL ANILLO PRODUCTO Y EL TEOREMA CHINO DE LOS RESTOS 259

Comencemos considerando
Qn unos elementos especiales. Para cada i ∈ {1, . . . , n}, consideremos
el elemento ei ∈ i=1 (R/ai ) dado mediante:
n
Y
ei := (εi,1 + a1 , εi,2 + a2 , . . . , εi,n + an ) ∈ (R/ai ) ,
i=1

donde 
1, si i = j
εi,j :=
0, en caso contrario
Nótese que ei es el elemento que “tiene un 0 en todos los lugares, excepto en el lugarQ i en el que
n
tiene un 1”. Consideremos ahora un elemento cualquiera ζ := (x1 +a1 , . . . , xn +an ) ∈ i=1 R/ai .
Se tiene la siguiente identidad:
n
X
(5.2.7) ζ := Φ(xi )ei .
i=1

Por tanto, probar que Φ es suprayectiva se reduce a probar que {e1 , . . . , en } ⊆ Im(Φ). Por
simplicidad de la expresión de la prueba, probemos que e1 ∈ Im(Φ) y, análogamente, se hará
para todos los otros elementos.
dado que a1 y ai son co-maximales para todo i 6= 1, 1 ≤ i ≤ n, podemos suponer que existen
xi ∈ a1 e yi ∈ ai tales que xi + yi = 1 en R. Definamos el elemento
n
Y n
Y
(5.2.8) z1 := yi = (1 − xi ).
i=2 i=2

Entonces, se tiene Φ(z1 ) = e1 . Para comprobarlo, recordemos que:


Φ(z1 ) := (z1 + a1 , z2 + a2 , . . . , z1 + an ).
Qn
• Como yj ∈Qaj , para todo j ≥ 2, entonces i=2 yi ∈ aj , para todos j ≥ 2 y, por tanto,
n
z1 + aj = i=2 yi + aj = 0 + aj , para todo Qn j ≥ 2. Qn
• De otro
Pn lado, desarrollando el producto i=2 (1−xi ) obtendremos z1 = i=2 (1−xi ) =
1 + i=2 xi hi (x2 , . . . , xn ), donde
n
Y
hi (x2 , . . . , xn ) = − (1 − xj ),
j=i+1

para 2 ≤ i ≤ n − 1 y hn = −1. En particular, hi (x2 , . . . , xn ) ∈ R. Para cada i,


2≤i≤ Pn, xi ∈ a1 , por tanto, xi hi (x2 , . . . , xn ) ∈ a1 , para cada i, 2 ≤ i ≤ n y, por
n
tanto, i=2 xi hi (x2 , . . . , xn ) ∈ a1 . Hemos concluido que z1 = 1 + h, con h ∈ a1 y,
finalmente, z1 + a1 = 1 + a1 .
Juntando estas afirmaciones, tendremos:
Φ(z1 ) := (1 + a1 , 0 + a2 , . . . , 0 + an ) = e1 ,
y queda probada la suprayectividad.

En cuanto al núcleo de Φ, es claro que dicho núcleo coincide con ∩ni=1 ai . Sin embargo, el
enunciado dice algo más. Dice que, en el caso de que los ideales sean co-maximales dos a dos,
entonces la intersección y el producto coinciden, es decir
n
Y n
\
ai = ai .
i=1 i=1
Qn Tn
Hay un contenido claro por las definiciones de los propios ideales i=1 ai ⊆ i=1 ai , luego sólo
queda por probar el recı́proco. Hagamos la prueba por inducción. Comencemos en el caso
n = 2. En ese caso, por ser a1 y a2 co-maximales, tendremos a1 + a2 = R y han de existir
x1 ∈ a1 y x2 ∈ a2 tales que x1 + x2 = 1. Sea ahora x ∈ a1 ∩ a2 .
• Como x ∈ a2 (por estar en a1 ∩ a2 ) y x1 ∈ a1 , entonces xx1 ∈ a1 a2 ,
• Recı́procamente, como x ∈ a1 (por estar en a1 ∩ a2 ) y x2 ∈ a2 , entonces xx2 ∈ a1 a2 .
260 5. TEOREMA CHINO DE LOS RESTOS

En conclusión, xx1 , xx2 ∈ a1 a2 , luego


x = x · 1 = x(x1 + x2 ) = xx1 + xx2 ∈ a1 a2 ,
y queda probado el caso n = 2. Para el caso n, vamos a reproducir el argumento del modo
siguiente:
Se tiene que si aQi , 1 ≤ i ≤ n es una familia de ideales dos a dos co-maximales, entonces, los
ideales ai y bi := j6=i aj son co-maximales también (i.e. ai + bi = R). Para probarlo, haremos
solamente el caso i = 1 y el resto de los casos es análogo. Dado que a1 y ai son co-maximales,
han de existir xi ∈ a1 e yi ∈ ai , i ≥ 2, tales que
xi + yi = 1.
Qn Qn
Consideremos ahora el elementos z1 := i=2 yi ∈ b1 = i=2 ai . De otro lado, como el la prueba
del epimorfismo, tendremos que
n
Y Xn
z1 = (1 − xi ) = 1 + xi hi (x2 , . . . , xn ) = 1 + h,
i=2 i=2
donde h ∈ a1 . Concluiremos ası́ que
1 = (−h) + z1 ,
siendo −h ∈ a1 y z1 ∈ b1 . Por tanto, a1 y b1 son co-maximales y, por el caso n = 2, tendremos
\
a1 b1 = a1 b1 .
Ahora aplicamos la hipótesis inductiva y concluimos
Yn \n
b1 = ai = ai ,
i=2 i=2

lo que, juntado con la igualdad inmediatamente anterior, implica la afirmación descrita en ii).
La afirmación iii) del enunciado es evidente a partir del primer Teorema de Isomorfı́a y de las
afirmaciones i) y ii). 

5.3. El Teorema Chino de los Restos en el caso R = Z


Utilizaremos los muchos resultados ya descritos sobre las propiedades básicas del anillo Z como
el Teorema 2.2.18, que nos indicaba que Z es un dominio de ideales principales, o la Identidad
de Bézout con cotas (ver Corolario 3.4.7). Seguidamente recordemos en el caso de dominios
de ideales principales, y en el caso de Z en particular, los significados de los ideales, suma,
producto e intersección.
Proposición 5.3.1. Dados n1 , . . . , nr ∈ Z números enteros y sean ai = (ni ) los ideales en Z
que generan. Entonces, se tienen las siguientes propiedades:
Pn
i) El ideal suma i=1 ai es el ideal generado por el máximo común divisor m := gcd(n1 , . . . , nr ).

ii) El ideal intersección a := ∩ni=1 ai es el ideal generado por el mı́nimo común múltiplo
m := mcm(n1 , . . . , nr ).
Qr
iii) El ideal producto b := i=1 ai es el ideal (N ), generado por el producto
r
Y
N := ni .
i=1

Finalmente, si gcd(ni , nj ) = 1 para todo i 6= j, entonces el mı́nimo común múltiplo m coincide


con N , esto es, en el caso de ser dos a dos co-maximales, se tiene:
r
Y
mcm(n1 , . . . , nr ) = ni .
i=1

Demostración. Ya se ha insistido abundantemente en la propiedad i), por lo que no insi-


stiremos en ello. El mı́nimo común múltiplo de varios números enteros se define, precisamente,
como el generador de la intersección de ideales. Recordémoslo: m = mcm(n1 , . . . , nr ) si y
solamente si se verifica:
5.3. EL TEOREMA CHINO DE LOS RESTOS EN EL CASO R = Z 261

• ni | m, para cada i, 1 ≤ i ≤ r.
• m es mı́nimo con esa propiedad.
Ahora nótese que la primera condición significa m ∈ (ni ) para cada i, 1 ≤ i ≤ r. Por tanto,
la primera condición significa m ∈ ∩ri=1 (ni ) y, por tanto, significa también (m) ⊆ ∩ri=1 ai . En
cuanto a la condición de minimalidad, recordemos el Teorema 2.2.18, en el cual se afirma que
el elemento no nulo de valor absoluto (resp. grado) mı́nimo en un ideal es el generador en
Z (resp. K[X]). Podemos ası́ concluir que si m es el mı́nimo con esa propiedad, entonces,
(m) = ∩ri=1 (ni ). Qr
De otro lado, por la definición del ideal producto, el ideal i=1 (ni ) es el ideal generado por los
productos de los generadores y, por tanto, el ideal generado por N .
La última de las afirmaciones es consecuencia inmediata del apartado ii) del Teorema Chino
de los Restos.
Qr Efectivamente, si ni es una familia cuyos elementos son dos a dos co-maximales,
los ideales i=1 (ni ) y ∩ri=1 (ni ) han de coincidir y, por tanto, sus generadores son iguales (salvo
unidad en Z) por lo que podemos concluir que
r
Y
mcm(n1 , . . . , nr ) = ni ,
i=1

como se pretendı́a. 

El Teorema Chino de los Restos sobre Z se convierte en el enunciado siguiente:


Teorema 5.3.2 (Teorema Chino de los Restos en Z). Sean dados n Q1r, . . . , nr números
enteros positivos de tal modo que gcd(ni , nj ) = 1 para todo i 6= j. Sea N := i=1 ni . Entonces,
la siguiente aplicación es un isomorfismo de anillos:
e : Z/ (N ) −→ Qr
Φ i=1 (Z/(ni ))
(5.3.1)
x + (N ) 7−→ (x + (n1 ), x + (n2 ), . . . , x + (nr )).
Demostración. Es una trasliteración del Teorema Chino de los Restos anterior. 

5.3.1. En relación con el problema de Sun Tzu. Retomemos el enunciado:


Cuál es el número entero más pequeño tal que
f ≡ 2 mod 11, f ≡ 3 mod 5, f ≡ 2 mod 7?.
Nótese que 11, 5 y 7 son primos y, por tanto, co-maximales. Ahora se trata de hallar, conforme
a las ecuaciones (5.2.7) y (5.2.8) anteriores la siguiente información:
i) En primer lugar N := 7 · 5 · 11 = 385.
ii) En segundo lugar, los elementos z1 , z2 , z3 ∈ Z tales que (como en la prueba del Teorema
Chino de los Restos) se verifique:
Φ(z1 ) = e1 = (1 + (11), 0 + (5), 0 + (7)), Φ(z2 ) = e2 = (0 + (11), 1 + (5), 0 + (7)),
y
Φ(z3 ) = (0 + (11), 0 + (5), 1 + (7)).
Para ello, obsérvese (via la identidad de Bézout) que se tiene:
11 + (−2)5 = 1, (−2)7 + 3 · 5 = 1, 2 · 11 + (−3) · 7 = 1.
• Para z1 : elijamos x2 , x3 , y2 , y3 tales que x2 , x3 ∈ (11), y2 ∈ (5), y3 ∈ (7) y
x2 + y2 = 1, x3 + y3 = 1.
Es decir, x2 = 11, x3 = 2 · 11 = 22, y2 = (−2)5 = −10, y3 = (−3) · 7 = −21 y
Q3
definamos z1 := i=2 yi = (−10)(−21) = 210.
• Para z2 : elijamos x01 , x03 , y10 , y30 tales que x01 , x03 ∈ (5), y10 ∈ (11), y30 ∈ (7) y
x01 + y10 = 1, x03 + y30 = 1.
Es decir, x01 = (−2)5 = −10, x03 = 3 · 5 = 15, y10 = 11, y30 = (−2)7 = −14 y
definamos z2 := y10 y30 = 11(−14) = −154.
262 5. TEOREMA CHINO DE LOS RESTOS

• Para z3 : elijamos x001 , x002 , y100 , y200 tales que x001 , x002 ∈ (7), y100 ∈ (11), y200 ∈ (5) y
x001 + y100 = 1, x002 + y200 = 1.
Es decir, x001 = (−3)·7 = −21, x002 = (−2)7 = −14, y100 = 2·11 = 22, y200 = 3·5 = 15
y definamos z3 := y100 y200 = 15 · 22 = 330.
Para mayor simplicidad podemos hacerlos todos positivos, reduciendo módulo N y
eligiendo:
z1 = 210, z2 = 231, z3 = 330.
iii) Con estos tres elementos y la fórmula (5.2.7) podemos hallar, dados x1 , x2 , x3 un
número x ∈ Z tal que
x mod (11) = x1 mod (11), x mod (5) = x2 mod (5), x mod (7) = x3 mod (7).
De hecho, tenemos que el número x1 z1 + x2 z2 + x3 z3 verificará:
Φ(x1 z1 + x2 z2 + x3 z3 ) = Φ(x1 )Φ(z1 ) + Φ(x2 )Φ(z2 ) + Φ(x3 )Φ(z3 ),
lo que es una formulación equivalente.
iv) Con los datos del enunciado del texto de Sun Tzu, tendemos que
z := 2 · 210 + 3 · 231 + 2 · 330 mod 385 = 233,
satisface los requerimientos (si no se ha traspapelado algún error de cálculo por en
medio).
5.3.2. En computación: cálculo del determinante por algoritmos modulares.
Una de las aplicaciones más importantes del Teorema Chino de los Restos sobre Z son los
algoritmos modulares, usados en la programación de paquetes de software simbólico comerciales
como Maple, Mathematica y otros. Aquı́ ejemplificamos esta estrategia con el ejemplo del
cálculo del determinante de una matriz A ∈ Mn (Z) con coordenadas enteras. El asunto es el
siguiente:
En el algoritmo de Gauss clásico, aprendido en las asignaturas básicas de Álgebra Lineal, se
produce un fenómeno singular con la concatenación de elecciones de pivotes. Si supongo que
todas las coordenadas de la matriz A = (ai,j )1≤i,j≤n original, verifican |ai,j | ≤ H, tras haber
elegido k pivotes, el tamaño de los números enteros que aparecen en la matriz es del orden
k
H 2 . Esto significa, por ejemplo, que para matrices de tamaño 200 × 200 no existen suficientes
electrones en el Universo para almacenar los dı́gitos de uno de esos números enteros a razón de
un dı́gito por electrón. Ni que decir tiene de la imposibilidad de manejar matrices razonables
en la práctica con tamaños del orden 1000 × 1000.
La conclusión es que el método de Gauss, tal y como se enseña, no sirve. Surgen ası́ diversas
alternativas. Algunas hacen modificaciones del algoritmo de Gauss (con búsquedas de otros
pivotes y otras operaciones, reduciendo a cada paso), otros se centran en algoritmos bien par-
alelizables (que evitan el crecimiento de los resultados intermedios a través de estructurar las
operaciones a realizar mediante grafos bien paralelizables). Una vı́a más son los Algoritmos
Modulares que vamos a describir, basándonos en el TCR anterior.
Comencemos recordando los rudimentos del Teorema de Gram-Schmidt.
Observación 5.3.3. Aunque parece que el método de cálculo de bases ortogonales ya era
conocido por Laplace y habı́a sido usado por Cauchy en 1836, se asigna este método a Jorgen
P. Gram y Erhardt Schmidt. El trabajo de E. Schmidt donde introdujo formalmente su método
de ortogonalización es [Schm, 1907]. Los trabajos de Gram (un matemático “amateur” danés)
son más difı́ciles de rastrear para mı́ y no he sido capaz de saber con certeza dónde publicó sus
resultados.
Algoritmo 5.3.4 (Gram -Schmidt). Sea v1 , . . . , vn una base ordenada de Rn . Definamos la
secuencia de vectores v1∗ , . . . , vn∗ siguiente:
v1∗ := v1
hv2 ,v1∗ i
v2∗ := v2 − µ2,1 v1∗ , µ2,1 = hv1∗ ,v1∗ i
(5.3.2) ..
.
Pi−1 hvi ,vj∗ i
vi∗ := vi − j=1 µi,j vj∗ , µi,j := hvj∗ ,vj∗ i
5.3. EL TEOREMA CHINO DE LOS RESTOS EN EL CASO R = Z 263

Teorema 5.3.5 (Teorema de Gram-Scmidt). En las notaciones anteriores, v1 , . . . , vn una


base de Rn . Sean v1∗ , . . . , vn∗ los vectores obtenidos tras aplicar Gram-Schmidt a esta base.
Entonces,
i) ||vi∗ || ≤ ||vi ||,
ii) hvi∗ , vj∗ i = 0, para todo i 6= j.
Demostración. Son meras comprobaciones, la segunda propiedad implicando la primera.

Continuaremos con un clásico, conocido como Desigualdad de Hadamard.
Proposición 5.3.6 (Desigualdad de Hadamard). Sea A ∈ Mn (C) una matriz con coorde-
nadas complejas. Sean v1 , . . . , vn ∈ Cn los vectores dados por sus columnas. Entonces,
n
Y
| det(A)| ≤ ||vi ||2 ,
i=

donde || · ||2 denota la norma hermı́tica usual en Cn .


Demostración. Para demostrar el resultado utilizaremos la ortogonalización de Gram-
Schmidt. Dicho procedimiento establece que si A es la matriz dada, existe una matriz triangular
superior, con solo 1’s en la diagonal principal P tal que
P A = A1 ,
donde los vectores dados como las columnas de A1 son precisamente la base ortogonal, asociada
a los vectores columna de A :
{v1∗ , . . . , vn∗ }.
Ahora consideramos la matriz de Wishart de A:
W (A) := A∗ A,
donde A∗ es la traspuesta conjugada. Adicionalmente, se tiene :
| det(A)|2 = det(W (A)) = det(AA∗ ).
Además,
hv1∗ , v1∗ i · · · hv1∗ , vn∗ i
 

det(A1 A∗1 ) = det  .. .. ..


.
 
. . .
∗ ∗ ∗ ∗
hvn , v1 i · · · hvn , vn i
Como hvi∗ , vj∗ i = 0 para i 6= j, tendremos
n
Y
| det(A1 )|2 = ||vi∗ ||2 .
i=1
Finalmente, usando la Proposición anterior,
n
Y n
Y
| det(A)|2 = | det(A1 )|2 = ||vi∗ ||2 ≤ ||vi ||2 .
i=1 i=1

Corolario 5.3.7. Sea A = (ai,j )1≤i,j≤n ∈ Mn (Z) una matriz con coordenadas enteras y
supongamos |ai,j | ≤ H. Entonces,
| det(A)| ≤ nn/2 H n .
Demostración. Baste con observar que si vi es la fila i−ésima de A, entonces
 
Xn
||vi ||22 =  |ai,j |2  ≤ nH 2 ,
j=1

con lo cual √
||vi ||2 ≤ nH,
y se sigue obviamente la desigualdad. 
264 5. TEOREMA CHINO DE LOS RESTOS

Definamos la siguiente transformación sobre las clases de restos módulo un entero M ∈ N,


M ≥ 2. Dado b ∈ {0, . . . , M − 1}, sea :
si 0 ≤ x ≤ b M

eb := b 2 c
b − M si b M
2 c < x ≤ M −1
Lema 5.3.8 (Lehmer). Con las notaciones precedentes, sean x ∈ Z y M ∈ N, M ≥ 2 tales que
2|x| ≤ M − 1. Sea a ∈ {0, . . . , M − 1} el resto de la división de x por M , i.e.
a := x mod M.
Entonces,
a = x.
e
Demostración. Es una mera comprobación a partir de las definiciones. La incluyo por
completitud. Dado x ∈ Z, con 2|x| ≤ M − 1, si x ≥ 0, tendremos
M −1 M
0≤x≤ < ,
2 2
luego a = x ∈ {0, 1, . . . , M − 1} y a ≤ b M
2 c, luego e
a = x, como se indica.
Supongamos que, por el contrario, x < 0. Tendremos que, tras la división euclı́dea, se dará la
siguiente igualdad con q ∈ Z: x = qM + a. Como a ≥ 0 y x < 0 se tendrá, necesariamente, que
q ≤ 0. De otro lado, 2|x| ≤ M − 1, implica que |x| = −x ≤ M2−1 , luego
M −1 M +1 M
M −1≥M +x≥M − ≥ > b c.
2 2 2
Para ver la última desigualdad, discutamos dos casos. Si M es par M = 2k, entonces k =
bM M
2 c = 2 y k <
M +1 M
2 . Si, por el contrario, M = 2k + 1 es impar, entonces k = b 2 c y
M +1
k+1= 2 .
Por tanto x = (−1)M + a , a := x mod M y
M
b c < a ≤ M − 1.
2
a = a − M = x y el resultado se sigue.
En conclusión e 

Observación 5.3.9 (Primera aproximación modular). Est resultado ya bastarı́a para


poder diseñar un primer algoritmo por métodos modulares para el cálculo del determinante
de una matriz A ∈ Mn (Z) con control del crecimiento de los resultados intermedios.

Algoritmo 5.3.10.

Input: Una matriz M := (ai,j )1≤i,j≤n ∈ Mn (Z), tal que H := max{|ai,j | : 1 ≤ i, j ≤ n}.
Initialize: M := nn/2 H n + 1.
eval:
x := det(A) mod 2M ∈ Z/(2M )Z.
e ∈ Z.
Ouput: x
Este algoritmo usa número enteros cuyo tamaño máximo está acotado por el tamaño de 2M .
Esto significa que todas las operaciones se hacen en un anillo de restos Z/(2M )Z y el número
de bits de los números involucrados está limitado por
log2 (n)
log2 M + log2 (2) ≤ 2n( + log2 (H)) + 1.
2
Lo que sigue nos permitirá observar que incluso esta talla (que evita crecimientos desmesurados
de resultados intermedios) es excesiva y que se puede hacer trabajando con clases de restos
módulo enteros mucho más peque nos.
5.3. EL TEOREMA CHINO DE LOS RESTOS EN EL CASO R = Z 265

5.3.2.1. La Búsqueda de un Buen Número Primo. Comencemos con un somero recorda-


torio del Teorema de los Números Primos (véase, por ejemplo, el texto clásico de G.H. Hardy y
E.M. Wright, [Hardy-Wright, 1938]). Este Teorema fue postulado tanto por A.-M. Legendre
como por C.F. Gauss, a base de evidencia numérica y fue demostrado simultánea e independien-
temente por J. Hadamard y por Ch.-J. de la Vallée Poussin en 1896. Resultados más refinados
han sido logrados posteriormente. Por el momento, nos conformamos con versiones simples. Se
trata de unos de los grandes resultados en Teorı́a de Números. Una demostración puede verse
también en el texto de H. E. Rose ([Ro, 1994], capı́tulos 12 y 13).
Comencemos con un poco de notación :
Notación 5.3.11. • Dadas dos funciones f, g : R −→ R, escribiremos f ∈ θ(g) cuando
f (x)
limx→∞ =1
g(x)
Obsérvese que f ∈ θ(g) ⇐⇒ g ∈ θ(f ).
• Definamos la función π : N −→ N dada por π(x) es el cardinal del conjunto de números
primos p tales que 2 ≤ p ≤ x.
Teorema 5.3.12 (Teorema (de Densidad) de los Números Primos). En las anteriores
notaciones,
π ∈ θ(Li(x)),
donde donde Z x
dt
Li(x) := ,
2 ln(t)
donde ln se refiere al logaritmo neperiano. Además, se tiene que, para x ≥ 55,
x x
≥ π(x) ≥ .
ln(x) − 4 ln(x) + 2
Aunque hay acotaciones más finas, nos bastan. Ver una prueba de la desigualdad expuesta en
[Rosser, 1941].
5.3.2.2. Tests de Primalidad. Se trata de un problema clásico tanto en Matemáticas
como en Informática.
Problema Clásico 5.3.13 (PRIMES). Dado un número natural n ∈ N, decidir si n es primo.
El algoritmo más inmediato es el algoritmo conocido como Criba de Eratóstenes. El problema
es el tiempo
√ necesario para ejecutarlo. Ası́ para decidir si un número n es primo hay que
realizar n operaciones elementales (operaciones bit). Se dice que es un algoritmo exponencial
o ineficiente porque el número de operaciones a realizar depende esencialmente del número n y
no de su tamaño que es log(n).
Se conocen algoritmos aleatorios (probabilistas eficientes en tiempo logO(1) (n)) desde mediados
de los años 70. Se conocen también como algoritmos Monte Carlo para testar composición y
son altamente eficaces en la práctica. Su aparición histórica es debida a los tests de composición
en la clase RP como son:
• El test de R. Solovay y V. Strassen de 1977 (cf. [SoStr, 1977]). En la Subsección
6.2.4.4 de los Problemas, mostraremos la presentación de este algoritmo, basado fuerte-
mente en el sı́mbolo de Jacobi-Legendre y en la Ley de Reciprocidad Cuadrática.
• El test de M.O. Rabin y G. Miller (cf. [Milr, 1976] y [Rabin, 1980]). En la Sub-
sección 5.3.5.1 mostraremos este algoritmo descompuesto en una serie de problemas.
Posteriormente se obtienen resultados eficientes en el trabajo de M. Agrawal, N. Kayal y N.
Saxena (cf [AKS, 04]) muestran un algoritmo polinomial (en P, es decir en tiempo O(log9 (n))
) para decidir si un número natural dado es primo.
El algoritmo subyacente se basa en la idea siguiente :
Lema 5.3.14. Sea n ∈ N un número entero dado. Supongamos n > 2. Las siguientes
propiedades son equivalentes :
i) n ∈ N es un número primo.
266 5. TEOREMA CHINO DE LOS RESTOS

ii) Para todo q, 1 ≤ q ≤ n − 1, se verifica :


 
n
=0 mod n.
q
iii) Para cada a ∈ {0, . . . , n − 1}, los siguientes polinomios son iguales en Z/nZ[X] :
n
X n − a = (X − a) en Z/nZ[X].
La clave de la prueba es la formulación del item iii). Se trata de verificar esta propiedad (que
no es sino una comparación de coeficientes entre dos polinomios de grado p) y para todos los
valores a ∈ {0, . . . , p−1}. Ası́ descrito el método propuesto por estos tres autores seguirı́a siendo
exponencial porque necesitarı́amos testar todos los coeficientes de O(p) polinomios de grado p.
El resultado principal de estos autores afirma que basta con hacer la comparación de O(log 2 p)
polinomios ( sólo valores pequeños de a) y que no es necesario hacer una comparación de todos
los coeficientes, sino una cantidad log O(1) p interpolaciones. No explicaremos más detalles y
orientamos al lector a la obra original, de sencilla lectura y, por ello, de gran creatividad.
5.3.2.3. Combinando el Teorema de Densidad y los Tests de Primalidad.
Proposición 5.3.15. Dados un número natural H ∈ N y un número s ∈ N, s ≥ 2, se pueden
hallar números naturales positivos n1 , . . . , nr verificando las siguientes propiedades:
i) El número de dı́gitos (talla bit, número de cifras) necesarios para representar el más
grande de estos números está acotado por 2(log2 (log2 (H)) + 1)s.
ii) La cantidad de números r es, a lo sumo 2 log(H).
iii) Los números n1 , . . . , nr son co-primos dos a dos.
iv) Se verifica la siguiente desigualdad:
r
Y
Hs ≤ ni .
i=1

El número de operaciones elementales (bit) necesarias para calcularlos está acotado por
O s log22 (s) log2 (H) + log22 (H) log22 (log2 (H)) .


Demostración. Elijamos un número entero positivo k ∈ N. Por el Teorema de Densidad


de los números primos, tenemos:
22k
2k ≤ ≤ π(22k ).
2k
Además, sean 2 := p1 ≤ p2 ≤ · · · ≤ p2k los números primos menores que 22k . Entonces,
k
2
2k
Y
2 ≤ pi .
i=1

Elijamos k := log2 (log2 (H)) + 1, tenemos r := 2k = 2 log2 (H) números primos distintos y,
claramente,
k
2
Y r
Y
H≤ pi = pi .
i=1 i=1

Más aún, el número primo pi más grande de esta lista, es de valor absoluto menor que 22k =
(2 log2 (H))2 y, por tanto, su tamaño en base 2 (tamaño bit) es, a lo sumo, 2(log2 (log2 (H)) + 1).
Para calcularlos, basta con hallar los primeros 2k números primos menores que 22k . Usando la
clásica Criba de Eratóstenes (sin mayor esfuerzo), el número de operaciones a realizar (escritura
2
de 1 a 22k , lectura y tachado) es del orden de 22k O(log2 k) . Nótese que el factor O(log2 k)
aparece por el esfuerzo de lectura de cada uno de los números de la lista. El cuadrado viene
porque hay que leer la lista entera cada vez que detectamos un nuervo número primo. Luego
el número total de operaciones realizadas está acotado por
2
(log2 (2H)O(log2 log2 H)) .
Finalmente, elijamos ni := psi , 1 ≤ i ≤ r . Claramente, son co-primos dos a dos, su tamaño
en base 2 (talla bit) está determinada por su logaritmo y está, por tanto, acotado por 2ks =
5.3. EL TEOREMA CHINO DE LOS RESTOS EN EL CASO R = Z 267

2(log2 (log2 (H)) + 1)s. El número de números obtenidos sigue siendo r y, obviamente, su pro-
ducto es mayor que H s . Para calcularlos, tenemos que realizar a lo sumo r log2 (s) multiplica-
ciones adicionales de números de tamaño acotado por s max{log2 (pi ) : 1 ≤ i ≤ r} ≤ s(2k). Us-
ando el reciente método de multiplicación de D. Harvey y J. an der Hoeven (cf. [HarvdH, 19]),
estas multiplicaciones pueden hacerse mediante el siguiente número de operaciones adicionales:
r log2 (s)O(s(2k) log2 (2ks)) ≤ (2 log2 (H)) log2 (s)O (s (2(log2 (log2 (H)) + 1)) (log2 (s) + log2 (2k))) .
Luego, con un número máximo de operacioens adicionales:
r log2 (s)O(s(2k) log2 (2ks)) ≤ O s log2 (H) log22 (s) + log22 (log2 (H)) .


En total, el número de operaciones bit a realizar está, por tanto, acotado por
2
(log2 (2H)O(log2 log2 H)) + O s log2 (H) log22 (s) + log22 (log2 (H)) ,


Y, por tanto, acotado por


O s log22 (s) log2 (H) + log22 (H) log22 (log2 (H))

.


5.3.2.4. La Estrategia Final. Consideremos el siguiente algoritmo:

Algoritmo 5.3.16 (Determinante modular en Z).

Input: A := (ai,j )1≤i,j≤n ∈ Mn (Z) y H tal que |ai,j | ≤ H = 2h .


% Por tanto, por la Desigualdad de Hadamard (Corolario 5.3.7): | det(A)| ≤ (nH)n

Hallar (como el la Proposición 5.3.15) números enteros n1 := pn1 , . . . , nr := pnr con r =


2 log2 (3nH) = 2(h + log2 n + log2 (3)) tales que
Qr
• N := i=1 ni ≥ 3(nH)n ≥ 2| det(A)| + 1,
• gcd(ni , nj ) = 1, para todos i 6= j.
% El número más grande de esa lista es de tama~
no (número de dı́gitos) acotado por
2 log2 (log2 ((3nH)n ) ≤ 2(log2 (n log2 (3nH))) ≤ 2(log2 (n) + log2 (log2 (n) + log2 (H) + log2 (3)),
o, equivalentemente, tiene talla bit acotada por:

O(log2 (n) + log2 (log2 (H)) + log2 (log2 (n))).

Hallar: di := det(A) mod ni , para cada i, 1 ≤ i ≤ r.

Aplicar el Teorema Chino de los Restos, para hallar


D e −1 (d1 + (n1 ), d2 + (n2 ), . . . , dr + (nr )).
mod N := Φ
% Usar el Problema 191

Aplicar el Lema 5.3.8 anterior:


Ouput: De ∈Z
end

El resultado final serı́a el siguiente: Consideremos la siguiente notación (conocida como Big-O-
tilde o Landau-Big-O) :
g ∈ Oe(f ) ⇔ ∃k ∈ N, g ∈ O(f logk2 (f )).
Es decir “olvida” factores poli-logarı́micos por simplicidad de la escritura y teniendo en cuenta
que logk (n) tiene menor crecimiento que n para cualquier ε > 0.
268 5. TEOREMA CHINO DE LOS RESTOS

Teorema 5.3.17. Aplicando técnicas modulares al cálculo del determinante podemos concluir :
El determinante de una matriz A ∈ Mn (Z) cuyos coeficientes tienen tamaño (logarı́tmo en base
2) acotado por h se puede calcular en tiempo

Oe(n3 h2 ).

Además, todos los cálculos se realizan en anillos de la forma Z/pZ, donde la talla bit de p está
acotada por:
O(log2 (n) + log2 (log2 (H)) + log2 (log2 (n))).

Demostración. Para calcular los números n1 , . . . , nr requeriremos un tiempo del orden:

O n log22 (n)(log2 (h) + log2 (n)) + (log2 (h) + log2 (n))2 log22 (log2 (h) + log2 (n))) .


Lo que, en notación Big-O de Landau, queda resumido en Oe(n log22 (h)). Ahora, para cada i,
debemos calcular en determinante de A módulo ni . Para cada i esto se puede realizar en O(n3 )
operaciones aritméticas (y divisiones euclı́deas) usando números enteros de tamaño acotado por
el tamaño de ni que, a su vez, está acotado por O(log2 (n) + log2 (log2 (H)) + log2 (log2 (n))) =
Oe(log2 (n) + log2 (h)), olvidando términos del tipo log2 (log2 (n)).
Por tanto, el tiempo requerido para la ejecución de esta parte del algoritmo está acotada
por el tiempo requerido en calcular del determinante usando O(n3 ) operaciones aritméticas
con números de tamaños acotados por lo indicado anteriormente. Esto da una cota del tipo
siguiente asumiendo el algoritmo escolar sobre Z/ni Z:

Oe(n3 (log2 (n) + log2 (h))2 ).

Como r ∈ O(h + log2 (n)), el coste del cálculo de todos los restos en todos los Z/nZ condiere a
una acotación del tipo:
Oe(n3 log22 (n) + h log22 (h)).
Finalmente, siguiendo el problema Problema 191, tenemos que aplicar el algorimo de Eu-
clides con números enteros acotados (en valor absoluto) por 3(nH)n r veces. Se trata de
rO(n(log2 (H) + log2 (n))) = O(rn(h + log2 (n))) divisiones euclı́deas. Como r = 2 log2 (3nH) =
2(h + log2 n + log2 (3)) = O(h + log2 (n)), se trata de realizar Oe(nh2 ) divisiones euclı́deas
de enteros de tamaños acotados por O(n(h + log2 (n))). Esto puede realizarse en un número
de operaciones bit acotadas por Oe(n3 h2 ). Dado que la operación de Lehmer final es lineal en
O(n(h+log2 (n))), el tiempo final para calcular un determinante por este método estará acotado
por
Oe(n3 h2 ).


Debe señalarse que se han usado los algoritmos más “escolares” tanto para el cálculo del deter-
minante módulo ni como para la división euclı́dea. La cota es obviamente refinable por diversas
técnicas; pero no modifica lo esencial de la estrategia: se hacen del orden de O(n3 ) operaciones
aritméticas con números enteros (modulares) de tamaño muy controlado.

5.3.3. Secretos compartidos. Una de las aplicaciones estándar del Teorema Chino de
los Restos es el sistema de compartimentar la información llamado Secretos Compartidos (del
inglés “secret sharing”) y que se usa, por ejemplo, en los cajeros automáticos. Se trata de lo
siguiente : se dispone de una información codificada en un número entero n ∈ N. Ahora se
eligen r personas distintas, cada una de las cuales lleva asociado un módulo mi . Suponemos
que los módulos mi y mj son dos a dos comaximales. Ahora se entrega a cada persona la
información rem(n, mi ). Para poder recuperar la información inicial es necesario que todas
las personas estén dispuestas a aportar su información y ejecutar el algoritmo subyacente al
Teorema Chino de los Restos. Por ejemplo, el cajero (la máquina) posee posee una parte del
código de autorización de una cuenta/tarjeta y el propietario de la tarjeta una segunda parte:
su código personal PIN.
5.3. EL TEOREMA CHINO DE LOS RESTOS EN EL CASO R = Z 269

5.3.4. Grupos abelianos finitamente generados: estructura, divisores elemen-


tales.
Teorema 5.3.18 (3er. Teorema de Estructura de módulos finitamente generados
sobre un DIP). Sea R un dominio de ideales principales. Para cada R−módulo finitamente
generado M existen los siguientes elementos (asociados a M ):
i) Un R−módulo libre de rango finito F ∼= Rn .
ii) Una familia finita de elementos irreducibles, co-maximales dos a dos, p1 , . . . , pr ∈ R.
iii) Una matriz de números naturales
N := (ai,j )1≤i≤r,1≤j≤m ,
tales que para cada i, 1 ≤ i ≤ r, se tiene
ai,1 ≥ ai,2 ≥ · · · ≥ ai,m ≥ 0,
de tal modo que hay un isomorfismo de R−módulos:
  
r
a
M∼
Y Y
=F ⊕  R/pi i,j R ,
i=1 j=1
a
donde, en el caso de que qi,j = = p0i = 1 ∈ R, se sobreentiende que R/qi,j R = 0 es el
pi i,j
R−módulo nulo.
Además, los elementos descritos en la lista i), ii) y iii) anterior son únicos salvo permutaciones
a
y unidades en R. A los elementos {qi,j := pi i,j : 1 ≤ i ≤ r, 1 ≤ j ≤ m} se les denominan los
divisores elementales (de la torsión) del R−módulo M .
Demostración. Retomamos el Segundo Teorema de Estructura de R−módulos sobre un
dominio de ideales principales (Teorema 4.6.5 anterior). Por ese teorema sabemos que M es
isoformo a
M∼ = Rn ⊕ T orR (M ),
donde T orR (M ) son los elementos de torsión de M , i.e.
T orR (M ) := {m ∈ M : AnnR (m) 6= (0)}.
Además, existen d1 , . . . , dm ∈ R verificando di+1 | di y se tiene:
m
Y
T orR (M ) := (R/di R) .
i=1
Luego
m
!
M∼
Y
(5.3.3) = Rn ⊕ (R/di R) .
i=1

Además, los elementos d1 , . . . , dm son únicos (salvo unidades en R) y se denominaban factores


invariantes del módulo M . Ahora observemos los siguiente: como di+1 | di , entonces los factores
irreducibles de di+1 son algunos de los factores irreducibles de di y, en caso de que un factor
irreducible aparezca en ambos, la multiplicidad (el exponente) que aparece en di+1 tiene que
ser menor que la multiplicidad en di . En otras palabras y más formalmente. Consideremos una
factorización de d1 como la siguiente:
Yr
d1 = pα
i .
i

i=1

Escribamos a1,j := αj . Ahora, como dj | d1 para cada j ≥ 2, los factores irreducibles de dj


tienen que estar asociados con alguno de los de d1 y su multiplicidad tiene que ser menor que
la que aparece en d1 . Es decir, para cada j ≥ 2, existe una unidad uj ∈ R y existen exponentes
aj,1 , . . . , aj,r tales que
r
a
Y
dj := uj pi i,j .
i=1
Como dj+1 | dj es claro que necesariamente, los exponentes de los factores pi disminuyen cuando
crece el sub-ı́ndice. Es decir, necesariamente ai,j ≥ ai,j+1 para cada i, 1 ≤ i ≤ r y 1 ≤ j ≤ m,
270 5. TEOREMA CHINO DE LOS RESTOS

incluyendo los casos en los que ai,j = 0 que significará que ai,t = 0, para cada t ≥ j. Tenemos ası́
los elementos descritos en las propiedades i), ii) y iii) del enunciado. Para concluir, baste con
utilizar el Teorema Chino de los Restos precedente (Teorema 5.2.2). Para cada j, 1 ≤ j ≤ m,
tenemos un isomorfismo de anillos
Y
ϕj : R/dj R −→ (R/qi,j R) ,
ai,j 6=0

a Q
donde qi,j = pi i,j . Nótese que hemos escrito ai,j 6=0 porque los primos pi que tengan exponente
nulo no aparecen en el cociente como anillo (no tiene unidad el cociente R/qi,j R = R/R = 0). Es
un ejercicio de fácil verificación el observar que los morfismo de anillo ϕ del Teorema 5.2.2 son,
en este caso, morfismo de R−módulos. Como añadir la suma directa de copias del R−módulo
0, no cambia el R−módulo, tenemos también un isomorfismo de R−módulos
 
Y Y Y r
ϕj : R/dj R −→ (R/qi,j R) ⊕  {0} = R/qi,j R,
ai,j 6=0 ai,j =0 i=1

a
donde qi,j := pi i,j . Reintegrando estos isomorfismos de R−módulos, tenemos un isomorfismo
de R−módulos
r m m r
!
ai,j
Y Y Y Y
ϕ := ϕj : (R/dj R) −→ R/pi R .
i=1 j=1 j=1 i=1

Finalmente re-integrando este isomorfismo en el isomorfismo (5.3.3) concluimos el enunciado


del Teorema:
 !   
m r r m
a a
M∼ R/pi i,j R  ∼
Y Y Y Y
= Rn ⊕  = Rn ⊕   R/pi i,j R .
j=1 i=1 i=1 j=1

El caso particular de grupos abelianos se sigue de manera obvia:

Corolario 5.3.19 (3er. Teorema de Estructura de módulos finitamente generados


sobre un DIP). Para cada grupos abeliano finitamente generado M existen los siguientes
elementos (asociados a M ):
i) Un Z−módulo libre de rango finito F ∼ = Zn .
ii) Una familia finita de enteros irreducibles, co-maximales dos a dos, p1 , . . . , pr ∈ Z.
iii) Una matriz de números naturales

N := (ai,j )1≤i≤r,1≤j≤m ,

tales que para cada i, 1 ≤ i ≤ r, se tiene

ai,1 ≥ ai,2 ≥ · · · ≥ ai,m ≥ 0,

de tal modo que hay un isomorfismo de grupos abelianos:


  
r
a
M∼
Y Y
=F ⊕  Z/pi i,j Z ,
i=1 j=1

a
donde, en el caso de que qi,j = pi i,j = p0i = 1 ∈ Z, se sobreentiende que Z/qi,j Z = 0 es el
Z−módulo (o grupo abeliano) nulo.
Además, los elementos descritos en la lista i), ii) y iii) anterior son únicos salvo permutaciones
a
y unidades en Z. A los elementos {qi,j := pi i,j : 1 ≤ i ≤ r, 1 ≤ j ≤ m} se les denominan los
divisores elementales (de la torsión) del grupo abeliano G.
5.3. EL TEOREMA CHINO DE LOS RESTOS EN EL CASO R = Z 271

5.3.5. Ejercicios y problemas de la Sección 5.3.


Problema 191 (Versión Eficiente del TCR en Z). Supongamos dados números naturales
no nulos co-primos dos a dos {ai : 1 ≤ i ≤ m} ⊆ \{0}. Supongamos dada una secuencia de
restos modulares
x1 mod a1 , . . . , xm mod am .
Qm
Definamos M := i=1 ai y definamos:
M
Mi := , 1 ≤ i ≤ m.
ai
Probar:
i) Los enteros Mi y ai son co-primos dos a dos (i.e. gcd(Mi , ai ) = 1). Pruébese que,
entonces, existe hi ∈ Z tal que Mi hi = 1 mod ai .
ii) Sea x ∈ Z el número entero dado por la siguiente igualdad:
m
X
x= (Mi hi xi ) .
i=1

Probar que si ϕ es el isomorfismo del Teorema Chino de los Restos, se tiene:


ϕ(x + M Z) = (x1 + a1 Z, . . . , xm + am Z).
iii) Probar que estas afirmaciones son válidas sobre todo dominio de ideales principales.
Problema 192. Hallar el entero positivo más pequeño tal que al dividirlo por 10, 17, y 19 da
restos 8, 11, y 14 respectivamente.
Problema 193. Supongamos que creamos un banco nuevo en el que aspiramos a que el número
de cuentas bancarias sea como mucho:
9.699.690.000 = 24 · 54 · 3 · 7 · 11 · 13 · 17 · 19.
Asociamos a cada cliente un número de cuenta PAN (Personal Account Number) entre 0 y este
número. Además, a cada cliente le reglamos una tarjeta de crédito que llevará asociado un
PIN (Personal Identification Number) a elección del usuario con 4 dı́gitos (es decir, un número
menor que 104 ). Por su parte, la tarjeta debe tener asignado un número CCN (Credit Card
Number) menor que 969.969. Proponemos un sistema de seguridad basado en el Teorema Chino
de los Restos. Se pide:
i) Si un usuario tiene una cuenta con PAN=400.022. ¿Cuál ha de ser su PIN? y ¿cuál
ha de ser su CCN? con este esquema basado en TCR.
ii) Si un usuario nos pide por teléfono que su PIN sea PIN=2345, ¿Cuántas posibles
CCN le podrı́amos asignar a su tarjeta?
iii) En el caso inmediato anterior, ¿Es posible que la petición de PIN de un usuario, cuyo
PAN ya ha sido fijado, sea imposible?. ¿Cómo sugieres corregir ese efecto?.
Problema 194. Busca en internet uno de los Tests de Primalidad citados. Describe en qué
consiste el agoritmo que has elegido y aplı́calo a 4 números enteros de tu elección con, al menos,
4 dı́gitos cada uno. Explica los resultados de tu experimento.
Problema 195. Busca en internet el sistema criptográfico RSA (de Rivest, Shamir y Adle-
mann). Explica su funcionamiento, demuestra la veracidad de su funcionamiento, genera una
clave pública propia y comprueba su funcionamiento encriptando y desencriptando mensajes.
Haz lo mismo con mensajes firmados, generando dos usuarios con dos claves públicas.
Problema 196. Busca en wikipedia que es el sistema de seguridad TLS1 y explica cuál es su
relación con alguno de los contenidos anteriores. Abre tu navegador usual y trata de obtener
información sobre los protocolos de seguridad que se usan en conexión con una u otra página
web. Encuentra alguno que use TLS. Busca otras aplicaciones de esta versión del Teorema
Chino de los Restos.

1http://en.wikipedia.org/wiki/Transport_Layer_Security
272 5. TEOREMA CHINO DE LOS RESTOS

5.3.5.1. El Test de G. Miller y M.O. Rabin. Vamos a trabajar en esta serie de prob-
lemas el test de M.O. Rabin y G. Miller entre 1976 y 1980 (cf. [Milr, 1976] y [Rabin, 1980]).
Se trata del segundo test de primalidad probabilista (o, para ser exactos, el segundo test de
composición probabilista) de la literatura matemática. Originariamente fue presentado por G.
Miller bajo la hipótesis de Riemann y, posteriormente, M.O. Rabin demostró que la hipótesis
de Riemann no era necesaria. El algoritmo hace uso intenso del Teorema Pequeño de Fermat y
la función de Euler (véase la Subsección de Problemas 3.6.5.3).
Problema 197. Para n ∈ N, sea 1 ≤ d ≤ n − 1, definamos el grupo de las raı́ces d−ésimas de
la unidad módulo n como:
K(d) := {a ∈ {1, . . . , n − 1} : ad − 1 = 0(mod n)}
Pruébese que para cada n ∈ N, K(d) es un subgrupo del grupo de las unidades (Z/nZ)× . En
particular, ](K(n − 1)) | ](Z/nZ)× y se tiene:
](K(n − 1)) | ϕ(n)

Algoritmo 5.3.20 (Test de Composición de Miller-Rabin).

Input n ∈ 2N + 1
compute ` tal que n − 1 = 2` m, m impar.
guess randomly a ∈ {1, . . . , n − 1}
compute am mod n
if am = 1 mod n, aceptar, Output Probablemente primo.
2 `
else compute am mod n, a2m mod n, a2 m mod n, . . . , a2 m mod n
n−1
if a 6= 1 mod n, aceptar y Output Compuesto.
k
else encontrar el mayor k such that a2 m 6= 1 mod n
k
if a2 m = −1 mod n, aceptar, Output Probablemente primo.
else Output Compuesto.
fi
fi
fi
end

Problema 198. Pruébese que si n ∈ N es un número primo impar, el anterior procedimiento


siempre responde Probablemente primo.
Problema 199. Pruébese que si n ∈ N un número compuesto que no es un número de
Carmichael (cf. Problema 150 anterior para la noción de número de Carmichael), el algo-
ritmo de Miller-Rabin responder compuesto con probabilidad > 1/2.
Problema 200. Con las notaciones de los problemas precdente, fijado n ∈ N definamos:
d−1
[
R(d) := ](K(d) \ K(i)).
i=1
Pruébese que si n es un número primo, se tienen las propiedades siguientes :
i) R(d) = 0 si d 6 | n − 1,
ii) R(d) ≤ ϕ(d),
Pn−1
iii) d=1 R(d) = n − 1
(Hint: Úsense también los Problemas de la Subsección 3.6.5.3).
Problema 201. Pruébese que las potencias de primos no son números de Carmichael.
Problema 202. Pruébese que si p es un número primo impar, el anillo
Z/pd Z,
tiene exactamente dos raı́ces cuadradas de la unidad. Son exactamnente las clases módulo pd
de los enteros {1, −1}.
5.3. EL TEOREMA CHINO DE LOS RESTOS EN EL CASO R = Z 273

Problema 203. Pruébese que si c, d ∈ N son dos enteros coprimos c, d ≤ n − 1, se tiene :


K(cd) ∼
= K(c) × K(d).
αk
Problema 204. Sea n ∈ N un número compuesto impar, supongamos n = pα
1 · · · pk , con
1

p1 , . . . , pk números primos distintos. Entonces, pruébese que


Z/nZ ∼
= (Z/pα
αk
1 Z) × · · · × (Z/pk Z)
1

es un isomorfismo de anillos. Además, el número de raı́ces cuadradas de la unidad en Z/nZ es


exactamente 2k .
Problema 205. Comencemos construyendo una estructura de grafo orientado cobre K(2` ).
Para cada número natural impar se tiene :
K(n − 1) ∼
= K(2` ) × K(m)
con ` maximal. Luego K(2` ) es la parte dominante del algoritmo. La clase de aristas en el
grafo será la siguiente :
E := {(a2 , a) : a ∈ K(2` )}
Esto genera una estructura del tipo siguiente :
{1}
.↓&
{−1} {w} {−w} ···
.. .. ..
. . .
Nótese que los elementos de profundidad i dentro del grafo son, justamente, las raı́ces primitivas
i−ésimas de la unidad.
Para cada elemento x ∈ K(2` ), denotamos por Tx el árbol formado por sus sucesores, es decir,
por sus raı́ces cuadradas y las raı́ces cuadradas de sus raı́ces cuadradas, etc. Formalmente,
k
Tx := {a ∈ K(2` ) : ∃k, a2 = x mod n}.
Con las anteriores notaciones, pruébese :
i) Se da la siguiente igualdad:
 
[ [ [
K(2` ) = T1 = {1} T−1  Tω  .
ω 2 =1,ω6=−1

ii) Dados ω, ω 0 ∈ K(2` ) \ {1}, tales que ω 2 = 1 mod n, (ω 0 )2 = 1 mod n y ω 6= ω 0 ,


entonces,
\
Tω Tω0 = ∅.
En particular, pruébese que
X
](K(2` )) = 1 + ](T−1 ) + ](Tω ).
ω 2 =1,ω6=−1

Problema 206. Sea ω ∈ K(2` ) una raı́z cuadrada de la unidad distinta de la unidad (i.e.
ω 2 = 1 mod n y ω 6= 1). Definamos el conjunto :
k
Tω,k := {a ∈ (Z/nZ)× : a2 = x mod n, `(a) = k}.
Pruébese, que, con estas notaciones, la siguiente es una descomposición como unión disjunta
de Tω :
[
Tω := Tω,k .
k≥0

Pruébese que, en particular,


X
](Tω ) = ](Tω,k ).
k≥0
274 5. TEOREMA CHINO DE LOS RESTOS

Problema 207. Con las notaciones del problema prcedente, para cada ω ∈ K(2` ) una raı́z
cuadrada de la unidad distinta de la unidad (i.e. ω 2 = 1 mod n y ω 6= 1), definamos :
L(ω) := max {k : Tω,k 6= ∅}.
En otras palabras, L(ω) = k si y solamente si existe x ∈ Tω con `(x) = k y no hay ningún
y ∈ Tω con `(ω) > k. Con estas notaciones, pruébese que para cada ω ∈ K(2` ) una raı́z
cuadrada de la unidad distinta de la unidad (i.e. ω 2 = 1 mod n y ω 6= 1), se tiene :
L(ω)
X
](Tω ) = ](Tω,k ).
k=0

Problema 208. Con las anteriores notaciones, pruébense las siguientes propiedades:
i) Para cada raı́z cuadrada de la unidad ω 2 = 1, con ω 6= 1 t para cada k ≤ L(ω), si
Tω,k 6= ∅, se tiene :
](Tω,k ) = ](K(2k )).
ii) Con las notaciones del apartado i), se tiene que si Tω,k 6= ∅, para algún k, entonces,
Tω,j 6= ∅, para todo j < k.
iii) Finalmente, L(−1) ≤ L(ω) para todo ω tal que ω 2 = 1 mod n, ω 6= 1, −1 mod n.
En particular, pruébese que se tiene:
L(−1) L(−1) L(ω)
X X X
](T−1 ) := ](T−1,k ) = ](Tω,k ) ≤ ](Tω,k ) = ](Tω ).
k=0 k=1 k=1

Problema 209. Pruébese que si n ∈ N es un número de Carmichael impar, que no es un


número primo, el algoritmo de Miller-Rabin responde Probablemente primo con probabilidad
menor estricto que 1/2. (Hint: Nótese que el algoritmo sólo responde Probablemente primo
si hemos elegido un valor a ∈ {1, . . . , n − 1}, a ∈ (Z/nZ)× . Por ser compuesto, considerar
A := {1, . . . , n − 1} \ (Z/nZ)× 6= ∅ y la cantidad t := ](A)
n−1 > 0. Dado que n es un número de
Carmichael, tenemos el isomorfismo :
ϕ: (Z/nZ)× = K(n − 1) −→ K(2` ) × K(m)
`
a 7−→ (am , a2 ).
Por tanto, el algoritmo responde Probablemente primo solamente si
am = 1 (mod n)
o si
k
∃k, (am )2 = −1 (mod N )
En otros términos, responde Probablemente primo, solamente si
a ∈ K(m) o am ∈ T−1 .
Controlando los cardinales con las estimaciones precedentes, la probabilidad de error estará
acotada estrictamente por 1/2).
Problema 210 (Test de Miller-Rabin). Con los resultados precedentes, pruébense las sigu-
ientes afirmaciones:
i) Si el algoritmo responde Compuesto, el input n ∈ N es un número compuesto.
ii) Si n ∈ N es un número primo impar, el algoritmo siempre produce Probablemente
primo.
iii) Si n ∈ N es un número compuesto, el algoritmo produce Compuesto con probabilidad
≥ 1/2.
iv) El número de operaciones aritméticas realizadas es polinomial en el número de dı́gitos
de n (O(log2 (n))) y en k. Además, los enteros más grandes involucrados son de talla
acotada por O(log2 (n))
De nuevo, se trata de un algoritmo de tipo MonteCarlo (y, al ejecutarse en tiempo
polinomial se denotan como la clase RP (random polynomial time)) En este caso, es un test
de Composición y no un test de primalidad (dado que la seguridad en la respuesta está del
lado de los número compuestos). Una manera alternativa de presentarlo consiste en decir que
Primes está en co-RP.
5.4. FORMA DE JORDAN 275

5.4. El Teorema Chino de los Restos en el caso R := K[X]: Forma de Jordan.


En la Sección 4.7 y en la Subsección de problemas 4.7.2, hemos dado dos demostraciones equiv-
alentes de que todo endomorfismo es semejante a la suma diagonal de las matrices compañeras
de sus factores invariantes, que culmina en el Teorema 4.7.9. Nuestro propı́sto en esta Sección
es avanzar un poco más en las presentaciones simplificadas de los endomorfismos: la forma
canónica de Jordan de un endomorfismo. Aprovecharemos la existencia de esa representación
para presentar un algoritmo de cálculo del máximo común divisor de dos polinomios en K[X]
que minimiza la dimensión del Álgebra Lineal involucrada hasta, justamente, trabajar con ma-
trices r × r, donde r es el grado del máximo común divisor. De hecho, probamos que el máximo
común divisor de dos polinomios es el polinomio caracterı́stico de una matriz contsryida a partir
de los dos polinomios dados.
5.4.1. La forma canónica de Jordan: divisores elementales en K[X]. Camille
Jordan introduce su forma canónica en su texto de 667 páginas [Jordan, 1870]. Este tratado es
un estudio completo de la teorı́a de E. Galois, resolución de ecuaciones polinomiales univariadas,
teorı́a de grupos y, en particular, contiene la forma canónica de Jordan (que lo hizo sólo para un
cuerpo finito, llamados “cuerpos de Galois” (ver Problema 79, por ejemplo)). El texto, usado
en la École Polytechnique, recibió en Premio Poncelet de la Academia de Ciencias de Parı́s.
Ahora vamos a intentar hacerlo, recuperando su formalismo original.
Proposición 5.4.1. Sea ζ ∈ K un elemento en un cuerpo K y consideremos el polinomio
mónico f = (X − ζ)n . Consideremos el anillo cociente K[X]/(f ). Se tiene:
i) La siguiente colección es una base de K[X]/(f ) como K− espacio vectorial, a la que
llamaremos base monomial en ζ de K[X]/(f ):
(n)
βζ := {1 + (f ), (X − ζ) + (f ), . . . , (X − ζ)n−1 + (f )}.
ii) La matriz en la base βζ de la homotecia ηX es, justamente, la caja de Jordan de orden
n y valor “propio” ζ. Es decir, la matriz J(ζ, n) ∈ Mn (K) dada mediante:
 
ζ 0 0 ··· 0 0
1 ζ 0 · · · 0 0
 
J(ζ, n) := 0 1 ζ · · · 0 0 .
 
 .. .. . . . .
. . .. 
. . . 
0 0 0 ··· 1 ζ
A la matriz J(ζ, n) se la denomina caja de Jordan de orden n en honor del matemático
C. Jordan. .
Demostración. La demostración de i) más “natural” pasa por usar el desarrollo de Tay-
lor en ζ de los polinomios. Expresamos ese noción del modo siguiente:
Dado cualquier polinomio univariado g ∈ K[X], de grado n, existen elementos únicos a0 , a1 , . . . , an ∈
K tales que
g = an (X − ζ)n + an−1 (X − ζ)n−1 + · · · a1 (X − ζ) + a0 .
Para ello, consideramos la siguiente transformación en K[X]:
Tζ : K[X] −→ K[X]
g 7−→ Tζ (g) := g(X + ζ).
Es claro que Tζ es un isomorfismo de anillos cuyo inverso es T−ζ . Más aún, deg(Tζ (g)) = deg(g),
para cualquier g ∈ K[X]. Ahora bien, si g es un polinomio de grado n, entonces h(X) = Tζ (g) =
g(X + ζ) es un polinomio de grado n en K[X]. Por tanto, existen a0 , . . . , an ∈ K tales que
h = an X n + · · · a1 X + a0 .
Por tanto,
g = T−ζ (h) = T−ζ (Tζ (g)) = an (X − ζ)n + · · · + a1 (X − ζ) + a0 ,
y tenemos probada la afirmación. La u8nicidad se sigue de la unicidad de los coeficientes de
h = Tζ (g).
En particular, para la afirmación i), los restos en K[X]/(f ) se escriben de manera única como
(n)
combinación lineal de los elementos de la base βζ y tenemos que es sistema generador. Dado
276 5. TEOREMA CHINO DE LOS RESTOS

(n)
que βζ es de cardinal n, y n es la dimensión de K[X]/(f ), tenemos que es base.
Para la afirmación ii), observemos la siguiente cadena:
ηX (1 + (f )) = ((X − ζ) + (f  )) + ζ (1 + (f )) = v2 + ζv1
ηX ((X − ζ) + (f ))  = (X − ζ)2 + (f ) + ζ ((X − ζ) + (f )) = v3 + ζv2
ηX (X − ζ)2 + (f ) = (X − ζ)3 + (f ) + ζ (X − ζ)2 + (f ) = v4 + ζv3
.. ..
 .  .
ηX (X − ζ)n−1 + (f ) = ((X − ζ)n + (f )) + ζ (X − ζ)n−1 + (f ) = 0 + ζvn−1 ,
(n)
donde hemos escrito βζ := {v1 , v2 , . . . , vn } y vi := (X − ζ)i−1 + (f ), para 1 ≤ i ≤ n. Esta
(n)
cadena de igualdades justifica que la matriz de ζX en la base βζ sea justamente la “caja” de
Jordan J(ζ, n). 

Estamos ya en condiciones de justificar una primera interpretación del Teorema Chino de los
Restos en el caso de polinomios mónicos que se descomponen completamente sobre un cuerpo
K.
Proposición 5.4.2. Sea f ∈ K[X] un polinomio mónico de grado n y supongamos que existen
ζ1 , . . . , ζr ∈ K, con ζi 6= ζj , y exponentes mi ∈ N, con mi ≥ 1, 1 ≤ i ≤ r, tales que:
r
Y
f (X) := (X − ζi )mi .
i=1

Consideremos:
• Sea Φe : K[X]/(f ) −→ Qr (K[X]/(X − ζi )mi ) el isomorfismo de anillos del Teo-
i=1
rema Chino de los Restos. Entonces, Φ e es también un isomorfismo de K−espacios
vectoriales.
• En K[X]/(f ) la base monomial βQ:= {1 + (f ), X + (f ), X 2 + (f ), . . . , X n−1 + (f )}.
r
• En el espacio vectorial producto i=1 (K[X]/(X − ζi )mi ), la base Γ inducida por las
(m )
bases βζi i en cada uno de los espacios vectoriales K[X]/(X − ζi )mi .
• Y sea MΦ la matriz del isomorfismo Φ e en las bases β y Γ.
Entonces, se tiene:
 
J(ζ1 , m1 ) 0 ··· 0
 0 J(ζ 2 , m2 ) ··· 0 
C(f ) := MΦ−1   MΦ .
 
.. . .. .. ..
 . . . 
0 0 ··· J(ζr , mr )
En paricular, C(f ) posee forma canónica de Jordan, ésta es única (salvo permutación de los
bloques) y la matriz de cambio de base es la matriz del Teorema Chino de los Restos.
Demostración. Obsérvese que si ζi 6= ζj , entonces, (X −ζi )k y (X −ζj )s son co-maximales
para k, s ≥ 1. Por tanto, el hecho de ser Φ
e un isomorfismo se sigue del Teorema Chino de los
Restos. De otro lado, tenemos el siguiente diagrama conmutativo:
Φ
e
Qr
K[X]/(f ) −→ i=1 (K[X]/(X − ζi )mi )
Qr (i)
ηX ↓ ↓ i=1 ηX
Qr mi
K[X]/(f ) −→ i=1 (K[X]/(X − ζi ) )
Φe
Qr (i)
Este diagrama es conmutativo, donde i=1 ηX es el endomorfismo dado mediante el producto
de los endomorfimos
(i)
ηX : K[X]/(X − ζi )mi −→ K[X]/(X − ζi )mi .
5.4. FORMA DE JORDAN 277

La conmutatividad del diagrama nos dice que


r
!
(i)
Y
e −1 ◦
ηX = Φ ηX ◦ Φ.
e
i=1

Por lo visto anteriormente, MX = C(f ) es la matrix de la homotecia ηX en la base β.


(i) (i) (m )
De otro lado, M (ηX ) = J(ζi , mi ) es la matriz de ηX cuando se considera la base βζi i en
K[X]/(X − ζi )mi .
Qr (i)
En particular, la matriz M ( i=1 ηX ) en la base producto es la suma diagonal de las matrices
(i)
M (ηX ), es decir,
 
J(ζ1 , m1 ) 0 ··· 0
r  0 J(ζ2 , m2 ) · · · 0 
(i)
Y
M ( ηX ) =  .
 
.. . .. . .. .
..
i=1
 . 
0 0 ··· J(ζr , mr )
Traduciendo la conmutatividad del diagrama a matrices, esto significa
r
!
(i)
Y
−1
M (ηX ) = M (Φ) ◦ M
e η ◦ M (Φ),
X
e
i=1

es decir
 
J(ζ1 , m1 ) 0 ··· 0
 0 J(ζ2 , m2 ) · · · 0 
C(f ) = MΦ−1   MΦ ,
 
.. .. .. ..
 . . . . 
0 0 ··· J(ζr , mr )
que es la propiedad buscada. 

Teorema 5.4.3 (Existencia de Forma canónica de Jordan de un enfomorfismo de


espacios vectoriales). Sea K un cuerpo y M ∈ Mn (K) una matrix cuadrada. Supongamos
que todas las raı́ces del polinomio caracterı́stico χM (X) ∈ K[X] están en K (i.e. que χM se
escinde completamente en K). Entonces, existen Jord(M ) una suma de diagonal de cajas de
Jordan con coordenadas en K y una matriz regular P ∈ GL(n, K) de tal modo que

M = P Jord(M )P −1 .
A la matriz Jord(M ) se la llama forma canónica de Jordan de M y es única salvo permutación
de las cajas de Jordan que aparecen en Jord(M ).

Demostración. Es consecuencia inmediata de la existencia de forma de Frobenius (ver


Problema 173) que muestra que la matriz M es semejante (con cambios de coordenadas “racionales”
(i.e. en GL(n, K))) a una matriz suma diagonal de matrices compañeras. Ahora, aplicando la
Proposición 5.4.2, cada una de las matrices compañeras que aparecen en la forma de Frobe-
nius es semejante a una matriz suma diagonal de cajas de Jordan asociada a los ceros de ese
polinomio y con talla sus multiplicidades. Recomponiendo todos los cambios de variables como
suma diagonal, obtendremos Jord(M ) y la matriz de cambo de base P ∈ GL(n, K). 

Observación 5.4.4 (La forma canónica de Jordan). Retomando los cursos básicos de
Álgebra Lineal, la anterior Proposición nos dice que si el polinomio mı́nimo de un endomorfismo
A se escinde completamente en un cuerpo, entonces, existe una única forma canónica de Jordan.
Obviamente, si K es algebraicamente cerrado, tanto el mı́nimo como el caracterı́stico se escinden
completamente en K. La unicidad viene dada por los divisores de la forma (X − ζ)m de los
factores invariantes y las matrices de paso de la forma de Frobenius (suma diagonal de matrices
compañeras) a la forma canónica de Jordan son las matrices del Teorema Chino de los Restos
en bases adecuadas.
278 5. TEOREMA CHINO DE LOS RESTOS

5.4.2. Teorı́a del endomorfismo y el máximo común divisor en K[X]. Como apli-
cación final del Teorema Chino de los Restos (al menos en esta parte del curso), veremos cómo
predecir el grado del máximo común divisor de dos polinomios usando Teorı́a del Endomorfismo
y sin acudir a la matriz de Sylvester de la Eliminación Univariada Clásica. Comencemos con
algunos resultados clásicos de Álgebra Lineal.
Lema 5.4.5. Sea K un cuerpo, y sea K su clausura algebraica. Sea g ∈ K[X] un polinomio
univariado. Tendremos las siguientes propiedades :
i) Sea J(0, m) una caja de Jordan con valor propio 0 de tamaño m × m. Entonces,
• Para todo k, 1 ≤ k ≤ m, se tiene :
 
k 0 0
J(0, m) = ,
Idm−k 0
donde Idm−k es la matriz identidad (m − k) × (m − k) y los 0’s representan
matrices rectangulares de tamaño apropiado.
• Para todo k ≥ m, se tiene :
J(0, m)k = 0.
ii) Si J(ζ, m) es una caja de Jordan de orden m y valor propio ζ ∈ K y denotamos por
ordζ (g) como el máximo número natural k ∈ N tal que (X −ζ)k | g en K[X], entonces,
tenemos
rank (g(J(ζ, m))) = max{0, m − ordζ (g)}.
Demostración. Las propiedades descritas en i) son las propiedades habituales de las
matrices nilpotentes, esto es, de las matrices tales que existe una potencia que se anula. Más
aún, son propiedades de las cajas de Jordan de valor propio 0. Para la propiedad ii), obsérvese
que ha de existir h ∈ K[X] un polinomio tal que g = h(X)(X − ζ)k , donde:
• h(ζ) 6= 0,
• k = ordζ (g).
Ahora, observamos que
g(J(ζ, m)) = h(J(ζ, m))(J(ζ, m) − ζIdm )k ,
Obsérvese que  
h(ζ) 0 0 ··· 0
 ∗ h(ζ) 0 ··· 0 
 
 ∗ ∗ h(ζ) · · · 0 
h(J(ζ, m)) =  ,
 .. .. .. .. .. 
 . . . . . 
∗ ∗ ∗ · · · h(ζ)
donde ∗ denota un elemento de K cuyo valor no nos ocupa. En otras palabras, h(J(ζ, m))
es una matriz triangular inferior con el valor h(ζ) en la diagonal principal. Como h(ζ) 6= 0,
entonces, es una matriz regular y, por tanto, el rango de g(J(ζ, m)) es igual al rango de ma
matriz (J(ζ, m) − ζIdm )k . Ahora observemos que
(J(ζ, m) − ζIdm )k = (J(0, m))k .
Luego el rango de g(J(ζ, m)) es igual a m − k si m ≥ k y 0 en caso contrario. ésto es lo que se
indica en el enunciado del Lema. 

Proposición 5.4.6 (Resultante y ceros de un polinomio). Sea K un cuerpo, f ∈ K[X]mon


un polinomio mónico y g ∈ K[X]. Supongamos K la clausura algebraica de K y que f factoriza
del modo siguiente en K[X]:
r
Y
f (X) := (X − ζi )ni ,
i=1
con ζ1 , . . . , ζr ∈ K y ni ∈ N, ni ≥ 1. Entonces, la resultante ResX (f, g) satisface:
Yr
ResX (f, g) := g(ζi )ni ,
i=1
lo que fortalece la equivalencia del Corolario 4.7.4 precedente.
5.4. FORMA DE JORDAN 279

Demostración. Por la Proposición 5.4.2, sabemos que C(f ) es semejante (en Mn (K) a
la matriz suma diagonal de bloques de Jordan siguiente:
 
J(ζ1 , n1 ) 0 ··· 0
 0 J(ζ2 , n2 ) · · · 0 
C(f ) ∼
=
 
.. . . . . .
. 
 . . . . 
0 0 · · · J(ζr , nr )
Por tanto, la matriz g(C(f )) es una matriz semejante a una matriz de la forma:
 
g(J(ζ1 , n1 )) 0 ··· 0
 0 g(J(ζ 2 , n2 )) ··· 0 
g(C(f )) ∼
= .
 
.. . .. ..
 . ··· . 
0 0 · · · g(J(ζr , nr ))
Como el determinante es un invariate de la clase de semejanza, tendremos que
 
g(J(ζ1 , n1 )) 0 ··· 0
 0 g(J(ζ2 , n2 )) · · · 0 
ResX (f, g) = det (g(C(f ))) = det  .
 
.. . . .
.
 . . ··· . 
0 0 · · · g(J(ζr , nr ))
Como el determinante se porta bien con las sumas diagonales de matrices, lo anterior implica:
r
Y
ResX (f, g) = det (g(J(ζi , ni ))) .
i=1

Como en la demostración del ı́tem ii) del Lema 5.4.5 precedente, cada matriz g(J(ζi , ni )) tiene
la forma:  
g(ζi ) 0 0 ··· 0
 ∗ g(ζ i ) 0 ··· 0 
 
 ∗ ∗ g(ζ i) ··· 0
g(J(ζi , ni )) =   ∈ Mni (K),

 .. .. .. .. .. 
 . . . . . 
∗ ∗ ∗ ··· g(ζi )
que es una matriz triangular inferior en la que los elementos por debajo de la diagonal principal
no nos interesan demasiado por ahora. Por tanto,
det (g(J(ζi , ni ))) g(ζi )ni .
con lo que concluimos:
r
Y r
Y
ResX (f, g) = det (g(J(ζi , ni ))) = g(ζi )ni .
i=1 i=1

Proposición 5.4.7 (Barnett, Grado del máximo común divisor de dos polinomios).
Dados dos polinomiso f, g ∈ K[X] supongamos que f es mónico. Entonces, el grado d del
máximo común divisor h de f y g satisface:
deg(f ) = rank(g(C(f )) + deg(h),
donde C(f ) es la matriz compañera de f .
Demostración. En primer lugar, podemos suponer que existen ζ1 , . . . , ζr ∈ K, con ζi 6=
ζj , cuando i 6= j, y existen m1 , . . . , mr ∈ N, con mi ≥ 1, 1 ≤ i ≤ r, tales que
r
Y
f (X) := (X − ζi )mi .
i=1
280 5. TEOREMA CHINO DE LOS RESTOS

Pr
En particular tenemos i=1 mi = deg(f ) = m. Gracias al Teorema Chino de los Restos
podemos suponer que existe una matriz regular P con coordenadas en K tal que
 
J(ζ1 , m1 ) 0 ··· 0
 0 J(ζ2 , m2 ) · · · 0 
C(f ) = P −1   P.
 
.. .. .
..
 . . ··· 
0 0 ··· J(ζr , mr )
Entonces,
 
g(J(ζ1 , m1 )) 0 ··· 0
 0 g(J(ζ 2 , m2 )) ··· 0 
g(C(f )) = P −1   P.
 
.. . . ..
 . . ··· . 
0 0 ··· g(J(ζr , mr ))
Como P es una matriz regular, el rango de la matriz g(C(f )) viene dado por:
 
g(J(ζ1 , m1 )) 0 ··· 0
0 g(J(ζ ··· r
2 , m2 )) 0
  X
rank (g(C(f ))) = rank  = rank (g(J(ζi , mi )))) .
 
.. . .. ..
 . ··· .  i=1
0 0 ··· g(J(ζr , mr ))
Ahora, usando el Lema anterior, tendremos:
r
X
rank (g(C(f )))) = max{0, mi − ordζi (g)}.
i=1

Escribamos νi := ordζi (g) por simplicidad notacional. Para concluir, probemos que la suma
descrita a la derecha es igual a deg(f ) − deg(h) donde h es el gcd(f, g).
Supongamos, entonces, que
Yr
g = p(X) (X − ζi )νi ,
i=1
donde p(ζi ) 6= 0 para todo i y νi = ordζi (g). El máximo común divisor de g y f vendrá dado
por la igualdad
Y r
h(X) := (X − ζi )min{mi ,νi } .
i=1
Luego
r
X
deg(h) = min{mi , νi }.
i=1
Pero, nótese que
mi − min{mi , νi } = max{0, mi − νi }.
Por tanto,
r
X r
X r
X
deg(h) = min{mi , νi } = mi − max{0, mi − νi } = deg(f ) − rank (g(C(f ))) ,
i=1 i=1 i=1

como se pretende en el enunciado. 

Observación 5.4.8. En el caso de la que la caracterı́stica de los cuerpos K y K es cero, podemos


describir con detalle la matriz g(J(ζ, m)) mediante las derivadas sucesivas
···
 
g(ζ) 0 0 0
0
 g (ζ) g(ζ) 0 ··· 0 
1 00 0
· · ·
 
g(J(ζ, m)) = 
 2 g (ζ) g (ζ) g(ζ) 0 ,

 .. .. .. .. .. 
 . . . . . 
1 (m−1) 1 (m−2) 1 (m−3)
(m−1)! g (ζ) (m−2)! g (ζ) (m−3)! g (ζ) · · · g(ζ)

donde g 0 (α), g 00 (α), . . . , g (m−1) (α) son las sucesivas derivadas.


5.4. FORMA DE JORDAN 281

Corolario 5.4.9. Con las anteriores notaciones, el grado del máximo común dividor de f y g
con f mónico satisface:
deg (gcd(f, g)) = dim ker (Mg ) .
Demostración. Obvio desde lo anterior, dado que
dim (ker (Mg )) = deg(f ) − rank (Mg ) .


Tenemos ası́ el siguiente algoritmo:

Algoritmo 5.4.10 (Cálculo del gcd en dimensión intrı́nseca).

Input: Dos polinomios f, g ∈ K[X], siendo f mónico.

initialize: M := C(f ) % la matriz compañera de g.

eval: N := g(M ) % la matriz de ηf sobre Ag .

compute: β una base ordenada cualquiera de KN := ker(N ) como K−subespacio vectorial de


K[X]/(f )

compute: la matriz B de ηX |KN : KN −→ KN en la base β. % posible por ser


ηX −invariante.

Output: h(X) := χB (X) := det(XId − B) % el polinomio caracterı́stico de B (que es, a la


vez, su polinomio mı́nimo).
%: El output es el máximo común divisor de f y g.

end

Proposición 5.4.11. Con las notaciones del algoritmo precedente, sean f, g ∈ K[X] y sea
h := gcd(f, g) y supongamos que h es mónico. Consideremos el anillo R := K[X]/(f ) y las
homotecias ηg , ηh : R −→ R. Se tiene:
i) Los subespacios ker(ηh ) = ker(ηg ) y las dimensiones como K−espacios vectoriales
satisfacen:
dimK (ker(ηh )) = dimK (ker(ηg )) = deg(h).
ii) Sea f1 ∈ K[X] polinomio mónico tal que hf1 = f , sea a = (f1 ) ⊆ K[X] el ideal que
genera f1 (y que es un ideal que contiene al ideal (f ) generado por f en K[X]. Sea
a/(f ) su proyección al anillo de restos R = K[X]/(f ). Entonces,
ker(ηh ) = ker(ηg ) = a/(f ).
Más aún, el siguiente conjunto es una base de ker(ηg ) como K−subespacio:
B := {f1 , Xf1 , X 2 f1 , . . . , X deg(h)−1 f1 },
donde X i f1 = X i f1 + (f ) es la clase de X i f1 módulo (f ).
iii) El subespacio K := ker(ηg ) es un subespacio ηX −invariante (i.e. ηX (K) ⊆ K) y tiene
sentido considerar el siguiente endomorfismo de espacios vectoriales:
ηX : K −→ K.
iv) La matriz del endomorfismo ηX : K −→ K en la base B es la matriz compañera de
h.
En particular, el máximo común divisor de f y g es precisamente el poliomio caracterı́stico de
la restricción de ηX a ker(ηg ).
Demostración. Probaremos cada una de las propiedades indicadas:
282 5. TEOREMA CHINO DE LOS RESTOS

i) Para la primera propiedad, comencemos observando que


dimK (ker(ηg )) = deg(f ) − rank(Mg ) = deg(gcd(f, g)) = deg(h).
Pero también es cierto que gcd(f, h) = h, por lo que también tenemos:
dimK (ker(ηh )) = deg(f ) − rank(Mh ) = deg(gcd(f, h)) = deg(h).
De otro lado si q + (f ) ∈ R es un elemento tal que ηh (q + (f )) = hq + (f ) = 0 + (f ),
como h | g, si g = hg1 , entonces,
ηg (q + (f )) = gq + (f ) = (g1 + (f )) (hq + (f )) = (g1 + (f )) (0 + (f )) = 0 + (f ).
Por tanto, hemos probado que ker(ηh ) ⊆ ker(ηg ) y, como ambos son subespacios vec-
toriales de igual dimensión y ésta es, además, finita, concluimos la igualdad ker(ηh ) =
ker(ηg ).
ii) Sea q ∈ K[X] un polinomio cualquiera y consideremos la clase qf1 + (f ). Entonces,
ηh (qf1 + (f )) = qhf1 + (f ) = qf + (f ) = 0 + (f ).
Por tanto, el ideal cociente satisface:
a/(f ) ⊆ ker(ηh ) = ker(ηg ).
De otro lado, sea q + (f ) un elemento de ker(ηh ). Entonces, f | qh, luego existe
q 0 ∈ K[X] tal que q 0 f = qh. Por tanto, tenemos
q 0 f1 h − hq = 0 =⇒ h(q 0 f1 − q) = 0 =⇒ q 0 f1 = q =⇒ q ∈ a.
Por tanto, ker(ηh ) ⊆ a/(f ) y tenemos la igualdad buscada.
De otro lado, tenemos que el K−subespacio generado por la familia B está contenido
en a/(f ) = ker(ηh ). Por otro lado, sea q ∈ a. Entonces, q = q 0 f1 y supongamos
q 0 = q 00 h + r, donde deg(r) ≤ deg(h) − 1. Tendremos que
q + (f ) = q 0 f1 + (f ) = ((q 00 h + r)f1 ) + (f ) = rf1 + (f ).
Como deg(r) ≤ deg(h) − 1, podemos suponero r = at X t + at−1 X t−1 + a0 , con t =
deg(h) − 1. Por tanto, haremos probado que si q ∈ a, entonces
deg(h)−1
X
ai X i f1 + (q) .

q + (f ) = rf1 + (f ) =
i=0
En particular, B es un sistema generador con deg(h) elementos de a/(f ) = ker(ηh ),
que es un subespacio de dimensión deg(h). Por tanto, B es base de ker(ηh ) = ker(ηg ).
iii) Es obvio que si q + (f ) ∈ ker(ηg ), entonces ηX (q + (f )) = Xq + (f ) ∈ ker(ηg ). Es obvio
porque
ηg (Xq + (f )) = Xgq + (f ) = (X + (f ))(gq + (f )) = (X + (f ))(0 + (f )) = 0 + (f ).
iv) Es claro que para cada i, 0 ≤ i ≤ deg(h) − 2, se tiene
ηX (X i f1 ) = X i+1 f1 .
Para el caso i = deg(h) − 1, tendremos que existen a0 , . . . , adeg(h)−1 ∈ K tales que:
deg(h)−1
X
deg(h)
ηX (X deg(h)−1 f1 ) =X f1 + (f ) = (−ai )X i f1 .
i=0
Pdeg(h)−1
Considero el polinomio µ = X deg(h) + i=0 ai X i ∈ K[X]. La última identidad
puede reescribirse mediante
 
deg(h)−1
X
µf1 = X deg(h) + ai X i  f1 ∈ (f ) =⇒ f | µf1 .
i=0

Pero como deg(µf1 ) = deg(µ) deg(f1 ) = deg(h) + deg(f1 ) = deg(f ), y todos son
mónicos, concluimos que µf1 = f , con lo que, por ser K[X] un dominio de integridad,
concluiremos que µ = ff1 = h. En particular, la matriz de ηX en la base B es la
matrix compañera de µ y, por tanto,
MB (ηX ) = C(h).
5.4. FORMA DE JORDAN 283

La conclusión es obvia dado que


det(XIddeg(h) − MB (ηX )) = det(XIddeg(h) − C(h)) = h.


Como conclusión de la Proposición precedente tendremos:


Teorema 5.4.12 (Algoritmo para el gcd con dimensión mı́nima). El anterior algoritmo
calcula el máximo común divisor de f y g. El número de operaciones aritméticas a realizar es
ω
del orden O (deg(g) (deg(f )) ), donde ω es el exponente del álgebra lineal. Nótese que el álgebra
lineal implicada es del orden de deg(f ) para operaciones Gaussianas y deg(gcd(f, g)) para el
cálculo de un polinomio caracterı́stico.
Otra demostación (más explı́cita) de la correctitud del algoritmo.

Demostración. Retomemos las notaciones de la demostración precedente. Sea K una


clausura algebraica de K y trabajemos en K con las formas de Jordan. Suponemos f (X) ∈
K[X] ⊆ K[X] un polinomio mónico de grado n := deg(f ), que factoriza en K[X] del modo
siguiente.
r
Y
f (X) := (X − ζi )mi .
i=1
Pr
En particular tenemos i=1 mi = deg(f ) = m. Para cada i, 1 ≤ i ≤ r consideremos el ideal
ai ⊆ K[X] dado por ai = ((X − ζi )mi ). Consideremos el isomorfismo del Teorema Chino de los
Restos (Teorema 5.2.2) siguiente:
Qr
ϕ : K[X]/(f ) −→ i=1 (K[X]/ai )
(5.4.1)
h + (f ) 7−→ (h + a1 , h + a2 , . . . , h + ar ).
Para cada i, 1 ≤ i ≤ r, consideremos las homotecias siguientes:
i) La homotecia de multiplicación por X sobre K[X]/(f ):
ηX : K[X]/(f ) −→ K[X]/(f )
h + (f ) 7−→ Xh + (f ).
ii) La homotecia de multiplicación por g sobre K[X]/(f ):
ηg : K[X]/(f ) −→ K[X]/(f )
h + (f ) 7−→ gh + (f ).
iii) Para cada i, 1 ≤ i ≤ r, la homotecia de multiplicación por X sobre cada K[X]/ai :
(i)
ηX : K[X]/ai −→ K[X]/ai
h + ai 7−→ Xh + ai .
iv) Para cada i, 1 ≤ i ≤ r, la homotecia de multiplicación por g sobre cada K[X]/ai :
(i)
ηg : K[X]/ai −→ K[X]/ai
h + ai 7−→ gh + ai .
Podemos pasar a los productos, mediante el producto de las homotecias considerando:
(i)
• El producto de las homotecias ηX :
Qr (i) Qr Qr
ηeX := i=1 ηX : i=1 (K[X]/ai ) −→ i=1 (K[X]/ai )
(h1 + a1 , . . . , hr + ar ) 7−→ (Xh1 + a1 , . . . , Xhr + ar ).
(i)
• El producto de las homotecias ηg :
Qr (i) Qr Qr
ηeg := i=1 ηg : i=1 (K[X]/ai ) −→ i=1 (K[X]/ai )
(h1 + a1 , . . . , hr + ar ) 7−→ (gh1 + a1 , . . . , ghr + ar ).
De hecho, los siguientes dos diagramas de K−espacios vectoriales son conmutativos:
284 5. TEOREMA CHINO DE LOS RESTOS

ϕ Qr
K[X]/(f ) i=1 (K[X]/ai )

ηX ηeX

Qr
K[X]/(f ) i=1 (K[X]/ai )
ϕ

ϕ Qr
K[X]/(f ) i=1 (K[X]/ai )

ηg ηeg

Qr
K[X]/(f ) i=1 (K[X]/ai )
ϕ

Es decir, se verifican las dos igualdades siguientes:

(5.4.2) ηeX ◦ ϕ = ϕ ◦ ηX , ηeg ◦ ϕ = ϕ ◦ ηg .


Probemos una de ellas, la otra será análoga. Ası́, consideremos h + (f ) ∈ K[X]/(f ), entonces,
ηeg ◦ ϕ(h + (f )) = ηeg (h + a1 , . . . , h + ar ) = (gh + a1 , . . . , gh + ar ) = ϕ(gh + (f )) = ϕ ◦ ηg (h + (f )).
Veamos varias propiedades que se infieren de estos diagramas conmutativos:
Qr
• Fijado cualquier par de bases ordenadas Θ en K[X]/(f ) y β en i=1 (K[X]/ai ), se
tiene que las correspondientes matrices verifican:
M (ηX ) := M (ϕ)−1 M (e
ηX )M (ϕ),

M (ηg ) := M (ϕ)−1 M (e
ηg )M (ϕ),
Siendo M (ϕ) ∈ GL(n, K) una matriz regular (porque corresponde a un isomorfismo
de espacios vectoriales.
• Para cada i, 1 ≤ i ≤ r, consideramos la base βi de K[X]/ai dada por (ver Proposición
5.4.1 anterior):
(5.4.3) βi := {1 + ai , (X − ζi ) + ai , . . . , (X − ζi )mi −1 + ai }.
Qr
• Definamos para el espacio vectorial producto i=1 (K[X]/ai ), la base natural del
espacio producto dada mediante:
r
[ r
Y
β := {0}i−1 × βi × {0}r−i ⊆ (K[X]/ai ) .
i=1 i=1

• La matriz en la base β de ηX es dada por una suma de cajas de Jordan asociada a los
ceros de f contando su mutiplicidad:
 
J(ζ1 , m1 ) 0 ··· 0
 0 J(ζ2 , m2 ) ··· 0 
Mβ (eηX ) = 
 
.. . . .. 
 . . ··· . 
0 0 ··· J(ζr , mr )
5.4. FORMA DE JORDAN 285

• La matriz de ηeg en la base β viene dada por:


 
g(J(ζ1 , m1 )) 0 ··· 0
 0 g(J(ζ 2 , m2 )) ··· 0 
Mβ (e
ηg ) = g(Mβ (e
ηX )) =  .
 
.. . . ..
 . . ··· . 
0 0 ··· g(J(ζr , mr ))
• Definamos la base Θ de K[X]/(f ) mediante
Θ := ϕ−1 (β) ⊆ K[X]/(f ).
Entonces,
Qr la matriz del isomorfismo ϕ en las bases respectivas Θ en K[X]/(f ) y β en
i=1 (K[X]/a i ), verifica que:

MΘ,β (ϕ) := Idn .


• De lo anterior se infiere que las matrices de ηX y ηg en la base Θ son respectivamente:
 
J(ζ1 , m1 ) 0 ··· 0
 0 J(ζ2 , m2 ) ··· 0 
(5.4.4) MΘ (ηX ) = Mβ (e ηX ) = 
 
.. . .. .. 
 . ··· . 
0 0 ··· J(ζr , mr ).
 
g(J(ζ1 , m1 )) 0 ··· 0
 0 g(J(ζ2 , m2 )) · · · 0 
(5.4.5) MΘ (ηg ) = Mβ (e
ηg ) =  .
 
.. .. ..
 . . ··· . 
0 0 ··· g(J(ζr , mr ))
Podemos ahora considerar la base ordenada Θ := {v1 , . . . , vn } y descoponerla en los trozos:
Θi := {vPi−1 mk +1 , . . . , vPik=1 mk } = {vi,1 , . . . , vi,m1 }.
k=1

Nótese que son los trozos ordenados de la base Θ ue se corresponde con los bloques de Jordan
J(ζi , mi ) y g(J(ζi , mi )). De hecho, podemos observar los siguiente:
• Los subespacios vectorials Vi ⊆ K[X]/(f ) generados por la subbase Θi son invariantes
por ηX y la matriz en la base Θi de Vi de ηX : Vi −→ Vi es dada mediante:
(5.4.6) MΘi (ηX ) = J(ζi , mi ) ∈ Mmi (K).
• Los subespacios vectorials Vi ⊆ K[X]/(f ) generados por la subbase Θi son invariantes
por ηg y la matriz en la base Θi de Vi de ηg : Vi −→ Vi es dada mediante:
MΘi (ηg ) = g(J(ζi , mi )) ∈ Mmi (K).
Ambas afirmaciones son consecuencia inmediata de tener forma de suma diagonal de cajas las
matrices asociadas a ηX y ηg en la base
Θ := Θ1 ∪ · · · ∪ Θr .
Supongamos que, para cada i, 1 ≤ i ≤ r, g factoriza en K[X] del modo siguiente:
g(X) := hi (X)(X − ζi )ti ,
donde hi (ζi ) 6= 0 y ti := ordζi (g). Entonces, tendremos que:
t
g(J(ζi , mi )) = hi (J(ζi , mi )) (J(ζi , mi ) − ζi Idmi ) i = hi (J(ζi , mi ))J(0, mi )ti ,
donde hi (ζi , mi ) ∈ GL(mi , K) es una matriz regular.
Ahora retomamos el Lema 5.4.5 sobre matrices nilpotentes y concluimos que:
• Si ti < mi se tiene:  
0 0
J(0, mi )ti = ,
Idmi −ti 0
donde Idmi −ti es la matriz identidad (mi −ti )×(mi −ti ) y los 0’s representan matrices
rectangulares de tamaño apropiado.
• Si ti ≥ mi tenemos directamente J(0, mi )ti = 0 ∈ Mmi (K).
Construyamos el trozo de base siguiente:
286 5. TEOREMA CHINO DE LOS RESTOS

• Si ti < mi definamos el conjunto de los ti últimos vectores de Θi , que son linealmente


independientes:
e i := {vi,m −t +1 , . . . , vi,m }.
Θ i i i

• Si ti ≥ mi definamos Θi := Θi .
e
Observamos que Θe i es la base de la intersección siguiente:
e i i = ker(ηg ) ∩ Vi .
KhΘ
La prueba es obvia dada la forma de las matrices g(J(ζi , mi ) discutida más arriba. Juntemos
estos trozos de base para defnir en conjunto de vectors linealmente independientes:
Θ e1 ∪ · · · ∪ Θ
e := Θ e r ⊆ Θ.
Son vectores linealmente independientes dado que son una unión disjunta de vectores que forman
parte de la base Θ. Además, Θ e ⊆ ker(ηg ) por construcción. Finalmente, ker(ηg ) que es
invariante por ηg se descompone mediante:
ker(ηg ) = (ker(ηg ) ∩ V1 ) ⊕ · · · (ker(ηg ) ∩ Vr ) ,
luego Θ
e es una base de ker(ηg ). Se tiene:

KhΘi
e = ker(ηg ).
Observemos seguidamete que ker(ηg ) es invariante por la acción de ηX . De hecho, si h + (f ) ∈
ker(ηg ), tendremos que
ηX (ηg (h + (f ))) = ηg (ηX (h + (f ))) = 0 + (f ).
Podemos construir, por tanto, el endomorfismo:
(5.4.7) ηX : ker(ηg ) −→ ker(ηg ).
Calculemos la matriz de ηX en la base Θ e que acabamos de construir.
Para cada i, 1 ≤ i ≤ r, consideremos un vector vi,k ∈ Θ
e i ⊆ Θ,
e con mi − ti + 1 ≤ k ≤ mi . Nótese
que vi,k ∈ Vi y que Θ
e i ⊆ Θi . Conforme a la Igualdad (5.4.6), la matriz de ηX en la base Θi es
dada mediante J(ζi , mi ). Por tanto, se tiene:
• Si mi − ti + 1 ≤ k ≤ mi − 1, la imagen de vi,k verifica:
ηX (vi,k ) = ζi vi,k + vi,k+1 .
• Si k = mi , la imagen de vi,k verifica:
ηX (vi,k ) = ζi vi,k .
Esta dos identidades se verifican observando simplemente la forma de J(ζi , mi ) en la base Θi
de Vi .
Por tanto, la matriz de ηX restringida a ker(ηg ) ∩ Vi en la base θei tiene la forma:

J(ζi , ti ) si ti < mi
MΘ (η
ei X ) = J(ζ i , min{t i , mi } =
J(ζi , mi ) si ti ≥ mi
Finalmente, la matriz de ηX en la base Θ e de ker(ηg ) toma la forma:
 
J(ζ1 , min{t1 , m1 }) · · · 0
MΘ .. .. ..
e (ηX ) =  .
 
. . .
0 · · · J(ζr , min{tr , mr })
Por tanto, el polinomo caracterı́stico de MΘ
e (ηX ) satisface
r
Y
χM e (ηX ) (T ) :=
Θ
(X − ζi )min{ti ,mi } = gcd(f, g),
i=1

poque ti = ordζi (g) mientras que mi = ordζi (f ).


Ahora bien, todo el esfuerzp hecho en la prueba ha consistido en hallar la base Θ
e de ker(ηg ) en
la que el enodomorfismo ηX toma forma de suma diagonal de bloques de Jordan. Pero esto se
hace para demostrar que el polinomio caracterı́stico del endomorfismo siguiente:
ker
ηX := ηX |ker(ηg ) : ker(ηg ) −→ ker(ηg ),
5.4. FORMA DE JORDAN 287

satisface
χηker = gcd(f, g).
X

Pero el polinomio caracterı́stico no depende de la base de ker(ηg ) elegida. Y como ker(ηg ) es un


subespacio de K[X]/(f ), entonces podemos hallar cualquier base de ker(ηg ), hallar la matriz
de ηX en esa base (porque ker(ηg ) es invariante por ηX ) y hallar el polinomio caracterı́stico
de turno que es independiente de la base elegida. Esto prueba la correctitud del algoritmo
introducido. 

5.4.3. Ejercicios y problemas de la Sección 5.4.


Problema 211 (Funciones polinomiales y cuerpos finitos). Sea K un cuerpo y consider-
emos el anillo K[K] de las aplicaciones polinomiales K−definibles sobre K. Sea I(K) ⊆ K[X]
el ideal formado por todos los polinomios p ∈ K[X] que se anulan idénticamente sobre K. Para
cada punto ζ ∈ K sea mζ el ideal de todos los polinomios que se anulan sobre ζ. Se pide:
i) Probar que K es un cuerpo finito si y soamente si I(K) 6= (0).
ii) Probar que K es algebraicamente cerrado si y sólo si se verifica:
 
[
K[X] \  mζ  = ∅
ζ∈K

iii) Probar que si K tiene, al menos, n elementos distintos α1 , . . . , αn ∈ K, para todo


m ∈ N, m ≥ n − 1 el ideal intersección n := ∩ni=1 mαi verifica que n ∩ K[X]m es un
espacio vectorial de dimensión m − n + 1.
iv) Concluir si K tiene, al menos, n elementos distintos α1 , . . . , αn ∈ K, entonces
las soluciones de un problema de interpolación con datos (b1 , . . . , bn ), punto α =
(α1 , . . . , αn ) ∈ K n , y grado m ≥ n − 1 es una variedad afı́n lineal de dimensión
m − n + 1.
Problema 212. Sean f1 , . . . , fr ∈ K[X] polinomios univariados y consideremos el K[X]−módulo
r
Y
M := K[X]/(fi ).
i=1

Sea a := AnnK[X] (M ) := {h ∈ K[X] : h ∗ m = 0, ∀m ∈ M }. Se pide:


i) Probar que el mı́nimo común múltiplo de f1 , . . . fr está en a. Concluir que el producto
de todos ellos está también en a.
ii) Discutir si a es el ideal generado por el mı́nimo común múltiplo de f1 , . . . , fr .
Problema 213. Hállense los polinomios mı́nimos y caracterı́stico de los siguientes endomor-
fismos sin calcular ni un sólo determinante, ni ningún valor propio:
i)
 
2 3 0
M1 :=  1 −2 3 .
−1 2 4
ii)
√ 
2 1
√ 0
M2 :=  0 − 2 √1 .

0 0 2
Problema 214. Hállese el máximo común divisor de los polinomios siguientes usando el álgebra
lineal de dimensión mı́nima:
i) gcd(f, g), donde f := X 8 − 1, g = X 2 + X + 1.
ii) gcd(f, g), donde f := X 2 − 1, g = X 7 + X + 1.
Problema 215 (Matrices diagonalizables: separabilidad). Pruébese la equivalencia sigu-
iente para un cuerpo K cualquiera y un endomorfismo M ∈ Mn (K) con polinomio mı́nimo
m(X) ∈ K[X].
288 5. TEOREMA CHINO DE LOS RESTOS

• El ideal generador por m en K[X] (el Anulador de la matriz M , (m) = AnnK[X] (M ))


es un ideal radical (i.e. el anillo cociente K[X]/AnnK[X] (M ) no tiene elementos
nilpotentes.
• El endomorfismo M es diagonalizable sobre alguna clausura algebraica K de K, es
decir, existen matrices P ∈ GL(n, K) y valores ζ1 , . . . , ζn ∈ K, tales que
 
ζ1 0 · · · 0
 0 ζ2 · · · 0 
P M P −1 =  . . .
 
 .. ..
. .. 
0 0 ··· ζn

Problema 216 (Discriminante de un polinomio). Sea K un cuerpo primo. Sea f ∈ K[X]


un polinomio mónico y sea f 0 ∈ K[X] la derivada de f con respecto a la vaiable X. Supongamos
que f 0 6= 0. Consideremos la matriz

DX (f, f 0 ) := f 0 (C(f )).

Se pide:
i) Probar que del determinante

DiscX (f ) := det (f 0 (C(f ))) ∈ K,

es un polinomio en los coeficientes de f . Se le denomina el discriminante del polinomio


f . Halla una cota para
Qrsu grado.
ii) Prueba que si f := i=1 (X − αi )si es una factorización de f en alguna clausura
algebraica de K, entonces
s
Y
DiscX (f ) := f 0 (αi )si .
i=1

iii) Halla el valor DiscX (f ) cuando f = X 2 + bX + c. Idem con los polinomios mónicos
genérios de grados 3 y 4.
iv) Concluye que f no posee factores múltiples en K[X] si y solamente si DiscX (f ) = 0.
v) Conluye que la matrix compañera C(f ) es diagonalizable si y solamente si DiscX (f ) 6=
0.
vi) Diseña un algoritmo que realice la siguiente tarea:
Dada una matrix A ∈ Mn (K), decide si A es diagonalizable sobre alguna clausura
algebraica de K.

Problema 217 (Ecuaciones diferenciales homogéneas con coeficientes constantes).


Definamos el siguiente conjunto:

C ω (R, C) := {f : R −→ C : f es analı́tica}.

Probar que C ω (R, C) es un anillo conmutativo con unidad. Denotemos este anillo por R :=
C ω (R, C) y sean Mn (C) y Mn (R) respectivamente, las matrices n × n con coordenadas en C y
R. Para una matriz A ∈ Mn (C), consideraremos sistemas de ecuaciones diferenciales lineales
homogéneos coeficientes constantes con condición inicial de la forma siguiente:

A · X(t) = Ẋ(t),
(5.4.8)
X(0) = v,

donde
   0   
x1 (t) x1 (t) v1
X(t) :=  ...  , Ẋ(t) :=  ...  , v =  ..  ∈ Cn .
    
. 
xn (t) x0n (t) vn
Dada una caja de Jordan J(λ, m) ∈ Mm (C), definamos la matriz
5.4. FORMA DE JORDAN 289

 
1 0 0 ··· 0

 t 1 0 ··· 0 

t2
eJ(λ,m)t λt 
:= e 

2! t 1 ··· 0 
.
.. .. .. .. .. 

 . . . . . 

tm−1 tm−2 tmi −3
(m−1)! (m−2)! (m−3)! ··· 1
Se pide:
i) Probar que eJ(λ,m)t ∈ Mm (C ω (R, C)).
ii) Probar que una solución en C ω (R, C)n de la ecuación diferencial dada por la Ecuación
(5.4.8), tomando A = J(λ, m) es la dada mediante:
   
x1 (t) v1
 ..  J(λ,m)t  .. 
 . =e  . .
xn (t) vn
iii) Sean A, B ∈ Mn (C) dos matrices complejas semejantes. Sea P ∈ GL(n, C) tal que
P AP −1 = B.
Probar que las soluciones de la Ecuación Diferencial (5.4.8) están en biyección con
las soluciones de la siguiente Ecuación Diferencial:

B · Y (t) = Ẏ (t),
(5.4.9)
X(0) = w,
donde w = P −1 v ∈ Cn . ( Pista: Probar que la relación Y 7−→ X = P −1 Y define la
biyección entre las soluciones).
iv) Dada la matriz A ∈ Mn (C) suma diagonal de cajas de Jordan siguiente:
 
J(λ1 , m1 ) 0 ··· 0
 0 J(λ2 , m2 ) · · · 0 
A :=  .
 
.. . .. .
..
 . 
0 0 ··· J(λr , mr )
Probar que una solución de la Ecuación Diferencial (5.4.8) para esta matriz A viene
dada mediante:
   J(λ ,m )t  
x1 (t) e 1 1 ··· 0 v1
 ..  At .
. . . .
.   .. 
X(t) =  .  = e v :=   . .

. . .
J(λr ,mr )t
xn (t) 0 ··· e vn
v) Dar una expresión general de la solución de la Ecuación Diferencial (5.4.8) usando la
forma canónica de Jordan de la matriz A y la matriz de paso P ∈ GL(, n, C).
Problema 218. Sea f ∈ C{X − ζ} una serie de Taylor de una función analı́tica compleja
(función holomorfa). Sea J(ζ, m) un bloque de Jordan de valor propio ζ y orden m. Prueba
que
rank(f (J(ζ, m)) = max{0, m − ordζ (f )}.
5.4.3.1. El algoritmo de Csanky-Leverrier-Fadeev-Souriau. En esta subsección
vamos a presentar un algoritmo eficiente para el cálculo del determinante de una matriz conocido
como el algoritmo de simultáneamente debido a los siguientes autores:
• L. Csanky (cf. [Csa, 1976]).
• V.N. Faddeeva (En el texto de V. N. Fadeeva : V. N. Fadeeva, “Computational Methods
of Linear Algebra” (versión española V.N. Fadeeva, Métodos de Cálculo de Algebra
Lineal. Paraninfo, 1972.) se le asigna la autorı́a de la recuperación del método de Le
Verrier a D. K. Fadeev en su trabajo (en ruso) : D.K. Fadeev, I.S. Sominskii, Sbornik
zadach po vysshei algebry ( Colección de Problemas en Álgebra Superior). Moscú,
1949. La versión bien paralelizable es descrita en [Fad, 77].
290 5. TEOREMA CHINO DE LOS RESTOS

• U. Le Verrier (Aunque sus principales actividaes cientı́ficas estuvieron ligadas a la As-


tronomı́a, incluso como precursor de la Teorı́a de la Relatividad de Einstein-Poincaré,
aquı́ nos referimos al algoritmo de Urbain Le Verrier (1811-1877) profesor de la École
Polytechnique, para el cálculo del polinomio caracterı́stico de una matriz. Se trata del
trabajo de 1840 [LeV, 1840].
• J.M. Souriau (cf. [Sou, 1965]).
Se usan las técnicas descritas en el problema 113 y en la Subsección de Problemas relativas a
las Sumas de Newton y su relación con las funciones simétricas Elementales (Subsección 2.3.4.2
Problema 219 (Csanky-Leverrier-Fadeev-Souriau). Sea R un dominio de integridad y
n ∈ N de tal modo que {1, 2, . . . , n} ⊆ R× son uidades. Prueba que el siguiente algoritmo cal-
cula el polinomio caracterı́stico de una matriz M ∈ Mn (R), realizando O(n4 log2 n) operaciones
aritméticas elementales en R:

Algoritmo 5.4.13 (Cálculo del Polinomio caracterı́stico via sumas de Newton).

Input: Una matriz A ∈ Mn (R), donde R es un dominio tal que {1, 2, . . . , n} ⊆ R× .

for i = 0 to n, eval Ni := T r(Ai )


% Obsérvese que se calculan las sumas de Newton de los valores propios de M en
una clausura algebraica del cuerpo de fracciones de R, aunque no los sepamos calcular.

Solve la recurrencia lineal:


 P 
k−1
 σk = k1

i=0 (−1) i+1
σ k−i N i , 2≤k≤n
(5.4.10) σ1 = N1 ,

σ0 = 1,

Output: σ0 , σ1 , . . . , σn .
End

Problema 220. Al principio del Capı́tulo aparece una frase que I. Newton escribió en respuesta
a su competidor R. Hooke. Sin embargo, la frase “like dwarfs standing on the shoulders of
giants” no es originaria de Newton. Busca su origen y explica su significado. ¿Pensaba Newton
que él era bajito de estatura?, ¿Crees que la sociedad actual conoce el sentido y significado de
esa frase?.
Cuestión 1. Se proponen varias tareas:
• Localiza el siguiente texto de A. Grothendieck “Allons-nous continuer la recherche
scientifique ? ”.
• Tradúcelo, haya su fuente, dale un contexto. Especialmente, averigua quién fue A.
Grothendieck e interpreta lo que quiere decir con el discurso completo.
• Traduce la expresión “C’est un con”, en el contexto del que habla Grotendieck. Explica
por qué él la considera detestable y expresa algún argmento por el que esa expresión y
todas sus traduciones a cada uno de los idiomas actuales o futuros, deberı́an prohibirse,
explusarse del mundo Matemático y, en general, del mundo cientı́fico.
• Explica si existe un abuso de semejantes descalificaciones en Twiter sobre cualquier
aspecto de la vida o en el contexto educativo sobre los alumnos. ¿Crees que deberı́a
mantenerse o exluirse?, ¿Es un debate nuevo o viejo?.
• Busca en la Biblioteca de la UC algún otro texto de A. Grothendieck distinto de su
tesis y sus primeros trabajos (o sea, busca algún EGA o SGA, que alguna hay). Trata
de leerlo y resume su contenido, desde tu punto de vista.
• Responde, desde tu perspectiva: ¿Son las Matemáticas un hecho individual o social?.
5.4. FORMA DE JORDAN 291

“...Pour illustrer ce point, j’aimerais donner ici un exemple très concret. Je suis allé, il y a
deux semaines, faire un tour en Bretagne. J’ai eu l’occasion, entre autres, de passer à Nantes
où j’ai vu des amis, où j’ai parlé dans une Maison de Jeunes et de la Culture (MJC) sur le
genre de problèmes que nous abordons aujourd’hui. J’y étais le lundi. Comme les collègues
de l’Université de Nantes étaient avertis de ma venue, ils avaient demandé in extremis que je
vienne, le lendemain après-midi, pour faire une causerie sur des sujets mathématiques avec eux.
Or il s’est trouvé que, le jour même de ma venue, un des mathématiciens de Nantes, M. Moli-
naro, s’est suicidé. Donc, à cause de cet incident malheureux, la causerie mathématique qui
était prévue a été annulée. Au lieu de ceci, j’ai alors contacté un certain nombre de collègues
pour demander s’il était possible que l’on se réunisse pour parler un peu de la vie mathématique
à l’intérieur du département de mathématiques à l’Université et pour parler également un peu
de ce suicide. Il y a eu une séance extrêmement révélatrice du malaise général, cette après-midi
là à Nantes, où manifestement tout le monde présent -avec une exception je dirais- sentait bien
clairement que ce suicide était lié de très près au genre de choses que, précisément, on discutait
la veille au soir à la MJC.
En fait, je donnerai peut-être un ou deux détails. Il s’est trouvé que Molinaro avait deux
thésards auxquels il faisait faire des thèses de troisième cycle - je crois que ce n’était pas des
thèses d’état. Or, ces thèses furent considérées comme n’étant pas de valeur scientifique suff-
isante. Elles furent jugées très sévèrement par Dieudonné qui est un bon collègue à moi et avec
lequel j’ai écrit un gros traité de géométrie algébrique. Je le connais donc très bien, c’est un
homme qui a un jugement scientifique très sûr, qui est très exigeant sur la qualité d’un travail
scientifique. Ainsi, alors que ces thèses étaient discutées par la Commission pour l’inscription
sur la liste d’aptitude aux fonctions de l’Enseignement Supérieur, il les a saqués et l’inscription
a été refusée. Ceci, bien entendu, a été ressenti comme une sorte d’affront personnel par Moli-
naro qui avait déjà eu des difficultés auparavant et il s’est suicidé sur ces circonstances. En fait,
j’ai eu un ami mathématicien, qui s’appelait Terenhôfel qui s’est également suicidé. Je connais
un certain nombre de mathématiciens - je parle surtout ici de mathématiciens puisque c’est le
milieu que j’ai le mieux connu -qui sont devenus fous.
Je ne pense pas que cela soit une chose propre aux mathématiques. Je pense que le genre,
disons, d’atmosphère qui prévaut dans le monde scientifique, qu’il soit mathématique ou non,
une sorte d’atmosphère à l’air extrêmement raréfié, et la pression qui s’exerce sur les chercheurs
sont pour beaucoup dans l’évolution de ces cas malheureux.
Ceci concernant le plaisir que nous prenons à faire de la recherche scientifique. Je crois qu’il
peut y avoir plaisir, mais je suis arrivé à la conclusion que le plaisir des uns, le plaisir des gens
haut placés, le plaisir des brillants, se fait aux dépends d’une répression véritable vis-à-vis du
scientifique moyen....
Mais, d’autre part, quand je parle d’une vie qui est digne d’être vécue, il ne s’agit pas seulement
de ma vie à moi, il s’agit de la vie de tous. Et je me rends compte que l’épanouissement que j’ai
pu réaliser dans une direction très limitée se faisait au dépends des possibilités d’épanouissement
d’autres personnes. Si certaines personnes se sont trouvées sous une pression psy-
chologique si forte qu’elles en sont parfois venues au suicide, c’est bien à cause
d’un consensus dominant qui faisait que la valeur de la personne était jugée, par
exemple, d’après sa virtuosité technique à démontrer des théorèmes, c’est-à- dire
à effectuer des opérations excessivement spécialisées - alors que, précisément, tout
le reste de lapersonne était complètement laissée dans l’ombre. C’est une chose que
j’ai expérimenté maintes fois. Quand on parle d’une certaine personne et que je demande “Qui
est-ce ?”, on me répond “C’est un con”, En voulant dire par là, entre mathématiciens, que
c’est un type qui soit démontre des théorèmes qui ne sont pas très intéressants, soit démontre
des théorèmes qui sont faux, ou bien ne démontre pas de théorèmes du tout.
Donc, là, j’ai défini un peu négativement ce que j’entends par une vie qui soit digne d’être
vécue. Je pense que, pour tout le monde, il y a possibilité d’épanouissement sans
que nous soyons jugés par les autres, par des critères aussi étroits, aussi étriqués.
En fait, je pense que cette échelle de valeurs a un effet directement mutilant sur
les possibilités d’épanouissement. Enfin, c’est un des aspects, je ne prétends pas répondre
ici à la question soulevée qui est très vaste ; mais dans l’optique où nous nous plaçons ici, en
partant de la pratique scientifique, c’est ce que je vois de plus immédiat à répondre....”
CAPı́TULO 6

Factorización de elementos e ideales: Las ideas de Gauss,


Lasker y Noether.
(“...hac re copiose loqui superfluum foret.” (Gauss)
“Meine Methoden sind Arbeits- und
Auffassungsmethoden...” (Noether))

“...les charmes enchanteurs de cette sublime science ne se


décèlent dans toute leur beauté qu’à ceux qui ont le courage
de l’approfondir.”
(C.F. Gauss, 1807)
“Problema, numeros primos a compositis dignoscendi, hosque
in factores suos primos resolvendi, ad gravissima ac
utilissima totius arithmeticae pertinere, et geometrarum tum
veterum tum recentiorum industriam ac sagacitatem
occupavisse, tam notum est, ut de hac re copiose loqui
superfluum foret. . . . [P]raetereaque scientiae dignitas
requirere videtur, ut omnia subsidia ad solutionem
problematis tam elegantis ac celebris sedulo excolantur”.
(C.F. Gauss, Disquisitiones Arithmeticae, 1801)

“Meine Methoden sind Arbeits- und Auffassungsmethoden,


und daher anonym überall eingedrungen.”
Emmy Noether, 1931.
(Texto de una carta de Noether a Hasse de 1931. Traducido
libremente como “Mis métodos son métodos de trabajo
([Arbeitssung Methoden]) y métodos conceptuales
([Auffassung Methoden]), y han penetrado anónimamente
por todas partes”.

293
294 6. FACTORIZACIÓN: GAUSS, LASKER. NOETHER

Índice
6.1. Introducción 294
6.2. Dominios de factorización única: Lema de Gauss 295
6.2.1. Dominios de factorización única 295
6.2.2. Máximo común divisor en dominios de factorización única 298
6.2.3. El Lema de Gauss 301
6.2.4. Ejercicios y problemas de la Sección 6.2 305
6.2.4.1. Ley de Reciprocidad Cuadrática. 307
Sı́mbolo de Legendre. 307
La Construcción de Einsenstein 308
Una Reflexión sobre la Construcción de Einsenstein 310
El Lema de Einsenstein (1859) 310
6.2.4.2. (Otro) Lema de Gauss 311
6.2.4.3. Ley de Reciprocidad Cuadrática de Jacobi 312
Sı́mbolo de Jacobi. 312
Ley de Reciprocidad Cuadrática para el sı́mbolo de Jacobi 313
6.2.4.4. El test de R. Solovay y V. Strassen 313
6.3. El Teorema de Lasker-Noether (Existencia): “factorizando”
ideales en anillos noetherianos 314
6.3.1. Radical de un Ideal 315
6.3.2. Ideales Primarios 318
6.3.3. Descomposición Primaria en anillos noetherianos: Teorema de Lasker-
Noether 323
6.3.4. Unicidad (Primer Teorema): descomposición primaria, asociados e ideales
primos minimales de un anillo noetheriano 325
6.3.4.1. Unas palabras sobre los ideales primos minimales en Spec(R), con
R noetheriano. 328
6.3.5. Ejercicios y Problemas de la Sección 6.3 330
6.3.5.1. Cociente de Ideales 330
6.3.5.2. El Teorema de Lasker-Noether para módulos noetherianos 330
6.3.5.3. Anillos y módulos de Artin 333

6.1. Introducción
Ya vimos en la Sección 3.3 la noción de anillo noetheriano y cómo esa noción permite concluir
que un caso particular (los DIP’s) admiten factorización de sus elementos. Vimos el Teorema
de la Base de Hilbert en la Sección ?? que muchos anillos no principles son noetherianos (como
Z[X], K[X1 , X2 , X3 ] y otros). Más aún hay anillos que no son dominios y sı́ son noetherianos
(simplemente por paso al cociente con un ideal que no sea primo). Pero nos queda la pregunta
de si es posible alguna forma de factorización de todo tipo de ideales que, en algún sentido,
generaliza los ideales de C.F. Gauss sobre factorización y dominios de factorización única. De
eso nos ocupamos en lo que sigue del Capı́tulo. .
El primer resultado destacable de los anillos noetherianos no fue el de generalizar simplemente
la noción de Hilbert sino el demostrar que, dentro del contexto noetheriano se podı́a extender
la idea de factorizar elementos (como en el Capı́tulo precdente) a la idea de “factorizar” ideales,
aunque no sean principales. Ese es el conocido como Teorema de Lasker-Noether. Dado que los
elementos de un anillo de polinomios K[X1 , . . . , Xn ] se pueden expresar como producto único
de elementos primos, la pregunta natural era extender el concepto a ideales de K[X1 , . . . , Xn ] y
descomponerlos mediante ideales primos y sus potencias. No funcionó la cosa como se esperaba
y hubo que introducir los ideales primarios (que no siempre son potencias de primos).
Fue el alumno de D. Hilbert (y famoso jugador de ajedrez, a quien le interesaban más los tableros
que las matemáticas) E. Lasker, en su trabajo [Lasker, 1905] de 1905, quien demostró que se
podı́an descomponer ideales (en anillos de polinomios y anillos de series de potencias formales)
como intersección finita de ideales “irreducibles”. Pero fue, sin embargo, E. Noether quien lo
generalizó a todo anillo y módulo verificando las condiciones de cadena ascendente numerables
en su trabajo de [Noether, 1921]. Ası́ los anillos neotherianos y el pensamiento noetheri-
ano se transformó en métodos de trabajo y métodos concenptuales (“Methoden...Arbeits- und
6.2. DOMINIOS DE FACTORIZACIÓN ÚNICA: LEMA DE GAUSS 295

Auffassungsmethoden...”) según sus propias palabras. Hemos preferido seguir precisamente el


pensamiento de E. Noether por su elegancia e intensidad, lo que nos lleva a usar una noción
técnica espuria como ideal o submódulo irreducibles(i.e. artificial e innecesaria ’a posteriori’)
en honor de la promotora de la Teorı́a de Anillos en el primer tercio del siglo XIX.
Daremos el Teorema de Existencia de Lasker-Noether en la Sección 6.3. Debe señalarse que:
• La descomposición de ideales cualesquiera sobre anillos noetherianos (incluido el anillo
de polinomios K[X1 , . . . , Xn ] se hace a través de ideales primarios que no siempre son
irreducibles (noción artificiosa de conveniencia) ni primos, ni potencias de primos
(como sı́ sucedı́a con los dominios de factorización única o los ideales principales en
anillos noetherianos).
• La descomposición como intersección de ideales primarios no es única (como en el caso
de factorización única del pensamiento gaussiano), pero admite una cierta unicidad.
Aquı́ daremos un Primer Teorema de Unicidad (ver la Sección 6.3.4) de la descom-
posición primaria en el que se caracterizan los ideales primos asociados. Resultados
de unicidad (también incompleta) más detallados se verán más adelante en el texto.
El caso de la descomposición primaria de módulos sobre anillos noetherianos lo dejaremos para
la Subsección de problemas 6.3.5.2.

6.2. Dominios de factorización única: Lema de Gauss


Trataremos de introducir aquı́ el Lema de Gauss, uno de los resultados clásicos y centrales en
la historia del Álgebra.
6.2.1. Dominios de factorización única.
Definición 73. Dos elementos irreducibles p, q ∈ R en un dominio de integridad R se dicen
co-primos si no son asociados, es decir, si p 6∼ q.

Observación 6.2.1. Nótese que dos irreducibles p y q en un dominio R son co-primos si y


solamente si p - q y q - q.

Definición 74 (Dominios de Factorización Única). Un dominio de integridad R se de-


nomina dominio de factorización única si se verifican las siguientes propiedades:
i) Existencia de Factorización: Para cada elemento x ∈ R \ {0} existen u ∈ R× , un
conjunto finito S := {pi ∈ R ; i ∈ I} ⊆ R de elementos irreducibles, co-primos dos a
dos, y números naturales positivos {αi : i ∈ I} ⊆ N, tales que
Y
x=u pαi .
i

i∈I

Es decir, todo elemento no nulo de R es producto finito (eventualmente vacı́o) de


unidades y elementos irreducibles de R. A la lista formada por la unidad u, los primos
en S y los exponentes αi , se le denomina factorización de x.
ii) Unicidad de la Factorización: Para cada elemento x ∈ R, x 6= 0, dadas dos
factorizaciones: Y Y β
x=u pα
i =v
i
qj j ,
i∈I i∈J
×
donde u, v ∈ R son unidades, I y J son conjuntos finitos, αi , βj ∈ N son números
naturales no nulos y {pi : i ∈ I}, {qj : j ∈ J} son dos conjuntos de elementos
irreducibles y co-primos dos a dos, entonces,
• Los cardinales de I y J coinciden (i.e. ](I) = ](J)).
• Existe una biyección f : I −→ J, tal que
pi ∼ qf (i) , αi = βf (i) , ∀i ∈ I.
Es decir, la factorización es única salvo unidades de R y permutación entre los ı́ndices.

Observación 6.2.2. Obsérvese que, a partir de la Definición anterior, si R es dominio de


factorización única, un elemento u ∈ R que no posea divisores primos es necesariamente una
unidad de R.
296 6. FACTORIZACIÓN: GAUSS, LASKER. NOETHER

Proposición 6.2.3. En dominios de factorización única, un elemento x ∈ R es primo si y


solamente si es irreducible.
Demostración. Esto es válido tanto para elementos nulos como no nulos por ser dominio
de integridad. Como todo primo es irreducible en dominios de integridad, sólo falta probar que
todo elemento irreducible p ∈ R no nulo es primo. Para ello, supongamos a, b ∈ R tales que
p | ab, siendo p irreducible. Entonces, existe h ∈ R tal que ph = ab.
Supongamos tres factorizaciones en irreducibles y unidades (una de a, otra de b y otra de h)
dadas mediante: Y Y β Y θ
a=u pα
i , b=v
i
qj j , h = ω hkk ,
i∈I j∈J k∈T
con las hipótesis habituales. Por tanto, tenemos dos factorizaciones de ab, Una que sale de
reordenar el producto siguiente:

β
Y Y
(6.2.1) ab = uv pα
i
i
qj j ,
i∈I j∈J

y otra que sale de reordenar el producto ph:


!
Y
(6.2.2) ab = ph = ω p hθkk .
k∈T

En todo caso, p aparece con exponente positivo en la factorización de ab = ph, descrita en la


Identidad (6.2.2). Por la unicidad de las factorizaciones en R (que es DFU), los irreducibles que
aparecen en ambas factorizaciones son los mismos salvo permutación o unidad. Luego p tiene
que aparecer con exponente positivo en la factorización de ab descrita en la Identidad (6.2.1).
Por tanto, se tiene que verificar alguna de las propiedades siguientes, luego su disyunción:
[∃i ∈ I, p ∼ pi ] ∨ [∃j ∈ J, p ∼ qj ].
Pero, en este caso, se tiene:
• Si p ∼ pi tendremos que p | a y
• si p ∼ qj , entonces p | b.
Por tanto, concluimos que
[p | a] ∨ [p | b].
con lo que habremos probado la primalidad de p. 

Proposición 6.2.4. Sea R un dominio de integridad. Son equivalentes:


i) Todo elemento es producto finito de unidades y elementos primos.
ii) El anillo R es un dominio de factorización única.
Demostración. Por la Proposición 6.2.3 precedente se tiene inmediatamente la impli-
cación ii) =⇒ i). por tanto, nos concentramos en probar que i) =⇒ ii):
Supongamos que R es un dominio que satisface que todo elemento es producto finito de primos
y unidades. Ya satisface la condición de existencia de factorización porque en dominios de
integridad todo primo es irreducible. Nos queda por ver la Unicidad de la factorización.
Sea, pues, x ∈ R un elemento no nulo con dos factorizaciones:
Y Y β
x=u pα
i =v
i
qj j ,
i∈I i∈J

donde u, v ∈ R× son unidades, I y J son conjuntos finitos, αi , βj ∈ N son números naturales


no nulos y {pi : i ∈ I}, {qj : j ∈ J} son dos conjuntos de elementos primos y co-primos
dos a dos (es decir, ∀i, j ∈ I, i 6= j, pi 6∼ pj y ∀r, s ∈ J, r 6= s, qr 6∼ qs ). Tenemos los casos
siguientes:
• Si x ∈ R× , es decir, si x es unidad, entonces tanto I como J tienen que ser el conjunto
vacı́o. Si no fuera vacı́o alguno de ellos, entonces x no puede ser unidad. En ese caso
la unicidad de la factorización se verifica de manera obvia.
• Si x ∈ R \ (R× ∪ {0}), entonces ni I ni J son conjuntos vacı́os.
6.2. DOMINIOS DE FACTORIZACIÓN ÚNICA: LEMA DE GAUSS 297

Nos ocupamos de este segundo caso. Para cada i ∈ I tenemos que, obviamente,
Y β
pi | x = v qj j .
i∈J

Como pi es primo, debe darse:


[pi | v] ∨ [∃j ∈ J, pi | qj ].
La primera opción no puede darse porque v ∈ R× es unidad, luego se tiene que dar la segunda,
es decir,
∃j ∈ J, pi | qj .
Pero como qj es primo, entonces, es irreducible, con lo que necesariamente, si pi | qj entonces,
pi ∼ qj . Probemos que sólo puede haber un j ∈ J tal que pi | qj .
Si existieran j1 , j2 ∈ J tales que pi | qj1 y pi | qj2 , por ser qj1 y qj2 irreducibles, entonces pi ∼ qj1
y pi ∼ qj2 . Por tanto, qj1 ∼ qj2 y necesariamente j1 = j2 .
Para cada i ∈ I, designemos por σ(i) = j ∈ J al único valor j ∈ J tal que pi | qj (o,
equivalentemente, al único j ∈ J tal que pi ∼ qj . Esto significa que la siguiente es un aplicación:
σ: I 7−→ J
i 7−→ σ(i).
Además, esta aplicación ha de ser inyectiva. Dados i1 , i2 ∈ I tales que σ(i1 ) = σ(i2 ) = j ∈ J.
Entonces tenemos pi1 ∼ qj y pi2 ∼ qj , luego pi1 ∼ pi2 y tendremos que, necesariamente, i1 = 22
y σ es una aplicación inyectiva.
Los mismos argumentos nos permitirán construir una aplicación
τ : J −→ I,
donde τ (j) = i si y solamente si qj ∼ qi . Es claro que τ es inyectiva y es fácil probar que
τ ◦ σ = IdI , σ ◦ τ = IdJ .
Para concluir la unicidad sólo falta concluir que αi = βσ(i) , ∀i ∈ I. Para ello, baste con recordar
que N es totalmente ordenado, con lo que o bien αi ≥ βσ(i) o αi ≤ βσ(i) . Supongamos el primer
caso, esto es, supongamos que αi ≤ βσ(i) . Entonces, tendrı́amos:
   
Y α β −α Y β
x = pα
i
i 
u αi
pk k  = qσ(i) σ(i)
qσ(i)
i
(u−1 v) qj j  .
k∈I\{i} j∈J\{σ(i)}

Además, como pi ∼ qσ(j) , existe ω ∈ R× una unidad tal que


pi = ωqσ(i) .
Nos queda,
   
Y βσ(i) −αi Y β

i
i 
u pα k
= pα
i qσ(i)
i (ω αi u−1 v) qj j  .
k
k∈I\{i} j∈J\{σ(i)}

Sacando “factor común” (R es un dominio), tendremos:


    
Y α β −α Y β
αi 
pi u σ(i)
pk k  − qσ(i)
i
(ω αi u−1 v) qj j  = 0.
k∈I\{i} j∈J\{σ(i)}

Como hemos supuesto que x 6= 0, entonces pi 6= 0 y, dado que R es dominio, tendremos:


    
Y α βσ(i) −αi Y β
u pk k  − qσ(i) (ω αi u−1 v) qj j  = 0,
k∈I\{i} j∈J\{σ(i)}

es decir  
Y β −αi Y β
u pα σ(i)
(ω αi u−1 v) qj j  .
k = qσ(i)
k

k∈I\{i} j∈J\{σ(i)}
298 6. FACTORIZACIÓN: GAUSS, LASKER. NOETHER

Ahora si βσ(i) > αi , tendrı́amos βσ(i) − αi ≥ 1 y, por tanto,


Y α
qσ(i) | u pk k .
k∈I\{i}

Siendo qσ(i) primo, debe ocurrir que ∃k ∈ I, k 6= i tal que qσ(i) | pk , luego qσ(i) ∼ pk y, sabiendo
que qσ(i) ∼ pi , concluirı́amos pi ∼ pk , con k 6= i, lo que es contradictorio con las hipótesis
que satisfacen las dos factorizaciones. Por tanto βσ(i) ≥ αi y βσ(i) 6> αi . Lo cual implica
necesariamente que βσ(i) = αi y tenemos la unicidad de la factorización en R. 

Corolario 6.2.5. Todo dominio euclı́deo (resp. todo dominio de ideales principales) es do-
minio de factorización única.
Demostración. Obvio por los Teoremas 3.4.10 (caso de dominios euclı́deos) y Teorema
3.3.10 (caso de dominios de ideales principales). En ambos Teoremas se prueba la existencia
de factorización en irreducibles. De otro lado, en el Teorema 3.2.14 hemos probado que en los
dominios de ideales principales las nociones de primo e irreducible equivalen. Por tanto, se
tienen las hipótesis de la Proposición previa y tenemos probada la afirmación del Corolario. 

6.2.2. Máximo común divisor en dominios de factorización única.


Proposición 6.2.6. Sea R un dominio de factorización única y sea F ⊆ R un conjunto de
elementos de R tal que F \ {0} =
6 ∅. El siguiente conjunto es un conjunto finito:
Vprin (F) := {p ∈ Spec(R) : F ⊆ p, p es principal}.
Supongamos Vprin (F) = {p1 , . . . , pm } de tal modo que pi = (pi ), 1 ≤ i ≤ m, con pi ∈ R es un
elemento primo. Entonces:
i) Si x ∈ R es un elemento que divide a todos los elementos de F, entonces existen
α1 , . . . , αm ∈ N y u ∈ R× tales que
x = upα αm
1 · · · pm .
1

ii) Definamos para cada k ∈ {1, . . . , m} la siguiente correspondencia:


ordpk : F \ {0} −→ N
f 7−→ max{n ∈ N : pnk | f }.
Entonces, ordpk es aplicación.
iii) Finalmente, definamos
ok := min{ordpk (a) : a ∈ F \ {0}},
y definamos el elemento h ∈ R dado mediante:
(6.2.3) h := po11 · · · pomm ∈ R,
Se verifican las siguientes propiedades:
(a) El elemento h ∈ R divide a todos los elementos de F, es decir,
∀a ∈ F, h | a.
(b) Dado x ∈ R un elemento que divide a todos los elementos de F, entonces x | h.
iv) Todo elemento x ∈ R que satisface las propiedades (a) y (b) anteriores está asociado
a h.
Al elemento h definido por la identidad (6.2.3) del item iii) anterior se le denomina máximo
común divisor de la familia F. Nótese que h es único salvo asociados y lo denotaremos mediante
:
gcdDFU (F).
En el caso, F = {a1 , . . . , as }, lo denotaremos mediante
gcdDFU (a1 , . . . , as ).
6.2. DOMINIOS DE FACTORIZACIÓN ÚNICA: LEMA DE GAUSS 299

Demostración. Por simplicidad de las notaciones de la prueba, supongamos F := {ai :


i ∈ I}. En primer lugar, sea ai0 ∈ F \ {0} ⊆ R un elemento no nulo. Como R es dominio de
factorización única, podemos suponer:
ai0 = pβ1 1 · · · pβnn ,
con βi ≥ 1, pi primo, y, para cada i, j, pi y pj no son asociados si i 6= j. Esto siginifca que si
defino pi = (pi ) ⊆ R el ideal que genera pi , entonces pi ∈ Spec(R) y
{p1 , . . . , pn } = {p ∈ Spec(R) : ai0 ∈ p, p es principal}.
Obviamente,
Vprin (F) ⊆ {p1 , . . . , pn },
y es un conjunto finito. Supongamos que, como en el enunciado, se tiene m ≤ n tal que
Vprin (F) = {p1 , . . . , pm }.
Para probar la propiedad i), sea x ∈ R un elemento, de tal modo que x | ai para cada i ∈ I.
Consideremos p un divisor primo de x, entonces el ideal que genera p = (p) ∈ Vprin (F) porque
p divide a todos los elementos de F. En particular, podemos suponer que
x = upα αm
1 · · · pm ,
1

con u ∈ R y αi ∈ N (posiblemente 0). De hecho, podemos suponer los exponentes αi con la


propiedad de que pi - u.
Supongamos ahora que existe q ∈ R un divisor primo de u. Como q divide a u, entonces q
divide a x y tendremos que el ideal primo que genera q = (q) ∈ Vprin (F). Pero por construcción,
hemos visto que q 6= pi , con lo que q 6∈ Vprin (F). En conclusión, u no posee factores primos con
lo que, necesariamente, u ∈ R× .
La propiedad ii) es inmediata por la unicidad en la factorización en dominios de factorización
única.
Para la propiedad iii), tiene sentido considerar el mı́nimo de las clases de elementos enteros
no negativos considerada y, por tanto, h está bien definido. Para probar las propiedades (a)
y (b), obsérvese que como los exponentes ok ∈ N son mı́nimos de los órdenes ordpk (a), para
a ∈ F \ {0}, tenemos ok ≤ ordpk (a) para cada a ∈ F \ {0} y dado ai ∈ F, tendremos que
ordp1 (ai ) ordpk (ai )
ai = bp1 · · · pm ,
para algún b ∈ R y, por tanto, tendremos la identidad siguiente:
 ordp (ai )−ok

ord (a )−o
ai = bp1 p1 i 1 · · · pm k h.

Como ordpk (ai ) − ok ≥ 0, concluiremos que


 ordp (ai )−ok

ord (a )−o
bp1 p1 i 1 · · · pm k ∈ R,

lo que nos permite concluir que h | ai y, por tanto h | a, ∀a ∈ F.


Para la propiedad (b) de iii), sea x ∈ R un elemento que divide a todos los elementos de F.
Entonces, por la propiedad i), tendremos que x = upα αm
1 · · · pm , con u ∈ R
1 ×
y αi ∈ N. Por
tanto,

k | ai , ∀i ∈ I.
k

Con ello concluimos que αk ≤ ordpk (a) para cada a ∈ F \ {0} y, por tanto, αk ≤ ok para cada
k, 1 ≤ k ≤ m. Entonces, es claro que x | h.
Finalmente, es fácil verificar la propiedad iv). Si y ∈ R verifica (a) entonces, y | h (por verificar
h la propiedad (b). De otro lado, si y ∈ R, verifica (b), entonces h | y, con lo que h e y estarán
asociados y termina la prueba del enunciado. 

Observación 6.2.7. Si R es un dominio de factorización única, la anterior Proposición recoge,


obviamente, la usual manera de presentar el máximo común divisor en cursos pre-universitarios.
300 6. FACTORIZACIÓN: GAUSS, LASKER. NOETHER

Proposición 6.2.8. Sea R un dominio de factorización única y sea F = {ai , : i ∈ I} ⊆ R


un conjunto de elementos que contiene algún elemento no nulo. Supongamos que el ideal a
generado por F es un ideal principal en R, esto es,
a = (F) = (h),
con h ∈ R. Entonces,
a = (gcdDFU (F)) ,
y, en particular, h ∼ gcdDFU (F).
Demostración. Usamos la Proposición precedente. Si (h) = (F), entonces h | ai , ∀i ∈ I.
Entonces, h | gcdDFU (F) y tenemos el contenido
a ⊇ (gcdDFU (F)) ,
De otro lado, (h) = (F) implica que existe J ⊆ I finito y existe {λj j ∈ J} tales que
X
h= λj aj .
j∈J

Por la Proposición precedente, (item iii) ) tenemos que


gcdDFU (F) | aj , ∀j ∈ I.
Entonces,  
X
gcdDFU (F) |  λj aj  = h,
j∈J

y tenemos el contenido:
a ⊆ (gcdDFU (F)) .
El hecho de que (h) = (gcdDFU (F)) implica que ambos generadores de un mismo ideal principal
son asociados, esto es,
h ∼ gcdDFU (F),
y el enunciado queda probado. 

Observación 6.2.9. A partir de esta proposición tenemos que, en el caso de que un conjunto
F genera un ideal principal, su generador es el DFU-máximo común divisor. Esto hace que no
se distinga entre las dos denominaciones y se diga simplemente “máximo común divisor” (y se
denote gcd(F)) al máximo común divisor de F y se suprime la referencia al prefijo DFU (y al
sub-ı́ndice DFU) a partir de este momento.

Observación 6.2.10. De otro lado, con las mismas notaciones, se tiene:


Si R es un dominio de factorización única, el ideal a = (F) ⊆ R es principal si y solamente si
gdc(F) ∈ (F).
En particular, tampoco se verifica la identidad de Bézout con el máximo común divisor si el
ideal generado no es principal.
A modo de ejemplos concretos, baste tomar:
• En Z[X], que no es DIP, :
gcd(2, X) = 1, pero 1 6∈ (2, X) 6= (1) = Z[X].
• En K[X1 , X2 ], que no es DIP, :
gcd(X1 , X2 ) = 1, pero 1 6∈ (X1 , X2 ) 6= (1) = K[X1 , X2 ].

Observación 6.2.11. El máximo común divisor verifica las propiedades siguientes (de obvia
verificación):
i) Dados {ai : i ∈ I} un conjunto de elementos de un DFU R no todos nulos, entonces,
gcd(ai : i ∈ I) = 1 ⇐⇒ ¬ (∃p ∈ R, (p ∈ R es primo) ∧ (p | ai , ∀i ∈ I)) .
6.2. DOMINIOS DE FACTORIZACIÓN ÚNICA: LEMA DE GAUSS 301

ii) Si R es un dominio de ideales principales, el máximo común divisor es el generador


del ideal que generan los elementos de estudio. Esto es, si R es dominio de ideales
principales,
(gcd(ai : i ∈ I)) = (ai : i ∈ I).
iii) Si (R, φ) es un dominio euclı́deo el máximo común divisor verifica que
φ(gcd(ai : i ∈ I)) = max{φ(a) : a | ai , ∀i ∈ I}.

6.2.3. El Lema de Gauss.


Definición 75 (Contenido y parte primitiva de un polinomio). Sea R un dominio
de factorización única y sea f ∈ R[X] \ {0} un polinomio univariado con coeficientes en R.
Supongamos que
f = ad X d + ad−1 X d−1 + · · · + a1 X + a0 .
Llamaremos
i) Contenido de f y lo denotaremos por cont(f ) al máximo común divisor de sus coefi-
cientes, esto es, al elemento de R dado mediante:
cont(f ) = gcd(ad , ad−1 , . . . , a1 , ao ) ∈ R.
ii) Un polinomio se dice primitivo si su contenido es una unidad de R.
iii) Parte primitiva de f y lo denotaremos por pp(f ) al resultado de dividir f por su
contenido, esto es, para cada i, 0 ≤ i ≤ d existe bi ∈ R tal que ai = bi cont(f ),
llamamos parte primitiva al polinomio en R[X] dado mediante:
pp(f ) := bd X d + bd−1 X d−1 + · · · + b1 X + b0 ∈ R[X].

Observación 6.2.12. En la anterior definición, tanto el contenido como la parte primitiva están
definidos salvo unidades en R. En lo que respecta al contenido, si escribimos cont(f ) = a ∈ R,
se verifica que cont(f ) = b, para cualquier b ∈ R con a ∼ b.
En cuanto a la parte primitiva, hemos visto que las unidades de R[X] son exactamente las
unidades de R (i.e. (R[X])× = R× ). Por tanto, cuando escribimos pp(f ) = g, estamos, en
realidad, usando igualdad salvo unidades en R y queremos decir que pp(f ) = g para cualquier
g ∼ f . Usaremos indistintamente la notación = y ∼ al referirnos a contenido y parte primitiva
de un polinomio, sabiendo que son “igualdades salvo unidades en R”.
Obviamente también, la parte primitiva de un polinomio es un polinomio primitivo.

Lema 6.2.13. Sea R un dominio de factorización única, sean {a1 , . . . , am } ⊆ R tales que
gcd({a1 , . . . , am }) = 1.
Sea a ∈ R \ {0} un elemento adicional. Entonces,
gcd({(aa1 ), . . . , (aam )}) ∼ a.
Demostración. Es un Lema técnico menor, que haremos. Para empezar es claro que
a | (aai ) para cada i, 1 ≤ i ≤ m. Por tanto,
a | gcd({(aa1 ), . . . , (aam )}).
Por tanto, existirá b ∈ R tal que ab = gcd({(aa1 ), . . . , (aam )}). En particular, existirán
α1 , . . . , αn ∈ R tales que αi ab = aai para cada i, 1 ≤ i ≤ m. Como estamos en un dominio de
integridad, tenemos que
a(αi b − ai ) = 0 =⇒ αi b = ai , ∀i, 1 ≤ i ≤ m.
En particular, b | ai para cada i, 1 ≤ i ≤ m. Pero como gcd({a1 , . . . , am }) = 1, concluiremos
que b ∈ R× y el resultado se sigue. 

Este resultado, obviamente implica el siguiente Lema:


Lema 6.2.14. Sea R un dominio de factorización única y sea f ∈ R[X] un polinomio primitivo.
Sea a ∈ R una constante no nula. Entonces,
cont(af ) ∼ a, pp(af ) ∼ f.
302 6. FACTORIZACIÓN: GAUSS, LASKER. NOETHER

Lema 6.2.15. Sea R un dominio de factorización única, si q(X) ∈ R[X] \ {0} es irreducible
entonces o bien q ∈ R y q irreducible en R o bien q ∈ R[X] \ R es un polinomio no constante
y, en ese caso, es un polinomio primitivo.
Demostración. De la descomposición q = cont(q)pp(q) deducimos que o bien cont(q) ∈
R× y q es primitivo o bien cont(q) 6∈ R× , en cuyo caso pp(f ) es una unidad en R[X] y, por
tanto, es una constante y q ∈ R× . En este segundo caso, q ∼ cont(q) en R y, necesariamente,
q es irreducible en R. 

Lema 6.2.16 (Gauss). Si R es un dominio de factorización única, el producto de polinomios


primitivos es primitivo.
Demostración. Sea p ∈ R un elemento primo y sea p = (p) ∈ Spec(R) el ideal primo que
genera. Tenemos entonces el dominio de integridad R/p[X].. Podemos definir un epimorfismo
de anillos del modo siguiente:
· : R[X] −→ R/p[X]
Pd i
Pd i
f := i=0 ai X 7−→ f := i= (ai + p)X .

Si f es un polinomio primitivo, para cualquier p ∈ R primo, f 6= 0. En otro caso, eistirı́a un


elemento primo p ∈ R que divide a todos los coeficientes de f y, por tamto, p | cont(f ) 6∈ R× ,
contradiciendo el hecho de ser primitivo.
Supongamos ahora dos polinomios primitivos f, g ∈ R[X]. Como ambos son primitivos, para
cualquier elemento primo f 6= 0 y g 6= 0. Consideremos el polinomio producto f g ∈ R[X] y su
imagen por el epimorfismo precedente f g. Por ser morfismo de anillos se tendrá:

f g = f g.
Por ser R/p[X] un dominio de integridad, tendremos que f 6= 0 y g 6= 0, implicará que f g =
f g 6= 0. En particular, existirá un coeficiente de f g que no es divisible por p. En suma, no hay
ningún elemento primo (o irreducible) de R que divida simultáneamente a todos los coeficientes
de f g, luego su contenido es unidad cont(f g) ∈ R× y concluimos que f g es un polinomio
primitivo. 

Observación 6.2.17. Nótese que hemos probado implı́citamente que si p es un elemento primo
de R, entonces p es primo en R[X].

Corolario 6.2.18. Dados dos polinomios univariados f, g ∈ R[X] no nulos, siendo R un


dominio de factorización única, entonces, se tiene:
pp(f g) ∼ pp(f )pp(g), cont(f g) ∼ cont(f )cont(g).
El mismo resultado se extiende de modo obvio a productos finitos de polinomios en R[X].
Demostración. Suponganos que tenemos:
a = cont(f ) ∈ R, f1 = pp(f ), b = cont(g) ∈ R, g1 = pp(g).
Entonces, por el resultado precedente, f1 g1 ∈ R[X] es un polinomio primitivo. Además, tenemos
f g = (ab)(f1 g1 ), con a 6= 0, b 6= 0
Luego por el Lema 6.2.14, concluimos que
ab = cont(f g), f1 g1 = pp(f ),
como afirma el enunciado. 

Corolario 6.2.19. Todo divisor en R[X] de un polinomio primitivo es primitivo.


Demostración. Si g | f y f ∈ R[X] es primitivo, entonces existe h ∈ R[X] tal que f = gh.
Por tanto, tenemos:
cont(f ) = 1 = cont(g)cont(h),
y, por tanto, los contenidos de g y h son unidades lo que significa que g y h han de ser
primitivos. 
6.2. DOMINIOS DE FACTORIZACIÓN ÚNICA: LEMA DE GAUSS 303

Lema 6.2.20. Sea R un dominio de ideales principales, K su cuerpo de fracciones y f ∈ R[X]


un polinomio univariado primitivo. Entonces, las siguientes propiedades son equivalentes:
i) f es primo en R[X]
ii) f es irreducible en R[X]
iii) f es irreducible en K[X]
iv) f es primo en K[X]
Demostración. Hagamos la demostración de las diversas implicaciones:
• i) =⇒ ii): Es cierta en todo dominio de integridad.
• iii) ⇐⇒ iv): Es obvio porque K[X] es un dominio de ideales principales.
• ii) =⇒ iii): Supogamos ahora que f es primitivo e irreducible en R[X]. Supongamos
que f = gh en K[X]. En este caso, existen a, b ∈ R \ {0} dos elementos no nulos tales
que
ag ∈ R[X], bh ∈ R[X].
Por tanto, tendremos la siguiente igualdad en R[X]:
(ab)f = (ag)(bh).
Sean a1 = cont(ag), g1 = pp(ag), b1 = cont(bh), h1 = pp(bh), luego
(ab)f = (ag)(bh) = (a1 b1 )(g1 h1 ).
Tendremos, por el Lema 6.2.14:
pp((ab)f ) ∼ f,
Mientras que por el Corolario 6.2.18
f = pp((ab)f ) = pp((ag)(bh)) = pp(ag)pp(bh) = g1 h1 .
Como f es irreducible en R[X], tendremos f | g1 o f | h1 en R[X]. Por tanto,
f | (ag) ∨ f | (bh), en R[X].
Como a 6= 0 y b 6= 0 en R, entonces son unidades en K, con lo que concluimos:
f | g ∨ f | h, en K[X].
Lo que implica que f es primo en K[X] y, por tanto, irreducible.
• iii) =⇒ ii): Supongamos que f es irreducible en K[X]. Y supongamos que f se puede
descomponer en producto f = gh con g, h ∈ R[X]. Por el Corolario 6.2.19, tanto
g como h han de ser poliomios pritimivos. De otro lado, la igualdad f = gh se da
también en K[X]. En consecuencia, por ser f irreducible en K[X], tiene que darse
f ∼ g o f ∼ h en K[X]. Supongamos que f ∼ g en K[X]. Entonces, deg(f ) = deg(g)
y existe λ ∈ K \ {0} tal que λg = f . Como K es el cuerpo de fracciones de R, existirá
b ∈ R tal que bλ ∈ R, con lo que tenemos la igualdad en R[X]:
(bλ)f = bg.
Por el Lema 6.2.14, como f y g con ambos primitivos, concluiremos:
cont((bλ)f ) ∼ (bλ), pp((bλ)f ) ∼ f, cont(bg) ∼ b, pp(bg) ∼ g,
y,en particular, f y g difieren en una unidad de R y, por tanto, f | g.
• ii) =⇒ i):En el caso de que deg(f ) ≤ 0, f serı́a una constante en R y ya hemos visto que
en los dominios de factorización única primo e irreducible son dos nociones coincidentes
(ver Proposición 6.2.3). Supongamos entonces que deg(f ) ≥ 1. Obsérvese, en primer
lugar, que si f es irreducible, entonces, f es primitivo. Por tanto, f ∈ R[X] es primitivo
e irreducible en R[X] y, por tanto, es irreducible en K[X], luego es un elemento primo
de K[X].
Supongamos, entonces, g, h ∈ R[X] tales que f | gh en R[X]. Como f es primo en
K[X], o bien f | g en K[X] o bien f | h en K[X]. Sin pérdida de la generalidad,
supongamos que f | g en K[X]. Entonces, existirá k ∈ K[X] tal que g = kf en K[X].
Como los coeficientes de k están en K y K es el cuerpo de fracciones de R, existirá
b ∈ R tal que bk ∈ R[X], por lo que concluiremos que se da la siguiente igualdad en
R[X].
(bk)f = bg.
304 6. FACTORIZACIÓN: GAUSS, LASKER. NOETHER

Supongamos g1 := pp(g) y, por el Corolario 6.2.18, tendremos que


g1 ∼ pp((bk))pp(f ) ∼ pp(bk)f,
porque f es primitivo. Por tanto f divide a g1 en R[X] y, por tanto, f | g en R[X],
con lo que habremos concluido que si f | gh en R[X] entonces o bien f | g o bien f | h
en R[X] y f es necesariamente primo.


Corolario 6.2.21. Con las notaciones anteriores, sea f ∈ K[X] un polinomio no nulo. En-
tonces, existe a ∈ R \ {0} tal que af ∈ R[X]. Además, si f es irreducible en K[X], la parte
primitiva pp(af ) ∈ R[X] es irreducible en R[X] y en K[X].
Demostración. Es lo que se ha probado en el resultado precedente. 

Teorema 6.2.22 (Lema de Gauss). Si R es un dominio de factorización única, también es


dominio de factorización única el anillo de polinomios R[X1 , . . . , Xn ], para cualquier n ∈ N.
Demostración. En primer lugar observemos que basta con probar la afirmación siguiente:
Afirmación. Si R es dominio de factorización única, entonces el anillo R[X], de polinomios
en una variable con coeficientes en R, también es dominio de factorización única.
Si tenemos probada la afirmación anterior, entonces podemos conluir el teorema por inducción
en n. Ası́, si n = 1, la Afirmación nos garantiza que R[X1 ] es un dominio de factorización única.
Y si n > 1, nótese que
R[X1 , . . . , Xn ] = R[X1 , . . . , Xn−1 ][Xn ].
Como, por hipótesis inductiva, R[X1 , . . . , Xn−1 ] es dominio de factorización única, entonces,
también lo es R[X1 , . . . , Xn−1 ][Xn ] por la Afirmación y, por tanto, también lo será R[X1 , . . . , Xn ].
Por tanto, nos centraremos solamente en probar la afirmación indicada.

Demostración de la Afirmación. Para probar la Afirmación anterior, recordando la Proposición


6.2.4 bastará con demostrar que todo elemento de R[X] es producto finito de elementos primos
y unidades de R[X]. Denotemos por K := qf (R) el cuerpo de fracciones de R. Sea f ∈ R[X]
un polinomio cualquiera no nulo. Descompongamos
f = cont(f )pp(f ).
Sea f1 = pp(f ) ∈ R[X]. Como K[X] es un dominio de ideales principales, entonces es dominio
de factorización única, f1 se descompone en factores primos en K[X], es decir,
m
Y
f1 ; = qj (X)αj ,
j=1

con qj (X) ∈ K[X] irreducible para cada j, 1 ≤ j ≤ m. Para cada uno de tales subı́ndices j,
existirán constantes aj ∈ R no nulas, tales que aj qj ∈ R[X]. Por ejemplo, usando el producto de
los denominadores de los coeficientes de qj . Escribamos, Fj := pp(aj qj ) para cada j, 1 ≤ j ≤ m
y tenemos:
 
m m m m
α α
Y Y Y Y
( aj j )f1 = (aj qj (X))αj =  cont(aj qj )αj  Fj j .
j=1 j=1 j=1 j=1

Usando el Corolario 6.2.18, como f1 es primitivo en R[X] tenemos que :


     
m m m m m
α α α α
Y Y Y Y Y
f1 ∼ pp  aj j  f1  ∼ pp  cont(aj qj )αj  Fj j  ∼ pp( Fj j ) ∼ Fj j .
j=1 j=1 j=1 j=1 j=1

Además, como Fj difiere en una unidad de qj , tendremos que Fj es primitivo, irreducible y


primo en K[X]. Por el Lema 6.2.20, Fj es irreducible en R[X] y, por tanto, es primo en R[X].
Luego f1 es un producto finito de elementos primos en R[X].
6.2. DOMINIOS DE FACTORIZACIÓN ÚNICA: LEMA DE GAUSS 305

De otro lado, es claro que si p ∈ R es un elemento primo, entonces p es primo en R[X]. En


particular, como R es dominio de factorización única, una factorización del contenido
Yn
cont(f ) = pβkk ,
k=1
es una descomposición de cont(f ) como producto finito de elementos primos de R[X].
En conclusión, f = cont(f )pp(f ) puede ser descompuesto como producto finito de elementos
primos de R[X] y, por la Proposición 6.2.4, R[X] es un dominio de factorización única. 

Observación 6.2.23 (No todos los DFU’s son DIP). Por el Lema de Gauss precedente,
todo anillo de polinomios sobre un cuerpo K[X1 , . . . , Xn ] es dominio de factoirización única.
Pero para n ≥ 2, K[X1 , . . . , Xn ] no es dominio de ideales principales (ver iv) en Ejemplo 3.2.1).

Corolario 6.2.24. Si R es un dominio de factorización única, K su cuerpo de fracciones y


f ∈ R[X] \ {0}. La factorización de f en irreducibles viene dada por:
n m
α
Y Y
f= pβkk Fj j ,
k=1 j=1

donde
Qn
i) cont(f ) = k=1 pβkk es una factorización del contenido de f en producto de irreducibles
de R, Q
m α
ii) pp(f ) = j=1 Fj j es una factorización de pp(f ) como producto de polinomios primi-
tivos e irreducibles en R[X] (y, por tanto, irreducibles en K[X]).
Demostración. Es lo visto en la demostración del Lema de Gauss precedente. 

6.2.4. Ejercicios y problemas de la Sección 6.2.


Problema 221. Prueba que la parte primitiva de un polinomio es un polinomio primitivo.
Problema 222. Demuestra la afirmación (i) de la Observación 6.2.11.
Problema 223. Demuestra la afirmación (ii) de la Observación 6.2.11
Problema 224. Demuestra la afirmación (iii) de la Observación 6.2.11
Problema 225. Demuestra la afirmación y los ejemplos descritos en la Observación 6.2.10
Problema 226. Prueba que si R es un dominio de factorización única, entonces es ı́ntegramente
cerrado en su cuerpo de fracciones. Es decir, prueba que si R es dominio de factorización única,
si K = qf (R) es el cuerpo de fracciones de R y si ζ ∈ K es tal que existe un polinomio mónico
f ∈ R[X] tal que f (ζ) = 0, entonces ζ ∈ R. Explica este resultado en el contexto de la mal
llamada “regla de Ruffini” aprendida en los cursos de Bachillerato.
Problema 227. Definir contenido, parte primitiva y serie primitiva para series de potencias
formales σ ∈ R[[X]], donde R es un dominio de factorización única.
Prueba que si σ, τ ∈ R[[X]] son dos series primitivas, entonces su producto στ ∈ R[[X]] también
es primitiva. (Pista: seguir la prueba del Lema 6.2.16).
Problema 228. Prueba que si K es un cuerpo, el anillo de series de potencias formales K[[X]]
con coeficientes en K es un dominio de ideales principales. (Pista: Prueba que es un anillo con
un único ideal maximal).
Problema 229. Prueba que si R es un DFU y p ∈ R es irreducible, entonces p es irreducible
en R[X] y en R[[X]].
Problema 230. Prueba que si R es un dominio de ideales principales, entonces, el anillo de
series de potencias formales R[[X]] en una sola variable es un dominio de factorización única.
Problema 231. Prueba que si R es un dominio de factorización única, A ∈ Mn (R) una matriz
cuadrada con coordenadas en R, el anulador a := AnnR[X] (A) ⊆ R[X] es un ideal principal en
R[X]. Se dice que R es un dominio normal (o un dominio ı́ntegramente cerrado en su cuerpo
de fracciones).
306 6. FACTORIZACIÓN: GAUSS, LASKER. NOETHER

Problema 232. Sea R un anillo cualquiera, no necesariamente un dominio de factorización


única. Generalicemos la noción de polinomio primitivo del modo siguiente: Un polinomio
f = a0 + a1 X + · · · + an X n ∈ R[X] se dice sub-primitivo si el ideal a := (a0 , . . . , an ) ⊆ R
que generan sus coeficientes satisface a = (1). Probar que dados dos polinomios f, g ∈ R[X] su
producto f g es un polinomio sub-primitivo si y solamente si f y g son sub-primitivos. ( Hint:
Para cada ideal maximal m de R, considérese el conjunto me = mR[X] la extensión de m a
R[X]. Es sencillo verificar que R[X]/me ∼ = (R/m)[X] que es un dominio de ideales principales
porque R/m es un cuerpo. Nótese que si f ∈ R[X], entonces f es sub-primitivo si y solamente
si la clase de f módulo me (es decir, el elemento f + me ∈ R[X]/me ) es no nulo para cualquier
maximal m de R. La razón es porque siempre hay un coeficiente de f que no está en el maximal
m de R. Para concluir la prueba, dados f, g ∈ R[X], supongamos que f g es sub-primtivo.
Entonces, para cualquier ideal maximal m de R, la clase f g + me 6= 0 en (R/m)[X]. Como
f g + me = (f + me )(g + me ) 6= 0 y (R/m)[X] es un dominio de integridad, entonces habremos
conlcuido que f + me 6= y g + me 6= 0 en (R/m)[X] para cualquier maimal m de R. por tanto,
tanto f como g son subprimitivos en R[X]. El recı́proco se demuestra por aun argumento
similar.)
Problema 233. Probad que el Lema de Gauss (Lema 6.2.16) puede demostrarse por un ar-
gumento idéntico al del problema anterior. Es decir, suponiendo que R es un dominio de
factorización única, repetir el argumento del problema anterior, reemplazando los ideales max-
imales m por los ideales primos p que son principales, es decir, por los ideales primos p de R
que están generados por un elemento irreducible.
Problema 234. Consideremos el anillo R := Z[X] de polinomios en una variable con coefi-
cientes en Z. Se pide:
i) Probar que las unidades en Z[X] satisfacen Z[x]× := Z× = {+1, −1}.
ii) Probar que el ideal n := (2, X + 1) ⊆ Z[X] es un ideal maximal propio que, además,
no es principal.
iii) Probar que el ideal m := (X, X 2 + 2) ⊆ Z[X] coincide con el ideal (2, X) y es maximal
en Z[X]. ( Hint: si 1 = a(X)X + b(X)(X 2 + 2), evaluando en X = 0 concluirı́amos
que 1 | 2 en Z).
iv) Probar que el polinomio X 2 − X + 4 ∈ Z[X] es un elemento irreducible.
v) Considerar la siguiente matriz A ∈ Ms (Z[X]):
 
2 X
A := .
X + 1 X2 + 2
Pruébese que det(A) := X 2 − X + 4.
vi) Pruébese que si P ∈ G(n, Z[X]) es una matriz inversible tal que
 
a(X) b(X)
P := .
c(X) d(X)
y existen p(X), q(X), h(X) ∈ Z[X] tales que
 
p(X) h(X)
PA = ,
0 q(X)
entonces p ∈ n y q ∈ m.
Problema 235. Con las notaciones del problema precedente, se pide:
i) Conclúyase que, si existe una matriz P ∈ GL(n, Z[X]) verificando las propiedades
precedentes, entonces o bien p ∈ Z× o bien q ∈ Z× . ( Hint: Si existiera tal matriz P ,
entonces,
p(X) · q(X) = det(P A) = ± det(A) = ±(X 2 − X + 4).
Como X 2 −X +4 es irreducible, entonces, o bien p(X) o bien q(X) han de ser unidades
en Z[X]× ).
ii) Conclúyase que la matriz A no puede ser equivalente a una matriz triangular superior
en M2 (Z[X]) haciendo solamente operaciones por filas inversibles ( Hint: Porque ni n
ni m pueden contener unidades de Z[X]).
6.2. DOMINIOS DE FACTORIZACIÓN ÚNICA: LEMA DE GAUSS 307

iii) Haz una reflexión sobre la corrección de la prueba de Proofwiki (Prueba del caso
de anillos, llamada Proof 1) en la página https: // proofwiki. org/ wiki/ Square_
Matrix_ is_ Row_ Equivalent_ to_ Triangular_ Matrix . Reflexiona, por tanto, si el
enunciado que ahı́ se cita es cierto o falso y sobre el oscuro significado de ”Row Equiv-
alent” usado en ese texto.
iv) Reflexiona sobre la corrección de la prueba de la propiedad det(AB) = det(A) det(B)
que se exhibe en Proofwiki (también como Proof 1) en la página https: // proofwiki.
org/ wiki/ Determinant_ of_ Matrix_ Product .
6.2.4.1. Ley de Reciprocidad Cuadrática. Los problemas que siguen son una sencilla
descomposición de la prueba de la Ley de Reciprocidad Cuadrática de Gauss (cf. [Gauss, 1801]),
siguiendo la demostración de G. Einsenstein en [Eins,1859].
Sı́mbolo de Legendre. Sea p ∈ N un número primo impar y sea m ∈ N un entero positivo.
Se define el sı́mbolo de Legendre mediante la siguiente igualdad:
 
m p−1
:= m 2 mod p.
p
Es decir, es el resto módulo p de m(p−1)/2 . El sı́mbolo de Legendre aparece como tal en su obra
de 1789 (cf. [Legendre, 1789]).
Definición 76 (Residuos Cuadráticos). Sea p ∈ N un número primo y sea m ∈ Z un
número entero. Decimos que m es un residuo cuadrático módulo p si la ecuación siguiente
porsee solución en Fp :
X 2 − m = 0.
Nótese que m es un residuo cuadrático módulo p si y solamente si el polinomio X 2 − m ∈ Fp [X]
es reducible (lo que se puede decidir algorı́tmicamente usando, por ejemplo, el Algoritmo de
Berlekamp descrito en la serie de problemas expuestos en la Subsección 3.6.5.2
Problema 236 (Euler). Con las notaciones precedentes, pruébese la siguiente propiedad debida
a Euler:
“Sea p ∈ N un número primo impar. En número de residuos cuadráticos módulo p en F× p es
p−1
exactamente 2 .” ( Hint: Purébese que el conjunto de residuos cuadráticos módulo p es
 2
p−1
{12 , 22 , 32 , . . . , }.)
2
Problema 237 (Criterio de Euler). Purébese la siguiente propiedad conocida como Criterio
de Euler (cf. [Euler, 1750]):
“ Con las notaciones precedentes, sea p ∈ N un número primo impar y sea m ∈ Z un entero,
entonces se tiene:

   1, si p - m y m es residuo cuadrático módulo p
m
= -1, si p - m y m no es residuo cuadrático módulo p
p
0, si p | m.

( Hint: Úsese el Teorema Pequeño de Fermat (ver Problema 151), obsérvese que
p−1 p−1
X −1 − 1 = (X 2 − 1)(X 2 + 1) = 0 en Fp [X],
y úsese el problema precedente.)
Problema 238. Realı́cense las tareas siguientes:
 
i) Probar que el sı́mbolo de Legendre m p es cı́clico de orden p.
ii) Probar que el sı́mbolo de Legendre es una función multiplicativa:
    
mn m n
= .
p p p
iii) Hallar los siguientes valores del sı́mbolo de Legendre:
•  2 
m 1, si p - m.
=
p 0, si p | m.
308 6. FACTORIZACIÓN: GAUSS, LASKER. NOETHER


  
−1 1, si p ≡ 1 mod 4.
=
p -1, si p ≡ 3 mod 4.
La Construcción de Einsenstein. Consideremos p ∈ N un primo impar y q ∈ N un
entero positivo impar tales que p no divide a q (i.e. p - q). Consideremos los intervalos abiertos
(0, p), (0, q) ⊆ R y definamos la región

R := (0, p) × (0, q) ⊆ R2 .
Y consideremos el conjunto de los puntos en R con coordenadas enteras:
Λ := Z2 ∩ R.
La siguiente imagen muestra los conjuntos R y Λ para p = 7 y q = 9, por ejemplo.
(p, q)
(0, q)
× ×

× ×
R (p, 0)

En el rectángulo R consideremos la diagonal D ⊆ R, es decir


q
D := {(x, y) ∈ R2 : y = x}.
p
Como p - 1, la diagonal D no contiene ningún punto de Λ. La figura siguiente muestra un
dibujo de la construcción.
(p, q)
(0, q)
× ×

× ×
R (p, 0)

Ahora consideremos dos nuevas rectas:


• La recta paralela al eje vertical pasando por (p/2, 0).
• La recta paralela al eje horizontal pasando por (0, q/2).
6.2. DOMINIOS DE FACTORIZACIÓN ÚNICA: LEMA DE GAUSS 309

Ninguna de las dos contiene a ningún punto de Λ porque tanto p como q son impares. Consid-
eremos la imagen resultante con los puntos:
A := (0, 0), X := (p/2, 0), Y := (p/2, p/2), B := (p, 0), C := (p, q), Z := (p/2, q), W := (0, q/2).

C
(0, q) Z
× × ×

Y
W× ×

× × ×
A X B

4
Problema 239. Con la construcción precedente, sea ABC el triángulo descrito por los vértices
A := (0, 0), B := (p, 0), C := (p, q) dentro de la región precedente. Para cada u ∈ {1, . . . , p − 1}
sea Lu la recta paralela al eje vertical pasando por el punto (u, 0). Pruébese que
4
 
uq
] Lu ∩ Λ ∩ ABC ≤ b c,
p
donde b·c significa parte entera.
Con las misma notaciones precedentes dada Ω ⊆ Λ una región acotada (como Ω := R ∩ Λ
anterior), denotaremos mediante:
Ω1 := {(x, y) ∈ Ω : x 6∈ 2Z},
y
Ω2 := {(x, y) ∈ Ω : x ∈ 2Z}.
Problema 240. Con la construcción y las notaciones precedentes, pruébense las siguientes
igualdades:
i) Para cada Ω ⊆ Λ, acotadapor una región finita,
](Ω) = ](Ω1 ) + ](Ω2 ).
ii) Con las notaciones precedentes:
p−1
4
  X
uq
] Λ ∩ ABC = b c,
u=1
p

donde b·c significa parte entera.


iii) Con las mismas notaciones:
4
   X uq
] Λ ∩ ABC = b c.
2 p
u∈2Z∩{1,...,p−1}

iv) Retomando los puntos X := (p/2, 0), Y := (p/2, p/2), se tiene:


4
   X uq
] Λ ∩ AXY = b c.
2 p−1
p
u∈2Z∩{1,..., 2 }
310 6. FACTORIZACIÓN: GAUSS, LASKER. NOETHER

Una Reflexión sobre la Construcción de Einsenstein. Consideremos la siguiente re-


flexión
ϕ: R2 −→ R2
(x, y) 7−→ (p − x, q − y).
Problema 241. Pruébense las siguientes propiedades de ϕ:
i) ϕ2 = ϕ ◦ ϕ = IdR2 .
ii) Con las notaciones de los puntos sobre la construcción de Einsenstein, se tiene:
 4   4
 4   4
ϕ CY Z = AXY 1 , ϕ CY Z = AXY 2 .
2 1
Conclúyase que
p−1
 4
 X 2  4
   4
 
uq
] Λ ∩ AXY = b c=] Λ ∩ AXY +] Λ ∩ CY Z .
u=1
p 2 2

Problema 242. Con las notaciones precedentes, considérese la región BXY C determinada por
los puntos B := (p, 0), X := (p/2, 0), Y := (p/2, q/2) y C := (p, q). Pruébese que
4
  
 
] Λ ∩ BXY C 2 = ] Λ ∩ CY Z mod 2.
2
Es decir, pruébese:
4
  

(−1)
]((Λ∩BXY C )
2
) = (−1)] Λ∩CY Z
2 .
Problema 243. Usando las notaciones y resultados precedentes, pruébese:
P p−1
b uq c b uq c 2 b uq c
P Y  
(−1) u∈2Z∩{1,...,p−1} p = (−1) p = (−1) u=1 p .
u∈2Z∩{1,...,p−1}

El Lema de Einsenstein (1859). Se trata de resolver un problema un poco más difı́cil,


usando todos los elementos gráficos y los resultados precedentes. Es un Problema Opcional.
Problema 244 (Lema de Einsenstein, Opcional). Pruébese Sea p ∈ N un número primo
impar y sea m ∈ N un número impar no divisible por p (i.e. p - m). Entonces,
P p−1
 
m P
b uq c 2 b uq c
= (−1) u∈2Z∩{1,...,p−1} p = (−1) u=1 p .
p
( Hint: Para cada u ∈ {1, . . . , p − 1}, sea r(u) el resto de la división de um por p. Como p - m,
r(u) ∈ {1, . . . , p − 1}, y se tiene
um um r(u)
=b c+ .
p p p
Consideremos las cantidades
(−1)r(u) r(u) mod p ∈ 2§ ∩ {1, . . . , p − 1}.
Hay que probar que estos restos son números pares en 2Z ∩ {1, . . . , p − 1}. Además, si u 6= v
con u, v ∈ 2Z ∩ {1, . . . , p − 1}, entonces, hay que probar que
(−1)r(u) r(u) 6= (−1)r(v) r(v) mod p.
Esto permite definir una biyección
f: 2Z ∩ {1, . . . , p − 1} −→ 2Z ∩ {1, . . . , p − 1}
u 7−→ (−1)r(u) r(u) mod p.
Por tanto, se prueba que
Y   Y Y  
(−1)r(u) r(u) = u mod p = (−1)r(u) um mod p.
u∈2Z∩{1,...,p−1} u∈2Z∩{1,...,p−1} 2Z∩{1,...,p−1}

Identificando el primer y el tercer término de esta igualdad, concluir que


 
Y p−1
1= (−1)r(u)  m 2 ,
u∈2Z∩{1,...,p−1}
6.2. DOMINIOS DE FACTORIZACIÓN ÚNICA: LEMA DE GAUSS 311

porque ](2Z ∩ {1, . . . , p − 1}) = p−1


2 . A prtir de este punto, basta con demostrar que
 
m P um
= (−1) u∈2Z∩{1,...,p−1} b p c mod p.)
p
Problema 245 (Ley de Reciprocidad Cuadrática, Gauss). Pruébese que dados p, q ∈ N
dos números primos impares, entonces,
  
p p p−1 q−1
= (−1)( 2 )( 2 ) .
p q
( Hint: Usar la construcción y el Lema de Einsenstein para concluir que
4
   
p ] Λ∩AXY
= (−1) .
q
Girando la figura y reflejándola (manteniendo los nombres), el Lema de Einsenstein implica
4
   
q ] Λ∩AW Y
= (−1) .
p
Mutiplicar ambas expresiones y calcular lo que sale.)
6.2.4.2. (Otro) Lema de Gauss. El Lema de Einsenstein se inspiró, sobre todo, en un
Lema de Gauss que pasamos a mostrar como problema a continuación.
Problema 246 ((Otro) Lema de Gauss, Opcional). Prébese el siguiente resultado:
Sea p ∈ N un número primo impar y mıN un entero positivo no divisible por p (i.e. p - m).
Consideremos el siguiente conjunto:
p−1
S := {um : 1 ≤ u ≤ }.
2
y definamos el conjunto siguiente:
S 0 := {x mod p : x ∈ S} ⊆ {1, . . . , p − 1}.
Sea n := ] ({r ∈ S 0 : p/2 ≤ r}), entonces,
 
m
= (−1)n mod p.
p
( Hint: Sigue las mismas pautas que el Lema de Einsenstein. De hecho, Einsenstein se inspiró
en esta visión de Gauss y, por lo que a nosotros respecta, puede usarse el Lema de Einsenstein
para esta prueba. Comienza considerando:
 p−1 
2
Y p−1 Y
Z := x=m 2  u mod p.
inS u=1

Define para cada x ∈ {1, . . . , p − 1} la función:


si 1 ≤ x ≤ p−1

x,
|x| := p+1
2
p-x, si 2 ≤ x ≤ p − 1.
Pruébese que:
p−1
2
Y
n
(−1) |um| = Z mod p.
u=1

Purub́ese, además, que la siguiente es una biyección:


{1, . . . , p−1
2 } −→ {1, . . . , p−1
2 }
u 7−→ |um mod p|.
Q p−1
Conclúyase que Z := 2
u=1 u y finalı́cese el Lema probando:
p−1 p−1
2 2
Y p−1 Y
n
(−1) u=m 2 u mod p.)
u=1 u=1
312 6. FACTORIZACIÓN: GAUSS, LASKER. NOETHER

Problema 247. Pruébese el siguiente cálculo de residuos cuadráticos de 2 módulo un primo


p ∈ N impar:
i) Si p = 3 mod 8, entonces 2 no posee raı́ces cuadradas módulo p, i.e.
 
2
= −1 mod p.
p
ii) Si p = 7 mod 8 o si p = 1 mod 8, entonces:
 
2
= 1 mod p.
p
iii) Si p = 5 mod 8, entonces:
 
2
= −1 mod p.
p
6.2.4.3. Ley de Reciprocidad Cuadrática de Jacobi. Trataremos de establecer la
Ley de Reciprocidad Cuadrática para el sı́mbolo de Jacobi, como paso previo a un algoritmo
de tipo Monte Carlo para decidir si un entero es primo o compuesto.
Sı́mbolo de Jacobi. En su trabajo de 1837 (cf. [Jacobi, 1837]), C.G. Jacobi generaliza
el sı́mbolo de Legendre del modo siguiente:
Sean m, n ∈ N y supongamos que n es impar. Definimos el sı́mbolo de Jacobi mediante:
m  α1  α2  αk
m m m
:= ··· ,
n p1 p2 pk
donde n factoriza en primos (impares) del modo siguiente:
αk
n = pα1 α2
1 p2 · · · pk .

Problema 248. Pruébense las siguientes propiedades del sı́mbolo de Jacobi:


i) Es multiplicativo con respecto al “numerador”, i.e. con n ∈ N impar se tiene:
m m  m  m 
1 2 1 2
= .
n n n
ii) Es mutiplicativo con respecto al “denominador”, i.e. con n1 y n2 impares se tiene:
    
m m m
= .
n1 n2 n1 n2
iii) El sı́mbolo de Jacobi depende solamente del resto rem(m, n) de la división de m por n
es decir:
 m   rem(m, n) 
= .
n n
Problema 249. Pruébense las siguientes propiedades:
i) Sea n ∈ N un entero impar y supongamos n = p1 · · · pr una factorización de n como
producto de primos impares posiblemente repetidos. Entones,
r
n − 1 X pi − 1
− =0 mod 2.
2 i=1
2

ii) Dados m, n ∈ N dos enteros positivos impares y supuestas dadas dos factorizaciones
en primos (impares) posiblemente repeidtos:
n := p1 · · · pr , m := q1 · · · qs .
Entonces,
r
! s

n−1 m−1 X pi − 1 X qj − 1 
× =  mod 2.
2 2 i=1
2 j=1
2
6.2. DOMINIOS DE FACTORIZACIÓN ÚNICA: LEMA DE GAUSS 313

Ley de Reciprocidad Cuadrática para el sı́mbolo de Jacobi. Finalmente, extendamos


el sı́mbolo de Jacobi para cualesquier número entero del modo obvio. Se tiene
Problema 250 (Ley de Reciprocidad Cuadrática (Jacobi)). Pruébese el siguiente resul-
tado :
Dados m, n ∈ N dos enteros positivos impares y coprimos, entonces
m  n  m−1 n−1
= (−1) 2 2 .
n m
Adicionalmente, siendo n ∈ N impar, se tiene:
   
−1 n−1 2 n2 −1
= (−1) 2 , = (−1) 8 .
n n
Problema 251. Diseña un algoritmo para el cálculo del sı́mbolo de Jacobi de dos enteros posi-
tivos m, n ∈ N sin conocer la factorización de ninguno de ellos. ¿Es un algoritmo que realiza un
número de operaciones polinomial exponencial en el tamaño de los números involucrados?( Hint:
Combina la Ley de Reciprocidad cuadrática, con el uso del resto en el numerador).
6.2.4.4. El test de R. Solovay y V. Strassen. En esta serie de problemas mostraremos
el test de Solovay y Strassen (cf. [SoStr, 1977]), citado en el cuerpo del Capı́tulo y que usa
intensamente la Ley de Reciprocidad Cuadrática extendida por C.G. Jacobi.
Problema 252. Sea p ∈ N un número primo impar. Pruébese:
i) El polinomio X p−1 − 1 factoriza completamente en Fp [X]:
p−1
Y
p−1
X −1= (X − i).
i=1
Además todas sus raı́ces son distintas.
ii) Si, además n | (p − 1) entonces también el polinomio X n − 1 se escinde completamente
en Fp [X] y todas sus raı́ces on distintas.
×
iii) Sea g1 , g2 ∈ (Z/pZ) dos elementos del grupo de las unidades tales que gcd(g1 , g2 ) = 1.
×
Entonces el orden del producto g1 g2 en el grupo (Z/pZ) es el producto de los órdenes
de los elementos g1 y g2 .
×
iv) El grupo (Z/pZ) es un grupo cı́clico de orden (p − 1). Es decir, existen raı́ces (p −
1)−ésimas primitivas de la unidad y cada una de ellas es un generador del grupo
×
cı́clico (Z/pZ) .
Problema 253. Pruébese las siguientes propiedades:
×
Sea p ∈ N un número primo impar y g ∈ (Z/pZ) un elemento generador del grupo multiplica-
tivo de las unidades. Entonces,
i) Los residuos cuadráticos en Fp son de la forma:
{g r : 0 ≤ r ≤ p − 2, r ∈ 2Z}.
ii) Los elementos que no son residuos cuadráticos en Fp son de la forma:
{g r : 0 ≤ r ≤ p − 2, r ∈ 2Z + 1}.
Concluir que si p ∈ N es un número primo impar, entonces hay elementos en Fp que no son
residuos cuadráticos.
Problema 254. Pruébese la siguiente propiedad:

Sea p ∈ N un número primo impar. Entonces el grupo multiplicaivo de las unidades Z/p2 Z
es un grupo cı́clico de orden p(p − 1). Conclúyase que existe al menos un generador.
Dfinamos la siguiente noción:
Definición 77 (Testigo de Euler). Sea n ∈ N un número compuesto impar y a ∈ Z/nZ un
elemento no nulo con gcd(a, n) = 1. Diremos que a es un testigo de Euler para n si
n−1
a
a 2 6= mod n,
n
donde na es el sı́mbolo de jacobi.

314 6. FACTORIZACIÓN: GAUSS, LASKER. NOETHER

Problema 255. Pruébese que si n ∈ N es un número compuesto impar, entonces hay al menos
×
un testigo de Euler en (Z/nZ) .( Hint: Distinguir los casos en los que n posee un factor múltiple
(∃p ∈ N, p2 | n) y el aso en el que todos sus factores primos tienen multiplicidad 1).

También introducimos la noción siguiente:

Definición 78 (Mentiroso de Euler). Sea n ∈ N un número impar y a ∈ Z/nZ un elemento


no nulo con gcd(a, n) = 1. Diremos que a es un mentiroso de Euler para n si
n−1
a
a 2 = mod n,
n
donde na es el sı́mbolo de jacobi.


Problema 256. Pruébese que si n ∈ N es un número impar, el número de testigos de Euler es


×
mayor que el número de mentirosos de Euler en (Z/nZ) .

Consideremos el siguiente Algoritmo

Algoritmo 6.2.25 (Test de Composición de Solovay-Strassen).

Input: n ∈ N, con n ≥ 3 y k ∈ N
guess randomly a1 , . . . , ak ∈ {2, . . . , n − 1}
for i := 1 to k, compute:
a 
i
xi :=
n
n−1
if xi = 0 o xi 6= ai 2 mod p, para algún i Output Compuesto
else Output: Probablemente Primo
fi
end

Problema 257. Pruébense las siguientes propiedades:


i) Si el algoritmo responde Compuesto, el número n es un número compuesto.
ii) Si el algoritmo responde Probablemente Primo, el número n es primo con proba-
bilidad mayor que
1
1− k.
2
iii) El número de operaciones aritméticas realizadas es polinomial en el número de dı́gitos
de n (O(log2 (n))) y en k. Además, los enteros más grandes involucrados son de talla
acotada por O(log2 (n))
Este tipo de algoritmo con control de la probabilidad de error se llaman algoritmos de tipo
MonteCarlo (y, al ejecutarse en tiempo polinomial se denotan como la clase RP (random
polynomial time)) En este caso, es un test de Composición y no un test de primalidad (dado
que la seguridad en la respuesta está del lado de los número compuestos). Una manera alter-
nativa de presentarlo consiste en decir que Primes está en co-RP.

6.3. El Teorema de Lasker-Noether (Existencia): “factorizando” ideales en anillos


noetherianos
El primer enunciado esencial sobre anillos noetherianos es el Teorema de la Base de Hilbert
(Basissatz) (cf. [Hilbert, 1890]). Hemos visto, en la Sección ?? el Teorema de la base de
Hilbert (que ya anunciamos anunciamos en la Subsección de Problemas 3.4.4.2 y, más partic-
ularmente, en el Problema 135). El alumno también puede revisar los aspectos sobre anillos y
módulos noetherianos salpicados a lo largo del curso.
6.3. LASKER-NOETHER (EXISTENCIA) 315

6.3.1. Radical de un Ideal. Recordemos (Problema 53) que un elemento f en un anillo


R se denomina nilpotente si una potencia positiva suya se anula en el anillo R, es decir, si existe
n ∈ N, n ≥ 1, tal que f n = 0 en R.
Definición 79. Sea a un ideal de un anillo R. El radical de a en R es el conjunto de los
elementos cuyas clases f + a son elementos nilpotentes en el anillo cociente R/a. Es decir, el
conjunto dado por la siguiente igualdad:

a := {f ∈ R : ∃n ∈ N, f n ∈ a}.

Un ideal a se llama radical si coincide con sup radical, i.e. si a = a. Aquellos anillos sin
elementos nilpotentes no culos (i.e. tales que (0) = (0)) se les denomina anillos reducidos.

También pueden caracterizarse los elementos del radical del modo siguiente: Dado un elemento
f ∈ R y el ideal a consideremos el endormorfismo de R−módulos siguiente:
ηf : R/a −→ R/a
x + a 7−→ f x + a.

Entonces, un elemento f ∈ R está en a si y solamente si el endomorfismo ηf anterior es
nilpotente, es decir, si y solamente si existe n ∈ N, n ≥ 1 tal que ηfn = 0. En otras palabras, se
tiene:
Lema 6.3.1. Sea R un anillo, a ⊆ R un ideal y R/a el anillo cociente de R por a. Sea (0 + a)
el ideal cero del anillo cociente R/a. Se tiene:
√ p
a = {f ∈ R : f + a ∈ (0 + a)}.
En otras palabras, si π : R −→ R/a es la proyección canónica sobre el anillo cociente, entonces,
√ p p
a = π −1 ( (0 + a) = ( (0 + a))c ,
donde la contracción del ideal se refiere a la contracción con respecto al morfismo π (ver
Proposición 1.4.9, ı́tem v)).
Demostración. Es mera reconstrucción de las frases que preceden a este enunciado. 

Proposición 6.3.2. Sea R un anillo. Se tiene:


• El conjunto de todos p los elementos nilpotentes de un anillo R es un ideal de R. En
particular,√el radical (0) del ideal (0) de R es un ideal de R.
• El radical a de un ideal a de R es un ideal de √ R que contiene al ideal a.
• Para cualquier ideal a de R, anillo cociente R/ a no tiene elementos nilpotentes no
nulos.
Diremos que un anillo es reducido si no posee elementos nilpotentes no nulos o, equivalente-
mente, si (0) es un ideal radical.

p ón. Basta con probar el resultado i). Aplicando i) al anillo cociente, obten-
Demostraci
dremos que (0 + a) es un ideal en R/a. Por el Lema precedente, el radical de un ideal a es la
contracción de un ideal de R/a. Por el ı́tem√v) de la Proposición 1.4.9, toda contracción de un
ideal es también un ideal y concluimos que a es ideal de R.
Para probar i), basta con probar que la suma y el producto de elementos nilpotentes es nilpo-
tente. Para ello, sean x, y ∈ R tales que xm = 0 e y n = 0, con n, m ∈ N, n, m ≥ 1 y z ∈ R.
Entonces, Tendremos que
(zy)m = 0,
y
n+m
X
(x + y)n+m = cn+m,k xk y n+m−k = 0,
i=0
donde cn+m,k es o bien el número combinatorio n+m

k o 0 dependiendo de la estructura de
grupo abeliano de R. √
Para√probar iii) nótese que los elementos nilpotentes de√R/ a son, precisamente,
√ los elementos
n
f + a tales que existe n ∈ N, n ≥ 1, verificando (f √ + a) = 0 en R/ a. Esto es equivalente
a decir que existe n ∈ N, n ≥ 1, verificando f n ∈ a. Pero esta condición significa que existe
316 6. FACTORIZACIÓN: GAUSS, LASKER. NOETHER


m ∈ N, m ≥ 1 tal que (f n )m ∈ a y esto implica f nm ∈ a, con nm ∈ N, nm ≥ 1. Luego f ∈ a
como se pretende. 

Proposición 6.3.3 (Propiedades inmediatas del radical). Sea a, b dos ideales de un anillo
R. Se tiene:
p√ √
i) √ a =√ a, √

ii) √ab = a ∩ b = a ∩ b,
iii) a = R siq y solamente si a = R,
√ √ √
iv) a + b = a + b,

v) Si p ∈ Spec(R), pn = p, para todo n > 0.
Demostración. Siendo de fácil demostración que dejamos como Problema 258. 

Ejemplo 6.3.4 (Radicales de ideales principales en DFU’s). Sea p ∈ R un elemento


primo, es decir, un elemento tal que el ideal principal (p) (o también pR) que genera es un
ideal primo de R. Denotemos por p = (p). Por la Proposición 2.2.19, sabemos que el producto
de los generadores de dos ideales genera el ideal producto, por lo que un generador de pn es
exactamente el conjunto {pn } . Dicho de otra manera, sabemos que pn = (pn ). Entonces, el
radical de un ideal (pn ) generado por una potencia de un elemento primo (p) ∈ Spec(R) es
precisamente el ideal primo. Esto es,
p
(pn ) = (p).
Supongamos que R es un DFU y sea a = (a) un ideal principal en R. Sabemos que a factoriza
en R como producto finito de eleentos primos dos a dos no asociados, esto es,
a = pα αr
1 · · · pr ,
1

donde p : i ∈ R es primo, αi ∈ N, αi ≥ 1 y dados i, j ∈ [r], con i 6= j, entonces pi y pj no


son asociados como elementos de R. Entonces, en términos de ideales, esa igualdad se expresa
mediante
a = pα αr
1 · · · pr ,
1

donde cada ideal primo pi = (pi ). Aplicando la elemental Proposición precedente, concluimos
que:
r q r
√ q \ \
a = pα 1
1
· · · pαr
r = pαi
i = pi = p1 · · · pr .
i=1 i=1
La última igual se tiene porque cada pi es principal y primo en un DFU. En conclusión, si
a = (a), tenemos que

a = (p1 · · · pr ).
Obviamente, el mismo resultado se tiene si, además de ser DFU, el anillo R es DIP.

Ejemplo 6.3.5. En el ejemplo precdente hemos preludiado alguna de las ideas que subyace al
Teorema de Lasker-Noether aunque, como veremos, es sólo un idea sesgada e incompleta. Es
decir, supongamos que a es un ideal cualquiera en un anillo cualquiera (no necesriadamente
DFU, ni tampoco a es principal). Supongamos que a es una producto de potencias de primos,
i.e.
a = pα αr
1 · · · pr ,
1

Entonces,

a = p1 ∩ · · · ∩ pr .
Los mismo sucede para las intersecciones de potencias de ideales primos por la Proposición
elemental precdente. Como veremos, no todos los ideales son producto (ni siquiera intersección)
de potencias de ideales primos. Esta especia de generalización de las ideas de Gauss falla ya
para anillos noetherianos y propiciará el Teorema de Lasker-Noether.
6.3. LASKER-NOETHER (EXISTENCIA) 317

Ejemplo 6.3.6. Sea (X, T ) un espacio topológico y sea C (X) el anillo de las funciones continuas
a valores reales sobre X. Es obvio observar que C (X) no posee elementos nilpotentes no nulos
(incluso si poseyera divisores de cro no nulos, como en el caso en que X no sea conexo). Por
tanto, C (C) es un ejemplo natural de anillo reducido.
Más aún, sea F ⊆ X un subconjunto cualquiera. Definamos IC (F ) como el siguiente conjunto:
IC (F ) := {f ∈ C (X) : f ≡ 0}.

F
Es sencillo observar que IC (F ) es un ideal en C (X) (si dos funciones se anulan en F , su suma
también se anulará, etc.). Es sencillo observar también que si f sin C (X) es tal que una potencia
suya f n se aula en F , entonces, por ser R un cuerpo, f debe anularse en F . Es decir, se tiene
p
IC (X) = IC (X),
y concluimos que IC (F ) es un ideal radical en C (X). Será un ejemplo inspirador que, a su vez,
nos llevará al Nullstellensatz que veremos en Capı́tulos posteriores.

Proposición 6.3.7. Sea f : R −→ T es un morfismo de anillos y b ( T es un ideal propio de


T . Entonces, se tiene: √ c √
b = bc .
√ c √
Demostración. Supongamos que x ∈ b . Entonces, f (x) ∈ b por cuanto existirá
n∈√ N tal que f (xn ) = (f (x))n ∈ b. En particular, f (xn ) ∈ b implca que xn ∈ bc y, por tanto,
x ∈ bc . √
Para el otro contenido supongamos x ∈ R tal que x ∈ bc . Entonces existirá n ∈ N tal
√ √ c
que xn ∈ bc . Por tanto, f (xn ) = (f (x))n ∈ b. Luego f (x) ∈ b y, por tanto, x ∈ b ,
concluyendo la veracidad de las dos inclusiones. 

Proposición 6.3.8. Si a es un ideal de un anillo R, su radical es la intersección de todos los


primos que le contienen, es decir,
√ \
a = {p : p ⊇ a, p ∈ Spec(R)},
donde Spec(R) es el conjunto de todos los ideales primos de R.
Demostración. Por tradición notacional, escribamos
V (a) := {p ∈ Spec(R) : p ⊇ a},
y denotemos, por simplicidad de la notación, mediante b al siguiente ideal de R:
\
b := p.
p∈V (a)

Supongamos que p ∈ V (a). Si f ∈ a, entonces, existe n ∈ N, n ≥ 1, tal que f n ∈ a. Pero como
a ⊆ p, entonces f n ∈ p, n ≥ 1. Supongamos que n0 ∈ N es el mı́nimo de los números naturales
tales que n0 ≥ 1 y f n0 ∈ p. El número n0 existe porque N es un conjunto bien ordenado y, por
hipótesis, existe n ≥ 1 tal que f n ∈ p. Si n0 = 1 ya hemos terminado. Supongamos n0 ≥ 2.
Como p es un ideal primo, tendremos que
f n0 = f · f n0 −1 ∈ p =⇒ f ∈ p ∨ f n0 −1 ∈ p.
Como
√ n0 es mı́nimo, no es posible que f n0 −1 ∈ p, por cuanto f ∈ p. Por tanto, hemos probado
a ⊆ b, tal como ha sido definido anteriormente.
Para el otro contenido, usaremos el Lema de Zorn y la Proposición precedente. Bastará con
que p \
(0) = p.
p∈Spec(R)
Haremos una prueba similar a la del Teorema 4.2.8. Supongamos que f no es nilpotente y
probemos que debe existir un ideal primo p ∈ Spec(R) tal que f 6∈ p. Para empezar, como f no
es nilpotente, entonces f 6= 0. Consideremos el siguiente conjunto de todas las potencias de f :
Sf := {f n : n ∈ N}.
318 6. FACTORIZACIÓN: GAUSS, LASKER. NOETHER

Ahora consideremos el siguiente conjunto formado por ideales de R:


If (R) := {b ⊆ R : Sf ∩ b = ∅, b ideal de R}.
Este conjunto es no vacı́o, dado que, como f 6= 0 y f no es nilpotente, entonces (0) ∈ If (R).
Como en el Teorema 4.2.8, cambiando 1 por el conjunto Sf en aquella demostración, es claro
que toda cadena de elementos de (If (R), ⊆) posee cota superior. Por tanto, aplicando el Lema
de Zorn, existe algún elemento maximal m ∈ If (R). Veamos que m es necesariamente un ideal
primo de R.
Supongamos que no lo fuera y que existen p, q ∈ R tales que p 6∈ m y q 6∈ m de tal modo que
pq ∈ m. Tenemos los siguientes contenidos estrictos de ideales de R.
m ( m + (p), m ( m + (q).
Como m es un elemento maximal en If (R) ninguno de esos dos ideales estrictamente mayores
que m está en If (R), es decir,
m + (p) 6∈ If (R), m + (q) 6∈ If (R).
Por tanto,
(m + (p)) ∩ Sf 6= ∅, (m + (q)) ∩ Sf 6= ∅.
Por tanto, existen n, m ∈ N tales que n ≥ 1, m ≥ 1 tales que
f n ∈ m + (p), f m ∈ m + (q).
Por tanto, existen m1 , m2 ∈ m y λ1 , λ2 ∈ R tales que:
f n = m1 + λ1 p, f m = m2 + λ2 q.
Por tanto,
f n+m = f n f m = m1 m2 + (λ1 p)m2 + (λ2 q)m1 + λ1 λ2 (pq).
Como m1 , m2 ∈ m, entonces m1 m2 + (λ1 p)m2 + (λ2 q)m1 ∈ m y como pq ∈ m, entonces
λ1 λ2 (pq) ∈ m. Por tanto, hemos probado que
f n+m ∈ m,
en contradicción con el hecho m ∈ If (R).
Concluimos ası́ que m ∈ If (R) y m ∈ Spec(R). Pero eso es imposible dado que f está en todos
los primos de R y m ∈ Spec(R) lo que contradice el hecho de que f 6∈ m. Concluimos ası́ que
si f no es nilpotente, existirı́a un primo en Spec(R) al que f no podrı́a pertenecer y tenemos
probada la segunda inclusión del enunciado. 

Observación 6.3.9. De hecho, la prueba se simplifica notablemente si f ∈ R no es un elemento


nilpotente, tiene sentido considerar la localización Rf y argumentar con el Teorema 4.2.8: Como
los ideales primos de Rf son las localizaciones de los primos de R que no contienen a f y
MaxSpec(Rf ) 6= ∅, entonces hay un primo p de R tal que f 6∈ p. Pero necesitarı́amos llegar a
los aspectos de localización que, por razones estructurales, hemos pospuesto hasta el Capı́tulo
??.

6.3.2. Ideales Primarios. Ya hemos sugerido que no todo ideal propio de un anillo, ni
siquiera cuando es noetheriano, va a ser una intersección (o producto) de potencias de ideales
primos. En otras palabras, las potencias de ideales primos no van a bastar para “factorizar”
ideales que no sea principales. Sugre ası́ la noción que reemplaza a la noción de “potencia de
ideal primo” que será la noción de ideal primario de Lasker y Noether.
Haremos el estudio con la perspectiva de poder extender los resultados para R−módulos noethe-
rianos (de tal modo que sea sencillo generalizar a módulos nuestro discurso para anillos). Pero
nos restringiremos al caso de anillos y dejaremos para los Problemas el caso de R−módulos.
Para empezar retomamos nuestras homotecias. Sea M un R−módulo. Para cada elemento
a ∈ R, denotaremos por ηa,M en endomorfismo de R−módulos definido, de nuevo del modo
siguiente
ηa,M : M −→ M
m 7−→ am.
que denominamos la homotecia de razón a sobre M . La generalización de lo que sigue pasa por
considerar esta homotecia como elemento fundamentador. En la Sección, nos restringiremos
6.3. LASKER-NOETHER (EXISTENCIA) 319

al caso del R−módulo M := R/q y de la homotecia ηa,R/q , dejando el caso general para los
problemas. Por garantizar que esta homytecia, en este caso, queda definida con precisión,
observamos que viene dada por la siguiente expresión:
ηa,R/q : R/q −→ R/q
x + q 7−→ ax + q.
En ocasiones, cuando no haya posibilidad de confusión, escribiremos simplemente ηa , pero hay
que ser cuidadoso con estanotación en muchos casos.
Recordemos también la noción de endomorfimso nilpotente de un R−módulo M como el en-
domorfismo φ : M −→ M tal que existe n ∈ N, n ≥ 1, verificando φn ≡ 0, donde φn es la
composición de φ consigo mismo n veces.
Lema 6.3.10. Sea R un anillo, M un R−módulo, las homotecias verifican las siguientes propiedades:
i) Si a = 0 es el elemento nulo del anillo, η0,M ≡ 0 es el endomorfismo nulo de M .
ii) Si a = 1 es el elemento unidad para el producto del anillo, entonces η1,M = IdM es el
endomorfismo identidad sobre M .
iii) Dados a1 , a2 ∈ R dos elementos, se verifican las siguientes identidades:
ηa1 +a2 ,M = ηa1 ,M + ηa2 ,M , ηa1 a2 ,M = ηa1 ,M ◦ ηa2 ,M = ηa2 ,M ◦ ηa1 ,M ,
donde ◦ significa composición de aplicaciones
En otras palabras, el siguiente es un morfismo de anillos con unidad (aunque el segundo anillo
no sea conmutativo):
H : (R, +, ·) −→ (HomR (M, M ), +, ◦)
a 7−→ ηa,M .
Demostración. Es un sencillo ejercicio de comprobación. 

Obviamente, el resultado se mantiene cuando M = R/q es el R−módulo cociente de R ‘por un


ideal propio. En particular, obseravmos que si a ∈ R y el enformismo ηa,R/q es nilpotente es
porque existe un entero positiovo n ∈ N, n ≥ 1, tal que

ηa,R/q = ηan ,R/q ≡ 0,
es el enodmorfismo idénticamente nulo. Esto conduce a la siguiente observación en forma de
Corolario:
Corolario 6.3.11. Si R es un anillo, q es un ideal propio de R y a ∈ R, entonces son
equivalentes:
i) El endomorfismo ηa,R/q es nilpotente.

ii) a ∈ q.
Demostración. Sencillo ejercicio a partir de la Proposición precdente. 

Definición 80 (Ideal primario). Sea R un anillo y sea q ( R un ideal propio de R. Decimos


que es un ideal primario si para cada a ∈ R, el endomorfismo ηa,R/q es inyectivo o nilpotente.

Proposición 6.3.12. Si q es un ideal primario de anillo R, entonces el siguiente conjunto:


p := {a ∈ R : ηa,R/q no es inyectiva},

es un ideal primo de R. En particular, p = q ∈ Spec(R) es el radical de q y el radical de un
ideal primario es un ideal primo. Diremos que el ideal q es p−primario.
Demostración. Como q es primario, un elemento a ∈ R está en p si y solamente si a + q

es nilpotente en R/q o, equivalentemente, ηa,R/q no es inyectivo si y solamente si a ∈ q.

Con ello concluimos que p = q y p es un ideal de R. Veamos, además, que p es un ideal
primo de R. Para ello, consideremos a, b ∈ R son tales que ab ∈ p. Y también recordamos que
ηab,R/q = ηb,R/q ◦ ηa,R/q = ηa,R/q ◦ ηb,R/q , donde ◦ es la composición de endomorfismos. Pero
si ηa,R/q y ηb,R/q fueran inyectivas, también lo serı́a su composición ηab,R/q . Por tanto, o bien
ηa,R/q o bien ηb,R/q es no inyectiva. Luego, o bien a ∈ p o bien b ∈ p y habremos probado que
p es un ideal primo de R. 
320 6. FACTORIZACIÓN: GAUSS, LASKER. NOETHER

Proposición 6.3.13. Un ideal propio q ( R es primario si y sólo sı́verifica la siguiente


propiedad involucrando cuantificadores:

∀x, y ∈ R, xy ∈ q ∧ x 6∈ q =⇒ y ∈ q.
Demostración. Supongamos que q es primario y sean x, y ∈ R tales que xy ∈ q y x 6∈ q.
Observamos que
ηy,R/q (x + q) = xy + q = 0 + q.
Por tanto, x + q 6= 0 + q es un elemento del núcleo de ηy,R/q . Como q es primario y ηy,R/q no

es inyectiva, entonces es nilpotente y, por el Corolario precedente, concluimos que y ∈ q.
Recı́procamente, supongamos que se verifica la propiedad expresada con cuantificadores del
enunciado. Consideremos a ∈ R un elemento cualquier y la homtecia ηa,R/q que define. Si la
homotecia ηa,R/q es inyectiva no hay nada que probar. Supongamos, por tanto, que la homotecia
ηa,R/q no es inyectiva. Existirá b ∈ R tal que b + q es no nulo en R/q y está en el núcleo de
ηa,R/q . Es decir b 6∈ q y se tiene:
ηa,R/q (b + q) = ab + q = 0 + q.
En otras palabras, tenemos que ab ∈ q y b 6∈ q, por tanto, usando la propiedad asumida

concluimos que a ∈ q. Pero, como ya se indicón anteriormente, esto es equivalente a decir
que ηa,R/q es un endomorfismo nilpotente cuando no es inyectivo. En suma q es primario. 

Corolario 6.3.14. Sea f :−→ T un morfismo de anillos y sea q ⊆ T un ideal primario de


T . Entonces, la contracción qc := f −1 (q) ⊆ R es un ideal primario. Más aún, si q es un ideal
p−primario de T , con p ∈ Spec(T ), entonces qc es pc −primario, donde pc ∈ Spec(R) es la
contracción a R del ideal primo p ∈ Spec(T ).
Demostración. En primer lugar, por la Proposición 6.3.7 precedente, sabemos que
√ c √
pc = ( q) = qc .
Por tanto, si qc es primario, ha de ser pc −primario. De otro lado, sea a ∈ R un elemento
cualquiera y consideremos el morfismo de R−módulos
ηa := ηa,R/qc : R/qc −→ R/qc
x + qc 7−→ ax + qc .
Si ηa es nilpotente, entonces existe n ∈ N tal que ηan = 0 lo que
√ implicarı́a an (1+qc ) = an +qc =
c c c
0 + q . En otras palabras, si ηa es nilpotente, entonces a ∈ q = p .
Por reducción al absurdo, supongamos que ηa no es nilpotente, a 6∈ pc y ηa no es inyectivo.
Entonces, existe x ∈ R \ qc tal que ηa (x + qc ) = 0 + qc . Es decir, tendrı́amos que ax ∈ qc y,
por tanto, f (a)f (x) = f (ax) ∈ q. Pero, entonces,el siguiente morfismo de T −módulos no serı́a
inyectivo:
ηf (a) := ηf (a),T /q : T /q −→ T /q
y + q 7−→ f (a)y + q.
Este morfismo es no inyectivo porque x 6∈ qc implica y = f (x) 6∈ q, luego f (x) + q 6= 0 + q es
un elemento no nulo en T /q. Pero ηf (a) (f (x) + q) = 0 + q. Por tanto, ηf (a) no es inyectivo

y, como q es primario, entonces ηf (a) es nilpotente, lo que impñlica que f (a) ∈ q = p. Por
tanto, f (a) ∈ p lo que implica a ∈ pc contradiciendo nuestras hipótesis. En conclusión, para
cada a ∈ R o bien ηa es nilpotente o bien es inyectivo y, por tanto, qc es un ideal primario de
R. 

Los siguientes ejemplos sirven para mostrar que los ideales primarios tratan de generalizar
los conceptos de potencia de un ideal primo en un dominio de ideales principales. Pero la
generalización no consiste de manera obvia en pensar en potencias de ideales primos.

Proposición 6.3.15. Sea q ( R un ideal propio de un anillo R y supongamos que su radical es



un ideal maximal de R, es decir, supongamos que q = m ∈ MaxSpec(R) es un ideal maximal.
Entonces, q es m−primario.
6.3. LASKER-NOETHER (EXISTENCIA) 321

Demostración. Consideremos, en primer lugar, el anillo cociente R/q. Consideremos


cualquier submóudlo de R/q como R−módulo que no son otra cosa que los ideales de R/q.
Consdieremos el espectro primo de ese anillo cociente Spec(R/q). Sabemos que los primos del
anillo R/q son de la forma p/q donde p ∈ Spec(R) es un ideal primo en R que, ademásn contiene
al ideal q. Por las propiedaes del radical sabemos que
√ √
m = q ⊂ p = p.
Como m es maximal y p es un ideal propio, concluimos que el espectro primo y el espectro
maximal de R/q son iguales y satisfacen:
Spec(R/q) = MaxSpec(R/q) = {m/q}.
En otras palabras, R/q es lo que llamaremos un anillo local, es decir, que posee un único ideal

maximal
p (terminologı́a que retomaremos más adelante). Además, como q = m, entonces
(0 + q) = m/q es una igualdad de ideales en R/q. Por tanto, los elementos a + q ∈ R/q son
de dos tipos:
×
• Si a+q 6∈ m/q, entonces a+q no están en ningı́n ideal de R/q. Por tanto a+q ∈ (R/q)
es una unidad en R/q.
• Si a + q ∈ m/q, entonces a + q ha de ser un elemento nilpotente en R/q.
Ahora bien, si a + q es unidad en R/q y si tomo un elemento b + q ∈ R/q en el núcleo de ηa,R/q ,
se tendrá:
0 + q = ηa,R/q (b + q) = ab + q = (a + q)(b + q).
Pero como a + q es unidad en R/q, posee un inverso (a + q)−1 ∈ R/q y, multiplicando por él la
anterior igualdad obtenemos
0 + q = (a + q)−1 (0 + q) = (a + q)−1 (a + q)(b + q) = (b + q),
lo que implica que ηa,R/q es inyectiva.
De otro lado, si ηa,R/q no es unidad es porque a + q es un elemento nilpotente en R/q. Pero,
entonces, existe un entero positivo n ∈ N, n ≥ 1, tal que (a + q)n = an + q = 0 + q. Ası́, dado
b + q ∈ R/q un elemento cualquiera, tenemos que
n
ηa,R/q (b + q) = ηan ,R/q (b + q) = an b + q = (an + q)(b + q) = (0 + q)(b + q) = 0 + q.
n
En conclusión, ηa,R/q ≡ 0 es el endomorfismo nulo y, por tanto ηa,R/q es nilpotente.
Juntando los dos casos concluimos que q es un ideal primario. Más aún, los elementos a ∈ R
tales que ηa,R/q no es inyectivo son exactamente aquellos tales que a ∈ m, por tanto q es un
ideal m−primario. 

Ejemplo 6.3.16 (Ideales primarios principales en DIP’s y DFU’s). Los ideales primarios
en dominios de ideales principales son las potencias de ideales primos. Ası́ el ideal 8Z es un
ideal (2)−primario, pero el ideal (12) no es primario.
Del mismo modo, si R es un DFU y si q = (q) es un ideal principal. Este ideal (q) es primario
si y solamente si q es una potencia de un elemento primo.

Ejemplos má intrigantes para la intuición son los siguientes:


Ejemplo 6.3.17 (No todo primario es potencia de un primo). Sin embargo, no es
necesario que un ideal sea potencia de ideal primo para ser primario. Consideremos el ideal
a := (X, Y 2 ) en el anillo de polinomios en dos variables R := k[X, Y ]. Es un ideal primario:
su radical es el ideal maximal m = (X, Y )) y, por tanto, es un ideal m−primario. Pero no es
el ideal m porque Y 6∈ a (luego a 6= m. Pero, además, X ∈ a no es un elemento de cualquier
potencia mr con r ≥ 2. Luego a no es potencia de m. Además, m es el único primo que contiene
a a por lo que no puede existir ningún otro primo p ∈ Spec(K[X, Y ]) tal que q = pn para algún
n
n ∈ N. El caso n = 0 es obvio porque a ( √K[X,√Y n] es un ideal propio. En otro caso, si a = p ,
con n ≥ 1 y p ∈ Spec(R), entonces m = a = p = p y ya hemos visto que a no es potencia
de m. Por tanto, a es primario pero no es potencia de ningún primo.
322 6. FACTORIZACIÓN: GAUSS, LASKER. NOETHER

Ejemplo 6.3.18 (No toda potencia de primo es primario). Consideramos ahora el ideal
a := (XY − Z 2 ) ⊆ Q[X, Y, Z] y sea R el anillo cociente:
R := Q[X, Y, Z]/a.
Sea p = (X + a, Z + a) = (X, Z)/a ⊆ R el ideal generado por las clases de X y Z con respecto
al ideal a. Tenemos que p es un ideal primo de R. Esto se ve fácilmente, dado que
 
(6.3.1) R/p ∼= (R/a) /((X, Z)/a) ∼ = Q[X, Y, Z]/(X, Z) ∼ = Q[Y ].

Consideremos ahora el ideal q := p2 en R y veamos que este ideal no es primario. En primer


lugar observemos que
p2 = (X 2 + a, XZ + a, Z 2 + a).
Pero Z 2 + a = XY + a. Por tanto, XY + a ∈ q. Entonces, X + q es un elemento del núcleo de
ηY,R/q . Además, X + q 6= 0 + q. Veamos esta última afirmación:
Si X + q = 0 + q tendrı́amos que X está en el ideal b de Q[X, Y, Z] dado mediante:
b := (X 2 , XZ, Z 2 , XY − Z 2 ) = (X 2 , XZ, XY, Z 2 ).
Pero eso no es posible: Tendrı́amos una descripción:
X = p1 (X, Y, Z)X 2 + p2 (X, Y, Z)XZ + p3 (X, Y, Z)XY + p4 (X, Y, Z)Z 2 .
Tomando X = 0, concluirı́amos
0 = p4 (0, Y, Z)Z 2 ,
luego, como Q[X, Y, Z] es un DFU, concluimos que X | p4 (X, Y, Z), es decir p4 (X, Y, X) =
Xq4 (X, Y, Z). Ası́, la anterior igualdad se convierte en:
X = p1 (X, Y, Z)X 2 + p2 (X, Y, Z)XZ + p3 (X, Y, Z)XY + q4 (X, Y, Z)XZ 2 ,
y , sacado factor común a X, se convierte en:
X = (p1 (X, Y, Z)X + p2 (X, Y, Z)Z + p3 (X, Y, Z)Y + q4 (X, Y, Z)Z 2 )X.
Por ser Q[X, Y, Z] un dominio de integridad, concluirı́amos que
1 = (p1 (X, Y, Z)X + p2 (X, Y, Z)Z + p3 (X, Y, Z)Y + q4 (X, Y, Z)Z 2 ),
o, equivalentemente,
1 ∈ (X, Y, Z) ⊆ Q[X, Y, Z].
Pero ya hemos visto que los ideales de la forma (X, Y, Z) son ideales maximales en Q[X, Y, Z]
y, por tanto, no pueden contener al elemento unidad de ese anillo.
En conclusión la homotecia ηY,R/q no es inyectiva porque contiene a un elemento no nulo en
su núcleo. Entonces, necesariamente se habrı́a de tener Y + a ∈ p, lo cual es imposible por el
isomorfismos descrito en la Identidad (6.3.1)

Ejemplo 6.3.19 (No todo ideal con radical primo es primario). Si bien el radical de
un ideal primario es un ideal primo, no es necesariamente cierto que todo ideal cuyo radical
2
√ el ideal a := (XY, Y ) ⊆
es primo sea un ideal radical. El ejemplo clásico pasa por considerar
R := Q[X, Y ]. Observamos que el radical del ideal a satisface a = (Y ), que es un ideal
primo en Q[X, Y ]. Pero, el ideal a no es primario: la homotecua ηX,R/a no es inyectiva porque

ηX,R/a (Y + a) = 0, y tampoco es nilpotente porque X 6∈ a.

Proposición 6.3.20. Sean q1 , . . . , qs ideales p−primarios de un anillo R (es decir, ideales


primarios con respecto al mismo ideal primo de R). Entonces, la intersección siguiente
q = q1 ∩ · · · ∩ qs
es un ideal p−primario.
6.3. LASKER-NOETHER (EXISTENCIA) 323

Demostración. Sea a ∈ p. Para cada i, 1 ≤ i ≤ s y consideremos la homotecia:


ηa,R/qi : R/qi −→ R/qi .
Por ser qi un ideal p−primario, entonces esta homtecia es nilpotente. Por tanto, para cada i,
1 ≤ i ≤ s, existe ni ∈ N, ni ≥ 1 tal que
ni
ηa,R/q i
≡ 0.
Tomando el elemento 1 + qi , tendremos que
ni
ηa,R/qi
(1 + qi ) = ani + qi = 0.

Considerando n0 ; = max{n1 , . . . , ns }, tendremos que an0 ∈ qi para cada i, 1 ≤ i ≤ s y la


homotecia ηa,R/q será nilpotente.
De otro lado, veamos que si a 6∈ p, entonces ηa,R/q es necesariamente inyectiva. Pues si no lo
fuera es porque existe b ∈ R, b 6∈ q tales que ηa,R/q (b + q) = ab + q = 0. Es decir, si ηa,R/q no
fuera inyectiva, entonces, existe b ∈ R tal que b 6∈ q y ab ∈ q. Pero b 6∈ q implica que existe i,
1 ≤ i ≤ s, tal que b 6∈ qi . Por tanto, tendrı́amos que existe b ∈ R tal que b 6∈ qi y ab ∈ q ⊆ qi .
Es decir ηa,R/qi no es inyectiva contradiciendo el hecho de que a 6∈ p y que qi es p−primario. 

6.3.3. Descomposición Primaria en anillos noetherianos: Teorema de Lasker-


Noether.
Definición 81 (Descomposición Primaria de Ideales). Sea a un ideal de un anillo R.
Una descomposición primaria de a es una descripción de a como intersección finita:
a := q1 ∩ . . . ∩ qs ,
donde cada qi es un ideal primario de R. Tenemos la lista finita de ideales primos {p1 , . . . , ps } ⊆
Spec(R) de tal modo que para cada i, 1 ≤ i ≤ s, el ideal qi es pi −primario. Decimos que la
descomposición primaria anterior es reducida (o, también, irredundante) si pi 6= pj , para cada
i 6= j y q no se puede presentar como intersección de un subconjunto propio de {q1 , . . . , qs }.

Proposición 6.3.21. Sea a un ideal propio de un anillo R. Dada una presentación de a como
intersección finita de ideales primarios:
(6.3.2) a := q1 ∩ · · · ∩ qt ,
entonces esta descomposición puede refinarse a una descomposición primaria irredundante y,
en particular, a posee una descomposición primaria irredudante.
Demostración. El refinamiento se hará en dos fases:
i) Fase 1: Agrupar los primarios con el mismo radical:En primer lugar, supongamos
que cada qi es pi −primario, con pi ∈ Spec(R). Salvo reordenación de los subı́ndices,
podremos encontrar r ≤ t tal que se tenga:
{p1 , . . . , pt } = {p1 , . . . , pr },
con pi 6= pj para cada i 6= j, 1 ≤ i, j ≤ r. En otras palabras, identificamos los
elementos distintos del conjunto {p1 , . . . , pt }. Seguidamente, agrupamos los ideales
primarios de la Identidad 6.3.2 que tengan el mismo radical. Es decir, para cada j,
1 ≤ j ≤ r, definamos:
\ \ √
rj := {qi : qi es pj −primario} = {qi : qi = pi }.

Por la Proposición 6.3.20 precedente, cada rj es pj −primario, para 1 ≤ j ≤ r. Además,


tenemos que
a := r1 ∩ · · · ∩ rr ,
es una descomposición primaria en la que cada rj es pj −primario y pi 6= pk , para cada
i 6= k, con 1 ≤ i, k ≤ r.
324 6. FACTORIZACIÓN: GAUSS, LASKER. NOETHER

ii) Fase 2: Minimizando el conjunto de primarios que intervienen: Consdieremos el sigu-


iente conjunto:
I := {s : ∃S ⊆ {1, . . . , r}, ](S) = s, a = ∩j∈S rj }.
Sea s0 = min I y sea S0 ⊆ {1, . . . , r} tal que ](S0 ) = s0 y se satisface:
\
(6.3.3) a= rj .
j∈S0

Como s0 es mı́nimo, no podemos eliminar ninguno de los primarios de esa intersección


sin perder la igualdad entre a y esa intersección.
En conclusión la descomposición exhibida en la Identidad 6.3.3 es una descomposición primaria
irredudante de a porque no hay dos primos asociados iguales ni tampoco se puede eliminar
ningún primario sin perder la igualdad con a. 

Definición 82 (Ideal Irreducible). Un ideal propio q de un anillo R se llama reducible si


existen a1 , a2 dos ideales propios de R tales que
q = a1 ∩ a2 ,
con q ( ai ( R, 1 ≤ i ≤ 2.
Un ideal propio q de R se llama ideal irreducible si no es reducible.

Proposición 6.3.22. Si R es un anillo noetheriano, todo ideal irreducible es primario.


Demostración. Supongamos que q ( R es un ideal irreducible en R. Recordemos que
los ideales de R/q son los submódulos como R/q−módulo y como R−módulo. Consideremos
a ∈ R y sea ηa,R/q : R/q −→ R/q la homtecia definida por a sobre R/q. Consideremos la
secuencia de submódulos de R/q dada por los núcleos de las potencias de este endomorfismo
r
Kr := ker(ηa,R/q ). Claramente tenemos que se trata de ideales de R/q y se verifica:
(0) = K0 ⊆ K1 ⊆ K2 ⊆ · · · ⊆ Kr ⊆ · · · .
Como R es noetheriano, también lo es R/q y, por tanto, esa cadena se estabiliza. Es decir,
existe n ∈ N, n ≥ 1, tal que Kr = Kn , para cada r ≥ n.
n
Definamos φ := ηa,R/q : R/q −→ R/q. Tenemos la siguiente afirmación:
Afirmación. Se verifica:
(6.3.4) ker(φ) ∩ Im(φ) = (0).
Demostración de la Afirmación. Es claro que si b + q ∈ Im(φ) ∩ ker(φ), entonces, b + q =
φ(b0 + q) = ηa,R/q
n
(b0 + q) y 0 + q = φ(b + q) = ηa,R/q
n 2n
(b + q) = ηa,R/q (b0 + q). Por tanto,
b0 + q ∈ ker(ηa,R/q
2n n
) = K2n = Kn = ker(ηa,R/q ).
Por tanto, b + q = φ(b0 + q) = ηa,R/q
n
(b0 + q) = 0 + q y habremos probado la afirmación.
Sea ahora π : R −→ R/q la proyección canónica y consideremos los ideales de R dados mediante:
a1 := π −1 (ker(φ)), a2 := π −1 (Im(φ)).
Claramente, tenemos los casos siguientes:
• a1 = q ( R. En ese caso, tenemos que ker(φ) = a1 /q = (0 + q) Por tanto, ker(φ) =
n n
(0 + q). Pero φ = ηa,R/q . Por tanto, ηa,R/q es inyectiva para n ∈ N, n ≥ 1.
Pero este endomorfismo es la composición consigo mismo de un mismo endomorfismo:
n
ηa,R/q = ηa,R/q ◦ · · · ◦ ηa,R/q .
Luego, si la composición de un endomorfismo consigo mismo varias veces es inyectivo,
el endomorfismo en cuestión debe ser inyectivo también y ηa,R/a es inyectivo.
• a2 = q ( R. En ese caso Im(φ) = a2 /q = (0 + q). Por tanto, φ es el endomorfismo
indénticamente nulo de R/q como R−módulo. Pero eso significa que
n
φ = ηa,R/q ≡ 0.
O, dicho de otra manera, el endomorfismo ηa,R/q es nilpotente.
6.3. LASKER-NOETHER (EXISTENCIA) 325

Habremos concluido ası́ que q es un ideal primario. 

Teorema 6.3.23 (Teorema (Existencial) de Lasker-Noether). Si R es un anillo noethe-


riano, todo ideal propio posee una descomposición primaria irredundante.
Demostración. Por la Proposición 6.3.21 basta con demostrar que todo ideal propio es
intersección finita de ideales primarios. Pero, por la Proposición 6.3.22 precedente, basta con
demostrar que todo ideal propio de R es intersección de ideales irreducibles. Para probar
esto último, razonemos por reducción al absurdo (tı́pico argumento noetheriano que ya hemos
encontrado varias veces) y consideremos el conjunto:
F := {q ( R : a es ideal y no es intersección finita de ideales irreducibles de a}.
Supongamos, por reducción al abusrdo que F 6= ∅. Entonces, por el Teorema 3.3.2, F posee
elemento maximal para la inclusión. Sea a ∈ F ese elemento maximal. Dicho elemento es un
ideal propio de R (porque la definición de F , formado por ideales propios). Además, a no puede
ser un ideal irreducible porque, entonces, serı́a intersección fnita de irreducibles, contradiciendo
la hipótesis a ∈ F . Pero, entonces, será reducible y existirán a1 ( R, a2 ( R dos ideales
propios tales que a ( ai , 1 ≤ i ≤ 2 y
a = a1 ∩ a2 .
Por la maximalidad de a en F , es claro que a1 6∈ F y a2 6∈ F . Pero como ambos son ideales
propios de R lo único que les falla es la segunda propiedad ue define F : ambos son intersección
finita de irreducibles. Consideremos ahora, dos descomposiciones de a1 y a2 como intersección
finita de irreducibles:
a1 = q1 ∩ · · · ∩ qs , a2 = qs+1 ∩ · · · ∩ qt .
Entonces, a será también intersección finita de irreducibles:
a = a1 ∩ a2 = q1 ∩ · · · ∩ qs ∩ qs+1 ∩ · · · ∩ qt .
Lo que contradice el hecho de que a ∈ F . Por tanto, F = ∅ y el Teorema queda demostrado. 

6.3.4. Unicidad (Primer Teorema): descomposición primaria, asociados e ide-


ales primos minimales de un anillo noetheriano.
Definición 83. Sea M un R−módulo. Un ideal primo p ∈ Spec(R) se denomina asociado a M
es el anulador de algún elemento de x ∈ M (cf. Definición 71). Es decir, si existe x ∈ M \ {0}
no nulo, tal que:
p = AnnR (x) := {a ∈ R : ax = 0}.
Denotaremos por AssR (M ) el conjunto de los ideales primos asociados a M . Si M = R,
escribiremos Ass(R) para los ideales primos asociados a R como md́ulo sobre sı́ mismo.

Observación 6.3.24. Otra manera de interpretar los ideales primos asociados a un R−módulo
M viene dada por la formulación siguiente :
Un ideal primo p ∈ Spec(R) es asociado a M si y solamente si existe un monomorfismo de
R−módulos:
ϕ : R/p −→ M.
El elemento ϕ(1R + p) = x verifica p = Ann({x}). La clase de ideales primos asociados a un
R−módulo es especialmente importante por determinar sus divisores de cero.

Definición 84 (Divisor de cero de un R−módulo). Dado un R−módulo M y un elemento


no nulo a ∈ R, diremos que a es un divisor de cero de M , si existe m ∈ M , m 6= 0, tal que
am = 0.

Nótese que, en el caso de anillos, son los divisores de cero del anillo.
326 6. FACTORIZACIÓN: GAUSS, LASKER. NOETHER

Ejemplo 6.3.25. Por tomar un ejemplo clásico, retomemos la Teorı́a del Endomorfismo in-
troducida en el Ejemplo 2.2.4. Consideramos un K−espacio vectorial de dimensión finita V
y un endormorfismo como K−espacio vectorial ϕ : V −→ V . Esto inducı́a una estructura de
K[X]−módulo sobre V dada mediante:
· : K[X] × V −→ V
(p, v) 7−→ p(ϕ)(v),
donde el endomorfismo p(ϕ) se define en el citado ejemplo. Ahora, dado un elemento v ∈ V , su
anulador será:
AnnK[X] (v) := {p ∈ K[X] : p(ϕ)(v) = 0}.
Como K[X] es un dominio de ideales principales el ideal AnnK[X] (v) = (q(X)) es un ideal
principal. Sugenerador es el polinomio mı́nimo de ϕ en v (que hemos denotado mediante µv en
el Problema 165). Este ideal es asociado a V como K[X]−módulo si y solamente si µv es un
elemento primo.

Lema 6.3.26. Sea R un anillo noetheriano y q un ideal p−primario de R. Entonces, existe


n ∈ N tal que pn ⊆ q.
Demostración. Es inmediato (véase el Problema 259). 

Teorema 6.3.27 (Primer teorema de unicidad de la descomposición primeria re-


ducida en anillos noetherianos). Sea R un anillo noetheriano y sea
(0) = q1 ∩ · · · ∩ qr
una descomposición primaria irredudante del ideal (0) de R, donde cada qi es pi −primario.
Entonces,
Ass(R) = {p1 , . . . , pr }.
En particular, Ass(R) es un conjunto finito y los ideales primos que aparecen en una descom-
posición primaria irredundante del ideal (0) están unı́vocamente determinados por el anillo y
son independientes de la descomposición primaria elegida.
Demostración. Probemos las dos inclusiones:
• ⊆ : Consideremos p ∈ Ass(M ) y supongamos x ∈ M , x 6= 0, tal que p = AnnR ({x}).
Salvo reordenación de los ı́ndices de la descomposición primaria, existirá un cierto
ı́ndice j ≥ 1 tal que :
(6.3.5) x 6∈ q1 ∪ · · · ∪ qj , x ∈ qj+1 ∩ · · · ∩ qr .
Sea ni ∈ N tal que pni i ⊆ qi . Tendremos que :
j
Y j
Y
pni i x = {λx : λ ∈ pni i } ⊆ (q1 ∩ · · · ∩ qj ) ∩ qj+1 ∩ · · · ∩ qr = (0).
i=1 i=1
Qj Qj
Por tanto el ideal i=1 pni i está contenido en el anulador de x (i.e. ni
i=1 pi ⊆ p =
AnnR (x)). Tomando radicales, como en el ı́tem ii) de la Proposición 6.3.3, tendremos:
v
u j j q j
√ uY \ \
p = p ⊇ t pni = i pni = p. i i
i=1 i=1 i=1

Por el ı́tem iv) de la Proposición 4.2.12, dado que p es un ideal primo, existirá un
cierto k, 1 ≤ k ≤ j, tal que pk ⊆ p. Fijemos ese k, con 1 ≤ k ≤ j.
Por otro lado, a partir de la Identidad (6.3.5), como k ≤ j, se tiene que x 6∈ qk o,
equivalentemente, x + qk 6= 0. Para cada a ∈ p = AnnR (x), tendremos que ax = 0 en
R y, por tanto, la homotecia ηa,R/qk : R/qk −→ R/qk no es inyectiva:
ηa,R/qk (x + qk ) = 0 + qk .
Por tanto, por ser qk un ideal pk −primario, los elementos a ∈ R tales que la homotecia
ηa,R/qk no es inyectiva están en el ideal pk . En conclusión, para cada a ∈ p, concluimos
que a ∈ pk y tenemos p = pk .
Combinando ambas inclusiones, concluimos que si p ∈ Ass(R), entonces existe k ∈
6.3. LASKER-NOETHER (EXISTENCIA) 327

{1, . . . , r} tal que p = pk y tenemos probada la primera inclusión de las dos afirmadas
en el enunciado del Teorema.
• ⊇ :Para el otro contenido, probemos que cada i, 1 ≤ i ≤ r, pi ∈ Ass(M ). Supongamos,
sin pérdida de la generalidad, i = 1 y considremos x ∈ q2 ∩ · · · ∩ qr tal que x 6∈ q1 .
Tal elemento x ∈ R ha de existir porque la descomposición primaria del enunciado
es irredundante. Puesto que q1 es p1 −primario, existirá n ∈ N tal que pn1 ⊆ q1 . Por
tanto, pn1 x ⊆ q1 . Consideremos el conjunto:
B := {m ∈ N : m ≥ 1, pm
1 x ⊆ q1 }.

Hemos visto que ese es un conjunto no vacı́o de enteros positivos, ası́ que debe tener
algún mı́nimo. Supongamos que n es el mı́nimo de A. Existirá, entonces, un elemento
y ∈ pn−1
1 x tal que y 6∈ q1 . En particular y 6= 0 en R y p1 y ⊆ pn1 x ⊆ q1 . Por lo tanto,
p1 ⊆ AnnR ({y}). De otro lado, si a ∈ R es un elemento tal que ay = 0, la homotecia
ηa,R/q1 : R/q1 −→ R/q1 no es inyectiva (porque y 6∈ q1 y ay = 0). Por la Proposición
6.3.12, dado que q1 es p1 −primario, concluimos que a ∈ p1 . Habremos probado que
AnnR ({y}) ⊆ p1 ⊆ AnnR ({y}) y concluimos la igualdad que pretendı́amos. Por tanto,
concluimos que:
p1 = AnnR ({y}) ∈ Ass(R).
Los ideales primos dados como radical de los primarios que aparecen en una descomposición
primaria irredundante de (0), están determinados de maneraúnica como la clase Ass(R). La
unicida de tales primos se sigue dela definición de Ass(R), cuyos elementos nada tienen que ver,
a priori, con la descomposición primaria irredundante considerada. 

Corolario 6.3.28 (Primer teorema de unicidad para Lasker-Noether para cocientes


de anillos). Sea R un anillo noetheriano, a un ideal propio y consideremos una descomposición
primaria irredudante de a :
a = q1 ∩ · · · ∩ qr ,
donde qi es pi −primario. Entonces,
Ass(R/a) = {p1 , . . . , pr }
En particular, los ideales asociados a una descomposición primaria irredundante de un ideal
están determinados de manera única por el cociente R/a y son independientes de la descom-
posición primaria irredudante elegida.
Demostración. Basta con reproducir los mismos argumentos del Teorema precedente
usando las clases módulo a de elementos de R para argumentar. 

La siguiente propiedad muestra la relación entre los divisores de cero de un anillo noetheriano
y los primos asociados:
Proposición 6.3.29. Sea R un anillo noetheriano, a ( R un ideal propio. Entonces, el conjunto
de los divisores de cero de R/a como R−módulo es dado por la siguiente igualdad:
[
p.
p∈Ass(R)

En particular, los divisores de cero de un anillo R es la unión de los ideales primos en Ass(R).
Demostración. Hagamos la prueba para el caso a = (0) y dejemos el caso general como
ejercicio para el lector.
Tomemos una descomposición primaria irredundante del ideal (0) de R :
(0) = q1 ∩ · · · ∩ qr
donde cada qi es pi −primario.
Sin pérdida de la generalidad, consideremos el ideal primo p1 . Por el teorema precedente, como
p1 es un ideal primo en Ass(R), existe x ∈ R tal que p1 = AnnR (x). Pero x 6= 0 puesto que si
x = 0, entonces AnnR ({0}) = R y p1 es primo y, por tanto, propio en R. Pero esto significa
que para cada λ ∈ p1 existe x 6= 0 en R tal que λx = 0, con lo cual λ es un divisor de cero
en R y tenemos que todos los elementos de p1 son divisores de cero en R. Cambiando 1 por
328 6. FACTORIZACIÓN: GAUSS, LASKER. NOETHER

cualquier i en este argumento, concluimos que la siguiente unión está formada por divisores de
cero de R: [
p = p1 ∪ · · · ∪ pr .
p∈Ass(R)

Recı́procamente, consideremos a ∈ R un divisor de cero en R. Entonces, existe x ∈ R, x 6= 0


tal que ax = 0. Pero como x 6= 0, dada la descomposición primaria irredudante del ideal (0)
elegida, ha de existir i tal que x 6∈ qi . Supongamos, sin pérdida de la generalidad, que i = 1.
Entonces, observamoes que
ηa,R/q1 (x + q1 ) = ax + q1 .
Ergo, la homotecia ηa,R/q1 no es inyectiva. Por la proposición 6.3.12, si ηa,R/q1 no es inyectiva,

entonces a ∈ q1 = p1 . Por tanto, todo divisor de cero de R debe estar en la unión
[
p1 ∪ · · · ∪ pr = p.
p∈Ass(R)

Y hemos concluido la prueba del resultado. 

Observación 6.3.30. Obsérvese que si R es un anillo noetheriano y a es un ideal radical de R,


existirá una descomposición primaria irredudante de a donde todos los primarios son primos :
Tomemos una descomposición primaria irredundante del ideal a = q1 ∩ · · · ∩ qr , donde qi es

un ideal pi −primario. Entonces, q = p1 ∩ · · · ∩ pr y ésta es una descomposición primaria
irredundante de a.

6.3.4.1. Unas palabras sobre los ideales primos minimales en Spec(R), con R
noetheriano. Consideremos R un anillo noetheriano a ( R un ideal propio, consideremos
una descomposición primaria irredudante
a = q1 ∩ · · · ∩ qr ,
donde cada qi es un ideal pi −primario. Consideremos el conjunto
V (a) = {p ∈ Spec(R) : p ⊇ a}.
Consideremos ahora la relación de inclusión sobre V (a). Esto define una estructura de grafo
orientado sobre V (a) donde las aristas orientadas E ⊆ V (a) × V (a) vienen dadas por los pares
(p, n) ∈ V (a)2 tales que p ⊆ n. Como V (a) está identificado con el espectro primo Spec(R/a),
en realidad estamos hablando de la estructura de grafo del espectro de ese anillo cociente.
Supongamos ası́ p ∈ V (a) y tenemos que
p ⊇ a = q1 ∩ · · · ∩ qr .
Tomando radicales a ambos lados tenemos que
√ √ √ √ √
p = p ⊇ a = q1 ∩ · · · ∩ qr = q1 ∩ · · · ∩ qr = p1 ∩ · · · ∩ pr .
Retomemos ahora el ı́tem iii) de la Proposición 4.2.12. Si p no contuviera a ninguno de los
ideales primos p1 , . . . , pr es porque para cada i, 1 ≤ i ≤ r, existirá xi ∈ pi \ p. Pero, entonces,
r
Y r
Y
xi ∈ pi ⊆ p1 ∩ · · · ∩ pr ⊆ p.
i=1 i=1

Esto estarı́a en contradicción con la condición “p es un ideal primo de R”. Hemos probado ası́
la siguiente propiedad:
Proposición 6.3.31. Sea R un anillo noetheriano, a ( R un ideal propio de R. Entonces, el
grafo Spec(R/a) orientado mediante la inclusión posee solamente un número finito de elemen-
tos minimales. Más aún, los ideales minimales de Spec(R/a) están entre los ideales primos
asociados Ass(R/a).
La afirmación es, en particular, cierta para Spec(R) y sus ideales primos minimales. En este
caso, los ideales primos minimales de un anillo noetheriano están formados por algunos de los
divisores de cero del anillo.
Demostración. La hemos dado justo antes del enunciado. 
6.3. LASKER-NOETHER (EXISTENCIA) 329

A los ideales primos minimales sobre a se les denomina componentes aisladas del ideal a.
Existen ideales a propios en anillos noetherianos R y descomposiciones primarias como en (??)
en las que no todos los ideales primos de la colección {p1 , . . . , pr } son minimales entre los primos
que contienen a a. En el Problema 260 se muestra un ejemplo sencillo de un ideal que posee
primos asociados que no son minmales. A los ideales primos asociados que no son minimales
sobre a se les denomina primos inmersos o componentes inmersas sobre el ideal a.
Un de los (pocos) casos en los que podemos garantizar que no tenemos componentes inmersas
es el siguiente:
Proposición 6.3.32 (Los ideales radicales no poseen componentes √ inmersas). Si R es
un anillo noetheriano y a ( R es un ideal propio y radical (i.e. a = a. Entonces los primos
asociados de Ass(R/a) son todos primos aislados (i.e. primos minimales sobre el ideal a).
El resultado es, en particular, cierto para los anillos reducidos (i.e. sin elementos nilpotentes
no nulos) y, en ese caso, los ideales primos asociados son los primos minimales del anillo y,
además, los divisores de cero de anillo son la unión de los primos minimales del anillo.

Demostración. Supongamos que a = a y consideremos una descomposición primaria
irredudante del ideal a:
a = q1 ∩ · · · ∩ qr ,
donde qi es pi −primario y, por el Teorema de Unicidad,

Ass(R/a) = Ass(R/ a) = {p1 , . . . , pr }.
Como a es un ideal radical también tenemos una descomposición primaria de a dada mediante
los ideales primos asociados:
√ √ √ √
a = a = q1 ∩ · · · ∩ qr = q1 ∩ · · · ∩ qr = p1 ∩ · · · ∩ pr .
Si esta descomposición primaria no fuera irredudante, entonces podrı́amos refinarla y existirı́a
un subconjunto S ( {1, . . . , r} tal que una descomposición primaria irredudante de a se tendrı́a
con la forma: \
a= pi .
i∈S
Pero, por el Teorema de Unicidad precedente concluirı́amos que los ideales primos asociados
del anillo cociente R/a satisfarı́an la siguiente propiedad imposible:
Ass(R/a) = {pi : i ∈ S} ( {p1 , . . . , pr } = Ass(R/a).
Por tanto, la siguiente es una descomposición primaria irredundante del ideal radical a:
(6.3.6) a = p1 ∩ · · · ∩ pr .
Los ideales primarios que aparecen en la descomposición son ciertamente ideales primos y,
además, no se puede refinar esta descomposición sin añadir elementos que no están en a. Es
decir, para cada S ( {1, . . . , r}, se tiene que:
\
a( pi .
i∈S

Por tanto si existiera alguna componente inmersa sobre a es porque existen i, j, 1 ≤ i, j ≤ r


tales que pi ⊆ pj . En ese caso podrı́amos eliminar pj de la intersección y tendrı́amos:
 
\ \
a = p1 ∩ · · · ∩ pr =  pk  ∩ pj = pk ,
k6=j k6=j

lo cual no es posible por ser la descomposición descrita en la Identidad (6.3.6) una descom-
posición irredudante. En particular, como los ideales primos minimales sobre a están entre
{p1 , . . . , pr } y no hay relación de inclusión posible entre dos distintos de ellos, todos los primos
de {p1 , . . . , pr } son ideales minimales sobre el ideal a.
En el caso a = (0) y radical (i.e. R no posee elementos nilpotentes) es un caso particular de lo
anterior.

330 6. FACTORIZACIÓN: GAUSS, LASKER. NOETHER

6.3.5. Ejercicios y Problemas de la Sección 6.3.


Problema 258. Prueba la Proposición 6.3.3
Problema 259. √ Sea
n R un anillo noetheriano y a ( R un ideal propio. Pruébese que existe
n ∈ N tal que a ⊆ a.
Problema 260. Sea K un cuerpo y R = K[X, Y, Z] el anillo noetheriano de los polinomios en
tres variables con coeficientes en K . Considera el ideal m := (X, Y, Z) ( K[X, Y, Z]. Se pide:
i) Prueba que el ideal m ∈ MaxSpec(R).
ii) Considera los siguientes ideales en K[X, Y, Z]:
p1 := (X, Y ), p2 := (X, Z).
Prueba que ambos ideales son ideales primos en K[X, Y, Z].
iii) Pruébese que a = p1 ∩ p2 ∩ m2 es un descomposición primaria irredudante del ideal a.
iv) Halla las componentes inmersas y las componentes aisladas del ideal a en la descom-
posición anterior.
6.3.5.1. Cociente de Ideales.
Definición 85 (Cociente de Ideales). Dados a, b dos ideales de un anillo R, su ideal cociente
está definido mediante:
(a : b) := {x ∈ R : xb ⊆ a}.
Al ideal cociente ((0) : b) se le denomina anulador del ideal b y se denota por Ann(b).
En particular si D son los divisores de cero de un anillo R, tendremos
[
D= Ann((x)).
x6=0

Problema 261 (Propiedades Elementales del Cociente de Ideales). Pruébense las sigu-
ientes propiedades:
Sea a, b, c ideales de un anillo R. Se tiene:
i) a ⊆ (a : b),
ii) (a : b)b ⊆ a,
iii) ((a : b) : c) = (a : bc) = ((a : c) : b),
i : b) = ∩i (ai : b),
iv) (∩i aP
v) (a : i bi ) = ∩i (a : ai ).
6.3.5.2. El Teorema de Lasker-Noether para módulos noetherianos. La sigu-
iente ser de problemas extiende a los R−módulos noetherianos el Teorema de Lasker-Noether
que acabmos de ver para anillos. Están estructurados de manera incremental y acumulativa,
de modo que cada problema suele depender de problemas precedentes. Para el material sobre
módulos noetherianos, véase la Sección ??.
Comencemos deiniendo el equivalente para submódulos de la noción de ideal primario:
Definición 86 (Submódulos e ideales primarios). Sea M un R−módulo. Un submódulo
N de M se denomina primario si N 6= M y para cada a ∈ R, la homotecia ηa,M/N es o bien
inyectiva o bien nilpotente.
Problema 262. Pruébese lo siguiente:
Si N es un submódulo primario de un R−módulo M , entonces el conjunto:
p := {a ∈ R : ηa,M/N no es inyectiva},
es un ideal primo de R. Diremos que el submódulo N es p−primario.( Hint: Se trata de repetir
la prueba, adaptándola a este contexto, de la Proposición 6.3.12).
Problema 263. Pruébese lo siguiente:
Sean N1 , . . . , Ns submódulos p−primarios de un R−módulo M (es decir, primarios con respecto
al mismo ideal primo de R). Entonces, la intersección
N = N1 ∩ · · · ∩ Ns
es un submódulo p−primario.( Hint:Adaptar al contexto de módulos la demostración de la
Proposición 6.3.20).
6.3. LASKER-NOETHER (EXISTENCIA) 331

Retomando la descomposición primatia de ideales, nos planteamos aquı́ la descomposición pri-


maria de submódulos del modo siguiente:
Definición 87 (Descomposición Primaria de R−módulos). Sea M un R−módulo y N
un submódulo de M . Una descomposición primaria de N es una descripción de N como
intersección finita:
N := N1 ∩ . . . ∩ Ns ,
donde cada Ni es un sumódulo pi −primario de M , con pi ∈ Spec(R). Decimos que la de-
scomposición primaria anterior es reducida (o, también, irredundante) si pi 6= pj , para cada
i 6= j y N no se puede presentar como intersección de un subconjunto propio de la familia
{N1 , . . . , Ns }.

Problema 264. Pruébese la propiedad siguiente:


Dado un R−módulo M y un submódulo N , dada una presentación de N como intersección
finita de submódulos primarios:
(6.3.7) N := N1 ∩ · · · ∩ Nt ,
entonces esta descomposición puede refinarse a una descomposición primaria irredundante.
( Hint: Adaptar a este contexto la prueba de la Proposición 6.3.21)
De modo anólogo al caso de anillos se define la noción (inútil por lo demás, salvo como argucia
para razonar) de submódulo irreducible:
Definición 88 (Submódulo Irreducible). Un submódulo propio N de un R−módulo M se
llama reducible si existen N1 , N2 dos submódulos propios de M tales que
N = N1 ∩ N2 ,
con N ( Ni ( M , 1 ≤ i ≤ 2.
Un submódulo propio N de M se llama irreducible si no es reducible.

Problema 265. Pruébese la siguiente afirmación:


Si M es un R−módulo noetheriano, todo submódulo irreducible es primario.( Hint: De nuevo,
se trata de adaptar el argumento de la Proposición 6.3.22 al contexto de R−módulos).
Finalmente llegamos al enunciado de Lasker-Noether para R−módulos:
Problema 266 (Teorema de Lasker-Noether para R−módulos). Pruébese el Teorema
de Lasker-Noether para R−módulos noetherianos, es decir, pruébese:
Si M es un R−módulo noetheriano, entonces todo submódulo propio posee una descomposición
primaria (de submódulos) irredundante.
( Hint: Se trata de argumentar en la forma de E. Noether, como en el Teorema 6.3.23. En
esencia se trata de probar que todo submódulo de M es intersección finita de R−módulos ir-
reducibles y luego agruparlos y refinar esa intersección usando los resultados de los Problemas
precedentes. Para probar esa afirmación basta con aplicar la forma noetheriano de argumentar
considerando la clase:
F := {N ( M : N es submódulo y no es intersección finita de submódulos irreducibles de M }.
y concluir que este conjunto es vacı́o.)
Finalmente nos ocupamos de un resultado de unicidad similar al caso de anillos. Para ello
revisemos las nociones de anulador de un elemento AnnR (m), con m ∈ M y M y R−módulo,
ası́ como la noción de primo associado p ∈ AssR (M ). Ambas nociones son descritas en la
Definición 83. Igualmente recordemos la definición de divisor de cero de un R−módulo descrita
en la Definición 84.
Problema 267 (Primer Teorema de Unicidad para R−módulos noetherianos). . Se
pide probar la siguiente propiedad:
Sea R un anillo noetheriano y M un R−módulo finitamente generado. Sea
h0i = N1 ∩ · · · ∩ Nr
332 6. FACTORIZACIÓN: GAUSS, LASKER. NOETHER

una descomposición primaria irredudante del submódulo h0i de M , donde cada Ni es pi −primario.
Entonces,
AssR (M ) = {p1 , . . . , pr }.
En particular, los ideales primos asociados a una descomposición primaria irredudante del
submódulo h0i de M son únicos e independientes de la descomposición primaria irredundante
elegida. De otro lado, el número de los ideales primos asociados a un R−módulo finitamente
generado sobre un anillo noetheriano es finito y están determinados por una descomposición
primaria irredundante del submódulo h0i de M .

Problema 268. Prueba el siguiente resulatdo:


El conjunto de los divisores de cero de un R−módulo finitamente generado sobre un anillo R
noetheriano dado por:
[
p
p∈Ass(M )

Problema 269. Se pide probar los siguientes resultados:


i) El Corolario 6.3.28
ii) El siguiente resultado que extiende a R−módulos el Corolario 6.3.28:
Sea R un anillo noetheriano y M un R−módulo finitamente generado. Sea N un
submódulo de N y tomemos una descomposición primaria irredudante de N :

N = N1 ∩ · · · ∩ Nr

donde Ni es pi −primario. Entonces,

AssR (M/N ) = {p1 , . . . , pr }.

En particular, los ideales primos aociados a una descomposición primaria irredudante


de un submódulo N de M son únicos e independientes de la descomposición primaria
irredundante elegida. Más aún, el cardinal de los ideales primos asociados al cociente
M/N es finito y están determinados de manera unı́voca por los ideales primos asoci-
ados a una descomposición primeria irredundante de N .

Problema 270. Sea R un anillo y R[X] el anillo de polinomios en una variable con coeficientes
en R. Para cada ideal a de R, denotemos por a[X] (o por a ⊗R R[X]) el conjunto de los
elementos en R[X] tales que todos sus coeficientes están en el ideal a. Se pide probar las
siguientes afirmaciones:
i) El conjunto a[X] es un ideal de R[X] y es precisamente la extensión de a a R[X] para
la inclusión ι : R ,−→ R[X], i.e. ae = a[X].
ii) Si p ∈ Spec(R) es un ideal primo, entonces su extensión p[X] ∈ Spec(R[X]) es también
un ideal primo.
iii) Si q ⊆ R es un ideal p−primario en R[X], entonces q[X] es un ideal p[X]−primario
en R[X].
iv) SI a ⊆ R es un ideal y tenemos una descomposición primaria irreduidante de a dada
mediante:
\m
a= qi ,
i=1

donde cara ideal qi es un ideal pi −primario, entonces la siguiente es una descom-


posición primaria irredudante de a[X]:
m
\
a[X] = (qi [X]) ,
i=1

donde cada qi [X] es un ideal pi [X]−primario.


v) Si p es un ideal primo minimal sobre a en R, entonces, p[X] es un ideal primo minimal
sobre a[X].
6.3. LASKER-NOETHER (EXISTENCIA) 333

6.3.5.3. Anillos y módulos de Artin.


Problema 271 (Módulos artinianos). Pruébese la asiguiente afirmación: Sea R un anillo
y M un R−módulo. Asumiendo el Axioma de Elección Dependiente, las siguientes propiedades
son equivalentes:
i) Condición de cadena Numerable Descendente para submódulos: Toda una
cadena numerable descendente de submódulos de M se establiza. Es decir, dada una
cadea numerable descendente:
N0 ⊇ N1 ⊇ · · · ⊇ Nn ⊇ · · · ,
Existe m ∈ N tal que Nn = Nm para cada m ≥ n.
ii) Todo conjunto no vacı́o de submódulos posee elemento minimal.
Los R−módulos que satisfacen cualquiera de estas dos propiedades se denominan R−módulos
artinianos . SI M = R deciemos que R es un anillo artiniano..
Obsérvese que Z no es anillo artininao, pero los anillos cociente Z/nZ son anillos artinianos y
Z−módulos artinianos.
Problema 272. Pruébese la siguiente afirmación:
Dada una sucesión exacta corta de R−módulos:
f g
0 M0 M M 00 0
entonces, M es artiniano si y solamente si M 0 y M 00 son artinianos.
Conclúyanse las siguientes propiedades:
i) La condición artiniana es hereditaria, esto es, si M es un R−módulo artiniano también
lo es todo submódulo suyo.
ii) Si M es un R−módulo artiniano y N es un submóduo, también es artiniano M/N .
iii) si R es una anillo artiniano y a es un ideal propio de R, entonces R/a es un anillo
artiniano.
iv) Un anillo es artiniano si y solamente si existe un ideal a de R tal que a es artiniano
como R−módulo y R/a es un anillo artiniano.
v) Módulos finitamente generados sobre anillos R artinianos son R−módulos artinianos.
Problema 273. Pruébese que si un anillo R es anillo de Artin, entonces Spec(R) = MaxSpec(R),
es decir, que todo ideal primo es maximal. ( Hint: Tómese un ideal primo p ∈ Spec(R) y un ele-
mento x ∈ R tal que x + p 6= 0 + p en el anillo cociente R/p. Considérese la cadena descendente
de ideales:
(x + p) ⊇ (x2 + p) ⊇ · · · ⊇ (xn + p) ⊇ · · · ,
y pruébese que x ha de ser unidad en R.)
Problema 274. Pruébese que si R es un anillo de Artin se verifican las siguientes propiedades:
i) Si q es un ideal primario, entonces existe un único ideal maximal m ∈ MaxSpec(R)
tal que q es m−primario y existe un número natural n ∈ N, n ≥ 1 tal que
mn ⊆ q.
ii) Probar que si el ideal (0) de R admite una descomposición primaria, entonces (0) es
un producto de ideales maximales de R.
iii) El espectro maximal de un anillo de Artin es un conjunto finito ( Hint: Considerar
todas las intersecciones finitas de ideales maximales de R y elegir un elemento mnimial
usando una argumentación de tipo noetheriano).
iv) Si R es un anillo noetheriano y Spec(R) = MaxSpec(R), entonces es un anillo artini-
ano.
CAPı́TULO 7

Rudimentos de Geometrı́a Algebraica: La Topologı́a de


Zariski
(La découverte est le privilège de l’enfant.)

“La découverte est le privilège de l’enfant. C’est du petit


enfant que je veux parler, l’enfant qui n’a pas peur encore de
se tromper, d’avoir l’air idiot, de ne pas faire sérieux, de ne
pas faire comme tout le monde. Il n’a pas peur non plus que
les choses qu’il regarde aient le mauvais goût d’être
différentes de ce qu’il attend d’elles, de ce qu’elles devraient
être, ou plutôt : de ce qu’il est bien entendu qu’elles sont. Il
ignore les consensus muets et sans failles qui font partie de
l’air que nous respirons – celui de tous les gens censés et bien
connus comme tels. Dieu sait s’il y en a eu, des gens censés
et bien connus comme tels, depuis la nuit des âges ! ”
Alexandre Grothendieck,
“Récoltes et Semailles (Réflexions et témoignage sur un
passé de mathématicien)”, 1983-1986, 127-128.

Índice
7.1. Introducción 335
7.1.1. Geometrı́a Diferencial: objetos dados “explı́citamente” ( por parametrizaciones
locales o globales) con buenos rangos en los Jacobianos: 336
7.1.2. Geometrı́a Algebraica, Analı́tica, Diofántica etc.: Objetos geométricos
dados implı́citamente por sus ecuaciones globales (o locales): 338
7.2. Geometrı́a y soluciones: La(s) topologı́a(s) de Zariski 339
7.2.1. Variedades o conjuntos de ceros (o de soluciones): Topologı́a(s) de Zariski 340
7.2.1.1. Algunos Ejemplos de Topologı́as de Zariski 344
7.2.2. Ideal de un objeto geométrico, primos, maximales y variedades. 346
7.2.2.1. Ideales Primos e Irreducibles 348
7.2.2.2. Ideales maximales y puntos 349
7.2.2.3. Nullstellensätze y y Variantes: ¿Diccionario Álgebra–
Geometrı́a?. 350
7.3. Rudimentos de Geometrı́a Algebraica: Variedades algebraicas
K−definibles 350
7.3.1. Funciones polinomiales K−definibles. 351
7.3.2. Variedades algebraicas afines y K−definibles. 352
7.3.3. Primos, maximales y variedades algebraicas afines. 355
7.3.4. Otras consecuencias de la argumentación noetheriana 357
7.3.4.1. Proyección y contracción de ideales 362
7.4. Variedades algebraicas en el espacio proyectivo: Ideales
homogéneos 362
7.4.1. Ejercicios y problemas de la Sección 7.2 378

7.1. Introducción
Se trata simplemente de empezar a conocer los términos más elementales como conjunto al-
gebraico, variedad algebraica sobre un cuerpo algebraicamente cerrado (K−definible, en algún
335
336 7. GEOMETRÍA ALGEBRAICA: TOPOLOGÍA DE ZARISKI

caso), ideal asociado, componentes irreducibles y/o la topologı́a de Zariski definida por un anillo
de funciones o en el espectro de un anillo.
Aunque la terminologı́a, especialmente la Tolopogı́a, no es propia del siglo XIX, sı́ que es cierto
que hay una gran lista de geómetras del siglo XIX que se ocuparon de estudiar de estos objetos
geométricos, sin disponer de herramientas notacionales o culturales como las que que están a
uestra disposición en este siglo XXI. Sólo por citar algunos de los gigantes de ese sigloi XIX,
aunque sus nombres no salgan en el texto de manera distinguida, y algunos alcanzaron su cénit
a comienzos del siglo XX, pongamos unos nombres cuya historia puede encontrarse fácilmente
en la red:
• E. Bézout, E. Laguerre, A. Cayley, F. Klein,...
• La escuela italiana: L. Cremona, E. D’Ovidio, C. Segre, G. Castelnouvo, F. Enriques,
E. Bertini, P. Del Pezzo, G. Fano, G. Veronese y un larguı́simo etcétera.
• H. Baker, M. Noether (padre de E. Noether), H. Schubert, E. Kähler, C. É. Picard,...
• D. Hilbert, L. Kronecker, E. Netto, F.S. Macaulay, D. König,...
• Y, desde la Teorı́a de Números como elemento influyente en el Álgebra Conmutativa,
R. Dedekind, E. Kummer, etc....
Muchos de estos autores continuaron trabajando en el primer tercio del siglo XX, cuando la
influencia de D. Hilbert y E. Noether impregna los desarrollos que ya exhibimos en el Capı́tulo
precedente. Casi todos ellos han tenido un homenaje en la terminologı́a de la Geometrı́a Al-
gebraica moderna: Bézout Inequality, Cayley form, Klein surfaces, Cremona transform, Segre
variety and Segre embbeding, del Pezzo varieties, Castlenouvo regularity, Bertini theorem, Fano
varieties, Max Noether resolution of singularities, Schubert calculus, Kähler manifold, Picard
group, Macaulay elimination, Dedekind rings, etc. Todos ellos son términos que deberı́an entrar
en un curso estándard de Geometrı́a Albebraica. Desgraciadamente, las limitaciones de tiempo
impiden llegar hasta algunos de ellos. En todo caso, todos ellos se ocuparon de un modo u otro
de los objetos geométricos cuya terminologı́a se incia en este Capı́tulo.
Como esta mera introducción genera ciertas dificultades en su lectura, abriremos un paréntesis
diáctico sobre objetos geométricos dados explı́cita o implı́ticamente.

7.1.1. Geometrı́a Diferencial: objetos dados “explı́citamente” ( por parametriza-


ciones locales o globales) con buenos rangos en los Jacobianos: Un objeto geométrico
es dado explı́citamente cuando sus puntos son dados por parametrizaciones locales o globales.
Una parametrización es simplemente una aplicación ϕ : P −→ X, donde P es el conjunto
de parámetros, normalmente elegido por su simplicidad geométrica, y X es el espacio ambi-
ente donde nuestro objeto está incluido. El objeto geométrico dado por la parametrización ϕ
serı́a la imagen de ϕ, es decir ϕ(P ). En un sentido “confundido”, se considera que si un ob-
jeto geométrico es dado explı́citamente se considera ‘‘resuelto’’: esto es una simplificación
errónea que debe descartarse, pero que ayuda a entender la diferencia entre la Geometrı́a de
los siglos XVIII y anteriores y la Tesis de B. Riemann. Veamos algunos ejemplos sencillos de
parametrizaciones y objetos geométricos dados explı́citamente:
i) Rectas “escolares” o variedades afines lineales: Era uno de los propósitos
de los estudios pre-universitarios, donde se describı́an las rectas (por ejemplo, en R3 )
mediante una parametrización donde el espacio de parámetros es un cuerpo (R, por
ejemplo) y la parametrización se basa en uno de sus puntos p = (p1 , p2 , p3 ) ∈ R3 y un
vector director v = (v1 , v2 , v3 ) ∈ R3 y toma la forma siguiente:
ϕ: R 7−→ R3
t 7−→ (p1 + tv1 , p2 + tv2 , p3 + tv3 ).
La recta es ϕ(R). Estos mismos objetos geométricos se recuperan en los estudios
elementales de las variedades afines lineales, donde los objetos geométricos son los que
admiten una parametrización desde algún espacio afı́n de la forma K m , a través de
un punto P ∈ K n (con n ≥ m) y un subespacio vectorial W ⊆ K n :
ϕ: Km 7 →
− Kn P
m
(t1 , . . . , tm ) 7−→ (p1 , . . . , pn ) + i=1 ti vi ,
donde W es el subespacio con base {v1 , . . . , vm }. La variedad afı́n lineal es ϕ(K m ).
7.1. INTRODUCCIÓN 337

ii) Esferas, curvas, superficies y variedades diferenciables: Son el paradigma


de las variedades diferenciables tal y como las intuyeron Riemann o Gauss. Pode-
mos considerar la esfera unidad S 1 ⊆ R2 mediante diversas parametrizaciones. Por
ejemplo, la más habitual y completa:
ϕ1 : R 7 →
− C = R2
it
t 7−→ e := (cos(t), sin(t)).

Aunque, a veces, se pueden considerar parametrizaciones parciales como la siguiente


ϕ2 : R 7−→ R2
2
t 7−→ ( 1−t 2t
1+t2 , 1+t2 ).

En este caso, el objeto geométrico “completo” no serı́a todo S 1 porque ϕ2 (R) =


S 1 \ {(0, −1)}, pero se podrı́a interpretar como que el objeto geométrico es la clausura
de la imagen. La otra interpretación consiste en intercambiar los roles de (0, 1) y
(0, −1) y obtener una segunda parametrización, pero esta vez del abierto en la esfera
S 1 \ {(0, 1)}. Esto conduce de manera casi natural a las parametrizaciones locales
compatibles y a la idea de carta.
En general en teorı́a global, se consideran parametrizaciones globales: Es decir todo
el objeto geométrico viene dado por una sola arametrización. Ası́ pensaban los
matemáticos del XVIII hasta que Gauss y, sobre todo, Riemann cambiaron las re-
glas del juego. Ası́, una curva parametrizada globalmente es el un objeto geométrico
dado or una parametrización desde un intervalo:
ϕ: (−1, 1) −7 → Rn
t 7−→ (ϕ1 (t), . . . , ϕn (t)),
La “curva” es ϕ((−1, 1)) y, para tener buenas propiedades se suponen las condiciones
del Teorema de la Función Inversa o el Teorema del Rango constante: El gradiente
∇t ϕ de la parametrización es no nulo en todos los puntos t del conjunto (−1, 1) de
parámetros. Esta condición sobre el gradiente permite concluir que, alrededor de todo
punto de la curva P ∈ ϕ((−1, 1)), hay un entorno UP en la curva que es difeormorfo
a un subintervalo abierto de conjunto de parámetros (−1, 1). Del mismo modo sucede
si tenemos una parametrización de la forma ϕ : (−1, 1)2 −→ Rn y tenemos buenas
condiciones sobre el rango de la matriz jacobiana de ϕ. En este caso tenemos una
superficie porque tendrá “dimensión” 2, aunque aún no tegamos clara la noción de
dimensión que llegará más adelante en este texto.
B. Riemann reflexionó sobre esta idea y propuso que lo relevante (y poco esperable) no
era la existencia de parametrizaciones globales sino la existencia de parametrizaciones
locales: introdujo ası́ las variedades diferenciables. Una variedad diferenciable de
dimensión n, por ejemplo, es un espacio topológico M tal que para cada punto x ∈
M , existe un entorno abierto Ux ⊆ M y un abierto entorno abierto V0 del origen
0 ∈ Rn de tal modo que V0 y Ux son difeomorfos. Esta definición grosera requiere
de algunas precisiones que omitimos por no ser este el curso apropiado. Pero la idea
de Riemann es la parametrización en la cercanı́a de cada punto dentro de la variedad
338 7. GEOMETRÍA ALGEBRAICA: TOPOLOGÍA DE ZARISKI

(lo que se llamarán parametrizaciones locales). Estos son los objetos de estudio de la
Geometrı́a Diferencial. Un dibujo ilustrativo (sin entrar en el asunto esencial de
la compatibilidad de la carta) podrı́a ser el siguiente:

iii) Leminiscatas: Son los objetos geométricos con forma de “ocho tumbado” o sı́mbolo
del infinito que atrajeron a los matemáticos del pasado. Por ejemplo, la Lemniscata
de Gerono: que viene dada por la parametrización siguiente:
ϕ: R 7−→ R2
t 7−→ (cos(t), cos(t) sin(t)),
Un dibujo serı́a el siguiente:

Este objeto geométrico posee casi todas las propiedades de las curvas del ejemplo
precedente: es dada por una parametrización, la parametrización es global (toda la
curva es imagen), pero ya no es una curva diferenciable: es imposible encontrar un
difeomorfismo (ni siquiera un homeomorfismo) entre un entorno del origen (0, 0) ∈
ϕ(R) en la curva ϕ(R) y un intervalo abierto de 0 ∈ R. La razón puede verse del modo
siguiente: eligiendo un entorno suficientemente pqequeño del origen (0, 0) ∈ ϕ(R) en
la curva (por ejemplo, la intersección de la curva con la bola en R2 centrada en (0, 0)
de radio 1/4), eliminando el origen (0, 0) de ese entorno nos quedan 4 componentes
conexas. Y no hay ningún intervalo abierto de R tal que eliminando un punto nos
salgan más de 2 componentes conexas. Surge ası́ una pregunta obvia: ¿Qué clase de
objetos son éstos?.

7.1.2. Geometrı́a Algebraica, Analı́tica, Diofántica etc.: Objetos geométricos


dados implı́citamente por sus ecuaciones globales (o locales): A diferencia de la Ge-
ometrı́a y Toplogı́a Diferenciales, donde los objetos son dados por parametrizaciones explı́citas
(locales o globales), se pueden considerar las Geometrı́as donde los objetos son dados por ecua-
ciones implı́icas: Son los objetos de “puntos” en algún espacio (normalmente un espacio
7.1. INTRODUCCIÓN 339

topológico) que satisfacen ciertas ecuaciones. Esas formas de geometrı́a son las que se dis-
cuten en este Capı́tulo. El primer ejemplo a considerar es la anterior Lemniscata de Gerono.
Tenı́amos una descripción como la imagen por una aplicación analı́tica:
ϕ: R 7−→ R2
t 7−→ (cos(t), cos(t) sin(t)),
Siendo la Lemniscata el conjunto L := ϕ(R), podemos también darla como el conjunto de
puntos que satisfacen una cierta ecuación:
L := {(x, y) ∈ R2 : x4 − x2 + y 2 = 0}.
Ya hemos visto que no es una curva local o globalmente parametrizable mediante una función
que tenga un buen gradiente. No es, por tanto, una subvariedad en el sentido de Riemann,
presenta puntos especialmente malos (llamados singularidades) y se puede entender como el
conjunto de los ceros de la ecuación polinomial indicada. De ese modo surgen diversas formas
de Geometrı́a, algunas de las cuales se definen groseramente como sigue:
i) Geometrı́a Algebraica: Inicialmente es la Geometrı́a de los objetos definidos
por ecuaciones polinomiales (es decir por polinomios en K[X1 , . . . , Xn ], usualmente
suponiendo que K es un cuerpo algebriacamente cerrado) y las soluciones pueden
estar en un espación afı́n sobre un cuerpo algebraicamente cerrado An (K) = An (K)
(se llamará Geometrı́a Algebraica Afı́n), o en un espacio projectivo sobre un cuerpo
algebraicamente cerrado Pn (K) (Geometrı́a Algebraica Proyectiva). Por extensión, la
Geometrı́a Algebraica admite también estructuras en las que, localmente, los objetos
geométricos son ceros en un espectro primo Spec(R) de un anillo, susualmente neothe-
riano, y las ecuaciones son elementos del anillo (ver Problema 296, por ejemplo). A
partir de Grothendieck, estas geometrı́as se llamarán también Geometrı́a Algebraica
de Esquemas Afines. Pero esa terminologı́a nos obligarı́a a ir mucho más allá del curso.
ii) Geometrı́a Analı́tica: Se trata de objetos geométricos M ⊆ An (K), donde K = R
o K = C (y, en ocasiones, K es un cuerpo valuado completo, como el cuerpo de los
números p−ádicos, pero se sale de nuestro contexto). Un subconjunto M ⊆ An (K)
se llama variedad analı́tica, si para cara punto p ∈ M , existe un entorno abierto
U ⊆ An (K) (para la topologı́a usual) y existe un familia finita de funciones analı́ticas
f1 , . . . , fs ∈ C ω (U ) (u holomorfas- analı́ticas complejas- en H (U ), si K = C) de tal
modo que
U ∩ M := {z ∈ U : f1 (z) = · · · = fs (z))0}.
Al darse en un entorno de cada punto, hablamos de ser soluciones de ecuaciones
analı́ticas localmente definidas. Un ejemplo simple de variedad anaı́tica que no es
algebraica serı́a la siguiente:
{x ∈ R : sin(x) = 0}.
Es una variedad analı́tica porque está dada por una ecuación analı́tica, no es algebraica
porque al corarla con la recta {x = 0} tiene una cantidad infinita (numerable) de ceros.
iii) Geometrı́a Diofántica o Puntos Raciones de Variedades Algebraicas: Es
similar a la Geometrı́a Algebraica, pero aquı́ las soluciones no tienen coordenadas en
un cuerpo sino en un anillo de enteros. Es decir, se considera R = Z o√bien R un anillo

de enteros algebraicos (como los ejemplos R := Z[ m] o R := Z[ 1+2 m ] descritos en
los ejemplos). Se consideran polinomios f1 , . . . , fs ∈ R[X1 , . . . , Xn ] y se estudian sus
soluciones en Rn :
{(x1 , . . . , xn ) ∈ Rn : f1 (x1 , . . . , xn ) = 0, . . . , fs (x1 , . . . , xn ) = 0}.
EL objetivo es estudiar estos tipos de objetos. Est conduce a diverso problemas de
gran relevancia histórica:
• El Problema X de Hilbert (ver Problema 189) que fue el origen de la noción
de algoritmo, gracias a Gödel, Church y Turing, y, por tanto, de la informática
tal y como la conocemos.
• Las Variedades Abelianas Son variedades algebraicas Z−definibles (i.e. las
ecuaciones tienen coeficientes en Z) y que poseen una estructura de grupo abeliano
(como las curvas elı́pticas, por ejemplo). Ver https://en.wikipedia.org/wiki/
340 7. GEOMETRÍA ALGEBRAICA: TOPOLOGÍA DE ZARISKI

Abelian_variety Están muy ligadas a la Conjetura de Birch y Swinnerton-Dyer


(ver lo que se discute en el Ejemplo 7.3.8).
• Los puntos Fq −racionales: Se trata de los puntos de una variedad algebraica
dada por ecuaciones con coeficientes en un cuerpo finito Fq y se buscan sus
asolucione stambién en ese mismo cuerpo finito Fq . Es el trasunto de la Conjetura
de Cook (ver lo que se discute en el Ejemplo 7.3.8). También es un asunto
fuertemente ligado a aspectos propios de la Combinatoria a través del método
conocido como “The Polynomial Method” (cf. [Tao, 14], [Dvr, 09], [Al, 1999],
[?]).
El Capı́tulo pretende ser una introducción a la terminologı́a de estas Geometrı́as de los objetos
definidos implı́citamente por ecuaciones de diversas clases. Se trata de la Topologı́a de
Zariski y supondremos las condiciones de:
• Un espacio topolǵico (XT ) que es donde viven las soluciones
• Un anillo de funciones A[X] sobre X, usualmente se suponen continuas, que valen
para todos los casos descritos (algebraicas, analı́ticas, etc...)
• Los conjuntos de soluciones que, en realidad, dependen de un ideal a ⊆ A[X]:
VA[X] (a) := {x ∈ X : f (x) = 0, ∀f ∈ a}.
Dejaremos para el Capı́tulo 8 la disquisición de la caracterización de cuáles de esos ideales son
los mejor ligados a la geometrı́a de los objetos dados por ecuaciones.

7.2. Geometrı́a y soluciones: La(s) topologı́a(s) de Zariski


Esta sección mostraremos ejemplos que provienen de la Geometrı́a, entendida como estudio de
los objetos dados como soluciones (locales o globales) de sistemas de ecuaciones definidas en un
conjunto. Comencemos con unas nociones básicas.

7.2.1. Variedades o conjuntos de ceros (o de soluciones): Topologı́a(s) de Zariski.


Antes de comenzar, una pequeña cuestión termonológica. Existe un formalismo del lenguaje
matemático que usa el término “conjunto de ceros” (zero-set en inglés, por ejemplo) o “conjunto
de soluciones” para designar los conjuntos de soluciones de ciertas ecuaciones. Estos autores
reservan el término “variedad” para los conjuntos de ceros “irreduibles”. Sin embargo, otra
cierta tradición, surgida especialmente la tradición francesa, prefiere usar el término “variedad”
(variété en francés, varietät en alemán o variety en inglés) para designar cualquier conjunto de
ceros de sistemas de ecuaciones y añadir el adjetivo “irreducible” para designar a las variedades
irreducibles. En el caso de estas notas me adhiero a este uso.
Adicionalmente, el lector debe poner un poco de cuidado sobre el uso del término “variedad”
en español (como, por lo demás, en todas las lenguas latinas. En español, como en las demás
lenguas latinas, el término matemátov “variedad” (variété, varietà en italiano) se usa en dos
ámbitos distintos para referirse a dos objetos disntos (aunque con algunas relaciones. En Ge-
ometrı́a Diferencial, se usa el término variedad diferenciable, mientras que en topologı́a se usa
el término variedad topológica para referirse a objetos geométricos y topológicos que no tienen
por qué ser conjuntos de ceros globales de ninguna función de ninguna clase. Una variedad
topológica (resp. diferenciable) es un espacio topológico tal que cada punto posee un entorno
homeomorfo (resp. difeomorfo) a un abierto de un espacio afı́ real. El término original, in-
troducido por B. Riemann, fué Mannigfaltigkeit (que podrı́amos traducir por aculumación,
colección o apilamiento de diversos o múltiples). En inglés se usa el término manifold para
distinguirlo del término variety. Ciertamente, hay objetos que son, simultáneamente, “variété”
y “Mannigfaltigkeit”: el caso paradigmático de las esferas S n−1 , que pertenecen a ambos mun-
dos. Pero, en general, la relación entre ambos mundos es menos fluida por la existencia de
singularidades (como la descrita en la Lemniscata de Gerono). Las páginas que siguen no ha-
cen referencia a las Mannigfaltigkeiten sino a las variétés en el sentido de conjuntos de ceros
comunes a varias ecuaciones.
Definición 89. Sea X un conjunto no vacı́o, sea R un anillo y sea A[X] ⊆ RX una R−álgebra
(cf. iv) en Definición 23), que es subanillo del conjunto de aplicaciones de X en R. Introduci-
mos las siguientes nociones:
7.2. LA(S) TOPOLOGÍA(S) DE ZARISKI 341

i) Variedad (o conjunto de ceros) de una función (hiper-superficie): Sea f ∈


A[X] una función, definimos la variedad (o conjunto de ceros) en X asociado a f
como el subconjunto VX (f ) ⊆ X dado por la igualdad siguiente:
VX (f ) := {x ∈ X : f (x) = 0}.
ii) Variedad (o conjunto de ceros) asociada a un conjunto de funciones: Sea
F ⊆ A[X] un conjunto de funciones en A[X], definimos la variedad (o conjunto
de ceros) en X asociado a F como el subconjunto VX (F) ⊆ X dado por la igualdad
siguiente:
\
VX (F) := {x ∈ X : f (x) = 0, ∀f ∈ F} = VX (f ).
f ∈F

En el caso de que F = {f1 , . . . , fs } sea un conjunto finito, escribiremos


VX (f1 , . . . , fs ) := {x ∈ X : f1 (0) =, . . . , fs (x) = 0}.
iii) Variedad (o conjunto de ceros) asociada a un ideal: Sea a ⊆ A[X] un ideal de
A[X], definimos la variedad en X asociada al ideal a (o conjunto de ceros de a) como
el subconjunto VX (a) ⊆ X dado por la igualdad siguiente:
\
VX (a) := {x ∈ X : f (x) = 0, ∀f ∈ a} = VX (f ).
f ∈a

Observación 7.2.1 (Terminologı́a hiper-superficie). En la anterior definición hemos usado


el término hiper-superficie para describir la variedad de ceros en X dada por una sola ecuación
f ∈ A[X]. Sin embargo, el lector puede tener la intuición de que el término “hiper” usado
significa que el objeto tiene “dimensión n − 1”, donde n es la dimensión del espacio ambiente
X, sea cual sea la idea de dimensión que intuimos. Esto no será ası́, por ejemplo, en el caso
de que R = K sea un cuerpo que no es algebraicamente cerrado y A[X] ⊆ K X . Como se
observa en el Problema 276, si K no es algebraicamente cerrado y A[X] es noetheriano, toda
subvariedad A[X]−definible de X se puede expresar con una sola ecuación. Sólo en el caso de
cuerpos algebraicamente cerrados, podremos (gracias al Teorema del Ideal Principal de Krull y
al Teorema de los Ceros de Hilbert) identificar hiper-superficies con conjuntos cuya dimensión
es n − 1 donde n es la dimensión del espacio ambiente. Pero, por ahora, preservaremos esta
terminologı́a.

Observación 7.2.2. Por lo indicado en la discusión terminológica inicial, insistiremos en usar


la expresión “variedad”, aunque, en ocasiones, usemos la expresión “conjunto de ceros”. Es
claro que VX (0) = X, luego X es una variedad (definida por el 0 ∈ A[X]). Por eso, en muchas
ocasiones, se dice que VX (F) es un subvariedad de X. Al conjunto de todos las posibles
suvariedades de X definidos por subconjuntos del anillo A[X] se les denomina subvariedades
A[X]−definibles. Según los casos, cuando los anillos tienen semántica propia, las subvariedades
A[X]−definibles tienen nombres especı́ficos. Veremos ejemplos más adelante

Proposición 7.2.3. Sea X un conjunto no vacı́o, sea R un anillo y sea A[X] una R−álgebra
que es subanillo de RX . Sea F ⊆ A[X] un conjunto y a ⊆ A[X] el ideal que F genera en A[X].
Entonces,
VX (F) = VX (a).
Más aún, el variedad VX (a) coincide con la variedad VX (G) asociada a cualquier conjunto de
generadores G de a como ideal en A[X]. Es, por tanto, independiente del conjunto generador
elegido. En particular, toda variedad A[X]−definibles de X es una variedad asociada a un ideal
de A[X].
Adicionalmente, si A[X] es un anillo noetheriano, toda variedad A[X]−definible es una inter-
sección finita de hipersuperficies, es decir, dado a ⊆ A[X] un ideal, si A[X] es noetheriano,
existe una familia finita f1 , . . . , fs ∈ A[X] tales que
VX (a) = VX (f1 ) ∩ · · · ∩ VX (fs ) = VX (f1 , . . . , fs ).
342 7. GEOMETRÍA ALGEBRAICA: TOPOLOGÍA DE ZARISKI

Demostración. Es claro que si F := {fi : i ∈ I} genera el ideal a en A[X], F ⊆ a y,


entonces, teniendo más ecuaciones en a que en F se tiene la inclusión siguiente:
\ \
VX (a) = VX (f ) ⊆ VX (f ) = VX (F).
f ∈a f ∈F

Para el otro contenido, sea x ∈ VX (F) y sea f ∈ a un elemento cualquiera. Recordando la


definición de generadores de un ideal (Definición 32), si f ∈ a = (F) existen J ⊆ I un conjunto
finito, y existen {gj : j ∈ J} ⊆ A[X] tales que:
X
f := gj fj .
j∈J

Como la suma de la parte derecha de la igualdad es finita, podemos concluir que


X X
f (x) = gj (x)fj (x) = gj (x) · 0 = 0.
j∈J j∈J

Por tanto, f (x) = 0 para cualquier f ∈ a, luego x ∈ VX (a) y habremos probado VX (F) ⊆ VX (a)
concluyendo la primera afirmación del enunciado.
Obviamente, si tuviéramos otro conjunto G de generadores del ideal a, aplicxando esta misma
afirmación tendrı́amos:
VX (G) = VX (a) = VX (F),
y la variedad no depende del sistema generador de a elegido.
En lo que concierne al caso noetheriano, es claro que, por definición de anillo noetheriano, todo
ideal a de A[X] posee un sistema generador finito y, por lo que acabamos de probar, VX (a) será
el conjunto de ceros comunes a ese sistem generador finito de elementos del ideal a. 

Proposición 7.2.4 (Propiedades generales). Sea X un conjunto no vacı́o, sea R un anillo


y sea A[X] una R−álgebra que es subanillo de RX . Se tiene:
i) Si a ⊆ b son dos ideales del anillo A[X], entonces VX (b) ⊆ VX (a).
ii) ∅ = VX ((1)), donde (1) es el ideal generado por 1 en A[X] (es decir, el propio A[X]
como ideal dentro de sı́ mismo).
iii) X = VX ((0)), donde (0) = {0} es el ideal de A[X] formado solamente por el 0 ∈ A[X].
iv) La intersección de una familia cualquiera {V (ai ) : i ∈ I} de variedades A[X]−definibles
P
es también una variedad A[X]−definible. De hecho, si b es el ideal suma i∈I ai en
A[X] se tiene
\ X
VX (ai ) = VX (b) = VX ( ai ).
i∈I i∈I
v) Si R es un dominio de integridad, dados f, g ∈ A[X], entonces VX (f g) = VX (f ) ∪
Vx (g).
vi) Si R es dominio de integridad, la unión finita de subconjuntos de ceros A[X]−definibles
de X es también un subconjunto de ceros A[X]−definible. De hecho, en este caso,
dados a, b dos ideales de A[X], entonces si c es el ideal producto ab en A[X] se tiene
VX (a) ∪ VX (b) = V (c) = VX (ab).
vii) Para cada ideal a ⊆ A[X], si R es un anillo reducido (i.e. sin elementos nilpotentes)
se tiene que:

VX (a) = VX ( a),

donde a es el radical del ideal a introducido en la Subsección 6.3.1.
Demostración. Hagamos un repaso a las distintas afirmaciones:
i) Supongamos a ⊆ b, entonces es claro que hay más ecuaciones en b que en a por cuanto,
hay menos ceros en común. Es decir, se tiene:
\ \
VX (a) = VX (f ) ⊇ VX (f ) = VX (b).
f ∈a f ∈b

ii) Es obvio.
iii) Es obvio.
7.2. LA(S) TOPOLOGÍA(S) DE ZARISKI 343

P S
iv) Recuérdese (Definición 35) que i∈I ai es el ideal generado por i∈I ai . Obsérvese,
además, que
[ [
VX ( ai ) := {x ∈ X : f (x) = 0, ∀f ∈ ai } ⊆ VX (ai ), ∀i ∈ I.
i∈I i∈I
P
Luego, como aj ⊆ i∈I ai , para cada j ∈ I, aplicando la afirmación i) concluimos
[ X \
(7.2.1) VX ( ai ) = VX ( ai ) ⊆ VX (ai ).
i∈I i∈I i∈I
T P
Para el otro contenido,
S sea x ∈P i∈I VX (ai ) y sea f ∈ i∈I ai dos elementos cua-
lesquiera. Como i∈I ai genera i∈I ai , existirá J ⊆ I un conjunto finito y para cada
(j) (j) (j) (j)
j ∈ J, existirán elementos {f1 , . . . , fkj } ⊆ aj y elementos {g1 , . . . , gkj } ⊆ A en
número finito y elementos tales que:
 
kj
(j) (j)
X X
f=  gi fi  .
j∈J i=1

Ahora, como la suma de la izquierda es una suma finita podemos escribir:


 
kj
(j) (j)
X X
f (x) =  gi (x)fi (x) .
j∈J i=1

Pero como x ∈ VX (ai ) para todo i ∈ I, también se tiene x ∈ VX (aj ) para todo j ∈ J.
(j) (j)
Como {f1 , . . . , fkj } ⊆ aj , para cada j ∈ J, entonces concluimos:
(j)
fi (x) = 0, ∀j ∈ J, ∀i, 1 ≤ i ≤ kj .
Por tanto, la igualdad precedente se puede escribir como:
   
kj kj
(j) (j) (j)
X X X X
f (x) =  gi (x)fi (x) =  gi (x) · 0 = 0,
j∈J i=1 j∈J i=1

donde hemos podido igualar


T a cero por ser suma finita. Hemos
P concluido que f (x) = 0
para cualesquiera x ∈ i∈I VX (ai ) y para cualquier f ∈ i∈I ai , por tanto,
\ X
VX (ai ) ⊆ VX ( ai ),
i∈I i∈I
lo cual nuto a la inclusión descrita en la ecuación 7.2.1 termina la demostración de
esta afirmación.
v) Sea f, g ∈ A[X], si x ∈ VX (f ) entonces f (x) = 0, luego f g(x) = f (x)g(x) = 0 y, por
tanto, x ∈ VX (f g). Haciendo lo mismo con los elementos de VX (g) concluiremos
VX (f ) ∪ VX (g) ⊆ VX (f g).
De otro lado, si x ∈ VX (f g), entonces f g(x) = f (x)g(x) = 0. Como R es un dominio
de integridad, y f (x), g(x) ∈ R, entonces tiene que darse f (x) = 0 o g(x) = 0. En
conclusión, si x ∈ VX (f g), entonces x ∈ VX (f ) o VX (g) y habremos probado:
VX (f ) ∪ VX (g) ⊇ VX (f g),
lo que con la inclusión anterior demuestra la afirmación buscada.
vi) Aplicando inducción, la afirmación sobre la unión finita se sigue inmediatamente si
somos capaces de demostrar que la unión de dos variedades A[X]−definibles es también
una variedad A[X]−definible. Consideremos, entonces, este caso y sean a, b dos ideales
de A[X] y sea c es el ideal producto ab en A[X]. Hemos visto que
c = ab ⊆ a ∩ b,
Luego, c ⊆ a y c ⊆ b, lo cual implica
VX (a) ⊆ VX (c) = VX (ab), VX (b) ⊆ VX (c) = VX (ab),
con lo que concluimos:
(7.2.2) VX (a) ∪ VX (b) ⊆ VX (c) = VX (ab).
344 7. GEOMETRÍA ALGEBRAICA: TOPOLOGÍA DE ZARISKI

Para la otra inclusión, necesitamos la hipótesis de que R es un dominio de integridad.


Recordemos que el ideal producto c es el ideal generado por el conjunto siguiente:
F := {f g : f ∈ a, g ∈ b}.
Como los ceros comunes de un ideal son los ceros comunes a uno cualquiera de los
sistemas generadores, concluimos que:
\ \
VX (c) = VX (f g) = VX (f g).
f g∈F f ∈a,g∈b

Como R es un dominio de integridad, para cada x ∈ X, si f (x)g(x) = 0, entonces, o


bien f (x) = 0 o bien g(x) = 0, de donde deducimos que dados f, g ∈ A[X] cualesquiera,
se tiene: VX (f g) = VX (f ) ∪ VX (g). Por consiguiente, se tiene:
\
VX (c) = (VX (f ) ∪ VX (g)) .
f ∈a,g∈b

Aplicando la distributiva de conjuntos concluiremos:


   
\ \
VX (c) =  VX (f ) ∪  VX (g) = VX (a) ∪ VX (b).
f ∈a g∈b

vii) Una de las inclusiones es obvia por√i). Para la otra, sI R no posee elementos nilpo-
tentes, dado f ∈ A[X] tal que f ∈ a, existe
√ n ≥ 1, n ∈ N, tal que f n ∈ a. Por tanto
si x ∈ X es tal que x ∈ VA[X] (a) y f ∈ a, entonces f n (x) = 0 entonces f (x) = 0 y

x ∈ VA[X] ( a).


Corolario 7.2.5 (Topologı́a de Zariski). Con las notaciones precedentes, dado un conjunto
X, un dominio de integridad R y una R−álgebra A[X] que es subanillos de RX , el conjunto de
los subconjuntos de ceros A[X]−definibles
{VX (a) : a es un ideal de A[X]},
define una única topologı́a en X en la que dicho conjunto es la clase de cerrados. A esa topologı́a
se la denomina topologı́a de Zariski sobre X dada por el anillo A[X] y la denotaremos mediante
TZ (A[X]). Discutiremos diversos ejemplos en las páginas que siguen.
Demostración. Basta observar la proposición precedente, y las propiedades allı́ probadas,
para concluir que existe una única topologı́a en X para la cual los cerrados son los subconjuntos
del conjunto de las variedades A[X]−definibles. 

Esto nos permite introducir el lenguaje de la topologı́a en nuestro contexto y podemos usar los
términos siguientes:
Definición 90. Sea X un conjunto y A[X] ⊆ RX una clase de funciones, con R dominio de
integridad.
i) Llamaremos cerrados (A[X]−definible) para la topologı́a de Zariski a las variedades
A[X]−definibles.
ii) Llamaremos abierto (A[X]−definible) en la topologı́a de Zariski a los complementarios
de las veriadades A[X]−definibles. Es decir, son abiertos aquellos subconjuntos O ⊆ X
tales que existe un ideal a ⊆ A[X] de tal modo que:
[
O= {x ∈ X : f (x) 6= 0} = X \ VX (a).
f ∈a

Podremos escoger cualquier conjunto F ⊆ A[X], igualmente.


iii) Llamaremos abierto distinguido (A[X]−definible) en la topologı́a de Zariski de X a
los abiertos de la forma:
OX (f ) := {x ∈ X : f (x) 6= 0},
donde f ∈ A[X]. Es decir, a los complementarios de una hipersuperficie definida por
un elemento f ∈ A[X].
7.2. LA(S) TOPOLOGÍA(S) DE ZARISKI 345

iv) Llamaremos localmente cerrado (A[X]−definible) en la topologı́a de Zariski de X a los


subconjuntos que sean intersección de un abierto y un cerrado en dicha topologı́a.
v) Llamaremos constructible A[X]−definible en la topologı́a de Zariski de X a cualquier
unión finita de localmente cerrados.
vi) Llamaremos clausura (A[X]−definible) de un subconjunto cualquier Y ⊆ X en la
topologı́a de Zariski de X al menor cerrado A[X]−definible en esa topologı́a que con-
z
tiene a Y . Lo denotaremos mediante Y .

Observación 7.2.6. Obviamente resulta incómodo y oneroso repetir una y otra vez el término
A[X]−definble. Por ello, evitaremos esa insistencia cuando la R−álgebra A[X] sea clara por
el contexto. Especificaremos el detalle del objeto en los casos en los que la R−álgebra sea
determinante para alguna propiedad en cuestión. Ası́ que hablaremos de cerrados, abiertos,
localmente cerrados en X para la topologı́a de Zariski, etc.
7.2.1.1. Algunos Ejemplos de Topologı́as de Zariski.
Ejemplo 7.2.7 (Ceros de funciones continuas a valores reales). Sea (X, T ) un espacio
topolológico sea R = R el cuerpo de los números reales y A[X] = C (X) (o también denotado,
en ocasiones como C 0 (X)) el anillo de las funciones contı́nuas de X en R. Podemos definir
conjuntos como:
VX (f ) := {x ∈ X : f (x) = 0} := f −1 ({0}).
El conjunto VX (f ) es, obviamente, un cerrado en X y resulta fácil observar algunas identidades
elementales como las siguientes:
VX (f ) ∪ VX (g) := VX (f.g), VX (f ) ∩ VX (g) := VX (f 2 + g 2 ).
Sobre los reales se da un patologı́a especial y es que intersecciónes finitas de hipersuperficies
definidas por una sola ecuación son también hipersuperficies definidas por una sola ecuación.
Esto no necesariamente ocurre para una colección infinita de ecuaciones dadas por funciones
continuas a valores reales definidas sobre un espacio topológico.
En todo caso, observamos que la topologı́a T dada inicialmente es “a priori” más fina que
la topologı́a de Zariski TZ (C (X)) definida sobre X por las funciones continuas, es decir,
TZ (C (X)) ⊆ T . Observemos también (en virtud del Teorema de Banach-Stone-Čech-Gel’fand-
Kolmogorov) que si X es compacto, ambas topologı́as coinciden.

Ejemplo 7.2.8 (Funciones diferenciables sobre abiertos de Rn ). Podemos suponer que


X ⊆ Rn es un abierto en Rn , que el anillo R = R es el cuerpo de los números reales y que
nuesto anillo A[X] tiene en cuenta condiciones de diferenciablidad de algunas funciones. Por
ejemplo,
A ∈ {C ω (X) ⊆ C ∞ (X) ⊆ C k (X) ⊆ C 1 (X)},
todos ellos subanillos de C (X). De nuevo la topologı́a de Zariski definida por A es una topologı́a
hecha de cerrados de X para la topologı́a usual en X inducida por la de Rn . El siguiente
resultado suele ser atribuido a Withney:
Teorema 7.2.9 (Withney). Dado cualquier subconjunto cerrado F ⊆ Rn , existe una función
f ∈ C ∞ (Rn ) tal que
F = VRn (f ).
No haremos la prueba que corresponde a otro curso (bien de Análisis o de Topologı́a Diferencial).
En todo caso, este resultado permite concluir
Corolario 7.2.10. Si X es un abierto de Rn y A[X] es un anillo en la familia
{C k (X) : 0 ≤ k ≤ ∞}.
Entonces, la topologı́a de Zariski sobre X definida por A es la topologı́a usual, es decir,
TZ (A[X]) = Tu .
Demostración. El Teorema atribuido a Withney nos garantiza que todo cerrado en X es
una subconjunto de ceros C ∞ (X)−definible . Por tanto es también B−definible para todo los
anillos B que contienen a C ∞ (X) como subanillo y, además, son cerrados para las respectivas
topologı́as de Zariski. 
346 7. GEOMETRÍA ALGEBRAICA: TOPOLOGÍA DE ZARISKI

Ejemplo 7.2.11 (Subvariedades diferenciables definidas localmente). No insistiré, por


haberlo hecho con anterioridad, en la cuestión terminológica. El uso de la palabra variedad no
debe confunir al lector entre su interpretación en Geometrı́a Diferencial y su uso en este nuestro
contexto.
Una notación clásica, para empezar: Dadas dos variedades diferencibles M y una función
f : M −→ N , para cada punto a ∈ M denotaremos por Ta f la función tangente alrededor del
punto a. Es decir,
Ta f : Ta M −→ Tf (a) N.
Se tiene la siguiente caracterización clásica de las subvariedades de una variedad:

Teorema 7.2.12 (Caracterización de subvariedades diferenciables como variedades


localmente lisas). Sea M una variedad de dimensión m y N un subconjunto. Entonces, N
es subvariedad de M si y solamente si para cada punto a ∈ N existe un entorno abierto U de
a en M y existen funciones f1 , . . . , fm−n ∈ C ∞ (U ) tales que
• N ∩ U = VU (f1 , · · · , fm−n ).
• Dada la aplicación f := (f1 , . . . , fm−n ) : M −→ Rm−n , la aplicación tangente asociada
Ta f : Ta M −→ T0 Rm−n es suprayectiva (submersión), donde 0 ∈ Rn−m es el origen
de coordenadas.

Aunque no lo demostraremos, la prueba se basa en el Teorema del Rango Constante. En esen-


cia, lo que dice este enunciado es que si bien las variedades no tiene por qué ser dadas como
conjunto de soluciones de niguna familia de ecuaciones, las subvariedades, en cambio, sı́ pueden
interpretarse como aquellos subconjuntos de una variedad M que, localmente, son cerrados para
la topologı́a de Zariski. Se dice que son, localmente, y cerrados lisos de la topologı́a de Zariski
dada por el anillo de funciones C ∞ (M ).

Ejemplo 7.2.13 (Ceros de una función a valores complejos). A partir de una función
continua f ∈ C (X, C) podemos definir el conjunto de sus ceros comunes en X:

VX (f ) := {x ∈ X : f (x) = 0} := f −1 ({0}).

El conjunto VX (f ) es, de nuevo, cerrado en X y resulta fácil observar algunas identidades


elementales como VX (f ) ∪ VX (g) := VX (f.g).

Ejemplo 7.2.14 (Las Variedades C-analı́ticas de Cartan). Se consideran esencialmente


dos casos:
• A = C ω (X, R), con X ⊆ Rn abierto, es decir el anillo de funciones analı́ticas a valores
reales,
• A = H (X), con X ⊆ Cn un abierto, es decir el anillo de funciones holomorfas (i.e.
analı́ticas complejas) definidas en X.
En este caso, la topologı́a de Zariski TZ (A) está formada sólo por una parte de los cerrados de
la topologı́a usual en X (tanto en el caso real como en el complejo). De hecho, se puede probar
el siguiente resultado en Geometrı́a Analı́tica:

Proposición 7.2.15. Sea K = R ∨ C, sea X ⊆ An (K) un abierto conexo y sea a un ideal en


H (X) (si K = C) o ideal en C ω (X) (si K = R). Entonces, VX (a) ⊆ X es o bien coincidente
con X o bien es un conjunto de interior vacı́o y de medida (de Lebesgue) nula. En particular,
todos los cerrados F ⊆ X propios de la topologı́a de Zariski son conjuntos de interior vacı́o y
medida de Lebesgue nula.

La demostración no la daremos aquı́ porque exige una fuerte introducción previa en variable
compleja y funciones analı́ticas reales que no se corresponde al curso pero, en todo caso, ilustra
la distinción entre la toopologı́a de Zariski y la topologı́a usual.
7.2. LA(S) TOPOLOGÍA(S) DE ZARISKI 347

7.2.2. Ideal de un objeto geométrico, primos, maximales y variedades.


Definición 91 (Ideal de funciones que se anulan en un subconjunto). Con las nota-
ciones precedentes, sean X un conjunto, R un dominio de integridad, A[X] una R−álgebra que
es subanillo de RX . Consideremos F ⊆ X, definimos el ideal de funciones que se anulan en el
subconjunto F (y lo denotaremos mediante IA[X] (F )) como el ideal en A[X] dado por:
IA[X] (F ) := {f ∈ A[X] : f (x) = 0, ∀x ∈ F }.

Observación 7.2.16. Es obvio que IA[X] (F ) es un ideal de A[X]. Obviamente en cada caso
hemos de especificar el anillo sobre el que trabajamos. Los ideales respectivos son distintos,
obviamente, aún cuando estemos en el caso de subanillos como, por ejemplo, en el caso de la
siguiente cadena de sub–anillos:
R[X1 , . . . , Xn ] ⊆ C ω (X) ⊆ C ∞ (X) ⊆ C (X),
tendremos ası́ la cadena de los “respectivos” ideales;
IR[X1 ,...,Xn ] (F ) ⊆ IC ω (X) (F ) ⊆ IC ∞ (X) (F ) ⊆ IC (X) (F ),
que no coincidirán. Como notación, una vez hemos fijado el contexto de una R−álgebra A[X]
sobre la que estamos trabajando, escribiremos simplemente I(F ). en lugar de IA[x] (F ), en-
tendiéndose la R−álgebra A[X] por el contexto. Sólo lo especificaremos cuando pueda haber
confusión y el contexto no sea claro.

Proposición 7.2.17. Con las anteriores notaciones, sean X el conjunto, R dominio de integri-
dad, fijemos una R−álgebra A[X] que es subanillo de RX . Escribamos I(F ) := IA[X] (F ) para
cualquier subconjunto F ⊆ X. Se verifican las propiedades siguientes:
i) Si F ⊆ G son dos subconjuntos de X, I(G) ⊆ I(F ).
ii) I(∅) = A[X], (0) = I(X). p
iii) LosS ideales I(F
T ) son ideales radicales (i.e. I(F ) = I(F )).
iv) I(Ti∈I Fi ) = Pi∈I I(Fi ).
v) I( i∈I Fi ) ⊇ i∈I I(Fi ).
vi) Además, la clausura en la topologı́a de Zariski sobre X definida por A[X] de cualquier
subconjunto viene dada mediante:
z
F = V (I(F )).
Además,
z
I(F ) = I(F ).
Demostración. La primera afirmación es evidente desde la Definición. La segunda también.
La afirmación iii) es consecuencia de ser R un dominio de integridad (el resultado también serı́a
cierto si hubiéramos asumido quep R un anillo reducido, i.e. sin elementos nilpotentes no nulos,
ver Definición 79). Ası́, si f ∈ I(F ), entonces existe n ∈ N, n ≥ 1, tal que f n ∈ I(F ). Por
tanto, f (x)n = 0 para cada x ∈ F . Como R es un anillo reducido, el único elementos nilpotentes
es el 0 ∈ R. Como f (x) ∈ R, claramente se tiene que f (x)n = 0 =⇒ f (x) = 0 y esto es cierto
para todo x ∈ F . Por tanto f ∈ I(F ) y concluimos que I(FS ) es un ideal radical. S
Para la afirmación iv), aplicando i) observamos que Fj ⊆ i∈I Fi y, por tanto, I( i∈I Fi ) ⊆
I(Fj ) para cada j ∈ I, con lo que se obtiene el contenido
[ \
I( Fi ) ⊆ I(Fi ).
i∈I i∈I
T
Para el otro contenido usamos la definición directamente.SSi f ∈ i∈I I(Fi ), entonces, f se
anula en todos los Fi ’s y, por tanto, se anula en la unión i∈I Fi . Y el otro contenido queda
demostrado.
La propiedad v) sólo establece el contenido (la igualdad es incierta) y es consecuencia inmediata
de la propiedad i): Como ∩i∈I Fi ⊆ Fj para cada j ∈ I, entonces, I(Fj ) ⊆ I(∩i∈I Fi ) para cada
j ∈ I. Por tanto, la suma también está incluida y tendremos
X \
I(Fi ) ⊆ I( I(Fi ).
i∈I i∈I
348 7. GEOMETRÍA ALGEBRAICA: TOPOLOGÍA DE ZARISKI

La propiedad iv), aún siendo sencilla, tiene algún interés en su prueba. Recordemos la topologı́a
de Zariski, descrita en la Proposición 7.2.5 anterior. Escribamos I(F ) en lugar de IA[X] (F )
por descaragr un poco la notación. En particular, VX (I(F )) es cerrado en esa topologı́a y,
z
claramente, F ⊆ VX (I(F )). Por tanto, tenemos un primer contenido F ⊆ VX (I(F )). De otro
z
lado, por la propia definición de la topologı́a de Zariski, como F es cerrado, debe existir un
ideal a en A[X] tal que:
z
(7.2.3) F ⊆ F = VX (a) ⊆ VX (I(F )).

Como F ⊆ VX (a), para cada f ∈ a, f F ≡ 0. Pero, entonces, para cada f ∈ a, tenemos
que f ∈ I(F ) y habremos probado que a ⊆ I(F ). Finalmente, usando la primera de las
afirmaciones de la Proposición 7.2.4 anterior, concluiremos VX (I(F )) ⊆ VX (a), por cuanto
z
F = VX (a) = VX (I(F )). La última afirmación se sigue elementalmente de esta. Si f ∈ A[X]
z
se anula en un conjunto F , entonces f ∈ I(F ), con lo que f se anula también en V (I(F )) = F .
z
Obviamente, si f se anula en la clausura F , se anulará también en F y habremos terminado
la prueba del enunciado. 

Observación 7.2.18. En estos apuntes hemos decidido presentar las variedades algebraicas
a través de una R−álgebra de funciones sobre X, es decir, hemos escrito, por simplicidad,
A[X] ⊆ RX . Pero no siempre va a ser ası́. En ocasiones, se consideran R−álgebras A[X]
cuyos elementos definen funciones, pero no de manera unı́voca. En esos casos, algunas de la
igualdades predecentes se pierden. Por ejemplo, consideremos R = Fq el cuerpo finito de q
elementos, supongamos X = F2q como conjunto no vacı́o y supongamos que consideramos la
R−álgebra A[X] = Fq [X1 , X2 ]. Los polinomios en A[X] definen funciones sobre X y se tiene
(0) ⊆ IA[X] (X), pero no se tiene la igualdad porque, obviamente,
(0) ( a ⊆ IA[X] (X),
con lo que la propiedad ii) de la proposición precedente no se da.

Corolario 7.2.19. Con las notaciones anteriores, para cualquier subconjunto C ⊆ X, se tiene
que C es cerrado Zariski para la topologı́a definida por A[X] si y solamente si
C = VX (IA[X] (C)).
Más aún, se verificarán las propiedades siguientes para cerrados F y G en la topologı́a de
Zariski:
F ⊆ G ⇐⇒ IA[X] (G) ⊆ IA[X] (F ).

7.2.2.1. Ideales Primos e Irreducibles.


Definición 92 (Variedad irreducible). Con las notaciones precedentes, un cerrado A[X]−
definible en X se denomina reducible si existen dos cerrados Zariski A[X]−definibles W1 , W2 ⊆
X tales que
Wi ( V, i ∈ {1, 2},
y
V = W1 ∪ W2 .
Si no es reducible, diremos que V es un irreducible.

Proposición 7.2.20. Con las notaciones precedentes, si R es un dominio de integridad y


A[X] ⊆ RX , y V ⊆ X una variedad A[X]−definible, son equivalentes:
i) V es irreducible,
ii) IA[X] (V ) ∈ Spec(A[X]).
Demostración. Supongamos que V es irreducible. Sea I(V ) = IA[X] (V ) ⊆ A[X] el
ideal formado por las funciones f : X −→ R en A[X] que se anulan en V . Sean dados
f, g ∈ A[X] tales que f g ∈ I(V ). Supongamos que f 6∈ I(V ). Considero las siguientes variedades
A[X]−definibles:
W1 := V ∩ VX (f ), W2 := V ∩ VX (g).
7.2. LA(S) TOPOLOGÍA(S) DE ZARISKI 349

Tenemos que V = W1 ∪ W2 y V es irreducible. Por tanto, como f 6∈ I(V ), entonces V 6= W1 .


Por tanto, V 6= W1 con lo que, necesariamente, V = W2 ⊆ VX (g). Esto último implica que
g ∈ I(V ) y tenemos que I(V ) ∈ Spec(A[X]).
Recı́procamente, supongamos que el ideal I(V ) es primo. Y supongamos que
[
V = W1 W2 ,

donde W1 y W2 son cerrados Zariski A[X]−definibles. Entonces, por el apartado iii) de la


Proposición 7.2.17 precedente, se tiene que
I(V ) = I(W1 ∪ W2 ) = I(W1 ) ∩ I(W2 ).
Pero el ideal p = I(V ) es un ideal primo, luego, por el ı́tem iii) de la Proposición 4.2.12, si un
ideal primo p contiene una intersección de ideales, debe contener a alguno de ellos. Concluimos
ası́ que:
I(V ) ⊇ I(W1 ) ∨ I(V ) ⊇ I(W2 ).
De otro lado, Wi ⊆ V , luego por el apartado i) de la Proposición 7.2.17 concluimos que
I(V ) ⊆ (Wi ), para cada i ∈ {1, 2}. Habremos probado ası́ que se da una de las dos condiciones
siguientes:
[I(W1 ) ⊇ I(V ) ⊇ I(W1 )] ∨ [I(W2 ) ⊇ I(V ) ⊇ I(W2 )].
o, equivalentemente,
I(V ) = I(W1 ) ∨ I(V ) = I(W2 ).
Finalmente, por la propiedad vi) de la Proposición 7.2.17 concluimos que V = W1 ∨ V = W2 y,
por tanto, V es irreducible. 

Corolario 7.2.21. Con las notaciones y propiedades precedentes, los cerrados irreducibles para
la topologı́a de Zariski están contenidos en el conjunto:
{VX (p) : p ∈ Spec(A[X])}.
Demostración. Si V es cerrado irreducible en la topologı́a de Zariski, entonces p :=
I(V ) ∈ Spec(A[X]). Pero, como es cerrado
z
V = V = VX (I(V )) = VX (p),
lo que prueba el enunciado. 

Observación 7.2.22. La pregunta natural pasa por intentar conocer qué ideales primos p
definen un irreducible y cuáles no. Es una pregunta de tipo Nullstellensatz.

7.2.2.2. Ideales maximales y puntos. Comencemos retomando el ejemplo discutido


(para cuerpos) en el ejemplo vi) de la lista de Ejemplos 4.2.1:

Proposición 7.2.23 (Ideales asociados a puntos). Con las mismas notaciones pecedentes,
R un dominio de integridad, A[X] una R−álgebra que es subanillo de RX y x ∈ X un punto
de X. Denotemos por mx ) al ideal mx := I({x}), es decir,
mx = IA[X] ({x}) := {f ∈ A[X] : f (x) = 0}.
Entonces,
i) El ideal mx ∈ Spec(A[X]) es un ideal primo. En particular, la clausura Zariski de un
z
punto cualquiera {x} es una variedad A[X]−definible irreducible.
ii) Si R es un cuerpo y A[X] es una R−álgebra, entonces el ideal mx ∈ MaxSpec(A[X])
es un ideal maximal.
iii) En general no es cierto que {x} sea un cerrado para la topologı́a de Zariski definida
por A[X] sobre X. Ni siquiera en el caso de que R sea un cuerpo.
350 7. GEOMETRÍA ALGEBRAICA: TOPOLOGÍA DE ZARISKI

Demostración. Consideremos el morfismo de anillos:


evx : A[X] −→ R
f 7−→ f (x).
Claramente se tiene que el núcleo de evx es precisamente el ideal mx . Por tanto, el 1er. Teorema
de Isomorfı́a nos identifica, mediante isomorfismo de anillos, con el anillo cociente
A[X]/mx ,
con un subanillo T de R. Como la condición de ser dominio de integridad es hereditaria para
subanillos, entonces T es dominio de integridad y también lo será A[X]/mx , lo que significa que
mx ∈ Spec(A[X]). Por la afirmación vi) Proposición 7.2.17, sabemos que
z
mx = IA[X] ({x}) = IA[X] ({x} )) ∈ Spec(A[X]).
z
Y por la Proposición 7.4.13 concluimos que {x} es una variedad irreducible.
Si R es cuerpo y A[X] es R−álgebra, R está identificado con un subcuerpo de A[X]. Podemos
suponer, simplemente, que R ⊆ A[X], definiendo las funciones constantes. Entonces, evx es
suprayectiva y el 1er. Teorema de Isomorfı́a identifica el anillo cociente con:
A[X]/mx ∼ = R,
con lo que mx es un ideal maximal.
Para la última afirmación, supongamos √ X = C, A[X] = Q[X1 ] el anillo de polinomios en
una variable. Considero el punto x = 2 ∈ C y considero mx ⊆ Q[X1 ]. Claramente m√2 =

((X12 − 2)) y VC (mx ) = {± 2}. En otras palabras, no se puede disociar√elementos algebraicos
de C usando solamente ecuaciones polnomiales con coeficientes en Q y { 2} no es cerrado para
la topologı́a de Zariski definida en C por Q[X1 ]. 

Observación 7.2.24. Del mismo modo que en el caso de ideales primos (ver Observación
7.2.22) y subvariedades irreducibles, nos podemos pregunta qué ideales maximales están aso-
ciados a los puntos de x y viceversa. De nuevo es una pregunta que será respondida por el
Nullstellensatz.
7.2.2.3. Nullstellensätze y y Variantes: ¿Diccionario Álgebra–Geometrı́a?.
En las observaciones 7.2.24 y 7.2.22 nos preguntamos por la identificación entre conjuntos de
ceros irreducibles y primos. De modo general, podemos retomar el Corolario 7.2.19 e interpre-
tarlo del modo siguiente:
Fijemos in conjunto X no vacı́o, un dominio de integridad R, una R−álgebra A[X] que sea
subanillo de RX . Definamos los conjuntos de cerrados en la topologı́a de Zariski en X
T c (X) := {F ⊆ X : F es cerrado Zariski en X},
y de ideales en A[X]:
IA[X] := {a ⊆ A[X] : a es un ideal de A[X]}.
Tenemos las transformaciones:
V : IA[X] −→ T c (X), I : T c (X) −→ IA[X]
a 7−→ VX (a), F 7−→ IA[X] (F ).
El Corolario 7.2.19 se traduce simplemente en:

V ◦ I |T c (X) = Id T c (X) .
En particular, I es inyectiva, V es suprayectiva, pero no queda claro quién es la imagen de
I o, dicho de otro modo, cómo podemos caracterizar qué ideales de A[X] están identificados
con los objetos geométricos. A las respuetas a estas preguntas se les conoce como Teoremas
de los Ceros o Nullstellensätze. En el Capı́tulo 8 daremos el enunciado y demostración
del Nullstellensatz de Hilbert-Kronecker. Este resultado considera un cuerpo K y su clausura
algebraica K, toma como espacio X un espacio afı́n de dimensión finita (pongamos de dimensión
n) sobre K, esto es en el caso X = An (K) = An (K) y considera como anillo de funciones al
anillo A[X] = K[X1 , . . . , Xn ]. Mostraremos, sin demostración, también otros ejemplos de
Nullstellensätze en otros ámbitos de funciones y espacios.
7.3. RUDIMENTOS DE GEOMETRÍA ALGEBRAICA 351

7.3. Rudimentos de Geometrı́a Algebraica: Variedades algebraicas K−definibles


Toda la disquisición previa sobre el uso de A[X]−definibles, remarcando la relevancia del anillo
A[X], tiene que ver, como se observa, con el contexto académico en el que se trabaja (bien sea
algebraico, anaı́tico, diferenciable, etc.). Pero también tiene su relevancia cuando se trabaja en
un contexto concreto y es, especialmente, significativo en el caso algebraico, que expondremos
a continuación.
Los métodos el tratamiento algorı́timico de objetos de la Geometrı́a Algebraica entroncan con el
sencillo problema de tratar de resolver un sistema de ecuaciones polinomiales como el siguiente:


 f1 (x1 , . . . , xn ) = 0
f2 (x1 , . . . , xn ) = 0

(7.3.1) .. ..


 . .
fs (x1 , . . . , xn ) = 0

Estos tratamientos algorı́tmicos suelen recibir el nombre de Métodos Efectivos en Geometrı́a


Algebraica (sobre todo en Europa), aunque también se usa el término Computational Algebraic
Geometry (sobre todo, en el contexto FoCM americano). En el siglo XIX eran más elegantes y
llamaban a esta parte de la Ciencia Teorı́a de la Eliminación.
Para poder analizar las soluciones de un sistema de ecuaciones como el descrito en la identidad
precedente (7.3.1) lo primero imprescindible es que algiien pueda “escribir” esas ecuaciones de
algún modo. Esto ya lo tratamos ligeramente cuando tratamos los lenguajes sobre alfebatos
finitos (ver la SUbsección 1.2.2). Algo que se puede escribir es algo que se puede expresar sobre
un alfabeto finito Σ y, por tanto, para estudiar las ecuaciones de (7.3.1), si los polinomios son
dados en forma “densa” (es decir, por sus coeficientes) necesito poder escribir los coeficientes
sobre algún alfabeto finito. En suma, los polinomios f1 , . . . , fs dados deben pertenecer a algún
anillo de la forma K[X1 , . . . , Xn ] donde K es un cuerpo expresable sobre un alfebato finito.
Los ejemplos más sencillos de tales cuerpos son los cuerpos primos ({Fp : p ∈ N p es primo} ∪
{Q}). Los cuerpos primos (y otros cuerpos que se construyen desde ellos) son, además cuerpos
computables (i.e. cuerpos expresables sobre un alfaeto finito, donde las operaciones naturales
{+, −, ×} y la igualdad {= 0} son funciones computables). En suma, las ecuaciones son dadas a
través de polinomios con coeficientes en un cuerpo computable que es, obviamente, numerable.
Por tanto, suponer que recibimos como Input del algoritmo unas ecuaciones en R[X1 , . . . , Xn ]
o en C[X1 , . . . , Xn ] es una suposición irracional sea cual sea el modelo de computación (digital
a la Turing o cuántica) con el que pretendamos desarrollar nuestro algoritmo.
Un aspecto distinto, desde esa misma perspectiva algorı́timica es dónde buscamos las soluciones
(x1 , . . . , xn ) del sistema (7.3.1). En el caso de ecuaciones polinomiales hay varias posibles
opciones y las siguientes son algunos de los ejemplos:
i) Geometrı́a Algebraica (Caso afı́n): El cuerpo de coeficientes es un cuerpo K, even-
tualmente, computable, pero las soluciones (x1 , . . . , xn ) ∈ An (K) son soluciones con
coordenadas en un cuerpo K que es la clausura algebraica del cuerpo K de coeficientes.
ii) Geometrı́a Algebraica Real: El cuerpo de coeficientes K es un cuerpo formalmente real
(ver el Problema ??). La socluciones se buscan en la calusura real de K o en un cuerpo
realmente cerrado que contenga a K. A modo de ejemplo, f1 , . . . , fs ∈ Q[X1 , . . . , Xn ]
y las soluciones (x1 , . . . , xn ) ∈ Rn .
iii) Geometrı́a Diofántica : Los polinomios dados son polinomios en Q[X1 , . . . , Xn ] (qui-
tando denominadores, que no afectan las podemos incluso suponer que f1 , . . . , fs ∈
Z[X1 , . . . , Xn ]) y las soluciones en (x1 , . . . , xn ) ∈ Zn . Este es el contexto del Problema
X de Hilbert (con respuesta negativa a la existencia de algoritmo debida a J. Robin-
son y Yu. Matjasievicz, ver [Matj, 1970] y sus referencias al trabajo de J. Robinson,
fundamentalmente). Obviamente relacionado con la Conjetura de Birch-Swynerton-
Dyers.
iv) La Conjetura de Cook: El cuerpo de los coeficientes es un cuerpo finito K = Fq , los
polinomios dados son polinomios f1 , . . . , fs ∈ Fq [X1 , . . . , Xn ] y las soluciones pretendi-
das son puntos Fq −racionales (i.e. (x1 , . . . , xn ) ∈ Fq ).
De ahı́ la pertinencia (a priori incómoda) de considerar variedades K−definibles en lo que sigue.
Observe el lector que, en apenas estos 4 ejemplos aparecen dos de los 6 Problemas del Millenium
352 7. GEOMETRÍA ALGEBRAICA: TOPOLOGÍA DE ZARISKI

(Clay Institute 1) sin olvidar que aparecen 3 de los problemas aún abiertos de la lista original
de 18 problemas de Steve Smale para las Matemáticas del siglo XXI ([Smale, 1998]), aunque,
en realidad, se hace referencia a 4 de ellos.
7.3.1. Funciones polinomiales K−definibles. Sea K un cuerpo y K un cuerpo alge-
braicamente cerrado que le contiene. Denotemos por An (K) = Kn el espacio afı́n n−dimensional
sobre K. Consideraremos el conjunto de las funciones polinomiales K−definibles sobre An (K),
que denotaremos mediante K[An (K)], definido del modo siguiente:
K[An (K)] := {f : An (K) −→ K : ∃F ∈ K[X1 , · · · , Xn ], f (x) = F (x), ∀x ∈ An (K)}.
Se trata obviamente de un anillo y una K−álgebra. En el caso K = K escribiremos simplemente
K[An ]. En el Problema 56, ya tratamos sobre este anillo. Consideramos el anillo de aplicaciones
Ap(An (K), K) y consideremos las proyecciones canónicas
πi : An (K) −→ K
(x1 , . . . , xn ) 7−→ xi .
n
Sea K[π1 , . . . , πn ] la menor sub-K−álgebra de KA (K) que verifica las dos propiedades siguientes:
• K ⊆ K[π1 , . . . , πn ],
• πi ∈ K[π1 , . . . , πn ], para cada i, 1 ≤ i ≤ n.
Nótese que, en las notaciones de la Proposición 1.4.7, K[π1 , . . . , πn ] es otra notación para la sub-
n
K−álgebra de KA (K) generada por {π1 , . . . , πn }, es decir, K[π1 , . . . , πn ] := K[{π1 , . . . , πn }].
Proposición 7.3.1. Con las anteriores notaciones, se tiene
i) Existe un epimorfismo de K−álgebras (i.e. es la identidad sobre el subcuerpo K)
Φ : K[X1 , . . . , Xn ] −→ K[An (K)] = K[π1 , . . . , πn ],
verificando Φ(Xi ) = πi , para cada i, 1 ≤ i ≤ n.
ii) Además, como K es un cuerpo de cardinal infinito, Φ es un isomorfismo de K−álgebras.
Demostración. La buena definición del morfismo Φ es obvia. Es claro que las proyec-
ciones πi = Φ(Xi ) ∈ Im(Φ). Esto prueba que K[An (K)] ⊇ K[π1 , . . . , πn ]. De otro lado,
supongamos f ∈ K[An (K)] existe un polinomio F ∈ K[X1 , . . . , Xn ] tal que f (x) = F (x) para
cada x ∈ An (K). Supongamos que
X
F := aµ X1µ1 · · · Xnµn .
|µ|≤d

Entonces, por ser Φ morfismo de anillos y ser la identidad sobre K, tendremos


X X
Φ(F ) = aµ Φ(X1 )µ1 · · · Φ(Xn )µn = aµ π1µ1 · · · πnµn .
|µ|≤d |µ|≤d

Entonces, Φ(F ) ∈ K[π1 , . . . , πn ] y, además, es fácil verificar que


Φ(F )(x) = F (x) = f (x), ∀x ∈ An (K).
Por tanto, ambas funciones (Φ(F ) y f ) coinciden en todos los puntos del dominio An (K), luego
han de ser iguales. Es decir, Φ(F ))f y Φ es un epimorfismo de anillos.
Para concluir la prueba de la Proposición, sólo nos queda verificar que Φ es inyectiva. Nótese
que los cuerpos algebraicamente cerrados tienen cardinal infinito (cf. Proposición 3.6.9), lo
que, en particular sucede para K. Recurrimos al Problema 58: mezclando inducción en el
número de variables e interpolación en el caso univariado (ver Problema 174) sobre cuerpos de
cardinal infinito, para cada F ∈ K[X1 , . . . , Xn ], si Φ(F )(x) = 0, ∀x ∈ An (K), entonces F = 0
en K[X1 , . . . , Xn ]. Como K[X1 , . . . , Xn ] ⊆ K[X1 , . . . , Xn ] esta propiedad también será cierta
para F ∈ K[X1 , . . . , Xn ] y concluimos que Φ es inyectiva. 

Notación 7.3.2. Dado que Φ es monomorfismo, denotaremos por f indistintamente al poli-


nomio f ∈ K[X1 , . . . , Xn ] y a la función polinomial Φ(f ) ∈ K[An (K)]. Sin embargo, en cada
caso debemos tener muy en cuenta el significado del sı́mbolo para no argumentar inapropiada-
mente (algo más común de lo que parece).

1Véase https://www.claymath.org/millennium-problems
7.3. RUDIMENTOS DE GEOMETRÍA ALGEBRAICA 353

Observación 7.3.3. Nótese esta Proposición depende fuertemente de la condición K es un


n
cuerpo de cardinal infinito. Si hubiésemos considerado K K con K cuerpo finito, no es cierto
n
que K[X1 , . . . , Xn ] sea isomorfo al menor subanillo de K K que contiene a K y a las proyecciones
canónicas πi : K n −→ K.

Notación 7.3.4 (En Geometrı́a Algebraica, denotaremos igual polinomios y fun-


ciones polinomiales sobre An (K)). Una vez que nos queda clara la diferencia concep-
tual entre el polinomio f (i.e. elemento en el anillo K[X1 , . . . , Xn ]) y la función polinomial
Φ(f ) : An (K) −→ K (i.e. elemento en el anillo K[An (K)]), usaremos indistintamente f para
denotar tanto al polinomio f ∈ K[X1 , . . . , Xn ] como la función f := Φ(f ) ∈ K[An (K)] en este
contexto de la Geometrı́a Algebraica y mientras no haya confusión con este uso.
7.3.2. Variedades algebraicas afines y K−definibles. Las propiedades esenciales de-
scritas en la Subsección 7.2.2 se satisfacen también en el caso de tener K un cuerpo, K una
extensión algebraicamente cerrada, X = An (K) el espacio afı́n sobre K de dimensión n y
A[X] = K[An (K)] ∼ = K[X1 , . . . , Xn ]. Tendremos ası́ una topologı́a de Zariski y conjuntos cerra-
dos y abiertos asociados a K[An (K)]. Sin embargo, como hay una terminologı́a propia de esta
situación la introduciremos en las páginas que siguen.
Ası́, dado f ∈ K[X1 , . . . , Xn ], siguiendo el convenio notacional descrito en la Subsección prece-
dente, denotemos igualmente por f la función polinomial f : An (K) −→ K que define. Lla-
maremos hiper-superficie afı́n definida por f en An (K), que denotaremos por VAn (K) (f ). al
conjunto:
VAn (K) (f ) := {x ∈ An (K) : f (x) = 0} = f −1 ({0}).
En el caso en que los cuerpos K y K, ası́ como la dimensión n, estén bien definidos por el
contexto, para no cargar la notación escribiremos simplemente VA (f ) en lugar de VAn (K) (f ) y
diremos simplemente hiper-superficie afı́n definida por f .
Por la Proposición 7.2.3, el conjunto de ceros de un ideal a ⊆ K[X1 , . . . , Xn ] ∼ = K[An (K)]
coincide con el conjunto de ceros de un conjunto cualquiera de generadores del mismo ideal.
Ası́, definimos variedad algebraica afı́n K−definible a cualquier subconjunto V ⊆ An (K) tal
que existe un ideal a ⊆ K[X1 , . . . , Xn ] tal que
V = VAn (K) (a) := {x ∈ An (K) : f (x) = 0, ∀f ∈ a}.
En el caso en que los cuerpos K y K, ası́ como la dimensión n, estén bien definidos por el
contexto, para no cargar la notación escribiremos simplemente VA (a).
Por tradición, en el caso K = K hablaremos simplemente de variedades algebraicas afines VA (a),
siendo a un ideal de K[X1 , . . . , Xn ].
Por el Teorema de la Base de Hilbert (Basissatz) (ver Teorema ??) sabemos que K[X1 , . . . , Xn ]
es un anillo noetheriano, cuando K es un cuerpo. Pero los anillos noetherianos (ver Definición
59) se caracterizan por la propiedad de que todo ideal es finitamente generado. En particular,
concluimos la siguiente proposición:
Proposición 7.3.5. Toda variedad algebraica K−definible es la intersección finita de un número
finito de hiper-superficies K−definibles. Es decir, dado un ideal a ⊆ K[X1 , . . . , Xn ] y dados
f1 , . . . , fs ∈ K[X1 , . . . , Xn ] una familia finita de generadores (i.e. a = (f1 , . . . , fs )), tendremos
que
VAn (K) (a) = VAn (K) (f1 , . . . , fs ) = VAn (K) (f1 ) ∩ · · · VAn (K) (fs ).
Si K = K escribiremos simplemente VA (f1 , . . . , fs ).

Ejemplo 7.3.6 (Puntos K−racionales y puntos de variedades). En ocasiones, sin em-


bargo, no interesa analizar toda la variedad algebraica afı́n VK (f1 , . . . , fm ) sino simplemente los
llamados puntos K−racionales de una variedad K−definible que denotaremos mediante:
VK (a) := VAn (K) (a) ∩ An (K) = VAn (K) (a) ∩ K n .
Para mostrar un sencillo ejemplo, basta con tomar el caso n = 1 y recordar lo aprendido en
los cursos de Teorı́a de Galois (o, simplemente, lo descrito en el Ejemplo 3.6.12 anterior). Por
ejemplo, tomemos los caso K = Q y K = Q ( C su clausura algebraica, es decir, el subcuerpo
de C siguiente:
Q = {ζ ∈ C : ∃f ∈ Q[X], f (ζ) = 0},
354 7. GEOMETRÍA ALGEBRAICA: TOPOLOGÍA DE ZARISKI

o el caso K = R y K = C.
• En el caso K = Q y K := Q ⊆ C, dado un ideal a = (f ) ⊆ Q[X1 ], podemos considerar
los conjuntos siguientes:
VA (a) := VA1 (Q) (a) = VA1 (Q) (f ) = {ζ ∈ Q : f (ζ) = 0}.
mientras que
VQ (a) := VA (a) ∩ Q = {ζ ∈ Q : f (ζ) = 0}.
Tomemos como ejemplo el polinomio:
√ √
f := X14 + 1 = (X12 − 2X1 + 1)(X12 + 2X1 + 1),
y el ideal a que genera. Entonces, la variedad Q−posee cuatro puntos
√ 1±i √
   
−1 ± i
VA (a) = { 2 , 2 } ,
2 2
mientras que no hay ningún punto Q−racional, es decir,
VQ (a) = ∅.
• Si hubiéramos elegido K = R y K = C, con el mismo polinomio f := X14 + 1 y
denotemos por ae el ideal que define en R[X1 ], la variedad de los ceros complejos sigue
teniendo 4 puntos, pero admite una descomposicón en R−definibles:
√ √
VA1 (C) (ae ) = VA1 (C) (X12 − 2X1 + 1) ∪ VA1 (C) (X12 − 2X1 + 1),
porque el ideal ae 6∈ Spec(R[X1 ]). El conjunto de los puntos R−racionales sigue siendo
vacı́o:
VR (ae ) = ∅.

Ejemplo 7.3.7. Obviamente, los objetos de estudio de la Geometrı́a algebraica no son simple-
mente los casos de una variable n = 1 descritos anteriormente (ese serı́a el objeto de estudio
de la Teorı́a de Galois), sino el estudio de variedades dadas por ecuaciones polinomiales como
los siguientes. A pesar de mi escaso interés por los dibujos de estos objetos geométricos,
sino por otras propiedades, he incluido un par de ejemplos de imágenes (en general de difı́cil
tratamiento, para ilustrar estas variedades algebraicas. Nótese que las imágenes vertidas no
son todos los puntos en VAn (C) porque no podemos dibujarlos para n ≥ 2, sino solamente sus
puntos R−racionales, llamados puntos reales de la variedad :
• La Cardioide VA2 (C) (g) es una curva plana, dada por una ecuación de grado 4 (una
cuártica) cuyos puntos reales se ven en la imagen siguiente:

tomada de M. Lávička (A Note on the Rational Parameterization of Algebraic Curves


in Mathematica. Journal of Interdisciplinary Mathematics 12(2009).) y cuya ecuación,
en la que a es un parámetro, es dada por la identidad siguiente
g(X, Y ) := (X 2 + Y 2 )2 + 4aX(X 2 + Y 2 ) − 4a2 Y 2 .
7.3. RUDIMENTOS DE GEOMETRÍA ALGEBRAICA 355

• La quı́ntica de Togliatti, es una superficie de grado 5, con ecuación debida a D. van


Straten (A Quintic Hypersurface in P4 (C) with 130 Nodes. Topology 32 (1993), 857-
864) y cuyos puntos reales afines son los de la imagen siguiente

La imagen ha sido tomada de https://commons.wikimedia.org/w/index.php?curid=


46286583, y la ecuación de grado 5 viene dada por
 
f (X, Y, Z) := 64(X − 1) X 4 − 4X3 − 10X 2 Y 2 − 4X 2
+ 16X − 20XY 2 + 5Y 4 − 20Y 2 + 16 −
p √ p √   √ 2
−5 5 − 5 2Z − 5 − 5 4 X 2 + Y 2 + Z 2 + (1 + 3 5) .

Ejemplo 7.3.8 (Puntos racionales y Millenium Problems). Son especialmente significa-


tivos los casos siguientes de búsqueda de puntos K−racionales en problemas como los ya se
nalados:
i) Si K = Q, se trata del estudio de los puntos racionales x ∈ Qn que son ceros de un
ideal a ⊆ Q[X1 , . . . , Xn ]:
VQ (a) := {x ∈ Qn : : f (x) = 0, ∀f ∈ a}.
El problema entronca con el Problema X de Hilbert y, en el caso de que la variedad V( a)
tenga una estructura de gurpo abeliano, la pregunta sobre la existencia de solución
Q−racional es el problema abierto central de la Geometrı́a Diofántica.
ii) Si K = Fq es un cuerpo de Galois, con q = pm , p ∈ N primo no nulo, se trata de
buscar los ceros Fq −racionales de un ideal a ⊆ Fq [X1 , . . . , Xn ]:
VFq (a) := {x ∈ Fnq : f (x) = 0, ∀f ∈ a}.
Decidir algorı́tmicamente si VQ (a) o VFq (a) son conjuntos no vacı́os (para convenientes ideales:
caso de variedades abelianas si K = Q y caso cero-dimensional si K = Fq ) conducen al 33% de
los problemas abiertos entre los Problemas del Milenio del Instituto Clay: Swinnerton-Dyer-
Birch Conjecture y Cook’s Conjeture
Proposición 7.3.9 (Propiedades elementales de las variedades algebraicas afines).
Las variedades agebraicas afines K−definibles (y las variedades algebraicas afines en general)
satisfacen las mismas propiedades de la Proposición 7.2.4. Es decir, las mismas propiedades de
VX se verifican para VAn (K) (y para VA , si K = K). En particular, existe una única topologı́a
sobre An (K) cuyos cerrados son las variedades K−definibles y que se denomina topologı́a de
Zariski de los K−definibles en An (K). En el caso K = K se denomina simplemente la topologı́a
de Zariski en An (K).

Igualmente usaremos los términos cerrado Zariski, abierto Zariski, localmente cerrado Zariski
o clausura Zariski en las respectivas topologı́as de Zariski K−definibles en An (K).
Recordemos que los abiertos distinguidos son los complementarios de las hipersuperficies, es
decir, un abierto distinguido en An (K) dado por f ∈ K[X1 , . . . , Xn ] es un subconjunto OA (f )
dado mediante:
OAn (K) (f ) := {x ∈ An (K) : f (x) 6= 0}.
356 7. GEOMETRÍA ALGEBRAICA: TOPOLOGÍA DE ZARISKI

Corolario 7.3.10. Cada abierto en la topologı́a de Zariski de An (K) dada por los K−definibles
es unión finita de abiertos distinguidos de la forma
OA (f ) := OAn (K) (f ) := An (K) \ VAn (K) (f ) := {x ∈ An (K) : f (x) 6= 0}.
Demostración. Es obvio a partir del Basissatz. La Proposición 7.3.5 nos dice que la
variedad definida por un ideal es igual a la variedad de ceros comunes a cualquiera de sus
generadores. De ello se sigue que toda variedad algebraica K−definible es la interseción de un
número finito de hipersuperficies. Por tanto, sus complementarios son los abiertos Zariski y son
uniones finitas de abiertos en la clase {O(f ) : f ∈ K[X1 , . . . , Xn ]}. 

7.3.3. Primos, maximales y variedades algebraicas afines.


Definición 93 (Ideal asociado a un variedad K−definible). Con las notaciones prece-
dentes, dado F ⊆ An (K), definimos IK (F ) como el ideal en K[X1 , . . . , Xn ] dado por:
IK (F ) := IK[X1 ,...,Xn ] (F ) := {f ∈ K[X1 , . . . , Xn ] : f (x) = 0, ∀x ∈ F }.
Cuando K = K escribiremos simplemente I(F ).

Se verificarán las mismas propiedades de la Proposición 7.2.17:


Proposición 7.3.11. Con las anteriores notaciones, se verifican las propiedades siguientes:
i) Si F ⊆ G son dos subconjuntos de An (K), IK (G) ⊆ IK (F ).
n
ii) IK (A
S (K)) = (0),
T IK (∅) = K[X1 , . . . , Xn ].
iii) IK ( i∈I Fi ) = i∈I IK (Fi ).
iv) Además, dado un subsonjunto F ⊆ An (K), su clausura en la topologı́a de Zariski sobre
An (K) definida por las variedades K−definibles viene dada mediante:
z
F = VA (IK (F )).
Demostración. Idéntica a la Demostración de la Proposición 7.2.17. Debe señalarse
que, en el punto ii) la igualdad IK (∅) = K[X1 , . . . , Xn ] es consecuencia del hecho de ser K
algebraicamente cerrado (y, por tanto, un cuerpo infinito) y de tener K ⊆ K (ver Problema
57). 

Corolario 7.3.12. Con las notaciones anteriores, para cualquier subconjunto C ⊆ An (K), se
tiene que C es cerrado para la topologı́a de Zariski definida en An (K) por K[X1 , . . . , Xn ] si y
solamente si
C = VA (IK (C)).
Más aún, se verificarán las propiedades siguientes para cerrados F y G en la topologı́a de
Zariski:
F ⊆ G ⇐⇒ IK (G) ⊆ IK (F ).

Definición 94 (Variedad algebraica afı́n irreducible). Con las notaciones precedentes,


dada una variedad algebraica K−definible V ⊆ An (K), diremos que es reducible si se satisfacen
las condiciones de la Definición 92 anterior, para la topologı́a Zariski de los K−definibles en
An (K). Es decir, V es reducible si existen dos variedades K−definibles W1 , W2 tales que V 6=
Wi , para cada 1 ≤ i ≤ 2, tales que
V = W1 ∪ W2 .
Igualmente, llamaremos variedades algebraicas K−definibles irreducibles a las que no sean re-
ducibles.
Si K = K es algebraicamente cerrado, diremos simplemente que una variedad algebraica en
An (K) es reducible o irreducible si lo es como K−definible.

Ejemplo 7.3.13. Retomemos el Ejemplos 7.3.6, y observamos que si f := X14 + 1 se tiene:


• En el caso K = Q y K := Q ⊆ C, la variedad VA (X14 + 1) es irreducible como variedad
Q−definible y es reducible como variedad “a secas” (i.e. sobre Q.
7.3. RUDIMENTOS DE GEOMETRÍA ALGEBRAICA 357

• Si hubiéramos elegido K = R y K = C, con el mismo polinomio f := X14 + 1, la


variedad VA (f ) serı́a reducible como variedad R−definible:
√ √
VA1 (C) (ae ) = VA1 (C) (X12 − 2X1 + 1) ∪ VA1 (C) (X12 − 2X1 + 1) .
Los puntos x ∈ An (K) son variedades K−definibles irreducibles, mientras que un par de rectas
es reducible:
VA2 (C) ((X + Y − 1)(X − Y − 1)) = VA2 (C) (X + Y − 1) ∪ VA2 (C) (X + Y − 1).

Proposición 7.3.14. Con las notaciones precedentes, V ⊆ An (K) es cerrado irreducible K−definible
si y solamente si es cerrado e IK (V ) ∈ Spec(K[X1 , . . . , Xn ])
Demostración. Idéntica a la Demostración de la Proposición 7.2.20. 

Proposición 7.3.15 (Ideales asociados a puntos afines). Con las mismas notaciones prece-
dentes, dado x ∈ An (K) un punto de An (K), Denotemos por mx al ideal IK ({x}), es decir,
mx = IK[X1 ,...,Xn ] ({x}) := {f ∈ K[X1 , . . . , Xn ] : f (x) = 0}.
Entonces,
z
i) El ideal mx ∈ Spec(K[X1 , . . . , Xn ]) es un ideal primo y la clausura Zariski {x} es
una variedad irreducible.
ii) Si K es la clausura algebraica de K, entonces, el ideal mx ∈ MaxSpec(K[X1 , . . . , Xn ])
es un ideal maximal. De hecho, si todas las coordenadas del punto x ∈ An (K) son
elementos algebraicos sobre K, entonces mx ∈ MaxSpec(K[X1 , . . . , Xn ]).
iii) En general no es cierto que {x} sea un cerrado para la topologı́a de Zariski de los
K−definibles (definida por K[X1 , . . . , Xn ] sobre An (K)).
iv) Si K = K o si ζ = (z1 , . . . , zn ) ∈ K n entonces, el ideal mζ viene dado mediante:
mζ = (X1 − z1 , . . . , Xn − zn ) ⊆ K[X1 , . . . , Xn ],
y está generado por una familia de n polinomios de grado 1. Más aún, si f ∈
K[X1 , . . . , Xn ], entonces
f + mζ = f (ζ) + mζ = f (z1 , . . . , zn ) + mζ ,
en el anillo K = K[X1 , . . . , Xn ]/mζ .
Demostración. La primera parte sigue las mismas pautas de la prueba de la Proposición
7.2.23. Consideremos el morfismo de anillos:
evx : K[X1 , . . . , Xn ] −→ K
f 7−→ f (x).
Es claro, por los mismos argumentos de entonces, que mx ∈ Spec(K[X1 , . . . , Xn ]).
Para la segunda de las afirmaciones, obsérvese que si K es la clausura algebraica de K y si
x = (x1 , . . . , xn ), entonces los elementos x1 , . . . , xn son algebraicos sobre K. De hecho se
observa que
K(x1 , . . . , xn ) := {f (x1 , . . . , xn ) : f ∈ K[X1 , . . . , Xn ]},
es el menor cuerpo que contiene a K y a los elementos algebraicos {x1 , . . . , xn } (ver Problema
280). De hecho, observamos que la imagen de evx es precisamente el cuerpo K(x1 , . . . , xn ):
Im(evx ) = K(x1 , . . . , xn ).
Por tanto,
K[X1 , . . . , Xn ]/mx ∼
= Im(evx ) = K(x1 , . . . , xn ),
es un cuerpo y mx ∈ MaxSpec(K[X1 , . . . , Xn ]). Lo mismo para la segunda afirmación, puesto
que sólo hemos usado que las coordenadas del punto x son elementos algebraicos sobre K.
La tercera afirmación del enunciado sigue el mismo caso del ejemplo mostrado en prueba de la
afirmación iii) de la Proposición 7.2.23.
La cuarta afrmación es un sencillo ejericio de inducción que dejamos al lector, aplicando la
división por el polinomio mónico Xi − ζi como en el Teorema 1.4.15 (de la División Euclı́dea
por un polinomio mónico). 
358 7. GEOMETRÍA ALGEBRAICA: TOPOLOGÍA DE ZARISKI

7.3.4. Otras consecuencias de la argumentación noetheriana. La condición noethe-


riana es enriquecedora para elconocmiento de los cerrados de la topologı́a de Zariski en An (K):
Proposición 7.3.16. Con las notaciones de los Teoremas precedentes, se verifican las siguientes
dos propiedades:
i) Condición de Cadena Numerable Descendente (para cerrados):Toda ca-
dena descendente de cerrados para la topologı́a de Zariski de los K−definibles sobre
An (K) se estabiliza.
ii) Asumiendo el Axioma de Elección Dependiente,, todo conjunto no vacı́o de cerrados
Zariski posee elemento minimal para la inclusión.
Se dice que la topologı́a de Zariski en An (K) define un espacio topológico noetheriano por
satisfacer estas dos propiedades.
Demostración. Por simplicidad de la notación, escribamos I(W ) en lugar de IAn (K) (W )
para cada W ⊆ An (K). Para la afirmación i) consideremos una cadena descendente de cerrados
K− definibles en K[X1 , . . . , Xn ]:
V0 ⊇ V1 ⊇ V2 ⊇ · · · ⊇ Vm ⊇ · · · ,
y consideremos la correspondiente cadena de ideales de K[X1 , . . . , Xn ] conforme a la propiedad
i) de la Proposición 7.2.17 aplicada al caso A[X] = K[X1 , . . . , Xn ]:
IK (V0 ) ⊆ IK (V1 ) ⊆ IK (V2 ) ⊆ · · · ⊆ IK (Vm ) ⊆ · · · .
Por la condición de cadena ascendente numerable de ideales de K[X1 , . . . , Xn ], esta cadena se
estabiliza y existirán n0 ∈ N tal que IK (Vm ) = IK (Vn0 ) para cada n ≥ n0 . Pero por el Corolario
7.2.19, como todos los Vm son cerrados, se tendrá:
Vn0 = V (IK (Vn0 )) = V (IK (Vm )) = Vm , ∀m ≥ n0 .
Y la cadena se estabiliza a partir de n0 .
La afirmación ii) se sigue de modo similar al caso de ideales. Considerando un subconjunto
no vacı́o F de cerrados Zariski de X, si F no posee elemento minimal, entonces satisface la
hipótesis del Axioma de Elección Dependiente (cf. Axioma 3.3.1) para la relación R :=) (i.e.
la relación “contiene estrictamente”).
∀V ∈ F , ∃W ∈ F , V ) W.
En aplicación de ese axioma, existirá una cadena numerable tal que
V0 ) V1 ) V2 ) · · · ) Vm ) · · · .
Pero esto contradice la condición de cadena descendente para cerrados, probada en i). 

Proposición 7.3.17 (Componentes irreducibles de un cerrado de Zariski). Con las


notaciones de los Teoremas precedentes, se verifican las siguientes propiedades:
i) Toda variedad K−definible (cerrado en la topologı́a de Zariski de An (K) definida por
las variedades K−definibles ) es unión finita de irreducibles.
ii) Dado V ⊆ An (K) un cerrado K−definible, existe una descomposición en cerrados
irreducibles K−definibles:
(7.3.2) V = V1 ∪ . . . ∪ Vs ,
tal que V no se puede escribir como unión de una subfamilia propia de {V1 , . . . , Vs }.
Tal descomposición se llama minimal o irredundante.
iii) Dada una descomposición irredudante de V como en (7.3.2) no hay relación de in-
clusión entre cualesquiera dos irredubles de tal descomposición. Es decir, no existe
i, j ∈ {1, . . . , s} tales que i 6= j y Vi ⊆ Vj .
iv) Las descomposiciones irredundantes de variedades K−definibles en irreducibles son
únicas salvo permutación de las variedades {V1 , . . . , Vs }.
A tales descomposiciones se las denomina descomposición en irreducibles de V y a los cerrados
irreducibles K-definibles (únicos para cada V ) que aparecen en ella se los denomina componentes
irreducibles de V .
7.3. RUDIMENTOS DE GEOMETRÍA ALGEBRAICA 359

Demostración. Tenemos un claro argumento del estilo noetheriano: Razonemos por re-
ducción al absurdo y supongamos que existen cerrados Zariski K−definibles en An (K) que no
son unión finita de irreducibles. Entonces, el siguiente conjunto es no vacı́o:
F := {V ⊆ An (K) : V no es unión finita de irreducibles K−definibles}.
Como F es no vacı́o, ha de poseer algún elemento minimal. Si V es un elemento minimal de F ,
entonces no puede ser irreducible. Si fuera irreducible, serı́ una unión finita de irreducibles y,
por tanto, no podrı́a estar en F . Si no es irreducible, entonces es reducible y existirán W1 , W2
cerrados Zariski tales que
• V = W1 ∪ W2 ,
• Wi ( V , i ∈ {1, 2}.
Ahora bien, de la segunda de estas afirmaciones, como cada Wi está estrictamente contenido
en un elemento minimal de F es claro que Wi 6∈ F para i ∈ {1, 2}. Por tanto, cada Wi es
una unión finita de irreduciles. Pero, si ası fuera, como V es unión de W1 y W2 , entonces
también V es unión finita de irreducibles lo que significarı́a que V 6∈ F . Por tanto F debe ser
necesariamente vacı́o y, por tanto, todo cerrado Zariski K−definible de An (K) ha de ser unión
finita de cerrads irreducibles K−definibles.
Ahora consideremos, para una variedad V fijada, el siguiente conjunto de números naturales:
N (V ) := {s ∈ N : existe una descomposición de V como unión de s irreducibles}.
Hemos visto que N (V ) es un conjunto no vacı́o de números naturales y, por tanto, debe poseer
un mı́nimo. Sea r := min(N (V )) ese mı́nimos y existirá una descomposición de V como unión
de r cerrados irreducibles
V = V1 ∪ · · · ∪ Vr ,
de tal modo que no existe ningún subconjunto propio S ( {1, . . . , r} tal que
[
V = Vi .
i∈S

De existir, el lector fácilmente inferirá que entonces r no puede ser el mı́nimo de N (V ). Clara-
mente, no es posible que haya inclusiones entre dos variedades irreducibles Vi y Vj en la de-
scomposición precedente. De tener Vi ⊆ Vj podrı́amos escribir
[
V = Vk ,
k∈{1,...,r}\{i}

y tendrı́amos que V es unión finita de una subfamilia propia de {V1 , . . . , Vr } contraviniendo ii).
Con esto quedan probadas las afirmaciones i) a iii).
En cuanto a la afirmación iv), supongamos que tenemos dos descomposiciónes irredudantes de
V ⊆ An (K) :
(7.3.3) V = V1 ∪ · · · ∪ Vr = W1 ∪ · · · ∪ Ws .
Tendremos que para cada i
Vi := (Vi ∩ W1 ) ∪ (Vi ∩ W2 ) ∪ · · · (Vi ∩ Ws ).
Por ser irreducible, existirá j tal que Vi = Vi ∩ Wj ⊆ Wj . Ahora bien tenemos también
Wj = (Wj ∩ V1 ) ∪ · · · ∪ (Wj ∩ Vr ).
De nuevo, por ser Wj irreucible, habrá de existir t tal que Wj ∩ Vt ⊆ Vt . Esto nos lleva a una
cadena de contenidos
Vi = Vi ∩ Wj ⊆ Wj = Wj ∩ Vt ⊆ Vt .
Pero como la descomposición es irredundante, entonces t = i, lo que implicará:
Vi = Vi ∩ Wj ⊆ Wj = Wj ∩ Vi ⊆ Vi .
Serán todo igualdades y esto nos permite definir una aplicación:
σ : {1, . . . , r} −→ {1, . . . , s}
i 7−→ σ(i), Vi = Wσ(j) .
360 7. GEOMETRÍA ALGEBRAICA: TOPOLOGÍA DE ZARISKI

Del mismo modo podemos argumentar partiendo desde los Wj ’s y construir una aplicación
τ : {1, . . . , s} −→ {1, . . . , r}
j 7−→ τ (j), Wj = Vτ (i) .
Es fácil verificar que σ y τ son respectivamente una inversa de la otra y, por tanto, ambas son
biyecciones, r = s y las dos descomposiciones de (7.3.3) son la misma salvo permutación. 

Proposición 7.3.18. Con las notaciones precedentes, dado Y ⊆ An (K) un cerrado Zariski
K−definible de An (K) y dado un espacio recubridor de Y por abiertos Zariski de An (K): A :=
{Ai : i ∈ I}, entonces, A posee un subcubrimiento finito de Y . Es decir, con la topologı́a
inducida por la topologı́a de Zariski de los cerrados K−definibles de An (K), todo cerrado es
quasi-compacto.
Demostración. Veamos primero que X satisface la propiedad. Ası́ pues supongamos que
tenemos un recubrimiento de X por abiertos Zariski en la topologı́a de los K−definibles:
[
X= Ai .
i∈I

Consideremos la familia de cerrados dados por los complementarios de los abiertos Ai , es decir,
E := {Fi := An (K) \ Ai : i ∈ I}.
Y definamos el conjunto de las intersecciones finitas de los elementos de E :
\
F := { Fj : J ⊆ I, J es finito}.
j∈J

Obviamente F es no vacı́o y ha de poseer elemento minimal. Sea J ⊆ I un subconjunto finito


tal que la intersección
\
Fj ,
j∈J

es minimal en F . Tomemos, entonces, i ∈ I \ J y tendremos que


 
\ \ \
Fi  Fj  ⊆ Fj .
j∈J j∈J

Es claro que la primera de estas intersecciones también están en F , es decir,


 
\ \
Fi  Fj  ∈ F .
j∈J

Por tanto, como ∩j∈J Fj es minimal enF tendremos que


 
\ \ \
∀i ∈ I \ J, Fi  Fj  = Fj .
j∈J j∈J

Luego,
   
\ \ \ \ \
Fi =  Fi   Fj  = Fj .
i∈I i∈I\J j∈J j∈J

Finalmente, observamos que Fi := An (K) \ Ai y que An (K) =


S
i∈I Ai , luego
\ \
∅= Fi = Fj ,
i∈I j∈J

o, equivalentemente,
[ [
An (K) = Ai = Aj ,
i∈I j∈J
7.3. RUDIMENTOS DE GEOMETRÍA ALGEBRAICA 361

con lo que tenemos un subcubrimiento finito del original. Ahora procedemos del modo habitual
con compactos: dado Y ⊆ An (K) un cerrado Zariski K−definible y un recubrimiento de Y por
abiertos Zariski K−definible en An (K):
[
Y ⊆ Ai ,
i∈I
n
tenemos un cubrimiento por abiertos de A (K) dado mediante:
!
[ [
n
X = (A (K) \ Y ) Ai .
i∈I
n
Aplicando que A (K) satisface la existencia de un subcubrimiento finito, concluimos que Y
posee también un subcubrimiento finito, concluyendo el enunciado. 

El Teorema de Lasker-Noether (Teorema 6.3.23) y nuestro estudio del radical de un ideal (Sub-
sección 6.3.1) nos permite hacer alguna observación especial sobre los ideales asociados a var-
iedades K−racionales.
Proposición 7.3.19. Con las notaciones precedentes:
i) Si a ⊆ K[X1 , . . . , Xn ] es un ideal, entonces,

VAn (K) (a) = VAn (K) ( a).
ii) Los ideales de la forma IK (V ) ⊆ K[X1 , . . . , Xn ] son ideales radicales. Es decir,
p
IK (V ) = IK (V ).
iii) Existe una descomposición primaria irredundante de cada ideal IK (V ) dada por ideales
primos. Esto es, para cada V ⊆ An (K) existe una familia finita de ideales primos
{p1 , . . . , ps } ⊆ Spec(K[X1 , . . . , Xn ]) tales que pi 6= pj , para cada i 6= j, la siguiente
descomposición es irredudante:
(7.3.4) IAn (K) (V ) = p1 ∩ · · · ∩ ps .
De hecho, esta descomposicón es única, salvo permutación de los ideales primos in-
volucrados. Los primos asociados del anillos cociente por el ideal vienen dados por:
Ass(K[X1 , . . . , Xn ]/IK (V )) = {p1 , . . . , ps } ⊆ Spec(K[X1 , . . . , Xn ]).
iv) Los ideales de la forma IK (V ) no poseen primos inmersos y todos sus ideales primos
asociados son minimales. Es decir, no hay relación de inclusión entre los ideales de
la familia {p1 , . . . , ps }.
v) De hecho, si disponemos de una descomposición de V en componentes irreducibles
V = V1 ∪ · · · ∪ Vs ,
se tendrá que pi = IK (Vi ) ∈ Spec(K[X1 , . . . , Xn ]).
Demostración. La afirmación i) se sigue de la última afirmación de la Proposición 7.2.4.
Como K es cuerpo y no posee elementos nilpotentes no nulos, el lector puede fácilmente concluir
que los ideales de funciones que se anulan en cerrados en la topologı́a de Zariski son radicales.
El resto de las propiedades se siguen del hecho de ser un ideal radical y de los resultados
relativos al Teorema de Lasker-Noether visto en las subsecciones 6.3.1, ??, 6.3.4 y, en especial,
las Proposiciones ?? y ??. 

Observación 7.3.20 (Noetherianidad). Gran parte de las propiedades descritas en la an-


terior Proposición pueden hacerse sin necesidad de acudir al Teorema de Lasker-Noether. La
noetherianidad de la toplogı́a de Zariski de An (K) dada por los K−definibles, nos permite
concluir que para cualquier cerrado V ⊆ An (K) hay una descomposición irredundante en com-
ponentes irreducibles (Proposición 7.3.17). Consideremos tal descomposición irredundante (o
minimal) descrita en la Proposición 7.3.17:
(7.3.5) V := V1 ∪ · · · ∪ Vs .
362 7. GEOMETRÍA ALGEBRAICA: TOPOLOGÍA DE ZARISKI

Los cerrados Vi ’ son irreducibles, la descomposición es única(salvo permutación), no hay relación


de inclusión entre dos de ellos y V no puede obtenerse como unión de una subfamilia propia de
{V1 , . . . , Vs }. Por las propiedades del uso del operador IK tenemos que
(7.3.6) IK (V ) = IK (V1 ) ∩ · · · ∩ IK (Vs ).
Por la Proposición 7.3.14 sabemos que los ideales asociados a las variedades irreducibles son
ideales primos. Lugo tenemos una primera familia de ideales primos
{p1 , . . . , ps },
donde, para cada i, 1 ≤ i ≤ s, se tendrá.
pi = IK (Vi ).
Además, como cada Vi es cerrado para la topologı́a de Zariski se tiene:
Vi = VAn (K) (IK (Vi )).
Por tanto, para cada i, j, 1 ≤ i, j ≤ s, se tiene que pi 6= pj . Es decir los primos de esa familia
son todos distintos. Pero, además, no puede haber ningún subconjunto propio S ( {1, . . . , s}
tal que \
IK (V ) = pi .
i∈S
La razón es que eso supondrı́a la existencia de un ı́ndice j ∈ {1, . . . , s} \ S tal que
∩i∈S pi ⊆ pj .
Ahora bien, si una intersección de ideales están incluida en un ideal primo, alguno de ellos
debe estar incluido en ese ideal primo (recordar Proposición 4.2.12). Por tanto, si IK (V ) fuera
intersección de los primos indiciados por una subfamilia propia S ( {1, . . . , s}, deberı́an existir
i ∈ S y j ∈ {1, . . . , s} \ S tales que pi ⊆ pj . En ese caso,
Vj = VAn (K) (pj ) = VAn (K) (IK (Vj )) ⊆ VAn (K) (pi ) = VAn (K) (IK (Vi )) = Vi .
Concluirı́amos que hay relación de inclusión entre dos de las componentes irreducibles de V que
aparecen en la descomposición irredundante del idel IK (V ) (7.3.5), lo cual no es posible.
Por tanto, la descomposición descrita en la Identidad (7.3.6) es un descomposición primaria
irredudante, con todos los primarios siendo ideales primos y el resto se sigue con argumentos
que no necesitan de lo descrito en la Sección 6.3.
7.3.4.1. Proyección y contracción de ideales. Supongamos que K es un cuerpo
cualquiera, sea K su clausura algebraica. En la Proposición 1.4.9 de la Sección 1.4 introdujimos
la noción de contracción de un ideal
El siguiente resultado trata de expresar el significado geométrico de la contracción de ideales:
Proposición 7.3.21. Sea V ⊆ An+m (K) una variedad algebraica afı́n. Sea IK (V ) el ideal en
el anillo K[X1 , . . . , Xn , Y1 , . . . , Ym ] de los polinomios con coeficientes en K que se anulan en
V . Consideremos la proyección que “olvida” las últimas m coordenadas:
π: An+m (K) −→ An (K)
(x1 , . . . , xn , y1 , . . . , ym ) 7−→ (x1 , . . . , xn ).
Sea IK (V )c := IK (V ) ∩ K[X1 , . . . , Xn ] la contracción del ideal IK (V ). Entonces,
i) IK (π(V )) = IK (V )c .
z
ii) π(V ) = VA (IK (V )c ).
Demostración. Por la Proposición 7.3.11, es obvio que ii) se sigue de i). Para probar i)
veamos el doble contenido:
• Si f ∈ IK (V )c = IK (V ) ∩ K[X1 , . . . , Xn ] y si x ∈ π(V ), entonces es porque existe y ∈
Am tal que (x, y) ∈ V , pero como f ∈ IK (V ) f (x, y) = 0. Ahora bien, f no depende
de las variables {Y1 , . . . , Ym } (porque está en K[X1 , . . . , Xn ]) luego f (x, y) = f (x) = 0
y concluimos que f se anula en π(V ), es decir, f ∈ IK (π(V )).
• Para el otro contenido, si g ∈ IK (π(V )), entonces g ∈ K[X1 , . . . , Xn ] y para cada
x ∈ π(V ) se tiene g(x) = 0. Basta con ver que g ∈ IK (V ). Pero si (x, y) ∈ V ,
entonces, como g no depende de las variables {Y1 , . . . , Ym }, g(x, y) = g(x) y como
x ∈ π(V ) concluimos que g(x, y) = g(x) = 0 y g ∈ IK (V ).
7.4. VARIEDADES PROYECTIVAS E IDEALES HOMOGÉNEOS 363

Corolario 7.3.22. Con las notaciones de loa Proposición precedente, si V ⊆ An+m (K) es una
z
variedad algebraica K−definible e irreducible, entonces π(V ) es también irreducible.
Demostración. La prueba es inmediata por la proposición precedente y la Proposiciń
7.3.14, sabemos que IK (V ) es un ideal primo en K[X1 , . . . , Xn , Y1 , . . . , Ym ]. Por la Proposición
4.2.6, sabemos que la contracción de un ideal primo es también primo. Por tanto, IK (V )c es
z
un ideal primo en K[X1 , . . . , Xn ]. Por tanto, π(V ) es una variedad algebraica irreducible. 

7.4. Variedades algebraicas en el espacio proyectivo: Ideales homogéneos


No podemos acabar sin citar un ejemplo más de variedades (en el sentido de conjuntos de ceros)
que son esenciales para entender la Geometrı́a: Las variedades algebraicas proyectivas.
Comencemos recordando el espacio proyectivo ya descrito en el Problema 19. Sea K un cuerpo
y K una extensión algebraicamente cerrada. Consideremos el espacio vectorial Kn+1 , el sub-
conjunto Kn+1 \ {0} y la relación de equivalencia sobre Kn+1 \ {0} dada mediante:
x ∼ y ⇐⇒ ∃λ ∈ K, x = λy.
Esta relación de equivalencia es el el resultado de la acción
 de K× = K \ {0} sobre Kn+1 \ {0}
n+1
(cf. Problema 19). El conjunto cociente K \ {0} / ∼ se denomina espacio proyectivo de
dimensión n sobre K y se denota mediante Pn (K) 2. Nótese que se trata de la colección de
todos los subespacios vectoriales de dimensión 1 de Kn+1 vistos como objeto geométrico. La
condición “dimensión 1” es crucial, de ahı́ que se descarte el origen 0 ∈ Kn+1 en la definición
de la acción.
Puede que el lector no iniciado tenga alguna dificultad en entender por qué trabajar con espacios
proyectivos en lugar de los espacios afines introducidos en la sección precedente. Es posible que
las notas que siguen no le aclare completamente esas dudas pero, al menos, interaé explicar
cómo el espacio proyectivo “completa” al espacio afı́n añadiendo las direcciones que se ubicarán
en un hiperplano del “infinito” de gran utilidad y sentido clásico. Para más detalles, habrá que
avanzar en el texto y entender mejor la interacción entre la Geometrı́a Algebraica en el espacio
afı́n y en espacio proyectivo.
Para intentarlo, podemos considerar la proyección canónica
π : Kn+1 \ {0} −→ Pn (K).
A los puntos π(x0 , x1 , . . . , xn ) los representaremos mediante (x0 : x1 : · · · : xn ) al estilo de
la escuela “francesa”, aunque algunos autores prefieren la notación [x0 : · · · : xn ]. A las
“coordenadas” de esta presentación del punto proyectivo (x0 : · · · : xn ) ∈ Pn (K) se las denomina
coordenadas homogéneas del punto.
Consideremos ahora la siguiente transformación:
ϕ0 : An (K) −→ Pn (K)
(7.4.1)
(x1 , . . . , xn ) 7−→ (1 : x1 , . . . , xn ).
La primera observación es que esta aplicación está bien definida, justamente por la forma de
las coordenadas homogéneas. Pero, además, es inyectiva:
Dados x := (x1 , . . . , xn ), y := (y1 , . . . , yn ) ∈ An (K), si ϕ0 (x) = ϕ(y), entonces, existe λ ∈ K\{0}
tal que en Kn+1 se verifica:
λ(1, x1 , . . . , xn ) = (1, y1 , . . . , yn ).
Pero, entonces, λ = 1 (por la coordenada 0−ésima) y tendremos (1, x1 , . . . , xn ) = (1, y1 , . . . yn ).
Lo que hemos oobtenido es una inmersión del espacio afı́n An (K), identificádolo con un conjunto
de puntos proyectivos que se caracterzan de modo sencillo con la siguiente igualdad:
ϕ0 (An (K)) = {(x0 : · · · : xn ) ∈ Pn (K) : x0 6= 0}.

2Otras notaciones que se encuentran en la literatuyra son: KPn , Pn K, etc... Nosotros mantendremos la
propuesta Pn (K).
364 7. GEOMETRÍA ALGEBRAICA: TOPOLOGÍA DE ZARISKI

Nótese que si nos dan (x0 : · · · : xn ) ∈ Pn (K) con x0 6= 0 es inmediata comprobar que:
x1 xn
(x0 : · · · : xn ) = ϕ0 ( , . . . , ),
x0 x0
y es que la condición x0 6= 0 nos permite dar sentido a la anti-imagen del punto proyectivo a
partir de un punto afı́n. Como veremos después, la condición x0 6= 0 nos permitirá interpretar
ϕ0 (An (K)) como un abierto en ∓n (K) que algunos autores tienden a llamar los puntos a dis-
tancia finita, aunque esa idea de distancia finita sea un poco irreal en este contexto. En todo
caso, son puntos afines con respecto a la inmersión ϕ0 .
Obviamente, los puntos que no están en ϕ0 (An (K)) se caracterizan mediante las siguientes
igualdades:
(0)
H∞ := Pn (K) \ ϕ0 (An (K)) = {(x0 : · · · : xn ) ∈ Pn (K) : x0 = 0}.
En la presentación clásica de la geometrı́a afı́n, que el lector he recibido seguramente, los
puntos de An (K) se presentan mediante (1, x1 , . . . , xn ) mientras que las “direcciones” se suelen
representar mediante (0, v1 , . . . , vn ). Se hacı́a de tal modo que una recta afı́n, por ejemplo, se
representa mediante
r := {(1, x1 , . . . , xn ) + t(0, v1 , . . . , vn ) ∈ {1} × Kn : t ∈ K},
o también mediante
r := {1, x1 + tv1 , . . . , xn + tvn ) ∈ {1} × Kn : t ∈ K},
observando que la dirección (0, v1 , . . . , vn ) depende solamente del subespacio vectorial de di-
mensión 1, Kh(0, v1 , . . . , vn )i, generado por (0, v1 , . . . , vn ) ∈ {0} × Kn . Se distinguı́a entonces,
por razones de elegancia, entre el punto afı́n (1, x1 , . . . , xn ) y las direcciones (0, v1 , . . . , vn ). En
(0)
este sentido el hiperplano H∞ “recoge” todas las direcciones de rectas del espacio afı́n y, en un
sentido más estético que formal, las “pone en el infinito”. De ahı́ que ese espacio de direcciones
(0)
de rectas afines H∞ se llame hiperplano en el infinito.
En los casos K = R ∨ C, por ejemplo,la proyección canónica π : Kn+1 \ {0} −→ Pn (K) induce
una topologı́a cociente en Pn (K). La imagen del espacio afı́n ϕ0 (An (K)) será un abierto, es esos
(0)
casos, y el hiperplano en el infinito H∞ será un cerrado. Es sencillo verificar que, en ambos
casos, la imagen del espacio afı́n ϕ0 (An (K)) es denso para la topologı́a cociente en Pn (K) y,
en un cierto sentido en estos casos particulares, hay sucesiones (xm )m∈N de puntos afines (en
(0)
ϕ0 (An (K))) que tienden a las direcciones en H∞ cuando m 7→ ∞. En ese sentido, en los casos
K = R ∨ C, uno puede ver la asintótica y la convergencia “en el infinito” (o hacia puntos en el
infinito, que serı́a más correcto), como en el caso de las ası́ntotas que los alumnos recordraán
(0)
de sus cursos más elementales de Secundaria. En algún sentido es en H∞ donde viven las
ası́ntotas (verticales, horizontales u oblicuas), que se vuelven “alcanzables”.
Obviamente, la elección de la coordenada 0 en la definición de ϕ0 (en la Ecuación (7.4.1))
es una elección arbitraria. Igualmente podrı́amos haber elegido unicar el 1 en cualquier otra
coordenada distinta a la 0−ésima, dando lugar a las correspondentes inmersiones {ϕ0 , . . . , ϕn }.
Son inmersiones del espacio afı́n en el proyectivo Pn (K) que identifican An (K) con un “abierto”
para cada i, 0 ≤ i ≤ n:
ϕi (An (K)) = {(x0 : · · · : x0 ) ∈ Pn (K) : xi 6= 0}.
A su vez cada una de estas inmersiones define un hiperplano en el infinito
(i)
(7.4.2) H∞ := {(x0 : · · · : xn ) ∈ Pn (K) : xi = 0}.
Estas diversas inmersiones definen un cubrimiento de Pn (K) por una familia de n + 1 abiertos:
n
[
(7.4.3) Pn (K) = ϕi (An (K)) = ϕ0 (An (K)) ∪ · · · ∪ ϕ0 (An (K)),
i=0

que le confiere una instintiva naturaleza de vareidad topológica y deferenciable, término que
sólo tiene sentido natural cuando K = R ∨ C.
De todos modos, no era el propósito de estas primeras palabras el hacer una inmersión en
Geometrı́a Proyectiva sino, en todo caso, ilustrar el objeto antes de pasar a interpretar los
7.4. VARIEDADES PROYECTIVAS E IDEALES HOMOGÉNEOS 365

objetos llamados variedades algebracas proyectivas que haremos a continuación. Dejaremos


para más adelante otras discusiones al respecto.
Dado un subconjunto A ⊆ Pn (K) podemos considerar la imagen inversa por la proyección
canónica π. Es decir,
π −1 (A) := {(x0 , . . . , xn ) ∈ Kn+1 \ {0} : π(x0 , . . . , xn ) = (x0 : · · · : xn ) ∈ A}.
Por cuestiones estéticas, añadiremos el origen a esta imagen inversa y definimos:
Definición 95 (Conos proyectantes y Conos Afines). Llamaremos cono proyectante sobre
A ⊆ ¶n (K) al conjunto definido por la siguiente igualdad: cono proyectante
e := π −1 (A) ∪ {0} ⊆ Kn+1 .
A

∅ = {0}, donde 0 ∈ Kn+1 , es el cono proyectante sobre el conjunto vacı́o de


En particular, e
puntos proyectivos.
Llamaremos cono afı́n a todo subconjunto C ⊆ Kn+1 que verifica la siguiente propiedad cono
afı́n:
∀λ ∈ K, ∀x ∈ A,
e λx ∈ A.e
Diremos que un cono C ⊆ Kn+1 es propio si C ( Kn+1 .

Obviamente, los conos proyectantes sobre subconjuntos de ¶n (K) son conos afines en Kn+1 .
En ciertos casos, tenemos una presentación del espacio que le confiere una estructura de variedad
diferenciable real o compleja. Que resultará variedad de Riemann en el caso K = R y variedad
de Kähler en el caso K = C.
• En el caso real, podemos identificar isométricamente (como variedades de Riemann)
Pn (R) con el cociente S n /S 0 , entendiendo por S 0 := {±1} la versión multiplicatica del
grupo abeliano Z/2Z y la relación “ser puntos antipodales”. En esta caso, un punto
proyectivo representa dos puntos sobre S n .
• En el caso complejo, identificamos Pn (C) con el coenciente S 2n+1 /S 1 , donde S 2n+1
es la esfera unidad en Cn+1 con la métrica hermı́tica canónica y S 1 es visto como el
grupo de los números complejos de valor absoluto 1, actuando sobre S 2n+1 . En este
caso un punto en Pn (C) representa un gran cı́rculo (una geodésica) en S 2n+1 .
En nuestro contexto, estamos especialmente interesados en aquellos subconjuntos de espacio
proyectivo Pn (K) que puedan ser dados implı́citamente por ecuaciones. En eso nos ayudan los
polinomios homogéneos.
Dado f ∈ K[X0 , . . . , Xn ] y consideremos la función polinomial que define:
f : An+1 (K) −→ K.
Observamos que esta función no siempre es “trasladable” al espacio proyectivo. La “traslación”
de la idea necesita alguna reflexión adicional. Pero, si suponemos que f ∈ Hd (X0 , . . . , Xn ) es
un polinomio homogéneo de grado d (cf. Proposición 1.4.40). Entonces, para todo λ ∈ K× y
para todo x ∈ An+1 (K) \ {0} observamos que se tiene la igualdad siguiente:
f (λx) = λd f (x).
Por tanto, dados dos puntos x e y que definen el mismo punto proyectivo π(x) = π(y) ∈ Pn (K)
tenemos claramente que para todo f ∈ Hd (X0 , . . . , Xn ) se tiene
f (x) = 0 ⇐⇒ f (y) = 0.
Esto nos permite definir la noción de hiper-superficie proyectiva del modo siguiente:

Definición 96 (Hiper-superficie algebraica proyectiva). Como en Secciones precedentes,


des K un cuerpo y sea K su clausura algebraica. Dado un polinomio homogéneo f ∈ Hd (X0 , . . . , Xn ) ⊆
K[X1 , . . . , Xn ] se denomina hiper-superficie proyectiva de los ceros de f al subconjunto del es-
pacio proyectivo definido del modo siguiente:
VPn (K) (f ) := {(x0 : · · · : xn ) ∈ Pn (K) : f (x0 , . . . , xn ) = 0}.
366 7. GEOMETRÍA ALGEBRAICA: TOPOLOGÍA DE ZARISKI

Con las mismas notaciones, llamaremos abierto algebraico proyectivo distinguido definido por
f ∈ Hd (X0 , . . . , Xn ) ⊆ K[X1 , . . . , Xn ] al conjunto dado mediante la siguiente igualdad:
OPn (K) (f ) := {(x0 : · · · : xn ) ∈ Pn (K) : f (x0 , . . . , xn ) 6= 0} = Pn (K) \ VPn (K) (f ).
Usualmente, y cuando el espacio Pn (K) esté fijado por el contexto, escribiremos simplemente
VP (f ) y OP (f ).

Observación 7.4.1. Simplemente obsérvese que, entre las hiper-superficies algebraicas proyec-
(i)
tivas, se encuentran los hiperplanos del infinito H∞ , con 0 ≤ i ≤ n definidos en la Ecuación
(7.4.2). Dado que son dados por ecuaciones lineales se suele decir hiper-superficie lineal o,
simplemente, hiperplano proyectivo.
Por su parte, las imágenes del espacio afı́n ϕi (An (K)) ⊆ Pn (K) por la diversas inmersiones
destacadas anterior mente, son abiertos distinguidos en Pn (K):
ϕi (An (K)) = OPn (K) (Xi ), ∀i, 0 ≤ i ≤ n.

Ejemplo 7.4.2 (Formas cuadráticas y cuádricas proyectivas). A estas alturas de la for-


mación de un matemático, ya suele estar familiarizado con el término “forma cuadrática”. Una
forma cuadrática con coeficientes en un cuerpo K es una expresión del tupo siguiente:
X
q(X0 , . . . , Xn ) := ai,j Xi Xj ∈ K[X0 , . . . , Xn ].
0≤i,j≤n

La expresión “forma” viene del latı́n y ha sido el término clásico para designar a los polinomios
homogéneos. El término “forma cuadrática” hace referencia a un polinomio homogéneo de
grado 2 y, por tnto, como se puede fácilmente observar, q ∈ H2 (X0 , . . . , Xn ) es un polinomio
homogéneo de grado 2.
Por su parte, la hiper-superficie proyectiva definida por una forma cuadrática se suele denominar
“cuádrica proyectiva” y no es otra cosa que una variedad K−definible
VPn (K) (q), q ∈ H2 (X0 , . . . , Xn ).
Por razones de simplicidad (y por el Lema de Cancelación de Witt sobre cuerpos realmente cer-
rados) se suelen estudiar principalmente las cuádricas proyectivas reales, pero, en nuestro caso,
nos ocupamos de la variedad proyectiva sobre un cuerpo algebraicamente cerrado. Es sencillo
recordar que si la caracterı́stica del cuerpo es distinta de 2, salvo un cambio de coordenadas
definido por un polinomio P ∈ GL(n + 1, K), toda cuádrica es equivalente a una cuádrica de
la forma:
VPn (K) (q),
donde q tiene la forma:
X r
q(X0 , . . . , Xn ) = ai Xi2 ,
i=0
donde r ≤ n, ai ∈ K. En el caso K = K, la forma se puede refinar a una forma cuadrática q
del tipo
r
X
q(X0 , . . . , Xn ) = Xi2 ,
i=0
con r ≤ n.

Como en el caso afı́n no sólo tendremos hiper-superficies sino que tendremos toda una topologı́a
de Zariski en Pn (K), justificando el término “abierto distinguido” usado anteriormente. Pero
necesitaremos analizar un poco má el tipo de ideale que nos hacen funcionar en este caso.
Comencemos recordando la descomposición en suma directa del anillo de polinomios con coefi-
cientes en un cuerpo hecho en la Proposición 1.4.40:
(7.4.4) K[X0 , . . . , Xn ] = ⊕d∈N Hd (X0 , . . . , Xn ),
donde la suma directa descrita por el sı́mbolo ⊕ es suma directa como subespacios del K−espacio
vectorial K[X0 , . . . , Xn ]. Observemos que los subespacios Hd verifican la siguiente propiedad:
(7.4.5) Hd (X0 , . . . , Xn )Hk (X0 , . . . , Xn ) ⊆ Hd+k (X0 , . . . , Xn ),
7.4. VARIEDADES PROYECTIVAS E IDEALES HOMOGÉNEOS 367

con la operación producto de polinomios. O, equivalentemente,


∀f ∈ Hd (X0 , . . . , Xn ), ∀g ∈ Hk (X0 , . . . , Xn ) =⇒ f g ∈ Hd+k (X0 , . . . , Xn ).
La demostración es inmediata recordando la multiplicación de polinomios y que ni K[X0 , . . . , Xn ]
(ni K) poseen divisores de cero. Recuérdese la Proposición 1.4.40.
Dado un polinomio f ∈ K[X0 , . . . , Xn ] no nulo, existe una familia finita única de polinomios
homogéneos tal que
f = f0 + f1 + · · · + fd , fi ∈ Hi (X0 , . . . , Xn ), fd 6= 0.
Esto es consecuencia inmediata de la descomposición de K[X0 , . . . , Xn ] como suma directa de
subespacios. A cada polinomio homogéneo fi ∈ Hi (X0 , . . . , Xn ) que aparece en esa descripción
de f como suma de homogéneos se le denomina componente homogénea de f grado i.

Proposición 7.4.3. Sea K un cuerpo R := K[X0 , . . . , X] el anillo de polinomios en n+1


variables con coeficientes en K. Sea a ⊆ K[X0 , . . . , Xn ]. Las siguientes propiedades son equiv-
alentes:
i) El ideal a está generado por una familia finita de polinomios homogéneos.
ii) El ideal a está generado por una familia cualquier H de polinomios nomogéneos, es
decir,
[
H⊆ Hd (X0 , . . . , Xn ),
d∈N
y a = (H).
iii) El ideal a satisface
a = ⊕d∈N (a ∩ Hd (X0 , . . . , Xn )) ,
donde ⊕ representa suma directa de subespacios vectoriales del K−espacio vectorial
K[X0 , . . . , Xn ].
iv) Dado f ∈ a y dada la descomposición de f en componentes homogéneas
f = f0 + · · · + fd , fi ∈ Hi (X0 , . . . , Xn ),
entonces fi ∈ a.
Demostración. Probemos las distintas implicaciones:
• i) =⇒ ii): Obviamente.
• ii) =⇒ iii): Supongamos que a = (H) está generado por una familia de polinomios
H := {fi : i ∈ I},
de tal modo que cada fi es homogéneo de grado di , es decir,
fi ∈ Hdi (X0 , . . . , Xn ), ∀i ∈ I.
Consideremos los subespacios vectoriales contenidos en el ideal a:
ad := a ∩ Hd (X0 , . . . , Xn ).
Consideremos el subespacio suma de los subespacios ad , que es suma directa por serlo la
descomposición original de K[X0 , . . . , Xn ] (Identidad (7.4.4)). Es decir, consideramos:
M X
ad = ad ,
d∈N d∈N

donde la suma es como subespacios vectoriales del K−espacio vectorial K[X0 , . . . , Xn ].


Como a es ideal en K[X0 , . . . , Xn ] también es subpespacio vectorial y como ad ⊆ a,
obviamente se tiene: M X
ad = ad ⊆ a.
d∈N d∈N
Por otro lado, consideremos g ∈ a. Entonces, existirá J ⊆ I un subconjunto finito, y
una familia cualquiera de polinomios {gj : j ∈ J} de tal modo que:
X
g= gj fj .
j∈J
368 7. GEOMETRÍA ALGEBRAICA: TOPOLOGÍA DE ZARISKI

Descompongamos cada gj es sus componentes homogéneas, conforme a la suma directa


descrita en la Ecuación (7.4.4), podemos descomponer cada uno de los polinomios gi
es sus componentes homogéneas:
gj := gj,0 + gj,1 + · · · + gj,tj , ∀j ∈ J, gj,tj 6= 0,
donde gj,k ∈ Hk (X0 , . . . , Xn ). Por la inclusión descrita en la Identidad (7.4.5), ten-
dremos que para cada j ∈ J y para cada k ∈ {0, . . . , tj } se tiene:
gj,k fj ∈ Hdj +k (X0 , . . . , Xn ).
Pero, como a es un ideal y fj ∈ a, también se tiene que gk,j fj ∈ a. En otras palabras
tenemos:
gj,k fj ∈ a ∩ Hdj +k (X0 , . . . , Xn ) = adj +k , ∀j ∈ J, ∀k ∈ {0, . . . , tj }.
Finalmente, observemos que
tj
X XX
g= gj fj = gj,k fj .
j∈J j∈J k=0

Como J es un conjunto finito, concluimos que g es una suma finita de elementos en


varios subespacios de la forma ar , es decir,
[ X
g ∈ Kh ad i = ad = ⊕d∈N ad .
d∈N d∈N
Lo que significa que
a ⊆ ⊕d∈N ad .
Como ya habı́amos probado el otro contenido, tendremos probada la afirmación iii) a
partir de ii).
• iii) =⇒ iv): Es esencialmente obvio y está implı́cito en la descomposición de a como
suma directa de subespacios vectoriales. Supongamos, con las notaciones de la prueba
de la impicación precedente, que tenemos
a = ⊕d∈N ad .
Y supongamos que f ∈ a un elemento no nulo. Tendremos una descomposición de f
como suma de elementos de esta suma directa:
f = g0 + · · · + gt ,
donde gi ∈ ai y gt 6= 0. Entonces deg(f ) = deg(gt ) = t. De otro lado, tenemos su
descomposición a través de sus componentes homogéneas
f = f0 + · · · + ft ,
con ft 6= 0, donde ya hemos usado que f tiene grado t. Pero, entonces, tenemos la
siguiente identidad:
0 = (g0 − f0 ) + (g1 − f1 ) + · · · + (gt − ft ),
válida en la suma directa de K−espacios vectoriales ⊕d∈N Hs (X0 , . . . , Xn ) y con la
propiedad gi − fi ∈ Hi (X0 , . . . , Xn ). Entonces,
fi = gi , ∀i ∈ {0, . . . , t},
y concluimos que fi ∈ ai ⊆ a para comoponente homogénea de grado i de f , como
buscábamos.
• iv) =⇒ i): Supongamos que se verifica iv). Por el Basissatz de Hilbert (Teorema ??),
a es un ideal finitamente generado. Supongamos que G := {g1 , . . . , gr } generan el ideal
a. Es decir,
a = (g1 , . . . , gr ).
Por la descomposición descrita en la Ecuación (7.4.4) podemos descomponer cada uno
de los polinomios gi es sus componentes homogéneas:
gi := gi,0 + gi,1 + · · · + gi,di , 1 ≤ i ≤ r.
Por la propiedad iv) dado que cada gi ∈ a, concluimos que
{gi,j : 1 ≤ i ≤ r, 0 ≤ j ≤ di } ⊆ a.
7.4. VARIEDADES PROYECTIVAS E IDEALES HOMOGÉNEOS 369

Entonces, el ideal que generan estas componentes homogéneas también estarán con-
tenido en el ideal a. Es decir,
b := ({gi,j : 1 ≤ i ≤ r, 0 ≤ j ≤ di }) ⊆ a.
Pero, obviamente, cada uno de los gi ’s está en el ideal b porque cada gi es suma de
elementos de b. Es decir,
{g1 , . . . , gr } ⊆ b := ({gi,j : 1 ≤ i ≤ r, 0 ≤ j ≤ di }) ⊆ a.
Entonces, el ideal que generan los gi ’s también estará contenido en b y habremos
concluido:
a = (g1 , . . . , gr ) ⊆ b := ({gi,j : 1 ≤ i ≤ r, 0 ≤ j ≤ di }) ⊆ a.
Por tanto, a = b y a está generado por la familia finita siguiente que está formada
solamente por polinomios homogéneos:
{gi,j : 1 ≤ i ≤ r, 0 ≤ j ≤ di }.
Y tenemos probado i).


Definición 97 (Ideal Homogéneo). Llamaremos ideal homogéneo (o graduado) en el anillo


de polinomios K[X0 , . . . , Xn ] a todo ideal propio a ( K[X0 , . . . , Xn ] generado por una fa-
milia finita de polinomios homogénos (o, equivalentemente, que satisface una cualquiera de las
propiedades descritas en la Proposición 7.4.3 precedente).

Observación 7.4.4. Como se observa, excluimos de entre los ideales homogéneos al ideal
K[X0 , . . . , Xn ] y nos restringimos solamente a ideales propios. No es un restricción significativa,
pero facilita la coherencia de lo que sigue.

Definición 98 (Variedad algebraica proyectiva K−definible). Llamaremos variedad al-


gebraica projectiva K−definible en Pn (K) a la intersección de cualquier familia (finita o infinita)
de hiper-superficies algebraicas proyectivas. Esto es, a cualquier subconjunto V ⊆ Pn (K) tal que
existe un conjunto cualquier de polinomios homogéneos H ⊆ K[X0 , . . . , Xn ] tal que
\
V = VPn (K) (f ) = VPn (K) (H).
f ∈H

Cnuando no haya confusión sobre el cuerpo K o la dimensión n del espacio proyectivo sobre el
que se trabaja, escribiremos simplemente VP (H).

Definición 99 (Variedad proyectiva de los ceros de un ideal homogéneo). Con las


notaciones precedentes, sea K un cuerpo, K su clasura Zariski y sea a ( K[X0 , . . . , Xn ] un
ideal homogéneo. Consideremos H(a) el conjunto de todos los polinomios homogéneos de a. Es
decir, consideramos [
H(a) = ad ,
d∈N
donde, como en la Proposición precedente, ad := a ∩ Hd (X0 , . . . , Xn ). Llamamos variedad
algebraica proyectiva definida por el ideal a a la variedad algebraica proyectiva siguiente:
\
VPn (K) (a) = VPn (K) (H(a)) = VPn (K) (a).
f ∈H(a)

Obsérvese que H(a), mencionado en la Definición 99, es una familia de polinomios homogéneos,
no necesariamente finita, que generan a como ideal. De hecho, se tiene que
!
\ [ [
H(a) = a Hd (X0 , . . . , Xn ) = ad ,
d∈N d∈N

y el apartado iii) de la citada Proposición implica que H(a) genera a como K−espacio vectorial
y, por ende, como ideal de K[X0 , . . . , Xn ].
370 7. GEOMETRÍA ALGEBRAICA: TOPOLOGÍA DE ZARISKI

Proposición 7.4.5 (Variedades proyectivas e ideales homogéneos). Sea a ⊆ K[X0 , . . . , Xn ]


un ideal homogéneo. Y sea H y G dos conjuntos de generadores de a formados por elementos
homogéneos. Entonces, se tiene:
VPn (K) (G) = VPn (K) (H).
Por tanto, la variedad proyectiva de los ceros del ideal a satisface:
VPn (K) (a) = VPn (K) (H),
donde H está formado únicamente de polinomios homogéneos y a = (H).
En particular, toda variedad algebraica proyectiva es intersección de una familia finita de hiper-
supercies proyectivas.
Demostración. Supongamos a = (F) = (H) dos sistemas de generadores del ideal
a. Dado f ∈ F, entonces exiten g1 , . . . , gs ∈ H y polinomios cualesquiera h1 , . . . , hs ∈
K[X0 , . . . , Xn ] tales que
f = h1 g1 + · · · + hs gs .
Consideremos un punto proyectivo
x = (x0 : · · · : xn ) ∈ VPn (K) (H) ⊆ Pn (K).
Entonces, los polinomios g1 , . . . , gs ∈ H se anulan en cualquier punto afı́n asociado (y0 , · · · , yn ) ∈
Kn+1 \ {0} tal que π(y0 , . . . , yn ) = (x0 : · · · : xn ) ∈ Pn (K). Por tanto,
f (y0 , . . . , yn ) = h1 (y0 , . . . , yn ) · 0 + · · · + hs (y0 , . . . , yn ) · 0 = 0.
Como f es homogéneo tiene sentido considerar VPn (K) (f ) y habremos probado que
VPn (K) (H) ⊆ VPn (K) (f ), ∀f ∈ F,
o, equivalentemente, hemos probado que
VPn (K) (H) ⊆ VPn (K) (F).
El otro contenido se sigue análogamente.
La segunda afirmación se sigue del hecho de que el conjunto H(a) ⊆ a, mencionado en la
Definición 99, genera el ideal a.
Obviamente, esto da sentido a considerar los conjuntos VPn (K) (a) y, por la afirmación del ı́tem
i) de la Proposición 7.4.3 precedente, el ideal a posee un sistema generador finito y, por tanto,
VPn (K) (a) es una intersección finita de hipersuperficies. 

Observación 7.4.6. Obsérvese que hemos probado que si a ⊆ K[X0 , . . . , Xn ] es un ideal


homogéneo, x ∈ VPn (K) es un punto proyectivo e y ∈ Kn+1 \{0} es un punto afı́n tal que π(y) = x,
entonces, para cualquier polinomio f ∈ a se tiene que f (y) = 0 porque sus componentes
homogéneas se anulan todas en y. Esto no funciona igual para ideales cualesquiera.

Proposición 7.4.7 (Conos proyectantes). Sea a ( K[X0 , . . . , Xn ] un ideal homogéneo. Se


tiene:
i) Se verifica
a ⊆ (X0 , . . . , Xn ).
Además VPn (K) (X0 , . . . , Xn ) = ∅.
ii) Sea a ( K[X0 , . . . , Xn ] un ideal homogéneo y sea V = VPn (K) (a) la variedad proyectiva
definida por a. Sea Ve = π −1 (V ) ∪ {0} ⊆ Kn+1 el cono proyectante sobre V , entonces
Ve = VA (a).
Es decir los conos proyectantes sobre variedades algebraicas proyectivas son variedades
algebraicas afines.
iii) Sea C ⊆ Kn+1 una variedad algebraica afı́n K−definible. Si C es un cono afı́n propio,
entonces IK (C) es un ideal homogéneo. Además, si W = VPn (K) (IK (V )) ⊆ Pn (K) es
la variedad proyectiva asociada a ese ideal homogéneo, entonces el cono C verifica:
W
f = C.
7.4. VARIEDADES PROYECTIVAS E IDEALES HOMOGÉNEOS 371

En conclusión, tenemos una biyección entre los conos afines propios V ⊆ Kn+1 que son
variedades algebraicas K−definibles y las variedades algebraicas proyectivas K−definibles en
Pn (K).
Demostración. La afirmación i) es inmediata. Nótese que si a es homogéneo y es propio
(i.e. si a 6= K[X0 , . . . , Xn ]) está generado por una familia de polinomios homogéneos. Pero no
contiene a ningún polinmio homogéneo no nulo de grado 0 por ser ideal propio. Por tanto a está
generado por polinomios homogéneos de grado al menos 1. A su vez, los polinomios homogéneos
de grado al menos 1 son combinaciones lineales, con coeficientes en K, de monomios de grado
al menos 1. Y los monomios de grado al menos 1 son divisibles por alguna de las variables en
el conjunto {X0 , . . . , Xn } lo que conduce a la afirmación, para un ideal heomogéneo a:
a 6= K[X0 , . . . , Xn ] =⇒ a ⊆ (X0 , . . . , Xn ).
La afirmación sobre el vacı́o como variedad algebraica proyectiva es obvia.
Para la afirmación ii), es claro que si V = VPn (K) (a) y si x ∈ Ve \ {0} , entonces f (x) = 0 para
todo f ∈ a homogéneo. Pero como los ceros afines de un ideal coinciden con los ceros afines de
cualquiera de sus sistemas de generadores (cf. Proposición 7.2.3 Proposición 7.3.5), y a es un
ideal homogéneo, entonces entonces x ∈ VA (a). Además, como a es un ideal homogéneo y es
propio, a ⊆ (X0 , . . . , Xn ) y, por tanto, 0 ∈ VA (a). En suma, tenemos
Ve = π −1 (V ) ∪ {0} ⊆ VA (a).
En cuanto al recı́proco, si x ∈ VA (a) y x 6= 0, supongamos que las coordenadas afines de x
vienen dadas por x = (x0 , . . . , xn ) ∈ Kn+1 \ {0}. Sea π(x) = (x0 : · · · : xn ) ∈ Pn (K) el punto
proyectivo asociado. Como f (x0 , . . . , xn ) = 0 para cada f ∈ a, entonces f (x0 , . . . , xn ) = 0
para cualquier polinomio homogéneo en a por lo que (x0 : · · · : xn ) ∈ VPn (K) (a). Por tanto
x ∈ π −1 (V ). Como a es homogéneo propio, 0 ∈ VA (a) y habremos probado que
VA (a) ⊆ Ve = π −1 (V ) ∪ {0}.
Y tenemos la igualdad.
La afirmación iii) es la que requiere de un poco más de reflexión. Supongamos que V es un
cono afı́n propio con respecto a K (i.e. λx ∈ V, ∀λ ∈ K, ∀x ∈ V ) y sea IK (V ) el ideal asociado
en K[X0 , . . . , Xn ]. Sea f ∈ IK (V ). Consideremos la descomposición de f en sus componentes
homogéneas:
f = f0 + f1 + · · · + fd ,
donde fi es homogéneo de grado i y fd 6= 0. Consideremos ahora un punto x ∈ V cualquiera.
Por ser V un cono, tendremos también que λx ∈ V para cada λ ∈ K. Como f ∈ IK (V ) se tiene
que f (x) = 0, pero también f (λx) = 0. Pero observemos que
0 = f (λx) = f0 (x) + λf1 (x) + · · · + λd fd (x).
Es decir, si consideramos el polinomio en una variable:
F = fd (x)T d + fd−1 (x)T d−1 + · · · + f1 (x)T + f0 (x) ∈ K[T ],
tenemos que F es un polinomio que se anula en todos los puntos de K que es un cuerpo infinito.
Entonces F ≡ 0 es el polinomio idénticamente nulo o, equivalentemente, todos sus coeficientes
son nulos. Es decir, f0 (x) = 0, . . . , fd (x) = 0. Hemos probado que:
∀x ∈ V, ∀f ∈ IK (V ) =⇒ f0 (x) = f1 (x) = · · · = fd (x) = 0.
Dicho de otra manera, si f ∈ IK (V ), entonces sus componentes homogéneas f0 , . . . , fd ∈ IK (V )
y, por nuestra caracterización de los ideales homogéneos, el ideal IK (V ) es un ideal homogéneo.


Observación 7.4.8 (El ideal m0 en el caso proyectivo). El ideal (X0 , X1 , . . . , Xn ) ⊆


K[X0 , . . . , Xn ] es un ideal homogéneo, que ya hemos detectado con anterioridad, dado que
se trata del ideal maximal m0 := IK ({0}) = (X0 , . . . , Xn ), donde 0 ∈ Kn+1 es el “origen” en
Kn+1 . Obsérvese que {0} es un cono con la terminologı́a usada anteriormente y que es el cono
proyectante asociado al vacı́o e ∅ = {0}, de donde surge el uso que damos a este ideal en el caso
proyectivo.
372 7. GEOMETRÍA ALGEBRAICA: TOPOLOGÍA DE ZARISKI

Proposición 7.4.9 (Propiedades elementales de ideales homogéneos). Se tiene las sigu-


ientes propiedades:
i) Si {ai : i ∈ I} es una familia cualquiera de ideales homogéneos, entonces
X
ai ,
i∈I

es un ideal homogéneo.
ii) Si a y b son ideales homogéneos, también son homogéneos los ideales ab y a ∩ b son
homogéneos. Más generalmente, dada una familia cualquiera de ideales homogéneos
{ai : i ∈ I}, la intersección ∩i∈I ai también es un idael homogéneo.

iii) Si a es un ideal homogéneo, también es homogéneo su radical: a.
Demostración. Hagamos cada afirmación por su lado.
• Afirmación i): El ideal suma está generado por la unión de los ideales. Pero, a
su ves, cada ideal ai está generado por una familia Hi de polinomios homogéneos
(i.e. ai = (Hi ) para cada i ∈ I). Es un sencillo ejercicio probar que el ideal suma
está generado por la unión de conjuntos de generadores de los ideales que se están
sumando. Es decir,
! !
X [ [
ai = ai = Hi .
i∈I i∈I i∈I

Por tanto, el ideal suma está generado por un conjunto cualquiera de polinomios
homogéneos y será un ideal homogéneo.
• Afirmación ii): Para el caso del ideal a ∩ b, si f ∈ a ∩ b, por ser a y b homogéneos,
las componentes homogéneas de f están en tanto en a como en b y, por tanto, las
componente homogéneas de f están en a ∩ b y el ideal a ∩ b es homogéneo por la
afirmación iv) de la Proposición 7.4.3.
Para el ideal producto ab, nótese que si H es un sistema generador del ideal a y G es un
sistema generador del ideal b entonces, el siguiente conjunto es un sistema generador
del ideal ab:
HG := {f g : f ∈ a, g ∈ b}.
Si, por ser a y b homogéneos, suponemos que los polinomios en H y en G son todos
homogéneos, por la inclusión descrita en la Identidad (7.4.5), el producto de dos
polinomios homogéneos es un polinomio homogéneo. En suma, los elementos de HC
son todos polinomios homogéneos y como
ab = (HG) ,
el ideal producto ab será un ideal homogéneo.
Para el caso de una familia cualquiera de ideales homogéneos {ai : i ∈ I} la prueba
de que su intersección es un ideal homogéneo sigue as mismas pautas que el caso de
la intersección de 2. Lo dejamos como reflexión para el lector.
• Afirmación iii): Supongamos que a es un ideal propio (en el caso impropio no hay
nada que probar). Consideremos el siguiente conjunto:
√ √
A := {t ∈ N : ∃f ∈ a, f = f0 + · · · ft , ft 6= 0, fi ∈ Hi , ft 6∈ a}.

Es decir, A es el conjunto de los grados de polinomios en a cuya colponente ho-
mogénea de mayor grado no está en a. Supongamos, razonando por reducción √ al
absurdo, que A 6= ∅ y sea d := min(A ). Entonces, existe un polinomio f ∈ a tal
que deg(f ) = d y dada la descomposición de f en componentes homogéneas
f = f0 + · · · + fd ,

con fi ∈ Hi (X0 , . . . , Xn ), fd 6= 0. Ahora, como f ∈ a existe una potencia m ∈ N,
m ≥ 1, tal que f m ∈ a. Ahora bien, tenemos que
X d
Y
f m = (f0 + · · · + fd )m = aµ fiµi ,
|µ|=m i=0
7.4. VARIEDADES PROYECTIVAS E IDEALES HOMOGÉNEOS 373

donde los coeficientes aµ ∈ K dependen de la caracterı́stica del cuerpo K. Ahoera los


sumandos de esa expresión son polinomios homogéneos y, además, el grado de cada
sumando, si aµ 6= 0, viene dado por
d
Y d
X d
X
deg(aµ fiµi ) = µi deg(fi ) = iµi .
i=0 i=0 i=0
El mx́imo de estos grados, dado que |µ| = µ0 + · · · + = m se alcanza en el témino
µ = (0, . . . , 0, m) ∈ Nd+1 , es decir,
d
X
iµi ≤ md.
i=0
Esto nos permite concluir que la componente homogénea de mayor grado de f m es
precisamente fdm . Como a es homogéneo, y√como f m ∈ a, concluimos que fdm ∈ a
y, por tanto, concluimos también que fd ∈ a. Pero eso contradice √ el hecho de ser
d = min(A ) y, por tanto, A = ∅. La conclusión es que si f ∈ a entonces la
componente de mayor grado de f es un elemento√de a.
Para concluir el argumento, consideremos f ∈ a un polinomio no √ nulo de grado
mı́nimo tal que alguna de sus componentes homogéneas no está en a. Supongamos
que deg(f ) = d y que sus componentes homogéneas son dadas por la siguiente igualdad:
f = f0 + · · · + fd .
√ √
Por lo que acabamos de probar, fd ∈ a pero, como a es un ideal,
√ √ entonces f − fd ∈
a. Además, la componente homogénea
√ de f que no está en a debe ser de grado
menor estricto√que d (porque fd ∈ a). Entonces, el siguiente polinomio √ tiene grado
d − 1, está en a y alguna de sus componentes homogéneas no está en a:
f − fd = f0 + f1 + · · · + fd−1 .
Entonces, necesiariamente (porque d era el mı́nimo de los grados de polinomios no
nulos), se ha de√tener f −fd = 0, f = fd y f no posee ninguna
√ componente homogénea
que no esté en a. En√ conclusión, para cada polinomio f ∈ a todas sus componentes

homogéneas están en a y, por la propiedad iv) de la Proposición 7.4.3, el ideal a
es un ideal homogéneo.

En la siguiente proposición escribiremos VP (a) en lugar de VPn (K) (a), asumiendo que el espacio
ambiente proyectivo Pn (K) está fijado.
Proposición 7.4.10 (Topologı́a de Zariski en Pn (K)). Sea K un cuerpo, K su clausura
algebraica, sea K[X0 , . . . , Xn ] el anillo de polinomios en n + 1 variables con coeficientes en K
y supongamos que trabajamos en el espacio proyectivo Pn (K). Se tiene:
i) Si a ⊆ b son dos ideales homogéneos del anillo K[X0 , . . . , Xn ], entonces VP (b) ⊆ VP (a).
ii) ∅ = VP ((X0 , . . . , Xn )) y Pn (K) = VP ((0)).
iii) La intersección de una familia cualquiera de variedades algebraicas proyectivas K−definibes
es una variedad algebraica proyectiva K−definible. Es decir, dada una familia {VP (ai ) :
i ∈ I}, donde ai es un ideal homogéneo, entonces
\ X
VP (ai ) = VP ( ai ),
i∈I i∈I

que es una variedad proyectiva K−definible por el apartado i) de la Proposición prece-


dente.
iv) La unión finita de variedades algebraicas proyectivas K−definibles es una variedad
algebraica proyectiva K−definible. De hecho, dados dos ideales homogéneos a, b en
K[X0 , . . . , Xn ], se tiene que
VP (a) ∪ VP (b) = VP (ab),
donde ab es un ideal homogéneo por la propiedad ii) de la Proposición precedente.
v) Para cada ideal a ⊆ K[X0 , . . . , Xn ] homogéneo, se tiene que

VP (a) = VP ( a).
374 7. GEOMETRÍA ALGEBRAICA: TOPOLOGÍA DE ZARISKI

(P)
En particular, existe una única topologı́a Tz en el espacio proyectivo Pn (K) cuyos cerrados
son las variedadees algebraicas proyectivas K−definibles. Es decir, los cerrados de Pn (K) son
la familia:
{VP (a) : a es un ideal homogéneo}.
Demostración. La prueba de las propiedades i) a v) es similar a la hecha para la
Proposición 7.2.4 poniendo cuidado en el hecho de que nuestros ideales son homogéneos (y,
por tanto, usando la homogeneidad de los generadores de los ideales implicados). La conclusión
sobre la topologı́a de Zariski es inmediata a partir de las propiedades i) a v). 

Igual que en el caso del espacio afı́n, podemos definir la noción de ideal asociadoa a un subcon-
junto del espacio proyectivo.
Definición 100 (Ideal asociado a un subconjunto de Pn (K)). Sea F ⊆ Pn (K) un sub-
(P)
conjunto del espacio proyectivo. Definiremos el ideal asociado a F como el ideal IK (F ) ⊆
K[X0 , . . . , Xn ] generado por todos los polinomios hompogéneos f ∈ K[X0 , . . . , Xn ] que se anu-
lan en el cono proyectante Fe sobre F . Es decir,
(P) 
IK (V ) := {f ∈ K[X0 , . . . , Xn ] : f es homogéneo y f Fe ≡ 0} .
(P)
Nótese que IK (F ) es un ideal homogéneo en K[X0 , . . . , Xn ] por estar generado por elementos
homogéneos. Más aún, obsérvese la diferencia con la definición de IK (F ) dado que hemos
consideramo el “ideal generado por” los polinomios homogéneos que se anulan en Fe ⊆ Kn+1 . A
(P)
posteriori, todos los polinomios de IK se anulan en todos los puntos afines del cono proyectante
Fe sobre F .

Proposición 7.4.11 (Clausura en la topologı́a de Zariski en Pn (K)). Con las notaciones


precedentes,sea F ⊆ Pn (K) un subconjunto del espacio proyectivo. Sea Fe = π −1 (F ) ∪ {0} ⊆
Kn+1 el cono proyectante sobre F . Entonces, se tiene
(P)
IK (F ) = IK (Fe).
En particular, se tiene que:
(P)
∅) = IK ({0}) = m0 = (X0 , . . . , Xn ).
IK (∅) = IK (e
Además, se tiene:
(P) z
VP (IK (F )) = F ,
z
donde F es la clausura de F en la topologı́a de Zariski en Pn (K).
Demostración. Para la primera propiedad, nótese simplemente que si Ve es un cono, por
la propiedad iii) de la Proposición 7.4.7 sabemos que IK (Fe) es un ideal homogéneo. Entonces,
IK (Fe) está generado por los ideales homogńeos que se anulan en Fe y, por tanto, se da la
igualdad:
(P)
IK (F ) = IK (Fe).
(P)
La afirmación sobre IK (∅) es obvia a partir de nuestra definiciones y la Proposición 7.3.15.
Para la tercera afirmación, basta con seguir la argumentación del ı́tem iv) de la Proposición
7.3.11 precedente, poniendo cuidado con la consideraciones de ideales y polinomios homogéneos.

(cones)
Observación 7.4.12. Nótese que, por lo anterior, existe una única topologı́a Tz en Kn+1 \
n+1
{0} cuyos cerrados son dados por la intersección de K \ {0} con los conos proyectantes sobre
variedades algebraicas proyectivas K−definibles. Además, la proyección canónica
π : (Kn+1 \ {0}, Tz(cones) ) −→ (Pn (K), Tz(P) ),
es continua. Más aún, con estas topologı́as π es una aplicación cerrada e induce una biyección
(cones)
entre los cerrados de Tz y los de TzP .
También será continua la proyección canónica entre la topologı́a inducida en Kn+1 \ {0} por la
topologı́a de Zariski Tz en Kn+1 :
π : (Kn+1 \ {0}, Tz n+1 ) −→ (Pn (K), Tz(P) ),

K \{0}
7.4. VARIEDADES PROYECTIVAS E IDEALES HOMOGÉNEOS 375

la razón es que los conos proyectantes sobre variedades algebraicas proyectivas K−definibles
son variedades algebraicas K−definibles afines. Pero debemos notar que la topologı́a de Zariski
en Kn+1 es estrictamente más fina (i.e. posee estrictamente más abiertos y cerrados) que la
(cones)
topologı́a Tz . Esta última es meramente instrumental y sirve solamente para intuir cómo
es la topoplogı́a de Zariski en Pn (K). Para estudiar más en profundidad la relación entre las
topologı́as de Zariski en espacios afines y proyctivos esperamos a desarrollos posteriores.

Dado que tenemos una topologı́a podemos hablar de cerrados irreducibles como en la Definición
92:
Definición 101 (Variedad algebraica proyectiva irreducible). Con las notaciones prece-
dentes, una variedad algebraica proyectiva K−definible V ⊆ Pn (K) se denomina reducible si
existen dos variedades algebraicas proyectivas K−definibles W1 , W2 ⊆ Pn (K) tales que
Wi ( V, i ∈ {1, 2},
y
V = W1 ∪ W2 .
Si V no es reducible, diremos que V es irreducible.

De nuevo, tenemos la conexión con los ideales primos, aunque, en este caso, debe ser homogéneo.
Proposición 7.4.13. Con las notaciones precedentes, V ⊆ Pn (K) una variedad algebraica
proyectiva K−definible, son equivalentes:
i) V es irreducible,
(P) (P)
ii) IK (V ) ∈ Spec(K[X0 , . . . , Xn ]), i.e. IK (V ) es un ideal primo y homogéneo.
Demostración. Esencialmente, es la prueba de la Proposición 7.2.20, poniendo cuidado
con los polinomios e ideales homogéneos y los puntos proyectivos.
(P)
Ası́, si el ideal IK ∈ Spec(K[X0 , . . . , Xn ]) es un ideal primo, y si tenemos una descomposición
V = W1 ∪ W2 en dos subvariedades algebraicas proyectivas, tenemos la misma relación entre
los conos proyectantes Ve = Wf1 ∪ W f1 ) ∩
f2 . Entonces, los ideales afines verifican IK (Ve ) = IK (W
IK (W2 ). Como en el caso afı́n, por la Proposición 4.2.12, se tiene que dar
f

IK (Ve ) ⊇ IK (W
f1 ) ∨ IK (Ve ) ⊇ IK (W
f2 ).
Todos ellos son ideales homogéneos y se tendrá, alternando las inclusiones
VP (IK (Ve )) ⊆ VP (IK (W
f1 )) ∨ VP (IK (Ve )) ⊆ VP (IK (W
f2 )).
(P) fi ) = I (P) (Wi ), para cada i ∈ {1, 2} y usando la
Pero sabemos que IK (Ve ) = IK (V ), IK (W K
Proposición 7.4.11, siendo V , W1 y W2 cerrados en Pn (K), concluimos
V = VP (IK (Ve )) ⊆ W1 = VP (IK (W
f1 )) ∨ V = VP (IK (Ve )) ⊆ W2 VP (IK (W
f2 )),
lo que nos permite concluir que V es irreducible.
Recı́procamente, supongamos que V es irreducible, escribamos, para simplificar la lectura,
(P)
i = IK (V ). Sea f ∈ K[X0 , . . . , Xn ] un polinomio tal que f 6∈ i. Supogamos que deg(f ) = d y
consideremos sus componentes homogéneas:
f = f0 + f1 + · · · + fd , fi ∈ Hi (X0 , . . . , Xn ), fd 6= 0.
Como i es homogéneo debe existir una componente homogénea de f que no está en ese ideal.
Es decir, existe t, con
P0 ≤ t ≤ d tal que ft 6∈ i y fj ∈ i para t + 1 ≤ j ≤ d. Consideremos el
d
polinomio f 0 := f − 0
j=t+1 fj . Obviamente f 6∈ i porque ft 6 i y el ideal i es homogéneo.
Consideremos los siguientes dos conjuntos siguiente conjunto:
F (f ) := {g ∈ K[X0 , . . . , Xn ] : gf ∈ i, g 6∈ i},
y
F (f 0 ) := {g ∈ K[X0 , . . . , Xn ] : gf 0 ∈ i, g 6∈ i}.
P 
d
Observemos que F (f ) = F (f 0 ). Dado g ∈ F (f ), tenemos que g 6∈ i y, además, g j=t+1 fj ∈
P  P 
d d
i, porque j=t+1 fj ∈ i. Por tanto, gf 0 = gf − g j=t+1 fj ∈ i, luego g ∈ F (f 0 ). El
376 7. GEOMETRÍA ALGEBRAICA: TOPOLOGÍA DE ZARISKI

P 
d
recı́proco es análogo: si g 6∈ i y gf 0 ∈ i, entonces f g = gf 0 + g j=t+1 fj ∈ i.
Para concluir nuestro argumento, veamos que F (f 0 ) = ∅.
Supongamos que F (f 0 1) no es vacı́o, entonces el siguiente conjunto posee mı́nimo:
F := {deg(g) : g ∈ F (f 0 )}.
Sea r = min(F ) el mı́nimo. De momento, no es posible que r = −1 porque si r = −1, entonces
0 ∈ F , pero 0 6∈ F dado que 0 ∈ p para cualquier ideal p primo. Por tanto, r ≥ 0. Sea g ∈ F
tal que deg(g) = r = min(F ). Escribamos las coordenadas homogéneas de g:
g = g0 + g1 + · · · + gr , gj ∈ Hj (X0 , . . . , Xn ), gr 6= 0.
Tenemos que g 6∈ i, pero tenemos también la expansión en componentes homogéneas de f 0 g:
 
t+r
X X
f 0g =  fi gj  .
k=0 i+j=k

La componente homogénea de mayor grado de f 0 g es, precisamente ft gr . Como f 0 g ∈ i y el


ideal es homogéneo, concluimos que ft gr ∈ i. Consideremos la descomposición de V como unión
de dos cerrado irreducibles:
V = V ∩ VP (ft ) ∪ V ∩ VP (gr ).
(P)
Pero V 6= V ∩ VP (ft ) porque ft 6∈ i = IK (V ). Por tanto, concluimos que
V = V ∩ VP (gr ),
(P)
o, equivalentemente, gr ∈ i = IK (V ). Consideremos, finalmente, el polinomio g 0 = g − gr .
Claramente deg(g ) ≤ r − 1. Además, como g 6∈ i y gr ∈ i, entonces g 0 6∈ i. Más aún, como
0

gr ∈ i, entonces
f 0 g 0 = f g − f gr ∈ i.
Por tanto, g 0 ∈ F (f 0 ), lo que contradice la minimalidad de r = min(F ). Por tanto, la única
opción es que F (f ) = F (f 0 ) = ∅. Es decir, que si f g ∈ i y f 6∈ i, concluimos que g ∈ i y el
ideal i es primo.


Corolario 7.4.14. Con las notaciones y propiedades precedentes, los cerrados irreducibles para
la topologı́a de Zariski en Pn (K) están contenidos en el conjunto siguiente:
{VPn (K) (p) : p ∈ Spec(K[X0 , . . . , Xn ]), p homogéneo}.
La discusión de cuántos de los ideales primos homogéneos determinan una variedad algebraica
proyectiva queda para el estudio del Nullstellensatz proyectivo ulterior.
De nuevo, por estar en un contexto noetheriano (ver ı́tem iv) de la Proposición 7.4.3, tenemos
las buenas cualidades de la topologı́a de Zariski en Pn (K):
Corolario 7.4.15. Cada abierto en la topologı́a de Zariski de Pn (K) dada por los K−definibles
es unión finita de abiertos distinguidos de la forma
OP (f ) := OPn (K) (f ) := Pn (K) \ VP (f ) := {x ∈ Pn (K) : f (x) 6= 0},
donde f ∈ K[X0 , . . . , Xn ] es un polinomio homogéneo.
Y se presevran las concidiones de cadena:
Proposición 7.4.16. Con las notaciones de los Teoremas precedentes se tiene:
i) Condición de Cadena Numerable Descendente (para cerrados):Toda ca-
dena descendente de cerrados para la topologı́a de Zariski en Pn (K) definida por las
variedades algebraicas proyectivas se estabiliza.
ii) Asumiendo el Axioma de Elección Dependiente, todo conjunto no vacı́o de variedades
algebraicas proyectivas K−definibles posee elemento minimal para la inclusión.
Se dice que la topologı́a de Zariski en Pn (K) define un espacio topológico noetheriano por
satisfacer estas dos propiedades.
Demostración. La prueba sigue, esencialmente, los mismos argumentos que la demostración
de la Proposición 7.3.16. 
7.4. VARIEDADES PROYECTIVAS E IDEALES HOMOGÉNEOS 377

Proposición 7.4.17 (Componentes irreducibles de una variedad algebraica proyec-


tiva). Con las notaciones de los Teoremas precedentes, se verifican las siguientes propiedades:
i) Toda variedad algebraica proyectiva K−definible es unión finita de variedades alge-
braicas proyectivas irreducibles.
ii) Dado V ⊆ Pn (K) un variedad algebraica proyectiva K−definible, existe una descom-
posición en variedades algebraicas poryectivas irreducibles y K−definibles:
(7.4.6) V = V1 ∪ . . . ∪ Vs ,
tal que V no se puede escribir como unión de una subfamilia propia de {V1 , . . . , Vs }
(o, equivalentemente, que dados i, j con i 6= j, no hay relación de contenido entre Vi y
Vj ). Tal descomposición se llama minimal o irredundante.
iii) Dada una descomposición irredundante de V como en (7.4.6) no hay relación de in-
clusión entre cualesquiera dos irredubles de tal descomposición. Es decir, no existe
i, j ∈ {1, . . . , s} tales que i 6= j y Vi ⊆ Vj .
iv) Las descomposiciones irredundantes de variedades K−definibles en irreducibles son
únicas salvo permutación de las variedades {V1 , . . . , Vs }.
Dada una variedad algebraica proyectiva K−definible V ⊆ Pn (K), los cerrados irreducibles
K-definibles (únicos para cada V ) que aparecen en una descomposición irredundante de V en
irreducibles se denominan componentes irreducibles de V .
Demostración. Similar a la demostración de la Proposición 7.3.17. 

El resto de las propiedades de la argumentación noetheriana se siguen de manera natural como


en el caso de las variedades afines:
Proposición 7.4.18. Con las notaciones precedentes, dado V ⊆ Pn (K) un cerrado Zariski
K−definible de Pn (K) y dado un espacio recubridor de V por abiertos Zariski de Pn (K) A :=
{Ai : i ∈ I}, entonces, A posee un subcubrimiento finito de Y . Es decir, la topologı́a de
Zariski de los K−definibles sobre Pn (K) es quasi-compacta.

Proposición 7.4.19. Con las notaciones precedentes, sea V ⊆ Pn (K) una variedad algebraica
proyectiva K−definible. Se tiene:
(P)
i) El ideal IK (V ) ⊆ K[X1 , . . . , Xn ] es un ideal radical.
(P)
ii) Existe una descomposición primaria irredundante de cada ideal IK (V ) dada por ide-
ales primos y homogéneos. Esto es, para cada V ⊆ An (K) existe una familia finita
de ideales primos {p1 , . . . , ps } ⊆ Spec(K[X0 , . . . , Xn ]), que son, además ideales ho-
mogéneos, tales que pi 6= pj , para cada i 6= j, y la siguiente descomposición es irredu-
dante:
(7.4.7) IPn (K) (V ) = p1 ∩ · · · ∩ ps .
De hecho, esta descomposicón es única, salvo permutación de los ideales primos in-
volucrados.
(P)
iii) Los ideales de la forma IK (V ) no poseen componentes inmersas y todos sus ideales
primos asociados son minimales.
iv) De hecho, si disponemos de una descomposición de V en componentes irreducibles en
Pn (K),
V = V1 ∪ · · · ∪ Vs ,
se tendrá que pi = IK (Vi ) ∈ Spec(K[X0 , . . . , Xn ]).
Demostración. La prueba es un punto más delicada que la prueba de la Prosición 7.4.19,
pero se sigue con esencialmente los mismos pasos. 

Observación 7.4.20 (Los ideales de los puntos proyectivo). Dado un punto proyectivo
(P)
z = (z0 : · · · : zn ) ∈ Pn (K), el ideal asociado IK ({z}) es un ideal homogéneo. Consideremos la
recta afı́n r ⊆ Kn+1 determinada como el cono proyectante sobre el punto z: r = {z}. g Se trata,
n+1
obviamente, del subespacio generado por z en K , i.e.
r = Khzi = {z}.
g
378 7. GEOMETRÍA ALGEBRAICA: TOPOLOGÍA DE ZARISKI

Por tanto, los ideales satisfacen:


(P)
IK ({z}) = IK (Khzi) ⊆ K[X0 , . . . , Xn ].
(P)
Y como las rectas son variedades afines irreducibles, entonces IK ({z}) ∈ Spec(K[X0 , . . . , Xn ]).
Pero ya no será un ideal maximal. Obviamente estará contenido en m0 y, por tanto, no será
maximal, pero se le puede caracterizar mediante la siguiente igualdad.
(P)
IK (x) := {zi Xj − zj Xi : {i, j} ⊆ {0, 1, . . . , n}} = IK (Khzi).
Retomando el cubrimiento de Pn (K) por las imágenes de los espacios afines descrito en la
Identidad (7.4.3) y, tras observar que las imágenes de los espacios afines son abiertos distinguidos
(cf. Observación 7.4.1), tenemos un cubrimiento abierto de Pn (K) por un número finito de
abiertos distinguidos:
n
[
Pn (K) = OP (Xi ).
i=0

Ahora, dado un punto z = (z0 : · · · : zn ) ∈ Pn (K) existe alguno de esos abiertos distinguidos en
el que se encuentra. Supongamos que z ∈ OP (Xi ) entonces se puede probar (y es un sencillo
ejercicio de verificación que
(P)
IK ({z}) = (zk Xi − zi Xk : k ∈ {0, . . . , n}, k 6= i}.
Y concluimos que los ideales asociados a puntos proyectivos están generados por n polinomios
homogéneos de grado 1. En particular, los puntos “afines” embebidos en el proyectos a través
de la usual homogeneización (i.e los puntos z = (z0 : · · · : zn ) ∈ ϕ0 (An (K))) tienen ideales
dados por:
(P)
IK ({(1 : z1 : · · · : zn )}) = (X1 − z1 X0 , . . . , Xn − zn X0 ) ,
que “recuerdan” al ideal mz := (X1 − z1 , . . . , Xn − zn ) homogeneizando los polinomios que le
generan. Volveremos sobre esta idea más adelante.

Observación 7.4.21 (Cuidado con las “funciones” polinomiales y el proyectivo). Dada


una variedad algebraica K−definible V ⊆ An (K), y dado un polinomio f ∈ K[X1 , . . . , Xn ] uno
pude definir de manera natural una función (llamada función polinomial) sobre V mediante f :
f: V −→ K
x 7−→ f (x)
Se escribe K[V ] para designar la K−álgebra de las funciones polinomiales sobre V y veremos
de su relevanzia (de hecho, una equivalencia natural) entre las variedades algebraicas afines y
este tipo de K−álgebras.
Sin embargo, tal cosa no pude hacerse con variedades algebraicas proyectivas. Dada V ⊆ Pn (K)
una variedad algebraica proyectiva, y dado un polinomio f ∈ K[X0 , . . . , Xn ] no tiene sentido
definir una “función” polinomial sobre V ni siquiera si f es homogéneo: no está claro quién
serı́a f (x0 : · · · : xn ) ∈ K. Por eso se considera la siguiente construcción:
Sean f, g ∈ Hd ⊆ K[X0 , . . . , Xn ] dos polinomios homogéneos del mismo grado y sean x, y ∈
Kn+1 dos representantes del mismo punto proyectivo ζ = (x0 : x1 : · · · : xn ) ∈ Pn (K). Sea
OP (g) := VPn (K) (g)c ⊆ Pn (K) el complementario de VPn (K) (g) en Pn (K). Entonces, podemos
definir la función:
f /g : D(g) ⊆ Pn (K) −→ K,
ζ 7−→ fg(ζ)
(ζ)
.
Esta función está bien definida y no depende sino del punto proyectivo ζ y no de sus represen-
tantes. Se denomina función regular (o función racional) K−definible sobre Pn (K). Obérvese
una interpretación aviesa de la función anterior como:
(f : g) : D(g) ⊆ Pn (K) −→ P1 (K),
ζ 7−→ (f (ζ) : g(ζ)).
Y VPn (K) (f ) ∩ D(g) son los puntos de D(g) que “se van al infinito” mediante (f : g).
7.4. VARIEDADES PROYECTIVAS E IDEALES HOMOGÉNEOS 379

7.4.1. Ejercicios y problemas de la Sección 7.2.


Problema 275. Prueba que si K es un cuerpo, son equivalentes:
i) Existe una hipersuperficie VK (f ) que no posee puntos K−racionales (i.e. que VK (f ) ∩
K n = ∅).
ii) K no es algebraicamente cerrado.
Problema 276. Consideremos X un conjunto no vacı́o, R = K un cuerpo y A[X] ⊆ K X una
K−álgebra de funciones definidas sobre X. Supongamos que A[X] es noetheriano. Pruébese
que si el cuerpo K no es algebraicamente cerrado, entonces toda variedad A[X]−definible es
una hiper-superficie en el sentido del ı́tem i) de la Definición 89.
Problema 277. Verifica lo que se afirma en la Proposición 7.3.9.
Problema 278. Sea X un conjunto no vacı́o, R un dominio de integraidad, A[X] ⊆ RX una
R−álgebra de funciones sobre X. Supongamos que A[X] es noetheriano. Elabora una propuesta
de enunciados similares a las propiedades i) y ii) de la Proposición 7.3.16 para variedades
A[X]−definibles. Concluye que, si A[X] es noetheriano, toda variedad A[X]−definible admite
descomposción única irredudante como unión finita de variedades A[X]−definibles irreducibles
(i.e. se verifica para el caso general un resultado similar a la Proposición 7.3.17).
Problema 279. Enuncia una condición de cadena ascendente numerable para abiertos de un
espacio topológico. Prueba que los abiertos K−definible de la topologı́a de Zariski de An (K)
satisfacen esa condición de cadena ascendente.
Problema 280. Sea K un cuerpo y sea K su clausura algebraica. Sea x = (x1 , . . . , xn ) ∈
An (K). Sea K(x1 , . . . , xn ) el menor subcuerpo de K qu contiene a K a los elementos {x1 , . . . , xn }.
Pruébese:
i) Para cada i, 1 ≤ i ≤ r, existe fi ∈ K[T ] un polinomio univariado tal que
xi f (xi ) = 1.
ii) Se tiene la siguiente igualdad
K(x1 , . . . , xn ) = {f (x1 , . . . , xn ) : f ∈ K[X1 , . . . , Xn ].
iii) Analiza qué sucede si no todas las coordenadas de x son algebraicas sobre K.
Problema 281. Sea R un dominio de integridad, X 6= ∅ un conjunto no vacı́o, A[X] ⊆
RX una R−álgebra que sea, además, noetheriano como anillo. Prueba que las variedades
A[X]−definibles en X y los ideales de A[X] asociados a ellas verifican propiedades análogas
a las descritas en la Proposición 7.3.19.Dicho de otra manera, es la condición noetheriana la
clave de esa Proposición.
Problema 282 (Espacio topológico noetheriano). Admitiendo el Axioma de lección De-
pendiente, pruébese que para un espacio topológico (X, T ) las siguiente propiedades son equiv-
alentes:
i) (X, T ) verifica la condición de cadena descendente numerable para cerrados, es decir,
dada una cadena descendente de cerrados de (X, T ):
V0 ⊇ V1 ⊇ V2 ⊇ · · · ⊇ Vn ⊇ · · · ,
existe n0 ∈ N tal que Vn = Vn0 para todo n ≥ n0 .
ii)
iii) (X, T ) verifica la condición de cadena ascendente numerable para abiertos, es decir,
dada una cadena ascendente numerable de abiertos de (X, T ):
A0 ⊆ A1 ⊆ A2 ⊆ · · · ⊆ An ⊆ · · · ,
existe n0 ∈ N tal que An = An0 para todo n ≥ n0 .
iv) Toda familia no vacı́a de cerrados de (X, T ) posee elemento minimal.
v) Toda familia no vacı́a de abiertos de (X, T ) posee elemento maximal.
vi) Todo abierto de (X, T ) es quasi-compacto.
Los espacios topológicos (X, T ) que posee una, luego todas, las propiedades equivalentes ante-
riores, se denominan espacios topológidos noetherianos. Obsérvese que todos los ejemplos de
topologı́as de Zariski anteriores son espacios topológicos noetherianos.
380 7. GEOMETRÍA ALGEBRAICA: TOPOLOGÍA DE ZARISKI

Problema 283 (Existencia de descomposición en irreducibles). Sea (X, T ) un espacio


topológico. Un cerrado C ⊆ X se dice reducible si existen W1 , W2 ⊆ X dos cerrados tales que:
[
C := W1 W2 , Wi ( C, W2 ( C.
Un cerrado se dice irreducible si no es reducible. Pruébese que en un espacio topológico noethe-
riano todo cerrado es unión finita de irreducibles. Conclúyase que para cada cerrado V ⊆ X,
existe una descomposición minimal irredundante como unión finita de cerrados irreducibles y
que esta descomposición minimal es única salvo permutación. A estos irreducibles que aparecen
en la descomposición minimal de un cerrado V de un espacio topológico noetheriano (X, T ) se
les denomina componentes irreducibles de V .
Problema 284. Estudia la veracidad de la siguiente propiedad:
Existe una biyección entre los conos en Kn+1 con respecto a escalares en K que son variedades
algebraicas K−definibles y las variedades algebraicas K−definibles en Pn (K). ¿El cardinal del
cuerpo K juega algún papel?.
Problema 285. Prueba la Proposición 7.4.10 precedente.
Problema 286. Prueba la Proposición 7.4.11 precedente.
Problema 287. Prueba la Proposición 7.4.13 precedente.
Problema 288. Prueba la Proposición 7.4.16 precedente.
Problema 289. Prueba la Proposición 7.4.19 precedente.
Problema 290. Prueba la siguiente propiedad de los abiertos en variedades irreducibles:
Sea U ∈ An (K) un abierto Zariski y sea V ⊆ An (K) ua variedad algebraica irreducible, ambos
K−definibles. Supongamos que U ∩ V 6= ∅. Prueba que U ∩ V es denso en V para la tologı́a de
Zariski de los K−definibles, esto es, prueba que
z
U ∩ V = V.
Problema 291. Prueba el mismo resultado anterior para variedades algebraicas proyectivas
K−definibles u abiertos Zariski en ¶n (K). Calcula la clausura Zariski de las imágenes del
espacio afı́n An (K) mediante las distintas indetificaciones descritas en el Capı́tulo. Es decir,
z
calcula ϕ0 (An (K)) en ¶n (K).
CAPı́TULO 8

Una Prueba Elemental de Nullstellensatz de Hilbert.


(...el vacı́o...inútil y perfecto.)

Cuando ya no nos queda nada,


el vacı́o de no quedar podrı́a ser al cabo
inútil y perfecto.
Joé Ángel Valente, 1979.

381
382 8. NULLSTELLENSATZ

Índice
8.1. Introducción. 382
8.1.1. Unas palabras sobre la Conjetura de Cook (P 6= NP). 384
8.2. Una demostración elemental del Nullstellensatz de Hilbert: Parte
I 386
8.2.1. La resultante y los tensores de multiplicación módulo un polinomio mónico:
especialización de la resultante 386
8.2.2. La prueba de la Parte I del Nullstellensazt de Hilbert-Kronecker 391
8.3. Un cambio de coordenadas útil 391
8.4. Tests de (no) nulidad para polinomios. 393
8.4.1. El Test de Schwartz-Zippel-DeMillo-Lipton. 395
8.4.2. Cuestores (Opcional, resumen de sólo lectura) 397
8.4.3. Witness Theorem. 397
8.4.4. Tests de (no) nulidad para números enteros dados por esquemas de
evaluación. 399
8.5. Una demostración elemental del Nullstellensatz de Hilbert: Parte
II 401
8.5.1. Nullstellensatz de Hilbert-Kronecker: Parte II 401
8.5.2. Nullstellensatz de Hilbert: Cuerpos finitos 402
8.5.2.1. Un recordatorio sobre Cuerpos Finitos. 403
8.5.3. Nullstellensatz: Identidad de Bézout 404
8.5.4. Nullstellensatz: Maximales 404
8.5.5. Nullstellensatz: Rabinowitsch y el radical de un ideal 406
8.5.6. Nullstellensatz e ideales primos. 408
8.5.7. Nullstellensatz y Geometrı́a Algebraica en Pn (K) 408
8.5.8. Nullstellensätze Efectivos y eliminación de un bloque de cuantificadores
existenciales (sólo enunciados). 410
8.6. Nullstellensatz y equivalencia natural: El lenguaje de las categorı́as 414
8.6.1. El lenguaje de las categorı́as. 414
8.6.2. Categorı́as 414
8.6.3. Functores y equivalencias naturales 416
8.6.4. La categorı́a de las variedades algebraicas afines y los morfimos regulares. 418
8.6.5. La Categorı́a de las K−álgebras reducidas finitamente generadas. 419
8.6.6. Nullstellensatz como Equivalencia Natural 421
8.7. Variaciones del Nullstellensatz en otros contextos (Cultura
General) 421
8.7.1. Variación de un primer tema clásico: El Teorema de Banach-Čech-Gel’fand-
Stone- 421
8.7.2. Variación de un segundo tema clásico: El Lema de Urysohn y el Teorema
de Extensión de Tietze. 422
8.7.3. Variación de un tercer tema clásico: Extensión de funciones en Variedades
Diferenciables 422
8.8. Ejericios y Problemas sobre el Nullstellensatz 423
8.8.1. La topologı́a de Zariski en el espectro de un anillo. 424
8.9. Meta-matemática: La Teorı́a de Primer Orden sobre los Complejos
admite Eliminación de Cuantificadores (Opcional, no se imparte
en esta forma). 426
8.9.1. Teorı́a de Primer Orden sobre cuerpos algebraicamente cerrados 426

8.1. Introducción.
El Nullstellensatz (o Teorema de los Ceros) es el punto de partida de la algebrización de la Geo-
metrı́a de los conjuntos definidos implı́citamente y, muy especialmente, de las conexiones entre el
Álgebra Conmutativa y la Geometrı́a Algebraica. El resultado tiene dos padres antagónicos en el
final del siglo XIX : D. Hilbert y L. Kronecker. El primero en observar un Nullstellensatz fue E.
Netto en 1885 (cf. [Netto, 1885]), quien probó una presentación del resultado, introduciendo
el radical, “ à la Rabinowitsch” ([Rainich, 1929]), aunque sólo para curvas. Este resultado
de Netto disparó la prueba posterior del Nullstellensatz general, que puede encontrarse en el
8.1. INTRODUCCIÓN. 383

trabajo de D. Hilbert (cf. el famoso [Hilbert, 1890]). Antes de ellos, en 1882, L. Kronecker
(cf [Kronecker, 1882]) demuestra un resultado similar, aunque en un contexto y con una
interpretación distintas que hacen más difı́cil identificarlo. Aquı́ nos conformaremos con dar
una demostración que minimiza los requisitos de Álgebra Conmutativa para poder seguirla.
La prueba que mostramos tiene dos bases sencillas de enunciar:
i) Que la resultante se especializa bien cuando uno de los polinomios involucrados es
mónico (cf. la Sección 3.6 y la Subsección 4.7.3).
ii) Que si K es un cuerpo con muchos elementos (por ejemplo, un cuerpo infinito) y si
f ∈ K[X1 , . . . , Xn ] es un polinomio no nulo, existe un cambio lineal de coordenadas
en el espacio ambiente que transforma nuestro polinomio en un polinomio mónico.
Para la propiedad ii) nos conformaremos con demostrar el Test de Schwartz-Zippel-DeMillo-
Lipton, aunque brevemente discutiremos otros métodos más sofisticados, y de mayor significado.
Haremos una sucinta revisión con la sola intención de ofrecer al lector la posibilidad de am-
pliar conocimientos sobre el tema. A ellos dedicaremos las secciones 8.3 y 8.4. Más adelante,
cuando dispongamos de las herramientas matemáticas requeridas, haremos una discusión más
promenorizada con pruebas. El lector puede también acudir a [Pardo, 95] para entender más
el contexto.
Uno de los problemas clásicos del uso de la resultante en la formulación de Sylvester (i.e. tal
y como se vió en la Sección 3.6) es que no es estable por especialización en el caso general.
De ahı́ que el tratamiento de la proyección de conjuntos dados como soluciones de polinomios
multivariados no se reduzca de modo inmediato al caso univariado y al uso de la matriz de
Sylvester (en palabras más técnicas, la proyección de un algebriaco no siempre es algebraico, ni
siquiera en el caso de “olvidar” sólo una coordenada). Pero la resultante sı́ se comporta bien bajo
especialización cuando uno de los polinomios involucrados es mónico. Este resultado es un mic-
mac pseudo-combinatorio, usando la noción original de Sylvester, pero es casi evidente desde C.
Jordan. El conocimiento de la forma canónica de Jordan no sólo es útil para entender ecuaciones
diferenciales homogéneas con coeficientes constantes (cf. Sección 5.4) sino que también permite
interpretar la resultante de modo muy conveniente cuando uno de los polinomios involucrados
es mónico:
ResX (f, g) := det (g(C(f ))) ∈ R,
donde f ∈ R[X] es un polinomio mónico, C(f ) es la compañera de f y f, g ∈ R[X]. Es la
presentación hecha en la Subsección 4.7.3. Por eso dedicamos un tiempo importante a recordar
esta forma de ver la resultante y a demostrar su estabilidad por especialización en la Subsección
8.2.1.
Armados con esas herramientas, una vez probado que la resultante está en la contracción
del ideal, observamos que está muy relacionada con la proyección de la intersección de hiper-
superficies (cf. Subsección 7.3.4.1). Con esto, el Nullstellensatz se vuelve inmediato: se trata de
un mero argumento inductivo que combina i), ii) y las propiedades de la resultante univariada.
Esta es la forma de la revisión en [Arr, 2006] y también la forma clásica del pensamiento
de L. Kronecker en [Kronecker, 1882], aunque no tanto la forma original de D. Hilbert. De
hecho, nuestra aproximación simplemente usa implı́citamente la Normalización de Noether (cf.
[Noether, 1926]) y las extensiones enteras de anillos sin explictar ninguna de las nociones.
Una vez probado el Nullstellensatz nos queda la tarea de dar versiones equivalentes del mismo
cuando K es un cuerpo algebraicamente cerrado: la identificación entre el espectro maximal
de K[X1 , . . . , Xn ] y los puntos del espacio afı́n An (K) (en Subsección 8.5.4), la identificación
entre ideales radicales y conjuntos algebraicos afines (el famoso “truco” de Rabonowitsch en la
Subsección 8.5.5), la identificación completa entre variedades algebraicas irreducibles e ideales
primos en K[X1 , . . . , Xn ] o la equivalencia natural entre las K−álgebras reducidas finitamente
generadas (i.e. sin elementos nilpotentes) y la categorı́a de conjuntos algebraicos y morfismos
regulares (cf. Sección 8.6).
La Sección 8.9 está dedicada a resumir cómo el Nullstellensatz se relaciona con la eliminación
de bloques de cuantificadores existenciales (∃) y tiene un estilo más cultural que preciso. En
el mismo tono cultural se escribe la Sección 8.7, donde se muestra, muy sucintamente, cómo
el Nullstellensatz influye el estudio de otros anillos. Destacamos el Teorema de Banach-Stone-
Čech-Gel’fand-Kolmogorov (cf. Teorema 8.7.1) que afirma que si C (X) es el anillo de funciones
384 8. NULLSTELLENSATZ

continuas a valores reales sobre un espacio topológico compacto X, entonces X es homeomorfo al


espectro maximal MaxSpec(C (X)) con la toplogı́a de Zariski, exactamente como sucede entre
Kn y MaxSpec(K[X1 , . . . , Xn ]), cuando K es un cuerpo algebraicamente cerrado. También
dejamos entrever cómo el Nullstellensatz influye en el caso de los anillos C ∞ (M ), cuando M es
una variedad diferenciable paracompacta, en las Subsecciones 8.7.2 y 8.7.3.
La pregunta que nos preguntamos en este Capı́tulo es la siguiente:
Problema Clásico 8.1.1 (Eliminar un bloque de cuantificadores existenciales). Sea
K un cuerpo, K su clausura algebraica, y sean dados f1 , . . . , fs ∈ K[X1 , . . . , Xn ]. Hállese una
expresión sintáctica sin cuantificadores (si existiera) que sea equivalente a la siguiente propiedad:
∃x1 ∈ K, ∃x2 ∈ K, . . . , ∃xn ∈ K f1 (x1 , . . . , xn ) = · · · = f (x1 , . . . , xn ) = 0.

La fórmula cuantificada también se puede resumir, en términos de nuestro lenguaje de varieda-


des, del modo siguiente:
Problema Clásico 8.1.2 (Decidir la vacuidad de una variedad). Sea K un cuerpo,
K su clausura algebraica, y sea a ⊆ K[X1 , . . . , Xn ], un ideal dado por una familia finita de
generadores a = (f1 , . . . , fs ). Hallar una expresión sintáctica sin cuantificadores (si existiera)
que sea equivalente a la siguiente propiedad:
VA (a) 6= ∅.

Ya habı́amos aproximado livianamente el asunto de eliminar bloques de cuantificadores existen-


ciales cuando hicimos una primera observación sobre las proyecciones de variedades algebraicas
en la Proposición 7.3.21. En aquél lugar consideramos la siguiente situación:
Con las mismas notaciones para K y K, sea π : An+m (K) −→ An (K) la proyección que
“olvida” las m últimas coordenadas. Sea V ⊆ An+m (K) una variedad algebraica K−definible.
Como en los ejemplos anteriores, podemos suponer, gracias al Basissatz, que V es dado por
un sistema de ecuaciones polinomiales finito. Es decir, suponemos que existen f1 , . . . , fs ∈
K[X1 , . . . , Xn , Y1 , . . . , Ym ] tales que:
V := VA (f1 , . . . , fs ).
En la Proposición 7.3.21 nos preguntábamos por el aspecto de la proyección π(V ) ⊆ An (K)
y analizábamos, con un argumento muy elemental, qué aspecto tendrı́a su clausura Zariski
z
π(V ) ⊆ An (K). Por ahora, sólo quiero insistir en la formulación sintáctica del acto de proyectar
que, en el sentido precedente, consiste en eliminar un bloque de cuantificadores existenciales.
Es obvio verificar esta idea porque:
π(V ) := {x ∈ An (K) : ∃y1 ∈ K, . . . , ∃ym ∈ K, fi (x, y1 , . . . , ym ) = 0, 1 ≤ i ≤ s}.
En este sentido, proyectar también remite a los dos problemas precedentes y ası́ fue interpre-
tado, incluso, por el propio D. Hilbert cuando pide a su alumna G. Hermann que trabaje el
Nullstellensatz Efectivo (cf. [Hermann, 1926]).
En el fondo, todo lo que se demuestra (y muestra) en el Capı́tulo subyace la esencia misma del
Nullstellensatz. Los objetos de la Geometrı́a dados por ecuaciones implı́citas, son las interpreta-
ciones semánticas (significado) de la ecuación que los describen. Por su parte, las ecuaciones,
especialmente en el caso polinomial, son meros objetos sintácticos que se pueden manipular,
incluso desconociendo su componente semática. El Nullstellensatz establece un camino, una
equivalencia natural, para pasar del universo sintáctico al universo semántico y recı́procamente,
lo que lo hace una clave esencial en el pensamiento matemático tras K. Gödel y A. Tarski. Pero
eso será otra historia.

8.1.1. Unas palabras sobre la Conjetura de Cook (P 6= NP).


Uno de los ejemplos más claros en los que el Nullstellensatz se observa como un medio para
trazar el paso desde la sintaxis a la semántica es el Problema del Milenio, uno de los 6 aún
abiertos, conocido como la Conjetura de Cook. Por la relevancia que la comunidad matemática
ha conferido al problema, merece la pena destacarlo aquı́. No podemos hacer una presentación
completa dado que necesitarı́amos una introducción cuidadosa a los modelos de computación
y, muy especialmente, a la obra de A.M. Turing. En su famoso trabajo [?], el autor define
un modelo abstracto de “máquina“ que resulta equivalente al modelo de función recursiva de
8.1. INTRODUCCIÓN. 385

K. Gödel ([Gödel, 31], [Gödel, 65]) (y al λ−calculus de A. Church en [Church, 36]). Lo


que persiguen estos autores en el primer tercio del siglo XX (sin olvidar al menos reconocido
E. Post en [Post, 36]) es una definición del concepto de algoritmo. Este ha sido un concepto
manoseado y manipulado sin definición por los matemáticos a partir de la traducción al latı́ de
la obra del matemático uzbeko Muhammad ibn Mūsā al-Khwārizmı̄: [al-Khwārizmı̄, 820]1.
La idea inicial de estos autores era probar la existencia de problemas que no admiten resolución
por medidos algorı́tmicos (indecidibilidad ).
Al mismo tiempo, y de modo casi inconsciente, la noción de algoritmo inspiró a varios ingenieros
electrónicos que crearon los primeros ordenadores digitales (entre otros, el secreto Colossus, que
se construyó bajo la dirección del propio A. Turing en Bletchley Park). Con el tiempo, el modelo
de Turing se convierte en el modelo estándard sobre el que se construyen las arquitecturas
de los ordenadores digitales, los lenguajes de programación y, en suma, toda la revolución
digital que incluye, entre otros, la telecomunicación digital. Aunque el modelo original de listas
(reflejado, por ejemplo, en el lenguaje Lisp) se ha ido refinando estructuralmente con diversas
arquitecturas de ordenadores, el modelo subyace a todo ordenador digital y, a partir de la
propuesta de Cobham y Edmonds, se convierte en el modelo (o patrón de medida) desde el que
se mide el tiempo de ejecución de un programa (independientemente de la máquina/ordenador
concreto que lo ejecuta). Si de medir el tiempo de un algoritmo/programa/porcedimiento se
trata, hay algoritmos y problemas cuya ejecución requiere una cantidad de tiempo inasumible.
Hay otros que se ejecutan en una cantidad de tiempo razonable: serán los problemas tratables y
el tiempo estará controlado por una función polinomial en el tamaño de representación del input
(los datos dados al programa a fin de que ejecute sus instrucciones sobre ellos). Usualmente, la
clase de problemas tratables suele designarse mediante la clase P.
En su trabajo [Cook, 1971], S. Cook crea una profunda alteración en el pensamiento de la
clasificación de los problemas por su tiempo de ejecución. Su principal contribución consiste en
establecer una teorı́a de reducción de unos problemas a otros, que le permite distinguir ciertos
problemas como problemas que condensan en sı́ mismos toda la Frontera de lo Intratable. Él
inicia este estudio mostrando ejemplos de ese tipo de problemas (como el que hoy conocemos
como el problema SAT y variantes). En principio, [Cook, 1971] no fue considerado como una
gran contribución cientı́fica. Cook suele contar que su tesis, defendida en Harvard, no impresionó
a los colegas y tuvo que ir a buscar empleo a Canadá (Universidad de Toronto), acabando por
tomar la cuidadanı́a canadiense. Sin embargo, al poco tiempo, aparecen autores como R. Karp
([Krp, 1972]) que añade una veintena de problemas adicionales a la lista de Cook. Karp
introduce la notación NP para esa Frontera de lo Intratable y la terminologı́a Problemas NP-
completos para referirse a esos problemas que condensan en sı́ mismos toda la frontera. No
pasará mucho tiempo hasta que M.R. Garey, D.S. Johnson publiquen en [GaJo, 1979] una
lista con más de 300 problemas NP-completos provenientes de los ámbitos más diversos.
Los problemas NP-completos son fáciles de enunciar y tiene formas diversas. Aquı́ hemos
elegido uno de ellos, simplemente por mostrar el tipo de problemas de los que se trata:
Problema Clásico 8.1.3 (3COLOR). Sea dado un grafo finito (no necesiariamente orien-
tado) G := ([n], E), donde [n] = {1, . . . , n} es un conjunto de vértices y E ⊆ 2[n] es un conjunto
de aristas dadas como subconjuntos X ⊆ [n] de cardinal 2. Sean dados tres colores {A, R, N }.
Decidir si el grado G se puede colorear de tal modo que dos vértices adyacentes (i.e. vértices
con una arista que los une) no tengan el mismo color.
El problema 3COLOR es uno de los muchos cientos de problemas NP−completos.
La primera consideración que hacemos es que los tres colores son mero artificio. Bien podemos
sustituir los tres colores por las tres raı́ces en C de la ecuación X 3 − 1. Es decir supongamos
que los tres colores son
2πi 4πi
(8.1.1) {1, e 3 ,e 3 },
2
o si se prefiere {1, ω, ω } en el anillo de los enteros de Einsenstein (cf. Ejemplo 1.4.19). Intro-
duzcamos ahora una serie de variables {X1 , . . . , Xn }, tantas variables como nodos V = [n] del
1La obra se publica en Bagdad en torno al año 820, y llegaré al atrasado mundo occidental en el siglo XI con
el tı́tulo “Liber Algebrae et Almucabola”. Se trata de una compilación de los algoritmos de la matemática clásica
(griega, fundamentalmente) con contribuciones relativas a la resolución de ecuaciones polinomiales univariadas.
Por eso se considera el origen del Álgebra. Se deformará el nombre del autor, dando lugar al término algoritmo.
386 8. NULLSTELLENSATZ

grafo G del Problema recién enunciado. Introduzcamos una serie de n polinomios f1 , . . . , fn ∈


Q[X1 , . . . , Xn ] definidos mediante:
fi (X1 , . . . , Xn ) = Xi3 − 1.
Para cada arista {i, j} ∈ E del grado F introduzcamos una serie adicional de ](E) polinomios
gi,j := Xi2 + Xi Xj + Xj2 ∈ Q[X1 , . . . , Xn ].
Observemos la siguiente indentidad
Xi3 − Xj3 2πi 4πi
gi,j (Xi , Xj ) = = (Xi − e 3 Xj )(Xi − e 3 Xj ).
Xi − Xj
Observamos la siguiente propiedad inmediata:
Dados xi ∈ C, xj ∈ C dos raı́ces cúbicas de la unidad (i.e.x3i − 1 = 0, x3j − 1 = 0), entonces
gi,j (xi , xj ) = 0 ⇐⇒ xi 6= xj .
Ea decir, si tomamos dos raı́ces cúbicas de la unidad, el polinomio gi,j se anula en ellas si y
solamente si son distintas. Por tanto, identificando los colores con la familia descrita en la
Igualdad (8.1.1), el problema de la 3-colorabilidad de un grafo es exactamente el siguiente:
Problema Clásico 8.1.4 (3COLOR como instancia del Nullstellensatz). Dado un grafo
F := ([n], E) y dado el ideal a ⊆ Q[X1 , . . . , Xn ] generado por la familia de polinomios
{f1 , . . . , fn } ∪ {gi,j : {i, j} ∈ E},
decidir si
VA (a) = ∅.
De hecho, todos los problemas NP−completos se pueden reescribir como el problema de Sa-
tisfactibilidad de ecuaciones polinomiales sobre cuerpos finitos (cf. [Pardo, 95], por ejemplo).
Es decir, todos los problemas NP−completos son instancias particulares de la siguiente forma
del Nullstellensatz:
Problema Clásico 8.1.5 (Satisfactibilidad sobre cuerpos finitos). Sea Fq un cuerpo
finito y sea Fq su clausura algebraica. Decidir algorı́tmicamente si dados polinomios f1 , . . . , fs ∈
Fq [X1 , . . . , Xn ] se verifica:
∃x1 ∈ Fq , . . . , ∃x1 ∈ Fq , f1 (x1 , . . . , xn ) = · · · = fs (x1 , . . . , xn ) = 0, xq1 − x1 = · · · = xqn − xn = 0.
Fijado el cuerpo Fq , este problema es también NP−completo y condensa en sı́ mismo toda la
Frontera de lo Intratable.
De hecho, se puede dar una forma incluso más refinada del Nullstellensatz que recoge todos los
problemas NP−completos, aunque no es un problema en la clase NP, hasta donde se conoce
actualmente:
Problema Clásico 8.1.6 (Nullstellensatz sobre variedades cero-dimensionales). Sea
K un cuerpo primo, sea K su clausura algebraica y sean dados f1 , . . . , fs , g ∈ K[X1 , . . . , Xn ]
una lista de polinomios. Supongamos que la variedad siguiente es un conjunto finito (se dice
cero-dimensional):
VA (f1 , . . . , fs ) = {x ∈ An (K) : f1 (x) = · · · = fs (x) = 0}.
Decidir si
∃ζ ∈ VA (f1 , . . . , fs ), g(ζ) = 0.
Todos estos ejemplos muestran que el Nullstellensatz, y su desarrollo algorı́tmico eficiente,
representan 1/6 de los principales problemas de la Matemática para el siglo XXI (Mille-
nium Problems). Por tanto, esta propuesta original de Hilbert ([Hilbert, 1890]) y Kronecker
([Kronecker, 1882]) están no sólo de actualidad sino que representan un problema central en
las matemáticas actuales. En lo que sigue nos ocuparemos simplemente en aportar una de-
mostración muy elemental del Teorema de Hilbert-Kronecker y su significado en la interacción
entre Sintaxis y Semática en la Geometrı́a Algebraica.
8.2. NULLSTELLENSATZ: PARTE I 387

8.2. Una demostración elemental del Nullstellensatz de Hilbert: Parte I


Los contenidos de esta sección están inspirados en en [Arr, 2006] y también la forma clásica
del pensamiento de L. Kronecker en [Kronecker, 1882], aunque no tanto la forma original de
D. Hilbert.
8.2.1. La resultante y los tensores de multiplicación módulo un polinomio mónico:
especialización de la resultante.
Comenzamos con un recordatorio y un resumen de las Proposiciones 4.7.2 y 4.7.3 de las Subsec-
ciones 4.7.2 y 4.7.3. También puede ser útil recordar la relación de la forma canónica de Jordan
de un endomorfismo con la resultante, aspecto que se desarrolla en las Subsecciones 5.4.1 y
5.4.2 El lector puede acudir a estos lugares en busca de detalles sobre las demostraciones:
Proposición 8.2.1 (Recordatorio). Sea R un anillo y sea f ∈ R[X]mon un polinomio mónico
univariado en R[X]). Se tiene:
i) La R−álgebra cociente:
A := R[X]/(f ),
es un R−módulo libre de rango igual a d := degX (f ), el grado de f con respecto a la
variable X. Una base como R−módulo libre (la base monomial) viene dada por:
B := {1 + (f ), X + (f ), X 2 + (f ), . . . , X d−1 + (f )}.
ii) Para cada g ∈ R[X], un polinomio no necesariamente mónico, consideremos el en-
domorfismo siguiente (que llamaremos homotecia de multiplicación por g ∈ R[X])
:
ηg : R[X]/(f ) −→ R[X]/(f )
h + (f ) 7−→ gh + (f ),
Entonces, se tiene:
(a) La matriz de ηg en la base monomial B descrita en el ı́tem precedente es la matriz
g(C(f )), donde C(f ) es la matriz compañera de f , es decir,
−u−1 a0
 
0 0 0 ···
1 0 0 · · · −u−1 a1 
−u−1 a2 
 
0 1 0 · · ·
C(f ) = 0 0 1 · · · −u−1 a3  ∈ Md (R),
 
 
 .. .. . . . .. .
.. 
. . . 
−1
0 0 0 · · · −u ad−1
donde f = uX d + ad−1 X d−1 + · · · + a1 X + a0 .
(b) Para cada polinomio g ∈ R[X], la clase g + (f ) satisface un polinomio mónico
con coeficientes en R (ecuación de dependencia entera). De hecho, dados los
anuladores:
AnnR[T ] (ηg ) := {p ∈ R[T ] : p(ηg ) = 0 ∈ EndR (A)},
y
AnnR[T ] (g + (f )) := {p ∈ R[T ] : p(g + (f )) = 0 + (f ) ∈ R[X]/(f )},
se tiene:
AnnR[T ] (ηg ) = AnnR[T ] (g + (f )).
En particular, si χg (T ) ∈ R[T ] es el polinomio caracterı́stico del endomorfismo
ηg , definido sobre un R−módulo libre, entonces χg (g + (f )) = 0 en R[X]/(f ).
(c) El determinante ResX (f, g) := det(g(C(f ))) ∈ R está en el ideal generado por
(f, g) en R[X] (y se denomina la resultante de f y g con respecto a la variable
X). Es decir, existen h1 , h2 ∈ R[X] tales que:
ResX (f, g) = h1 f + h2 g ∈ R[X].
De hecho, tenemos que ResX (f, g) ∈ (g, f )c está en la contracción del ideal
(f, g) ⊆ R[X] al anillo R.
(d) El endomorfismo ηg es un isomorfismo de R−módulos libres si y solamente si
ResX (f, g) ∈ R× es una unidad de R. Más aún, se tiene la equivalencia entre:
388 8. NULLSTELLENSATZ

• 1 ∈ (f, g),
• ResX (f, g) ∈ R× .
Demostración. La mayorı́a de las propiedades descritas estaban ya probadas en las las
Proposiciones 4.7.2 y 4.7.3. Si acaso, un pequeño inciso sobre la equivalencia entre:
• 1 ∈ (f, g),
• ResX (f, g) ∈ R× .
Es claro que si ResX (f, g) ∈ R× , entonces 1 ∈ (f, g)c ⊆ (f, g) con lo que tenemos una de las
implicaciones. En cuanto a la otra implicación, supongamos que 1 ∈ (f, g) en R[X]. Entonces,
existirán polinomios h1 , h2 ∈ R[X] tales que
1 = h1 f + h1 .g.
Por las propiedades de las homotecias, tenemos que
Id = η1 = ηh1 ◦ ηf + ηh2 ◦ ηg = ηh1 ◦ 0 + ηh2 ◦ ηg = ηh2 ◦ ηg ,
A

por lo que concluimos que ηg−1 existe y coincide con ηh2 . Por tanto, ηg es un isomorfismo de
R−módulos libres y ResX (f, g) = det(g(C(f ))) ∈ R× . 

Lema 8.2.2 (Especialización de la resultante). Como en la Proposición precedente, sea R


anillo, f ∈ R[X]mon un polinomio mónico, g ∈ R[X] un polinomio cualquiera. Sea p ∈ Spec(R)
un ideal primo de R. Supongamos:
f = uX d + ad−1 X d−1 + · · · + a1 X + a0 , g = bm X m + · · · + b0 ,
donde u ∈ R× es una unidad en R. Denotemos por f y g los polinomios en R/p[X] obtenidos
tomando módulo p los coeficientes de f y g respectivamente. Es decir,
f = (u + p)X d + (ad−1 + p)X d−1 + · · · + (a1 + p))X + (a0 + p) ∈ R/p[X],

g = (bm + p))X m + · · · + (b0 + p) ∈ R/p[X].


Obsérvese que f ∈ R/p[X]mon sigue siendo un polinomio mónico porque u 6∈ p. Denotemos
por ResX (f, g) ∈ R la resultante de f y g tal y como se define en el Lema precedente. Y sea
ResX (f , g) ∈ R/p la resultante de f y g como polinomios en R/p[X]. entonces, se tiene:

ResX (f, g) + p = ResX (f , g), en R/p.


Demostración. Se trata de verificar las identidades de manera sencilla. Nótese que esta-
mos trabajando en dos módulos distintos:
• El R−módulo libre de rango d:
R[X]/(f ).
• El R/p−módulo libre de rango d:

(R/p)[X]/(f ) ∼
= R/p ⊗R R[X]/(f ),
donde ya destacamos la presencia de la extensión de escalares, aunque aún no hallamos
hablado de ello. No es inapropiado empezar a encontrar el producto tensorial ⊗R ,
aunque sólo sea como notación en un caso muy particular.
En ambos casos tenemos las matrices compañeras:
−u−1 a0
 
0 0 0 ···
−u−1 a1 
 
1 0 0 ··· α1,1 α1,2 ··· α1,d
−u−1 a2 
 
0 1 0 ··· α2,1 α2,2 ··· α2,d 
C(f ) = 0 0 1 −u−1 a3  :=  . ..  ∈ Md (R),
   
··· .. ..
   .. . . . 
 .. .. . . .. .. 
. . . . .  αd,1 αd,2 ··· αd,d
0 0 0 · · · −u−1 ad−1
8.2. NULLSTELLENSATZ: PARTE I 389

y
−u−1 a0 + p
 
0 0 0 ···
1 + p 0 0 ··· −u−1 a1 + p
−u−1 a2 + p
 
 0 1 + p 0 ··· 
C(f ) =  0 −u−1 a3 + p ∈ Md (R/p),
 
 0 1+p ··· 
 .. .. .. .. .. 
 . . . . . 
−1
0 0 0 ··· −u ad−1 + p
luego
 
α1,1 + p α1,2 + p ··· α1,d + p
α2,1 + p α2,2 + p ··· α2,d + p
C(f ) =   ∈ Md (R/p).
 
.. .. .. ..
 . . . . 
αd,1 + p αd,2 + p · · · αd,d + p
Ahora, consideremos
 i  
α1,1 α1,2 ··· α1,d γ1,1 γ1,2 ··· γ1,d
m
X α2,1 α2,2 ··· α2,d  γ2,1 γ2,2 ··· γ2,d 
g(C(f )) := bi  . ..  =  .. ..  ∈ Md (R),
   
.. .. .. ..
i=
 .. . . .   . . . . 
αd,1 αd,2 ··· αd,d γd,1 γd,2 ··· γd,d

donde γi,j ∈ R se otienen mediante operaciones polinomiales (i.e. involucrando operaciones


{+, .×}) en las coordenadas αk,` (y, por tanto, de los coeficientes de f en R y u−1 ∈ R). Por
su parte

 i
α1,1 + p α1,2 + p ··· α1,d + p
m
X α2,1 + p α2,2 + p ··· α2,d + p
g(C(f )) := (bi + p)   ∈ Md (R/p),
 
.. .. .. ..
i=0
 . . . . 
αd,1 + p αd,2 + p ··· αd,d + p
Denotemos
 
δ1,1 δ1,2 ··· δ1,d
δ2,1 δ2,2 ··· δ2,d 
g(C(f )) =  . ..  ∈ Md (R/p),
 
.. ..
 .. . . . 
δd,1 δd,2 ··· δd,d
donde δi,j ∈ R/p se obtiene mediante funciones polinomiales en las coordenadas αk,` + p de
C(f ) y los coeficientes de g. Como las operaciones del anillo cociente se definen a partir de
las operaciones de cualesquiera de los representantes de la clase módulo p, podemos fácilmente
concluir que:
∀ i, j, 1 ≤ i, j ≤ d, γi,j + p = δi,j .
Seguidamente, las respectivas resultantes son determinantes, por cuanto concluimos:
 
γ1,1 γ1,2 · · · γ1,d
γ2,1 γ2,2 · · · γ2,d 
ResX (f, g) + p := det  . ..  + p ∈ R/p,
 
. .. . .
 . . . . 
γd,1 γd,2 ··· γd,d

Lo cual es equivalente a:
 
γ1,1 + p γ1,2 + p ··· γ1,d + p
γ2,1 + p γ2,2 + p ··· γ2,d + p
ResX (f, g) + p = det   ∈ R/p.
 
.. .. .. ..
 . . . . 
γd,1 + p γd,2 + p ··· γd,d + p
390 8. NULLSTELLENSATZ

Luego
 
δ1,1 δ1,2 ··· δ1,d
δ2,1 δ2,2 ··· δ2,d 
ResX (f, g) + p = det  . ..  = ResX (f , g) ∈ R/p,
 
.. ..
 .. . . . 
δd,1 δd,2 ··· δd,d
como se afirma en el enunciado. 

Corolario 8.2.3. Como en el resto de la sección, se K un cuerpo, K su clausura algebraica


y consideremos el anillo R := K[X1 , . . . , Xn−1 ]. Sean f ∈ K[X1 , . . . , Xn ] = R[Xn ]mon un
polinomio mónico con respecto a la variagle Xn y sea g ∈ K[X1 , . . . , Xn ] = R[Xn ] un polinomio
multivariado cualquiera. Sea ζ = (z1 , . . . , zn−1 ) ∈ An−1 (K) un punto cualquiera. Consideremos
h(X1 , . . . , Xn−1 ) := ResXn (f, g) ∈ K[X1 , . . . , Xn−1 ],
definido como en las proposiciones precedentes.
De otro lado, consideremos
fe(Xn ) := f (z1 , . . . , zn−1 , Xn ) ∈ K[Xn ]mon ,
ge(Xn ) := g(z1 , . . . , zn−1 , Xn ) ∈ K[Xn ].
Sea ResXn (f , ge) ∈ K la resultante de fe, ge ∈ K[Xn ]. Entonces,
e

ResXn (f, g)(ζ) := h(z1 , . . . , zn−1 ) = ResXn (fe, ge).


Demostración. Para empezar observemos que podemos suponer que K = K sin pérdida
de la generalidad. La razón es la siguiente:
Si f ∈ R[X]mon también se tiene f ∈ K[X1 , . . . , Xn ] y es mónico con respecto a la variable Xn .
Definiendo R e := K[X1 , . . . , Xn−1 ] claramente se tiene f ∈ R[X e n ]mon . Por supuesto, también
g ∈ R[Xn ]. Observemos, además, que si consideramos la extensión del ideal (f ) de R[Xn ] al
e
anillo R[X
e n ] sigue siendo el ideal principal generado por f , el cocciente R[X e n ]/(f )e sigue siendo
un R−módulo
e libre de rango igual a d := degXn (f ) y tenemos la misma base monomial, módulo
el ideal extendido:
B := {1 + (f )e , Xn + (f )e , . . . , X d−1 + (f )e }.
Por lo visto antes, la matriz del tensor de multiplicación por Xn en la nueva R−álgebra e y
e e
R−módulo
e (ηg
Xn : R[X
e n ]/(f ) −→ R[X
e n ]/(f ) ) sigue siendo la matriz compañera C(f ) de f .
Por tanto, sus coordenadas siguen estando en R. Ahora el tensor ηeg sigue teniendo por matriz
en la base monomial B anterior a la matriz g(C(f )) ∈ Md (R), con coordenadas en R. En
consecuencia, el determinante de esa matriz sigue siendo un elemento en R, es decir,
ResXn (f, g) = det(g(C(f ))) = h(X1 , . . . , Xn−1 ) ∈ R = K[X1 , . . . , Xn−1 ].
En otras palabras, pasando del cuerpo K a su clausura algebraica K, la resultante de f y g no
varı́a porque f, g ∈ K[X1 , . . . , Xn ] y ResXn (f, g) sigue siendo un polinomio en K[X1 , . . . , Xn−1 ]
aunque sea la resultante de f y g como elementos de K[X1 , . . . , Xn ].
Supongamos, entonces, que K = K es un cuerpo algebraicamente cerrado. Apliquemos el Lema
precedente, usando como ideal primo de R (i.e. en Spec(K[X1 , . . . , Xn−1 ])) el ideal maximal
(discutido en la Proposición 7.3.15):
mζ := IK ({ζ}) ∈ MaxSpec(K[X1 , . . . , Xn−1 ]).
Como K = K es algebraicamente cerrado, esa misma Proposición nos dice que si ζ = (z1 , . . . , zn−1 ),
entonces mζ tiene la forma siguiente:
mζ = (X1 − z1 , . . . , Xn−1 − zn−1 ) ⊆ K[X1 , . . . , Xn−1 ].
Consideremos f , g ∈ R/mζ [Xn ] = K[Xn ], tomando clases módulo mζ , que son, precisamente, los
polinomios fe, ge respectivamente definidos en el enunciado de este Corolario. Baste recordar la
Proposición 7.3.15 en la que se observa que tomar clases módulo mζ es lo mismo que evaluar en ζ
porque, al cabo, mζ es simplemente el núcleo de la función evaluación evζ : K[X1 , . . . , Xn−1 ] −→
K. Usando el lema precedente, se sigue la afirmación de modo obvio. 
8.2. NULLSTELLENSATZ: PARTE I 391

El siguiente Corolario pretende redondear la comprensión de la proyección (i.e. eliminación de


cuantificadores existenciales) en un caso particular, que refuerza lo descrito en la Proposición
7.3.21.

Corolario 8.2.4. Sea K un cuerpo y sea K cu clausura algebraica. Sean f, g ∈ K[X1 , . . . , Xn ]


y supongamos que f es mónico con respecto a la variable Xn . Sea π : An (K) −→ An−1 (K) la
proyección que “olvida” la coordenada n−ésima. Entonces, se tiene:

VAn−1 (K) (ResXn (f, g)) = π(VAn (K) (f, g)).

En particular, bajo estas hipótesis, π(VAn (K) (f, g)) ⊆ An−1 (K) es una variedad algebraica
K−definible.

Demostración. Sin ánimo de confundir escribamos VA para denotar variedades, dejando


que el contexto permita entender ci estamos en An (K) o en An−1 (K).
Ya hemos recordado en el ı́tem ii), (b) de la Proposición 8.2.1 precedente, que ResXn (f, g) ∈
(f, g)c = (f, g) ∩ K[X1 , . . . , Xn−1 ]. Por la Proposición 7.3.21, es claro que ResXn (f, g) se anula
en π(VA (f, g)) y π(VA (f, g)) ⊆ VA (ResXn (f, g)).
Se trata, por tanto, de probar el otro contenido. Supongamos que x = (x1 , . . . , xn−1 ) ∈ An−1 (K)
es un punto tal que ResXn (f, g)(x) = 0. Como f es mónico, el siguiente polinomio univariado
es un polinomio no nulo en K[Xn ]mon (es decir, es también mónico con respecto a la variable
Xn ):
fx := f (x1 , . . . , xn−1 , Xn ) ∈ K[Xn ]mon .
Consideremos también el polinomio gx := g(x1 , . . . , xn−1 , Xn ) ∈ K[Xn ]. Como fx es un poli-
nomio no nulo y K es algebraicamente cerrado, ha de existir ζ ∈ K tal que fx (ζ) = 0. Con-
sideremos todas las raı́ces de fx en K que, como K es algebraicamente cerrado, nos permite
descomponer fx en factores de grado 1 de la forma siguiente:
d
Y
fx := (X − ζi ),
i=1

donde d := deg(fx ) = degXn (f ) y los ceros ζi aparecen repetidos con su multiplicidad. Ahora,
por la capacidad de especialización de la resultante en K[X1 , . . . , Xn−1 ][Xn ], cuando uno de los
polinomios es mónico, tendremos que:

ResXn (fx , gx ) = ResXn (f, g)(x).

Pero, además, hemos visto en la Proposición 5.4.6 que, gracias al pensamiento de C. Jordan, la
resultante, en el caso de que uno de los polinomios sea mónico, consiste en evaluar el segundo
polinomio en los ceros de primero repetidos con su multiplicidad. Es decir,
d
Y d
Y
ResXn (fx , gx ) = gx (ζi ) = g(x, ζi ).
i=1 i=1

Por lo anterior, como ResXn (f, g)(x) = 0 concluimos que ha de existir i, 1 ≤ i ≤ d tal que
g(x, ζi ) = 0. Pero eso significa que el punto (x, ζi ) ∈ An (K) verifica

f (x, ζi ) = g(x, ζi ) = 0.

En otras palabras, (x, ζi ) ∈ VA (f, g) y, en particular, x = π(x, ζi ) ∈ π(VA (f, g)), lo que concluye
la prueba del otro contenido y del enunciado. 

Observación 8.2.5. El anterior resultado, en realidad, prueba el poder de tener las variables
en posición de Noether o, dicho de otro modo, estar ante una extensión entera de anillos. Pero
ese asunto lo trataremos en detalle más adelante.
392 8. NULLSTELLENSATZ

8.2.2. La prueba de la Parte I del Nullstellensazt de Hilbert-Kronecker.


Lema 8.2.6. Si K es un cuerpo y K es su clausura algebraica, para un ideal a ⊆ K[X1 ] son
equivalentes VA1 (K) (a) = ∅ y 1 ∈ a.
Demostración. Es obvio por la propia definición de clausura algebraica y no necesita de
mayores aclaraciones. 

De nuevo, jugando con las proyecciones, observamos que la propiedad de tener un elemento
a ∩ K[X1 , . . . , Xn−1 ][Xn ]mon facilita determinar las proyecciones (al menos en una variable) de
los ceros afines de a:
Lema 8.2.7 (cf. [Arr, 2006]). Sea K un cuerpo, sea K su clausura algebraica. Sea n ∈ N un
entero con n > 1. Sea a ⊆ K[X1 , . . . , Xn ] un ideal propio y sea ac = a ∩ K[X1 , . . . , Xn−1 ] su
contracción. Supongamos que existe f ∈ a un polinomio mónico con respecto a la variable Xn .
Sea π : An (K) −→ An−1 (K) la proyección que “olvida” la coordenada n−ésima. Entonces, se
tiene:
i) π(VAn (K) (a)) = VAn−1 (K) (ac ),
ii) VAn (K) (a) 6= ∅ si y solamente si VAn−1 (K) (ac ) 6= ∅.
Demostración. Supongamos K = K es algebraicamente cerrado y probemos la afirmación
i). Notemos que si a es un ideal propio en K[X1 , . . . , Xn ], también su contracción ac es propio
porque no puede darse 1 ∈ ac . De nuevos escribiremos de forma simplificada VA , dejando al
lector interpretar si se trata de An (K), An−1 (K) o A( K).
z
Por la Proposición 7.3.21, sabemos que VA (ac ) = π(VA (a)) ⊃ π(VA (a).
Recı́procamente, supongamos que x ∈ VA (ac ). Ahora consideremos el siguiente conjunto de
polinomios univariados:
ax := {g(x, Xn ) : g ∈ a}.
Es obvio que ax es un ideal en K[Xn ]. Por tanto, es un ideal principal y posee un generador
hx (Xn ) := h(x, Xn ) donde h ∈ a. También tendremos un polinomio f ∈ a que es mónico con
respecto a la variable Xn . Consideremos ahora la resultante:
ResXn (f, h) ∈ ac ⊆ K[X1 , . . . , Xn−1 ].
Tenemos que ResXn (f, g)(x) = 0 y, por los mismos argumentos que en el Corolario 8.2.4 prece-
dente, existirá ζ ∈ K tal que
f (x, ζ) = 0, h(x, ζ) = 0.
Ahora sea g ∈ a tenemos que hx | gx (con las notaciones precedentes) porque gx ∈ ax . Por
tanto, gx se ha de anular en todas las raı́ces de hx , pero como hx (ζ) = 0, concluimos que
gx (ζ) = g(x, ζ) = 0 para todo g ∈ a. Por tanto, (x, ζ) ∈ VA (a) y x = π(x, ζ) ∈ π(VA (a)).
Nótese que, en los argumentos precedentes, el papel del cuerpo de coeficientes es nulo: lo único
que usamos es la existencia de raı́ces en la clausura algebraica del cuerpo de coeficientes, luego el
argumento sigue siendo válido para un ideal a en K[X1 , . . . , Xn ] siempre que VA (a) = VAn (K) (a),
VA (ac ) = VAn−1 (K) (ac ) y la proyección sea entre los respectivos espacios afines de dimensiones
n y n − 1 sobre K.
La propiedad ii) se sigue obviamente de la propiedad i) dado que un subconjunto X ⊆ An (K)
es no vacı́o si y solamente si su proyección π(X) es no vacı́a. 

8.3. Un cambio de coordenadas útil


Hemos visto la utilidad de disponer de polinomios mónicos en un ideal de un anillo de poli-
nomios. Veamos cómo podemos hacer un cambio lineal de coordenadas del espacio ambiente
para lograr esa situación. Como antes, sea K un cuerpo y sea K la clausura algebraica de K.
Consideremos (t1 , . . . , tn−1 , 1) ∈ An (K). Consideremos el siguiente cambio de variables:


 Y1 = X1 − t1 Xn ,
Y2 = X2 − t2 Xn ,




(8.3.1) ..
 .
Y = Xn−1 − tn−1 Xn ,

 n−1



Yn = Xn .
8.3. UN CAMBIO DE COORDENADAS ÚTIL 393

Consideremos el isomorfismo de K−álgebras dado por este cambio de coordenadas:


ϕ : K[X1 , . . . , Xn ] −→ K[Y1 , . . . , Yn ]
(8.3.2)
f 7−→ f (Y1 + t1 Yn , . . . , Yn−1 + tn−1 Yn , Yn ).
Lema 8.3.1. Se verifican las siguientes propiedades:
i) Si a ⊆ K[X1 , . . . , Xn ] es un ideal propio, entonces ϕ(a) es un ideal propio. Y
recı́procamente.
ii) Consideremos la matriz triangular P ∈ Mn (K) dada mediante:
   
Y1 X1
 ..   .. 
 .  = P  . ,
Yn Xn
es decir, la matriz
 
1 0 ··· 0 −t1
0 1
 ··· 0 −t2 

P :=  ... .. ..
.
 
 . . 
0 0 ··· 1 −tn−1 
0 0 ··· 0 1
La matriz inversa de la matriz P es dada mediante:
 
1 0 ··· 0 t1
0
 1 ··· 0 t2 
P −1 :=  ... .. ..  .

 . . 

0 0 · · · 1 tn−1 
0 0 ··· 0 1
iii) El isomorfismo ϕ : K[X1 , . . . , Xn ] −→ K[Y1 , . . . , Yn ] de la Identidad (8.3.2) precedente
satisface:
∀f ∈ K[X1 , . . . , Xn ], ϕ(f ) = (f ◦ P −1 )(Y1 , . . . , Yn ).
iv) Consideramos el automorfismo de K−espacios vectoriales dado por P :
P : Kn −→ 
n
 K  
x1 y1 x1
 ..   ..   . 
 .  7−→  .  := P  ..  .
xn yn xn
Este isomorfismo induce un automorfismo del espacio afı́n An (K) en sı́ mismo que
satisface lo siguiente:
Para cada ideal a de K[X1 , . . . , Xn ], se tiene:
VA ((ϕ(a)) = P (VA (a)).
En particular, VA (a) 6= ∅ si y solamente si VA (ϕ(a)) 6= ∅.
Demostración. Son todos ejercicios elementales. 

Observación 8.3.2 (Construcción a partir de las componentes homogéneas).


Consideremos el anillo K[X1 , . . . , Xn ] y su descomposición dada como suma directa de subes-
pacios vectoriales, determinados por los polinomios homogéneos de grado fijado (recuérdese la
Proposición 1.4.40):
K[X1 , . . . , Xn ] = ⊕n∈N Hd (X1 , . . . , Xn ).
consideremos un polinomio no nulo cualquiera f ∈ K[X1 , . . . , Xn ] \ {0}. Podemos descomponer
f en sus componentes homogéas. Es decir, podemos escribir :
f := fd (X1 , . . . , Xn ) + · · · + f0 (X1 , . . . , Xn ),
394 8. NULLSTELLENSATZ

donde fi ∈ Hi (X1 , . . . , Xn ) es un polinomio homogéneo de grado i, con fd 6= 0. En particular,


tenemos X µ1
fi (X1 , . . . , Xn ) := a(i) µn
µ X1 · · · Xn ,
|µ|=i

n (i)
donde µ = (µ1 , . . . , µn ) ∈ N , |µ| = µ1 + · · · + µn ∈ N, aµ ∈ K. Supongamos que deg(f ) = d
y, por tanto, que fd 6= 0.
Sea ϕ : K[X1 , . . . , Xn ] −→ K[Y1 , . . . , Yn ] el isomorfismo de K−álgebras descrito en la Sección
precedente. Por ser ϕ, de hecho, una aplicación lineal entre K−espacios vectoriales, ϕ respe-
ta las componentes homogéneas de los polinomios y tendremos que si g = ϕ(f ) admite una
descomposición en componentes homogéneas del tipo:
g := gd (X1 , . . . , Xn ) + · · · + g0 (X1 , . . . , Xn ),
donde gi = ϕ(fi ). En otras palabras, tenemos que
gi (Y1 , . . . , Yn ) = fi (Y1 + t1 Yn , . . . , Yn−1 + tn−1 Yn , Yn ), ∀i, 0 ≤ i ≤ d.
En particular, tendremos la siguiente igualdad:
X
gi (Y1 , . . . , Yn ) := a(i)
µ (Y1 + t1 Yn )
µ1
· · · (Yn−1 + tn−1 Yn )µn−1 Ynµn .
|µ|=d

Lema 8.3.3. Sean f y g como en la Observación precedente, entonces, existe un polinomio


h ∈ K[Y1 , . . . , Yn ] tal que
g = fd (t1 , . . . , tn−1 , 1)Ynd + h,
y el grado de h con respecto a la variable Yn es menor estricto que d.
En particular, si f (t1 , . . . , tn−1 , 1) 6= 0, entonces g ∈ K[Y1 , . . . , Yn−1 ][Yn ]mon es un polinomio
mónico con respecto a la variable Yn salvo unidades en K.
Demostración. Obvio por mera reescrittura. 

8.4. Tests de (no) nulidad para polinomios.


En el diseño de algoritmos que manipulan polinomios multivariados, no siempre se manejan los
polinomios como un vector de coeficientes. La mayor dificultad surge cuando se hace Geometrı́a
Algebraica Computacional (o, más clásicamente, Teorı́a de la Eliminación). Los polinomios
que son generados por la Teorı́a de la Eliminación, de manera completamente natural y por
razones semánticas, tienen un crecimiento exponencial de su grado tras la eliminación de un
bloque de cuantificadores existenciales (Nullstellensatz o Conjetura de Cook). Si el grado crece
2
exponencialmente, el número de coeficientes crece hasta cantidades del tipo dO(n ) donde n es
el número de variables y d es el grado de los polinomios de inicio (Input). Una referencia en la
que se expone esta fenomenologı́a, ası́ como algunos antecedentes sobre el tema es [Pardo, 95].
Por esa razón, en ocasiones se ha utlizado con éxito la codificación (representación, forma de
escribir) de polinomios no ya como sucesiones (es decir, a partir de la definición de polinomio,
dados como una lista de sus coeficientes en R[X1 , . . . , Xn ]), sino mediante programas que los
evalúan. En este sentido se hace un cierto salto incompleto de la sintaxis a la semántica
porque nos acercamos más a su carácter de funciones polinomiales. Estos programas pueden
ser mucho más cortos (tamaño de su código) que la mera lista de sus coeficientes (véase, por
ejemplo, la secuencia de trabajos del concepto TERA-Kronecker, desarrollados en los años
90 en [GHMP, 97a], [GHHMMP, 97b], [HMPS, 2000]). No entraremos por ahora en la
definición de esos programas conocidos usualmente como esquemas de evaluación y, en tiempos
más recientes, simplemente como redes neuronales con functión de activación polinomial.
Cuando dos polinomios f, g son dados por programas (de cualquier tipo) es elemental diseñar
programas que evaluan los polinomios f + g, f − g, f g. No queda tan claro, sin embargo, si un
polinomio f dado por un programa es o no el polinomio nulo. Escamoteadas entre decenas de
operaciones del programa puede estar oculto el hecho de que, a partir de un cierto momento,
sólo estamos ante ininteligibles operaciones del tipo 0 + 0, f − f o 0g. Obviamente, un proceso
de interpolación (i.e. cálculo de coeficientes) nos sacarı́a de dudas. Pero, incluso si interpolar
fuera simple computacionalmente, la mera exposición de la lista de coeficientes nos lleva de
nuevo a escribir el polinomio en forma “densa” (i.e. por sus coeficientes) y eso es muy caro en
8.4. TESTS DE (NO) NULIDAD PARA POLINOMIOS. 395

términos computacionales cuando se trata de polinomios de Teorı́a de Eliminación (como los


citados en el párrafo precedente).
En otras palabras, la alternativa natural a evitar la codificación densa de polinomios pasa por:
Desarrollar Tests de Nulidad para Esquemas de evaluación. Se trata de algoritmos
que evalúan los códigos dados (los programas que definen a esas funciones polinomiales) en un
número finito ( a ser posible en un número pequeño) de puntos. Con los valores de esas “pocas”
evaluaciones, tratamos de decidir si ambos esquemas de evaluación evalúan la misma función.
En esta Sección nos ocuparemos de estos Tests de Nulidad que pertenecen a tres tipos funda-
mentalmente :
i) Los Tests de Schwartz-Zippel-DeMillo-Lipton. Se trata de seleccionar un conjunto
fijo y, para cada polinomio, hay muchos puntos en los que un polinomio no nulo de
cierto grado no se anula. El conjunto de puntos de test es excesivamente grande: de
tamaño (2d + 1)n , donde d es una cota del grado del polinomio no nulo a testar y n
es el número de variables involucradas. Es por tanto, un test que necesita un número
exponencial de evaluaciones para para garantizar con seguridad (determinı́sticamente)
que nuestro polinomio es no nulo. Pero, afortuadamente, la probabilidad de dar con
un punto donde no se anula el polinomio dado es alta, con lo que se convierte en un
test probabilista que asume un conjunto. Fueron introducidos en los trabajos de J.T.
Schwartz en [Schw, 1980], por R. Zippel en [Zip, 1990]y por R.A. DeMillo y R.J.
Lipton en [DeMLi, 1978], por lo que, en ocasiones, se suele denominar el Test de
Schwartz-Zippel-DeMillo-Lipton.
ii) Los Cuestores o Correct Test Sequences. Se trata de un principio opuesto al descrito
en el caso precedente. Aquı́, se buscan conjuntos cortos garantistas y válidos para
clases de polinomio. Es decir, se considera un subconjunto C ⊆ K[X1 , . . . , Xn ] de
polinomios que satisface alguna propiedad geométrica en un espacio afı́n AL (K) de
dimensiń finita sobre K. Se busca una lista “pequeña” Q = {x1 , . . . , xM } ⊆ An (K)
de puntos que sea garantista para polinomios en el conjunto C dado. Es decir, que se
satisfaga:

∀f ∈ C, f (x1 ) = · · · = f (xM ) = 0 =⇒ f ≡ 0.

Tales conjuntos Q se denominan conjuntos cuestores o correct test sequences. En


términos de Aprendizaje Computacional se denominan universal teaching sequences.
Lo relevante del asunto es que existen “muchos” conjuntos de longitud M lineal en
la dimensión de C y que, además, son muy densos en conjuntos del estilo del test
precedente. Desafortunadamente, no existe un método determinista para detectar
tales conjuntos cuestores. La probabilidad se traslada a usar test probabilı́sticos para
hallar conjuntos cuestores para C y, una vez hallados, usarlos sistemáticamente para
cualquier polinomio en la clase C. Fue introducido en el trabajo de J. Heintz y C.P.
Schnorr (cf. [HeSc, 82]) y analizados en profundidad en [?]. La versión que aquı́ se
incluye es la versión, bastante refinada, de [KrPa, 1996]. Sin embargo, no disponemos
aún de las herramientas matemáticas requeridas para abordarla con detalle.
iii) Witness Theorem. Se trata de observar que, en ocasiones, uno puede encontrar con-
juntos cuestores formados por un sólo punto donde un polinomio no nulo no se anula.
Esto ya aparece implı́citamente ya en la obra de L. Kronecker y se conoce como Es-
quema de Kronecker. En el caso de polinomios con coeficientes en Z el resultado
aparece recogido, y atribuido a Kronecker, en el trabajo [HeSc, 82]. Posteriormente,
S. Smale en [BCSS, 1996] redescubre el esquema de Kronecker para polinomios
con coeficientes en un cuerpo de números y lo denomina “Witness Theorem” (véase
también [BCSS, 1998]). Sin embargo, las estimaciones de Smale y sus colaboradores
eran muy groseras. Las estimaciones se mejoran en el trabajo [CHMP, 2001].
Haremos la demostración del Test de Schwartz-Zippel-DeMillo-Lipton y dejaremos los otros re-
sultados, mucho más técnicos, para el momento en que se disponga de herramientas matemáticas
suficientes para poder interpretarlos y trabajarlos. No obstante, nos parecı́a que limitarse al
Test de Schwartz-Zippel-DeMillo-Lipton era una manera de borrar el amplio contexto del prob-
lema. Por eso es opcional (y sólo como guı́a de posibles lecturas futuras del actual lector) el
396 8. NULLSTELLENSATZ

material correspondiente a los Cuestores y al Witness Theorem. Adicionalmente, por su sen-


cillez, hemos incluido una idelogı́a similar para los Tests de Nulidad de Números dados por
programas siguiendo el trabajo de [IM, 1983], que también se presenta como lectura opcional.

8.4.1. El Test de Schwartz-Zippel-DeMillo-Lipton. La clave del Test de Schwartz-


Zippel-DeMillo-Lipton es el siguiente enunciado :
Lema 8.4.1. Sea f ∈ K[X1 , . . . , Xn ] un polinomio no nulo. Definamos recursivamente los
siguientes polinomios :
• Para i = 1, consideremos:
Q1 := f ∈ K[X1 , . . . , Xn ], d1 := degX1 (Q1 ),
y definamos Q2 ∈ K[X2 , . . . , Xn ] como el coeficiente de X1d1 en Q1 .
• Para 2 ≤ i ≤ n − 1 definamos recursivamente :
di := degXi Qi ,
y sea Qi+1 ∈ K[Xi+1 , . . . , Xn ] el coeficiente de Xidi in Qi .
• Para i = n, definamos dn := degXn (Qn ), donde Qn ∈ K[Xn ].
Consideremos para cada i, 1 ≤ i ≤ n, Q
un subconjunto finito Ii ⊆ K.
n
Entonces, el número de ceros de f in i=1 Ii := I1 × · · · × In verifica:
n
!  
Y d1 dn
] VA (f ) ∩ Ii ≤ ](I1 × · · · × In ) + ··· + .
i=1
](I1 ) ](In )

Demostración. La prueba se sigue por inducción en n. En el caso n = 1 es obvio que un


polinomio univariado de grado d1 con coeficientes en un cuerpo no posee más de d1 ceros en el
cuerpo. La razón última es la interpolación de polinomios que se discute en los Problemas 174
y 175 y, al cabo, el hecho de que K[X1 ] es un dominio de factorización única.
Consideremos ahora el caso n > 1. Consideremos el polinomio Q2 ∈ K[X2 , . . . , Xn ] que es
el coeficiente director de f con respecto a la variable X1 . Por construcción, la secuencia de
polinomios Q2 , . . . , Qn y de grados d2 , . . . , dn es la misma comenzando por Q2 o comenzando
por f . Por tanto, podemos aplicar Qn la hipótesis inductiva a Q2 y tenemos que el número de
elementos de x = (x2 , . . . , xn ) ∈ i=2 Ii en los que Q2 no se anula es de cardinal mayor que:
n n n
! n n
!
Y Y X di Y X di
](Ii ) − ](Ii ) = ](Ii ) 1 − .
i=2 i=2 i=2
](Ii ) i=2 i=2
](Ii )
Qn
Para cada uno de los x = (x2 , . . . , xn ) ∈ i=2 Ii en los que Q2 (x) 6= 0, el polinomio f toma la
forma:
f (X1 , x2 , . . . , xn ) = Q2 (x)Y1d1 + h(X1 ),
donde h es un polinomio de grado a lo sumo d1 − 1. En consecuencia, este polinomio univariado
no se puede anular en, al menos, ](I1 ) − d1 elementos de I1 . Y esto para cada x con esas
condiciones.
Qn Por tanto, f no se anula en, al menos, el siguiente número de elementos de
i=1 Ii : !
n n
Y X di
P := (](I1 ) − d1 ) ](Ii ) 1 − .
i=2 i=2
](Ii )
Desarrollando este producto obtenemos
n n
! n n
!
Y X di Y X di
P := ](I1 ) ](Ii ) 1 − − d1 ](Ii ) 1 − .
i=2 i=2
](I i) i=2 i=2
](I i)

Luego
n n n
! n n n
!
Y Y X di d1 Y d1 Y X di
P := ](Ii ) − ](Ii ) − ](Ii ) + ](Ii ) .
i=1 i=1 i=2
](I i) ](I1 ) i=1 ](I1 ) i=1 i=2
](I i)

Por tanto,
8.4. TESTS DE (NO) NULIDAD PARA POLINOMIOS. 397

n n
! n n n
!
Y X di d1 Y Y X di
P ≥ ](Ii ) 1 − − ](Ii ) = ](Ii ) 1 − ,
i=1 i=2
](Ii ) ](I1 ) i=1 i=1 i=1
](Ii )
y se sigue el enunciado previsto. 
Tenemos la siguiente aplicación inmediata:
Corolario 8.4.2. Con las notaciones previas, sea I un subconjunto finito de K and F ∈
K[X1 , . . . , Xn ] un polinomio de grado d. La probabilidad de que una elección aletaoria de un
punto x ∈ I n sea un cero de F es, a lo sumo :
d
](I)
En particular, si ](I) ≥ 2d + 1,la probabilidad de que una elección aletoria en I n de un valor
no nulo de F es, al menos, 1/2.
Demostración. Basta con usar el Lema precedente con I = I1 = · · · = In . 
Esto genera el siguiente algoritmo probabilista polinomial (RP o MonteCarlo) para detectar
polinomios no nulos.

Input : El código de un programa G en n variables, que evalúa un polinomio de grado d.


guess ad random
x = (x1 , . . . , xn ) ∈ {−d, . . . , 0, 1, . . . , d}n .
Eval G en x.
if G(x) 6= 0, Output : “Es un polinomio no nulo”,
else Output : “Probablemente sea nulo”,
fi
end

El error del algoritmo se produce si G es un polinomio no nulo, pero el algoritmo devuelve la


expresión “Probablemente sea nulo”. Esto se produce si una elección aleatoria (distribución
uniforme) de un punto x ∈ {−d, . . . , 0, 1, . . . , d}n es tal que G(x) devuelve 0, porque el polinomio
que evalúa G se anula en ese especı́fico punto x. Pero la probabilidad de que eso ocurre está
acotada por
d d 1
= < .
](I) 2d + 1 2
Para disminuir la probabilidad de error, basta con hacer un número alto (digamos k) elecciones
aleatorias independientes de puntos en I n . En ese caso, asumiendo k elecciones independientes,
la probabilidad de error caerı́a a una cantidad acotada por:
1
.
2k
Observación 8.4.3 (Las dificultades en el caso de que el cuerpo K sea finito). Nótese,
sin embargo, que hay un problema implı́cito en la propuesta. Si K fuera un cierpo finito,
pongamos de q elementos, y f ∈ K[X1 , . . . , Xn ] fuera un polinomio de grado d, con d > q, no
podrı́amos encontrar ningún subconjunto I ⊆ K tal que ](I) ≥ 2d + 1. La única salida para
utilizar este tipo de algoritmos consiste en ampliar el cuerpo finito K buscando una extensión
algebraica finita L de K para obviar la dificultad. Daremos algunas pistas en las páginas que
siguen.

En todo caso si el cuerpo K posee suficientes elementos, y f ∈ K[X1 , . . . , Xn ] \ {0} es un


polinomio no nulo es seguro (aunque no sea obvio cómo hallarlo) que hay algún punto x ∈ K n
fuera de la hiper-superficie VA (f ). Es lo que se aclara en el siguiente resultado:
Corolario 8.4.4. Con las anteriores notaciones, si existe un subconjunto I de K de, al menos,
2d + 1 elementos, entonces para todo polinomio no nulo f ∈ K[X1 , . . . , Xn ] \ {0} de grado a
lo sumo d existe (t1 , . . . , tn ) ∈ K n tal que f (t1 , . . . , tn ) 6= 0 (o, equivalentemente, (t1 , . . . , tn ) 6∈
VAn (K) (f )).
398 8. NULLSTELLENSATZ

Demostración. Consecuencia inmediata del resultado precedente. 

Nótese que, aunque muy lejanamente, esto nos acerca a la pregunta de saber cuántos puntos
K−racionales hay en una hipersuperficie VA (f ) y, en general, en una variedad VA (a).

8.4.2. Cuestores (Opcional, resumen de sólo lectura).


Definición 102. Dado un subconjunto (no necesariamente finito) F ⊂ K[X1 , . . . , Xn ] (que
contiene al polinomio nulo) Diremos que un conjunto finito Q ⊂ An (K) es un questor (o una
“Correct Test Sequence”) para F si y sólo si para todo F ∈ F se tiene :
P |Q = 0 =⇒ P ≡ 0 .
El resultado depende fuertemente de la desigualdad de Bézoutque analizaremos posteriormente.
El primer resultado significativo es el siguiente :
Lema 8.4.5 ([KrPa, 1996]). Sea W(L, `, n) el conjunto de todos los polinomios en K[X1 , . . . , Xn ]
que se pueden evaluar mediante un esquema de evaluación de talla L y profundidad `. Sea
W (L, `, n) la clausura Zariski de ese conjunto. Entonces, se verifica

deg W (L, `, n) ≤ (2`+1 − 2)2L(L−(n+1)) .


Teorema 8.4.6 (Existencia de Conjuntos Cuestores). Sea K un cuerpo y sean n, `, L ∈ N,
L ≥ n + 1. Sean
u := (2`+1 − 2) (2` + 1)2 and t := 6 (`L)2 .
Supongamos que la caracterı́stica de K es mayor que u o que la caracterı́stica de K es cero.
t
Entonces, el conjunto {1, . . . , u}n ⊂ K n contiene al menos unt (1 − u− 6 ) conjuntos cuestores
de longitud t para W (L, `, n). En particular, contiene al menos uno.
Observe el lector que un elección aleatoria de un subconjunto cualquiera de t elementos del
conjunto {1, . . . , u}n ⊂ K n es un conjunto cuestor para W (L, `, n) con probabilidad mayor que
t
(1 − u− 6 ) > 1/2.
Por tanto, el algoritmo del Tests de Schwartz-Zippel-DeMillo-Lipton se transforma en un algo-
ritmo RP mediante el siguiente esquema :

Input : El código de un esquema de evaluación bien paralelizable G en n variables, que evalúa


un polinomio de grado d. Supongamos que G es de talla L y profundidad `.
Compute u y t (como en el Teorema anterior)
guess indeterministically Q ⊆ {1, . . . , u}n de cardinal t.
Eval G en x para cada x ∈ Q.
if G(x) 6= 0, para algún x Output : “Es un polinomio no nulo”,
else Output : “Probablemente sea nulo”,
fi
end

En este caso, la probabilidad de no cometer errores es, al menos


t
(1 − u− 6 ).

8.4.3. Witness Theorem. Comencemos fijando la terminologı́a con la siguiente Definición :


Definición 103. Un testigo (Witness) para un polinomio F ∈ K[X1 , . . . , Xn ] es un punto
ω ∈ K n tal que si F (ω) = 0 implica P = 0.
En otras palabras, un testigo es un punto ω ∈ K n fuera del conjunto de puntos K−racionales
de la hipersuprficie VA (F ) (si hubiera alguno). La manera de obtenerlo de modo explı́cito es el
siguiente Teorema
8.4. TESTS DE (NO) NULIDAD PARA POLINOMIOS. 399

Teorema 8.4.7 (Witness Theorem). Sea K un cuerpo de números, F ∈ K[X1 , . . . , Xn ] un poli-


nomio no nulo evaluable por un esquema de evaluación Γ de talla L, profundidad ` y parámetros
en F ⊆ K. Sea ω0 ∈ K tal que se verifica la siguiente desigualdad :
ht(ω0 ) ≥ max{log 2, ht(F)}.
Sea N ∈ N un número natural tal que se verifica la siguiente desigualdad :
log N > log(` + 1) + (` + 2)(log 2) (log log(4L)) .
Definamos recursivamente la siguiente secuencia de números algebraicos (conocida como Es-
quema de Kronecker) :
ω1 = ω0N ,
y para cada i, 2 ≤ i ≤ n, definamos
N
ωi = ωi−1 .
n
Entonces, el punto ω := (ω1 , . . . , ωn ) ∈ K es un testigo para F (i.e. F (ω) 6= 0).
La demostración se sigue por un argumento inductivo, que usa fuertemente una Generalización
de la Desigualdad de Liouville, descrito en [CHMP, 2001].
Corolario 8.4.8. Sea F ∈ K[X1 , . . . , Xn ]un polinomio no nulo evaluable por un esquema de
evaluación de talla L, profundidad ` y parámetros en F := {x1 , . . . , xr } ⊆ K. Sea ω−1 ∈ K tal
que
ht(ω−1 ) := max{log 2, ht(x1 ), . . . , ht(xr )}.
2
2L
Definamos ω0 ∈ K como ω0 := ω−1 . Sea N ∈ N un número natural tal que
log N > log(` + 1) + (` + 2)(log 2) (log log(4L)) .
Definamos recursivamente la siguiente secuencia de números algebraicos (Esquema de Kro-
necker) :
ω1 = ω0N ,
N
y para cada i, 2 ≤ i ≤ n, definamos ωi = ωi−1 . Entonces, el punto ω := (ω1 , . . . , ωn ) ∈ K n es
un Testigo para F (i.e. F (ω) 6= 0).
Observación 8.4.9.

i) El resultado nos da, codificado como un esquema de evaluación, un punto en el que no


se anula el polinomio dado. Sin embargo, el tal Testigo es un punto que, en expansión
binaria, resulta excesivo para poder manejarlo del modo adecuado. Por ello, el uso
de métodos tipo Witness Theorem exigen poner un especial cuidado con el tamaño
de los resultados intermedios o, en su defecto, usar Tests Probabilistas para números
dados por esquemas de evaluación como los que se introducen en la Subsección 8.4.4
siguiente.
ii) El Caso Denso . Para la mayorı́a (genéricamente) de los polinomios F ∈ K[X1 , . . . , Xn ]
de grado d, el esquema de evaluación óptimo tiene talla
 
d+n
L= ,
n
y profundidad ` = log d + O(1). Los parámetros en este caso genérico son los co-
eficientes de F . El Teorema 8.4.7 anterior dice que existe una pequeña constante
universal c2 > 1, tal que la cota que debe verificar N es simplemente la cota sigu-
iente :
log N > c2 n log2 d.
iii) El caso Ralo (Sparse/Fewnomials). Supongamos que nuestro polinomio F ∈
K[X1 , . . . , Xn ] tiene pocos términos no nulos. Supongamos que F tiene grado a lo
sumo d y que a lo sumo M de sus términos tienen coeficientes no nulos. Entre estos
polinomios, el esquema de evaluación óptimo que los evalúa tiene talla del orden
L = c3 M d (donde c3 > 0 es una constante universal), y profundidad log2 d + O(1).
Entonces, el Teorema 8.4.7 anterior dice que existe una pequeña constante c3 > 1, tal
que la condición para definir N en el esquema de Kronecker es la siguiente :
log N > c3 log d (log log d + log log M ) .
400 8. NULLSTELLENSATZ

8.4.4. Tests de (no) nulidad para números enteros dados por esquemas de eva-
luación. Del mismo modo que los esquemas de evaluación pueden ser la buena estructura de
datos para codificar polinomios que aparecen en Teorı́a de la Elminación, la misma estructura
de datos se aplica a la representación de números enteros y racionales que aparecen como
resultados de eliminación. Del mismo modo que ocurre con los polinomios, los esquemas de
evaluación de números son muy adecuados para realizar operaciones aritméticas entre números
codificados mediante esquemas. Sin embargo, los Tests de Igualdad (o Tests de Nulidad) son
problemáticos. En este sentido, la operación correspondiente a la evaluación de un polinomio
es la operación de evaluar un esquema de evaluación módulo una constante dada. La buena
capacidad de adaptación de los esquemas de evaluación para estas propiedades hace que los
Tests de Nulidad para esquemas de evaluación representando números pasen por los cálculos
modulares.
Los algoritmos esenciales en esta Sección vienen de los trabajos de O.H. Ibarra, S. Moran
([IM, 1983]) y del trabajo de A. Schönhage (cf. [Schö, 1979]).
Comencemos recordando el Teorema de (Densidad) de los Números primos (visto en el párrafo
5.3.2.1 precedente). Como en aquel párrafo, definamos la función π : N −→ N dada por
π(n) := ]({p ∈ N : 2 ≤ p ≤ n, p es un número primo},
es decir el cardinal de los números primos no nulos menores que n.
Recordemos el Teorema (de Densidad) de los Números Primos (cf. Teorema ??) y la estimación
de [Rosser, 1941] allı́ descrita:
Teorema 8.4.10 ([Rosser, 1941]). Con las anteriores notaciones, para n ≥ 55,
n n
≤ π(n) ≤ ,
ln(n) + 2 ln(n) − 4
donde ln se refiere al logaritmo neperiano.

Comencemos con una vertsión existencial:


Lema 8.4.11 (Ibarra-Moran). Existe una constante c ∈ R universal, tal que para cualquier
n
número natural n ∈ N tal que 22n ≥ c y para cada N ∈ N tal que 1 ≤| N |≤ 2n2 se verifica :
Dado el conjunto P(22n ) de todos los números primos menores que 22n . Entonces, existe un
primo p ∈ P(22n ) tal que N no es divisible por p.
Demostración. Usaeemos la estimación de Rosser (cf [Rosser, 1941]) antes citada. Eli-
jamos c = 55 cada n ∈ N tal que 22n ≥ 55,
22n 22n
](P(22n )) = π(22n ) ≥ ≥ .
ln(22n ) + 2 2n + 2
De otro lado, sean p1 , . . . , ps los divisores primos de N . Como p1 ≥ 2 se tiene :
n
p1 · · · ps ≤ N ≤ 2n2 .
Tomando logaritmos, se tendrá:
s
X
log2 (pi ) ≤ log2 (N ) ≤ n2n .
i=1

Como pi ≥ 2, entonces log2 (pi ) ≥ 1 y, por tanto, concluimos


s ≤ log2 (N ) ≤ 2n2n .
Finalmente, observemos que
22n 2n 2n − 4n(n + 1)
   
− 2n2n = 2n − 2n = 2n > 1.
2n + 2 2n + 2 2n + 2
para n ≥ 10. Tomando n ≥ 55, la hipótesis de [Rosser, 1941], se tiene el resultado. 

Podemos dar una versión más probabilı́stica del mismo resultado. Para ello, consideremos
el conjunto A (22n ) := {2, . . . , 22n }. Consideremos la distribución uniforme sobre A (22n ) y
escribamos
](A) ](A)
Probunif [A] := = 2n ,
](A (22n )) 2 −1
8.4. TESTS DE (NO) NULIDAD PARA POLINOMIOS. 401

para denotar la probabilidad (con respecto a la distribución uniforme) de cualquier subconjunto


A ⊆ A (22n ).
Lema 8.4.12 ([IM, 1983]). Sea N un número natural no nulo tal que
n
|N | ≤ 22n2 .
Existe una constante universal d > 0, d ∈ R, tal que para n ≥ d, la probabilidad para m ∈
A (22n ) de de la propiedad de N = 0 mod m satisface
1
Probunif [m ∈ A (22n ) : N = 0 mod m] ≤ 1 − .
4n
Demostración. Consideremos el siguiente conjunto:
A1 (N ) := {m ∈ P(22n ) : N 6= 0 mod m}.
Y consideremos el subconjunto
A2 (N ) := {p ∈ P(22n ) : N 6= 0 mod p},
donde, como en la demostración precdente, P(22n ) son los números primos menores que 22n .
Como A2 (N ) ⊆ A1 (N ), tenemos
Probunif [A1 (N )] ≥ Probunif [A2 (N )].
Usando los mismos argumentos que en la prueba precedente, tenemos que
22n
](A2 (N )) ≥ − 2n2n ,
2n + 2
por lo que podemos escribir:

22n
](A2 (N )) ](A2 (N )) 2n+2 − 2n2n 1 2n 1
Probunif [A2 (N )] = 2n ≥ ≥ = − ≥ ,
2 −1 22n 22n 2n + 2 2n 4n
para n ≥ 12, por ejemplo. Por tanto,
1
Probunif [A1 (N )] ≥ Probunif [A2 (N )] ≥
,
4n
y, por tanto, tomando d = 55, concluimos que para n ≥ d se tiene:
1
Probunif [m ∈ A (22n ) : N = 0 mod m] = 1 − Probunif [A1 (N )] ≤ 1 − .
4n


Consideremos ahora el mismo conjunto A (22n ) y hagamos su producto cartesiano 4kn veces
con k ∈ N. es decir,
A (22n )4kn := {(m1 , . . . , m2kn ) ∈ N4kn : mi ∈ A (22n )}.
Consideremos en esta conjunto la distribución uniforme que, en este caso, es la misma que la
distribución producto. entonces, tenemos:
Teorema 8.4.13 ([IM, 1983]). Sea k ∈ N un entero positivo. Sea N un número natural no
nulo tal que
n
|N | ≤ 22n2 .
Existe una constante universal f > 0, f ∈ R, tal que para n ≥ f , la probabilidad de que una
lista aleatoriamente elegido (m1 , . . . , m4kn ) ∈ A (22n )4kn satisfaga:
N =0 mod mi , ∀i, 1 ≤ i ≤ 4kn,
está acotada por e−k , donde e es el número de Neper. Es decir,
1 1
Probunif [(m1 , . . . , m4kn ) ∈ A (22n )4kn : N = 0 mod mi , ∀i, 1 ≤ i ≤ 4kn] ≤ < k.
ek 2
402 8. NULLSTELLENSATZ

Demostración. Es mera consecuencia de los lemas precedentes. Escribamos


A1 (N ) := {(m1 , . . . , m4kn ) ∈ A (22n )4kn : N = 0 mod mi , ∀i, 1 ≤ i ≤ 4kn},
y tendremos que:
 4kn
1 k 1 1
Probunif [A1 (N )] ≤ 1− ≤ e−1 = k
≤ k.
4n e 2


Para concluir el test de Ibarra-Moran, considérese N ∈ Z un número entero que se evalúa me-
diante un programa que usa sólo operaciones en {+, −, ×} y constante en {−1, 0, +1}. Supong-
amos que L es el número total de operaciones realizables por el programa (también llamada
talla del esquema de evaluación). Entonces,
L
0 ≤ |N | ≤ 22 .
Tiene sentido, entonces, diseñar el siguiente programa probabilista para detectar si N 6= 0:

Input : Γ el código de un esquema de evaluación de talla L evaluando un número entero.


Gess randomly un conjunto DL de 4L2 números enteros en el conjunto {1, . . . , 22L },
if Γ 6= 0modm, para algún m ∈ DL , Output : “El número es no nulo”.
else Output :“El número es probablemente nulo”.
fi
end

La probabilidad de error en este algoritmo es del orden


 L
1 4L2 1 4L L 1
(1 − ) = (1 − ) < e−1 < L ,
4L 4L 2
donde e es el número de Neper.
Con lo que concluimos:
Teorema 8.4.14 ([IM, 1983]). Existe un algoritmo probabilista que, en tiempo polinomial,
decide si un número natural N ∈ N, dado por un esquema de evaluación Γ, que usa solamente
operaciones en {+, −×} en Z y las constantes {−1, 0, +1}, satisface N = 0 o no. La probabilidad
de error del algoritmo es menor que
1
,
2L
donde L es la talla del esquema Γ.
Demostración. Es el algoritmo precedente. 

8.5. Una demostración elemental del Nullstellensatz de Hilbert: Parte II


Estamos ya en condiciones de ofrecer demostraciones elementales de las distintas formas de
presentar el Nullstellensatz de Hilbert-Kronecker.

8.5.1. Nullstellensatz de Hilbert-Kronecker: Parte II.


Lema 8.5.1. Sea K un cuerpo de cardinal infinito y f ∈ K[X0 , . . . , Xn ] un polinomio homogéneo
no nulo. Entonces, para cada i, 0 ≤ i ≤ n el polinomio “afinizado” con respecto a la variable i:

fi (X0 , X1 , . . . , Xi−1 , Xi+1 , . . . , Xn ) := f (X0 , . . . , Xi−1 , 1, Xi+1 , . . . , Xn ),


es un polinomio no nulo.
8.5. NULLSTELLENSATZ, PARTE II 403

Demostración. Es un mero ejercicio de comprobación. Por ser autocontenidos hagamos


el caso i = 0. Supongamos dada la expansión monomial de f mediante:
X
f := aµ X0µ0 X1µ1 · · · Xnµn .
|µ|=d

Entonces, la expansión monomial de f0 será dada por:


X
f0 := aµ X1µ1 · · · Xnµn ∈ K[X1 , . . . , Xn ].
|µ|=d

Los coeficientes de f0 son los mismos coeficientes de f , aunque los términos difieren ahora por
ser términos en las variables {X1 , . . . , Xn }. Por tanto, si existe µ tal que aµ 6= 0 tendremos que
f 6= 0 si y solamente si f0 6= 0. 
Teorema 8.5.2 (Hilbert-Kronecker’s Nullstellensatz). Sea K un cuerpo infinito, K su
clausura algebraica y a un ideal en un anillo K[X1 , . . . , Xn ]. Entonces, la variedad algebraica
V = VA (a) ⊆ An (K) verifica:
VA (a) = ∅ ⇐⇒ 1 ∈ a.
Demostración. Hay una implicación obvia: si 1 ∈ a, es decir a = K[X1 , . . . , Xn ], es obvio
que VA (a) = ∅.
Para la otra implicación haremos inducción en n, usando el Corolario 8.4.4 anterior. El caso
n = 1 es obvio.
Supongamos que el resultado es cierto para todo ideal propio en todo ideal de un anillo de
polinomios involucrando a los sumo n−1 variables (esto es, en todo anillo del tipo K[Y1 , . . . , Yr ],
con r ≤ n − 1).
Por hipótesis, a es un ideal propio en K[X1 , . . . , Xn ]. Como K es infinito, podemos encontrar
un elemento f ∈ a de grado d no nulo y un subconjunto I de K de cardinal 2d + 1. Siguiendo
la descomposición descrita en la Observación 8.3.2, sea fd (X1 , . . . , Xn ) su parte homogénea de
grado d y no nula. tendremos que fd (X1 , . . . , Xn−1 , 1) 6= 0. Por tanto, existe (t1 , . . . , tn−1 ) ∈
I n−1 , tal que
fd (t1 , . . . , tn−1 , 1) 6= 0.
Consideremos ahora el isomorfismo descrito en la Sección 8.3 (es decir, el isomorfismo de
K−álgebras dado la Ecuación (8.3.2)):
ϕ : K[X1 , . . . , Xn ] −→ K[Y1 , . . . , Yn ]
(8.5.1)
f 7−→ f (Y1 + t1 Yn , . . . , Yn−1 + tn−1 Yn , Yn ).
Entonces, por el apartado i) del Lema 8.3.1, como a es un ideal propio, también lo es el ideal
b := ϕ(a). Pero g := ϕ(f ) es, tras este cambio de variables un polinomio mónico con respecto
a la variable Yn y no nulo en b. Consideremos su contracción:
bc := b ∩ K[Y1 , . . . , Yn−1 ].
Como b es propio, también lo es bc . Por hipótesis inductiva VAn−1 (K) (bc ) 6= ∅. Por el Lema
8.2.7 VAn−1 (bc ) = π(VAn (b). Luego si VAn−1 (K) (bc ) 6= ∅, entonces VA (b) 6= ∅.
Finalemente, usando el apartado iii) del Lema 8.3.1, tendremos que VA (a) 6= ∅ es no vacı́o. 
8.5.2. Nullstellensatz de Hilbert: Cuerpos finitos.
Teorema 8.5.3 (Hilbert’s Nullstellensatz: cuerpos finitos). Sea a un ideal en un anillo
K[X1 , . . . , Xn ], siendo K un cuerpo finito. Supongamos que a posee un elemento no nulo y no
unidad de grado d ≥ 1. Supongamos que el cardinal de K verifica: ](K) ≥ 2d + 1. Entonces, la
variedad algebraica V = VK (a) ⊆ An (K) verifica:
V = ∅ ⇐⇒ 1 ∈ a.
Demostración. El resultado se sigue de una demostración idéntica a la anterior. Nótese
que el punto crı́tico es que el número de elementos del cuerpo sea suficientemente grande.

Observación 8.5.4. En las utilizaciones algorı́tmicas del Nullstellensatz sobre cuerpos finitos,
si el cuerpo inicial K sobre el que se trabaja no tiene suficientemente elementos se suelen usar
extensiones finitas de K que tienen un cardinal suficientemente grande con respecto a los grados
de los polinomios involucrados. Una forma de entender estas construcciones son las siguientes.
404 8. NULLSTELLENSATZ

8.5.2.1. Un recordatorio sobre Cuerpos Finitos. Unas palabras para recordar los
cuerpos finitos y cómo podemos extenderlos.
Teorema 8.5.5. Todo cuerpo finito F de cardinal pm y caracterı́stica p es el menor cuerpo que
contiene a Z/pZ y a todas las raı́ces de la ecuación
m
X p − X = 0.
De hecho, los elementos de F son justamente las raı́ces de esa ecuación.
Definición 104. Sea F un cuerpo finito de cardinal q = pm y sea n un número entero coprimo
con q. Llamaremos raı́z primitiva n−ésima de la unidad a todo elemento θ de F tal que las
siguientes sean las n raı́ces distintas de la unidad :
{1, θ, θ2 , . . . , θn−1 }.
En el caso en que n es coprimo con q las raı́ces n−ésimas primitivas de la unidad sobre F tienen
un comportamiento próximo al caso de caracterı́stica 0; aunque con matices y diferencias que
es necesario destacar.
Definición 105. Sea F un cuerpo finito de cardinal q = pm y sea n un número natural no
nulo coprimo con q. La siguiente función racional es un polinomio en F [X] llamado polinomio
ciclotómico de grado n :
Y µ(d)
fn (X) := X n/d − 1 ,
d|n
donde µ es la función de Möbius. La función de Möbius fue introducida como el discriminante
en Teorı́a de Números. Viene definida del modo siguiente : Sea n ∈ N un número natural.
Definimos µ(n), mediante :

 0 si n posee algún factor irreducible múltiple
µ(n) := (−1)r si n = p1 · · · pr con pi primo, gcd(pi , pj ) = 1
1 si n = 1

En suma, µ(n) = 0 si y solamente si posee factores irreducibles múltiples. Esto permite iden-
tificar las propiedades de la función de Möbius con las propiedades del discriminante de un
polinomio. Sin embargo, la función de Möbius no se sabe calcular sin conocer la factorización
(lo que hace de ella una función difı́cil de evaluar) y tiene propiedades muy significativas como
la famosa “Fórmula de Inversión de Möbius” (véase el texto de G. H. Hardy and E. M. Wright
[Hardy-Wright, 1938] para más información).
Obsérvese que el cálculo de polinomio √ ciclotómico fn puede hacerse fácilmente√a partir de la
factorización de n (en tiempo O( nlog22 n)) y de todos sus divisores (tiempo O( nlog22 n)).
Una raı́z n−ésima de la unidad sobre F es un elemento θ tal que θn = 1 y las potencias
{1, θ, θ2 , . . . , θn−1 } son todas las raı́ces n−ésimas de la unidad sobre F y son todos distintos.
Para calcularlas y poder trabajar con ellas, es necesario hacer uso del siguiente :
Lema 8.5.6. Sea F un cuerpo finito de cardinal q = pm y sea n un número natural no nulo
coprimo con q. Sea (Z/nZ)× el grupo multiplicativo de las clases de restos módulo n. Sea r
el orden de q como elemento de (Z/nZ)× . Entonces, el polinomio ciclotómico fn factoriza en
F [X] como un producto de ϕ(n)r polinomios irreducibles de grado r cada uno de ellos, siendo ϕ
la función de Euler (cf. Subsección de Problemas 3.6.5.3).
La función de Euler : Se define mediante φ(1) = 1 y para n ≥ 2 del modo siguiente :
ϕ(m) := ]{a ∈ N : 1 ≤ a ≤ m − 1, mcd(a, m) = 1}.
Se trata de probar que φ(m) coincide con el número de elementos del grupo de las unidades
en (Z/mZ)× . En particular, Z/mZ es un cuerpo si y solamente si ϕ(m) = m − 1. Otras
propiedades de la función de Euler :
i) La función de Euler es multiplicativa, esto es, si mcd(p, q) = 1, entonces ϕ(pq) =
ϕ(q)ϕ(q).
ii) Se tiene :
X
ϕ(m) = n
m|n
8.5. NULLSTELLENSATZ, PARTE II 405

Las raı́ces primitivas n−ésimas de la unidad sobre F son las raı́ces de uno de esos factores.
Para detectar las raı́ces primitivas de la unidad, factoricemos fn usando uno cualquiera de
los algoritmos de factorización de polinomios univariados sobre cuerpos finitos. Por ejemplo, el
método descrito por E. Berlekamp (cf. también la serie de Problemas descritos en la Subsección
3.6.5.2) y que puede resumirse en el siguiente enunciado:
Teorema 8.5.7 ([Be, 1970]). Sea p ∈ N un número primo. Sea Fp el cuerpo primo de p
elementos. Entonces, existe una máquina de Turing M determinista tal que realiza la siguiente
tarea :
dado f ∈ Fp [T ] un polinomio mónico, sin factores múltiples y de grado d, M calcula los factores
irreducibles de f en Fp [T ]. El tiempo de cálculo de tal máquina de Turing es polinomial en p y
d, i.e.
pO(1) dO(1)
A partir de esa factorización, sea gn uno de esos factores y definamos el cuerpo
F 0 := F (θ) = F [Y ]/(gn (Y )).
Se tiene :
Lema 8.5.8. La clase de Y módulo gn (esto es, θ ∈ F 0 ) es una raı́z primitiva n−ésima de la
unidad sobre F .
Con ello tenemos una descripción de cualquier cuerpo.

8.5.3. Nullstellensatz: Identidad de Bézout.


Teorema 8.5.9 (Hilbert’s Nullstellensatz: Identidad de Bézout). Sea {f1 , . . . , fs } un
conjunto finito de elementos de K[X1 , . . . , Xn ] no todos nulos y ninugno unidad, siendo K un
cuerpo. Sea d el máximo de os grados de los polinomios f1 , . . . , fs .Sea V ⊆ An (K) la variedad
algebraica V = VK (f1 , . . . , fs ) ⊆ An (K) de los ceros comunes de estos polinomios. Supongamos
que el cardinal de K satisface: ](K) ≥ 2d + 1. En tonces son equivalente:
∃x ∈ An (K), f1 (x) = 0, . . . , fs (x) = 0,
y ∃g1 , . . . , gs ∈ K[X1 , . . . , Xn ], tales que:
1 = g1 f1 + dotsgs fs .
Demostración. Simplemente notar que si a es el ideal que generan los polinomios {f1 , . . . , fs },
el ideal es propio si y solamente si V (a) = V (f1 , . . . , fs ) 6= ∅. El resto es reescritura.


8.5.4. Nullstellensatz: Maximales. Esta versión del Nullstellensatz (totalmente equi-


valente a las anteriores) tiene sus reminiscencias en el Teorema del Resto, consecuencia inmedi-
ara de la división Euclı́dea. En España, por tradiciones incomprensibles, se suele llamar Teorema
de Ruffini al Teorema del Resto. En realidad, están confundiendo el “Método de Ruffini” (que sı́
es un método para dividir por (X − a)) y es debido a Ruffini (cf. [Ruff, 1804]). En cambio, en
el mundo anglosajón ese método de Ruffini es conocido como el “Horner’s method” y se basa en
un trabajo de Horner (cf. [Hor, 1819]). Una descripción de ese conocimiento puede verse en
[Caj, 1911]. Recientemente, en la permanente campaña de “reconocimiento” del saber chino
histórico, se ha descubierto que, en realidad, el “Método de Ruffini” era ya conocido por el
matemático chino Qin Jiushao (cf. [Jiushao, 1247]) en el siglo XIII. En todo caso, el método
es tan obvio que darle un nombre a una división euclı́adea tan sencilla carece de interés: es el
“método” que a cualquiera se le ocurre. Lo que sı́ es evidente es que es consecuencia inmediata
de la existencia de división euclı́dea y se remonta, cuando menos, al siglo III a. de C y a los
Elementos de Euclides.
Supondremos que K es un cuerpo inifnito y K su clausura algebraica.
Observación 8.5.10 (Ideales maximales asociados a puntos). En el Párrafo 7.2.2.2 in-
trodujimos los ideales asociados a puntos de la forma mx , donde x ∈ An (K), y estudiamos sus
propiedades más generales en la Proposición 7.2.23. Las propiedades especı́ficas del caso de
variedades afines fueron vistas en la Proposición 7.3.15. Retomemos aquellas notaciones:
406 8. NULLSTELLENSATZ

Supongamos x := (x1 , . . . , xn ) ∈ An (K) un punto en el espacio afı́n. Tenemos el siguiente ideal


primo en K[X1 , . . . , Xn ]:

mx := {f ∈ K[X1 , . . . , Xn ] : f (x) = 0}.

Si K es, como en todo este Capı́tulo, la clausura algebraica de K, entoncs mx es un ideal


maximal (cf. Proposición 7.3.15) porque se tiene un isomorfismo de K−álgebras entre:

K[X1 , . . . , Xn ]/mζ ∼
= K(x1 , . . . , xn ).

Si, además, x1 , . . . , xn ∈ K o si K = K, se tiene la siguiente identidad:

mζ := (X1 − z1 , . . . , Xn − zn ).

Teorema 8.5.11 (Hilbert’s Nullstellensatz: maximales). Sea K un cuerpo infinito, K su


clausura algebraica. Entonces, se tiene:

MaxSpec(K[X1 , . . . , Xn ]) = {mζ : ζ ∈ An (K)}.

Demostración. Por los visto en la Proposición 7.3.15, ya tenemos la inclusión ⊇. Se


trata de ver la otra inclusión. Ası́ qu supongamos m ∈ MaxSpec(K[X1 , . . . , Xn ]) un ideal
maximal. Por ser maximal es propio, luego 1 6∈ m. Pero por el Nullstellensatz para cuerpos
infinitos (Teorema 8.5.2), VA (m) 6= ∅. Luego existe ζ ∈ An (K), tal qu ζ ∈ VA (m). Por la propia
definición de mζ , se tendrá m ⊆ mζ . Pero, como m es un ideal maximal y mζ es un ideal propio,
concluimos m = mζ y tenemos la inclusión ⊆ y probado el Teorema. 

Teorema 8.5.12 (Hilbert’s Nullstellensatz: maximales, caso K = K). Sea K = K un


cuerpo algebraicamente cerrado. La siguiente es una biyección entre conjuntos no vacı́os:

m : An (K) −→ MaxSpec(K[X1 , . . . , Xn ])
(8.5.2)
ζ 7−→ mζ

Demostración. De hecho, se tiene la equivalencia entre las siguientes tres afirmaciones:


i) El cuerpo K es algebraicamente cerrado, esto es, K = K,
ii) La aplicación m anterior es una biyección entre K n y MaxSpec(K[X1 , . . . , Xn ]),
iii) Se verifica el Nullstellensatz de Hilbert en K[X1 , . . . , Xn ] en la forma siguiente:
Para cada ideal a de K[X1 , . . . , Xn ], existe ζ ∈ An (K) tal que f (ζ) = 0, ∀f ∈ a, si y
solamente si 1 6∈ a.
Probar que si no se verifica i), no se verifica iii) es evidente. Si un cuerpo no es algebraicamente
cerrado, siempre hay un polinomio univariado e irreducible que no posee raı́ces en K (el ejemplo
f = X 2 + 1 ∈ R[X] es clásico). Ese polinomio define un ideal propio a = (f ) (con 1 6∈ a) y no
posee ninguna solución en K 1 . Por tanto, iii)=⇒ i).
La implicación i) =⇒ iii) es simplemente el Teorema 8.5.2, dado que todo cuerpo algebraica-
mente cerrado es de cardinal infinito.
De otro lado, ii) =⇒ iii). La razón es obviamente la siguiente. En la equivalente de iii) sólo hay
una implicación, la otra es obvia. La implicación es la siguiente:

1 6∈ a, =⇒ ∃ζ ∈ An (K), f (ζ) = 0, ∀f ∈ a.

Pero si 1 6∈ a, entonces, hay un ideal maximal n de K[X1 , . . . , Xn ] que contiene al ideal a


(i.e.a ⊆ n). Pero, por ii), todos los tales maximales son de la forma n = mζ , con ζ ∈ An (K). En
conclusión, existe ζ ∈ An (K) tal que a ⊆ mζ . Esto es lo mismo que escribir f (ζ) = 0, ∀f ∈ a y
tendremos la implicación relevante de iii).
Finalmente, iii) =⇒ ii). Si n es un ideal maximal, entonces 1 6∈ n luego, por iii), existe ζ ∈ An (K)
tal que f (ζ) = 0, ∀f ∈ n. Esto es lo mismo que decir n ⊆ mζ . Como n es maximal, entonces
n = mζ y m es suprayectiva. La inyectividad se sigue del hecho de que dos puntos disntintos de
An (K) definen distintos maximales mζ1 6= mζ1 . 
8.5. NULLSTELLENSATZ, PARTE II 407

8.5.5. Nullstellensatz: Rabinowitsch y el radical de un ideal. El “Truco de Ra-


binowitsch” es el método descrito por George Yuri Rainich, bajo el pseudónimo de J. J. Ra-
binowitsch, en su trabajo de 1929 (cf. [Rainich, 1929]). El resultado es una identificación
entre los ideales radicales del anillo de polinomios y las variedades algebraicas. Es consecuencia
inmediata del Nullstellensatz y vamos a tratar de recuperarlo. Recordemos la Sección 6.3.1, en
el que se trataba la noción de radical de un ideal y se introdujeron los ideales radicales.
Además, ya habı́amos observado en el Capı́tulo 7 que los ideales IK (V ) de cualquier variedad
afı́n K−definible V ⊆ An (K) son ideales radicales y que, en un sentido quasi-recı́proco, para
cada ideal a ⊆ K[X1 , . . . , Xn ] consideremos la variedad K−definible en An (K) de los ceros
comunes a los elementos de a, definida del modo siguiente:
VAn (K) (a) := {x ∈ An (K) : f (x) = 0, ∀f ∈ a}.
Ası́, podemos considerar los siguientes conjuntos:

RadK (K[X1 , . . . , Xn ]) := {a ⊆ K[X1 , . . . , Xn ] : a es ideal, a = a}.
ClK (An (K)) := {VA (b) = VAn (K) (b) : b es ideal de K[X1 , . . . , Xn ]}.
Y tendremos bien definidas las siguientes dos aplicaciones:
VA : RadK (K[X1 , . . . , Xn ]) −→ ClK (An (K))
b 7−→ VA (b) = VAn (K) (b).
IK : ClK (An (K)) −→ RadK (K[X1 , . . . , Xn ])
V 7−→ IK (V ),
n
Es claro que se tiene que si V ⊆ A (K) es un cerrado Zariski en la topologı́a de los K−definibles,
por el ı́tem iv) de la Proposición 7.3.11, se tiene:
VA (IK (V )) = V.
Por tanto, concluimos que IK es un aplicación inyectiva y que VA es una aplicación suprayectiva.
En la versión de Rabinowitsch del Nullstellensatz (Teorema 8.5.13 siguiente) probaremos que
son ambas biyextivas, una inversa de la otra cuando K es un cuerpo infinito (lo que incuye el
caso en que K = K es algebraicamente cerrado).
La relevancia del radical de un ideal se observa en el famoso “truco de Rabinowistch”, que es
la siguiente versión del Nullstellensatz:
Teorema 8.5.13 (Nullstellensatz: Rabinowitsch trick). Sea K un cuerpo infinito, K su
clausura algebraica, cuerpo algebraicamente cerrado que le contiene y n ∈ N un número natural,
n ≥ 1. Consideremos los conjuntos RadK (K[X1 , . . . , Xn ]) y ClK (An (K)) anteriores y sean las
aplicaciones IK y VA definidas engtre ellos:

VA : RadK (K[X1 , . . . , Xn ]) −→ ClK (An (K))


b 7−→ VA (b) = VAn (K) (b).
IK : ClK (An (K)) −→ RadK (K[X1 , . . . , Xn ])
V 7−→ IK (V ).
Entonces, IK y VA son ambas biyectivas, una inversa de la otra.

Dicho de otra manera, para cada ideal a de K[X1 , . . . , Xn ] y cada cerrado K−definible V en
An (K) se verifica √
IK (VA (a)) = a, VA (IK (V )) = V.
Demostración. Sólo hay que probar que para cada ideal b de K[X1 , . . . , Xn ] se verifica

IK (VA (b)) = b.
Y, dado que tenemos que K[X1 , . . . , Xn ] es noetheriano, basta con que probemos que dado
un conjunto finito de elementos {f1 , . . . , fs } en K[X1 , . . . , Xn ], y dado un elemento adicional
f ∈ K[X1 , . . . , Xn ], si f se anula sobre VA (f1 , . . . , fs ), entonces, existen m ∈ N y existen
g1 , . . . , gs ∈ K[X1 , . . . , Xn ] verificando:
f m := g1 f1 + · · · + g2 f2 .
En realidad, técnicamente, el Truco de Rabinowitsch consiste en trabajar en la localización
K[X1 , . . . , Xn ]f , pero, hasta que no introduzacmos el lenguaje de las localizaciones, lo haremos
408 8. NULLSTELLENSATZ

“auto-suficientemente”.
Para hacerlo de la manera clásica, introduzcamos una nueva variable Xn+1 y trabajemos en el
anillo de polinomios K[X1 , . . . , Xn , Xn+1 ]. En este anillo de polinomios, consideremos el ideal
b0 generado por los siguientes polinomios:
b0 := (f1 , . . . , fs , Xn+1 f − 1).
Dado que f se anula en todos los puntos en los que se anulan simultáneamente f1 , . . . , fs ,
entonces
VA (b0 ) ⊆ An+1 (K),
es el conjunto vacı́o. La razón es que si x = (x1 , . . . , xn , xn+1 ) ∈ An+1 (K) es un elemento en
VA (b0 ), entonces se tiene:
f1 (x1 , . . . , xn ) = 0, . . . , fs (x1 , . . . , xn ) = 0, xn+1 f (x1 , . . . , xn ) − 1 = 0.
Pero si f1 (x1 , . . . , xn ) = 0, . . . , fs (x1 , . . . , xn ) = 0, como f se anula en VA (f1 , . . . , fs ), entonces
se ha de tener f (x1 , . . . , xn ) = 0 y la imposible igualdad:
xn+1 0 − 1 = 0.
0
Ası́, VA (b ) = ∅ y, por el Nullstellensatz (Teorema 8.5.2 anterior), concluiremos que existen
g1 , . . . , gs , gs+1 en K[X1 , . . . , Xn+1 ] tales que la siguiente igualdad se da en K[X1 , . . . , Xn+1 ]:
1 = g1 f1 + · · · + g2 f2 + gs+1 (Xn+1 f − 1).
Consideremos K(X1 , . . . , Xn ) el cuerpo de fracciones de K[X1 , . . . , Xn ] introducido en el Párrafo
3.2.0.1. Reemplazamos la variable Xn+1 por f1 ∈ K(X1 , . . . , Xn ) en la expresión anterior, ob-
servando que f1 , . . . , fs no contienen esa variable, y obtendremos:
s
!
X 1 1 1
1 := gi (X1 , . . . , Xn , )fi (X1 , . . . , Xn ) + gs+1 (X1 , . . . , Xn , )( f − 1).
i=1
f f f
Es decir, obtenemos la siguiente igualdad (en el cuerpo K(X1 , . . . , Xn )):
s
!
X 1
(8.5.3) 1 := gi (X1 , . . . , Xn , )fi (X1 , . . . , Xn ) .
i=1
f
Sea D una cota superior de los grados de los gi ’s con respecto a la variable Xn+1 . Entonces, es
una mera comprobación el verificar que, para i, 1 ≤ i ≤ s, existe hi ∈ K[X1 , . . . , Xn ] tal que se
verifica la siguiente igualdad en K(X1 , . . . , Xn ):
1
hi (X1 , . . . , Xn ) = f D gi (X1 , . . . , Xn , ) ∈ K[X1 , . . . , Xn ].
f
Por tanto, multiplicando por f D a la identidad (8.5.3) obtendremos la siguiente igualdad entre
elementos de K[X1 , . . . , Xn ] que se satisface en K(X1 , . . . , Xn ):
s
!
X
D
f := hi (X1 , . . . , Xn )fi (X1 , . . . , Xn ) .
i=1

Esta identidad se satisface también en el subanillo K[X1 , . . . , Xn ] ⊆ K(X1 , . . . , Xn ) y, por


tanto, tenemos !
s
X
D
f := hi (X1 , . . . , Xn )fi (X1 , . . . , Xn ) ∈ b.
i=1

O, equivalentemente, f ∈ b, lo que permite concluir la afirmación buscada. 

Observación 8.5.14. El Truco de Rabinowitsch, que no es sino una variante del Nullstellen-
satz, permite introducir un Diccionario Álgebra-Geometrı́a que permitirá traducir indistin-
tamente los objetos geométriocs a objetos descriptibles mediante polinomios y recı́procamente.
Éste es el principio de la Geometrı́a Algebraica y tendrá su influencia en el posterior desarrollo
de la Geometrı́a a lo largo de la segunda mitad del siglo XX y princpios del XXI. Por lo que
a nosotros respecta, nos quedaremos con que esa identificación existe y la usaremos cuando
convenga.
8.5. NULLSTELLENSATZ, PARTE II 409

8.5.6. Nullstellensatz e ideales primos. Una de las consecuencias del Nullstellensatz


en la versión de Rabinowitsch es la siguiente indetificación entre las componentes irreducibles
y los ideales primos del anillo:
Corolario 8.5.15. Sea K un cuerpo infinito, K su clausura algebraica y Spec(K[X1 , . . . , Xn ]
el espectro primo del anillo K[X1 , . . . , Xn ]. Entonces la siguiente aplicación es una biyección:
IK : {V ⊆ An (K) : V es K−definible irreducible} −→ Spec(K[X1 , . . . , Xn ])
V 7−→ IK (V ).
La inversa de esta aplicación es la aplicación dada por:
VA : Spec(K[X1 , . . . , Xn ]) −→ {V ⊆ An (K) : V es K−definible irreducible}
p 7−→ VA (p).
Demostración. Lo dejamos como Problema 292. 

8.5.7. Nullstellensatz y Geometrı́a Algebraica en Pn (K). Se trata de analizar el


efecto del Nullstellensatz en el tratamiento de las variedades algebraicas proyectivas discutidas
en la Sección 7.4. Comencemos indetificando el Nullstellensatz en su forma primitiva.
Teorema 8.5.16 (Nullstellensatz proyectivo). Sea K un cuerpo infinito, K su clausura
algebraica, Pn (K) el espacio proyectivo de dimensión n sobre K y sea a ( K[X0 , . . . , Xn ] un
ideal homogéneo. Entonces, son equivalentes:
i) VPn (K) (a) = ∅.

ii) a = (X0 , . . . , Xn ) = m0 .
Demostración. Como se indica √ en el ı́tem i) de la Proposición 7.4.7, VP ((X0 , . . . , X√
n )) =
∅. Como, además, VP (a) = VP ( a) (ver ı́tem v) de la Proposición 7.4.10), entonces si a =
(X0 , . . . , Xn ), concluimos que VP (a) = ∅. Lo que significa que hemos probado ii) =⇒ i).
Para la otra impplicación, supongamos VP (a) = ∅. Considero el ideal homogéneo asociado a
(P)
esta variedad IK (VP (a)) ⊆ K[X0 , . . . , Xn ]. Por la proposición 7.4.11 sabemos que ese ideal es
el ideal sobre el cono proyectante, es decir,
(P) ^
IK (VP (a)) = IK (V P (a)).

Como VP (a) = ∅, su cono proyectante satisface


^
V P (a) = ∅ = {0}.
e

Luego,
(P)
IK (VP (a)) = IK ({0}) = (X0 , . . . , Xn ).
Pero, además, por la Proposición 7.4.7, el cono proyectante satisface
^
{0} = VP (a) = VA (a).

Luego, por el Teorema 8.5.13 (Truco de Rabinowitsch) tenemos



IK (VA (a)) = a.
Por tanto, tenemos que

a = IK (VA (a) = IK ({0}) = (X0 , . . . , Xn ),
lo que concuye la prueba de que i) =⇒ ii) y la prueba del Teorema. 

Corolario 8.5.17 (Ideales homogéneos radicales y variedades proyectivas). Sea K un


cuerpo infinito, K su clausura algebraica, Pn (K) el espacio proyectivo de dimensión n sobre K.
La siguiente es una biyección entre los ideales homogéneos radicals y las variedades algebraicas
proyectivas K−definibles. Es decir, consideremos los conjuntos
V arK (Pn (K)) := {V ⊆ Pn (K) : V algebraica K−definible},
y
(hom) √
RadK := {a ( K[X0 , . . . , Xn ] : a ideal homogéneo, a = a}.
410 8. NULLSTELLENSATZ

Entonces, la siguiente es una biyección:


(P) (hom)
IK : V arK (Pn (K)) −→ RadK
(P)
V 7−→ IK (V ).
La aplicación inversa es la dada por:
(hom)
VP : RadK −→ V arK (Pn (K))
a 7−→ VP (a).
De hecho, se tiene
(P) √
IK (VP (a)) = a.
Demostración. Lo dejamos como Problema 293 

Corolario 8.5.18 (Ideales primos homogéneos y variedades proyectivas irreducibles).


Sea K un cuerpo infinito, K su clausura algebraica, Pn (K) el espacio proyectivo de dimensión n
sobre K. La siguiente es una biyección entre los ideales primos homogéneos y las variedades al-
gebraicas proyectivas K−definibles e irreducibles. Es decir, consideremos el siguiente conjunto:
Proj(K[X0 , . . . , Xn ]) := {p ∈ Spec(K[X0 , . . . , Xn ]) : p ( m0 , p homogéneo},
denominado el espectro homogéneo del anillo K[X0 , . . . , Xn ] con la graduación habitual. Con-
sideremos también el conjunto:
IrredK (Pn (K)) := {V ⊆ Pn (K) : V 6= ∅ algebraica, K−definible e irreducible}.
Entonces, la siguiente es una biyección:
(P)
IK : IrredK (Pn (K)) −→ Proj(K[X0 , . . . , Xn ])
(P)
V 7−→ IK (V ).
La aplicación inversa es la dada por:
VP : Proj(K[X0 , . . . , Xn ]) −→ IrrK (Pn (K))
a 7−→ VP (a).
Demostración. Lo dejamos como Problema 294. 

Corolario 8.5.19 (Puntos proyectivos y sus ideales, caso K = K). Supongamos K = K


un cuerpo algebraicamente cerrado y sea Pn (K) el espacio proyectivo de dimensión n sobre
K. La siguiente es una biyección entre los puntos proyectivos en Pn (K) y algunos ideales
(no maximales) de K[X0 , . . . , Xn ]. Consideremos x = (z0 : · · · , zn ) ∈ Pn (K) dado por sus
coordenadas homogéneas. Definamos el ideal en Proj(K[X0 , . . . , Xn ] siguiente:
m(P)
z := ({zj Xj − zj Xi : 0 ≤ i, j ≤ n}) ∈ Proj(K[X0 , . . . , Xn ]),

es decir, el ideal generado por los menores 2 × 2 de la matriz:


 
z0 z1 · · · zn
.
X0 X1 · · · Xn
La siguiente es una biyección:
(P) (P)
IK : Pn (K) −→ {mz ∈ Proj(K[X0 , . . . , Xn ]) : z ∈ Pn (K)}
(P)
z 7−→ IK ({z}).
La aplicación inversa es la dada por:
(P)
VP : {mz : z ∈ Pn (K)} −→ Pn (K)
(P) (P)
mz 7−→ VP (mz ).
Demostración. Lo dejamos como Problema 295. 
8.5. NULLSTELLENSATZ, PARTE II 411

8.5.8. Nullstellensätze Efectivos y eliminación de un bloque de cuantificadores


existenciales (sólo enunciados). Una de las estrategias antiguas más habituales para elimi-
nar un bloque de cuantificadores existenciales es el uso del llamado Nullstellensatz Efectivo. Fué
comenzado por la alumna de D. Hilbert G. Hermann en su trabajo de 1926 [Hermann, 1926].
Básicamente, este enunciado puedes darse como sigue:
Teorema 8.5.20 (Nullstellensatz Efectivo, [Hermann, 1926]). Existe una función D :
N3 −→ R+ que verifica las popiedades siguientes:
Sea {f1 , . . . , fs } un conjunto finito de elementos de K[X1 , . . . , Xn ]. Sea d el máximo de os
grados de los polinomios f1 , . . . , fs . Sea V ⊆ An (K) la variedad algebraica V = VK (f1 , . . . , fs ) ⊆
An (K) de los ceros comunes de estos polinomios. Supongamos que el cardinal de K satisface:
](K) ≥ 2d + 1. Entonces son equivalente:
∃x ∈ An (K), f1 (x) = 0, . . . , fs (x) = 0,
y ∃g1 , . . . , gs ∈ K[X1 , . . . , Xn ], tales que:
deg(gi ) ≤ D(d, n, s),
Y
1 = g1 f1 + dotsgs fs .
Además, D(d, n, s) puede elegirse satisfaciendo:
n
D(d, n, s) ≤ (sd)2 .
La demostración es más sutil que la descrita para el Nullstellensatz porque es constructiva:
se trata de dar descripciones de los polinomios que surgen en el Nullstellensatz en función de
los datos f1 , . . . , fs . Las cotas iniciales de G. Hermann fueron sucesivamente reducidas por la
colaboración de diversos autores y el paso de casi un centenar de años. Se pueden destacar las
siguientes:
n
i) D.W. Masser, G. Wüsholtz (cf. [MaWü, 1971]) : D(d, n, s) ≤ d2 s.
ii) D.W. Brownawell (cf. [Br, 1987]), L. Caniglia, A. Galligo, J. Heintz (cf. [CGH, 1988]),
J. Kollár (cf. [Kol, 1988]) :D(d, n, s) ≤ max{3, d}n .
iii) Otras variantes con distintos métodos de cálculo se puede obtener en [KrPa, 1996],
[HMPS, 2000], [KPS, 2001] y sus referencias.
Este procedimiento da, por ejemplo, un procedimiento para decidir si un sistema de ecuaciones
polinomiales posee una solución en una clausura algebraica sin conocer las soluciones ni calcu-
larlas. La idea de base es la siguiente.
Consideremos el anillo de polinomios K[X1 , . . . , Xn ] y, dentro de él, consideremos el subespacio
vectorial formado por todos los polinomios de grado acotado por una cierta cantidad T :
PTK (X1 , . . . , Xn ) := K[X1 , . . . , Xn ]T := {g ∈ K[X1 , . . . , Xn ] : deg(g) ≤ T }.
Es fácil probar que PTK (X1 , . . . , Xn ) es un subespacio vectorial de K[X1 , . . . , Xn ] como K−espacio
vectorial. También es sencillo probar, a partir de la definición de grado y de la definición de
K[X1 , . . . , Xn ] (verSubsección 1.4.2 ), que se trata de un espacio vectorial de dimensión finita
sobre K:
Una base es la base monomial formada por todos los monomios de grado a lo sumo T :
M (PTK ) := {X1µ1 · · · Xnµn : µ1 + · · · + µn ≤ T }.
A partir del Problema 1, es claro que M (PTK ) es un conjunto finito y su cardinal viene dado
por la cantidad N (T, n) siguiente: Es decir, tenemos
 
T +n
N (T, n) := dimK PT (X1 , . . . , Xn ) = ] M (PT ) =
K K
 
(8.5.4) .
n
Usando un orden monomial (cf. Definición 26 y los problemas de la Subsección 1.4.4.2), por
ejemplo el graduado lexicográfico (≤deglex ), podemos ordenar los elementos de la base M (PTK ).
Ordenar estos elementos es similar a ordenar sus exponentes. Escribamo µ0 al meno de tales
exponentes (resp. X µ0 el primero de esos monomios) y por µN (T,n)−1 al mayor de tales expo-
nentes (resp. X µN (T ,n)−1 al último de los monomios de la base M (PTK ) con respecto al orden
monomial fijado. Recud́ense tambiéon los Problemas 67 o Lema 1.4.28.
412 8. NULLSTELLENSATZ

Fijada M (PTK ) como base ordenada, dado f ∈ K[X1 , . . . , Xn ] un polinomio de grado d, pode-
mos definir una aplicación lineal como sigue:

ηf : PTK (X1 , . . . , Xn ) −→ PTK+d (X1 , . . . , Xn )


g 7−→ fg
Es claro que es una aplicación lineal. Tomando las bases monomiales respectivas M (PTK ) y
M (PTK+d ) en los espacios vectoriales PTK (X1 , . . . , Xn ) y PTK+d (X1 , . . . , Xn ), existe una única
matriz Hf con coordenadas en el cuerpo K con N (T + d, n) filas y N (T, d) columnas que
representa a ηf en esas bases. Puede observarse que, jugando con el orden monomial prefijado,
las columnas de la matriz Hf vienen dadas por ceros y por los coeficientes de f en la base
monomial M (PTK ), ocupando los lugares oportunos. En un cierto sentido, esta matriz Hf
extiende al caso multivariado la matriz Sf introducida, para el caso univariado, en la Proposición
3.6.14 de la Subsección ??.

Lema 8.5.21. Con las notaciones precedentes, dado f ∈ K[X1 , . . . , Xn ] u polinomio de grado d
se tiene:
Para cada h ∈ PTn+d (X1 , . . . , Xn ), sea H la columna de sus coeficientes en la base M (PTK+d ),
orenada con respecto al orden monomial prefijado. Entonces, f divide a h si y solamente si el
siguiente sistema de ecuaciones lineales posee solución en K N (T,n) :

Hf · Z = H,

donde
 
Zµ0
 Zµ1 
Z :=  .. ,
 
 . 
ZµN (T ,n) −1

es el vector columna de los posibles coeficientes de un polinomio en PTK (X1 , . . . , Xn ) ordenados


por el orden monomial prejijado (como en la Definición 26, en los ).

Demostración. Es mera transcripción al lenguaje del Álgebra Lineal de las propiedades


que definen los distintos objetos. 

Sea s ∈ N un número entero positivo. Consideremos ahora el espacio vectorial sobre K dado
por el producto cartesiano siguiente:
s
Y
P(T
K
) (X1 , . . . , Xn ) := PTK (X1 , . . . , Xn ) := {(g1 , . . . , gs ) ∈ K[X1 , . . . , Xn ]s : deg(gi ) ≤ T }.
i=1

Sobre él podemos considerar la base inducida, como espacio producto, por las respectivas bases
monomiales M (PTK ) en cada uno de los multiplicandos. Ciha base B(T s
) viene dada por la
siguiente igualdad:
s
[
B(T
s
{0}i−1 × M (PTK ) × {0}s−i .

) :=
i=1

Y el número de sus elementos es sN (T, n).


Consideremos ahora una lista de polinomios f1 , . . . , fs ∈ K[X1 , . . . , Xn ] de grados acotados por
d y consideremos la aplicación lineal siguiente:
Qs K K
η(f1 ,...,fs ) : i=1 PT (X1 , . . . , Xn ) −→ PT +d P(X 1 , . . . , Xn )
s
(g1 , . . . , gs ) 7−→ i=1 gi fi .

Lema 8.5.22. Con las notaciones precedentes, fijando las bases B(T
s
) y M (PK ) las bases mono-
T

miales respetivas en los espacios de entrada y salida de η(f1 ,...,fs ) existe una única matriz
(T )
H(f1 ,...,fs ) con coordenadas en K, con N (T + d, n) filas y sN (T, n) que representa la aplicación
8.5. NULLSTELLENSATZ, PARTE II 413

lineal η(f1 ,...,fs ) . Más aún, consideremos el vector columna


 
1
0
 
1 := 0 ,
 
 .. 
.
0
correspondiente al elemento 1 ∈ PTK+d (X1 , . . . , Xn ) en la base ordenada por el orden monomial
seleccionado en PTK+d (X1 , . . . , Xn ). Entonces, son equivalentes:
i) Existen g1 , . . . , gs ∈ K[X1 , . . . , Xn ] polinomios de grado a lo sumo T tales que
1 = g1 f1 + · · · + gs fs .
ii) El siguiente sistema de ecuaciones lineales es compatible:
 (1) 
Z
H(f ,...,f ) ·  ...  = 1,
(T )  
1 s

Z(s)
donde para cada i, 1 ≤ i ≤ s, se tiene
(i)
 
Zµ0
(i)
Zµ1
 
(i)
 
Z := 
 .. ,
.

 
(i)
ZµN (T ,n) −1
es el vector columna de los posibles coeficientes de un polinomio en PTK (X1 , . . . , Xn ),
ordenados por el orden monomial prefijado.
Demostración. Es simplemente la transcipción de la linearidad de η(f1 ,...,fs ) al lenguaje
de matrices y vectores. 
(T )
Nótese que la matriz de H(f1 ,...,fs ) de la aplicación lineal η(f1 ,...,fs ) tiene un apsecto como el
siguiente:
s
(T )
X
H(f1 ,...,fs ) := H
g fi ,
i=1
Qs
donde H
g fi es la matriz Hfi extendida mediante zeros al producto cartesiano i=1 PTK (X1 , . . . , Xn ).
A partir de aquı́, el procedimiento que podemos definir es el siguiente:

Algoritmo 8.5.23. Input: Una lista de polinomios f1 , . . . , fs ∈ K[X1 , . . . , Xn ] con coefi-


cientes en el cuerpo K.

Output: Una respuesta Sı́ o No a la fórmula de primer orden:


∃x1 ∈ K, · · · , ∃xn ∈ K, f1 (x1 , . . . , xn ) = 0, . . . , fs (x1 , . . . , xn ) = 0.

Procedimiento:
eval una cota de D(d, n, s), por ejemplo
T := max{3, n}n .
Siguiendo el Lema precedente:
eval las matrices: Hf1 , . . . , Hfs .
(T )
eval la matriz: H(f1 ,...,fs ) .
decide whether sl siguiente sistema de ecuaciones lineales es o no compatible:
 (1) 
Z
(T )  .. 
(8.5.5) H(f1 ,...,fs )  .  = 1,
Z(s)
414 8. NULLSTELLENSATZ

Las notaciones son las del Lema precedente.


Output: if el sistema (8.5.5) es compatible, then ouput No
else output Sı́
end

Teorema 8.5.24. Sea K un cuerpo computable de ceracterı́stica distinta de 2 y sea K un cuerpo


algebraicamente cerrado que le contiene. Existe un algoritmo que realiza la tera siguiente:
Dados como inputs polinomios {f1 , . . . , fs } ∈ K[X1 , . . . , Xn ], el algoritmo decide si
∃x1 ∈ K, · · · , ∃xn ∈ K, f1 (x1 , . . . , xn ) = 0, . . . , fs (x1 , . . . , xn ) = 0.
El tiempo de ejecución del algoritmo está acotado por un procedimiento que realiza un número
de operaciones en K acotado por:
ω 
max{3, d}n + d + n
 
2
O s ) ≤ O(sω max{3, d}ωn + dωn ),
n
donde ω ≤ 2.7.
Demostración. Se trata simplemente de decidir si el sistema de ecuaciones lineales (8.5.5)
es o no compatible. Para el caso de ceracterı́tica distinta de 2 podemos aplicar la cota de
Bronawell-Caniglia-Galligo-Heintz-Kollár y tendremos
D(d, n, s) ≤ max{3, d}n .
Ahora bien, el sistema de ecuaciones lineales (8.5.5) tiene:
• El número de variables involucradas es el número de variables en Z, es decir,
max{3, d}n + n
   
D(d, n, s) + n
s ≤s ,
n n
para el caso que nos ocupa es el número de coeficientes estudiado en la Parte 1 del
curso para una listra de s polinomios en n variables de grados acotados por D(d, n, s).
• El número de ecuaciones en el sistema de ecuaciones lineales (8.5.5) es el número
de coeficientes en n variables de un polinomo de grado acotado por D(d, n, s) + d ≤
max{3, d}n + d.
Finalmente, el exponente ω ≤ 2.7 es el exponente (menor estricto que 3) conocido desde los
trabajos de V. Strassen (cf. [Str, 1969]) tal que permite decidir si un sistema de n ecuaciones
lineales en m variables es compatible en tiempo O(max{n, m}ω ). 

Corolario 8.5.25. Existe un algoritmo que permite realizar la tarea siguiente:


Dada una secuencia de polinomios f1 , . . . , fs , g1 , . . . , gt ∈ K[Y1 , . . . , Ym , X1 , . . . , Xn ], hallar una
fórmula libre de cuantificadores con coeficientes en K y en las variables {Y1 , . . . , Ym }
Ψ(Y1 , . . . , Ym ),
equivalente a la fórmula
(8.5.6)  
s t
!
^ ^ ^
∃X1 ∈ K, . . . , ∃Xn ∈ K,  (fj (Y1 , . . . , Ym , X1 , . . . , Xn ) = 0) (g` (Y1 , . . . , Ym , X1 , . . . , Xn ) 6= 0) .
j=1 `=1

En particular, la teorı́a de primer orden sobre cuerpos algebraicamente cerrados es decidible y


completa y admite algoritmos de eliminación de cuantificadores.
Demostración. La única idea es reescribir la fórmula (8.5.6) como una fórmula del tipo
del Nullstellensatz, usando el truco siguiente: añadamos una variable Z` para 1 ≤ ` ≤ t, de tal
modo que se observa que la fórmula siguiente:
(∃X1 ∈ K, . . . , ∃Xn ∈ K, g` (Y1 , . . . , Ym , X1 , . . . , Xn ) 6= 0) ,
es equivalente a la fórmula
(∃Z` ∈ K, ∃X1 ∈ K, . . . , ∃Xn ∈ K, Z` g` (Y1 , . . . , Ym , X1 , . . . , Xn ) − 1 = 0) .
Una vez puesta nuestra fórmula en la forma del Nullstellensatz del Teorema precedente, hacemos
crecer el cuerpo considerando L = K(Y1 , . . . , Ym ). Escribimos la correspondiente ecuación lineal
8.6. NULLSTELLENSATZ Y EQUIVALENCIA NATURAL: EL LENGUAJE DE LAS CATEGORÍAS 415

(8.5.5) cuya matriz tiene coordenadas en L. De hecho, las coordenadas están en K[Y1 , . . . , Ym ].
Ahora, el sistema es incompatible si y solamente si ciertos menores de la matriz de coeficientes
del sistema de ecuaciones lineales (8.5.5) son nulos o no. La fórmula Ψ(Y1 , . . . , Ym ) son combi-
naciones booleanas de condiciones de signo sobre los menores de esa matriz. Esos menores son
polinomios en K[Y1 , . . . , Ym ]2. En particular, acabamos de denostrar el Teorema Fundamental
de la Eliminación usando el Nullstellensatz y Álgebra Lineal Elemental. El resto se sigue de
modo obvio. 
Observación 8.5.26 (Crı́ticas a este Procedimiento). Este procedimiento es el que subyace
a los intentos de mejorar los Nullstellensatz Efectivos que fueron moda a finales de los años 80 y
principios de los 90, pero que siguen siendo considerados resultados de élite en Matemáticas. Sin
embargo, el método no es óptimo porque la complejidad ni siquiera es simplemente exponencial:
2
está en O(dωn ). Veremos, si es posible a lo largo del curso, que se puede decidir en tiempo
O(d(ω+1)n ) con una complejidad que necesariamente están en Ω(dn ) (al menos para algoritmos
universales). Por tanto, no es recomendable usar este procedimiento por más que sea el más
accesible e inmediato de entender.

8.6. Nullstellensatz y equivalencia natural: El lenguaje de las categorı́as


8.6.1. El lenguaje de las categorı́as. El lenguaje de las categorı́as fue introducido
a mediados de de los años 40 por S. Eilenberg y S. MacLane (cf. [EiMc, 1945]) como un
intento de desarrollar un lenguaje común a diversas ramas de la Matemática y sus interac-
ciones, distinta de la Metamatemática impulsada por la Lógica. Una de las derivaciones del
lenguaje de las Categorı́as fue el desarrollo del Álgebra Homológica. El Álgebra Homlógica
fué introducida por H. Poincaré y D. Hilbert como un intento de interacción entre topologı́a
y álgebra, fundamentalmente, para disponer de grupos más “manejables” que los grupos de
homotopı́a. Posteriormente, el Álgebra Homológica evoluciona aprovechándose del lenguaje de
las categorı́as, hasta convertirse en una parte propia de la Matemática. Esta integración de las
dos ideologı́as se produce en el clásico de H. Cartan y S. Eilenberg [CaEi, 1956]. Un par de
textos clásicos, varias veces re-editados, que constituyen una Introducción a estos temas son
[Mc, 1975] o [HiSt, 1997].
Aquı́ hacemos un resumen acelerado del lenguaje, sin entrar en más detalles por falta de tiempo.
8.6.2. Categorı́as.
Definición 106 (Categorı́as). Una categorı́a es un par C := (Obj C , HomC ), donde:
i) Obj C es una clase formada por conjuntos, cuyos elementos X ∈ Obj C se denominan
objetos de la categorı́a C
ii) HomC es una aplicación que a cada dos objetos X, Y ∈ Obj C les asigna un conjunto
HomC (X, Y ) que se denomina morfismos de la categorı́a C entre los objetos X e Y .
Además, dados tres objetos X, Y, Z ∈ Obj C , existe una transformación:
◦: HomC (X, Y ) × HomC (Y, Z) −→ HomC (X, Z)
(f, g) 7−→ g ◦ f,
y que verifica las siguientes propiedades:
(a) Para cada objeto X ∈ Obj C existe un morfismo IdX ∈ HomC (X, X) tal que para
cada f ∈ HomC (X, Y ) y para cada g ∈ HomC (Z, Y ), se verifica:
f ◦ IdX = f, Idx ◦ g = g.
(b) Dados 4 objetos X, Y, Z, T ∈ Obj C y dados tres morfismos f ∈ HomC (X, Y ),
g ∈ HomC (Y, Z), h ∈ HomC (Z, T ), se tiene:
h ◦ (g ◦ f ) = (h ◦ g) ◦ f.

Ejemplo 8.6.1 (Ejemplos de Categorı́as). Los ejemplos usados en anteriormente sirven para
ilustrar la noción de categorı́as.
2Note el alumno que se trata de los menores que, rudimentariamente, le salı́an en los lejanos cursos

de secundaria en los que se discutı́a si un sistema de ecuaciones lineales con parámetros era compatbile
o no.
416 8. NULLSTELLENSATZ

i) La Categorı́a de los Espacios Topológicos (E T ): Los objetos Obj E T son los


espacios topológicos, los morfismos HomE T (X, Y ) := C 0 (X, Y ) son las funciones con-
tinuas entre X e Y .
ii) La Categorı́a de los Espacios Vectoriales (E VK ) : Los objetos Obj E VK son
los espacios vectoriales sobre un cuerpo K fijado, los morfismos HomE VK (X, Y ) :=
HomK (X, Y ) son las aplicaciones K−lineales entre X e Y .
iii) La Categorı́a de las Variedades Diferenciables sobre R (M ): Los objetos Obj M
son las variedades diferenciables ( C ∞ , por ejemplo) y los morfismos HomM (X, Y ) :=
C ∞ (X, Y ) son las funciones infinitamente diferenciables entre X e Y .
iv) La Categorı́a de los Grupos (G ): Los objetos Obj G son los grupos, los morfismos
HomG (X, Y ) := Hom(X, Y ) son los morfismos de grupo entre X e Y .
v) La Categorı́a de los Módulos sobre un anillo (R−M od ): Los objetos Obj R−M od
son los R−módulos (R fijado), los morfismos HomR−M od (X, Y ) := HomR (X, Y ) son
los morfismos de R−módulo entre X e Y .
vi) La Categorı́a de los Anillos (R): Los objetos Obj R son los anillos conmutativos
con unidad, los morfismos HomR (X, Y ) := Hom(X, Y ) son los morfismos de anillo
entre X e Y .
vii) · · · et cetera.

El objetivo de la Teorı́a de categorı́as es detectar coincidencias entre diversas categorı́as teniendo


en cuenta solamente los comportamientos de objetos y morfismos. Comencemos, definiendo
algunos tipos elementales de morfismos. Ya vimos en la Definición 9, la forma general de ls
nociones de monomorfismo, epimorfismo e isomorfismo en la categorı́a de grupos. Reincidimos
aqu´o i con la noción general para cualquier categorı́a.

Definición 107 (Tipos elementales de Morfismos). Dados dos objetos X, Y en una cate-
gorı́a C y un morfismo f ∈ HomC (X, Y ), definiremos las condiciones para que f sea
i) Monomorfismo: Decimos que f es un monomorfismo en C si para todo otro objeto T
de C y cualesquiera dos morfismos α1 , α2 ∈ HomC (T, X), se tiene:

f ◦ α1 = f ◦ α1 =⇒ α1 = α2 .

Gráficamente, decimos que f es monomorfismo en la categorı́a C si para todo objeto


T de la categorı́a y cualesquiera dos morfismos α1 , α2 ∈ HomC (T, X), se verifica:
Si el siguiente diagrama es conmutativo:
T f ◦ α1
α1 

f
IdT X Y

α2 

T f ◦ α2

entonces, α1 = α2 .
ii) Epimorfismo: Decimos que f es un epimorfismo de grupos si para todo grupo (T, ?) y
cualesquiera dos morfismos α1 , α2 : (H, ⊥) −→ (T, ?), se tiene:

α1 ◦ f = α1 ◦ f =⇒ α1 = α2 .

También gráficamente, f es epimorfismo en la categorı́a C si para todo objeto T de la


categorı́a C y para cualesquiera dos morfismos α1 , α2 ∈ HomC (Y, T ), se verifica:
Si el siguiente diagrama es conmutativo:
8.6. NULLSTELLENSATZ Y EQUIVALENCIA NATURAL: EL LENGUAJE DE LAS CATEGORÍAS 417

α1 ◦ f T
 α1

f
X Y IdT

 α2

α2 ◦ f T
entonces α1 = α2 .
iii) Isomorfismo: Decimos que f es isomorfismo en la categorı́a C si existe un morfismo
g ∈ HomC (X, Y ) tal que:
g ◦ f = IdX , f ◦ g = IdX .

Ejemplos de monomorfismos, epimorfismos e isomorfismos en las distintas categorı́s son cono-


cidos. Si acaso, recordar que, en el caso de espacios topológicos, los isomorfismos se llaman
homeomorfismos, mientras que en el caso de variedades diferenciables o analı́ticas, se habla de
difeomorfismo y, por ejemplo, en el caso de espacios métricos, se tratan las isometrı́as. Son el
mismo concepto aunque en distintas categorı́as.

8.6.3. Functores y equivalencias naturales. Para poder identificar dos categorı́as, el


Álgebra Homológica acude a la noción de functor y de equivalencia natural (introducida por S.
Eilenberg).
Definición 108 (Functor Covariante). Sean C y D dos categorı́as, con objetos Obj C y
Obj D y morfismos HomC (X, Y ), HomD (X 0 , Y 0 ). Un functor covariante F entre las categorı́as
C y D es una transformación con dos ingredientes:
• Una aplicación F : Obj C −→ Obj D , y
• para cada par de objetos X, Y ∈ Obj C una aplicación (que denotaremos con las misma
letra):
F : HomC (X, Y ) −→ HomD (F (X), F (Y )),
verificando las siguientes propiedades:
i) Dados f ∈ HomC (X, Y ) y g ∈ HomC (Y, Z), se tiene:
F (g ◦ f ) := F (g) ◦ F (f ).
ii) Para cada objeto X ∈ Obj C , se tiene:
F (IdX ) = IdF (X) .
Definición 109 (Functor Contravariante). Sea C y D dos categorı́as, con objetos Obj C y
Oy D y morfismos HomC (X, Y ), HomD (X 0 , Y 0 ). Un functor covariante F entre las categorı́as
C y D es una transformación con dos ingredientes:
• Una aplicación F : Obj C −→ Obj D ,
• para cada par de objetos X, Y ∈ Obj C una aplicación (que denotaremos con las misma
letra):
F : HomC (X, Y ) −→ HomD (F (Y ), F (X)),
verificando las siguientes propiedades:
i) Dados f ∈ HomC (X, Y ) y g ∈ HomC (Y, Z), se tiene:
F (g ◦ f ) := F (f ) ◦ F (g).
ii) Para cada objeto X ∈ Oy C , se tiene:
F (IdX ) = IdF (X) .
Ejemplo 8.6.2 (Ejemplos de Functores). Los siguientes son ejemplos de Functores entre
distintas categorı́as, con diversos significados:
418 8. NULLSTELLENSATZ

i) Consideremos las categorı́as E T de espacios topológicos y R de anillos. Consideremos


una transformación C 0 del tipo siguiente:
• A cada espacio topológico X ∈ Obj E T se le asocia el objeto C 0 (X) := HomE T (X, R) :=
C 0 (X, R) de las funciones continuas de X en R.
• A cada par de espacios topológicos X, Y y a cada morfismo f ∈ C 0 (X, Y ) (es
decir, función contı́nua de X a Y ), le asociamos el morfismo de anillos
C 0 (f ) : C 0 (Y, R) −→ C 0 (X, R),
h 7−→ h ◦ f.
Claramente se trata de un functor contra-variante de la categorı́a de espacios topológicos
en la categorı́a de anillos.
ii) Consideremos un functor de la categorı́a E VK en sı́ misma, que denotaremos por ∗ y
lo llamaremos el paso al espacio vectorial dual.
• A cada espacio vectorial X ∈ Oy EVK se le asocia el objeto X ∗ := HomK (X, K),
usualmente conocido como el espacio dual de X sobre K.
• A cada par de −espacios vectoriales sobre X, Y y a cada morfismo f ∈ HomK (X, Y )
(es decir, a cada aplicación K−lineal) le asociamos la aplicación K−lineal
f∗ : Y ∗ −→ X ∗,
h 7−→ h ◦ f.
Claramente es un functor contra-variante de la categorı́a de espacio vectoriales en sı́
misma.
iii) Consideremos ahora la categorı́a M de las variedades diferenciables y el functor C ∞
de M en la categorı́a R de anillos. Se define análogamente al caso del functor C 0 .
Esto es
• A cada variedad diferenciable X ∈ Obj M se le asocia el objeto C ∞ (X) :=
HomM (X, R) := C ∞ (X, R) de las funciones infinitamente diferenciables de X
en R.
• A cada par de variedades diferenciables X, Y y a cada morfismo f ∈ C ∞ (X, Y )
(es decir, función infinitamente diferebnciable de X a Y ), le asociamos el morfismo
de anillos
C ∞ (f ) : C ∞ (Y ) −→ C ∞ (X),
h 7−→ h ◦ f.
Claramente se trata de otro functor contra-variante.

Definición 110 (Equivalencia Natural entre Functores Covariantes). Sea C y D dos


categorı́as, con objetos Oy C y Obj D y morfismos HomC (X, Y ), HomD (X 0 , Y 0 ). Dos functores
covariantes F y G entre las categorı́as C y D se dicen naturalemente equivalentes si para cada
objeto X ∈ Obj C , existe un isomorfismo ϕX : F (X) −→ G(X) tal que dados X, Y ∈ Obj C y
dado un morfismo cualquiera f ∈ HomC (X, Y ) se verifica:
ϕY ◦ F (f ) = G(f ) ◦ ϕX .
Es decir, el siguiente diagrama es conmutativo:
ϕX
F (X) G(X)

F (f ) G(f )

F (Y ) G(Y )
ϕY

Definición 111 (Equivalencia Natural entre Functores Contravariantes). Se define de


manera análoga al caso covariante, teniendo en cuenta la condición de contravariantes.

Definición 112 (Equivalencia Natural entre Categorı́as). Dos categorı́as C y D se dicen


naturalmente equivalentes si existen functores (covariantes o contravariantes) F entre C y D y
G entre D y C tales que la composición G ◦ F es naturalmente equivalente a la identidad IdC
8.6. NULLSTELLENSATZ Y EQUIVALENCIA NATURAL: EL LENGUAJE DE LAS CATEGORÍAS 419

y F ◦ G es naturalemnte equivalente a la identidad IdD . A los functores F y G se les llama


equivalencias naturales entre las categorı́as C y D.
8.6.4. La categorı́a de las variedades algebraicas afines y los morfimos regulares.
Vamos a tratar de definir los conceptos más elementales relativos a la categorı́a formada por las
variedades algebraicas K−definibles y sus morfismos de transformación: los morfismos regulares
entre variedades o aplicaciones polinomiales. Ya en el Problema 56 iniciamos la senda de
las funciones polinomiales como interpretación semántica de los polinomios, ası́ que vamos a
retomarla.
Definición 113 (Función polinomial sobre una variedad). Sea K un cuerpo, K su
clausura algebraica y V ⊆ An (K) una variedad algebraica K−definible. Llamaremos función
polinomial K−definible sobre V a toda función ϕ : V −→ K tal que existe un polinomio
p ∈ K[X1 , . . . , Xn ] verificando ϕ = p V , es decir,
ϕ(x) = p(x), ∀x ∈ V.
Denotaremos por K[V ] al conjunto de todas las aplicaciones polinomiales definidas en V .
En el caso K = K diremos simplemente que ϕ es una función polinomial sobre V y denotaremos
por K[V ] al anillo correspondiente.

Proposición 8.6.3. Con las notaciones precedentes, el conjunto K[V ] es una K−álgebra con
las operaciones usuales de suma y producto de aplicaciones a valores en el cuerpo K. De hecho,
K[V ] es una K−álgebra finitamente generada (cf. Definición 34) y reducida (i.e. sin elementos
nilpotentes). Más aún, sea IK (V ) ⊆ K[X1 , . . . , Xn ] el ideal de los polinomios con coeficientes
en K que se anulan en V . Entonces, los siguientes anillos son isomorfos como K−álgebras:
∼ K[X1 , . . . , Xn ]/IK (V ).
K[V ] =
Demostración. Es claro que K[V ] es un subanillo de KV con las operaciones usuales.
Además, como K es cuerpo, el anillo KV no tiene elementos nilpotentes y tampoco los tendrá
el subanillo K[V ]. Por la propia definición de función polinomial, tenemos un epimorfismo de
anillos dado por la siguiente aplicación:
ρ : K[X1 , . . . , Xn ] −→ K[V
]
p 7−→ p V ,
donde la restricción es simplemente la función consistente en evaluar p es los puntos de V . Es
un epimorfismo de anillos y es un epimorfismo de K−álgebras (nótese que ρ(λ) es la función
constante λ definida en V ). Obviamente el núcleo es el ideal
ker(ρ) = IK (V ) := {p ∈ K[X1 , . . . , Xn ] : p(x) = 0, ∀x ∈ V },
ya estudiado anteriormente. Por el Primer Teorema de isomorfı́a concluiremos el isomorfismo
anunicado en la proposición. 

Definición 114 (Morfismo Regular entre variedades algebraicas). Sea K un cuerpo,


K su clausura algebraica, V ⊆ An (K) y W ⊆ Am (K) dos variedades algebraicas K−definibles.
Una aplicaciı́on polinomial K−definible entre V (también llamado morfismo regular) y W es
una aplicación ψ : V −→ W tal que existen polinomios p1 , . . . , pm ∈ K[X1 , . . . , Xn ] tales que
∀x ∈ V, ψ(x) = (p1 (x), . . . , pm (x)) ∈ W.
En el caso K = K diremos simplemente aplicación polinomial o morfismo regular entre V y W .

Proposición 8.6.4 (La Categorı́a de las variedades algebraicas afines K−definibles).


Con las notaciones precedentes, la siguiente es una Categorı́a descrita a partir de un cuerpo K
y su clausura algebraica:
• Objetos: Son las vareidades algebraicas afines K−definibles V contenidas en un es-
pacio afı́n de dimensión finita An (K) sobre el cuerpo K.
• Morfismos Regulares: Los morfismos entre dos variedades algebraicas afines K−definibles
son las aplicaciones polinomiales entre ellas:
Reg(V, W ) := {ψ : V −→ W : ψ es aplicación polonomial}.
420 8. NULLSTELLENSATZ

(A)
Denotaremos mediante VK esta categorı́a. Nótese que fijado el cuerpo K su clausura algebraica
K queda determinada de manera unı́voca, y las objetos son subconjuntos de espacios afines sobre
la clausura algebraica de K.
Demostración. Para probar esta Proposición basta con observar que IdV es ciertamente
una aplicación polinomial y que la composición de dos aplicaciones polinomiales es una apli-
cación polinomial. Esta segunda afirmación es de fácil verificación. 

Definición 115 (Isomorfismo birregular). Un isomorfimo birregular K−definible entre dos


(A)
variedades algebraicas K−definibles V y W es un isomorfismo en la categorı́a VK . Es decir, un
isomorfismo birregular entre dos variedades K−definibles V y W es una aplicación polinomial
biyectiva ϕ : V −→ W tal que su inversa ϕ−1 : W −→ V es también aplicación polinomial.
En el caso K = K decimos simplemente isomorfismo birregular.

Definición 116 (Morfismo dominante). Un entre dos variedades algebraicas K−definibles


V y W , es una aplicación polinomial ϕ : V −→ W tal que la imagen de V es densa en la
z
topologı́a de Zariski de W , i.e. si ϕ(V ) = W .
En el caso K = K decimos simplemente morfismo dominante.

Proposición 8.6.5 (Morfismo de K−álgebras asociado a un morfismo regular de


variedades). Con las notaciones precedentes, sean V ⊆ An (K) y W ⊆ Am (K) dos variedades
algebraicas K−definibles y sea ϕ : V −→ W un morfismo regular. Definamos la siguiente
aplicación :
ϕ∗ : K[W ] −→ K[V ]
h 7−→ h ◦ ϕ.
Entonces:
i) ϕ∗ es un morfismo de K−álgebras reducidas finitamente generadas.
ii) ϕ∗ es monomorfismo si y solamente si ϕ es un morfismo dominante.
Demostración. La primera afirmación es de sencilla verificación y no necesita una de-
mostración mś significativa. Para la segunda, supongamos que ϕ es un morfismo dominante.
z
Esto significa simplemente que ϕ(V ) = W . Es decir, que dado cualquier polinomio p ∈
K[Y1 , . . . , Ym ] que se anula en ϕ(V ) se anula necesariamente en todo W y, por tanto será un
elemento de IK (W ). Es términos más formales, si p + IK (W ) ∈ ker(ϕ∗ ) es porque el polinomio
p ∈ K[Y1 , . . . , Ym ] satisface que p ◦ ϕ = 0 como aplicación sobre V , lo cual es equivalente a
que p se anule sobre ϕ(V ) y, por lo antedicho, es equivalente p ∈ IK (W ) o, equivalentemente,
p + IK (W ) = 0 en K[W ]. 

8.6.5. La Categorı́a de las K−álgebras reducidas finitamente generadas.


Definición 117 (La Categorı́a de las K−álgebras reducidas finitamente generadas).
Definimos la Categorı́a de las K−álgebras reducidas finitamente generadas a la categorı́a de-
terminada por los siguientes elementos:
i) Objetos: Los objetos son las K−álgebras reducidas finitamente generadas. Es decir,
los anillos R de la forma:
R = K[X1 , . . . , Xn ]/a,
donde a es un ideal radical (de ahı́ que R sea un anillo reducido).
ii) Morfismos: Los morfismos entre dos K−álgebras reducidas y fintamente generadas
R1
y R2 son simplemente los morfismos de anillos f : R1 −→ R2 , tales que f K = IdK .
Denotamermos por K − Ared a esta categorı́a.

Por lo discutido en este curso es claro que K − Ared es una categorı́a.


Lo expuesto en la subsección precedente, nos permite concluir de manera elemental lo siguiente:
Proposición 8.6.6. La siguiente transformación es un functor contravariante entre las cate-
(A)
gorı́as VK y K − Ared :
8.6. NULLSTELLENSATZ Y EQUIVALENCIA NATURAL: EL LENGUAJE DE LAS CATEGORÍAS 421

(A)
• A cada objeto V ⊆ An (K) de la categorı́a VK le asociamos la K−álgebra reducida
finitamente generada K[V ].
(A)
• A cada morfismo regular ϕ : V −→ W de la categorı́a VK le asociamos el morfismo
de K−álgebras finitamente generadas reducidas:
ϕ∗ : K[W ] −→ K[V ].
Demostración. Esencialmente tenemos que probar que Id∗V = IdK[V ] , lo cual es obvio, y
que dados dos morfismos regulares ϕ : V −→ W y ψ : W −→ Z entre variedades algebraicas
K−definibles, se tiene que los morfismos de K−álgebras satisfacen:

(ψ ◦ ϕ) = ϕ∗ ◦ ψ ∗ .
Pero esa es una propiedad de fácil verificación a partir de las definiciones expuestas. 

Proposición 8.6.7 (Morfismo regular inducido por un morfismo de K−álgebras). Con


las notaciones precedentes, sean R y S dos K−álgebras finitamente generadas y reducidas. Y
sea F : R −→ S un morfismo de K−álgebras. Se tiene:
i) Existen V ⊆ An (K) y W ⊆ Am (K) dos variedades algebraicas K−definibles tales que
R∼ = K[V ] = K[X1 , . . . , Xn ]/IK (V ), S ∼
= K[W ] = K[Y1 , . . . , Ym ]/IK (W ).
ii) Consideremos polinomios p1 , . . . , pm ∈ K[Y1 , . . . , Yn ] tales que
F (Xi + IK (V )) = pi ‘ + IK (W ), ∀i, 1 ≤ i ≤ n.
Entonces, el siguiente es un morfismo regular bien definido:
F∗ : W −→ V
y 7−→ (p1 (y), . . . , pn (y)).
iii) El siguiente es un functor contravariante de la categorı́a K − Ared en la categorı́a
(A)
VK :
• A los objetos R dados como K−álgebras reducidas finitamente generadas le aso-
ciamos una variedad algebraica afı́n K−definibe V tal que K[V ] ∼
= R.
• A los morfismos de K−álgebras reducidas F : R −→ S le asociamos el morfismo
regular F∗ : V −→ W descrito anteriormente.
Demostración. La propiedad i) se sigue de manera inmediata de la definición de K−álgebra
reducida finitamente generada y del Nullstellensatz en la versión del “truco” de Rabonowisch.
Hagámoslo para R. Por la definición de K−álgebra finitamente generada (cf. Definición 34) ha
de existir un ideal a propio en un anillo de polinomios K[X1 , . . . , Xn ] con coeficientes en K tal
que existe un isomorfismo de K−álgebras entre
R∼ = K[X1 , . . . , Xn ]/a.
Consideremos ahora V := VA (a). Como R s reducido como anillo, carece de elementos nilpo-
tentes y como el radical se transporta bien en su paso √ al cociente en anillos noetherianos, si R
es reducida entonces a es un ideal radical, esto es, a = a. Por el Nullstellensatz en la versión
de Rainich, tenemos que √
IK (V ) = IK (VA (a)) = a = a.
Por lo que concluimos que
R∼ = K[X1 , . . . , Xn ]/a ∼
= K[X1 , . . . , Xn ]/IK (V ) ∼
= K[V ].
Para probar la segunda propiedad es claro que F∗ : V −→ An (K) es una aplicación polinomial.
Por tanto, s’olo hemos de probar que para cada y ∈ W F∗ (y) ∈ V . Para ello, consideremos
un polinomio cualquiera f (X1 , . . . , Xn ) ∈ K[X1 , . . . , Xn ] que sea anule sobre V . Es decir,
f ∈ IK (V ) o, equivalentemente,
0 + IK (V ) = f + IK (V ) = f (X1 + IK (V ), . . . , Xn + IK (V )), en K[V ].
Pero, entonces, F (f + IK (V ) = 0. Es decir, 0 + IK (W ) = F (f + IK (V )), pero como F es
morfismo de K−álgebras las imágenes de productos y sumas se transforman en productos y
sumas y las constantes en K se transforman en constantes en K. Esto siginifica que
F (f + IK (V )) = f (F (X1 + IK (V )), . . . , F (Xn + IK (V ))) ,
422 8. NULLSTELLENSATZ

es decir,
0 + IK (W )F (f + IK (V )) = f (p1 + IK (W ), . . . , pn + IK (W )) = f (p1 , . . . , pm ) + IK (W (.
Por tanto, f (p1 , . . . , pn )(y) = f (p1 (y), . . . , pn (y)) = 0 para cada y ∈ W o, equivalentemente,
F∗ (y) ∈ VA (f ), para cada f ∈ IK (V ). Es decir, F∗ (y) ∈ V y F∗ : W −→ V es una aplicación
polinomial bien definida.

La afirmación iii) es de mera verificación para el lector. 

8.6.6. Nullstellensatz como Equivalencia Natural. Como consecuencia de los dos


functores contravariantes construidos tenemos la interpretación final del Nullstellensatz de
Hilbert-Kronecker buscada:
Teorema 8.6.8 (Nullstellensatz como Equivalencia Natural). Los dos functores (∗ ,∗ )
(A)
antes descritos definen una equivalencia natural entre las categorı́as VK y K − Ared .
Demostración. Se trata, esneicalmente, de probar que si F : R −→ S es un morfismo en-
tre dos K−álgebras reducidas finitamente generadas. Si R ∼ = K[V ], S ∼= K[W ] y consideramos
F∗ : W −→ V es la aplicación polinomial asociada entre V y W . Y si, de nuevo, consideramos
el morfismo de anillos (F∗ )∗ : K[W ] −→ K[V ], entonces, los isomorfismos de K−álgebras entre
R y K[V y S con K[W ] se comportan bien como equivalencias naturales. 

8.7. Variaciones del Nullstellensatz en otros contextos (Cultura General)


El Nullstellensatz y su filosofı́a de identificar objetos (tı́picamente geométricos) con los anil-
los de funciones ha influenciado mucho del pensamiento geométrico a lo largo del siglo XX.
Aquı́ mostraremos tres ejemplos sencillos cuyos fundamentos hablan de objetos culturalemente
conocidos por los alumnos.

8.7.1. Variación de un primer tema clásico: El Teorema de Banach-Čech-Gel’fand-


Stone-. Una variación clásica del Nullstellensatz es el famoso Teorema de Banach-Čech-Gel’fand-
Stone-Kolmogorov (y algún otro autor que, probablemente, descubirán un resultado análogo
por el camino. (Véase, por ejemplo, el trabajo reciente H.-L. Gau, J.-S. Jeang, N.-C. Wong,
An algebraic approach to the Banach-Stone Theorem for separating linear bijections. Tai. J. of
Math. 6 (2002) 399-403.). Una demostración del mismo pude consultarse en [GiJe, 1976]. No
inistiremos aquı́ en su historia, pero este resultado afirma lo siguiente:
Teorema 8.7.1 (Banach-Stone-Čech-Gel’fand-Kolmogorov). Si X es un espacio topológico
compacto, entonces X es homemorfo al espectro maximal de C (X).

Una versión equivalente en términos de equivalencia natural entre categorı́as (recuérdese la


Definición en 112) puede ser la siguiente:
Teorema 8.7.2 (Banach-Stone-Čech-Gel’fand-Kolmogorov). Si X, Y son dos espacios
topológicos compactos de Hausdorff y f : X −→ Y es una función continua tal que C 0 (f ) es
isomorfismo de R−álgebras entre C 0 (X) y C 0 (Y ), entonces f es un homeomorfismo.

En realidad el resultado en más completo y afirma lo siguiente:


Corolario 8.7.3. Sea E Tcompact la categorı́a de los espacios topológios compactos. Entonces,
existe una equivalencia natural entre E Tcompact y la subcategorı́a de anillos determinada por
las R−álgebras de la forma C (X, R), donde X es una espacio topológico compacto.

Dicho de otro modo, ambas categorı́as son equivalentes y lo mismo da estudiar los espacios
topológicos compactos o esta subclase de la categorı́a de anillos. Éste es el propósito de es-
tablecer equivalencias naturales: establecer conexiones entre teorı́as matemáticas que permitan
transferir en ambos sentidos información, resultados y, por ende, conocimiento.
8.7. VARIACIONES DEL NULLSTELLENSATZ EN OTROS CONTEXTOS (CULTURA GENERAL) 423

8.7.2. Variación de un segundo tema clásico: El Lema de Urysohn y el Teorema


de Extensión de Tietze.
Definición 118 (Espacio Topológico Normal). Un espacio topológico (X, T ) se dice nor-
mal si verifica la siguiente propiedad para sus cerrados: Dados dos cerrados F, G ∈ T c , disjun-
tos, existen dos abiertos A, B ∈ T tales que F ⊆ A, G ⊆ B y A ∩ B = ∅.

Ejemplo 8.7.4. Unos pocos ejemplos convencionales: espacios métricos, espacios compactos
de Hausdorff. Mientras que Cn es normal con la topologı́a usual y no lo es con la topologı́a de
Zariski.

Teorema 8.7.5 (Lema de Urysohn). Sea X un espacio topológico normal, dados F, G dos
cerrados en X, existe una función continua f ∈ C (X) tal que f (X) ⊆ [0, 1] y se tiene:

f = 0, f = 1.
F G

Este resultado es conocido como el primer resultado no trivial en Topologı́a. Se puede obvia-
mente probar que un espacio topológico es normal si y solamente si verifica la propiedad descrita
en el Lema de Urysohn. Una de sus consecuencias más famosas es el siguiente resultado:
Teorema 8.7.6 (Teorema de Extensión de Tietze-Urysohn). Sea F un cerrado en un
espacio topológico normal X. Entonces, para cada función continua f ∈ C (F ) existe una
función continua ϕ ∈ C (X) tal que
ϕ F = f.

Una interpretación casi inmediata del Teorema de Tietze (en nuestro contexto) es la siguiente.
Consideremos X un espacio topológico y sea F ⊆ X un cerrado. Tenemos un morfismo de
anillos dado por la restricción:
ρ : C (X) −→ C (F ),

ϕ 7−→ ϕ . F
Claramente se trata de un morfismo de anillos y se tiene el siguiente enunciado equivalente del
Teorema de Tietze:

Teorema 8.7.7 (Teorema de Extensión de Tietze-Urysohn, versión 2). Con las anteri-
ores notaciones, si X es un espacio topológico normal, entonces ρ es un epimorfismo de anillos,
Ker(ρ) = I(F ) y se tiene el siguiente isomorfismo de anillos:
C (F ) =∼ C (X)/I(F ).

8.7.3. Variación de un tercer tema clásico: Extensión de funciones en Var-


iedades Diferenciables. Un recubrimiento abierto {Ui : i ∈ I} de un espacio topológico
(X, T ) es una familia de abiertos {Ui : i ∈ I} ⊆ T que “recubren” X, i.e.
[
X⊆ Ui .
i∈I

Un refinamiento de un cubrimiento abierto {Ui : i ∈ I} de un espacio topológico (X, T ) es


otro recubrimiento por abiertos {Vj : j ∈ J} tal que para cada j ∈ J, existe i ∈ I satisfaciendo
Vj ⊆ Ui .
Definición 119 (Espacio topológico paracompacto). Un espacio topológico paracompacto
es un espacio topológico (X, T ) tal que todo recubrimiento posee un refinamiento localmente
finito. Es decir, dado un recubrimiento por abiertos {Ui : i ∈ I} de X, existe un refinamiento
abierto {Vj : j ∈ J} tal que para cada x ∈ X, el refinamiento satisface:
] ({j ∈ J : x ∈ Vj ) < ∞.

Definición 120 (Partición de la Unidad). Sea X un espacio topológico, una partición de


la unidad es una familia de funciones continuas {ϕi : i ∈ I} ⊆ C (X) verificando:
• Para cada x ∈ X, el cardinal de los i ∈ I tales que ϕi (x) 6= 0 es finito.
424 8. NULLSTELLENSATZ

• Para cada x ∈ X, X
ϕi (x) = 1.
i∈I
Se dice que una partición de la unidad {ϕi : i ∈ I} ⊆ C (X) está subordinada a un cubrimiento
abierto {Ui : i ∈ I} de X si supp(ϕi ) ⊆ Ui para cada i ∈ I 3.

Teorema 8.7.8. Si X es un espacio topológico paracompacto, entonces posee particiones de la


unidad y particiones de la unidad subordinadas a cubrimientos abiertos.
Las variedades diferenciables, cuando aparezcan en los ejemplos, se suponen siempre paracom-
pactas.
Teorema 8.7.9. Dada una variedad diferenciable (paracompacta) M y un cubrimiento abierto
de M , existe un subcubrimiento abierto localmente finito y una partición de la unidad {fi : i ∈
I} subordinada al subcubrimiento y tal que para cada i ∈ I, fi ∈ C ∞ (M ).
El Teorema 7.2.9 es consecuencia de la existencia de particiones de unidad en variedades para-
compactas.
Definición 121 (Funciones lisas en un cerrado). Sea F un cerrado en una variedad difer-
enciable M , una función continua f : F −→ R se dice que es C ∞ sobre F si para cada x ∈ F ,
existen un entorno abierto Ux de x en M y una función C ∞ , ϕx : Ux −→ R tal que

ϕx = f
Ux ∩F
. F ∩Ux
Se denota por C ∞ (F ) al anillo de las funciones lisas definidas sobre F .

Corolario 8.7.10. Con las anteriores notaciones, para cualquier cerrado F en X, la re-
stricción:
ρ : C ∞ (M ) −→ C ∞ (F )

ϕ 7−→ ϕ , F
es un epimorfismo de anillos. Más aún, el siguiente es un isomorfismo de anillos:
C ∞ (F ) ∼
= C ∞ (M )/I(F ).

8.8. Ejericios y Problemas sobre el Nullstellensatz


Problema 292. Prueba el Corolario 8.5.15. Es decir, prueba la afirmación siguiente:
Sea K un cuerpo infinito, K su clausura algebraica y Spec(K[X1 , . . . , Xn ] el espectro primo del
anillo K[X1 , . . . , Xn ]. Entonces la siguiente aplicación es una biyección:
IK : {V ⊆ An (K) : V es K−definible irreducible} −→ Spec(K[X1 , . . . , Xn ])
V 7−→ IK (V ).
La inversa de esta aplicación es la aplicación dada por:
VA : Spec(K[X1 , . . . , Xn ]) −→ {V ⊆ An (K) : V es K−definible irreducible}
p 7−→ VA (p).
Problema 293. Prueba el Corolario 8.5.17. Es decir, prueba la afirmación siguiente:
Sea K un cuerpo infinito, K su clausura algebraica, Pn (K) el espacio proyectivo de dimensión
n sobre K. La siguiente es una biyección entre los ideales homogéneos radicals y las variedades
algebraicas proyectivas K−definibles. Es decir, consideremos los conjuntos
V arK (Pn (K)) := {V ⊆ Pn (K) : V algebraica K−definible},
y
(hom) √
RadK := {a ( K[X0 , . . . , Xn ] : a ideal homogéneo, a = a}.
Entonces, la siguiente es una biyección:
(P) (hom)
IK : V arK (Pn (K)) −→ RadK
(P)
V 7−→ IK (V ).
3Recuérdese que el soporte supp(f ) de una función es la clausura del conjunto de puntos donde la
función no se anula.
8.8. EJERICIOS Y PROBLEMAS SOBRE EL NULLSTELLENSATZ 425

La aplicación inversa es la dada por:


(hom)
VP : RadK −→ V arK (Pn (K))
a 7−→ VP (a).
De hecho, se tiene
(P) √
IK (VP (a)) = a.
Problema 294 (Ideales primos homogéneos y variedades proyectivas irreducibles).
Prueba el Corolario 8.5.18. Es decir, prueba la afirmación siguiente:
Sea K un cuerpo infinito, K su clausura algebraica, Pn (K) el espacio proyectivo de dimensión n
sobre K. La siguiente es una biyección entre los ideales primos homogéneos y las variedades al-
gebraicas proyectivas K−definibles e irreducibles. Es decir, consideremos el siguiente conjunto:
Proj(K[X0 , . . . , Xn ]) := {p ∈ Spec(K[X0 , . . . , Xn ]) : p ( m0 , p homogéneo},
denominado el espectro homogéneo del anillo K[X0 , . . . , Xn ] con la graduación habitual. Con-
sideremos también el conjunto:
IrredK (Pn (K)) := {V ⊆ Pn (K) : V 6= ∅ algebraica, K−definible e irreducible}.
Entonces, la siguiente es una biyección:
(P)
IK : IrredK (Pn (K)) −→ Proj(K[X0 , . . . , Xn ])
(P)
V 7−→ IK (V ).
La aplicación inversa es la dada por:
VP : Proj(K[X0 , . . . , Xn ]) −→ IrrK (Pn (K))
a 7−→ VP (a).
Problema 295 (Puntos proyectivos y sus ideales, caso K = K). Prueba el Corolario
8.5.19. Es decir, prueba la afirmación siguiente:
Supongamos K = K un cuerpo algebraicamente cerrado y sea Pn (K) el espacio proyectivo de
dimensión n sobre K. La siguiente es una biyección entre los puntos proyectivos en Pn (K) y
algunos ideales (no maximales) de K[X0 , . . . , Xn ]. Consideremos x = (z0 : · · · , zn ) ∈ Pn (K)
dado por sus coordenadas homogéneas. Definamos el ideal en Proj(K[X0 , . . . , Xn ] siguiente:
m(P)
z := ({zj Xj − zj Xi : 0 ≤ i, j ≤ n}) ∈ Proj(K[X0 , . . . , Xn ]),

es decir, el ideal generado por los menores 2 × 2 de la matriz:


 
z0 z1 · · · zn
.
X0 X1 · · · Xn
La siguiente es una biyección:
(P) (P)
IK : Pn (K) −→ {mz ∈ Proj(K[X0 , . . . , Xn ]) : z ∈ Pn (K)}
(P)
z 7−→ IK ({z}).
La aplicación inversa es la dada por:
(P)
VP : {mz : z ∈ Pn (K)} −→ Pn (K)
(P) (P)
mz 7−→ VP (mz ).
8.8.1. La topologı́a de Zariski en el espectro de un anillo. Haremos su pre-
sentación como un sencillo problema. Recuérdese la noción de espacio topológico noetheriano
introducido en el Problema 282. La idea de introducir una topologı́a de Zariski en Spec(R)
está fuertemente inspirada en el Nullstellensatz. Si, al cabo, las variedades algebraicas están
identificadas con los ideales radicales y los puntos con los maximales tendrı́a sentido introducir
una topologı́a de Zariski en MaxSpec(R) para cualquier anillo R. Sin embargo, MaxSpec(R)
se porta mal para morfismos entre anillos (la contracción de un ideal maximal no siempre es
maximal), con lo que nos vemos forzados a enriquecer a MaxSpec(R) con “puntos” que no se
ven: esos puntos son los elementos de Spec(R) y el siguiente problema resume cómo se comporta
la topologı́a de Zariski en Spec(R).
426 8. NULLSTELLENSATZ

Problema 296 (La topologı́a de Zariski en Spec(R)). Comencemos con un aspecto nota-
cional: Sea R un anillo, p ∈ Spec(R) y f ∈ R. Denotemos mediante f (p) la clase f + p ∈ R/p.
Nótese que es una notación, aunque no debe entenderse f funcionalmente, pero nos permite
definir los siguientes conjuntos. Dado a un ideal de R, definamos
V (a) := {p ∈ Spec(R) : f (p) = 0 ∈ R/p}.
Del mismo modo, dado F ⊆ Spec(R) podemos definir
I(F ) := {f ∈ R : f (p) = 0, ∀p ∈ F }.
Probar las afirmaciones siguientes:
i) V (a) = {p ∈ Spec(R) : p ⊇ a}. En particular, pruébese que V (a) es biyectable con
Spec(R/a).T
ii) I(F ) := {p ∈ Spec(R) : p ⊇ (F )}, donde (F ) es el ideal geberado por F .
iii) Existe una única topologı́a en Spec(R) cuyos cerrados son los subconjuntos de la forma
V (a) (llamada topologı́ de Zariski en el espectro Spec(R)).
iv) Un subconjunto F ⊆ Spec(R) es cerrado si y solamente si V (I(F )) = F .
v) Definimos elemento nilpotente módulo un ideal a de R como un elemento f ∈ R tal
que el morfismo de R−módulos siguiente es nilpotente:
ηf : R/a −→ R/a
h + a 7−→ f h + a.
Pruébese que el conjunto de todos los√elementos nilpotentes con respecto a un ideal a
es un ideal de R. Denotaremos √ por a a ese ideal y lo denominaremos radical del
ideal a y lo denotaremos
√ por a. Diremos que un ideal a es radical si coincide con su
su radical (i.e. si a = a) √
vi) Pruébese que para cada ideal a de R, a = I(V (a)).
vii) Existe una biyección entre los ideales radicales de R y los cerrados de Spec(R) para la
topologı́a de Zariski.
viii) Dado un morfismo de anillos ϕ : R −→ T , la aplicación
Spec(ϕ) : Spec(T ) −→ Spec(R)
p 7−→ pc := ϕ−1 (p),
es una aplicación continua para las respectivas topologı́as de Zariski.
Problema 297 (Noetherianidad en Spec(R)). Con las notaciones del problema precedente,
consideremos R un anillo notheriano y sea Spec(R) su espectro primo con la topologı́a de Zariski.
Pruébese que se verifican las siguientes propiedades:
i) Todo cerrado para la topologı́a de Zariski de Spec(R) puede ser dado como la inter-
sección finita de cerrados de la forma
V (f ) := {p ∈ Spec(R) : f (p) = 0},
con f ∈ R.
ii) Todo abierto para la topologı́a de Zariski de Spec(R) puede ser dado como la unión
finita de abiertos de la forma
D(f ) := {p ∈ Spec(R) : f (p) 6= 0},
con f ∈ R.
iii) Los cerrados de Spec(R) verifican la Condición de Cadena Descendente para
Cerrados, i.e. toda cadena numerable descendente de cerrados de Spec(R):
V0 ⊇ V1 ⊇ V2 ⊇ · · · ⊇ Vn ⊇ · · · ,
se estabiliza.
iv) Los abiertos de Spec(R) verifican la Condición de Cadena Ascendente para
abiertos, i.e. toda cadena numerable ascendente de abiertos de Spec(R):
A0 ⊆ A1 ⊆ A2 ⊆ · · · ⊆ Vn ⊇ · · · ,
se estabiliza.
v) Bajo el Axioma de Elección Dependiente, toda familia no vacı́a de cerrados de Spec(R)
para la topologı́a de Zariski posee elemento minimal.
8.9. META-MATEMÁTICA DE PRIMER ORDEN SOBRE CUERPOS 427

vi) Bajo el Axioma de Elección Dependiente, toda familia no vacı́a de abiertos de Spec(R)
para la topologı́a de Zariski posee elemento minimal.
vii) Todo cerrado en Spec(R) para la topologı́a de Zariski es quasi-compacto.
viii) Todo abierto en Spec(R) para la topologı́a de Zariski es quasi-compacto.

8.9. Meta-matemática: La Teorı́a de Primer Orden sobre los Complejos admite


Eliminación de Cuantificadores (Opcional, no se imparte en esta forma).
8.9.1. Teorı́a de Primer Orden sobre cuerpos algebraicamente cerrados. La Meta-
matemaática, o la Lógica Formal, son términos que definen el campo que estidia, con métodos
matemáticos, la Matemática “per se”, como objeto de estudio. Para ello, no estudio las dis-
tintas ramas de la Matemática sino la Matemática y sus procedimientos deductivos. Esto se
hace a través del análisis de las Teorı́as Formales o Teorı́as Axiomáticas. En esas teorı́as,
expresiones involucrando uantificadores y expresiones elementales de una teroı́a vienen a ser
llamadas Lógica de Primer Orden o Teorı́a de Primer Orden. Una de las primeras de las que
se supo que era completa (es decir, Tautologı́a -también llamada Verdad- es equivalente a lo
demostrable, también llamado Teorema) y decidible (es decir, podemos decidir la verdad o
falsedad de una expresión mediante algoritmos) es la Teorı́a de Primer Orden de Cuerpos Alge-
braicamente Cerrados. Desde la tesis de K. Gödel sabemos que hay muchas Teorı́a incompletas
e indecidibles. Y la clave para probar ambas propiedades en el caso de cuerpos algebraicamente
cerrados es el Nullstellensatz. Lo que se hace es simplemente desmostrar que se pueden eliminar
bloques de cuantificadores (existenciales como ∃ o universales como ∀) y obtener fórmulas sin
ciantificadores de la misma teorı́a.
Analicemos un poco esa formulación, sin entrar en profundidad en los detalles. Por simplicidad
supongamos K = Q y K = C que, aunque no es la clausura algebraica de Q admite la misma
formulación.
Consideremos todas las expresiones que se pueden escribir usando los siguientes elementos y
sus combinaciones naturales (definen un lenguaje regular):
• Un conjunto numerable de variables {Xn : n ∈ N},
• Un conjunto de constantes {0, 1, −1},
˙ y la inversión sobre las constantes
• Operaciones usuales de la teorı́a de anillos ({+, −, })
−1
no nulas { }.
• Condiciones de signo {= 0}.
• Operadores booleanos {∨, ∧, ¬}.
• Cuantificadores que afectan a elementos de K: {∀, ∃}.
Unas pocas observaciones:
i) Las constantes son los objetos que puedo construir usando {−1, 0, 1} y las operaciones
elementales de cuerpo {+, −, }. ˙ Luego se trata de los número naturales Z.
ii) Si admito la inversión de constantes no nulas ({−1 }) tengo el cuerpo de los racionales
Q.
iii) Las funciones se obtienen mezclando constantes (en Q), variables y las operaciones de
anillo {+, −, }, ˙ son los polinomios en un número finito de variables Q[X0 , . . . , Xn ].
iv) Las fórmulas atómicas son, expresiones de la forma f (X0 , . . . , Xn ) = 0, con f ∈
Q[X0 , . . . , Xn ] un polinomio en un número finito de variables. Usualmente, de admiten
como fórmulas atómicas las negaciones de las anteriores, es decir, ¬(f (X0 , . . . , Xn ) =
0) o, equivalentemente, f (X0 , . . . , Xn ) 6= 0.
v) Se admiten coombinaciones booleanas de fórmulas atómicas. Se pede probar que todas
se pueden escribir como:
  !
n
_ ^k ^ ^ t
 (fi,j = 0) (gi,` 6= 0) .
i=1 j=1 `=1

Una de las primeras observaciones casi inmediatas es que se puede suponer que todas las
fórmulas son estudiables en forma pre-nexa, es decir, con los cuantifidaores por delante. Suponiendo
428 8. NULLSTELLENSATZ

que fi,j , hi,j ∈ K[X0 , . . . , Xn ], una fórmula se primer orden en el lenguaje de cuerpos algebra-
caente cerrados en forma pre-nexa es una fórmula del tipo:
  !
_n k
^ ^ ^ t
Q1 Xi1 , . . . , Qr Xir ,  (fi,j = 0) (gi,` 6= 0) ,
i=1 j=1 `=1

donde Qi ∈ {∀, ∃} son cuantificadores. Si los cuantificadores son todos del tipo Qi ∈ {∃},
decimos que es una fórmula existencial o que sólo involucra un bloque de cuantificadores exis-
tenciales.
La Semántica de esas fórmulas consiste en interpretar (instanciar o sustituir variables por
constantes en un dominio) las fórmulas con subconjuntos de An (K), donde K es algebraicamente
cerrado:
i) Ası́, un átomo, f (X0 , . . . , Xn ) = 0 se iterpreta como el conjunto algebraico
V (f ) := {x = (x0 , . . . , xn ) ∈ Kn+1 : f (x) = 0}.
ii) Una fórmula del tipo:
 
k
^
 (fi,j (X0 , . . . , Xn ) = 0) ,
j=1

se interpreta con la variedad algebraica (también llamado cerrado en la topologı́a de


Zariski) VA (ai ) donde ai es el ideal generado por fi,1 , . . . , fi,m . Es decir, con
k
\
V (fi,1 , . . . , fi,m ) = {x ∈ Kn+1 : fi,j (x) = 0} = VA (ai ).
j=1

De hecho, el Teorema de la Base indica que todo V (a), para cualquier ideal a de
K[X0 , . . . , Xn ] se puede escribir mediante una fórmula de este tipo.
iii) Una negación de un átomo f (X0 , . . . , Xn ) 6= 0 se identifica con el complementario de
un conjunto algebraico dado por una sola ecuación:
V (f )c := {x = (x0 , . . . , xn ) ∈ Kn+1 : f (x) 6= 0}.
Son los abiertos de la base de la toplogı́a de Zariski.
iv) Las fórmulas del tipo:
t
!
^
(gi,` (X0 , . . . , Xn ) 6= 0) ,
`=1

también se interpretan como elementos de la base de abiertos de la topologı́a de Zariski


dado que:
t
! t
!
^ Y
n+1 n+1
{x ∈ K : (gi,` (x) 6= 0) } = {x ∈ K : (gi,` (x) 6= 0) }.
`=1 `=1

v) Las fórmulas del tipo:


r t
!
_ ^
(gi,` (X0 , . . . , Xn ) 6= 0) ,
i=1 `=1

también se interpretan como abiertos de la topologı́a de Zariski dados como uniones


finitas de intersecciones de abiertos de la base de la topologı́a de Zariski:
r t
!
[ \
n+1
{x ∈ K : (gi,` (x) 6= 0)} .
i=1 `=1

Por culpa de la condición noetheriana (Teorema de la Base de Hilbert) todos los


abiertos de la topologı́a de Zariski serán uniones finitas de abiertos de la base y, por
tanto, expresables mediante fórmulas de este tipo.
8.9. META-MATEMÁTICA DE PRIMER ORDEN SOBRE CUERPOS 429

vi) Las fórmulas del tipo:


  !
k
^ ^ t
^
 (fi,j = 0) (gi,` 6= 0)
j=1 `=1

se interpretan como conjuntos que son intersección de un abierto y un cerrado en la


topologı́a de Zariski.
  !
k
^ ^ ^ t
n+1
Si := {x ∈ K :  (fi,j = 0) (gi,` 6= 0) }.
j=1 `=1

Es decir, se tiene
  !
\k \ t
\
Si =  {x ∈ Kn+1 : fi,j = 0} {x ∈ Kn+1 : gi,` 6= 0}  .
j=1 `=1

Se llaman, obviamente, localmente cerrados en la topologı́a de Zariski.


vii) Las uniones finitas de localmente cerrados se denominan constructibles de la toplogı́a
de Zariski y, obviamente, son dados por fórmulas de la forma siguiente:
  !
_s ^k ^ ^ t
 (fi,j = 0) (gi,` 6= 0) ,
i=1 j=1 `=1

que son interpretadas como el conjunto:


  !
s
[ \k \ t
\
C :=  {x ∈ Kn+1 : fi,j = 0} {x ∈ Kn+1 : gi,` 6= 0}  ,
i=1 j=1 `=1

o, equivalentemente,
s t
!!
[ \ \
C := VA (fi,1 , . . . , fi,k ) {x ∈ Kn+1 : gi,` 6= 0} .
i=1 `=1

Teorema 8.9.1 (Teorema Fundamental de la Teorı́a de la Eliminación, versión Cheval-


ley). Sea C ⊆ Kn+1 un conjunto constructible y sea π : Kn+1 −→ Kr una proyección. Entonces,
π(C) ⊆ Kn+1 es también constructible.
En otras palabras, sea C ⊆ Kn+1 un conjunto constructible dado por una fórmula Φ(X0 , . . . , Xn )
sin cuantificadores. Sea π : Kn+1 −→ Kr la proyección dada mediante:
π: Kn+1 −→ Kr
(x0 , . . . , xn ) 7−→ (xn−r+1 , . . . , xn ).
La proyección π(C) es el conjunto dado por la fórmula
∃Xn−r+1 ∈ K, . . . , ∃Xn ∈ K, Φ(X0 , . . . , Xn ).
El Teorema afirma que existe una fórmula de primer orden libre de cuantificadores Ψ de la
forma
  !
n
_ k
^ t
^ ^
Ψ(X0 , . . . , Xn−r ) :=  (fi,j (X0 , . . . , Xn−r ) = 0) (gi,` (X0 , . . . , Xn−r ) 6= 0) ,
i=1 j=1 `=1

tal que
π(C) := {x ∈ Kn−r+1 : Ψ(x0 , . . . , xn−r )}.
Por tanto, toda fórmula con cuantificadores existencias es equivalente a una fórmula sin cuan-
tificadores (se dice libre de cuantificadores). Como los constructibles son cerrados por comple-
mentación y ∀ se interpreta mediante ¬ (∃¬(...)), podemos concluir.
Teorema 8.9.2. Toda fórmula de primer orden del lenguajde de cuerpos algebraicamente cer-
rados es semánticamente equivalente a una fórmula libre de cuantificadores. Luego la teorı́a es
completa. Además es decidible, es decir, existe un algoritmo que elimina los cuantificadores de
la fórmula cuantificada.
Glosario de Términos

abierto distinguido (Zariski), 344 cociente, anillo, 59


abierto distiniguido en Pn (K), 366 cociente, módulo, 85
acción a izquierda (de grupo), 27 coeficiente director (de un polinomio
acción a izquierda (de monoide), 27 univariado), 57
fiel, 32 complejo (de cadena) de R−módulos, 101
transitiva, 32 complejo (de co-cadena) de R−módulos,
alfabeto, 18 101
R−álgebra, 58 componente aislada, 329
finita, 88 componente homogénea de f grado i, 367
finitamente generada, 88 componentes inmersas, 329
algebraico, elemento, 162 componentes irreducibles de una variedad,
altura (logarı́tmica) de un número natural, 358
161 componentes irreducibles de una variedad
analı́tica, función , 70 proyectiva, 377
anillo, 54 conúcleo (morfismo de R−módulos), 86
cociente, 59 condición de cadena ascendente numerable
anillo de polinomios sobre un anillo no (CCA), 144
necesariamente conmutativo, 57 Conjetura de Cook, 384
principal, 88 conjunto de ceros de un conjunto de
reducido, 315 funciones, 341
producto de anillos, 258 conjunto minimal de generadores de un
anulador de un elemento, 204, 325 R−módulo, 88
anulador de una matriz, 131 cono afı́n, 365
aplicaciı́on polinomial K−definible, 419 cono proyectante, 365
aplicaciones polinomiales, 419 constructibles, 429
Artin, anillo de, 188 contenido de un polinomio, 301
artiniano, R−módulo, 333 contracción (de un ideal), 59
artiniano, anillo, 333 coordenadas homogéneas, 363
asociado, ideal primo, 325 coprimos, elementos, 295
automorfismo (de R−módulos), 84 coproducto de R−módulos, 82
automorfismo (de anillos), 59 cuádrica proyectiva, 366
cuerpo, 58
base (de un R−módulo), 94
algebraicamente cerrado, 165
base monomial, 96
cuerpo computable, 351
byte, 19
cuerpo de fracciones de un dominio, 142
cı́clica, forma canónica de un cuerpo de funciones racionales, 142
endomorfismo, 215, 248 cuerpo de Galois GFq , 106
caracterı́stica de un cuerpo, 60 (formalmente) real, 75
casi-anillo, 55 primo, 60
clausura algebraica, 167
clausura algebraica (de un cuerpo en otro), descomposición en irreducibles de una
165 variedad, 358
co-producto de módulos, 82 descomposición en valores singulares
cociente de ideales, 330 (SVD), 40
cociente de la división (euclı́dea) quo(f, g), descomposición en valores singulares
62 (SVD), caso complejo, 41
431
432 GLOSARIO DE TÉRMINOS

descomposición irredudante en irreducibles espectro maximal, 187


(de una variedad algebraica espectro primo, 187
proyectiva), 377 estabilizador de un punto, asociado a una
descomposición primaria, 323 acción), 32
descomposición primaria (submódulos), euclı́dea, función, 147
331 Euler, función, 179, 404
descomposición primaria irredundante Euler, mentiroso, 314
((submódulos), 331 Euler, testigo, 313
descomposición primaria reducida, 323 exponente monomial, 67
desigualdad triangular fuerte, 109, 110 extensión (de un ideal), 90
determinante, 112 extensiones finitas de cuerpos, 164
diagrama conmutativo, 99
diagrama de R−módulos, 99 , asociados a una matriz Mn (K),
difeomorfismo, 23 241
diofánticas homogéneas, ecuaciones factores invariantes, de A ∈ Mm×n (R), R
lineales, 208 DIP, 236
discriminante de un polinomio univariado , de un grupo abeliano finitamente
sobre un cuerpo, 288 generado, 237
divisor de cero, 61 , de un R−módulo finitamente
divisor de cero, en un módulo, 325 generado, R DIP, 241
divisores elementales de un grupo abeliano, Fibonacci, Sucesión, 159
270 filtración p−ádica, 108
divisores elementales de un módulo sobre fitración p−ádica, 109
un DIP, 269 fitración en R[[X]], 110
dominio, 61 fitración, orden en un cero, 109
de ideales principales, 139 forma cuadrática, 366
de integridad, 61 Frobenius, forma canónica de un
euclı́deo, 147 endomorfismo, 215, 248
de factorización única, 295 fución multi-lineal, 112
función booleana, 70
ecuaciones diferenciales lineales función continua, 72
homogéneas con coeficientes función diferenciable, 72
constantes, resolución, 289 función multi-lineal alternada, 113
ecuaciones diofanticas lineales, 185 función polinomial, 73
ecuaciones lineales diofánticas, 217 función polinomial K−definible sobre V ,
Einsenstein, enteros, 63 419
Elección Dependiente, Axioma, 143 función polinomial sobre V , 419
endomorfismo (de R−módulos), 84 funciones polinomiales K−definibles sobre
endomorfismo (de anillos), 59 An (K), 352
epimorfismo (de R−módulos), 84 funciones racionales, 142
epimorfismo (de anillos), 59 functor contravariante, 417
epimorfismo (de grupos), 23 functor covariante, 417
epimorfismo (en una categroı́a), 416
equivalencia natural, 419 Galois, Problema Inverso, 54
escalón (asociado a un exponente Gauss, enteros, 63
monomial), 77 generador (de un ideal), 87
escindida, s.e.c, 201 generador (de un subgrupo), 26
espacio afı́n n−dimensional sobre un generador (de un submódulo), 87
cuerpo An (K), 352 grado (de un polinomio univariado), 57
espacio afı́n sobre un cuerpo, 74 grado de un polinomio multivariado, 68
espacio proyectivo, 30 grado de una extensión de cuerpos, 164
espacio proyectivo n−dimensional Pn (K), grafo orientado, 99
38, 363 Gröbner, Base, 159
espacio proyectivo sobre un cuerpo, 38 grupo, 21
espacio vectorial dual, 418 abeliano, 21
espectro homogéneo de un anillo cı́clico finito, 21
(graduado), 410 cociente, 37
GLOSARIO DE TÉRMINOS 433

de Baer-Specker, 108 irreducibles, componentes de un cerrado en


de permutaciones sobre X, 21 un espacio topológico neotheriano, 380
ortogonal, 36 isomorfimo birregular K−definible, 420
simétrico, 42 isomorfismo (de R−módulos), 84
especial ortogonal SO(n), 53 isomorfismo (de anillos), 59
unitario, 31 isomorfismo birregular, 420
alternado, 115
, morfismo, 22 Jacobi-Legendre, sı́mbolo, 312
, automorfismo, 23 Jordan, caja, 275
, endomorfismo, 22 Jordan, forma canónica de un
, isomorfismo, 23 endomorfismo, 275, 277

k−ciclo, 44
Hilbert, Problema X, 254
hiper-superficie, 341 Legendre, sı́mbolo, 307
hiper-superficie afı́n definida por f en lenguaje, 18
An (K), 353 lexicográfico, orden, 19
hiper-superficie algebraica proyectiva, 365 libre, modulo, 94
hiperplano en el infinito, 364 lifting property, 197
hiperplano proyectivo, 366 local, anillo, 187
holomorfa, función , 71 localemente cerrado, 429
homeomorfismo, 23 localización de A en pZ, 110
homogéneo, ideal de polinomios, 369
homotecia, 28 Möbius, función, 404
homotecia (de multiplicación por máximo común divisor, 140
g ∈ R[X]: ηg ), 387 máximo común divisor en DFU’s, 298
homotecia asocial al elemento g, 242 métrica m−ádica en K[[X]], 111
homotecia de razón a sobre M , 318 módulo dual, 86
módulos de homologı́a, 101
ideal, 58 Matrices de Operaciones Elementales en
finitamente generado, 87 GL(2, R), 218
impropio, 58 Matrices de Operaciones Elementales en
ideal irreducible, 324 GL(n, R), 222
maximal, 187 matriz adjunta, 122
ideal maximal asociado a un punto, 349 compañera, 212, 242
primo, 187 hermitiana, 31
principal, 58 orlada, 225
propio, 58 ortogonal, 36
ideal radical, 315 unitaria, 31
radical, 426 simétrica, 31
ideal reducible, 324 transpuesta, 31, 115
, asociado a una variedad I(V ), 356 transpuesta conjugada, 31
, asociado a una K−variedad R−módulo, 80
IK (V ), 356 cociente, 85
, funciones que se anulan en F (i.e. finitamente generado, 87
IA[X] (F )), 347 libre, 94
, intersección, 86 libre de torsión, 204
ideales co-maximales, 258 proyectivo, 197
imagen (morfismo de R−módulos), 85 monoide, 17
inclusiones naturales en la suma directa, 85 monomio, 67
ı́ndice (de una permutación), 50 monomorfismo (de R−módulos), 84
intersección (de subgrupos), 26 monomorfismo (de anillos), 59
irreducible, elemento, 141 monomorfismo (de grupos), 23
irreducible, variedad algebraica, 356 monomorfismo (en una categorı́a), 416
irreducible, variedad algebraica biyectivo (de grupos), 23
K−definible, 356 morfismo de anillos, 58
irreducible, variedad algebraica proyectiva, (de R−módulos), 84
375 de monoides, 17
434 GLOSARIO DE TÉRMINOS

de semigrupos, 17 univariado, 56
morfismo docminante K−definible, 420 , mı́nimo de un endomorfismo, 212
morfismo dominante, 420 , multigrado (ord. monomial), 77
inyectivo (de grupos), 23 , término director, 77
morfismo regular, 419 polinomios multivariados, 67
suprayectivo (de grupos), 23 polinomios multivariados, anillo, 67
morfismos (de una categorı́a), 415 pre-orden (sobre un cuerpo), 75
morfismos frontera, 101 pre-orden propio (sobre un cuerpo), 75
morfismos regulares entre variedades, 419 primario, ideal, 319
multi-ı́ndice, 17 primario, submódulo, 330
, grado, 17 primitivo, polinomio, 301
multiplicar por un polinomio sobre K[X]d , primo, elemento, 141
acción, 169 primos inmersos, 329
producto (de ideales), 89
núcleo, (morfismo de R−módulos), 85 producto cartesiano de módulos, 107
número mı́nimo de generadores de un producto de módulos, 81
R−módulo, 88 producto semi-directo, grupos, 37
naturalemente equivalentes, functores proyecciones naturales del producto
covariantes, 418 cartesiano, 85
naturalmente equivalentes, functores proyectivo, módulo, 197
contravariantes, 418 pseudo-anillo, 55
Newton, sumas, 134, 135 [x0 : · · · : xn ], 363
nilpotente, 315 puntos K−racionales de una variedad, 353
nilpotente, elemento, 73
nilpotente, endomorfismo, 319 quasi-compacto, 360
no arquimqediano, valor absoluto, 110
noetheriano, anillo, 145 racional, forma canónica de un
noetheriano, espacio topológico, 379 endomorfismo, 215, 248
normal, espacio topológico, 423 racionales p−ádicos, 110
NP-completos, 385 radical de un ideal, 315√
Nullstellensatz Efectivo, 411 radical de un ideal ( a), 426
Nullstellensatz sobre vareidades rango de un R−módulo libre (caso finito),
cero-dimensionales, 386 97
rango de un R−módulo libre, 195
objetos (de una categorı́a), 415 reducible, variedad algebraica, 356
operación externa, 81 reducible, variedad algebraica
operaciones con matriz orlada, reglas, 225 K−definible, 356
órbita, 29 reducible, variedad algebraica proyectiva,
orden de una serie univariada en 0, 57 375
orden monomial, 66 reducido, anillo, 315
orden sobre un cuerpo, 75 relación de congruencia unitaria, matrices,
31
p−primario, ideal, 319 relación de congruencia, matrices, 31
p−primario, submódulo, 330 relación de equivalencia, matrices, 31
palabra, 18 relación de semejanza, matrices, 31
palabra vacı́a, 18 resto de la división (euclı́dea) rem(f, g), 62
paracompacto, espacio, 423 resultante univariada (“à la
parte primitiva de un polinomio (pp(f )), Sylvester-Bézout”), 172
301 resultante univariara (vı́a homotecias), 387
patición de la unidad, 423 retı́culo, 253
permanente de una matriz, 112 , paralelepı́pedo fundamental, 253
permutación, 42 , volumen, 253
caracterı́stico, 126 RSA, criptosistema, 180
polinomio eliminante en una variable, 173
polinomio homogéneo, 70 Sarrus, Regla determinantes 3 × 3, 121
polinomio mı́nimo en un vector, 211 Satisfactibilidad sobre cuerpos finitos, 386
polinomio univariado, 56 Schur, factorización compleja, 36
INDEX 435

Schur, factorización real, 36 término, 67


secret sharing, 268 , grado, 67
semi-local, anillo, 187 torsion, elemento, 204
semigrupo, 16 transposiciones (2−ciclos), 44
serie de potencias formales, 66 trascendente, elemento, 162
serie de potencias formales univariada, 56
serie, soporte, 67 unidades, de un anillo, 58
simétricas elementales, funciones, 113, 134
sistema dinámico, 32 valor absoluto p−ádico, 110
sistema generador (de un módulo), 87 valor absoluto p−ádico, 109
Smith, formal normal, 236 valor absoluto no arquimediano, 109
subanillo, 55 Vandermonde, matriz, 215
subanillo (sub-R1 −álgebra) generado por variedad algebraica afı́n, 353
R1 y F, 59 variedad algebraica afı́n K−definible, 353
subespacio ϕ−invariante, 106 variedad algebraica ceros ideal homogéneo,
subgrupo, 22 369
alternado An , 53 variedad algebraica proyectiva, 363
cı́clico, 26 variedad algebraica proyectiva
finitamente generado, 26 K−definible, 369
normal, 36 variedad asociada a una familia de
submódulo, 81 funciones, 341
submódulo irreducible, 331 variedad de los ceros de un ideal, 341
submódulo reducible, 331 variedad irreducible, 348
finitamente generado, 87 variedad reducible, 348
, producto por un ideal (aN ), 89 variedades C−analı́ticos, 346
, intersección, 86
, suma de submódulos, 88 Wishart, matriz, 263
sucesión exacta (de R−módulos), 102
sucesión exacta corta (de R−módulos), 102 Zariski, topologı́a, 344
suma (de ideales), 88 , topologı́a en An (K), 355
suma directa de módulos, 82 , abiertos, 344
suma directa módulos, 107 , cerrados, 344
z
Sylvester-Bézout, matriz, 170 , clausura en la topologı́a (Y ), 345
, constructibles, 345
talla (bit) de un número natural, 161 , topologı́a de los K−definibles en
tensor de multiplicación por X, 242 An (K), 355
Teorı́a de la Eliminación, 351 Zariski, topologı́a en Spec(R), 426
Teorema del Reemplazamiento, 88 , localmente cerrados, 345
Glosario de Teoremas y Resultados

1er. Teorema de Isomorfı́a, módulos, 91 Ecuaciones diferenciales homogéneas con


2do. Teorema de Isomorfı́a, módulos, 92 coeficientes constantes, resolución, 288
3er. Teorema de Isomorfı́a, módulos, 92 Ecuaciones Diofánticas lineales, Algoritmo
de Resolución, 231
Teorema del Resto (aka Ruffini), 165 Einsenstein, Lema (res. quad.), 310
Einsentein, construcción (res. quad.), 308
Agrawal-Kayal-Saxena, Test de Elección Dependiente, Axioma, 143
primalidad, 265 Elección, Axioma, 192
Artin-Schreier, Teorema, 76 Estructura de grupos abelianos finitamente
Avoidance Lemma, 212 generados, (Teorema 1), 207
Estructura de grupos abelianos finitamente
Bézout (con cotas) en Z, Identidad, 151 generados, (Teorema 2), 237
Bézout (con cotas) en K[X], Identidad, Estructura de grupos abelianos finitamente
151 generados, (Teorema 3), 270
Bézout (con cotas) en DE, Identidad, 149 Estructura de módulos finitamente
Bézout (sin cotas), Identidad, 140 generados sobre DIP, (Teorema 1), 207
Bézout, Identidad en el Nullstellensatz, 405 Estructura de módulos finitamente
Banach-Čech-Gelf’and- Kolmogorov-Stone, generados sobre DIP, (Teorema 2), 241
Teorema, 422 Estructura de módulos finitamente
Berlekamp, Algoritmo, 179 generados sobre DIP, (Teorema 3), 269
Bernstein, Teorema (Compatibilidad de Euclides, Algoritmo, 149
cardinales), 193 Euclides, Algoritmo, número de divisiones
Buena Ordenación, Principio, 193 en Z, 161
Euclides, división en R[X], 61
caracterización polinomio mı́nimo, Euler, Criterio, 307
Teorema, 212 Euler, Teorema sobre la suma de 4
Chino de los Restos, Teorema, 258 cuadrados, 35
contracción de primos y maximales, 190 Existencia de Dimensión, Axioma, 193
Csanky-Leverrier-Fadeev-Souriau, Factores invariantes de una matriz en
Algoritmo, 289 Mn (K) (Existencia), 241
Factorización en DE (Existencia), 151
DE =⇒ DIP, 148 Factorización en DIP (Existencia), 146
Dedekind, Teorema, 199 Fermat, Teorema “pequeño”, 180
Dedekind-Hasse, Criterio, 154 Forma de Frobenius (Existencia), 215
Densidad de los Números Primos, Frobenius, forma canónica (Existencia),
Teorema, 265 248
Descomposición en valores singulaes, Frucht, Teorema, 54
Teoremas de Existencia, 39
determinante, cálculo modular, 267 Gauss, Lema, 302
Diagonalización de Matrices, Algoritmo Gauss, Lema sobre R[X1 , . . . , Xn ], 304
para Mm×n (R), R DIP o DE, 230 Gauss, Reciprocidad Cuadrática, 307
Dickson, Lema, 158 Gauss, Reciprocidad Cuadrática, Teorema,
DIP 6=⇒ DE, 156 311
Dirichlet, Principio de las Cajas, 36 Gcd en DFU’s (Existencia), 298
dominios con factorización en elementos Gcd en DFU’s, caso ideales principales, 300
primos =⇒ DFU, 296 Gcd en dimensión mı́nima, Algoritmo, 281
437
438 INDEX

Gröbner, base, (Existencia), 158 Noether: Condición de Cadena Ascendente


Gram-Schmidt, Algoritmo, 262 numerable para anillos, 144
Gram-Scmidt, Teorema, 263
Operaciones elementales, matrices en
Hacer ceros en filas y columnas, Algoritmo GL(n, R), 220
para Mn×m (R), R DIP o DE, 228 Pell, Ecuación, caso m = 2, 177
Hacer ceros por filas o columnas, primo ⇔ irreducible, en DFU, 296
Algoritmo para Mn×m (R), R DIP o
DE, 226 Rango de R−módulos libres (Existencia),
Hadamard, Desigualdad, 263 194
Hamilton-Cayley, Teorema, 130, 250 resultante, estabilidad por especialización,
Hermann, Nullstellensatz Efectivo, 411 388
Hilbert, Basissatz en K[X1 , . . . , Xn ], 159
Hilbert-Kronecker Nullstellensatz, 403 Schreier, Teorema, 24
Hilbert-Kronecker Nullstellensatz, Schwartz-Zippel-DeMillo-Lipton,
coeficientes en cuerpos finitos, 403 Algoritmo probabilista, 395
Hilbert-Kronecker Nullstellensatz, Smith, forma normal (algoritmo), 234
equivalencia natural, 422 Smith, forma normal (Existencia), 236
Hilbert-Kronecker Nullstellensatz, Sobre un dominio, libre =⇒ libre de
maximales y puntos, 405 trosión, 204
Hilbert-Kronecker Nullstellensatz, Solovay-Strassen, test de “composición”,
Rabinowitsch trick, 407 313
Hironaka, división en K[X1 , . . . , Xn ], 77 no vacuidad de MaxSpec(R), teorema, 190
Hodges, sobre condición Strassen, multiplicación rápida de
Q noetheriana, 145 matrices, 132
HomR (⊕i∈I Mi , N ) ∼= i∈I HomR (Mi , N ),
Sun Tzu, problema, 261
96
Sylvester-Bézout y grado del gcd ,
determinación, 170
Interpolación (Existencia), 216
Sylvester-Bézout, proyección de dos
Isomorfı́a, grupos, 1er. Teorema, 37
hipersuperficies, 172
Sylvester-Bézout, resultante (caso K[X]),
Jacobi, Reciprocidad Cuadrática, 312, 313
172
Jordan, forma canónica (Existencia), 277
Sylvester-Bézout, resultante (caso R[X]),
172
Karatsuba-Ofman, algoritmo, 78 Sylvester-Bézout, Teorema de Eliminación
Univariada, 169
Lagrange, Interpolación, 216
Lagrange,Teorema sobre los 4 cuadrados Teorı́a de la Eliminación, Teorema
en Z, 36 Fundamental, 429
Lamé, Teorema, 160 Tietze-Urysohn, Teorema de Extensión,
Laplace, Fórmula Generalizada, 122 423
Laplace, Fórmula para el Determinante,
120 Unicidad de la descomposición primaria
Lasker- Noether para cocientes de anillos, reducida en noetherianos, 1er.
Teorema, 327 Teorema, 326
Lasker-Noether (paramódulos Unicidad de la Descomposición Primaria,
noetherianos), 331 1er. Teorema (módulos), 331
Lasker-Noether, Teorema, 325 Urysohn, Lema, 423
Libre de torsión 6⇒ libre si no DIP, Weil, Fórmula del Producto, 110
contraejemplos, 206 Winograd, multiplicación rápida de
Libre ⇔ libre de torsión sobre DIP, matrices, 133
Teorema, 205
Zariski, Existencia de la topologı́a, 344
Miller-Rabin, test de “composición”, 272 Zariski, topologı́as (ejemplos), 345
de Moivre-Binet, Fórmula, 159 Zorn, Axioma (o Lema), 190
Glosario de Sı́mbolos y Abreviaturas

A∗ , 31 EndR (M ), 84
At , 31 E(α), 77
ac , 59 An (K) = Kn , 352
ae , 90 An (K) = K n , 74
(a), 58
aR, 58 Fp , 60
aB, 90 Fq , 106
ab, 89 (F ), 87
aN , 89 hFi, 26
a + b, 88 RhFi, 87
a1 + · · · + am , 88
P m GFq , 106
i=1 ai , 88
gcdDFU , 298
An , 115
gcd(F ), 140
An , 53
gcd(a1 , . . . , am ), 140
AnnR (m), 204, 325
GL(n, R), 125
AnnR[X] (A), 131
[L : K], 164
AnnK (ζ), 162
Ap(S,
√ R), 65 Hd (X1 , . . . , Xn ), 70
a, 426 (i)
H∞ , 364
AssR (M ), 325 (0)
H∞ , 364
H(U ), 71
Bn , 70
ηg , 29
ηg , 387
C (X)(= C 0 (X)), 60
ηX , 242
C ω (U ), 70
HomR (M, M 0 ), 84
C k (U ), 1 ≤ k ≤ ∞, 72
cf., 7 i.e., 19
G/G1 , 37 IK (V ), 356
M/M 0 , 85 I(V ), 356
R/a, 59 IA[X] (F ), 347
(a : b), 330 I(F ), 347
Coker(f ), 86 mx , 349
C(f ), 212 (a1 , . . . , am ), 87
CCA, 144 Id , 21
X
cont(f
` ), 301 Im(f ), 85
i∈I M i , 107 λi , i ∈ I, 85
K(X1 , . . . , Xn ), 142 I(σ), 50
IrrK (ζ), 162
deg(f ) (multivariado), 68
deg(f ) (univariado), 57 Jord(M ), 277
det, 112
DFU, 295 K[X]d , 168
, 100 K[V ], 419
DiscX (f ), 288 K[V ], 419
DIP, 139 χ (X), 126
A
DE, 147 ker(f ), 85
439
440 GLOSARIO DE SÍMBOLOS Y ABREVIATURAS

p
K[An ], 352 (0), 315
K[An (K)], 352 rankR (M ) (caso finito), 97
rankR (M ), 195
λ,
 18  rem(f, g), 62
m
p , 307 rem(a, b), 147
ZpZ , 110 ResX (f, g), 387
LT (f ), 77 Res(f, g), 172
  ρf , 168
m
, 307 RS , 65
Qp n
RN , 66
i∈I Mi , 81
⊕i∈I Mi , 82 Σ∗ , 18
mx , 187, 349, 357 S (X), 21
µϕ , 212 Symn (K), 31
µv , 211 Sn , 42
0 (módulo nulo), 81 MaxSpec(R), 187
M ∗ , 86 Spec(R), 187
ϕ∗ , 420 SO(n), 53
StabG (x), 32
[n], 42
R1 [F], 59
P1m+ · · · + Nm , 88
N
2X , 16
i=1 Ni , 88 s.e.c,
µ(M ), 88 P 102
Pi∈I ai , 88
Oe(f ), 267 i∈I Ni , 88
O¶ (f ), 366 ⊕
Pi∈I Mi , 107
O(f ), 78 K , 75
Og (x), 29 SVD, 39, 40
OS (Y ), 29 SVD, matrices complejas, 41
≤deglex , 66 S (X), 29
≤lex , 66 Sylv(f, g), 171
≤revdeglex , 77 Sm+1 (f ), 169
ord0 (·), 57 T orR (M ), 204
O(n), 36
˙ 25
∪,
pp(f ), 301 U (n), 31
P roj(K[X0 , . . . , Xn ]), 410
Q
i∈I Mi , 107
VAn (K) (a), 353
πi , i ∈ I, 85 VAn (K) (f ), 353
Pn (K), 38 VX (F), 341
P(V ), 38 VX (a), 341
Pn−1 (K), 30 VA (f1 , . . . , fm ), 353
P(V ), 30 VAn (K) (f1 , . . . , fm ), 353
(x0 : x1 : · · · : xn ), 363 VX (f ), 341
VPn (K) (H), 369
Q, 60 VPn (K) (a), 369
quo(f, g), 62 VA (a), 353
qf (R), 142 VA (f ), 353
VP (f ), 365
⊕X R, 94
R[[X1 , . . . , Xn ]], 66 Y X , 16
R[[X]], 56 z
R[X1 , . . . , Xn ], 67 Y , 345
R[X], 56 √ 21
Z/nZ,
(R× , ·), 58 Z[√2]× , 178
Z[ m], 64
√p , 110
Q √
1+ m
a, 315 Z[ 2 ], 64
Bibliografı́a

[AKS, 04] M. Agrawal, N. Kayal, N. Saxena, PRIMES is in P. Annals of Math. 160 (2004), 781-793.
[AW, 2004] S. Alaça, K.S. Williams, “Introductory Algebaic Number Theory”. Cambridge Univ. Press, 2004.
[al-Khwārizmı̄, 820] Muhammad ibn Mūsā al-Khwārizmı̄, “al-Kitāb al-Mukhtas.ar fı̄ H . isāb al-Jabr wal-
Muqābalah”, Bagdad, 820.
[Al, 1999] N. Alon, Combinatorial Nullstellensatz. Combin. Probab. Comput. 8 (1999), 7-29.
[Arr, 2006] E. Arrondo, Another elementary proof of the Nullstellensatz. Amer. Math. Monthly 113 (2006),
169-171.
[AtMc, 1969] M.F. Atiyah, I.G. Macdonald, “Introduction to Commutative Algebra”, Addison-Wesley Pub-
lishing Co., 1969. [Edición en español por Ed. Reverté, 1980].
[AuBu, 1957] M. Auslander, D.A. Buchsbaum, Homological dimension in local rings.Trans. of the Amer.
Math. Soc. 85 (1957), 390–405.
[AuBu, 1959] M. Auslander, D.A. Buchsbaum, Unique factorization in regular local rings. Proc. of the Nat.
Acad. of Sci. of the USA 45 (1959), 733–734.
[Azu, 1951] G. Azumaya, On maximally central algebras, Nagoya Mathematical Journal 2 (1951), 119-150.
[BaSh, 1996] E. Bach, J. Shallit, “Algorithmic Number Theory. Vol 1 : Efficient Algorithms”, MIT Press,
1996.
[Baer, 1940] R. Baer, Abelian groups that are direct summands of every containing abelian group. Bulletin of
the Amer. Math. Soc. 46 (1940), 800-807.
[BS, 1988] D. Bayer, M. Stillman, On the complexity of computing syzygies. J. of Symb. Comput. 6 (1988),
135-147.
[BW, 1993] T. Becker, V. Weispfenning, “Groebner bases: a computational approach to commutative alge-
bra”. Grad. Texts in Maths. 141, Springer, 1993.
[Bls, 1984] A. Blass, Existence of Basis Implies the Axiom of Choice. Contemporary Mathematics 31 (1984)
31-33.
[Be, 1970] E.R. Berlekamp, Factoring Polynomials over Large Finite Fields. Mathematics of Computation 24,
(1970), 713-735.
[Berk, 1984] S.J. Berkowicz,On computing the determinant in small parallel time using a small number of
processors, Inf. Proc. Letters 18 (1984), 147-150.
[Be, 1970] E.R. Berlekamp, Factoring Polynomials over Large Finite Fields. Mathematics of Computation 24,
(1970), 713-735.
[Béz, 1764] E. Bézout, Recherches su le degré des équations résultants de l’évanouisement des inconnnues.
Histoires de l’Academie Royale des Sciences (1764), 288-338.
[Béz, 1779] É. Bézout, “Théorie générale des équations algébriques”. Paris, France: Ph.-D. Pierres, 1779.
[Bls, 1984] A. Blass, Existence of Basis Implies the Axiom of Choice. Contemporary Mathematics 31 (1984)
31-33.
[BCSS, 1996] L. Blum, F. Cucker, M. Shub, S. Smale,Algebraic settings for the problem P6=NP?. In “The
mathematics of numerical analysis (Park City, UT, 1995)”, Amer. Math. Soc., Providence, 1996, 125-144.
[BCSS, 1998] L. Blum, F. Cucker, M. Shub, and S. Smale, “Complexity and real computation”, Springer-
Verlag, New York, 1998.
[Bourbaki, 1967] N. Bourbaki, “Algébre Commutative, Éléments de mathématique, Fascicule XXVIII,
chapitres 1-7”, Hermann 1961-.
[BS, 02] M. Brin , G. Stuck, “Introduction to Dynamical Systems”. Cambridge Univ. Press, 2002.
[BL, 1972] Th. Bröcker, L. Ladner, “Differentiable germs and catastrophes”. Cambridge Univ. Press, 1972.
[Br, 1987] W. D. Brownawell, Bounds for the degree in the Nullstellensatz. Annals of Math. 126 (1987),
577-591.
[Buch, 1965] B. Buchberger, “Ein Algoritmus zum Auffinden der Basiselemente des Restklassenringes nach
einen nulldimensionallen Polynomideal”. Tesis Doctoral, Universidad Leopold-Franzens, Innsbruck, 1965.
[Buch, 1985] B. Buchberger, Gröbner Basis : An Algorithmic Method in Polynomial Ideal theory. In “Multi-
dimensional Systems Theory” , Mathematics and its Applications 6, Reidel, 1985, 184-232.
[Caj, 1911] F. Cajori, Horner’s method of approximation anticipated by Ruffini. Bull. Amer. Math. Soc.
17(1911), 409-414.
[CGH, 1988] L. Caniglia, A. Galligo and J. Heintz, Borne simplement exponentielle pour les degrés dans
le théorème des zéros sur un corps de caractéristique quelconque, C.R. Acad. Sci. Paris, t. 307, Série I
(1988), 255-258.
[CaEi, 1956] H. Cartan, S. Eilenberg, “Homological algebra. With an appendix by David A. Buchsbaum”.
Princeton Landmarks in Mathematics. Princeton University Press, Princeton, NJ, 1999 [Reedición del
original editado en Princeton en 1956].

441
442 BIBLIOGRAFÍA

[Cas, 59] J.S.W. Cassels, “An Introduction to the Geometry of Numbers”. Die Grund. Math. Wiss. 99,
Springer, 1959.
[CHMP, 2001] D. Castro, K. Hägele, J.E.Morais, L. M. Pardo, Kronecker’s and Newton’s approaches to
Solving : A first Comparison. J. of Complexity 17 (2001), 212-303.
[Cayley, 1858] A. Cayley, A Memoir on the Theory of Matrices. Phil. Trans. of the Royal Soc. of London 148
(1858), 17-37.
[Ch, 1957] N. Chomsky, “Syntactic Structures”. Mouton and Co., The Hague, 1957.
[ChMi, 1957] N. Chomsky, G. A. Miller, Finite state languages. Information and Control 1 (1957), 91-112.
[Ch, 1959a] N. Chomsky, On certain formal properties of grammars. Information and Control 2 (1959), 137-
167.
[Ch, 1959b] N. Chomsky, A note on phrase structure grammars. Information and Control 2 (1959), 393-395.
[Ch, 1962] N. Chomsky, Context-free grammarsand pushdown storage. Quarterly Progress Report No. 65. Re-
search Laboratory of Electronics, M. I. T., Cambridge, Mass., 1962.
[Ch, 1965] N. Chomsky, Three models for the description of language. IEEE Trans. on Information Theory 2
(1965), 113-124.
[Church, 36] A. Church, An unsolvable problem of elementary number theory. Am. J. Math. 58 (1936) 345-363.
[Coh, 1946] I.S. Cohen, On the structure and ideal theory of complete local rings. Transactions of the Amer.
Math. Soc. 59 (1946), 54–106.
[Cook, 1971] S. Cook, The complexity of theorem-proving procedures. In Proc. 3rd Ann. ACM SToC, ACM
Press, 1971, 151-158.
[CoLiOS, 1997] D. Cox, J. Little, D. O’Shea, “Ideals, Varieties, and Algorithms”, Springer, 1997 (1a. edición,
1992).
[CoLiOS, 1998] D. Cox, J. Little, D. O’Shea, “Using algebraic geometry”. Graduate Texts in Mathematics
185, Springer, 1998.
[Csa, 1976] L. Csanky, Fast Parallel Matrix Inversion Algorithm. SIAM J. on Comput. 5,4 (1976) 618-623.
[Dav, 49] M. Davis,Arithmetical problems and recursively enumerable predicates. The Journal of Symbolic Logic,
18 (1949), 33-41.
[Dem, 1984] M. Demazure, “Le monoı̈de de Mayr y Meyer”. Notes informelles de Calcul Formel, École Poly-
technique, 1984.
[DeMLi, 1978] R.A. DeMillo, R.J. Lipton, A probabilistic remark on algebraic program testing. Information
Processing Letters 7 (1978), 193–195.
[Dix, 1913] L.E. Dickson, Finiteness of the odd perfect and primitive abundant numbers with n distinct prime
factors. American Journal of Mathematics, 35 (1913), 413-422.
[Dvr, 09] Z. Dvir, On the size of Kakeya sets on finite fields. J. of the A.M.S. 22 (2009), 1093-1097.
[EiMc, 1945] S. Eilenberg, S. Mac Lane, General Theory of Natural Equivalence. Trans. of the Amer. Math.
Soc. 58 (1945), 231-294.
[Eins,1859] G. Einsenstein, Beweiss del allgemeinsten Reciprocitätgesetze zwischen reellen un komplexen
Zahlen. Verhandlungen der Königlich Pr. Akad. des Wissen. zu Berlin (1859), 189-198.
[Ei, 1995] D. Eisenbud, “Commutative algebra: with a view toward algebraic geometry”, Springer Verlag, 1995.
[Euler, 1750] L. Eulero, Theoremata circa Divisores Numerorum, Novi Commentarii academiae scientiarum
Petropolitanae 1 (1750), 20-48.
[Fad, 77] N. Fadeeva, D. K. Fadeev, Parallel Calculations in Linear Algebra. Kibernetika 6 (1977) 28-40.
[Frobenius, 1878] G. Frobenius, Über lineare Substutionen und bilineare Formen. J. Reine Angew. Math.
(Crelle) 84 (1878), 1–63.
[Fulton, 1984] W. Fulton, “Intersection theory”. New York-Heidelberg-Berlin Tokyo Springer, 1984.
[GaJo, 1979] M.R. Garey, D.S. Johnson, “Computers and Intractability: A Guide to the Theory of NP-
Completness”. W.H. Freeman, 1979.
[Gauss, 1801] C.F. Gauss, “Disquistiones Arithmeticae”. LIPSIAE in Commussionis apud Ger. Fleischer, 1801.
[Gen, 1976] E.R. Gentile, On the invariant factors. Rev. Un. Mat. Argentina 27 (1976), 240–243.
[GTZ, 1988] P. Gianni, B. Trager, G. Zacharias, Gröbner bases and primary decomposition of polynomial
ideals. J. Symbolic Comput. 6 (1988), 149-167.
[GiJe, 1976] L. Gillman and M. Jerison,“Rings of Continuous Functions”. Springer-Verlag, New York, 1976.
[GHMP, 97a] M. Giusti, J. Heintz, J.E. Morais, L. M. Pardo, Le rôle des structures des données dans les
problèmes d’élimination . Comptes Rendues Acad. Sci. Paris, Sér. I 325 (1997), 1223-1228.
[GHHMMP, 97b] M. Giusti, K. Hägele, J. Heintz, J.E. Morais, J.L. Montaña, L. M. Pardo, Lower bounds
for diophantine approximations. Journal of Pure and Applied Algebra 117 & 118 (1997), 277-317.
[GHMMP, 98] M. Giusti, J. Heintz, J.E. Morais, J. Morgenstern, L. M. Pardo, Straight-line programs in
geometric elimination theory. Journal of Pure and Applied Algebra 124 (1998), 101-146.
[Gödel, 31] K. Gödel, Über formal unentscheidbare Sätze der Principia Mathematica und verwandter Systeme,
I. Monatsh. Math. Phys. 38 (1931) 173-198.
[Gödel, 65] K. Gödel, On undecidable propositions of formal mathematical systems. In “The undecidable,
Basic Papers on Undecidable Propositions, Unsolvable Problemas and Computable Functions”, Raven
Press, Hewlett, NY (1965) 41-71.
[Goldman, 1951] O. Goldman, Hilbert rings and the Hilbert Nullstellensatz. Mathematische Zeitschrift 54
(1951), 136–140.
[HMPS, 2000] K. Hägele, J.E. Morais, M. Sombra, L. M. Pardo,The intrinsic complexity of the Arithmetic
Nullstellensatz. J. of Pure and App. Algebra vol. 146, (2000), 103-183.
BIBLIOGRAFÍA 443

[Hamilton, 1843] W.R. Hamilton, On Quaternions; or on a new System of Imaginaries in Algebra. Letter to
John T. Graves, dated October 17, 1843.
[Hamilton, 1853] W.R. Hamilton, “Lectures on Quaternions”. Hodges & Smith, Dublin, 1853.
[Hardy-Wright, 1938] G. H. Hardy, E. M. Wright, “An Introduction to the Theory of Numbers”. Oxford at
the Clarendon Press, 1938.
[HarvdH, 19] D. Harvey, J. Van Der Hoeven, Integer multiplication in time O(nlogn). (2019). hal-02070778.
[HHPS, 21] A. Hashemi, J. Heintz, L.M. Pardo, P. Solernó, On Bézout inequalities for non-homogeneous
polynomial ideals. J. of Symbolic Computation 106 (2021), 1-22.
[Heintz, 1983] J. Heintz, Fast quantifier elimination over algebraically closed fields. Theoret. Comp. Sci. 24
(1983), 239-277.
[HeSc, 82] J. Heintz, C.P. Schnorr, Testing Polynomials wich are easy to compute. In Logic and Algorith-
mic (an International Symposium in honour of Ernst Specker), Monographie n. 30 de l’Enseignement
Mathématique (1982), 237-254.
[Hen, 75] M. Henriksen, A simple characterization of commutative rings without maximal ideals. Amer. Math.
Monthly 82.5 (1975), 502-505.
[Hermann, 1926] G. Hermann, Die Frage der endlich vielen Schritte in der Theorie der Polynomideale. Math.
Ann. 95 (1926), 736-788.
[Hilbert, 1890] D. Hilbert, Über die Theorie der algebraischen Formen. Mathematische Annalen 36 (1890),
473-530.
[Hilbert, 1893] D. Hilbert, Über die vollen Invariantensysteme. Math. Annalen 42 (1893) 313-373.
[HiSt, 1997] P. Hilton, U. Stammbach, “A course in homological algebra. Second edition”. Graduate Texts in
Mathematics, 4. Springer-Verlag, New York, 1997.
[Hir, 1964a] H. Hironaka, Resoluction of Singularities of an Algebraic Variety over a Field of Characteristic
Zero I. Annals of Math. 79 (1964), 109-203.
[Hir, 1964b] , Resoluction of Singularities of an Algebraic Variety over a Field of Characteristic Zero
II. Annals of Math. 79 (1964), 205-326.
[HSD, 1974] M. W. Hirsch, S. Smale, R. L. Devaney, “Differential Equations, Dynamical Systems, and
Linear Algebra , 1st Ed.”. Academic Press, 1974.
[Hod, 1974] W. Hodges, Six impossible rings, J. Algebra 31 (1974), 218-244
[Hol, 1889] O. Hölder, Zurückführung einer beliebigen algebraischen Gleichung auf eine Kette von Gleichun-
gen. Math. Ann. 34 (1889), 26–56.
[Hor, 1819] W. G. Horner, A new method of solving numerical equations of all orders, by continuous approx-
imation. Philosophical Transactions (Royal Society of London), July 1819, 308-335.
[IM, 1983] O.H. Ibarra, S. Moran, Equivalence of Straight–Line Programs. J. of the ACM 30 (1983), 217-228.
[Jacobi, 1837] Carl Gustav Jacobi, Über die Kreisteilung und iher Anwendung auf die Zahlentheorie. Bericht
Akademi Wissen. Berlin (1837), 127-136.
[Jacobson, 1945] N. Jacobson,The radical and semi-simplicity for arbitrary rings. Amer. Journal of Math. 67
(1945), 300–320.
[Jen, 1899] J. Jensen,Sur un nouvel et important théorème de la théorie des fonctions. Acta Mathematica 22
(1899), 359–364.
[Jiushao, 1247] Qin Jiushao, “Shu Shu Jiu Zhang” (Tratado Matemático en Nueve Secciones), 1247.
[Jod, 1967] M.A. Jodeit, Uniqueness in the Division Algorithm. Amer. Math. Monthly 74 (1967), 835-836.
[Jordan, 1869] C. Jordan, “Théorème sur les équations algébriques”. C.R. Acad. Sci. Paris 68 (1869), 257–258.
[Jordan, 1870] C. Jordan, “Traité des substitutions et des équations algébriques”. Gauthier-Villars, Paris, 1870.
[KLL, 84] R. Kannan, A. K. Lenstra, L. Lovász, Polynomial factorization and non-randomness of bits of
algebraic and some transcendental numbers. In “Proceedings of the 16th Ann. ACM Symp. Theory of
Computing (STOC’84)”, Washington, D.C., 1984, 191-200.
[Kap, 1970] I. Kaplansky, “Commutative Rings”, Allyn and Bacon, 1970.
[Krp, 1972] R. Karp, Reducibility among combinatorial problems. In Complexity of Computer Computations,
(R.E. Miller & J.W. Hatcher, eds.), Plenum Press, 1972, 85-103.
[KO, 1962] A. Karatsuba, Yu. Ofman, Multiplication of Many-Digital Numbers by Automatic Computers.
Proceedings of the USSR Academy of Sciences. 145 (1962), 293–294. Traducción al inglés en Physics-
Doklady 7 (1963), 595–596.
[Knu, 1981] D.E. Knuth, “The Art of Computer Programming, vol. 2 Seminumerical Algorithms” Addison-
Wesley, 1981.
[KMH, 1988] H. Kobayashi, S. Moritsugu, R.W. Hogan, On Solving Systems of Algebraic Equations. In
“Proceedings ISSAC 88”, ACM, 1988, 139-149.
[Köning, 1903] J. Köning, “Einleitung in die allgemeine Theorie der Algebraischen Groessen”. Leipzig, 1903.
[Kol, 1988] J. Kollár, Sharp Effective Nullstllensatz. J. of A.M.S. 1 (1988), 963-975.
[Koz, 1992] D.C. Kozen, “The Design and Analysis of Algorithms”. Texts and Monographs in Computer Sci-
ence, Springer Verlag, 1992.
[KrPa, 1996] T. Krick, L.M. Pardo, A Computational Method for Diophantine Approximation. In Algorithms
in Algebraic Geometry and Applications, Proc. MEGA’94, Progress in Mathematics 143, Birkhäuser
Verlag, 1996, 193-254.
[KPS, 2001] T. Krick, L.M. Pardo, M. Sombra, Sharp Estimates for the Arithmetic Nullstellensatz. Duke
Math. Journal 109 (2001), 521-598.
[Kronecker, 1882] L. Kronecker, Grundzüge einer arithmetischen theorie de algebraischen grössen. J. reine
angew. Math. 92 (1882) 1-122.
444 BIBLIOGRAFÍA

[Ku, 1985] E. Kunz, “Introduction to Commutative Algebra and Algebraic Geometry”, Birkhäuser, 1985.
[Krull, 1928] W. Krull, “Primidealketten in allgemeinen Ringbereichten”. Sitzungs berichte der Heidelberger
Akademie der Wissenschaften, Mathematische-Naturwissenschaftliche Klasse 7 (1928).
[Krull, 1929] W. Krull, Die Idealtheorie in Ringen ohne Endlicheitsbedingungen. Mathematische Annalen 10
(1929), 729-744.
[Krull, 1935] , “Idealtheorie”. Springer, 1935.
[Krull, 1938] W. Krull, Dimensionstheorie in Stellenringen. J. Reine Angew. Math. 179 (1938), 204.
[Krull, 1951] W. Krull, Jacobsonsche Ringe, Hilbertscher Nullstellensatz, Dimensionstheorie. Mathematische
Zeitschrift, 54 (1951), 354–387.
[Laf, 1977] J.P. Lafon, “Algèbre commutative”, Hermann, 1977.
[Lan, 1905] E. Landau, Sur quelques Théorèmes de M. Petrovic relativs aux zéros des fonctions analytiques.
Bull Soc. Math. France 33 (1905), 251-261.
[Lm, 1844] G. Lamé, Note sur la limite du nombre des divisions dans la recherche du plus grand commun
diviseur entres deux nombres entiers. Comptes Rendus Acad. Sci. 19 (1844), 876-870.
[Lasker, 1905] E. Lasker, Zur Theorie der Moduln und Ideale, Math. Ann. 60 (1905), 19-116.
[Lau, 1962] H. Läuchli, Auswahlaxiom in der Algebra, Commentarii Mathematici Helvetici, 37 (1962-1963),
1-18.
[Laz, 1981] D. Lazard, Résolution des systèmes d’équations algébriques, Theor. Comp. Sci. 15 (1981), 77-110.
[Legendre, 1789] A.M. Legendre, “Essai sur la Théorie des Nombres”. Paris, 1789.
[Leh, 1933] D.H. Lehmer,Factorization of Certain Cyclotomic Functions. Ann. of Math. 34 (1933), 461-479.
[Lens, 1981] A. K. Lenstra, “Lattices and Factorization of Polynomials”. Report IW 190, 81. Amsterdam
Mathematisch Centrum, 1981.
[LLL, 1982] A.K. Lenstra, H. W. Lenstra, L. Lovász, Factoring Polynomials with Rational Coefficientes.
Math. Ann. 261 (1982), 515-534.
[Lind, 1970] C. Linderholm, A Group Epimorphism is Surjective. American Mathematical Monthly 77 (1970),
176–177.
[LeV, 1840] U. Le Verrier, Sur les variations séculaires des elements elliptiques des sept planètes principales.
Liouville J. Math. 5 (1840) 220-254.
[Macaulay, 1916] F.S. Macaulay, “The Algebraic Theory of Modular Systems”. Cambridge tracts in math. and
Math. Physics, Cambridge University Press, 1916.
[Mc, 1975] S. Mac Lane, “Homology. Reprint of the 1975 edition”. Classics in Mathematics. Springer-Verlag,
Berlin, 1995.
[Mah, 1962] K. Mahler, On Some Inequalities for Polynomials in Several Variables. J. London Math. Soc. 37
(1962), 341-344.
[MaWü, 1971] D. W. Masser and G. Wüstholz, Fields of large transcendence degree generated by values of
elliptic functions. Invent. Math. 72 (1971) 407-463.
[Matj, 1970] Juri. V. Matjasevich, Enumerable sets are Diophantine. Doklady Akademii Nauk SSSR (en ruso)
191 (1970), 279-282. (Traducción al inglés en Soviet Mathematics 11 (2) (1970) pp. 354-358).
[Mat, 1980] H. Matsumura,“Commutative Algebra (2nd. Edition)”, Benjamin/Cummings, 1980.
[Ma, 1989] H. Matsumura, “Commutative Ring Theory”. Cambridge Studies in advanced Math. 8, Cambridge
Univ. Press, 1989.
[Mayr, 1989] E. Mayr, Membership in Polynomial Ideals over Q Is Exponential Space Complete. In “Proc.
of the 6th Annual Symposium on Theoretical Aspects of Computer Science (STACS’89)”, ACM, 1989,
400-406.
[MM, 82] E. Mayr and A. Meyer, The complexity of the word problem for commutative semigroups. Advances
in Math. 46 (1982), 305-329.
[Mign, 1989] M. Mignotte, “Mathématiques pour le Calcul Formel”, Presses Univ. de France, 1989.
[Milr, 1976] G.L. Miller, Riemann’s hypothesis and tests for primality. J. Comput. Syst. Sci. 13 (1976), 300-
317.
[Mks, 10] H. Minkowski, “Geometrie der Zahlen”. Leipzig and Berlin: R. G. Teubner, 1910. Chelsea, 1953
(reprint).
[Mtz, 1949] T. Motzkin, The Euclidean algorithm. Bull. Amer. Math. Soc., 55 (1949), 1142-1146.
[Mul, 1986] K. Mulmuley, A Fast Parallel Algorithm to Compute the Rank of a Matrix over an Arbitrary
Field. In Proc. STOC 1986, 338-339.
[Nag, 1958] M. Nagata, A general theory of algebraic geometry over Dedekind domains. II. Separably generated
extensions and regular local rings. American J. of Math. 80 (1958), 382–420,
[Nag, 1975] M. Nagata,“Local Rings”, Robert E. Krieger, 1975.
[Nak, 1951] T. Nakayama, A remark on finitely generated modules, Nagoya Mathematical Journal 3 (1951),
139-140.
[Netto, 1885] E. Netto, Zur Theorie der Elimination. Acta math. 7 (1885), 101–104.
[NP, 21] V. Neiger, C. Pernet, Deterministic computation of the characteristic polynomial in the time of
matrix multiplication. J. of Complexity 67 (2021), 101572.
[Noether, 1921] E. Noether, Idealtheorie in Ringbereichen. Math. Annalen 83 (1921), 24-66.
[Noether, 1926] E, Noether, Der Endlichkeitsatz der Invarianten endlicher linearer Gruppen der Charakter-
istik p. In “Nachritten von der Gesellschaft der Wissenschaften zu Göttingen, aus dem Jahre 1926”, 1926,
28–35.
[Noether, 1927] E. Noether, Abstrakter Aufbau der Idealtheorie in algebraischen Zahl und Funktionenkörpern.
Math. Ann. , 96 (1927), 26-61.
BIBLIOGRAFÍA 445

[Or, 2013] Nuccio Ordine, “L’utilità dell’Inutile. Manifesto”. Bompiani, 2013.


[Os, 1973] A.M. Ostrowski, “Solutions of Equations in Euclidean and Banach Spaces”, Academic Press, 1973.
[Pardo, 95] L. M. Pardo, How lower and upper complexity bounds meet in elimination theory. In “Applied
Algebra, Algebraic Algorithms and Error-Correcting Codes” , G. Cohen, M. Giusti & T. Mora, eds.,
Lecture Notes in Computer Science 948 , Springer Verlag, 1995, 33-69.
[Post, 36] E. Post, Finite Combinatory processes-formulation I. J. Symbolic Logic 1 (1936), 103-105.
[Pr, 1975] V.R. Pratt, Every Prime has a succinct certificate. SIAM J. on Computing 4 (1975), 214-220.
[Qui, 1976] D. Quillen, Projective modules over polynomial rings. Inventiones Mathematicae 36 (1976),
167–171.
[Rabin, 1980] M.O. Rabin, Probabilistic algorithms for testing primality. J. Number Theory 12 (1980), 128-138.
[Rag et al., 1975] S. Raghavan, B. Singh, R. Sridharan, “Homological Methods in Commutative Algebra”,
Tata Institute for Fund. Res., Oxford University Press, 1975.
[Rainich, 1929] G. Y. Rainich (pseudonym J.L. Rabinowitsch), Zum Hilbertschen Nullstellensatz. Math. Ann.
102 (1929), 520
[Rees, 1956] D. Rees,Two classical theorems of ideal theory. Proc. Cambridge Philos. Soc. 52 (1956), 155-157.
[Re, 1995] M. Reid, “Undergraduate Commutative Algebra”, Cambridge University Press, 1995.
[Rha, 1962] T.S. Rhai, A characterization of polynomial domians over a field. Amer. Mathematical Monthly
69 (1962), 984-986.
[Rib, 1985] P. Ribenboim, Equivalent forms of Hensel’s Lemma. Expo. Math. 3 (1985), 3-24.
[RSA, 1978] R.L. Rivest, A. Shamir y L.A. Adleman, A method for obtaining digital signatures and public-key
cryptosystems. Communications ACM 21(1978), 120-126.
[Rob, 1950] J. Robinson, General recursive functions. Proc. of Amer. Math. Soc. 1 (1950), 703-718.
[Rob, 52] , Existential definability in arithmetic. Trans. of the Amer. Math. Soc. 72 (1952), 437-449.
[Ro, 1994] H.E. Rose,“A Course in Number Theory”.2nd. ed., Oxford Sci. Publications, 1994.
[Rosser, 1941] B. Rosser, Explicit Bounds for Some Functions of Prime Numbers. American Journal of Math-
ematics 63 (1941), 211-232.
[Ruff, 1804] P. Ruffini, Sopra la determinazione delle radici nelle equazioni numeriche di qualunque grado.
Memoria del Dottor Paolo Ruffini, pubblico professore di matematica sublime in Modena, uno dei quaranta
délia società italiana delle scienze ec. Coronata dalla società medesima. In Modena, MDOCCIV. Presso la
società tipografica. Con Approvazione, 1804.
[Schm, 1907] E. Schmidt, Zur Theorie der linearen und nichtlinearen Integralgleichungen. I Teil. Entwicklung
willkürlichen Funktionen nach System vorgeschriebener. Mathematische Annalen Vol. 63 (1907), 433-476.
[Schö, 1979] A. Schönhage, On the power of random access machines. In H. A. Maurer, ed., Proceedings of the
6th Colloquium on Automata, Languages and Programming, vol. 71 of LNCS, Springer, 1979, 520-529.
[Sche, 1928] O. Schreier, Ueber den Jordan–Hölderschen Satz. Abh. Math. Sem. Univ. Hamburg 6 (1928),
300–302.
[Schw, 1980] J.T. Schwartz, Fast Probabilistic Algorithms for Verification of Polynomial Identities. J. of the
ACM 27 (1980), 701-717.
[Ser, 1955] J. P. Serre, Sur la dimension homologique des anneaux et des modules noetheriens. Proc. Intern.
Symp. Alg. Number Theory, Tokyo, 1955, 175-190.
[Shf, 1974] I.R. Shafarevich, “Basic Algebraic Geometry”, Springer-Verlag, 1974.
[Shp, 2000] R.Y. Sharp, “Steps in commutative algebra”. Cambridge University Press, 1990, (2nd. Ed. 2000).
[Shu, 1987] M. Shub, “Global Stability of Dynamical Systems”. Springer, 1987.
[Smale, 1998] S. Smale, [ Mathematical Problems for the Next Century. Mathematical Intelligencer 20 (1998),
7–15.
[Smith, 1861] H.J.S. Smith, On systems of linear indeterminate equations and congruences. Phil. Trans. R.
Soc. Lond. 151 (1861) 293-326.
[SoStr, 1977] R. Solovay, V. Strassen, A fast Monte Carlo test for primality. SIAM J. on Comput. 6 (1977),
84-85.
[Sou, 1965] J.M. Souriau, “Calcul linéaire”. Tome I, II. Presses Universitaires de France, 1964-65.
[Str, 1969] V. Strassen,Gaussian Elimination is not optimal. Numer. Math. 13 (1969), 354-356.
[Sus, 1976] A.A. Suslin, Projective modules over polynomial rings are free. Doklady Akademii Nauk SSSR (in
Russian), 229 (1976), 1063–1066. Translated in Projective modules over polynomial rings are free. Soviet
Mathematics, 17 (1976) 1160–1164
[Syl, 1840] J. J. Sylvester, A method of determining by mere inspection the derivatives from two equations of
any degree. Philos. Magazine 16 (1840), 132–135.
[Syl, 1853] J.J. Sylvester, On a theory of the syzygetic relations of two rational integral functions, comprising
an application to the theory of Sturm’s functions, and that of the greatest algebraical common measure.
Philosophical Transactions of the Royal Society of London CXLIII (1853), 407-548.
[Tao, 14] T. Tao, Algebraic Combinatorial geometry: the polynomial method in arithmetic c ombinatorics,
incidence combinatorics, and number theory. EMS Surveys Math. Sci. 1 (2014), 1-46.
[Taylor, 1715] B. Taylor, “Methodus incrementorum directa et inversa”, 1715.
[Val, 1979] L.G. Valiant, The Complexity of Computing the Permanent. Theoretical Computer Science 8
(1979), 189–201.
[Vogel, 1984] W. Vogel, “Lectures on Bézout’s Theorem”. Tata Inst. for Fundamenta Research, Springer-
Verlag, 1984.
[vdW, 1930] Bartel Leendert van der Waerden, “Moderne Algebra. Teil I”. Die Grundlehren der mathe-
matischen Wissenschaften 33, Springer, 1930
446 BIBLIOGRAFÍA

[vdW, 1931] , “Moderne Algebra. Teil II”. Die Grundlehren der mathematischen Wissenschaften 34,
Springer, 1931.
[Wallis, 1656] J. Wallis, “Arithmetica infinitorum”, 1656.
[Weierstras, 1854] K. Weierstras, “Zur Theorie der Abelschen Functionen”. J. für Reine und Angew. Math.
(1854).
[Weirstrass, 1876] K. Weierstrass, “Zur Theorie der eindeutigen analytischen Functionen”. Berl. Abh. (1876),
11-60.
[Wls, 1973] J.C. Wilson, A Principal Ideal Ring that is not a Euclidean Ring. Mathematics Magazine, 46
(1973), 34-38.
[Yap, 1991] C. K. Yap, A New Lower Bound Construction for Commutative Thue Systems with Applications.
J. of Symb. Comput. 12 (1991) 1-27.
[ZarSam, 1960] O. Zariski, P. Samuel, “Commutative Algebra”, vols. I-II, Van Nostrand, Princeton,
1958,1960.
[Zer, 1904] E. Zermelo, Beweis, dass jede Menge wohlgeordnet werden kann. Mathematische Annalen 59
(1904), 514-516.
[Zip, 1990] R. Zippel, Interpolating Polynomials from their Values. J. Symbol. Comput. 9 (1990), 375-403.
[Zh, 13] Zhuangzi,“The Complete works of Zhuangzi (Translated by Burton Watson)”. Columbia Univ. Press,
2013.

También podría gustarte