2023-Alg Ctiva

Algunas Notas para un curso elemental de
“Álgebra Conmutativa”, Parte I.
Luis M. Pardo
Índice
Capı́tulo 0. Prólogo: Thinking outside the box 7

Aclaración sobre la ortografı́a usada en este texto 11
Part 1. Requisitos y Prerrequisitos al Álgebra Conmutativa:

Los “gigantes” del XIX y princios del XX: pensamiento Noetheriano 13
Capı́tulo 1. Algunos Prerrequisitos de Álgebra

(“...all novelty is but oblivion”) 15
1.1. Introducción: Prerrequisitos. 16
1.2. Semigrupo, monoide, grupo, acciones 16
1.2.1. Las nociones básicas 16
1.2.2. Un ejemplo: alfabeto, palabras, lenguajes 18
1.2.3. Grupos 21
1.2.4. Acciones de un grupo 27
1.2.5. Ejercicios y problemas de la Sección 1.2 35
1.3. El paradigma de las acciones transitivas y fieles: Sn 42
1.3.1. Grupo simétrico Sn : Órbitas, ciclos, transposiciones. 42
1.3.2. Índice de una permutación 48
1.3.3. Ejercicios y problemas la Sección 1.3 53
1.4. Anillos, ideales, morfismos de anillos 54
1.4.1. Propiedades generales 54
1.4.2. Anillos de polinomios y de series de potencias formales en varias variables 65
1.4.3. Otros ejemplos 70
Capı́tulo 2.Módulos, Determinantes y Teorema de Hamilton-Cayley

(“Begin at the beginning and go on till...”) 79
2.1. Introducción 79
2.2. Módulos, submódulos, morfismos de módulos 80
2.2.1. Generalidades 80
2.2.2. Operaciones básicas con submódulos e ideales 86
2.2.3. Teoremas de isomorfı́a 91
2.2.4. Módulos libres y bases 94
2.2.5. Diagramas conmutativos, complejos y sucesiones exactas (Opcional) 99
2.3. Determinante. Teorema de Hamilton-Cayley 111
2.3.1. Determinante: propiedades básicas. 112
2.3.2. La Fórmula de Laplace 116
2.3.3. Polinomios con coeficiente matricial y matrices con coordenadas polinomiales.
Teorema de Hamilton-Cayley 126
Capı́tulo 3. Dominios de Ideales Principales. Anillos Noetherianos. Dominios Enclı́deos.

Con unas reflexiones sobre algoritmos de Cálculo del Máximo Común Divisor
“ à la Sylvester”.
(À la recherche du temps perdu) 137
3.1. Introducción: DIP’s, Noetherianos y Dominios Euclı́deos. 138
3
4 ÍNDICE
3.2. Dominios de ideales principales, propiedades elementales, elementos primos e

irreducibles. 139
3.3. Anillos noetherianos: aplicación del pensamiento noetheriano a la factorización en
dominios de ideales pincipales. 143
3.4. Dominios Euclı́deos 147
3.4.1. Dominios Euclı́deos: Elementos básicos 147
3.4.2. Existencia de factorización en primos en dominios euclı́deos (Opcional) 151
3.4.3. Existen dominios de ideales principales que no son dominios euclı́deos:
Dedekind-Hasse (Opcional) 152
3.4.4. Ejercicios y problemas de las secciones 3.2, 3.3 y 3.4 156
3.5. Sobre la eficiencia del Algoritmo de Euclides en Z 159
3.5.1. Divisiones del algoritmo de Euclides en Z 159
3.6. Eliminación univariada clásica: la Matriz de Sylvester 162
3.6.1. Extensiones algebraicas (Resumen Opcional) 162
3.6.2. Cuerpos algebraicamente cerrados (Resumen opcional) 165
3.6.3. La matriz de Sylvester y el máximo común divisor en K[X] 168
3.6.4. Resultante de Sylvester-Bézout y Eliminación: cuando los coeficientes están en
un anillo 172
Capı́tulo 4. Ideales Primos y Maximales. Módulos Libres. Con una coda sobre la Forma
Normal de Smith
(Le temps retrouvé) 183
4.1.1. Motivación: El ejemplo de las ecuaciones diofánticas lineales: Diagonalización,
forma normal de Smith y aplicaciones. 185
4.2. Ideales primos e ideales maximales. La noción de rango de un R−módulo libre. 187
4.2.1. Las nociones y primeras propiedades 187
4.2.2. La noción de rango de un R−módulo libre 192
4.2.3. Generación finita sobre anillos noetherianos es hereditaria 196
4.3. Proyectivos, libres y dominios de ideales principales 197
4.4. Libres y Libres de Torsión sobre dominios de ideales principales 204
4.4.1. Libres de Torsión sobre dominios de ideales principales 204
4.4.2. Libres de torsión sobre dominios euclı́deos (Opcional) 208
4.4.3. Ejercicios y problemas de las secciones 4.2 y 4.3 211
4.5. Diagonalización de Matrices sobre un DIP 217
4.5.1. Motivaciones 217
4.5.2. Matrices de operaciones elementales en GL(2, R) 218
4.5.3. Generalizando a matrices m × n: Operaciones elementales sobre DIP’s 220
4.5.4. Matrices elementales particulares 222
4.5.5. Orlar una matriz 225
4.5.6. “Algoritmo”: Hacer ceros por filas o columnas 226
4.5.7. Hacer ceros en filas y columnas 228
4.5.8. Diagonalización de una matriz sobre un DIP: “algoritmo” primario 230
4.5.9. Resolución de ecuaciones lineales diofánticas 231
4.6. Forma Normal de Smith 234
4.6.1. Estructura de grupos abelianos finitamente generados 237
4.7. Forma de Frobenius y Factores Invariantes de un endomorfismo sobre un espacio
vectorial de dimensión finita. 241
4.7.1. Factores invariantes de un endomorfismo 241
4.7.2. Forma de Frobenius de un endomorfismo: factores invariantes en K[X] 242
4.7.3. El álgebra R[X]/(f ), con f ∈ R[X]mon . 242
Capı́tulo 5. El Teorema Chino de los Restos (Opcional)

(..nanos gigantum humeris insidentes) 257
ÍNDICE 5
5.2. El anillo producto y el Teorema Chino de los Restos 258

5.3. El Teorema Chino de los Restos en el caso R = Z 260
5.3.1. En relación con el problema de Sun Tzu. 261
5.3.2. En computación: cálculo del determinante por algoritmos modulares. 262
5.3.3. Secretos compartidos. 268
5.3.4. Grupos abelianos finitamente generados: estructura, divisores elementales. 269
5.4. El Teorema Chino de los Restos en el caso R := K[X]: Forma de Jordan. 275
5.4.1. La forma canónica de Jordan: divisores elementales en K[X]. 275
5.4.2. Teorı́a del endomorfismo y el máximo común divisor en K[X]. 278
Capı́tulo 6.Factorización de elementos e ideales: Las ideas de Gauss, Lasker y Noether.

(“...hac re copiose loqui superfluum foret.” (Gauss)
“Meine Methoden sind Arbeits- und Auffassungsmethoden...”
(Noether)) 293
6.2. Dominios de factorización única: Lema de Gauss 295
6.2.1. Dominios de factorización única 295
6.2.2. Máximo común divisor en dominios de factorización única 298
6.2.3. El Lema de Gauss 301
6.3. El Teorema de Lasker-Noether (Existencia): “factorizando” ideales en anillos
noetherianos 314
6.3.1. Radical de un Ideal 315
6.3.2. Ideales Primarios 318
6.3.3. Descomposición Primaria en anillos noetherianos: Teorema de Lasker-Noether 323
6.3.4. Unicidad (Primer Teorema): descomposición primaria, asociados e ideales
primos minimales de un anillo noetheriano 325
6.3.5. Ejercicios y Problemas de la Sección 6.3 330
Capı́tulo 7.Rudimentos de Geometrı́a Algebraica: La Topologı́a de Zariski

(La découverte est le privilège de l’enfant.) 335
7.1.1. Geometrı́a Diferencial: objetos dados “explı́citamente” ( por parametrizaciones
locales o globales) con buenos rangos en los Jacobianos: 336
7.1.2. Geometrı́a Algebraica, Analı́tica, Diofántica etc.: Objetos geométricos dados
implı́citamente por sus ecuaciones globales (o locales): 338
7.2. Geometrı́a y soluciones: La(s) topologı́a(s) de Zariski 339
7.2.1. Variedades o conjuntos de ceros (o de soluciones): Topologı́a(s) de Zariski 340
7.2.2. Ideal de un objeto geométrico, primos, maximales y variedades. 346
7.3. Rudimentos de Geometrı́a Algebraica: Variedades algebraicas K−definibles 350
7.3.1. Funciones polinomiales K−definibles. 351
7.3.2. Variedades algebraicas afines y K−definibles. 352
7.3.3. Primos, maximales y variedades algebraicas afines. 355
7.3.4. Otras consecuencias de la argumentación noetheriana 357
7.4. Variedades algebraicas en el espacio proyectivo: Ideales homogéneos 362
Capı́tulo 8.Una Prueba Elemental de Nullstellensatz de Hilbert.

(...el vacı́o...inútil y perfecto.) 381
8.1. Introducción. 382
8.1.1. Unas palabras sobre la Conjetura de Cook (P 6= NP). 384
8.2. Una demostración elemental del Nullstellensatz de Hilbert: Parte I 386
8.2.1. La resultante y los tensores de multiplicación módulo un polinomio mónico:
especialización de la resultante 386
8.2.2. La prueba de la Parte I del Nullstellensazt de Hilbert-Kronecker 391
8.3. Un cambio de coordenadas útil 391
6 ÍNDICE
8.4. Tests de (no) nulidad para polinomios. 393

8.4.1. El Test de Schwartz-Zippel-DeMillo-Lipton. 395
8.4.2. Cuestores (Opcional, resumen de sólo lectura) 397
8.4.3. Witness Theorem. 397
8.4.4. Tests de (no) nulidad para números enteros dados por esquemas de evaluación. 399
8.5. Una demostración elemental del Nullstellensatz de Hilbert: Parte II 401
8.5.1. Nullstellensatz de Hilbert-Kronecker: Parte II 401
8.5.2. Nullstellensatz de Hilbert: Cuerpos finitos 402
8.5.3. Nullstellensatz: Identidad de Bézout 404
8.5.4. Nullstellensatz: Maximales 404
8.5.5. Nullstellensatz: Rabinowitsch y el radical de un ideal 406
8.5.6. Nullstellensatz e ideales primos. 408
8.5.7. Nullstellensatz y Geometrı́a Algebraica en Pn (K) 408
8.5.8. Nullstellensätze Efectivos y eliminación de un bloque de cuantificadores
existenciales (sólo enunciados). 410
8.6. Nullstellensatz y equivalencia natural: El lenguaje de las categorı́as 414
8.6.1. El lenguaje de las categorı́as. 414
8.6.2. Categorı́as 414
8.6.3. Functores y equivalencias naturales 416
8.6.4. La categorı́a de las variedades algebraicas afines y los morfimos regulares. 418
8.6.5. La Categorı́a de las K−álgebras reducidas finitamente generadas. 419
8.6.6. Nullstellensatz como Equivalencia Natural 421
8.7. Variaciones del Nullstellensatz en otros contextos (Cultura General) 421
8.7.1. Variación de un primer tema clásico: El Teorema de Banach-Čech-Gel’fand-
Stone- 421
8.7.2. Variación de un segundo tema clásico: El Lema de Urysohn y el Teorema de
Extensión de Tietze. 422
8.7.3. Variación de un tercer tema clásico: Extensión de funciones en Variedades
Diferenciables 422
8.8. Ejericios y Problemas sobre el Nullstellensatz 423
8.8.1. La topologı́a de Zariski en el espectro de un anillo. 424
8.9. Meta-matemática: La Teorı́a de Primer Orden sobre los Complejos admite
Eliminación de Cuantificadores (Opcional, no se imparte en esta forma). 426
8.9.1. Teorı́a de Primer Orden sobre cuerpos algebraicamente cerrados 426
Apéndice. Glosario de Términos 429
Apéndice. Glosario de Teoremas y Resultados 435
Apéndice. Glosario de Sı́mbolos y Abreviaturas 437

Apéndice. Bibliografı́a 439
CAPı́TULO 0
Prólogo: Thinking outside the box
El Arte de la Matemática:
From [Zh, 13]:

Zhuping Man studied the art of
butchering dragons under Crippled Yi.
It cost him all the thousand pieces
of gold he had in his house,
and after three years he’d mastered the art,
but there was no one who could use his services.
Zhuangzi (s. IV adC)
From [BL, 1972]:

...As a result he began
to teach how to slay dragons”
René Thom (Fields Medal of 1958)
Índice
Aclaración sobre la ortografı́a usada en este texto 11
En el nuevo milenio, la expresión “ Think outside the box!” ha sido acuñada como referente
del pensamiento moderno. El origen de la expresión es discutido por mucha gente a lo largo del
siglo XX, especialmente del ámbito de la psicologı́a, el márketing, la finanzas o la tecnologı́a.
Sin embargo, nada hay menos moderno que el significado de esa expresión (cf.(cf.1 la cita a R.
Bacon que se encuentra al inicio del Capı́tulo 1: “...all novelty is but oblivion”). Al cabo, la
Humanidad lleva milenios pensando de manera diferente, enfrentándose de manera diferente a
problemas, para lograr un cierto progreso, no siempre estable o permanente. Desde luego no es
nuevo, ni novedoso el acto de pensar fuera del tarro.
Es en el ámbito del conocimiento humano, el ámbito de la Ciencia, donde el pensamiento fuera
de los cánones establecidos ha marcado la pauta para responder a los problemas y las preguntas
que las mentes más curiosas se han planteado. Muchos son los nombres que se me ocurre citar
(y podrı́a citar algunos de los más apreciados por mı́, sion citar amigos personales, como E.
Noether, D. Hilbert, J. Nash, A. Turing, S. Smale, R. Thom, K. Gödel y muchı́simos otros cuyo
pensamiento influyó en distintas épocas de mi carrera académica). Pero me voy a restringir al
caso de la asignatura que nos ocupa.
Pensar fuera de la caja que nos envuelve supone un esfuerzo enorme y un acto brutal de cre-
atividad. No es necesario que ese pensamiento esté desarrollado hasta el lı́mite técnico extremo
(para eso ya vendrán los “continuadores” - ya sean amigos o enemigos - que se encargarán de
llevar a término la tecnicalidad del asunto). Para pensar fuera de lo establecido basta con tener
la mente dispuesta a dar un “pas à côté”, ponerse en un lado, y mirar lo que existe desde la per-
spectiva desde la que nadie miró antes. Tras esa observación desde una perspectiva inesperada,
se trata de dar un primer paso y mostrar un nuevo camino. Es el trabajo del “pathfinder”, de
quien muestra un camino o un atajo, de nuevas rutas de pensamiento. En muchos casos, esos
pathfinders son maltratados por sus contemporáneos, en otros reciben en vida el premio a su
1
cf.: Abreviatura del imperativo cónfer del verbo latino conferre. De acuerdo al Diccionario Panhispánico
de dudas, se puede traducir por “compare [usted]” o “compara [tú]” , aunque, por costumbre o tradición, se
interpreta como una instrucción que “Remite a la consulta de un determinado texto o pasaje...”
7
8 0. PRÓLOGO
creatividad. Esto no es importante. Lo que sı́ es importante es que quienes logran pensar fuera
del tarro abren una vı́a a través de la cual el conocimiento humano (un constructo cooperativo
de la Humanidad) puede profundizar su comprensión de las cosas.
Lo que sı́ suele suceder es que, ante la sociedad que nos rodea, estos golpes de inmensa creativi-
dad parecen “dragones” y, por tanto, logros imaginarios, fantasiosos, hasta que no son aplicados.
Tampoco eso debe importar demasiado al matemático. La Matemática no es un constructo de
la mente humana creada para ser aplicada sino para profundizar en el conocimiento de aquellos
objetos que se resisten a ser comprendidos y que son susceptibles de ser estudiados con medios
meramente deductivos. De ahı́ que la enseñaza de la Matemática, por más que moleste a quienes
sólo buscan aplicaciones inmediatas, tenga ese matiz de “Manual para la caza de dragones”, de
guı́a para la comprensión de grandes golpes de creatividad en el arte de abstraer y deducir.
Para este humilde matemático, el problema más duro de comprender es el manejo y dominio del
sı́mbolo ∃. La “existencia” (o su hermano, la “universalidad” del sı́mbolo ∀) son los dos grandes
misterios de la Matemática. No en vano, cuatro de los problemas del Milenio llevan en su cuerpo
un ∃ sin piedad, imperturbable. Un ∃ subyace a la Conjetura de Cook y a la Conjetura de Birch
y Swynerton-Dyer. Un ∃ | (existe un único) subyace a la Conjetura sobre las ecuaciones de
Navier-Stokes, mientras un ∀ se encuentra inmerso en la Conjetura de Riemann.
Enfrentar el ∃ o el ∀ de manera única se ha mostrado imposible a lo largo de la historia. Y las
veces en que ha habido un cierto progreso significativo ha sido porque alguien miró de soslayo,
enfrentó el problema de otro modo y, a trancas y barrancas, dió lugar a una nueva forma de
pensamiento matemático. No todos son afortunados porque no todos lo lograron, pero la esencia
del matemático profesional consisten en, al menos, intentarlo. Los tecnicismos son aburridas
tareas colectivas, mientras que el encontrar un nuevo camino es un éxito de la formación y el
ingenio.
Cuando uno enfrenta la formación de un Grado en Matemáticas y hace referencia al Álgebra, dos
casos clásicos de pensamiento fuera del tarro vienen a la mente. Se trata de dos casos sencillos
de exponer, complicados de demostrar y que se produjeron a lo largo del siglo XIX y principios
del XX. El primero, conocido globalmente, es la respuesta a la pregunta de si ∃ solución por
radicales a una ecuación polinomial univariada. La respuesta a años de búsqueda positiva la dió,
en primer lugar, un jovencı́simo N. Abel (a la sazón tenı́a 26 años cuando muere en la pobreza)
mostrando una quı́ntica que no es resoluble por radicales. Es un contraejemplo muy brillante,
pero insuficiente para alimentar un nuevo camino. Será otro jovencı́simo Évariste Galois quien,
a sus 22 años escribe un testamento, la vı́spera del duelo en el que encontró la muerte, en el
que entremezcla de manera confusa sus asuntos personales con su nueva idea: entrelazar la
resolución de ecuaciones polinomiales con la familia de permutaciones de las raı́ces. Este sı́ fue
un pensamiento fuera de la caja que generó la Teorı́a de Grupos y la presencia de las acciones de
los grupos como paradigma de mecanismo para comprender muchos de los asuntos matemáticos
que resultaban de difı́cil penetración intelectual. No en vano, ya en 1872, Felix Klein defiende
en su programa de Erlangen que la Geometrı́a sólo es entendible si se interpreta a través del
grupo de las acciones permitidas. Por eso es común que la Teorı́a de Galois forme parte de la
formación básica de todo matemático. No se trata solo de que los tecnicismos que subyacen a
esas ideas sean de conocimiento común de cuantos ostentan el nombre de “matemático”, que
también. Se trata, ante todo, de que la formación del matemático contemple la comprensión
de cuanto acontece a un pensamiento fuera de la caja, como paradigma del necesario “pensar
distinto” que todo matemático debe llevar en su ADN deontológico.
El presente curso es, sin embargo, un curso de “Algebra Conmutativa”. Al alumno se le supone
el conocimiento previo del sofisticado salto que dió É. Galois y ahora se trata de enfrentar otro
∃ ligeramente distinto, algo más moderno. Se suele citar a D. Hilbert2, en su trabajo de 1893
sobre la Teorı́a de Invariantes, como el origen de ese otro punto de partida del pensamiento fuera
del tarro: el Nullstellensatz. Aunque un poco antes, en 1882, L. Kronecker 3 prueba el mismo
resultado en un contexto ligeramente distinto, por lo que es más difı́cil de detectar su presencia.
La pregunta es ahora sobre la existencia de soluciones en Cn de un sistema finito de ecuaciones
2D.Hilbert, Über die vollen Invariantensysteme. Mathematische Annalen 42 (1893), 313–373.

3L.Kronecker, Grundzüge einer arithmetischen theorie de algebraischen grössen. J. reine angew.
Math. 92 (1882) 1–122.
0. PRÓLOGO 9
polinomiales. En la obra de Hilbert, la respuesta aparece como un resultado marginal, en el

apartado II, § 3 (páginas 320-326), de su estudio sobre invariantes. Posiblemente Hilbert no
le dió relevancia suficiente a este resultado y tuvieron que ser sus colaboradores más cercanos
quienes desarrolları́an el nuevo camino, la nueva ruta.
Tendrán que venir los colaboradores más cercanos de D. Hilbert (especialmente E. Noether, pero
también E- Artin, y su amplio grupo de alumnos, colaboradores y seguidores) para que este
primer resultado tenga un impacto de gran relevancia. La brillantı́sima algebrista E. Noether,
a pesar de su desafortunada vida académica (por prejuicios raciales y de género), desarrollará el
camino abierto por Hilbert con el Nullstellensatz. Con E. Lasker desarrollará la generalización
de la factorización a través de la descomposición primaria de ideales (el Teorema de Lasker-
Noether). El jugador de ajedrez y filósofo E. Lasker contribuye mostrando la descomposición
primaria de ideales en anillos de polinomios. E. Noether, generaliza la idea del Basissatz
de Hilbert a la noción de anillos hoy llamados noetherianos y prueba la existencia (y ciertas
formas de unicidad) de descomposición primaria de ideales en anillos noetherianos. No es menos
relevante el Lema de Normalización 4 que dará contexto geométrico a las extensiones enteras
de anillos. Tras Emmy, sus alumnos, como el holandés B.L. van der Waerden o la alemana
G. Hermann, y sus colegas más crecanos, como W. Krull (cf. [Krull, 1935]), desarrollarán
los primeros elementos del Álgebra Conmutativa. Desde Odessa, George Yuri Rainich (nacido
“Rabinowitsch”) mostrará cómo el Nullstellensatz de Hilbert permite construir un diccionario
entre el Álgebra Conmutativa y los objetos geométricos llamados “variedades algebraicas”.
Al cabo, Hilbert y Kronecker han mostrado que se puede aparcar la ingeniosa geometrı́a de
lo “genérico” de los maestros italianos del XIX, para sustituirla por el aspecto más formal de
los ideales y los anillos de funciones polinomiales y racionales, mediante la equivalencia natural
que propicia el Nullstellensatz. También a través del Nullstellensatz, el tratamiento y estudio
de las variedades algebraicas se puede hacer algorı́tmicamente a través de ideales de anillos de
polinomios, dando un fundamento preciso a la “Teorı́a de la Eliminación” (eliminación de ∃ y
∀), tan apreciada por L. Kronecker.
Son muchos los frentes que aquı́ encuentran su fuente de pensamiento. B. L. van der Waerden
escribirá su texto “Moderne Algebra” (cf. [vdW, 1930, vdW, 1931]), compilación de los
cursos impartidos por E. Noether y E. Artin, que pasará a ser el referente de la forma mod-
erna de entender el Álgebra desde 1929. La eliminación del ∃ entero o racional en ecuaciones
polinomiales, dará lugar al Problema X de Hilbert, a los trabajos de Gödel, Turing y Church
y al nacimiento de la informática. Desde la equivalencia natural, J. Dieudonné y, sobre todo,
A. Grothendieck, tratarán de fundamentar “toda” geometrı́a a través de haces de espacios lo-
camente anillados y la unificación de la Homologı́a y Co-homologı́a. Lang intentará trasladar
las ideas de Grothendieck (y su brillante elenco de colaboradores, que sustentarán el difunto N.
Bourbaki) a la Teorı́a de Números, dando lugar a la Geometrı́a Diofántica moderna. Y el Null-
stellensatz se reencontrará en el Análisis Funcional a través de resultados como el teorema de
Stone-Čech-Banach sobre el espectro maximal del anillo de funciones continuas sobre un com-
pacto. La Geometrı́a Analı́tica (real o compleja) tratará de asemejarse, en lo posible, a las ideas
originales del colectivo de Goetingen, permı́taseme citar a mi muy apreciado S. Lojasiewicz,
mientras que la Geometrı́a sobre los reales tratará de asemejarse a través del Principio de Tarski
y del Nullstellensatz Real de JJ. Risler y D. Dubois.
Muchos otros ámbitos sienten la influencia del pensamiento de este resultado, aunque luego
las formas y los tecnicismos los hagan aparecer de manera diversa, fragmentada y sin aparente
conexión. En lo esencial, el concepto es el mismo: transformar el estudio de difusos objetos
geométricos en objetos bien axiomatizados y formalmente tratables, cuyas propiedades son
demostrables sin ánimo de duda. Esto dió lugar al Álgebra Conmutativa moderna, objeto de
este curso, con fuertes aplicaciones también, y no sólo por la obra de Lang, a la Teorı́a Algebraica
de Números. Ni que decir tiene que el Álgebra Conmutativa moderna tiene fuertes implicaciones
en la algorı́tmica a través, sobre todo, de la Computación Simbólica, también llamada, Álgebra
Computacional. Se ha intentado introducir algún que otro algoritmo para dar un poco de
presencia a este ámbito: ası́, hemos introducido el agoritmo de Berlekamp para la factorización
4E. Noether, Der Endlichkeitsatz der Invarianten endlicher linearer Gruppen der Charakteristik p,
Nachrichten von der Gesellschaft der Wissenschaften zu Göttingen (1926), 28–35
10 0. PRÓLOGO
de polinomios sobre cuerpos finitos, la División de Hironaka y las Bases de Gröbner, junto a
algoritmos como los tests de “composición” de Solovay-Strassen y Miller-Rabin o los algoritmos
de multiplicación “rápida de matrices de V. Strassen o S. Winograd, entre otros.
El problema, en la impartición de una asignatura como ésta, es doble: de una parte, el Grado
en la Universidad de Cantabria tiene 120 horas de docencia en Álgebra Lineal en la que no
se alcanzan objetivos mı́nimos imprescindibles y, de otra parte, el Álgebra Conmutativa es
una parte “descarnada” del conocimiento matemático. El primer problema es un problema
grave: No se puede admitir un graduado en Matemáticas sin unos conocimientos sólidos en
Álgebra Lineal. Por eso, el curso contiene, subrepticiamente en sus primeros capı́tulos, un curso
básico de Álgebra Lineal y Teorı́a del Endomorfismo (camuflado a la manera más elegante
de módulos sobre dominios de ideales principales), cuyos contenidos son, sorprendetemente,
desconocidos para los alumnos de último cuatrimestre de tercero de un Grado de Matemáticas.
Estos contenidos se presentan como aplicaciones de algunas de las propiedades de anillos y
módulos y, sobre todo, en el cuerpo de los problemas de los primeros Capı́tulos. Por eso, el
curso dedica sus buenas 280 páginas a aspectos tan elementales como la noción de determinante,
el teorema de Hamilton-Cayley, los dominios de ideales principales, los dominios euclı́deos, los
dominios de factorización única, los módulos finitamente generados sobre dominios de ideales
principales, La Forma Normal de Smith y su interacción con la Teorı́a del Endomorfismo (la
llamada Forma de Frobenius) o el histórico Teorema Chino de los Restos (que Jordan “tradujo”
en la llamada Forma Canóica de Jordan).
En honor a E. Noether, a su colaboración con Lasker y al desarrollo de las ideas de Hilbert (que
ella misma denomina “Meine Methoden sind Arbeits- und Auffassungsmethoden...”). Por eso
se intercala un Capı́tulo en el que no sólo se demuestra el Teoramde la Base de Hilbert como el
éxito de Lasker-Noether en “factorizar” ideales no principales, generalizando el sueño de Gauss.
Las contribuciones de E-Artin a estas ideas de Nother quedan para una segunda parte de este
manual para la caza de dragones.
En lo que respecta a la segunda dificultad, al tratarse de uno de los lenguajes de la Geometrı́a,
se vuelve lenguaje “per se” y pierde el acercamiento visual de algo más dibujable. Aprender
un lenguaje relevante pero descarnado es una tarea ardua como principio. Nada pasa o nada
parece pasar si no hay un poco de Geometrı́a a su lado. Pero el “poco” de Geometrı́a ya es
un mucho de formación que, ligada al conocimiento del lenguaje, entrelaza inexorablemente
ambas formaciones. Y esto no encaja en el universo fragmentario y burocrático, a la par que
superficial, de los Grados de Matemáticas de la decadente universidad española actual.
Como remate, la formación media de los graduados en matemáticas posee fuertes lagunas de
conocimiento “recordado” (o, si se prefiere, un exceso de “no recuerdo” o “ no lo he visto”), lo
que obliga a retomar ese mismo concocimiento desde sus mismos elementales orı́genes. Final-
mente, y como primer paso a la interacción entre Álgebra y Geometrı́a, dedicamos un Capı́tulo
a la terminologı́a básica de la llamada topologı́a de Zariski e introduciremos un demostración
muy elemental del Nullstellensatz de Hilbert-Kronecker. Daremos una demostración muy ele-
mental que usa implı́citamente la Normalización de Noeteher, pero sin desarrollarla aún, y la
resultante de dos polinomios univariados, uno de los cuales es mónico. Todo ello se presenta
aderezado de ejercicios y ejemplos bien conocidos, a la par que evidentes. Muchos ejemplos de
algoritmos, algunos de los cuales no suelen ser comúnmente conocidos, son descritos como prob-
lemas y, en ocasiones, como enunciados del texto. Con todo ello se ha configurado una Parte 1
de Prerrequisitos que, por casualidad, está formada por las muchas ideas que los gigantes que
nos precedieron dieron a la luz durante el siglo XIX y primeros años del siglo XX.
No será hasta la Parte ??, a jugar con un formalismo más actualizado del Álgebra Conmutativa
con la presencia de la escuela de Cartan y Eilenberg (muy influyentes a partir de mediados
sel sigloXX) y la conjugación del lenguaja del Álgebra Homológica con el lenguaje del Álgebra
Conmutativa. No obstante, mucho de esa futura Parte ?? seguirá estando inspirado por Hilbert,
Krull y Noether, aunque sólo aparezcan de modo fragmentario. Debo decir que mi visión sobre
este curso debe mucho a la escuela japonesa (Nakayama, Azumaya, Nagata, Matsumura), al
clásico texto de Atiyah y Macdonald, a “libruco” de S. Raghavan y co-autores, al texto de E.
Kunz, a los clásicos de Zariski y Samuel y, sin falsa humildad, a un poco de lectura y pen-
samiento de quien suscribe que siempre admiró la excelente arquitectura colectiva levantada
0. PRÓLOGO 11
en torno a estas ideas. Aunque están esbozadas otras partes más técnicas y recientes, con
contribuciones que pretenden mostrar mi lealtad a maestros y amigos, todo está inacabado por
la dificultad doble de encontrar tiempo y encontrar los textos/poemas que más se ajusten al
mensaje inmanente de cada Capı́tulo. Sueño con tener la disponibilidad en tiempo para trans-
feriri esos otros capı́tulos a este Latex interminable, aunque mi incapacidad como mecanógrafo
sea públicamente conocida e inhabilitante. Mientras tanto, lanzo al formato de Trabajos Fin
de Grado muchos de los capı́tulos que algún dı́a añadiré.
No debo dejar este Prólogo sin mostrar mi más sincero agradecimiento a cuantos alumnos
hicieron el esfuerzo de una lectura crı́tica de los textos. A pesar de que cada año son modificados,
a pesar de mis dilsexia y disgrafı́a con los tipos de imprenta (que plagan el texto de erratas), las
lecturas y comentarios de algunos pocos alumnos me han ayudado a ir mejorando cada parte,
cada año y a evitar groseras barbaridades. Gracias a ellos por sus lecturas,
Suerte al lector y suerte a los alumnos que traten de entenderlo. No es fácil porque no es trivial,
pero tampoco es tan profundo que nos pueda abrumar.
May 11, 2023.
5
Aclaración sobre la ortografı́a usada en este texto. En evitación de lecturas aviesas,

quiero clarificar algunos aspectos relativos a la ortografı́a elegida para este texto.
Se ha elegido el formato de libro (book) de la American Mathematical Society (AMS). Aunque el
idioma utilizado es el español, hemos tratado de seguir lo más fielmente posible las recomenda-
ciones del Libro de Estilo de esta asociación6, juntamente con las reglas de estilo recomendadas
por D. E. Knuth y co-autores para la Mathematical Asociation of America (MAA) 7.
Especı́ficamente, hemos tratado de seguir atentamente las siguientes dos reglas:
• “Numbered theorems, lemmas, etc. are proper nouns and, thus, are capitalized: The-
orem 2.3, Lemma 3.1, Figure 4.5” (p. 79 del AMS Style Guide).
• “Rule 19. Capitalize names like Theorem 1, Lemma 2, Algorithm 3, Method 4”’ (en
D. E. Knuth et al.).
5Este Prólogo hace referencia a un texto incompleto que contiene muchos Capı́tulos sin desarrollar. Quizá
algún dı́a tenga la paciencia de encontrar los poemas que reflejan los contenidos de los Capı́tulos inacabados.
Pero “hoy no es ese dı́a”.
6M. Letourneau, J. Wright Sharp, AMS Style Guide, Journals, October 2017, AMS, Providence, 2017
7D. E. Knuth, T. Larrabee, P. M. Roberts, Mathematical Writing, MAA, 1989
Part 1
Requisitos y Prerrequisitos al Álgebra

Conmutativa:
Los “gigantes” del XIX y princios del
XX: pensamiento Noetheriano
CAPı́TULO 1
Algunos Prerrequisitos de Álgebra

(“...all novelty is but oblivion”)
Solomon saith,
ç There is no new thing upon the earth.
So that as Plato had an imagination,
That all knowledge was but remembrance;
so Solomon giveth his sentence:
That all novelty is but oblivion.
(R. Bacon)
Está bien que se mida con la dura

sombra que una columna en el estı́o
arroja o con el agua de aquel rı́o
en que Heráclito vio nuestra locura
...
La arena de los ciclos es la misma
e infinita es la historia de la arena;
...
la invulnerable eternidad se abisma.
...
Todo lo arrastra y pierde este incansable
hilo sutil de arena numerosa.
No he de salvarme yo, fortuita cosa
Del tiempo, que es materia deleznable.
15
16 1. PRE-ÁLGEBRA
Índice
1.1. Introducción: Prerrequisitos. 16
1.2. Semigrupo, monoide, grupo, acciones 16
1.2.1. Las nociones básicas 16
1.2.2. Un ejemplo: alfabeto, palabras, lenguajes 18
1.2.2.1. Operaciones Básicas con palabras. 20
1.2.2.2. Operaciones Elementales con Lenguajes. 20
1.2.3. Grupos 21
1.2.3.1. La terminologı́a usual con morfismos: Teorema de Schreier. 22
1.2.3.2. Generación de Subgrupos 26
1.2.4. Acciones de un grupo 27
1.2.5.1. Descomposición en Valores Singulares. 39
1.3. El paradigma de las acciones transitivas y fieles: Sn 42
1.3.1. Grupo simétrico Sn : Órbitas, ciclos, transposiciones. 42
1.3.2. Índice de una permutación 48
1.3.2.1. Índice por la naturaleza de la identidad. 48
1.3.2.2. Índice de una permutación por alteración del orden
(Alternativo). 50
1.3.3. Ejercicios y problemas la Sección 1.3 53
1.4. Anillos, ideales, morfismos de anillos 54
1.4.1. Propiedades generales 54
1.4.2. Anillos de polinomios y de series de potencias formales en varias variables 65
1.4.3. Otros ejemplos 70
1.4.4.1. Problemas sobre cuerpos ordenados o formalmente reales 75
1.4.4.2. Problemas sobre Órdenes Monomiales y división de Hironaka. 76
1.1. Introducción: Prerrequisitos.

Este Capı́tulo es una lista de nociones y propiedades elementales que suponen los requisitos
previos que un alumno deberı́a tener en su bagaje cultural, antes de someterse a las exigencias
propias de este curso. De hecho, deberı́an ser requisitos previos superados antes de superar
los requisitos de las asignaturas, previas a este curso, “Estructuras Algebraicas” y “Teorı́a de
Galois”. Pero requisito ya no es una palabra de uso común cuando uno habla de superar una
formación previa (al menos no en el Grado en Matemáticas). Ası́ que este Capı́tulo se queda en
aderezar prerrequisitos con algo del lenguaje del Álgebra Conmutativa para que no desentone
demasiado.
Notación 1.1.1. Dadas dos clases X e Y denoteremos por Y X al conjunto de todas las apli-
caciones de X en Y , es decir:
Y X := {f : X −→ T : f es aplicación}.
Asimismo, denoteramoes por 2X (o por P(X)) la clase de todos los subconjuntos de un con-
junto X dado. Recuérdeser que hay una identidad obvia entre los subconjuntos de X y las
funciones caracterı́sticas definidas en X. Es decir, P(X) ∼
= {0, 1}X , de donde viene la notación
X
simplificada 2 .
1.2. Semigrupo, monoide, grupo, acciones

1.2.1. Las nociones básicas. Comencemos recordando algunas nociones básicas
Definición 1 (Semi-grupo, Monoide). Un semigrupo es un par (S, ∗), donde S es un con-
junto no vacı́o y ∗ es una aplicación
∗: S×S −→ S
(a, b) 7−→ a ∗ b,
1.2. SEMIGRUPO, MONOIDE, GRUPO, ACCIONES 17
Donde S × S = {(x, y) : x, y ∈ S} es el producto cartesiano de S consigo mismo y, además,

verifica la siguiente propiedad:
Propiedad Asociativa: (x ∗ y) ∗ z = x ∗ (y ∗ z), ∀x, y, z ∈ S.
A la aplicación ∗ se la denomina Operación Interna del semi-grupo. Un semigrupo (S, ∗) se

denomina monoide si verifica la siguiente propiedad adicional:
Existencia de Elemento Neutro: ∃e ∈ S, e ∗ x = x ∗ e = x, ∀x ∈ S.
Al elemento e, si existe, se le denomina Elemento Neutro del monoide.

Un semigrupo (o un monoide) (S, ∗) se dice conmutativo o abeliano si verifica la siguiente
propiedad adicional:
Propiedad Conmutativa: ∀x, y ∈ S, x ∗ y = y ∗ x.
Proposición 1.2.1. Si (S, ∗) es un monoide, el elemento neutro es único y suele denotarse

mediante eS o, simplemente, e o 1 si no hay confusión en el lenguaje.
Demostración. Sea e1 y e2 son dos elementos de S neutros en el sentido de la definición

precedente, tendremos que
e1 e2 = e1 porque e2 es neutro,
mientras que
e1 e2 = e2 porque e1 es neutro,
Con lo que hemos concluido que e1 = e2 como se indica en el enunciado.
Definición 2 (Morfismo de semi-grupos, monoides). Un morfismo de semigrupos entre

dos semigrupos (S, ∗), (T, ⊥) es una aplicación entre los respectivos conjuntos:
f: S −→ T
a 7−→ f (a),
que verifica la siguiente propiedad:
f (x ∗ y) = f (x) ⊥ f (y).
Un morfismo entre dos monoides (M, ∗), (N, ·), con respectivos elementos neutros eM y eN , es
un morfismo de semi-grupos fM −→ N que verifica, además, la siguiente propiedad:
f (eM ) = eN .
Ejemplo 1.2.2 (El monoide de los exponentes monomiales). El conjunto (Nn , +) es un

monoide conmutativo con la operación:
+ : Nn × Nn −→ Nn ,
dada mediante:
(µ1 , . . . , µn ) + (θ1 , . . . , θn ) := (µ1 + θ1 , . . . , µ1 + θ1 ).
A los elementos µ ∈ Nn se les suele denominar multi-ı́ndices (o también exponente monomial ).
Más aún, la siguiente aplicación es un morfismo de monoides entre (Nn , +) y (N, +), llamada
grado: | · | : Nn −→ N, dada mediante
|(µ1 , . . . , µn )| = µ1 + · · · + µn .
A los elementos de Nn , en este contexto, se les suele llamar exponentes o exponentes monomiales.
18 1. PRE-ÁLGEBRA
1.2.2. Un ejemplo: alfabeto, palabras, lenguajes. Lo que sigue son unas notas rela-
tivas al ejemplo más simple de monoide, dentro del contexto de los Lenguajes Formales y de las
ideas de N. Chomsky (cf. [ChMi, 1957], [Ch, 1959a],[Ch, 1959b], [Ch, 1962], [Ch, 1965],
por ejemplo). La primera idea, que se remonta al Cı́rculo de Viena, es que en toda comunicación
no ambigua (o en toda computación), lo único susceptible de comunicarse (o comptar) viene
escrito sobre un alfabet finito. Ası́ que comenzamos con esta definición elemental.
Definición 3 (Alfabeto, Palabras, Lenguajes). Sea Σ un conjunto finito que llamaremos
alfabeto.
i) Una palabra de longitud n sobre el alfabeto Σ es una lista finita de sı́mbolos de Σ.
Podemos formalmente identificar las listas x = x1 · · · xn de sı́mbolos (xi ∈ Σ) con
los elementos del producto cartesiano Σn . Denotaremos por |x| = n la longitud de la
palabra x1 · · · xn .
ii) El conjunto de todas las palabras sobre el alfabeto Σ se denotará mediante Σ∗ y podemos
identificarlo con la unión disjunta
[˙ n
Σ∗ = Σ
n∈N
∗
iii) Los subconjuntos L de Σ se denominan lenguajes.
Insistamos en la notación x1 · · · xn para expresar la palabra (x1 , . . . , xn ) ∈ Σn . Los “)”, “(” y

las “,” pudieran ser (y suelen ser) elementos del alfabeto.
Definición 4 (Palabra Vacı́a). Al único elemento x ∈ Σ∗ de longitud cero |x| = 0 (o,
equivalentemente, x ∈ Σ0 ) se la denomina palabra vacı́a y se la denota usualmente mediante λ
(o ε, según los autores).
Veremos enseguida que todos los lenguajes son conjuntos numerables, pero el número de lengua-
jes (identificable con la clase de subconjuntos de N, P(N)) es no numerable.
Ejemplo 1.2.3. Como ejemplos de alfabetos y palabras podemos destacar los siguientes:
i) Alfabetos Unarios. Son alfabetos Σ := {a} formados por un único elemento. Por
ejemplo, Σ1 := {1}. Las palabras x ∈ Σ∗1 n sobre este alfabeto son listas de la forma:
(n
,
x= 11 · · · 1
y, obviamente, es una representación mediante “palotes” de los números naturales.
Es decir, definir N := Σ∗1 , para cualquier alfabeto unario. El elemento 0 ∈ N es la
longitud de (y, por ende, es) la palabra vacı́a λ.
ii) Alfabeto Binario: bits. Son todos los alfabetos Σ con dos elementos. Su objeto
habitual es el alfabeto Σ1 := {0, 1} cuyos elements se llaman bits. El conjunto de las
palabras en Σ∗2 de longitud n se puede identificar con el conjunto {0, 1}n .
iii) Alfabeto del español. Son los sı́mbolos comúnmente admitidos en la lengua española,
incluyeno el sı́mbolo de espacio o el sı́mbolo de punto final de párrafo. Ası́, con estas
dos inclusiones, un capı́tulo de “El Quijote” o un capı́tulo de “Tiempo de Silencio” o
un poema de “Poeta en Nueva York” son palabras sobre el alfabeto español.
iv) Alfabeto Cirı́lico (o alfabetos de otros idiomas europeos). Son los alfabetos
de cada una de las lenguas en vigor en cada uno de esos paı́ses. Ası́, un capı́tulo de
“El Idiota” o de “La Odisea” son, respectivamente, palabras sobre el alfabeto cirı́lico
o el griego clásico.
v) Otros alfabetos del Lenguaje Natural. Desde el alfabeto de los “Vedas”, hasta el
alfabeto árabe clásico de “Al-Quaran” o el alfabeto mandarı́n para la obra de Sun-Tzu
sobre “el Arte de la Guerra”...Son todos alfabetos generados por las distintas culturas
para comunicarse entre sı́ o para preservar información a lo largo del tiempo.
vi) ASCII (American Standard Code for Information Interchange): byte. Es
el alfabeto correspondiente al teclado estándard de un ordenador. Creado el 6 de
Octubre de 1960, quedó como un estándard de la codificación en ordenadores y aún
permanece como tal en las telecomunicaciones (salo por la masiva degeneración de los
emoticonos originales a través de sub-products como Whatsapp). Se trata del alfabeto
del teclado. Para “codificarlo” se usó el alfabeto de 8 bits (Σ28 := {0, 1}8 ). Por tanto,
la unidad de comunicación pasó a ser una lista de 8 bits que acabó denominándose
byte.
vii) El Lenguaje de la Vida. Sea Σlife = {A, C, G, T},representando las cuatro bases
que conforman el ADN, a saber: Adenina, Guanina, Citosina y Timina (reciente-
mente se suele añadir también U por Uracilo como sı́mbolo del “alfabeto de la vida”).
Las cadenas de ADN forman un lenguaje que contiene la información genética y esta
empaquetada de esta forma para su posible transmisión hereditaria. Curiosamente,
este lenguaje es casi universal y se aplica a todos los seres vivos.
Cada cadena de ADN guarda la codificación de varias proteı́nas. Dentro del ADN, cada
secuencia de tres bases de las mencionadas corresponden a un aminoácido concreto.
Esto se conoce como el código genético. Por ejemplo, la combinación AT G representa
el inicio de la secuencia y el final puede ser representada por T GA, T AG, T AA 1 . Debe
señalarse que no sólo son las cadenas sı́mbolos, sino la estructura de inter-conexiones,
representado a través de la hélice doble, lo que caracteriza el ADN individual.
En cambio, el ARN resulta más simple como lenguaje. El alfabeto cambia a ΣARN life =
{A, C, G, U} por adenina, guanina, citosina y uracilo y las cadenas de palabras son
suficientes. Lo que no obsta para que el lenguaje del ARN se salga de la clasificación
tradicional de lenguajes de Noam Chomsky. Esto ha sido aprovechado, por ejemplo,
en algunas de la vacunas para la COVID19 (Pfizer, Moderna, etc.).
La operación esencial sobre Σ∗ es la concatenación (también llamada adjunción) de palabras:

·: Σ∗ × Σ∗ −→ Σ∗ (x, y) 7−→ x · y,
donde si x = x1 · · · xn e y = y1 · · · ym , entonces
x · y = x1 · · · xn y1 · · · ym .
Proposición 1.2.4. Con las notaciones anteriores, (Σ∗ , ·) es un monoide, donde λ es el ele-
mento neutro. La longitud define un morfismo de monoides entre (Σ∗ , ·) y el monoide (N, +).
El monoide Σ∗ es conmutativo si y solamente si el cardinal de Σ es uno. De hecho, la operación
suma + sobre N es siplemente la operación de adjunción, cuando identifamos N ∼= Σ∗1 .
Demostración. Ejercicio obvio.
Lema 1.2.5. Si Σ es un alfabeto finito, el conjunto Σ∗ es numerable, esto es, es biyectable con
el conjunto N de los números naturales.
Demostración. Para dar una prueba de este enunciado basta con fijar un buen orden en
Σ∗ . Un ejercicio razonable consiste en definir el buen orden basado en “lexicográfico + longitud”
length+lex que define la biyección. Recuérdese que el orden lexicográfico es el orden usual del
“diccionario”, i.e.i.e.2 basado en establecer un orden en el alfabeto Σ (en ocasiones lo llamarán
alfabético). Es decir, sea un orden total en Σ (que existe por ser Σ finito). Supongamos que
los elementos de Σ quedan ordenados mediante:
Σ := {α1 α2 · · · αr }.
Definimos para x = x1 . . . xn , y = y1 . . . ym ∈ Σ∗ la relación de orden siguiente:


 o bien n = |x| < |y| = m, 
 ∃k ≤ n = m, ∀i ≤ k − 1,



x ≤ y ⇐⇒ o bien |x| = |y| = n = m, xi = yi ,
xk yk

 


o bien x = y.

1El ADN siempre se ha considerado el “lenguaje de la vida” y parece que se cumple la máxima de Galileo:
“La Naturaleza es un libro escrito con el lenguaje de las matemáticas”.
2Abreviatura de la expresión latina id est, traducida al español por “esto es”.
20 1. PRE-ÁLGEBRA
Esta relación de orden es un buen orden en Σ∗ y permite una identificación (biyección) entre
Σ∗ y N, asociando a cada elemento de Σ∗ , el número de elementos menores que el:
λ 7−→ 0
α1 7−→ 1
α2 7−→ 2
···
α1 α1 7−→ r+1
α1 α2 7−→ r+2
···

Nótese que como consecuencia (Corolario) se tienen las propiedades siguientes:
Corolario 1.2.6 (Los lenguajes son conjuntos contables). Sea Σ un alfabeto finito y
L ⊆ Σ∗ un lenguaje. Entonces, L es un conjunto contable (i.e. es finito o numerable).
Más aún, el cardinal de los posibles lenguajes L ⊆ Σ∗ coincide con el número de subconjuntos
de N y, por tanto, verifica:
] (P(Σ∗ )) = ] (P(N)) = ] (R) = 2ℵ0 .
En particular, hay una cantidad infinita no numerable de lenguajes sobre un alfabeto finito.
1.2.2.1. Operaciones Básicas con palabras. Además de la concatenación de palabras,
podemos destacar las siguientes:
i) Potencia de Palabras. Se define recursivamente a partir de la concatenación. Ası́,
dada una palabra ω ∈ Σ∗ y un número natural n ∈ N, definimos la potencia ω n ,
mediante:
• Definimos ω 0 = λ,
• Para n ≥ 1, definimos
ω n := ω · ω n−1 .
ii) Reverso de una Palabra: Se trata de una biyección
R
: Σ∗ −→ Σ∗ ,
dada mediante:
• Si ω = λ, λR = λ,
• Si ω = x1 · · · xn ∈ Σ∗ , con xi ∈ Σ, definimos
ω R := xn xn−1 · · · x1 ∈ Σ∗ .
Ejemplo 1.2.7. Un lenguaje de cierta relevancia es el Palı́ndromo P ⊆ {0, 1}∗ y que viene
dado por la siguiente igualdad:
P := {ω ∈ {0, 1}∗ : ω R = ω}.
1.2.2.2. Operaciones Elementales con Lenguajes. Vamos a considerar las siguientes

operaciones básicas con lenguajes formales. Tendremos fijado un alfabeto Σ,
i) Unión de Lenguajes: De la manera obvia como subconjuntos. Dados L1 , L2 ⊆ Σ∗ ,
definimos:
L1 ∪ L2 := {ω ∈ Σ∗ : [ω ∈ L1 ] ∨ [ω ∈ L2 ]}.
ii) Concatenación de Lenguajes: Dados L1 , L2 ⊆ Σ∗ , definimos su concatenación:
L1 · L2 := {ω1 · ω2 ∈ Σ∗ : ω1 ∈ L1 , ω2 ∈ L2 }.
iii) Potencia de Lenguajes: Se define recursivamente.
• Si n = 0, L0 = {λ}.
• Si n ≥ 1, Ln := L · (Ln−1 ).
Observación 1.2.8. Obsérvese que L1 · L2 no es, en general, igual a L2 · L1 . Tampoco es

cierto que si L1 · L2 = L2 · L1 entonces se tiene L1 = L2 . El ejemplo más sencillo de esto es
Σ = {a}, L1 = {a}, L2 = {aa}.
Proposición 1.2.9 (Distributivas). Con las anteriores notaciones, se tienen las siguientes
propiedades para lenguajes L1 , L2 y L3 contenidos en Σ∗ :
L1 · (L2 ∪ L3 ) = L1 · L2 ∪ L1 · L3 .
(L1 ∪ L2 ) · L3 = L1 · L3 ∪ L2 · L3 .
Otras operaciones importantes entre lenguajes, hacen referencia al cálculo de la clausura tran-
sitiva por la operación de adjunción :
i) Clausura transitiva o monoide generado por un lenguaje: Dado un lenguaje L ⊆ Σ∗
definimos el monoide L∗ que genera mediante la igualdad siguiente:
[
L∗ := Ln .
n∈N
ii) Clausura positiva de un lenguaje: Dado un lenguaje L ⊆ Σ∗ definimos la clausura

positiva L+ que genera mediante la igualdad siguiente:
[
L+ := Ln .
n≥1
1.2.3. Grupos.
Definición 5 (Grupo). Un grupo es un monoide (G, ∗) que verifica la siguiente propiedad
adicional:
Existencia de Inverso: ∀x ∈ G, ∃x0 ∈ G, x ∗ x0 = x0 ∗ x = eG ,
donde eG es el elemento neutro de (G, ∗). Para cada x ∈ G, todo elemento x0 tal que x0 ∗ x =
x0 ∗ x = eG se denomina inverso de x y se denota x−1 . Un grupo abeliano es un grupo cuyo
monoide subyacente es conmutativo.
Ejemplo 1.2.10. El conjunto (Zn , +) con la operación:
+ : Zn × Zn −→ Zn ,
dada mediante:
(µ1 , . . . , µn ) + (θ1 , . . . , θn ) := (µ1 + θ1 , . . . , µ1 + θ1 ),
es un grupo abeliano.
Ejemplo 1.2.11 (Grupo Simétrico). Sea X un conjunto y consideremos el conjunto S (X)

formado por todas las biyecciones sobre X, es decir,
S (X) := {f : X −→ X : f es una biyección}.
Sobre conjunto S (X) definimos:
◦ : S (X) × S (X) −→ S (X)
(f, g) 7−→ f ◦ g.
Dado que la composición de aplicaciones biyectivas es biyectiva, sabemos que esta aplicación
está bien definida. Más aún, es fácil verificar, a partir de las propiedades de la composición de
aplicaciones, que (S (X), ◦) forma un grupo cuyo elemento unidad es la identidad IdX : X −→
X. A este grupo (S (X), ◦) se le denomina el grupo de las permutaciones (o grupo simétrico)
sobre el conjunto X.
Notación 1.2.12 (Notación para Grupos Abelianos). Es habitual que los grupos abelianos
se representen mediante notación aditiva. Es decir, se suelen presentar mediante la forma
“(G, +) es un grupo abeliano”. El elemento neutro de un (G, +) se suele denotar mediante 0G
o, simplemente, 0, cuando no haya confusión. Para cada elemento g ∈ G de un grupo abeliano
(G, +) el inverso de g se denomina “el opuesto de g” y se suele denotar mediante −g.
Ejemplo 1.2.13 (Grupos cı́clicos finitos). Los grupos cı́clicos finitos son grupos abelianos,
isomorfos a las clases de restos de elementos en Z con respecto al subgrupo nZ = {nx : x ∈ Z}.
Denotaremos estos grupos cociente mediante Z/nZ o por Z/(n). Nunca mediante Zn que
corresponderá a otra construcción (véase el ı́tem iv) del Ejemplo ??). Será admisible usar Cn
para describir al grupo cı́clico de orden n.
22 1. PRE-ÁLGEBRA
Proposición 1.2.14. Si (G, ·) es un grupo, cada elemento x ∈ G posee un único elemento

inverso.
Demostración. Ya hemos visto que (G, ·) posee un único elemento neutro. Ahora supong-
amos que x ∈ G posee dos posiles elementos neutros x0 , x00 ∈ G. Por la propiedad asociativa se
tiene:
x0 = x0 · e = x0 · (x · x00 ) = (x0 · x) · x00 = e · x00 = x00 .
Y se tiene el enunciado.
Definición 6 (Subgrupo). Dado un grupo (G, ∗), un subgrupo es un subconjunto no vacı́o
G1 ⊆ G tal que se verifica la siguiente propiedad:
∀x, y ∈ G1 , xy −1 ∈ G1 .
Definición 7 (Morfismo de grupos). Un entre dos grupos (G, ∗), (H, ⊥)es un morfismo
entre los subyacentes monoides. Es decir, f : (G, ∗) −→ (H, ⊥) es morfismo de grupos si
f (eG ) = eH y
∀x, y ∈ G, f (x ∗ y) = f (x) ⊥ f (y).
Proposición 1.2.15. Sean (G, ∗) y (H, ⊥) dos grupos. Una aplicación f : G −→ H define un
morfismo de grupos f : (G, ∗) −→ (H, ⊥) si y solamente si se verifica la siguiente propiedad:
−1
∀x, y ∈ G, ϕ(x ∗ y −1 ) = ϕ(x) ⊥ (ϕ(y)) .
En particular, los morfismos de grupos transforman los inversos de los elementos del primer
grupo, en inversos de la imagen.
Demostración. Basta con ver que los morfismos de monoide entre grupos transforman
inversos en inversos. Supongamos ϕ : (G, ∗) −→ (H, ⊥) un morfismo de grupos y sea g ∈ G,
entonces,
−1
ϕ(g −1 ) = (ϕ(x)) .
Para verificarlo, baste con observar que
ϕ(g) ⊥ ϕ(g −1 ) = ϕ(g ∗ g −1 ) = ϕ(eG ) = eH ,
y
ϕ(g −1 ) ⊥ ϕ(g) = ϕ(g −1 ∗ g) = ϕ(eG ) = eH .
El recı́proco es también obvio y omitimos su prueba.
Proposición 1.2.16. Sea f : (G, ∗) −→ (H, ⊥) un morfismo de grupos. Sean S ⊆ G y T ⊆ H
dos subgrupos de G y H respectivamente. Entonces, también se tiene que f (S) es subgrupo de
H y f −1 (T ) es subgrupo de G.
Entre los subgrupos obtenidos como imagen y anti-imagen de subgrupos por morfismos de grupos,
son destacables el núcleo y la imagen, respectivamente definidos mediante:
ker(f ) := f −1 ({eH }) := {x ∈ G : f (x) = eH }.
Im(f ) := f (G).
Demostración. Queda como problema.
1.2.3.1. La terminologı́a usual con morfismos: Teorema de Schreier. En oca-
siones se encuentra la terminologı́a homomorfismo en lugar de morfismo que hemos usado en
la definición precedente. Nosotros usaremos, como en Teorı́a de Categorı́as el término mor-
fismo, seguido de la palabra que indica la categorı́a en la que estemos ocupados: Ası́, usaremos
sufijos para indicar “morfismo de monoides”, “morfismo de grupos”, “morfismos de espacios
vectoriales”, etcétera.
Pero, a la hora de clasificar o comprender los morfismos, son también importantes los prefijos.
Consideraremos algunos usuales. Ası́, sea
f : (G, ∗) −→ (H, ⊥),
un morfismo de alguna clase. Se pueden encontrar los términos:
• Endo-: Llamamos “endomorfismo” , cuando (G, ∗) = (H, ⊥).
• Iso-: Llamamos “isomorfismo”, cuando exista g : (H, ⊥) −→ (G, ∗) morfismo (de

grupos o de la clase que corresponda), tal que
f ◦ g = IdH , g ◦ f = IdG ,
donde ◦ indica composición e IdX : X −→ X significa la aplicación identidad de un
conjunto X en sı́ mismo.
• Auto-: Se usa bajo la forma “automorfismo” cuando es endomorfismo e isomorfismo
a la vez.
Hay que poner un poco más cuidado en el uso de los términos siguientes:
Definición 8 (Morfismos inyectivos y suprayectivos). Sea f : (G, ∗) −→ (H, ⊥) un
morfismo (de grupos, de monoides, etc.)
• Diremos que f es un morfismo inyectivo si la aplicación subyacente f : G −→ H es
una aplicación inyectiva.
• Diremos que f es un morfismo suprayectivo si la aplicación subyacente f : G −→ H
es una aplicación suprayectiva.
• Diremos que f es un morfismo biyectivo si la aplicación subyacente f : G −→ H es
una aplicación biyectiva.
Observación 1.2.17 (Isomorfismos en Topologı́a, llamados homeomorfismos). En Topologı́a

se usa la noción de “aplicación continua” en lugar de “morfismo”, “aplicación continua inyec-
tiva” en lugar de “morfismo inyectivo”, “aplicación continua suprayectiva” en lugar de morfismo
suprayectivo y, un término que no debe confundirse, “homeomorfismo” en lugar de isomorfismo.
Pero son nociones idénticas, aunque con nombres distintos. Lo que no es idéntico en Topologı́a
es la equivalencia entre homeomorfismo y morfismo biyectivo (continua y biyectiva). Por ejem-
plo, es obvio que existe una aplicación biyectiva entre el intervalo [0, 1) y la esfera unidad S 1 .
Además es continua y viene dada mediante:
exp : [0, 1) −→ S1
2πti
t 7−→ e .
Es continua, biyectiva, pero no es homeomorfismo porque su inversa no es continua. Es decir,
en general, isomorfismo no ha de coindicir con morfismo inyectivo y suprayectivo a la vez, ni
siquiera cuando los “morfismos” tiene como sustrato una aplicación entre conjuntos con ciertas
estructuras destacables.
Observación 1.2.18 (Isomorfismo en Geometrı́a Diferencial, llamado difeomorfismo).

En Geometrı́a Diferencial se puede usar la noción de “aplicación diferenciable” en lugar de mor-
fismo, “aplicación diferenciable inyectiva” en lugar de morfismo inyectivo, “aplicación diferencia-
ble suprayectiva” en lugar de morfismo suprayectivo y “difeomorfismo” en lugar de isomorfismo.
Sin embargo, en Geometrı́a Diferencial es muy importante compaginar el comportamiento como
aplicación con el comportamiento sobre el espacio tangente, con lo que tendremos, inmersiones,
embebimientos y submersiones con especiales definiciones y propiedades. En todo caso, apli-
cación diferenciable biyectiva tampoco concide con “difeomorfismo” en el caso de la Geometrı́a
Diferencial, con ejemplos obvios como el anterior.
Los términos usuals para entender este fenómeno son los términos de monomorfismo y epimor-
fismo que daremos a continuación.
Definición 9 (Monomorfismo y Epimorfismo de grupos). Sea f : (G, ∗) −→ (H, ⊥) un

morfismo de grupos.
i) Decimos que f es un monomorfismo de grupos si para todo grupo (T, ?) y cualesquiera
dos morfismos α1 , α2 : (T, ?) −→ (G, ∗), se tiene:
f ◦ α1 = f ◦ α1 =⇒ α1 = α2 .
ii) Decimos que f es un epimorfismo de grupos si para todo grupo (T, ?) y cualesquiera
dos morfismos α1 , α2 : (H, ⊥) −→ (T, ?), se tiene:
α1 ◦ f = α1 ◦ f =⇒ α1 = α2 .
24 1. PRE-ÁLGEBRA
Para mejor recordar estas nociones, consideremos los siguientes dos diagramas que reflejan la
condición de monomorfismo y epimorfismo:
• Con las anteriores notaciones, f es monomorfismo si para todo grupo (T, ?) y cua-
lesquiera dos morfismos α1 , α2 : (T, ?) −→ (G, ∗), si el siguiente diagrama es conmu-
tativo:
(T, ?) f ◦ α1
α1
f
Id (G, ∗) (H, ⊥)
T
α2
(T, ?) f ◦ α2
Es decir, si f ◦ α1 = f ◦ α2 , entonces, α1 = α2 .
• Con las anteriores notaciones, f es epimorfismo si para todo grupo (T, ?) y cualesquiera
dos morfismos α1 , α2 : (H, ⊥) −→ (T, ?), si el siguiente diagrama es conmutativo:
α1 ◦ f (T, ?)
α1
f
(G, ∗) (H, ⊥) Id
T
α2
α2 ◦ f (T, ?)
Es decir, si α1 ◦ f = α2 ◦ f , entonces α1 = α2 .
Ya hemos visto que, en general, monomorfismo y morfismo inyectivo (respectvamente, epimor-
fismo y morfismo suprayectivo o ismorfismo y morfismo biyevtivo) no siempre son sinónimos.
Esta equivalencia, usualmente ausmida en las presentaciones de los grupos, es un caso particular
de los morfismos de grupos. Es el resultado que introducimos a continuación. Aunque el resul-
tado sobre la caracterización de epimorfismos de grupos de atribuye a O. Schreier (1901-1929),
su forma actual de debe a C. Linderholm (cf. [Lind, 1970]) que es la presentación elegida en
estas páginas.
Teorema 1.2.19. Con las anteriores notaciones, sea f : (G, ∗) −→ (H, ⊥) un morfismo de
grupos.
i) El morfismo f es morfismo inyectivo si y solamente si
ker(f ) := {x ∈ G : f (x) = eH } = {eG }.
ii) El morfismo f es monomofismo (en la categorı́a de grupos) si y solamente si f es
morfismo inyectivo.
iii) (Teorema de Schreier) El morfismo f es epimorfismo (en la categorı́a de grupos)
si y solamente si f es un morfismo suprayectivo.
Demostración. Demostraremos cada ı́tem separadamente:
i) Es evidente que si f es inyectiva ker(f ) = {eG }. Recı́procamente, si ker(f ) = {eG },
supongamos que tenemos x, y ∈ G tales que f (x) = f (y). Entonces, xy −1 ∈ ker(f ) y,
por tanto, x = y con lo que tenemos la inyectividad.
ii) Si f es inyectiva, se verifica obviamente la propiedad indicada con lo que tenemos la
implicación ⇐=. Recı́procamente, supongamos que f es un monoformismo de gru-
pos. Consideremos ker(f ) con la operación inducida por la de (G, ∗) como grupo y
consideremos los siguientes dos morfismos:

α1 : (ker(f ), ∗) ,→ (G, ∗)
x 7 →
− x,
α2 : (ker(f ), ∗) ,→ (G, ∗)
x 7−→ eG .
Es decir, α1 es la inclusión y α2 es claramente la “aplicación nula”, en el sentido de
que va siempre al elemento neutro. Entonces, es obvio que f ◦ α1 = f ◦ α2 . Por tanto,
si f es monomorfismo, α1 = α2 y, necesariamente, ker(f ) ⊆ {eG }.
iii) Para demostrar el Teorema de Schreier observamos, en primer lugar, que si f es
suprayectiva, entonces se verifica la condición de epimorfismo. El Teorema de Schreier
es justamente la prueba del recı́proco. Consideremos el subgrupo de H dado mediante:
L := Im(f ) := f (G).
Supongamos a ∈ H. Consideremos el conjunto de las clases a izquierda módulo L
(nótese que no hemos supuesto que L sea subgrupo normal, luego no es el grupo
cociente) unido, y de manera disjunta, un elemento a ∈ H cualquiera, es decir:
˙
[
X := {xL : x ∈ H} {a},
donde ∪˙ significa unión disjunta. Sea (S (X), ◦) el grupo de las permutaciones del
conjunto X con la composición ◦ como operación (descrito en el Ejemplo 1.2.11).
Definamos la siguiente permutación sobre X:
σ: X −→  X
 a, si s = L = eH L ∈ X,
s 7−→ σ(s) := L, si s = a,
s, si s 6= a, L.

Es obvio que es una biyección (nótese que σ −1 = σ, 3) que, en términos simplistas,

pretende “confundir” los papeles de a y L como elementos de X. Definamos dos
morfismos φ, ψ : (H, ⊥) −→ (S (X), ◦) del modo siguiente:
η: H −→ S (X)
x 7−→ η(x) := ηx ∈ S (S),
donde la permutación φx viene dada por:
ηx : X −→ X
xyL, si s = yL,
s 7−→
a, si s = a.
Por otro lado definamos
ψ: H −→ S (X)
x 7−→ σ ◦ ηx ◦ σ −1 ∈ S (S),
Es obvio que ambos son morfismos de grupo. Ahora hay que probar la siguiente afirmación:
Afirmación. Con las notaciones precedentes:
(1.2.1) L = {z ∈ H : η(z) = ψ(z)}.
Dejamos para más abajo la prueba de esta afirmación y damos por obvio que ambos son mor-
fismos de grupos. Asumiendo esta igualdad, veamos que η ◦ f = ψ ◦ f . Pues si x ∈ G, sea
entonces y = f (x) ∈ Im(f ) = f (G) = L. Pero como η(y) = ψ(y), para todo y ∈ L, tendremos
que η ◦ f (x) = ψ ◦ f (x) para cualquier x ∈ G, luego η ◦ f = ψ ◦ f y, como f es epimor-
fismo, concluiremos que η = ψ. En particular, tenemos que η(a) = ψ(a), con lo que por la
Igualdad (1.2.1) concluimos que a ∈ L. Habremos demostrado ası́ que H ⊆ L y, por tanto,
H = Im(f ), con lo que f es un morfismo suprayectivo. Nos queda por probar la Igualdad (1.2.1):
Demostración de la Afirmación.
3Aunque mantendremos la notación σ y σ −1 por razones didáctias: al alumno puede “recordarle” alguna
la semejanza con los subgrupos normales
26 1. PRE-ÁLGEBRA
• Demostración del contenido L ⊆ {z ∈ H : φ(z) = ψ(z)}: Sea z ∈ L. Por definición

de η, tenemos que ηz (s) = ηz (yL) = (zy)L para cada s = yL ∈ X y ηz (a) = a. De
otro lado,
ψ(z) := σ ◦ ηz ◦ σ −1 ∈ S (X).
Entonces, si s = yL ∈ X \ {a}, con y ∈ H, tenemos que s 6= L si y solamente si
y 6∈ L = Im(f ). En este caso, σ(s) = s y σ −1 (s) = s, y se tiene:
ψ(z)(s) = σ ◦ ηz ◦ σ −1 (yL) = σ ◦ ηz (yL) = σ ((zy)L) .
De nuevo, (zy)L 6= a y (zy)L 6= L. La primera afrimación es obvia, la segunda se
basa en el hecho de que z ∈ L. Pues si (zy)L = L es porque zy ∈ L, como z ∈ L,
esto implicarı́a que y ∈ L y hemos supuesto que yL 6= L. Por tanto, tendremos que si
s = yL ∈ X \ {L, a}, con y ∈ H se tiene:
ψ(z)(s) = σ ((zy)L) = (zy)L = ηz (yL).
En los dos casos que quedan, es obvio, por las definiciones de las funciones, que:
ψ(z)(a) = ηz (a),
y
ψ(z)(L) = ηz (L).
Con ello hemos probado que las dos permutaciones ψ(z) y ηz coinciden en todo punto
s ∈ X y, por tanto, ψ(z) = ηz , cuando z ∈ L.
• Demostración del contenido L ⊇ {z ∈ H : η(z) = ψ(z)}: Sea z ∈ H y supongamos
que z 6∈ L = Im(f ). Tenemos que
ψ(z)(a) = σ ◦ ηz ◦ σ −1 (a) = σ ◦ ηz (L) = σ(zL).
Como z 6∈ L, entonces zL 6= L y, por tanto, σ(zL) = zL. De otro lado,
ηz (a) = a,
y habremos probado que ψ(z) 6= ηz , con lo que hemos probado el contenido buscado.

Corolario 1.2.20. En la categorı́a de grupos, los isomorfismos de grupos son los morfismos
biyectivos y, por tanto, aquellos morfismos de grupos que son, a la vez, monomorfismos y
epimorfismos.
Demostración. Baste observar que los isomorfismos son precisamente aquellos morfismos
que son inyectivos y suprayectivos a la vez y usar el anterior Teorema.
1.2.3.2. Generación de Subgrupos. El punto de partida es la siguiente

Proposición 1.2.21. Sea (G, ·) un grupo y {Si : i ∈ I} una familia cualquiera de subgrupos.
Entonces, la intersección \
Si ⊆ G,
i∈I
es también subgrupo.
Demostración. Obvio.
A partir de esta sencilla propiedad podemos definir las nociones siguientes:

Definición 10 (Generadores de Subgrupos). Sea (G, ·) un grupo.
i) Para cada subconjunto F ⊆ G, llamaremos subgrupo generado por F al subgrupo dado
por la intersección de todos los subgrupos de G que contienen a F, es decir,
\
hFi := {S ⊆ G : F ⊆ S, S es subgrupo de G}.
ii) Un subgrupo S de G se dice finitamente generado si existe F ⊆ G finito tal que
hFi = S. Se dice que un subgrupo finitamente generado S es cı́clico si posee un
conjunto generador F de cardinal 1 (i.e. ](F) = 1).
iii) Un subgrupo se dice cı́clico si es el subgrupo generado por un único elemento.
La siguiente Proposición indica la relación entre los conjuntos de palabras Σ∗ y los grupos
finitamente generados, subyacente a las ideas de Thue y, finalmente, al Teorema de Novikov-
Boone.
Proposición 1.2.22. Sea (G, ∗) un grupo. Entonces, G es finitamente generado como grupo si
y solamente si existe un alfabeto finito Σ y un morfismo suprayectivo de monoides:
ψ : (Σ∗ , ·) −→ (G, ∗),
donde · es la operación de adjunción sobre Σ∗ .
Demostración. Es la clásica representación de los elementos de un grupo generado por
un subconjunto finito F = {γ1 , . . . , γm }. Los elementos g ∈ G vienen representados como
palabras
g = γi1 ∗ γi2 ∗ · · · ∗ γi` ,
con ik ∈ {1, . . . , γm }. Esta representación es simplemente la escritura informal de un morfismo
de monoides suprayectivo de la forma siguiente:
ψ: (F ∗ , ·) −→ (G, ∗)
γ i1 · · · · · γ i` 7−→ γi1 ∗ · · · ∗ γi` .
Dejamos los detalles al lector.
Observación 1.2.23. Nótese que el morfismo suprayectivo de monoides anterior no es, en gen-
eral, inyectivo. Aunque sı́ se puede inducir una relación de equivalencia ∼ sobre F ∗ que define
una estructura de grupo en el conjunto cociente F ∗ / ∼ a través de la adjunción de clases. Esto
permitirá identificar (G, ∗) con el cociente de (F ∗ / ∼, ·). Por tanto, los grupos finitamente
generados son los cocientes de conjuntos de palabras Σ∗ por relaciones de equivalencia espe-
ciales compatibles con la operación de adjunción de palabras. Entre ellos son especialmente
significativos los grupos finitamente generados y finitamente presentados que son los grupos en
los que la relación de equivalencia ∼ sobre Σ∗ está generada por una familia finita de reglas de
reescritura.
1.2.4. Acciones de un grupo.
Definición 11 (Acción de un monoide/grupo). Sea X un conjunto no vacı́o y (G, ∗) un
monoide. Una acción a izquierda del monoide G sobre X es una aplicación:
·G : G × X −→ X
(g, x) 7−→ g · x,
verificando
i) Dados cualesquiera g1 , g2 ∈ G y x ∈ X se tiene:
g1 ·G (g2 ·G x) = (g1 ∗ g2 ) ·G x.
ii) Si e ∈ G es el elemento neutro de G se tiene, para cada x ∈ X:
e · x = x.
Si (G, ∗) es un grupo diremos que es una acción a izquierda de un grupo sobre el conjunto X
En lo que respecta a esta Sección nos centraremos fundamentalmente en las acciones de grupo.
En Capı́tulos posteriores nos interesarán también las acciones de monoides.
Ejemplo 1.2.24 (Algunos ejemplos y comentarios sobre acciones de grupos). Unos
pocos comentarios preliminares:
i) La primera de las propiedades indicadas en la definición indica que se tiene una cierta
asociatividad entre la operación de grupo ∗ y la acción ·. Por eso se suelen denotar
con el mismo sı́mbolo (i.e. escribir (G, ·) para el grupo y ·G para la acción “externa”
del grupo sobre el conjunto X. Progresivamente iremos suprimiendo el sı́mbolo · de
las operaciones, siempre que no genere confusión alguna.
28 1. PRE-ÁLGEBRA
ii) El ejemplo más tradicional de acción a izquierda de un grupo sobre un conjunto es el

siguiente:
Sea K un cuerpo y V un espacio vectorial sobre K. Consideremos V ∗ := V \ {0},
el conjunto de los “vectores” de V , excluyendo el 0. Tenemos una acción a izquierda
natural sobre V ∗ a partir del grupo multiplicativo (K × , ·), donde K × = K \ {0}:
η : K× × V ∗ −→ V∗
(λ, v) 7−→ ηλ (v) := λv.
A la transformación ηλ se la suele denominar homotecia de razón λ sobre V ∗ .
iii) Las acciones a izquierda no solamente pueden ser de grupos, sino también de monoides.
Un ejemplo de acción a izquierda de un monoide sobre un grupo es el clásico ejemplo
de la acción del monoide multiplicativo (Z, ·) sobre cualquier grupo abeliano (X, ∗).
La acción tradicional se define del modo siguiente:
·: Z×X −→ X
(n, g) 7−→ ng,
dada mediante:


 0X , si n = 0
g, si n = 1

ng :=

 g ∗ (n − 1)g, si n ∈ N, n ≥ 2
−((−n)g), si −n ∈ N,

donde 0X es el neutro del grupo abeliano (X, ∗) y −g es el opuesto de h ∈ X para la

operación de X. Obviamente, es una acción de monoide.
iv) Junto a las acciones a izquierda se suelen introducir las acciones “a derecha”. Una
acción a derecha es una aplicación
R: G×X −→ X
(g, x) 7−→ R(g, x),
verificando
(a) Dados cualesquiera g1 , g2 ∈ G y x ∈ X se tiene:
R(g1 ∗ g2 , x) = R(g2 , R(g1 , x)).
(b) Si e ∈ G es el elemento neutro de G se tiene, para cada x ∈ X:
e · x = x.
De ahı́ que, usualmente, se suelan denotar las acciones a derecha mediante:
R(g, x) = x ·G g,
para indicar la diferencia con las acciones a izquierda. A modo de ejemplo, conside-
remos el conjunto X := Mn (K) de matrices n × n con coordenadas en un cuerpo K
y el grupo de matrices regulares G := GL(n, K). Consideremos una primera acción,
claramente acción a izquierda, dada por :
L: G × X −→ X
(P, M ) 7−→ P M,
Del mismo modo podemos considerar la siguiente acción que es una acción a derecha
(aunque multipliquemos por la izquierda):
R: G × X −→ X
(P, M ) 7−→ P −1 M,
La acción por la derecha esperable en este caso serı́a:
R0 : G × X −→ X
(Q, M ) 7−→ M Q,
que tiene asociada su correspondiente acción a izquierda, aunque multiliquemos por
la derecha:
L0 : G × X −→ X
(Q, M ) 7−→ M Q−1 .
v) De modo más general, las acciones a izquierda y a derecha de un grupo están rela-
cionadas a través de la inversión en G de modo obvio. Si R : G × X −→ X es una
acción a derecha de un grupo G sobre un conjunto X, la siguiente es una acción a
izquierda:
R0 : G × X −→ X
(g, x) 7−→ R(g −1 , x).
Esto determina una biyección entre ambos tipos de acciones. En lo que queda nos
ocupamos sólo de acciones a izquierda.
vi) Consideremos el grupo simétrico sobre un conjunto X, (S (X), ◦) introducido en el
Ejemplo 1.2.11. De manera natural define una acción a izquierda sobre el conjunto X
mediante:
◦S : S (X) × X −→ X
(1.2.2)
(σ, x) 7−→ σ(x).
Definición 12 (Órbitas). Sea (G, ·) un grupo, X un conjunto no vacı́o, ·G : G×X −→ X una

acción de grupo, S ⊆ G un subgrupo, Y ⊆ X un subconjunto y x ∈ X un elemento. Definimos
las diferentes órbitas:
i) Definimos la órbita definida por S sobre Y mediante:
OS (Y ) := {gy : g ∈ S, y ∈ Y }.
ii) Para cada elemento x ∈ X, se define la órbita a izquierda de x por la acción de S al
conjunto:
OS (x) := {gx : g ∈ S}.
iii) Si S = h{g}i es un subgrupo cı́clico, escribiremos simplemente Og (x) en lugar de
Ohgi (x). Es decir, escribiremos:
Oσ (x) := Ohgi = {g n (x) : n ∈ Z}.
Proposición 1.2.25. Sea (G, ·) un grupo y sea X un conjunto no vacı́o y sea ∗G : G×X −→ X
una acción a izquierda. Se tiene:
i) Para cada g ∈ G, la siguiente es una biyección (y, por tanto, está en S (X))4
ηg : X −→ X
x 7−→ g · x.
ii) El siguiente es un morfismo de grupos:
H : G −→ S (X)
g 7−→ ηg .
iii) Las órbitas definen una relación de equivalencia sobre X. Ası́, dado S ⊆ G un sub-
grupo, la siguiente es una relación de equivalencia sobre X
x ∼S y ⇐⇒ y ∈ OS (x).
Más aún, las clases de equivalencia son las órbitas, es decir,
x ∼S y ⇐⇒ OS (x) = OS (y).
Al conjunto cociente de X por la órbitas definidas por S a través de la acción de G se le denota
mediante X/ ∼S .
Demostración. Las propiedades i) y ii) son obvias dado que son, precisamente, las usadas
−1
en la definición de acción a izquierda anterior y dado que ηg−1 = (ηg ) .
Para la propiedade iii), bastará con que probemos la siguiente propiedad:
\
OS (x) OS (y) 6= ∅ ⇐⇒ OS (x) = OS (y).
Pero esa propiedad se sigue si probamos la siguiente:
∀z ∈ X, z ∈ OS (x) ∩ OS (y) =⇒ y ∈ OS (x).
4Bastantes autores prefieren la notación L en lugar de η haciendo referencia a que la acción es “a
g g
izquierda” (left). En estas notas hemos preferido usar ηg porque la homotecia de multiplicación por un elemento
(del grupo o de cualquier otra etructura) tiene un papel esencial en el sustrato cultural del curso.
30 1. PRE-ÁLGEBRA
Para probarlo, supongamos que existen g1 , g2 ∈ S tales que:

z = g1 x = g2 y.
Entonces,
y = g2−1 z = g2−1 (g1 x) = g2−1 · g1 x ∈ OS (x),

porque S subgrupo (i.e. g2−1 g1 ∈ S). Por tanto, y ∈ OS (x) y, consecuentemente, OS (y) ⊆
OS (x). El mismo argumento, “mutatis mutandi”, nos lleva a concluir que OS (x) ⊆ OS (y) y
ambas órbitas han de ser iguales.
Obviamente esto significa que la siguiente es una partición de X a través de las órbitas de la
acción de S sobre X:
{OS (xi ) : i ∈ I} = {OS (x) : x ∈ X},
En particular, tendremos la relación de equivalencia ∼S como se indica en el enunciado.
Ejemplo 1.2.26. Varios comentarios sobre la acción de grupo y las órbitas.
i) Obviamente se tiene la siguiente igualdad:
[
OS (N ) := OS (x).
x∈N
ii) Si tomamos la acción definida en el apartado ii) del Ejemplo 1.2.24 precedente:
η : K× × V ∗ −→ V∗
(λ, v) 7−→ ηλ (v) := λv,
el conjunto de las órbitas es una construcción geométrica básica conocida como , el
espacio tangente de V como K−espacio vectorial y se denota mediante P(V ). Es
la clase de los subespacios de dimensión uno como K−espacio vecorial. Nótese que,
obviamente depende del cuerpo K en consideración. En el caso V = K n se suele
denotar mediante Pn−1 (K), donde n − 1 hace referencia a la dimensión sobre K.
iii) Dada la acción de un grupo sobre sı́ mismo, las órbitas (por la acción a izquierda) de
un elemento σ ∈ G con respecto a un subgrupo S ⊆ G serán las clases a derecha, es
decir, se trata de:
OS (σ) := Sσ := {gσ : g ∈ S}.
En este caso, también se pueden considerar las órbitas a la derecha (interpretando la
acción a derecha):
(R)
OS (σ) := σS := {σg : g ∈ S}.
Esta es la notación más habitual para las clases módulo un subgrupo. En el caso de
subgrupos normales se estudia la relación entre ambos tipos de clases (ver Problema
11).
iv) Grupo de Automorfismos de una extensión de cuerpos. Los alumnos de este curso
han visto, mayoritariamente, un curso de Teorı́a de Galois por lo que, aunque no
veremos la noción de anillo y subanillo hasta dentro de algunas páginas, introducimos
aquı́ un ejemplo basado en extensiones de cuerpos y morfismos de cuerpos. Ası́,
consideremos (L, +, ·) un cuerpo y K ⊆ L un subconjunto que es subcuerpo (es decir,
(K, +) es subgrupo de (L, +) y (K × , ·) es subgrupo de (L× , ·), donde K × = K \ {0}
y L× = L \ {0}. Se dice que K ⊆ L es una extensión de cuerpos. Consideramos el
siguiente conjunto:

AutK (L) := {f : L −→ L : f es automorfismo de cuerpos y f = Id },
K K
donde automorfismo significa isomorfismo de anillos. Con la composición de aplica-
ciones (AutK (L) es un subgrupo del grupo de permutaciones (S (L), ◦). Y tenemos
inducida una acción a izquierda natural:
·: AutK (L) × L −→ L
(f, x) 7−→ f (x).
La ŕobita de un elemento x ∈ L se denomina los “elementos conjugados de x en L”.
Claramente se observa que si x ∈ L es algebraico sobre K, su órbita bajo esta acción
es finita, es decir, verifica:
] OAutK (L) (x) < ∞.

v) La relación de semejanza de matrices. Sea K un cuerpo, Mn (K) el conjunto de las

matrices n × n con coordenadas en K y GL(n, K) el grupo general lineal sobre K.
Entonces, tenemos la acción de GL(n, K) sobre Mn (K) dado mediante:
·GL(n,K) : GL(n, K) × Mn (K) −→ Mn (K)
(P, A) 7−→ P AP −1 ,
La órbita de una matriz A, en este caso, es el conjunto de las matrices semejantes
a la matriz A y estará determinada unı́vocamente por factores, invariantes, divisores
elementales y/o forma canónica de Jordan o de Frobenius. 5
vi) La relación de equivalencia de matrices. Sea K un cuerpo, Mn×m (K) el conjunto de
las matrices n × m con coordenadas en K. Consideremos los grupos generales lineales
GL(n, K) y GL(m, K) sobre K. Definamos el grupo producto cartesiano (también
producto “semi-directo”) (ver Problema 18) G := GL(n, K) × GL(m, K). Definamos
la acción de G sobre Mn×m (K) mediante:
·G : G × Mn×m (K) −→ Mn×m (K)
((P, Q), A) 7−→ P AQ−1 ,
Las órbitas inducen una relación de equivalencia denominada “equivalencia de matri-
ces”. Y el conjunto cociente es finito y está determinado por el rango. 6
vii) La relación de congruencia de matrices. Consideremos Symn (K) el conjunto de las
matrices simétricas n × n con coordenadas en K y GL(n, K) el grupo general lineal
sobre K. Entonces, tenemos la acción de GL(n, K) sobre Symn (K) dado mediante:
·GL(n,K) : GL(n, K) × Symn (K) −→ Symn (K)
(P, A) 7−→ P AP t ,
donde P t significa matriz traspuesta (i.e. P t := (qi,j ) donde P = (pi,j ) y qi,j = pj,i ,
para todo i, j). La órbita de una matriz simétrica A, en este caso, es el conjunto de
las matrices congruentes a la matriz A. En el caso K = R el conjunto cociente está
determinado por el rango y la signatura de la matriz, gracias al Lema de Cancelación
de Witt. En particular, sirve para clasificar las formas bilineales y formas cuadráticas
afı́n y proyectivamente. 7
viii) La relación de congruencia unitaria de matrices. Consideremos el cuerpo C de los
números complejos. Para cada matriz A ∈ Mn (C) denotamos por A∗ su transpuesta
conjugada. Es decir, si A = (ai,j ), su traspuesta conjugada es la matriz A∗ := (bi,j )
donde
bi,j = aj,i , ∀i, j.
Consideremos el grupo unitario U (n) := {A ∈ Mn (C) : A∗ = A−1 }. Y consideremos
el conjunto de matrices Hermitianas
Hn (C) := {A ∈ Mn (C) : A∗ = A}.
Consideremos el grupo unitario de matrices unitarias complejas:
U (n) := {A ∈ Mn (C) : A−1 = A∗ } = {A ∈ Mn (C) : AA∗ = Idn }.
la acción de grupo:
·U (n) : U (n) × Hn (C) −→ Hn (C)
(P, A) 7−→ P AP ∗ .
Se trata de una acción de grupo que define una relación de equivalencia sobre Hn (C).
En este caso, el número de órbitas está identificado con Rn . En particular, sirve para
clasificar métricamente las formas sesqui-lineales y formas cuadráticas cobre C. 8
5Teóricamente, el curso de Álgebra Lineal I está dedicado a entender esta acción del grupo GL(n, K).
6Teóricamente, el Álgebra Lineal de Bachillerato está dedicado a entender esta acción de grupo.
7Teóricamente, el curso de Álgebra Lineal II está dedicado a entender esta acción de grupo.
8Teóricamente, el curso de Álgebra Lineal II está dedicado a entender esta acción de grupo.
32 1. PRE-ÁLGEBRA
ix) Sistemas Dinámicos. Consideramos un conjunto X = M dado como una variedad

diferenciable de clase C ∞ y Dif f (M ) el grupo de sus difeomorfismos. Fijamos un
elemento f ∈ Dif f (M ) y consideramos el grupo cı́clico que genera por composición
hf i := {f n : n ∈ Z}. Definimos la acción:
·f : hf i × M −→ M
(f n , x) 7−→ f n (x).
A esta acción se la suele denominar sistema dinámico y se representa por el par (M, f ).
Ver [Shu, 1987], [HSD, 1974] o [BS, 02] para más aspectos sobre el tema.
Observación 1.2.27. La parte usualmente difı́cil cuando se trata de acciones de grupos sobre
conjuntos es la determinación de las órbitas y, en particular, la determinación de representantes
significativos (llamados “canónicos”) de cada una de las órbitas. Entre los ejemplos se pueden
ver varias acciones de grupo y se trata de determinar representantes canónicos de las órbitas,
para lo que los alumnos han sido adiestrados en diversas asignaturas precdentes a ésta.
Definición 13 (Acciones Transitivas y Fieles.). Una acción de un grupo (G, ·) sobre un

conjunto X no vacı́o dada mediante ·G : G × X −→ X
i) Se dice que la acción es transitiva si verifica:
∀x, y ∈ X, ∃g ∈ G, g · x = y.
ii) Se dice que la acción es fiel si verifica:
∀g1 , g2 ∈ G, ∃x ∈ M, g1 · x 6= g2 · x.
Definición 14 (Estabilizador de un elemento). Sea (G, ·) un grupo, X un conjunto no

vacı́o y ·G : G × X −→ X una acción de G sobre X. Sea x ∈ X un elemento. Definimos el
estabilizador de x con respecto a la acción de ·G como el subgrupo de G dado mediante :
StabG (x) := {g ∈ G : g ·G x = x}.
Es, obviamente, un subgrupo de G.
Observación 1.2.28. Nótese que un elemento g ∈ G está en el estabilizador de un elemento
x ∈ G si y solamente si la órbita Og (x) se reduce a un punto, i.e.
g ∈ StabG (x) ⇐⇒ Og (x) = {x}.
Proposición 1.2.29. Sea (G, ·) un grupo y ·G : G×X −→ X una acción a izquierda de G sobre
el conjunto X no vacı́o. La acción es fiel si y solamente si el siguiente es un monomorfismo de
grupos:
H : G −→ S (X)
g 7−→ ηg .
En particular, G se identifica con un subgrupo del grupo simétrico S (X).
Demostración. Ya hemos visto que es morfismo. Justamente, por ser fiel si dos elementos
g1 , g2 ∈ G definen la misma transformación ηg1 y ηg2 , entonces g1 = g2 por la definición de fiel.
El recı́proco es igualmente obvio y mera reescritura comparada de las definiciones.
Observación 1.2.30 (“Fidelizando” acciones a izquierda). Algunas acciones a izquierda

(o a derecha) de un grupo sobre un conjunto pueden ser “infieles” porque varios elementos del
grupo tienen un mismo comporatmiento sobre el conjunto. Por ejemplo, el grupo aditivo (Z, +)
actuando sobre el conjunto Z/6Z del modo usual no define una acción fiel: hay demasiados
elementos de Z que definen el mismo comportamiento sobre Z/6Z. Las acciones infieles se
pueden “fidelizar” pasando simplemente al núcleo. Es decir, dada una acción a izquierda G ×
X −→ X del grupo (G, ·) sobre el conjunto X, tenemos defino un morfismo de grupos: H :
(G, ·) −→ (S (X), ◦) definido en la Proposición 1.2.25. Consideramos el núcleo de ese morfismo
ker(H) que es un subgrupo normal de (G, ·). Tenemos un monomorfismo (por el Primer Teorema
de Isomorfı́a de Grupos):
e : (G/ ker(H), ·) ,−→ (S (X), ◦).
H
Ası́, podemos construir una nueva acción:

·: (G/ ker(H)) × X −→ X
(g ker(H), x) 7−→ gx.
Es una acción a izquierda y ahora la acción es fiel porque e(H) es monomorfismo. La conclusión
es que se pueden “fidelizar” las acciones a izquierda pero, en general, no siempre es fácil describir
el grupo cociente G/ ker(H) que “fideliza” la acción.
Proposición 1.2.31 (Estabilizador y cociente). Sea G×X −→ X una acción a izquierda del
grupo (G, ·) sobre el conjunto X no vacı́o. Entonces, para cada x ∈ X se tiene una biyección
entre la órbita OG (x) y el conjunto cociente G/ ∼S , donde S := StabG (x) es el subgrupo
estabilizador del punto x ∈ X 9. En particular, si el estabilizador S es un subgrupo normal,
entonces, las órbitas son biyectables al grupo cociente G/S.
Demostración. Baste con observar la siguiente aplicación suprayectiva:
ω : G −→ OG (x)
g 7−→ gx.
Obviamente, ω(g1 ) = ω(g2 ) si y solamente si g1 x = g2 x, lo cual implica g2−1 g1 x = x o, equiva-
lentemente, g2−1 g1 ∈ S := StabG (x). Por tanto, g1 y g2 definen la misma clase de equivalencia
mediante la relación
g1 ∼S g2 ⇐⇒ g2−1 g1 ∈ S = StabG (x).
Esto nos permite definir la siguiente correspondencia:
Ω : G/ ∼S −→ OG (x)
gS 7−→ gx.
Por construción, Ω es aplicación (i.e. está bien definida), es suprayectiva por definición y, como
hemos visto, debe ser inyectiva.
Proposición 1.2.32 (Acciones transitivas y estabilizador). Sea (G, ·) un grupo, X un

conjunto no vacı́o y ·G : G × X −→ X una acción transitiva de G sobre X.
i) Todos los estabilizadores de puntos son subgrupos conjugados y, en particular, isomor-
fos. Es decir, dados x0 , y0 ∈ X existe g ∈ G tal que
StabG (x0 ) = g · StabG (y0 ) · g −1 ,
ii) Sea x0 ∈ X un elemento cualquiera de X y sea S := StabG (x0 ). Entonces, X es
biyectable al conjunto de clases definido por S en G. Es decir, existe una biyección
natural entre X y el conjunto cociente:
G/ ∼S := {aS : a ∈ G}.
iii) Si existiera un punto y0 ∈ X tal que su estabilizador T := StabG (y0 ) es subgrupo
normal de G (en cuyo caso todos los estabilizadores son iguales)(ver Problema 11), el
conjunto X serı́a biyectable a un grupo cociente: G/T .
Demostración. Probemos la afirmación i). Sabemos que existe g ∈ G tal que gx0 = y0
por ser la acción transitiva. Entonces, se tiene la igualdad
gStabG (x0 )g −1 = StabG (y0 ).
Dado h ∈ StabG (x0 ) tenemos que hx0 = x0 . Por tanto, ghg −1 (y0 ) = (gh)x0 = gx0 = y0 . El
recı́proco es igualmente obvio. Al ser subgrupos conjugados son obviamente isomorfos.
Para la afirmación ii), retomamos la biyección descrita en la Proposición 1.2.31 precedente:
Ω : G/ ∼S −→ OG (x0 )
gS 7−→ gx0
Como la acción es transitiva, la órbita de cualquier punto es todo X, i.e. OG (x0 ) = X, y
tenemos la biyección anunciada.
9Recuérdese que un subgrupo S de un grupo G define una relación de equivalencia mediante a ∼ b sii
S
ab−1 ∈ S. Pero el conjunto cociente G/ ∼S , formado por las clases de equivalencia, no necesariamente es un
grupo con la operación natural. Para ello es necesario que S sea subgrupo normal.
34 1. PRE-ÁLGEBRA
Para la afirmación iii), siguiendo, de nuevo, la estela de la Proposición 1.2.31, consideremos la

biyección allı́ discutida:
Ω : G/ ∼S −→ OG (x)
gS 7−→ gx.
Nótese simplemente que la afirmación i) no depende del punto x0 elegido. Si, además, y0 es tal
que su estabilizador es un subgrupo normal, entonces G/ ∼T tiene estructura de grupo cociente,
que suele denotarse por G/T (ver Problema 11 más adelante). Por tanto, el conjunto X es, en
realidad, un grupo cociente G/T camuflado tras la acción.
Ejemplo 1.2.33 (Esferas como variedades homogéneas). Consideremos la esfera unidad

real S n−1 := {x ∈ Rn : ||x||2 = 1}, donde || · ||2 es la norma euclı́dea canónica. Consideremos
también el grupo de las matrices ortogonales reales O(n) := {A ∈ GL(n, R) : A−1 = At },
donde At es la transpuesta de A. Ahora observamos la siguiente acción a izquierda:
·: (O(n), ·) × S n−1 −→ S n−1
(U, x) 7−→ U x.
Es claro que la acción es transitiva. Más aún, consideremos el polo e1 := (1, 0, . . . , 0) ∈ S n−1 .
Es sencillo verificar que el estabilizador de e1 es dado por la siguiente igualdad:

1 0
StabO(n) (e1 ) = { : U1 ∈ O(n − 1)} ∼= O(n − 1).
0 U1
El resultado anterior nos permite concluir que S n−1 es el cociente del grupo de matrices ortog-
onales O(n) por la acción del estabilizador de e1 . Es decir,
S n−1 ∼
= O(n)/ ∼O(n−1) .
En Geometrı́a Diferencial suele usarse la notación
S n−1 =∼ O(n)/O(n − 1),
sin poner mucha atención al hecho de que no es un grupo cociente casi nunca. De hecho, es
fácil ver que si n ≥ 2, ese cociente no es un grupo. Para ello, baste con ver que StabO(n) (e1 ) no
es subgrupo normal para n ≥ 3. Si lo fuera, todos los establizadores de todos los puntos serı́an
iguales. Mostremos, simplicando el caso n = 3. En ese caso, consideremos la matriz unitaria
que transforma el polo e1 en el polo e2 := (0, 1, 0). Es la matriz ortogonal
 
0 1 0
P := 1 0 0 ∈ O(3),
0 0 1
que verifica P e1 = e2 . Obviamente, P −1 = P t = P , con lo que también se verifica P e2 = e1 .
Por la demostración de la proposición precedente, tenemos que
StabO(3) (e2 ) = P StabO(3) (e1 )P −1 .
Pero si StabO(3) (e1 ) fuera un subgrupo normal,entonces StabO(3) (e2 ) = StabO(3) (e1 ), lo cual es
imposible: la siguiente matriz están en StabO(3) (e2 ) pero no en StabO(3) (e1 ):
 
0 0 1
Q := 0 1 0 ∈ StabO(3) (e2 ) \ StabO(3) (e1 ).
1 0 0
Es posible que el lector no quiera usar la proposición predente. Entonces, basta con que observe
el siguiente producto de matrices:
     
0 1 0 1 0 0 0 1 0 a 0 −b
1 0 0 0 a −b 1 0 0 = 0 1 0  ,
0 0 1 0 b a 0 0 1 b 0 a
donde a2 + b2 = 1. Claramente, esta matriz no está en StabO(3) (e1 ) en cuando b 6= 0, luego
StabO(3) (e1 ) no es un subgrupo normal.
El único caso en el que la esfera unidad es grupo es el caso de S 1 , que es grupo por obvias
razones pero, en el contexto actual, es grupo porque StabO(2) (e1 ) ∼
= O(1) = {±1} = Z× , donde
Z× es el grupo de las unidades del anillo (Z, +, ·) con la operación producto. En ese caso, es
sencillo ver que StabO(2) (e1 ) es un subgrupo normal y que
S1 ∼
= O(2)/O(1),
donde el ∼= no es solamente una biyección sino un isomorfismo de grupos. A las variedades
diferenciables que son cociente (salvo ∼S , no necesariamente como grupos) de dos grupos [de
Lie, topológicos, etc] se las denomina variedades homogéneas. Las esferas S n−1 son variedades
homogéas.
1.2.5. Ejercicios y problemas de la Sección 1.2.
Problema 1. Considérese el conjunto Nn y, sobre él, consideremos la estructura de monoide
definida mediante la suma coordenada a coordenada (Nn , +). Consideremos la aplicación grado
definida sobre Nn del modo siguiente:
| · | : Nn −→ N,
definida para cada µ := (µ1 , . . . , µn ) ∈ Nn , entonces
|µ| := µ1 + · · · + µn ∈ N.
A la aplicación | · | se la denomina grado total del multi-ı́ndice (o exponente monomial) µ. Se
pide:
i) Probad que, efectivamente, (Nn , +) es un monoide.
ii) Hay que probar que el par (2Z, ·), donde 2Z son los enteros pares y · es el producto.
Pruébese que se trata de un semi-grupo que no es monoide.
iii) Probad la siguiente igualdad para cada d ∈ N:

n d+n−1
]{µ ∈ N : |µ| = d} = .
n−1
Problema 2. Pruébese la Proposición 1.2.16 anterior.
Problema 3. Verifica que un morfismo de grupos f : (G, ∗) −→ (H, ⊥) es biyectivo si y
solamente si es isomorfismo, es decir, si y solamente si existe otro morfismo de grupos f 0 :
(H, ⊥) −→ (G, ∗) tal que:
f ◦ f 0 = IdH , f 0 ◦ f = IdG ,
donde ◦ denota composición de aplicaciones e IdG , IdH son, respectivamente, los morfismos
identidad. Concluir que un isomorfismo es un morfismo que es monomorfismo y epimorfismo
en el sentido de la Definición 9.
Problema 4. Sea (K, +, ·) un cuerpo y definamos la clase de las sumas finitas de cuadrados
en K como el conjunto:
X n
X
K := {x ∈ K : ∃n ∈ N, ∃x1 , . . . , xn ∈ K, x = x2i }.
i=1
Pruébense:
P
i) El par (P K , +) es un monoide conmutativo.
ii) El par ( K , ·) es un monoide conmutativo.
Problema 5 (Teorema de Euler sobre la suma de 4 cuadrados). Considera el conjunto
de números enteros que son suma de 4 cuadrados:
X
Z := {x ∈ Z : ∃a1 , a2 , a3 , a4 ∈ Z, x = a21 + a22 + a23 + a24 }.
4
P
Pruébese que ( 4 Z , ·) con el producto de enteros, es un monoide. ( Hint: Busca una prueba
del Teorema de Euler sobre la suma de cuatro cuadrados).
Problema 6. Sea p ∈ N un primo impar. Pruébese que las clases residuales en Z/pZ son todas
distintas:
{a2 + pZ : 0 ≤ a ≤ (p − 1)/2}.
( Hint: Usad el Teorema de Lagrange sobre el número de raı́ces de un polynomio f ∈ Z/pZ[X].)
36 1. PRE-ÁLGEBRA
Problema 7 (Principio de las Cajas de Dirichlet). Prueba el siguiente resultado, conocido

como principio de las cajas de Dirichlet (aunque la prioridad pertenece a Jean Leurechon,
Dirichlet lo redescubre y el nombre se mantiene), también conocido como Principio del Palomar:
Sean k y m dos números naturales y sea n = km + 1. Dada cualquier partición del conjunto
{1, . . . , n} en m subconjuntos disjuntos de cardinal finitoF, debe existir al menos un subconjunto
con k + 1 elementos.
Problema 8 (Teorema de Lagrange sobre los cuatro cuadrados). Prueba el siguiente
Teorema de Lagrange:
Todo entero positivo es suma de 4 cuadrados o, equivalentemente, con las notaciones de los
problema precedentes, pruébese que: X
N⊆ Z .
4
Problema 9. Consideremos el conjunto O(n) de las matrices n × n ortogonales sobre R. Es

decir,
O(n) := {O ∈ Mn (R) : Ot = O−1 },
donde O∗ es la transpuesta de O. Se pide:
i) Se debe probar que (O(n), ·) es un grupo con la operación producto de matrices.
ii) Se tiene que probar que la siguiente es una acción de O(n) sobre Mn (R):
·O : O(n) × Mn (R) −→ Mn (R)
(O, M ) 7−→ OM Ot .
iii) Determinar las órbitas de una matriz M ∈ Symn (R) (el conjunto de las matrices
simétricas cuadradas) salvo la congruencia ortogonal de matrices. ¿Existe algún rep-
resentante canónica de esa clase de equivalencia?. Explicar la relación con la diagonal-
ización de formas cuadráticas (i.e. polinomios homogéneos de grado 2 con coeficientes
reales). ( Hint: Buscad en internet (o en vuestra bibliografı́a personal o apuntes) la
Factorización de Schur real de matrices reales y explicar qué tiene que ver con este
enunciado).
iv) Indica en qué curso y asignatura estudiaste la congruencia ortogonal de matrices y su
relación con lo estudiado en este Problema.
Problema 10. Consideremos el conjunto U (n) de las matrices n × n unitarias sobre C. Es
decir,
U (n) := {U ∈ Mn (C) : U ∗ = U −1 },
donde U ∗ es la transpuesta de la conjugada de U . Se pide:
i) Probad que (U (n), ·) es un grupo con la operación producto de matrices.
ii) Probad que la siguiente es una acción de U (n) sobre Mn (C):
·U : U (n) × Mn (C) −→ Mn (C)
(U, M ) 7−→ U M U ∗.
iii) Determinar las órbitas de una matriz M ∈ Hermn (C) (matrices hermı́ticas comple-
jas, i.e. matrices que coinciden con su transpuesta conjugada M = M ∗ ). ¿Existe
algún representante canónica de esa clase de equivalencia?. ( Hint: Buscad en inter-
net (o en vuestra bibliografı́a personal o apuntes) la Factorización de Schur de matrices
complejas y explicar qué tiene que ver con este enunciado).
iv) Indica en qué curso y asignatura estudiaste la congruencia unitaria de matrices y su
relación con lo estudiado en este Problema.
Problema 11 (Subgrupo Normal). Sea (G, ∗) un grupo y G1 un subgrupo. Decimos que G1
es un subgrupo normal de G si verifica la siguiente propiedad adicional:
∀x ∈ G, xG1 x−1 := {x ∗ g ∗ x−1 : g ∈ G1 } ⊆ G1 .
Probad que las siguientes propiedades son equivalentes:
i) G1 es un subgrupo normal de (G, ∗),
ii) ∀x ∈ G, xG1 x−1 = G1 ,
iii) ∀x ∈ G, xG1 = {x ∗ g : g ∈ G1 } = {g ∗ x : g ∈ G1 } = G1 x.
Da un ejemplo de un grupo y un subgrupo que no sea normal en él.
Problema 12. Se debe probar que todo subgrupo de un grupo abeliano es un subgrupo normal.
Buscar un ejemplo de un grupo donde no se dé esta propiedad (Pista: Intentarlo con S3 y el
subgrupo H = {Id, (1 2)}).
Problema 13. Sea f : G −→ H un morfismo de grupos. Prueba que la imagen inversa de
todo subgrupo normal de H es subgrupo de G. Concluye que, en particular, el núcleo ker(f )
es un subgrupo normal de G. ¿Es también cierto que las imágenes de subgrupos normales son
subgrupos normales?. Razona la respuesta a esta pregunta ( Hint: reflexiona usando el problema
precedente).
Problema 14. Probad que todo grupo finito de cardinal menor o igual a 5 es un grupo abeliano.
¿Es eso cierto también para grupos de cardinal 6?.
Problema 15 (Grupo cociente). Sea (G, ∗) un grupo y G1 un subgrupo normal. Hay que
probar que la siguiente es una relación de equivalencia entre elementos de G:
a ∼G1 b ⇔ ab−1 ∈ G1 .
Consideremos el conjunto cociente de G por esa relación de equivalencia R/ ∼G1 . Probad que
para cada elemento x ∈ G, su clase de equivalencia con respecto a esa relación ∼G1 verifica:
[x]∼G ; = {y ∈ G : y ∼G1 x} = xG1 = G1 x.
1
Denotemos mediante G/G1 a ese conjunto cociente y definamos la siguiente correspondencia:

∗ : G/G1 × G/G1 −→ G/G1
(xG1 , yG1 ) 7−→ (x ∗ y)G1 .
Pruébese que ∗ es una aplicación y que (G/G1 , ∗) es un grupo (llamado grupo cociente de G
por el subgrupo normal G1 . Probad, adicionalmente, que la siguiente es aplicación y que es
epimorfismo de grupos:
π : G −→ G/G1
x 7−→ xG1 .
Problema 16 (Primer Teorema de Isomorfı́a). Sea f : (G, ∗) −→ (H, ⊥) un morfismo de
grupos. Entonces, existe un isomorfismo de grupos dado del modo siguiente:
f˜ : (G/Ker(f )) −→ Im(f )
xKer(f ) 7−→ ˜
f (xKer(f )) = f (x).
Se debe probar esta afirmación.
Problema 17. Buscar alguna identificación del grupo cociente (R/Z, +).
Problema 18 (Producto (cartesiano) de grupos). Dados dos grupos (G, ∗), (H, ⊥), se
define una estructura de grupo sobre el producto cartesiano G × H del modo siguiente:
2
·: (G × H) −→ G×H
((g1 , h1 ), (g2 , h2 )) 7−→ (g1 ∗ g2 , h1 ⊥ h2 ).
Se suele denominar producto semi-directo de los grupos G y H y se representa, en ocasiones,
mediante G o H. Se pide:
i) Probad que (G × H, ·) es un grupo con la anterior operación.
ii) Consideremos el conjunto Mn×m (K) de las matrices n×m (con n filas y m columnas)
y coordenadas en un cuerpo K. Consideremos el grupo producto GL(n, K)×GL(m, K)
y definamos la siguiente acción:
·Gauss : (GL(n, K) × GL(m, K)) × Mn×m (K) −→ Mn×m (K)
((P, Q), M ) 7−→ P M Q−1 .
Hay que probar que es una acción del grypo producto GL(n, K) × GL(m, K) sobre
Mn×m (K).
iii) Para cada elemento M ∈ Mn×m (K) detectar la relación de equivalencia a sociada a
esta acción. Determina algún representante canónico.
38 1. PRE-ÁLGEBRA
Problema 19 (El Espacio Proyectivo). Sea V un espacio vecorial sobre un cuerpo K.

Consideremos el grupo multiplicativo (K × , ·) donde K × := K \ {0} y el conjunto X := V \ {0}.
Definamos la acción a izquierda usual determinada por las homotecias:
η : K × × X −→ X,
definida entre los ejemplos de la Observación 1.2.24. Se pide:
i) Determinar las órbitas OK × (v) para cada v ∈ V .
ii) Expresar la relación de equivalencia que, sobre V \ {0}, definen estas órbitas. Al
conjunto cociente se le denomina espacio proyectivo sobre V y se denota mediante
P(V ).
iii) Si V = K n+1 , al espacio proyectivo P(V ) se le denota mediante Pn (K) y se le denom-
ina espacio proyectivo n−dimensional sobre el cuerpo K. Se pide:
• En el caso K = R, busca representaciones gráficas de P1 (R) y P2 (R) ( Hint: Usa
las esferas de dimensiones 1 y 2 sobre R: S 1 := {(x, y) ∈ R2 : x2 + y 2 − 1 = 0}
y S 2 := {(x, y, z) ∈ R3 : x2 + y 2 + z 2 − 1 = 0}.)
• Tomando los cuerpos finitos K = F2 y K = F3 , construye representaciones
gráficas de Pi (K), para i = 1, 2, 3.
Problema 20. Seguidamente se describen algunas acciones clásicas de grupos sobre diversas
geometrı́as elementales. Describe las acciones que conozcas, indica en qué materia o asignatura
te las han introducido y trata de determinar representantes canónicos de las órbitas. Para las
acciones o términos que no reconozcas, trata de localizar en la web los términos y trata de
resumir lo que hayas entendido al respecto.
i) Afinidades sobre el espacio afı́n Rn .
ii) (Opcional, sólo se han visto y se ha estudiado el espacio proyectivo) Homografı́as
(también proyectividades) actuando sobre el espacio proyectivo Pn (R).
iii) Isometrı́as sobre el espacio afı́n real Rn .
iv) Movimientos sobre el espacio afı́n real Rn .
v) Isometrı́as lineales sobre la esfera real S n−1 .
vi) Isometrı́as sobre el espacio proyectivo real Pn (R).
vii) Homemomorfismos sobre espacios topológicos.
Problema 21. Sea G × X −→ X una acción a izquierda de un grupo G sobre un conjunto no
vacı́o X. Se pide:
i) Pruébese que si la acción es transitiva y fiel y si X es un conjunto finito, la siguiente
aplicación es monomorfismo de grupos, pero no siempre es un isomorfismo de grupos:
H : G −→ S (X)
g 7−→ ηg ,
ii) Discútase si la anterior afirmación sigue siendo cierta cuando X no es un conjunto
finito.
Problema 22. Pruébese que el grupo ortogonal O(n) define una acción natural a izquierda
sobre la esfera unidad S n−1 := {x ∈ Rn : ||x||22 = 1}. Pruébese asimismo:
i) Es una acción transitiva.
ii) Discutir si es acción fiel.
iii) Si e1 ∈ S n−1 ⊆ Rn es el primer elemento de la llamada base canónica de Rn , pruébese
que
1 0
StabO(n) (e1 ) = { : U ∈ O(n − 1)}.
0 U
iv) Los establizadores de todo punto son isomorfos entre sı́ e isomorfos a O(n − 1).
v) Discútase si para n ≥ 3, StabO(n) (e1 ) es un subgrupo normal de O(n) y si la esfera
tiene una estructura de cociente entre dos grupos, con la operación habitual entre
matrices:
S n−1 = O(n)/ ∼O(n−1) .
Hágase un análisis similar con la acción de O(n) sobre bolas (abiertas y/o cerradas) en Rn con
centro en el origen y radio variable.
Problema 23. Demostrar la Proposición 1.2.29 anterior.
1.2.5.1. Descomposición en Valores Singulares. En esta serie de problemas probare-

mos la existencia de Descomposición en Valores Singulares (SVD) de matrices reales y com-
plejas.
Problema 24. Sea Mn×m (R) el conjunto de las matrices con n filas y m columnas con coor-
denadas reales. Para cada k consideremos el producto euclı́deo sobre Rk usual:
h·, ·i : Rk × Rk −→ R
Pk
((a1 , . . . , ak ), (b1 , . . . , bk )) 7−→ i=1 ai bi .
Sea || · ||2 la norma inducida por ese producto euclı́deo. Para cada A ∈ Mn×m (R), defı́nase la
norma de A como operador lineal mediante la identidad siguiente:
||Av||2
||A||2 := sup{ : v ∈ Rm , v 6= 0}.
||v||2
Se pide:
i) Pruébese la siguiente identidad:
||A||2 := sup{||Av||2 : v ∈ Rm , ||v||2 = 1}.
ii) Pruébese que la norma de una matriz como operador está bien definida (es decir,
que ese supremo existe y es finito) ( Hint: Úsese que toda función continua sobre un
compacto tiene como imagen un compacto y el hecho de que S m−1 es compacto).
iii) Pruébese que existe siempre v1 ∈ S m−1 ⊆ Rm tal que ||Av1 ||2 = ||A||2 . ( Hint: Úsese
el Teorema de Weierstrass y la compacidad de S m−1 ).
iv) Pruébese que si At es la matriz transpuesta de A, entonces ||At ||2 = ||A||2 ( Hint:
Tomad v1 el vector de la anterior afirmación. Usando las definiciones y la desigualdad
de Cauchy-Schwartz probar la siguiente cadena de desigualdades:
||A||22 = ||Av1 ||22 = |(v1t At )(Av1 )| = |v1t ((At A)v1 ))| ≤
||v1 ||||At Av1 || ≤ ||At ||2 ||Av1 || = ||At ||2 ||A||2 .
v) Pruébese que para cada matriz A ∈ Mn×m (R) existen matrices ortogonales U ∈ O(n)
y V ∈ O(n) tales que
t ||A||2 0
U AV = ,
0 A1
donde A1 ∈ M(n−1)×(m−1) (R) y los ceros representan, respectivamente matrices fila o
columa de tamaño adecuado ( Hint:Úsese la ortonormalización de Gram-Schmidt).
Problema 25 (Existencia de Descomposición en Valores Singulares (SVD) para ma-
trices reales). Con las notaciones de problema precedente, consideremos el conjunto Mn×m (R)
de matrices n × m con coordenadas reales y los grupos de matrices ortogonales O(n) y O(m).
Consideremos el grupo producto G := O(n) × O(m) con la operación descrita en el Problema
18 precedente. Definamos la siguiente aplicación :
L : G × Mn×m (R) −→ Mn×m (R)
((U, V ), A) 7−→ U AV ∗ ,
donde V ∗ es la transpuesta de V . Se pide:
i) Probar que es una acción a izquierda.
ii) Usando el Problema precedente, pruébese que para cada A ∈ Mn×m (R) la órbita de A
por la acción de G satisface que existe una matriz diagonal DA ∈ OG (A)de la forma
siguiente:  
σ1 0 · · · 0
 0 σ2 · · · 0 
 .. . 0
 
DA :=  . .. .. r×(m−r)
,

 . 
 0 0 · · · σr 
0(n−r)×r 0(n−r)×(m−r)
donde
• Las matrices 0i×j son la matrices nulas de tamaño i × j,
• r = rank(A) es el rango de la matriz A,
40 1. PRE-ÁLGEBRA
• DA ∈ Mn×m (R) (i.e. las cantidades σi están en R) y se tiene

σ1 ≥ σ2 ≥ · · · ≥ σr ≥ 0.
• σ1 = ||A||2 .
iii) Discute la unicidad de los σi ’s en la diagonalización anterior.
A la sucesión σ1 ≥ σ2 ≥ σr se la denomina los valores singulares de la matriz A y a la
descomposición DA := U AV ∗ se la denomina descomposición en valores singulares, singular
value decomposicition o, simplemente, SVD. Algunos autores, suelen llamar valores signulares
a la sucesión siguiente:
σ1 ≥ · · · σr ≥ σr+1 ≥ · · · ≥ σt ,
donde t := min{m, n} y σi = 0 para r +1 ≤ i ≤ m. Estos autores quieren simplemente enfatizar
el caso r < min{m, n} añadiendo 00 s como valores singulares. Usaremos ambos indistintamente.
Problema 26. Sea Mn×m (C) el conjunto de las matrices con n filas y m columnas con coor-
denadas complejas. Para cada k consideremos el producto hermı́tico sobre Ck usual:
h·, ·i : Ck × Ck −→ C
Pk
((a1 , . . . , ak ), (b1 , . . . , bk )) 7−→ i=1 ai bi ,
donde bi es elpconjugado de bi ∈ C. Sea || · ||2 la norma inducida por ese producto hermı́tico
(i.e. ||v||s := hv, vi. Para cada A ∈ Mn×m (C), defı́nase la norma de A como operador lineal
mediante la identidad siguiente:
||Av||2
||A||2 := sup{ : v ∈ Cm , v 6= 0}.
||v||2
Se pide:
i) Pruébese la siguiente identidad:
||A||2 := sup{||Av||2 : v ∈ Cm , ||v||2 = 1}.
ii) Pruébese que la norma de una matriz como operador está bien definida ( Hint: Úsese
que toda función continua sobre un compacto tiene como imagen un compacto y el
hecho de que la esfera unidad compleja S 2m−1 := S 1 (C) := {v ∈ Cm : ||v||2 = 1} es
compacto).
iii) Pruébese que existe siempre v1 ∈ S 2m−1 ⊆ Cm tal que ||Av1 ||2 = ||A||2 . ( Hint: Úsese
el Teorema de Weierstrass y la compacidad de S m−1 ).
iv) Pruébese que si A∗ es la matriz transpuesta conjugada de A, entonces ||A∗ ||2 = ||A||2
( Hint: Tomad v1 el vector de la anterior afirmación. Usando las definiciones y la
desigualdad de Cauchy-Schwartz probar la siguiente cadena de desigualdades:
||A||22 = ||Av1 ||22 = |(v1∗ A∗ )(Av1 )| = |v1t ((A∗ A)v1 ))| ≤
||v1 ||||A∗ Av1 || ≤ ||A∗ ||2 ||Av1 || = ||A∗ ||2 ||A||2 .
v) Pruébese que para cada matriz A ∈ Mn×m (C) existen matrices unitarias U ∈ U (n) y
V ∈ U (n) tales que
∗ ||A||2 0
U AV = ,
0 A1
donde V ∗ es la transpuesta conjugada de V , A1 ∈ M(n−1)×(m−1) (C) y los ceros rep-
resentan, respectivamente matrices fila o columa de tamaño adecuado ( Hint:Úsese la
ortonormalización de Gram-Schmidt).
Problema 27 (Existencia de Descomposición en Valores Singulares (SVD) para
matrices complejas). Con las notaciones de problema precedente, consideremos el conjunto
Mn×m (C) de matrices n × m con coordenadas complejas y los grupos de matrices unitarias
U (n) y U (m). Consideremos el grupo producto G := U (n) × U (m) con la operación descrita
en el Problema 18 precedente. Definamos la siguiente aplicación :
L : G × Mn×m (C) −→ Mn×m (C)
((U, V ), A) 7−→ U AV ∗ ,
donde V ∗ es la transpuesta conjugada de V . Se pide:
i) Probar que es una acción a izquierda.
ii) Usando el Problema precedente, pruébese que para cada A ∈ Mn×m (C) la órbita de A
por la acción de G satisface que existe una matriz diagonal DA ∈ OG (A)de la forma
siguiente:
 
σ1 0 · · · 0
 0 σ2 · · · 0 
 .. . 0r×(m−r) 
 
DA :=  . . . . .. ,
 
 0 0 · · · σr 
0(n−r)×r 0(n−r)×(m−r)
donde
• Las matrices 0i×j son la matrices nulas de tamaño i × j,
• r = rank(A) es el rango de la matriz A,
• DA ∈ Mn×m (R) (i.e. las cantidades σi están en R) y se tiene
σ1 ≥ σ2 ≥ · · · ≥ σr ≥ 0.
• σ1 = ||A||2 .
iii) Discute la unicidad de los σi ’s en la diagonalización anterior.
A la sucesión σ1 ≥ σ2 ≥ σr se la denomina los valores singulares de la matriz A. y a la
descomposición DA := U AV ∗ se la denomina descomposición en valores singulares, singular
value decomposicition o, simplemente, SVD. Algunos autores, suelen llamar valores signulares
a la sucesión siguiente:
σ1 ≥ · · · σr ≥ σr+1 ≥ · · · ≥ σt ,
donde t := min{m, n} y σi = 0 para r +1 ≤ i ≤ m. Estos autores quieren simplemente enfatizar
el caso r < min{m, n} añadiendo 00 s como valores singulares. Usaremos ambos indistintamente.
Problema 28 (ODE’s y órbitas). Considera la ecuación diferencial con valor inicial sigu-
iente:

ẋ = f (x),
(1.2.3)
x(0) = x0
Donde x := (x1 (t), . . . , xn (t)) son las funciones que buscamos hallar, f : U ⊆ Rn −→ Rn , es una
función de clase C ∞ (U ), definida en un abierto U ⊆ Rn , x0 ∈ Rn y ẋ(t) := (x01 (t), . . . , x0n (t))
es el vertor de las derivadas con respecto a la variable t de las soluciones de la ecuación difer-
encial. Aplicando el Teorema de Existencia y Unicidad de solución (que sirve en nuestro caso),
denotemos por φt (x0 ) := x(t) una solución maximal de (1.2.3), definida para t ∈ Ix0 ⊆ R.
Definamos el conjunto
[
Ω := Ix0 × {x0 } ⊆ R × U.
x0 ∈U
Pruébese que φ está definida en Ω y que:

∂φt
(x0 ) = f (φt (x0 )).
∂t
Pruébese que si 0 ∈ Ix0 , φ0 (x0 ) = x0 y que si s, t ∈ Ix0 son tales que s + t ∈ Ix0 , entonces,
φt+s (x0 ) = φt (φs (x0 )) .
Si Ix0 = R, explica que estas propiedades definen una acción del grupo abeliano (R, +) sobre
Rn , en la que las órbitas de un punto x0 ∈ Rn vienen dads por:
OR (x0 ) := {φt (x0 ) : t ∈ R}.
Busca ejemplos de EDO’s sencillas y trata de determinar las órbitas de los puntos que definen
las condiciones iniciales10.
10En General, los autores de EDO’s no se preopuan en exceso de disponer de todo el grupo (R, +), sino que
consideran (Ix0 , +), que no tiene necesariamente una estructura de grupo abeliano, e igualmente llaman ŕbitas
a los conjuntos que acabamos de definir.
42 1. PRE-ÁLGEBRA
Problema 29. Considérese el anillo de polinomios univariados con coeficientes en un cuerpo

K (K[X], +, ·) y el espacio vectorial de las matrices cuadradas n × n sobre K Mn (K). Se
consider el grupo aditivo (K[X], +) y la acción:
·K[X] : K[X] × Mn (K) −→ Mn (K)
(p(X), A) 7−→ p(A).
Pruébese que para cada elemento A ∈ Mn (K) la órbita por la acción de K[X] es un espacio
vectorial de dimensión a lo sumo n sobre K, i.e.
dimK OK[X] (A) ≤ n.

( Hint: El alumno necesitará conocer la definición de K[X] y usar el Teorema de Hamilton-

Cayley o sucedáneos. Este material está probado con detalle más adelante en este mismo texto).
Problema 30 (Opcional). Lee los dos textos citados al principio del Capı́tulo. Pertenecen
a dos autores distintos y distantes en el tiempo (del segundo he incluido el nombre). Trata de
averiguar qué relación hay entre ellos, completa el poema citado por el primero e indica si el
texto del segundo tiene algo que ver con el Capı́tulo.
1.3. El paradigma de las acciones transitivas y fieles: Sn

1.3.1. Grupo simétrico Sn : Órbitas, ciclos, transposiciones. El paradigma de las
acciones transitivas y fieles de un grupo sobre un conjunto es el caso del grupo simétrico
(S (X), ◦) actuando sobre un conjunto finito no vacı́o. Nos ocuparemos de estudiar ese caso
particular en esta Sección. Demostrar que está generado por tipos especiales de permutaciones,
llamados ciclos y trasposiciones11 que, a su vez, están ligados a las órbitas que se definen sobre
puntos de X. Para no siobrecargar de palabras definiciones y enunciados, en toda la sección,
cuando nos referimos a un conjunto finito X supondremos implı́citamente que es no vacı́o,
aunque no se insista en decirlo.
Si X es un conjunto finito de cardinal n, podemos identificar (mediante biyección) X con el
conjunto [n] := {1, . . . , n} ⊆ N, formado por los n primeros números naturales estrictamente
positivos. Escribamos [0] = ∅ por mantener la notación. Como veremos después, si X e [n] son
biyectables sus respectivos grupos simétricos son isomorfos, por lo que podemos concentrarnos
esencialmente en el grupo simétrico de orden n! como el grupo
Sn = S ([n]) = {σ : [n] −→ [n] : σ es una biyección},
con la composición de aplicaciones. Los elementos de Sn se denominan permutaciones. El
problema esencial en el manejo y estudio de los elementos de Sn es su desmedido cardinal (ver
Problema 31), que es n!. El objetivo esencial es encontrar un conjunto Σ ⊆ Sn lo más pequeño
posible de tal modo que tengamos un morfismo suprayectivo de monoides:
ϕ : (Σ∗ , ·) −→ (Sn , ◦).
En otra palabras, se busca un conjunto generador de Sn lo más pequeño posible. Veremos que
se puede elegir con cardinal n(n−1)
2 , que es una cantidad mucho más pequeña que n!, aunque
no habrá representación única.
Retomemos la noción de órbita de un elemento por la acción de un grupo, ya introducida en la
Definición 12 anterior:
Definición 15 (Órbita de un elemento por la acción de una permutación). Sea X un

conjunto y sea x ∈ X un elemento y sea σ ∈ S (X) una permutación. Definimos la órbita de
x mediante σ como el conjunto:
Oσ (x) := {σ i (x) : i ∈ Z}.
11El diccionario de la RAE parece admitir como sinónimos “trasposición” y “transposición”, por lo que los
usaremos indistintamente.
1.3. EL PARADIGMA DE LAS ACCIONES TRANSITIVAS Y FIELES: Sn 43
Proposición 1.3.1. Sea X un conjunto finito. La órbita de un elemento x ∈ X por cualquier

permutación σ ∈ S (X) es finita y verifica:
(1.3.1) Oσ (x) := {σ k (x) : 0 ≤ k ≤ p − 1},
donde
p := min{k ∈ N : k ≥ 1, σ k ∈ StabS (X) (x)} = min{k ∈ N : k ≥ 1, σ k (x) = x},
y StabS (X) (x) es el estabilizador de x para la acción de natural de S (X) sobre X.
Además, el cardinal de la órbita es precisamente p y diremos que Oσ (x) es una órbita de longitud
p.
Por último, la permutación σ y el punto “inicial” x ∈ X inducen un orden natural entre los
elementos de la órbita Oσ (x) que viene dado mediante:
x < σ(x) < · · · < σ p−1 (x).
Demostración. La finitud de las órbitas es obvia dado que Oσ (x) ⊆ X, luego necesari-
amente es un conjunto finito. En cuanto a p se deduce fácilmente su existencia de la finitud
del orden de la permutación como elemento de un grupo finito. Pero, para facilitar el acceso al
concepto, hacemos una demostración auto-contenida que facilite el acceso a la idea subyacente.
Consideremos p definido como en el enunciado. Como StabS (X) (x) es subgrupo, para cada
q
q ∈ Z, (σ p ) = σ pq ∈ StabS (X) (x). Por tanto, concluimos que para cada q ∈ Z, se tiene:
σ qp (x) = x.
Dado n ∈ Z, hacemos la división euclı́dea en Z de n por p. Tendremos que existe q ∈ Z y existe
k ∈ N tales que:
• 0 ≤ k ≤ p − 1,
• n = qp + k.
Por tanto, se tiene la siguiente cadena de igualdades:
σ n (x) = σ qp+k (x) = σ k (σ qp (x)) = σ k (x).
Lo cual prueba la igualdad (1.3.1).
Para finalizar, queda simplemente por probar que los elementos de la forma σ k (x), con 0 ≤
k ≤ p − 1 son todos distintos. Para probarlo, consideremos k y k 0 , con 0 ≤ k, k 0 ≤ p − 1.
0 0
Si σ k (x) = σ k (x), supongamos que k ≥ k 0 . Como σ es una biyección, también lo será σ k y
concluiremos que
0
0
0 0
σ k (x) = σ k σ k−k (x) = σ k (x) =⇒ σ k−k (x) = x.
0
Luego k − k 0 ≤ p − 1 es tal que σ k−k ∈ StabS (X) (x) y p es la mı́nima potencia de σ que le hace
estar en el estabilizador StabS (X) (x). La única posibilidad es que k−k 0 = 0 o, equivalentemente,
k = k0 .
En cuanto a la relación de orden sobre Oσ (x) es obvia y natural dado que todos los elementos
descritos son distinto entre sı́.
Corolario 1.3.2. Con las notaciones de la Proposición anterior, dados x, y ∈ X, se tiene que
Oσ (x) ∩ Oσ (y) 6= ∅ ⇐⇒ Oσ (x) = Oσ (y).
En particular, las órbitas definen una relación de equivalencia sobre [n], cuyas clases de equiv-
alencia son precisamente las órbitas. Más aún, para cada x ∈ X y cada órbita Oσ (x) definida
por algún elemento σ ∈ S (X), se tiene que
σ(X \ Oσ (x)) ⊆ (X \ Oσ (x)).
Y la restricción de σ a X \ Oσ (x) es una permutación de X \ Oσ (x), i.e. σ |X\Oσ (x) ∈ S (X \
Oσ (x)).
Demostración. No es sino la traducción al caso de permutaciones de la Proposición 1.2.25
anterior. El resto de afirmaciones son obvias.
44 1. PRE-ÁLGEBRA
Observación 1.3.3 (Subconjuntos de [n] con un orden). Las órbitas definidas por una
permutación σ ∈ S (X) sobre un punto son subconjuntos de X con una relación de orden
inducida por la propia permutacón. Consideremos ası́ subconjuntos de un conjunto finito X
con un orden implı́cito. Para denotarlos consideraremos subconjuntos S ⊆]n] descritos mediante
la expresión:
S = {x1 < x2 < . . . < xs }.
Definición 16 (Ciclo). Sea X un conjunto finito y sea τ : X −→ X una permutación sobre

X. Decimos que τ es un ciclo de orden k (o k−ciclo) si existe un conjunto finito ordenado
O := {x1 < · · · < xk } ⊆ X de cardinal k verificando las propiedades siguientes:
i) La órbita de τ sobre x1 verifica:
Oτ (x1 ) = O.
ii) El orden en Oτ (x) es el inducido por la permutación τ , esto es, xi+1 = τ (xi ) = τ i (x1 ),
para 0 ≤ i ≤ k − 1, con τ (xk ) = x1 .
iii) Para todo y ∈ X \ {x1 , . . . , xk }, τ (y) = y, es decir,

τ X\O = IdX .

X\O
Al conjunto ordenado O se le denomina órbita distinguido del ciclo τ . A los 2−ciclos se les
denomina transposiciones.
Notación 1.3.4 (Notación usual para los ciclos). Un ciclo σ : [n] −→ [n] lleva intrı́n-
secamente implı́cito una ordenación sobre los elementos de la órbita de un punto x. La órbita
fue definida como conjunto, pero el ciclo impone una ordenación. Por ello, se suele utilizar
la notación vectorial (x1 x2 · · · xk ) para describir un ciclo como en la definición precedente..
Ası́, por ejemplo, tomando I5 := {1, 2, 3, 4, 5}, el ciclo de orden 3 descrito mediante (4 3 1),
representa la permutación

1 2 3 4 5
.
4 2 1 3 5
Obsérvese que la identidad es el único ciclo de orden 1.
Observación 1.3.5 (Ciclos con órbitas distinguidas disjuntas conmutan entre sı́).
Supongamos dados dos ciclos τ1 y τ2 con órbitas distinguidas O1 y O2 respectivamente. Supong-
amos que O1 ∩ O2 = ∅. Entonces,
τ1 ◦ τ2 = τ2 ◦ τ1 .
Es una propiedad de sencilla verificación a partir de la definición de ciclo.
Proposición 1.3.6 (Órbitas y Ciclos). Sea X un conjunto finito y sea S (X) el grupo de las
permutaciones sobre X. Se tiene:
i) Dada una permutación σ ∈ S (X), y dado x ∈ X, sea O := Oσ (x) la órbita que
determinan σ y x, con el orden inducido por la permutación σ. Supongamos que la
órbita O es de cardinal p. Entonces, existe un único p−ciclo τO ∈ S (X) tal que:

τO O = σ, τO X\O = IdX\O .
Es decir, τO sobre O se comporta como σ y τO sobre el complementario X \ O se

comporta como la identidad.
ii) Dado un ciclo τ ∈ S (X) de orden mayor o igual que 2, hay una órbita distinguida de
cardinal igual al orden del ciclo y que es dada por la propiedad:
Oτ (x) = {y ∈ X : τ (y) 6= y}.
El resto de las órbitas tienen cardinal 1.
Demostración. Veamos cada afirmación separadamente.
i) Para la primera afirmación, si p ∈ N es el mı́nimo entero tal que σ p ∈ StabS (X) (x)
basta con observar que la órbita toma la forma:
Oσ (x) := {x1 := x := σ 0 (x), x2 = σ 1 (x1 ), . . . , xp = σ p−1 (x1 ) = σ(xp−1 )},
y, además, σ(xp ) = x1 . Como se ha observado anteriormente, el conjunto O := Oσ (x)
tiene un orden natural inducido por σ:
O := Oσ (x) := {x1 < x2 < . . . < xp }.
Definamos, con estas notaciones, τO como el ciclo siguiente:
τO := (x1 x2 x3 · · · xp ).
Claramente, tenemos las propiedades indicadas, dado que
• τO (xi ) = xi+1 = σ(xi ), para cada i, 1 ≤ i ≤ p − 1,
• τO (y) = y para todo y ∈ X \ O,
• τO (xp ) = x1 = x = σ(xp )).
Es claro también que τO es único dado que σ y x1 = x lo definen completamente.
ii) Para la segunda afirmación, basta con reproducir la definición de ciclo. Si σ ∈ S (X)
es un ciclo de orden p es porque existe x ∈ X tal que la órbita O := Oσ (x) tiene
cardinal p y verifica:
Oσ (x) = {x1 := x = σ 0 (x), σ 1 (x), . . . , σ t−1 (x)},
y σ p (x) = x. Adicionalmente, σ |X\O = Id. Por tanto τO satisface las propiedades
descritas en ii).

Observación 1.3.7. La anterior Proposición nos indica que existe una biyección entre las
órbitas (ordenadas y definidas por una permutación) y los ciclos que, además, transforma
cardinal de las órbitas en orden de ciclo.
Proposición 1.3.8. Dados X e Y dos conjuntos finitos del mismo cardinal, entonces, los re-
spectivos grupos de permutaciones (S (X), ◦) y (S (Y ), ◦) son isomorfos como grupos. Más aún,
el isomorfismo respeta ciclos, órbitas, órdenes de ciclos y longitud de las órbitas. Recı́procamente,
si estos grupos de permutaciones son isomorfos, entonces X e Y son biyectables y, por tanto,
tienen el mismo cardinal.
Demostración. Supongamos que existe f : X −→ Y una biyección entre los conjuntos
X e Y (o, lo que es lo mismo, que tienen el mismo cardinal). Entonces, podemos definir una
transformación:
f ∗ : S (X) −→ S (Y )
σ 7−→ f ◦ σ ◦ f −1 ,
donde f −1 : Y −→ X es la inversa de f (que existe por ser f biyección) y f ◦ σ ◦ f −1 : Y −→ Y
es la composición de estas tres aplicaciones, es decir,
f ◦ σ ◦ f −1 (y) = f (σ(f −1 (y))), ∀y ∈ Y.
Es claro que f ∗ es una biyección cuya inversa es la aplicación:
f∗ : S (Y ) −→ S (X)
τ 7−→ f −1 ◦ τ ◦ f.
Es decir, se verifica:
f ∗ ◦ f∗ = IdS (X) , f∗ ◦ f ∗ = IdS (Y ) .
Es claro también (mera verificación) que tanto f ∗ como f∗ son morfismos de grupo, con lo que
queda probado que S (X) y S (Y ) son isomorfos. En cuanto al hecho de que se preserven los
ciclos y las órbitas, simplemente se trata de verificar que si σ ∈ S (X) es un ciclo de orden k,
entonces f ∗ (σ) es un ciclo del mismo orden. Y lo mismo sucede para τ ∈ S (Y ) y f∗ (τ ). En
cuanto a las órbitas, se tiene la identidad siguiente:
f (Oσ (x)) = Of ∗ (σ) (f (x)),
46 1. PRE-ÁLGEBRA
para cada x ∈ X y para cada σ ∈ S (X). Basta con escribir las identidades respectivas y
comprobar. Lo mismo se puede hacer con las órbitas de todo elemento y ∈ Y y toda permutación
τ ∈ S (Y ). Para la última afirmación del enunciado. Recuérdese, antes de nada, que decir “
X es un conjunto finito de cardinal n ∈ N” es lo mismo que decir que existe una biyección
entre X e [n] para algún n ∈ N”. Por tanto, S (X) será isomorfo al grupo Sn de orden n!.
En particular, si dos grupos S (X) y S (Y ) son isomorfos, ambos tendrán el mismo cardinal
(por ser biyectivos) y dicho cardinal coincidirá con algún n!. Pero, entonces, necesariamente, los
cardinales de X y de Y han de ser iguales a n ∈ N y esto significa que X e Y son biyectables.
Teorema 1.3.9. Toda permutación sobre un conjunto finito es composición de un número finito
de ciclos con óribtas disntiguidad dos a dos disjuntas y de orden mayor o igual que 2. Es decir,
dada σ ∈ Sn una permutación, existe una presentación de σ como producto finito:
(1.3.2) σ = τO1 ◦ · · · ◦ τOr ,
de tal modo que:
i) Para cada i, 1 ≤ i ≤ r, ](Oi ) ≥ 2 (luego τOi es un ciclo de orden mayor o igual que
dos).
ii) Dados i, j ∈ [r] tales que i 6= j, entonces Oi ∩ Oj = ∅.
Más aún, la descomposición descrita en (1.3.2), con las condiciones i) y ii) es única, salvo
permutación de los ciclos que aparecen en ella.
Demostración. Supongamos X nuestro conjunto finito y sea σ ∈ S (X) una permutación
sobre un conjunto finito X. Por lo descrito en el apartado iii) de la Proposición 1.2.25, las
órbitas de σ sobre elementos de X definen una relación de equivalencia sobre X. En particular,
como X es finito, existe una partición de X de la forma siguiente:
X = O1 ∪˙ · · · ∪O
˙ s,
donde la unión es disjunta y cada Oi := Oσ (xi ) es la órbita de algún elemento xi ∈ X. Además,
conforme a la Proposición 1.3.1 esas órbitas tienen inducida una ordenación natural a partir de
σ. Esto nos permite considerar los conjuntos Oi ordenados mediante:
Oi = {xi < σ(xi ) < · · · < σ pi −1 (xi )}.
Aplicando la Proposición 1.3.6, podemos considerar los ciclos τOi allı́ descritos y que verifican:
• La permutación σ satisface:

σ Oi = τOi Oi ,
• El ciclo es la identidad fuera de su órbita:

τOi X\O = IdX .

i X\Oi
Es decir, consideramos el ciclo:

τOi = xi σ(xi ) · · · σ pi −1 (xi ) ∈ Sn .

Veamos que se tiene:

(1.3.3) σ = τO1 ◦ · · · ◦ τOs .
Obsérvese, además, que estos ciclos conmutan entre sı́ por tener órbitas distinguidas disjuntas
(ver Observación 1.3.5). Es decir, sabemos que
τOi ◦ τOj = τOj ◦ τOi , ∀ i, j ∈ [s].
Ahora, dado x ∈ X, existe un único i tal que x ∈ Oi (las órbitas son disjuntas dos a dos, por
formar una partición de X). Entonces,

σ(x) = σ (x) = τOi (x) = τOi (x),
Oi Oi
y, además, para j 6= i, se tiene:
τOj Oi (x) = x.
Por tanto, para x ∈ Oi , dado que estos ciclos permutan entre sı́, se prueba de modo elemental
que:

τO1 ◦ · · · ◦ τOs (x) = τOi ◦ τO1 ◦ · · · ◦ τOi−1 ◦ τOi+1 ◦ · · · ◦ τOs (x) = τOi (x) = σ(x).
Como todos los elementos de X deben estar en alguna órbita, se tiene la Igualdad (1.3.3).
Seguidamente, podemos suponer, salvo ordenación de los ı́ndices, que existe r ≤ s tal que:
i) ](Oi ) ≥ 2, para cada i ∈ {1, . . . , r},
ii) ](Oj ) = 1, para cada j tal que r + 1 ≤ j ≤ s.
Consideremos el conjunto
A = O1 ∪˙ · · · ∪O
˙ r ⊆ X.
que es una unión disjunta de las órbitas de σ de cardinal mayor o igual que 2. Observemos que
para i ∈ {1, . . . , r}, se tiene:

(1.3.4) σ
X\A
= IdX
X\A
= τO
i X\A
= τO ◦ · · · τO
1 r
.
X\A
La razón tiene que ver con el cardinal de las órbitas de los elementos x 6∈ A. Si un elemento
x 6∈ A, entonces su órbita Oσ (x) debe ser una de las órbitas Or+1 , . . . , Os , que son órbitas
de cardinal 1. Entonces ](Oσ (x)) = 1 o, equivalentemente, Oσ (x) = {x}, lo que significa que
σ(x) = x.
De otro lado, para j ∈ {r + 1, . . . , s}, se tiene que

τOj A = IdX ,

A
porque A ∩ Oj = ∅ para j ∈ {r + 1, . . . , s}. Por tanto, concluimos que:

(1.3.5) σ A = τO1 ◦ · · · ◦ τOs A = τO1 ◦ · · · ◦ τOr A .
Juntando las igualdades (1.3.4) y (1.3.5), concluimos que
σ = τO1 ◦ · · · ◦ τOr .
Y tenemos probada la primera afirmación del enunciado relativa la existencia de tal descom-
posición.
Deajamos al inteligente lector la verificación de que una descomposición como la descrita en

(1.3.2), satisfaciendo las propiedades i) y ii), ha de ser única, salvo permutación de las órbitas
distinguidas. De hecho, con una tal descomposición, las órbitas de cardinal mayor o igual que
2 se σ sobre puntos de X han de ser exacta,emte las órbitas distinguidas {O1 , . . . , Or }.
Observación 1.3.10 (La representación por ciclos, aunque con cierta unicidad, no es
suficiente para expresar las permutaciones). A pesar de la unicidad mostrada en el antrior
resultado, no es satisfactorio para poder decir que disponemos de una buena representación
del grupo de las permutaciones Sn mediante las órbitas que definen. La dificultad de esta
representación de las permutaciones es que si bien hay n! permutaciones y hay menos ciclos que
permutaciones, el número de ciclos sigue siendo una cantidad esponencial en n y no resulta un
gran salto cualitativos representar permutaciones mediante un alfabeto de cardinal exponencial
en n. De ahı́ que se busque en un conjunto de menor cardinal para representar las permutaciones
y por eso se restringe la búsqueda a las transposiciones que exhibimos a continuación.
Definición 17 (Transposiciones adyacentes). Consideremos X = [n] := {1, . . . , n}. Lla-

maremos transposiciones adyacentes a todas las transposiciones (i j) ∈ S ([n]), tales que
i ∈ {1, . . . , n − 1} y j = i + 1.
Observación 1.3.11. Nótese que la transposición (i i + 1) = (i + 1 i), con lo que la definición

anterior incluye como transposiciones adyacentes tanto (1 2), (2 3) como (2 1), (3 2) por ser las
mismas. En particular, si X = [n] las únicas transposiciones adyacentes son:
(1 2), (2 3), . . . , (n − 1 n).
Teorema 1.3.12. Se verifican las siguientes propiedades:

i) Toda permutación sobre un conjunto finito es una composición finita de transposi-
ciones.
ii) Toda permutación sobre [n] es una composición finita de transposiciones adyacentes.
De hecho, toda transposición es composición de un número impar de transposiciones
adyacentes.
48 1. PRE-ÁLGEBRA
En particular, el conjunto de las transposiciones es un conjunto de generadores del grupo

simétrico, Más aún, para cualquier conjunto finito X y para cada biyección f : X −→ [n],
el grupo S (X) está generado por las permutaciones adyacentes.
Demostración. i) Por lo visto en el Teorema 1.3.9, basta con que probemos que
los ciclos de cualquier orden se pueden dar como composición finita de transposiciones.
Lo haremos por inducción en el orden.
Dado un ciclo de orden 3 (x1 x2 x3 ) podemos reescribirlo como la composición de dos
transposiciones:
(x1 x2 x3 ) = (x1 x3 ) ◦ (x1 x2 ).
Para un ciclo de orden r, (x1 x2 · · · xr ), tenemos que
(x1 x2 · · · xr ) = (x1 x3 · · · xr ) ◦ (x1 x2 ),
y la propiedad se sigue por inducción. Verificar esta igualdad es inmediato y el lector
puede hacerlo por su cuenta. Obsérvese que el número de transposiciones es igual al
orden del ciclo (ver Problema 34 más abajo).
ii) Para la segunda afirmación basta con que probemos que toda transposición es com-
posición de un número impar de transposiciones adyacentes. La demostración es
evidente dado que
(k l) = (k k + 1) ◦ (k + 1 k + 2) ◦ · · · (l − 1 l) ◦ (l − 1 l − 2) ◦ · · · ◦ (k + 1 k).
El número de transposiciones adyacentes es (k − l) + (k − l) − 1 = 2(k − l) − 1.

Observación 1.3.13. Dado el conjunto finito Σ := {(i, j) : i < j}. Es fácil verificar que Σ es
un conjunto cuyo cardinal satisface:
n−1
X n(n − 1)
](Σ) = r= .
r=1
2
El anterior resultado simplemente significa que tenemos un morfismo suprayectivo de monoides:
ϕ : (Σ∗ , ·) −→ (Sn , ·).
donde a cada par (i, j) se le asigna la transposición ϕ((i, j)) := (i j). Hemos reducido el número
de elementos de Sn con los que “representar” las permutaciones, pero, a cambio, hemos perdido
la unicidad que suponı́a disponer de la presentación mediante ciclos asociados a las órbitas.
Obviamente, se tiene que la identidad puede representarse de varias formas mediante producto
de transposiciones (si n ≥ 3):
Id = (1 2)(1 2) = (1 3)(1 3) = (2 3)(2 3).
[n]
Es decir, resulta más difı́cil controlar la forma de expresar el cociente Σ∗ / ∼∼

= Sn . En nuestra
ayuda viene la noción de ı́ndice de una permutación que trataremos en la sección siguiente.
Al menos podremos controlar una cierta cualidad de las transposiciones usadas: su paridad es
independiente de la representación elegida.
1.3.2. Índice de una permutación. Daremos dos presentaciones de esta noción de

ı́ndice. Una que viene dada de forma “interna”, teniendo en cuenta cómo se articulan las trans-
posiciones en la descomposición de la identidad. La segunda tendrán en cuenta cómo las trans-
posiciones suponene un cambio de “orden” de los elementos del conjunto X = [n] = {1, . . . , n}.
1.3.2.1. Índice por la naturaleza de la identidad. Comencemos probando el sigu-
iente resultado que prueba que, por la naturaleza intrı́nseca de la identidad, el número de
transposiciones que aparecen en ella tiene que ser par.
Teorema 1.3.14 (Paridad de transposiciones de la Identidad). Con las notaciones prec-
dentes, sea Id[n] ∈ Sn la identidad sobre [n] y supongamos que existe una descomposición
(1.3.6) Id
[n]
:= σ1 · · · σr ,
donde cada σ` ∈ Sn es una transposición de orden 2. Entonces, r es un número par.
Demostración. Razonaremos por inducción en r (la menos elegante de las formas de de-
mostración). Es claro que si r = 1, no puede existir una descomposición del tipo que se exhibe
en la Identidad (1.3.6). Pues si tal descomposición existiera, tendrı́amos Id[n] = σ1 , donde σ1
es una transposición de orden 2. Por tanto, tiene que haber un i ∈ {1, . . . , n} tal que σ1 (i) 6= i
(i.e. σ1 = (i j) con j 6= i). Pero esto es imposible si Id[n] = σ1 . El caso r = 2 siendo obvio,
analicemos el caso de cualquier r.
Supongamos, por hipótesis inductiva, que el enunciado es cierto para cualquier r < t y consid-
eremos una descomposición:
[n] := σ1 · · · σt ,
donde cada σi es una transposición de orden 2. Consideremos la última de las transposiciones σt
y debe existir un ı́ndice i ∈ {1, . . . , n} tal que σt (i) 6= i (es decir, suponemos que σt = (i j) para
algún j 6= i). Consideremos el subconjunto S(i) ⊆ {1, . . . , r} dado por los número naturales
m ∈ {1, . . . , t} tales que se verifican la siguiente propiedad:
Existen transposiciones ρm , ρm+1 , . . . , ρt tales que:
• Id[n] = σ1 σ2 · · · σm−1 ρm · · · ρt .
• Para cada ` con m + 1 ≤ ` ≤ t, ρ` (i) = i.
• ρm (i) 6= i.
Nótese que S(i) 6= ∅ porque t ∈ S(i):
simplemente obsérvese la descomposición Id[n] := σ1 · · · σt de la que hemos partido.
Ahora consideremos s = min S(i), el menor de esos elementos en S(i). Observamos que,
necesariamente, s ≥ 2. Porque si s = 1, entonces 1 ∈ S(i) y tendrı́amos una descomposición de
la identidad
Id = ρ1 ρ2 · · · ρt ,
[n]
donde ρ` (i) = i para ` ≥ 2, mientras que ρ1 (i) 6= i. Entonces, tendrı́amos la siguiente con-
tradicción:
i = Id[n] (i) = ρ1 ◦ ρ2 ◦ · · · ◦ ρt (i) = ρ1 (i) 6= i.
Dado que s ≥ 2, tenemos una presentación de Id[n] de la forma siguiente:
Id
[n]
= σ1 σ2 · · · σs−1 ρs · · · ρt .
Supongamos que ρs = (i j), con inot = j y consideremos las distintas posibilidades para el
producto σs−1 ρs :
• Supongamos σs−1 = (i k). En ese caso observamos que:
σs−1 ρs = (i k)(i j) = (i j)(j k),
con lo que tenemos la descomposición:
Id
[n]
= σ1 σ2 · · · σs−2 ρs (j k)ρs+1 · · · ρt .
Esto significa que s − 1 ∈ S(i), lo cual contradice la minimalidad de s y es imposible.

• Supongamos que σs−1 = (j k), con k 6= i, j. En ese caso observamos que:
σs−1 ρs = (j k)(i j) = (i k)(j k),
con lo que tenemos la descomposición:
Id
[n]
= σ1 σ2 · · · σs−2 (i k)(j k)ρs+1 · · · ρt .
Esto significa que s − 1 ∈ S(i), lo cual contradice la minimalidad de s y es, de nuevo,

imposible.
• σs−1 = (u k), con u, k 6∈ {i, j}. En ese caso, observamos que:
σs−1 ρs = (u k)(i j) = (i j)(u k) = ρs σs−1 ,
porque son transposiciones disjuntas y, por tanto, conmutan. Por tanto, tenemos una
descomposición
Id
[n]
= σ1 σ2 · · · σs−2 ρs (u k)ρs+1 · · · ρt .
Esto significa, finalmente, que s − 1 ∈ S(i) contradiciendo la minimalidad de s.

50 1. PRE-ÁLGEBRA
De los tres casos anteriores, deducimos que tenemos una descomposición:

Id
[n]
= σ1 σ2 · · · σs−1 ρs · · · ρt ,
donde ρs = (i j), ρ` (i) = i, para s + 1 ≤ ` ≤ t y, además, σs−1 = (u1 u2 ) no está en ninguno
de los tres casos precedentes. pero esos significa que {u1 , u2 } = {i, j} o, equivalentemente,
σs−1 = (i j). Por tanto, σs−1 ρs = (i j)(i j) = Id[n] . Ası́, tendrmoes una descomposición de la
identidad con la forma:
Id = σ1 σ2 · · · σs−2 ρs+1 · · · ρt ,
[n]
donde todas las permutaciones que aparecen son transposiciones y hay t − 2 transposiciones.
Por hip’otesis inductiva, tendremos que t − 2 ∈ 2N y, en consecuencia, t es un número par.
Definición 18 (Índice de una permutación). La siguiente correspondencia se denomina

ı́ndice de una permutación :
I : Sn −→ Z× = {±1}
σ 7−→ (−1)m ,
donde σ admite una descomposición σ := ρ1 · · · ρm , donde ρ` son transposiciones de orden 2.
Nótese que la dificultad con esta correspondencia I consiste en probar que es una aplicación.
Es decir,
Teorema 1.3.15 (El ı́ndice es un morfismo de grupos). La correspondencia I es un
morfismo de grupos.
Demostración. Comencemos probando que I está bien definida. Esto es, comencemos
probando que, dado σ ∈ Sn , entonces dadas dos descomposiciones de σ como producto de
transposiciones
σ = ρ1 · · · ρm = τ1 · · · τs ,
entonces m = s mod 2. La razón es el Teorema 1.3.14 precedente. Estas dos descomposiciones
inducen una descomposición de la identidad en producto de m + s transposiciones (recuŕdese
que la inversa de una transposición es una transposición):
Id
[n]
= ρ1 · · · ρm τ1−1 · · · τs−1 ,
con lo que m + s ∈ 2N y m = s mod 2. En conclusión, (−1)m = (−1)s y, por tanto, I está
bien definida.
Es casi inmediato probar que, entonces, es morfismo de grupos dado que se comporta como la
adjunaicón de palabras, es decir, si tenemos
σ = ρ1 · · · ρm , τ = τ1 · · · τs ,
entonces,
I(στ ) = I(ρ1 · · · ρm τ1 · · · τs ) = (−1)m+s = I(σ)I(τ ).
En cuanto a la identidad, el Teorema precedente indica que I(Id[n] ) = 1.
1.3.2.2. Índice de una permutación por alteración del orden (Alternativo).

En esta subsección mostraremos una prueba alternativa de los mismos hechos. Pero, en este
caso, no haremos una prueba por inducción sino que contaremos con un elemento externo.
Como en la subsección precedente, consideremos en esta Subsección X = [n] = {1, . . . , n} y el
grupo simétrico Sn . Consideremos el conjunto de pares de elementos de [n] siguiente:
A := {(i, j) ∈ [n]2 : i < j}.
Nótese que el cardinal de A satisface:
n(n − 1)
](A) = 1 + 2 + · · · + (n − 1) = .
2
Para una permutación σ ∈ Sn , obtendremos una descomposición de A en dos subconjuntos
disjuntos [
A = A+ (σ) A− (σ),
donde
A+ (σ) := {(i, j) ∈ A : σ(i) < σ(j)}, A− (σ) := {(i, j) ∈ A : σ(i) > σ(j)}.
Los elementos de A− (σ) se llaman inversiones de la permutación σ. Denotaremos por
N+ (σ) := ](A+ (σ)), N− (σ) := ](A− (σ)),
y al número N− (σ) se le llama el número de inversiones de la permutación σ.
Observación 1.3.16. Las siguientes propiedades son obvias de verificar:
i) Si Id[n] ∈ Sn es la identidad, N− (Id[n] ) = 0.
ii) Para cualquier transposición σ ∈ Sn , se tiene N− (σ) = 1.
Definición 19 (Índice de una Permutación (alternativo)). Con las anteriores nota-
ciones, se llama ı́ndice de una permutación σ ∈ Sn al elemento del grupo multiplicativo
Z× := {+1, −1}, dado mediante:
N− (σ)
ι(σ) := (−1) ∈ Z× .
Teorema 1.3.17. El ı́ndice ι define un morfismo de grupos:
ι: (Sn , ◦) −→ (Z× , ·)
N (σ)
σ 7−→ ι(σ) := (−1) − ,
donde la operación · sobre Z× es la multiplicación. En otras palabras, se verifican las dos
propiedades siguientes:
i) ι(Id[n] ) = 1 ∈ Z× ,
ii) Para todo par de permutaciones σ, τ ∈ Sn , se tiene:
ι(σ ◦ τ ) = ι(σ) · ι(τ ).
Demostración. Nótese que se trata de probar simplemente que para todo par de per-
mutaciones σ, τ ∈ Sn , se tiene:
ι(σ ◦ τ ) = ι(σ) · ι(τ ).
Obsérvese, además, que esta propiedad es equivalente a probar que
N− (σ ◦ τ ) = N− (σ) + N− (τ ), mod 2.
Para ello, comencemos definiendo los conjuntos siguientes para una permutación σ fijada:
τ + (A+ (τ )) = {(τ (i), τ (j)) : (i, j) ∈ A+ (τ )},
τ − (A− (τ )) = {(τ (j), τ (i)) : (i, j) ∈ A− (τ )}.
Comencemos observando que
[
A = τ + (A+ (τ )) τ − (A− (τ )),
siendo ésta una unión disjunta. La razón es obvia, dado (i, j) ∈ A, han de existir i1 , j1 ∈ [n]
tales que i = τ (i1 ), j = τ (j1 ). Ahora se tiene:
• Si i1 < j1 , como (i, j) ∈ A (i.e. i < j), entonces (i1 , j1 ) ∈ A+ (τ ) y, por tanto,
(i, j) = (τ (i1 , τ (j1 )) ∈ τ + (A+ (τ )).
• Si i1 > j1 , como (i, j) ∈ A (i.e. i < j), entonces (j1 , i1 ) ∈ A− (τ ) y, por tanto,
(i, j) = (τ (j1 ), τ (i1 )) ∈ τ − (A− (τ )).
De otro lado, como τ es una biyección, es fácil concluir que los cardinales verifican:
N+ (τ ) = ](τ + (A+ (τ ))), N− (τ ) = ](τ − (A− (τ ))).
Ahora, consideremos los siguientes cuatro conjuntos disjuntos dos a dos y sus cardinales:
• El conjunto A++ (σ, τ ), de cardinal N++ (σ, τ ) = ](A++ (σ, τ )), dado mediante:
A++ (σ, τ ) := {(i, j) ∈ A+ (σ) : (i, j) ∈ τ + (A+ (τ ))}.
• El conjunto A+− (σ, τ ), de cardinal N+− (σ, τ ) = ](A+− (σ, τ )), dado mediante:
A+− (σ, τ ) := {(i, j) ∈ A+ (σ) : (i, j) ∈ τ − (A− (τ ))}.
• El conjunto A−+ (σ, τ ), de cardinal N−+ (σ, τ ) = ](A−+ (σ, τ )), dado mediante:
A−+ (σ, τ ) := {(i, j) ∈ A− (σ) : (i, j) ∈ τ + (A+ (τ ))}.
52 1. PRE-ÁLGEBRA
• El conjunto A−− (σ, τ ), de cardinal N−− (σ, τ ) = ](A−− (σ, τ )), dado mediante:
A−− (σ, τ ) := {(i, j) ∈ A− (σ) : (i, j) ∈ τ − (A− (τ ))}.
Las siguientes propiedades son de mera comprobación:
[
A+ (σ ◦ τ ) = A++ (σ, τ ) A−− (σ, τ ),
[
A− (σ ◦ τ ) = A+− (σ, τ ) A−+ (σ, τ ),
[
A+ (σ) = A++ (σ, τ ) A+− (σ, τ ),
A− (σ) ∼
[
= A−+ (σ, τ ) A−− (σ, τ ),
τ + (A+ (τ )) ∼
[
= A++ (σ, τ ) A−+ (σ, τ ),
τ − (A− (τ )) ∼
[
= A+− (σ, τ ) A−− (σ, τ ),
donde ∼= significa biyectables. Obsérvese, como pista esencial, que
A− (σ) = {(i, j) ∈ τ + (A+ (τ )) : σ(i) > σ(j)} ∪ {(i, j) ∈ τ − (A− (τ )) : σ(i) > σ(j)}.
Y que esta identidad induce la biyección señalada porque se tienen biyecciones siguientes:
ϕ : A−+ (σ, τ ) −→ {(i, j) ∈ τ + (A+ (τ )) : σ(i) > σ(j)}
(i1 , j1 ) 7−→ (τ (i1 ), τ (j1 )).
ψ: A−− (σ, τ ) −→ {(j, i) ∈ τ − (A− (τ )) : σ(i) > σj }
(i1 , j1 ) 7−→ (τ (j1 ), τ (i1 )).
Con estas identidades conjuntistas de fácil verificación, obtenemos (entre otras) las siguientes
relaciones entre los cardinales:
N− (σ) = N−+ (σ, τ ) + N−− (σ, τ ),
N− (τ ) = ](τ − (A− (τ )) = N+− (σ, τ ) + N−− (σ, τ ),
N− (σ ◦ τ ) = N+− (σ, τ ) + N−+ (σ, τ )
Sumando las dos primeras identidades obtenemos
N− (σ)+N− (τ ) = N−+ (σ, τ )+N−− (σ, τ )+N+− (σ, τ )+N−− (σ, τ ) = N−+ (σ, τ )+N−− (σ, τ )+2(N−− (σ, τ )).
Por tanto, tenemos
N− (σ) + N− (τ ) = N− (σ ◦ τ ) + 2(N−− (σ, τ )),
y esto último implica:
N− (σ◦τ ) N− (σ)+N− (τ )
ι(σ ◦ τ ) = (−1) = (−1) = ι(σ) · ι(τ ),
que es la identidad buscada.
Corolario 1.3.18. Sea σ ∈ Sn una permutación se tiene la siguiente igualdad entre las dos
nociones de ı́ndice antes definidas:
ι(σ) = I(σ).
Demostración. Es evidente, por ser ambas un morfismo de grupos y porque para cada
transposición τ , se tiene ι(τ ) = I(τ ) = −1. Es decir, dada una descomposición de σ mediante
transposiciones:
σ = τ1 · · · τm ,
tendremos que, por ser ι un morfismo de grupos se tendrá:
m
Y
ι(σ) = ι(τi ) = (−1)m = I(σ),
i=1
donde I(σ) es el ı́ndice definido en la sección precedente.
Corolario 1.3.19. Sea X un conjunto finito cualquiera, entonces dadas dos representaciones
de una permutación σ ∈ S (X) como composición de transposiciones en X:
σ = τ1 ◦ τ2 ◦ · · · ◦ τr = ρ1 ◦ ρ2 ◦ · · · ◦ ρm ,
se tiene que r = m mod 2.
Demostración. Basta con usar el isomorfismo de S (X) con un Sn cualquiera.

Esta forma de ver el ı́ndice de una permutación como algo que depende solamente del número
de transposiciones implicadas, permite generalizar la noción de ı́ndice para un conjunto finito
cualquiera X del modo siguiente.
Definición 20 (Índice de una permutación de un conjunto cualquiera). Sea X un
conjunto finito cualquiera y sea σ ∈ S (X) una biyección de X. Llamamos ı́ndice de σ al valor
I(σ) := (−1)m ,
donde σ admite una descomposición como producto de m transposiciones de X.
Observación 1.3.20. Obsérvese que el ı́ndice ası́ definido tambiéon define un morfismo de
grupos:
I : (S (X), ◦) −→ (Z× , ·)
σ 7−→ I(σ).
1.3.3. Ejercicios y problemas la Sección 1.3.

Problema 31. Se pide:
i) Pruébese que (Sn , ◦) es un grupo (es decir, verificar que ◦ está bien definida como
aplicación (i.e. que es operación interna) y que verifica la propiedad asociativa, que
posee elemento neutro y que todo elemento posee un inverso).
ii) Probad que el cardinal ](Sn ) = n! (Pista: por inducción en n).
Problema 32. Para un conjunto X, el grupo simétrico S (X) define una acción natural sobre
X. Probar que esa acción es transitiva y fiel.
Problema 33. Verificar todos los detalles de la demostración de la Proposición 1.3.8. Es decir,
todas las identidades entre conjuntos y aplicaciones no probadas con detalle y las afirmaciones
como f ∗ y f∗ son morfismos de grupo, etc.
Problema 34. Sea X un conjunto finito y consideremos un ciclo de orden r en S (X). Hay
que probar que ese ciclo puede ser dado como la composición de r − 1 transposiciones. (Pista:
Por inducción en r).
Problema 35. Consideremos [n] := {1, . . . , n}, el grupo simétrico Sn y escribamos τi para la
transposición adyacente τi := (i i + 1). Prueba que se verifican las siguientes propiedades:
i) τi2 = Id[n] ,
ii) τi ◦ τi+1 ◦ τi = τi+1 ◦ τi ◦ τi+1 .
iii) τi ◦ τj = τj ◦ τi , siempre que |i − j| ≥ 2.
Problema 36. Prueba que el ı́ndice de una permutación σ ∈ S (X), siendo X un conjunto
finito, es invariante por biyecciones de X con conjuntos finitos de la forma [n].
Problema 37. Pruébese que el conjunto de todas las permutaciones en Sn que tienen ı́ndice
1 es un subgrupo normal de Sn . A este subgrupo se le conoce como el subgrupo alternado y se
denota por An ⊆ Sn . Pruébese que An es un subgrupo normal de Sn y se verifica:
Sn /An ∼= Z/2Z.
Problema 38. Sea O(n) el grupo de las matrices ortogonales n × n con coordenadas reales y
sea SO(n) es grupo especial ortogonal de las matrices orotogonales con determinante 1. Probad
que SO(n) es un subgrupo normal de O(n) y que se verifica el siguiente isomorfismo de grupos:
O(n)/SO(n) ∼ = Z/2Z.
Problema 39 (Sólo para alumnos que haya superado la asignatura Matemática Disc-
reta). Un grafo orientado es un par G := (V, E) donde V es un conjunto no vacı́o (cuyos
elementos son llamados nodos o vértices) y E ⊆ V × V es un conjunto finito de pares de nodos
de V llamados aristas. Un grafo no orientado es un grafo orientado G tal que el conjunto de
las aristas verifica:
∀x, y ∈ V, (x, y) ∈ E ⇐⇒ (y, x) ∈ E.
54 1. PRE-ÁLGEBRA
Un automorfismo de un grafo es un elemento σ ∈ S (V ) tal que

∀x, y ∈ V, (x, y) ∈ E ⇐⇒ (σ(x), σ(y)) ∈ E.
Se pide:
i) Hay que probar que los grafos no orientados pueden definirse como los pares (V, E),
donde V es un conjunto no vacı́o y E es un subconjunto del conjunto P(V ) de todos
los subconjuntos de V que verifica:
∀X ∈ E, 1 ≤ ](X) ≤ 2.
ii) Hay que probar que el conjunto Aut(G ) de automorfismos de un grafo orientado forma
un grupo con la operación composición de aplicaciones. ¿Es abeliano?.
iii) Sea G un grafo no orientado con vértices V . Consideremos el subgrupo G ⊆ S (V )
generado por las transposiciones
G := h{(i j) : {i, j} ∈ E}i.
¿Son los elementos de G automorfismos del grafo G (i.e. G ⊆ Aut(G ))?. Razona la
respuesta.
iv) Probad que el grupo simétrico S (V ) es el grupo Aut(Kn ), donde Kn es el grafo com-
pleto de n vérices (i.e. el grafo con todas las aristas posibles).
v) Busca en internet (Wiki, por ejemplo) información sobre el enunciado del Teorema
de Frucht y el enunciado del Problema de Galois Inverso. Cópialos y trata de explicar
sus significados.
vi) Busca en internet información sobre los grafos de Cayley. Explica su construcción.
Problema 40. Dos ciclos τ y θ en S (X), con X conjunto finito, se dicen disjuntos si sus
respectivas órbitas no triviales son conjuntos disjuntos. Pruébese que toda permutación es
producto finito de ciclos disjuntos dos a dos ( Hint: Observar el detalle de la prueba del Teorema
1.3.9).
Problema 41. Con la terminologı́a del Problema precedente, pruébese que si τ y θ son dos
ciclos disjuntos, entonces conmutan entre sı́ (i.e. τ θ = θτ ). Pruébese que el orden de un
k−ciclo es k como elemento del grupo simétrico al que pertenece. Concluir una estimación del
orden de una permutación dada como producto finito de ciclos disjuntos dos a dos.
Problema 42. Dado un entero positivo n ∈ N, para cada r ∈ N, r ≤ n, calcula una cota
superior del número de permutaciones en Sn que se pueden obtener como producto de r √ ci-
clos. Concluye que para n ≥ 2, siempre existe una permutación que necesite más de n
transposiciones. Concluye que el número de transposiciones necesarias para escribir cualquier
permutación está en Θ(n).
1.4. Anillos, ideales, morfismos de anillos

1.4.1. Propiedades generales.
Definición 21 (Anillo). Un anillo (conmutativo con unidad) es una terna (R, +, ·), donde
i) (R, +) es un grupo abeliano, cuyo elemento neutro se suele denotar por 0R ,
ii) (R, ·) es un monoide conmutativo, cuyo elemento neutro se suele denotar por 1R ,
iii) se verifica la propiedad distributiva siguiente:
∀a, b, c ∈ R, a · (b + c) = a · b + a · c.
Al elemento neutro del grupo abeliano (R, +) lo denotaremos por 0R o, simpemente, 0 y al
elemento neutro del monoide (R, ·) lo denotaremos por 1R o, simplemente, 1.
Observación 1.4.1 (Simplemente “anillo”). En este curso, “ Álgebra Conmutativa”, todos

los anillos serán conmutativos con unidad, por lo que simplificaremos diciendo “Sea (R, +, ·)
un anillo.” queriendo decir “Sea (R, +, ·) anillo conmutativo con unidad”.
Terminológicamente, podemos establecer tres niveles del uso posible del término “anillo”.
1.4. ANILLOS, IDEALES, MORFISMOS DE ANILLOS 55
• Casi-anillo: Es una terna (R, +, ·) en las que (R, +) es un grupo (no necesariamente
conmutativo), (R, ·) es un semi-grupo y se da la distributiva, pero solamente en una de
las direcciones. Por ejemplo, si (G, ∗) es un grupo definamos M (G) como el conjunto
de todas las aplicaciones de G en sı́ mismo. Sobre el conjunto M (G) podemos definir
la operación f ∗ g, entre dos elementos f, g ∈ M (G) de la manera obvia. Añadamos la
composición de aplicaciones ◦ y tendremos que (M (G), ∗, ◦) es un casi-anillo. Es una
noción que no carece de interés, pero es poco común su estudio.
• Pseudo-anillo (Anillo “sin unidad”): Es una terna (R, +, ·) en las que se da la
propiedad distributiva, (R, +) es un grupo abeliano y (R, ·) es un semi-grupo, pero
no necesariamente tiene unidad. Este caso es poco habitual. Un ejemplo podı́a ser
cualquier ideal propio, como los números enteros pares (2Z, +, ·). Pero no es una
noción demasiado interesante ni es comúnmente aceptado.
• Anillo : Es una terna (R, +, ·) en las que se da la propiedad distributiva, (R, +) es
un grupo abeliano y (R, ·) es un monoide. Este uso es el más habitual. Un ejemplo
podı́a ser el conjunto de los endomorfismos sobre un espacio vectorial o las matrices
cuadradas (Mn (K), +, ·). Es el más aceptado, salvo que se trate de un curso de
“Álgebra Conmutativa”, como es nuestro caso.
• Anillo Conmutativo (o, simplemente, anillo): que es el uso que daremos habitualmente
en este curso, aunque puedan aparecer anillos que no sean conmutativos con unidad,
en cuyo caso advertiremos al lector.
La definición de anillo (conmutativo con unidad) tiene sus precursores en D. Hilbert y A.
Fraenkel, pero es E. Noether, junto con E. Artin, quien estabiliza la noción actualmente acep-
tada en su trabajo [Noether, 1921]. Será la escuela de E. Noether, su seminario conjunto con
E. Artin y, especialmente, la obra de su colega W. Krull (cf. [Krull, 1929], [Krull, 1935]) o las
notas del seminario, recogidas y publicadas por su alumno B.-L. van der Waerden ([vdW, 1930,
vdW, 1931]), las que más influirán en la concepción del Álgebra Conmutativa moderna. Ob-
viamente, el conocimiento de estos aspectos ha evolucionado mucho en los últimos ochenta
años, ganando relevancia en Geometrı́a Algebraica y, en general, en Geometrı́a a partir de la
fundamentación de la Geometrı́a propuesta por A. Grothendieck en sus EGA’s y SGA’s. Un
cambio significativo del Álgebra Conmutativa se produce a mediados de los años 50 con la
intervención como herramiento del “ Álgebra Homológica” (introducida por Cartan y Elien-
berg en [CaEi, 1956]) y una serie de preguntas de J.P. Serre y el propio E. Artin, que
conducián a resultados tan significativos como el Teorema de Serre-Auslander-Buchsbaum
([AuBu, 1957, AuBu, 1959], [Ser, 1955]) o el Teorema de Quillen-Suslin (con direcciones
opuestas en cuanto al uso del Álgebra Homológica, [Qui, 1976], [Sus, 1976]). Pero ambos
aspectos no surgirán sino muy avanzado el curso y este curso es, por desgracia, una pre-
introducción al conocimiento de la “Teorı́a de Anillos”.
Observación 1.4.2. Si (R, +, ·) es un anillo, entonces:

∀x ∈ R, x · 0 = 0.
Para probarlo, obsérvese que
x · 0 + x · 1 = x · (1 + 0) = x · 1 = x.
Como (R, +) es un grupo, concluiremos que si x · 0 + x = x, entonces, x · 0 = 0. En particular,
concluimos que si R es un anillo y R 6= {0} (es decir, si R posee algún elemento además del
neutro de la suma), entonces 1 6= 0. La razón es que si x ∈ R, con x 6= 0, tendremos que,
de una parte, x · 0 = 0 y, por otro lado, x · 1 = x. Por tanto, si 1 = 0 en R, concluirı́amos
x = 0 y, necesariamente, R = {0}. Para excluir este caso patológico y nulamente interesante,
supondremos, a partir de ahora, que todo anillo R es tal que 1R 6= 0R o, equivalentemente, que
R 6= {0}.
Definición 22 (Subanillo). Sea (R, +, ·) un anillo. Llamaremos subanillo de R a todo sub-

grupo (S, +) de (R, +) tal que 1R ∈ S y S es cerrado para la operación producto, esto es,
∀a, b ∈ S, a · b ∈ S.
56 1. PRE-ÁLGEBRA
Ejemplo 1.4.3. Los ejemplos más elementales de anillos son obviamente los cuerpos, como
Q, R, C, o anillos que no son cuerpos como Z. Veremos, sin embargo, que hay muchos más
ejemplos. También son ejemplos de anillos los anillos de polinomios en una variable con coefi-
cientes en los anteriores anillos.
Para una definición formal de los anillos de polinomios, sea (R, +, ·) un anillo (conmutativo con
unidad) y consideremos los siguientes dos conjuntos de sucesiones de elementos de R:
(1.4.1) R[[X]] := RN := {(an )n∈N ∈ RN : an ∈ R, ∀n ∈ N}.
Definimos el subconjunto siguiente:
(1.4.2) R[X] := {(an )n∈N ∈ RN : ∃I ⊆ N, finito, an = 0, ∀n ∈ N \ I}.
Ahora definimos dos operaciones sobre estos dos conjuntos
+: R[[X]] × R[[X]] −→ R[[X]], ∗: R[[X]] × R[[X]] −→ R[[X]]
(an )n∈N , (bn )n∈N 7−→ (an + bn )n∈N . (an )n∈N , (bn )n∈N 7−→ (cn )n∈N ,
donde
X
(1.4.3) ck := ai bj , ∀k ∈ N.
i+j=k
Nótese la relación existente entre la operación ∗ y la convolución de funciones estudiada en

Análisis. De hecho, podrı́amos decir directamente que ∗ es la operación de convolución. La
terna (R[[X]], +, ∗) es un anillo conmutativo con unidad, conocido como el anillo de series
de potencias formales en una variable con coeficientes en R. Es importante subrrayar que la
operación clave para tener en cuenta la estructura de anillo en R[[X]] es la convolución: sin
ella, estarı́amos hablando simplemente de sucesiones. De hecho, por tradición y para distinguir
este anillo, no se usa la notación sucesional (an )n∈N ni la notación funcional a : N −→ R, sino
la notación en forma de serie no necesariamente convergente:
X X∞
(an )n∈N se denota mediante an X n = an X n ,
n∈N n=0
aunque todas estas notaciones representan el mismo objeto, siempre que se tenga en cuanta la
operación ∗ que inspira a la convolución de funciones. Se suele usar la terminologı́a coeficiente
n−ésimo para referirse al elemento n−ésimo an de la sucesión. Una primera noción importante
para una serie de potencias formales σ ∈ R[[X]] es su soporte, que se define del modo siguiente:
supp(σ) := {n ∈ N : an 6= 0}.
Es un sencillo ejercicio de verificación el comprobar las siguientes propiedades del soporte para
σ, τ ∈ R[[X]]:
supp(σ + τ ) ⊆ supp(σ) ∪ supp(τ ),
supp(σ ∗ τ ) ⊆ supp(σ) · supp(τ ) = {ij : i ∈ supp(σ), j ∈ supp(τ )}.
En particular, si dos series σ, τ ∈ R[[X]] tienen soporte finito también lo tienen σ + τ y σ ∗ τ .
Esto facilita la introducción de la siguiente noción:
Las series en R[[X]] de soporte finito se llaman polinomios univariados. Denotamos por R[X]
el conjunto de todos esos polinomios univariados:
N
Rfin := {σ ∈ R[[X]] : supp(σ) es un conjunto finito}.
N
Por el comportamiento del soporte antes descrito, Rfin es cerrado para ambas operaciones:
+: N
Rfin × Rfin
N
−→ N
Rfin , ∗: N
Rfin × Rfin
N
−→ N
Rfin
(an )n∈N , (bn )n∈N 7−→ (an + bn )n∈N . (an )n∈N , (bn )n∈N 7−→ (cn )n∈N ,
donde los elementos ck están igualmente definidos mediante la convolución definida en la
Ecuación (1.4.3) anterior. De nuevo, la terna (Rfin N
, +, ∗) define un anillo conmutativo con
unidad, conocido como el anillo de polinomios univariados con coeficientes en R y que deno-
taremos simplemente mediante R[X]. En particular, R[X] es un subanillo de R[[X]]. Debemos
insistir en la idea de la relevancia de la operación convolución ∗ involucrada porque, en otro
caso, no estarı́amos hablando de anillo de polinomios sino de sucesiones nulas salvo un conjunto
finito (que suelen ser vistas como otra estructura usualmente). Usualmente, se usa el sı́mmbolo
más modesto · para representar la operación ∗, esperando que el lector sea capaz de recordar
que el prodycto en R[[X]] y R[X] s el dado por la convolución de funciones.

Una segunda noción importante sobre las series de potencias formales es la noción de orden de
una serie de potencias formales en 012. Dada una serie σ := n∈N an X n , se denomina orden
P
de σ en 0 y se denota por ord0 (σ), al mı́nimo siguiente:
ord0 (σ) := min{n ∈ N : an 6= 0} = min{n ∈ N : n + 1 ∈ supp(σ)}.
Es fácil observar que el orden verifica las siguientes propiedades:
ord0 (σ + τ ) ≥ min{ord0 (σ), ord0 (τ )}, ord0 (σ ∗ τ ) ≥ ord0 (σ) + ord0 (τ ).
Estas propiedades inducirán la noción de valoración (en especial las valoraciones discretas) y,
pasando el tiempo, entroncará con la Geometrı́a Tropical. Pero esto son aspectos que no alcan-
zaremos hasta mucho más adelante en este curso.
Tendremos ası́ nuevos ejemplos de anillo como Z[X], Q[X], R[X], C[X] (anillos de polinomios)
o Z[[X]], Q[[X]], R[[X]], C[[X]] (anillos de series de potencias formales) con coeficientes respec-
tivamente en Z, Q, R, C.
En el caso de los polinomios f = (an )n∈N ∈ R[X] cambiamos el mı́nimo, usado en la noción
de orden anterior, por el máximo del soporte (que no tiene sentido en el caso de las series con
soporte infinito). Es el grado de un polinomio f como el anterior, y que se define mediante:
deg(f ) := max{k ∈ N : ak 6= 0} = max{k ∈ N : k ∈ supp(f )}.
Si f = (an )n∈N es la sucesión nula, escribiremos f = 0 y definiremos su grado mediante
deg(0) = −1. Por eso, para un polinomio f = (an )n∈N ∈ R[X], de grado d := deg(f ) se suele
denotar mediante la suma formal (llamada representación densa de polinomios):
d
X
f := ai Xi = ad X d + · · · + a1 X + a0 ,
i=0
donde hemos ordenado el soporte de modo decreciente. Al coeficiente ad 6= 0, con d = deg(f ),

se le denomina coeficiente director de f . Es sencillo dobservar que el grado satisface las dos
deg(f + g) ≤ max{deg(f ), deg(g)}, deg(f ∗ g) ≤ deg(f ) + deg(g).
Ejemplo 1.4.4 (Anillo de Polinomios con coeficientes en un anillo no necesariamente

conmutativo). Supongamos que tenemos ahora un anillo (A, +, ·) no necesariamente conmu-
tativo con unidad. Por ejemplo, en anillo A = Mn (R) de las matrices n × n con coordenadas
en un anillo R. Podemos hacer una construcción idéntica de los anillos de series de potencias
formales A[[X]] y A[X], teniendo sumo cuidado con el hecho de que ahora los anillos A[[X]]
y A[X no son necesariamente conmutativos. Ası́, el sustrato del anillo de series de potencias
formales será en conjunto AN := {f : N −→ A : f es aplicación}. Las operaciones suma y
producto serán las mismas diseñadas para el caso en que A es conmutativo. Ası́ la suma de dos
funciones f.g ∈ A[[X]] será la “suma coordenada a coordenada” y producto será la convolución,
es decir,
X
f ∗ g(n) := f (i)f (j).
i+j=n
La terna (A , +, ∗) es un anillo (no necesariamente conmutativo) con unidad. Denotamos por

N
A[[X]] a ese anillo de series de potencias formales con coeficientes en A y sus elementos se
representan también mediante la forma:
∞
X
f ∈ A[[X]] =⇒ f = ak X k , ak = f (k),
k=0
k
y los “monomios” X se definen igualmente al caso de anillos conmutativos. De nuevo, podemos
considerar el conjunto de las sucesiones de elementos de A con soporte finito:
AN
fin := {f ∈ A
N
: supp(A) es finito}.
12Es recomendable que el lector acompase esta noción de “orden de una serie” con la noción de orden en
un cero de una función holomorfa, usada en los cursos estándar de Variable Compleja.
58 1. PRE-ÁLGEBRA
Idénticamente se prueba que el conjunto AN 0 es estable para las operaciones “suma” y “con-
volución” y se tiene un anillo (no necesariamente conmutativo) con unidad (AN fin , +, ∗). A este
anillo se le denota mediante A[X] y se le denomina anillo de polinomios con coeficientes en A.
Obviamente, los lementos f ∈ A[X] admiten una presentación en la forma:
d
X
f := ai X i ,
i=0
donde d := max(supp(f ). Y a este máximo se le denomna también grado de f . En este curso,

como curso de Álgebra Conmutativa” que es, sólo habrá un caso en el que usaremos los anillos
A[[X]] y A[X] que será el caso de los anillos de matrices cuadradas A = Mn (R), con R anillo
conmutativo. Es decir, apenas si usaremos, por el contexto del curso, los anillos Mn (T )[[X]] y
Mn (R)[X]. Será de modo puntual y solamente para garantizar un buen fundamento de Teorı́a
del Endomorfismo. Como en el caso conmutativo, no harmos especial ńfasis en destacar la
operación convolución ∗ y usaremos el sı́mbolo más modesto ·, esperando que el lector sepa
recordar que el producto en A[[X]] y A[X] se dfine a través de la convolución.
Ejemplo 1.4.5 (Enteros de Gauss). Un sencillo ejemplo de anillo es el anillo de los enteros
de Gauss Z[i], formado por los números complejos de la forma:
Z[i] := {a + bi : a, b ∈ Z},
donde i2 = −1.
Definición 23 (Ideales, morfismos, unidades). Dado un anillo (R, +, ·), llamaremos:
i) Ideal: a todo subgrupo (a, +) de (R, +) tal que se verifica:
∀a ∈ R, ∀b ∈ a, a · b ∈ a.
El ideal R se denominan ideal impropio de R. Los demás, incluyendo el ideal (0), se
denominan propios.
ii) Morfismo de anillos: Dados dos anillos (R, +, ·) y (T, +, ·), llamamos morfismo
entre los anillos R y T a todo morfismo de grupos f : (R, +) −→ (T, +) tal que
f : (R, ·) −→ (T, ·) es un morfismo de monoides, es decir, si verifica, además, las
propiedades:
• f (1R ) = 1T ,
• ∀a, b ∈ R, f (a · b) = f (a) · f (b).
iii) R−álgebra: Dado un morfismo de anillos f : R −→ T , decimos que T es una
R−álgebra. Esto incluye el caso de subanillos (i.e. R ⊆ T , cuando f es simplemente
la inclusión).
iv) Unidades en el anillo: A todos los elemenos a ∈ R tales que existe a0 ∈ R, con
aa0 = a0 a = 1R . Denotamos por R× al conjunto de las unidades del anillo R y forma
un grupo abeliano con la operación producto (R× , ·) llamado grupo de las unidades
del anillo R.
v) Cuerpo:Un anillo R se denomina cuerpo si R× = R \ {0}.
Ejemplo 1.4.6 (Ideal Principal). Dado un anillo R y un elemento a ∈ R, se define el ideal

principal generado por a como el conjunto siguiente:
(a) := {λa : λ ∈ R}.
Es un sencillo ejercicio verificar que (a) es ideal en R. En ocasiones utilizaremos la notación
aR. Esto conduce a todos los anillos cociente R/(a) (o R/aR). Entre ellos podemos considerar
los anillos cocientes Z/mZ, donde m es un entero cualquiera en Z.
Es también un ejercicio sencillo probar que (a) = R si y solamente si a ∈ R× .
Proposición 1.4.7 (Subanillo generado por un subconjunto). Sea (R, +, ·) un anillo.

i) La intersección de una familia cualquiera de subanillos de R es también subanillo. Es
decir, dados {Ti : i ∈ I} una familia de subanillos de un anillo R, entonces, la
intersección ∩i∈I Ti es también subanillo de R.
ii) Dado un subanillo R1 de R y dado un subconjunto F ⊆ R, llamaremos subanillo (sub-

R1 −álgebra) generado por R1 y F al menor subanillo de R que contiene a R1 y F, es
decir, \
R1 [F] := {T ⊆ R : R1 , F ⊆ T, T es subanillo}.
Demostración. Mero ejercicio de verificación a partir de las definiciones.
Ejemplo 1.4.8. Con los ejemplos precedentes, K[X] es el subanillo (sub-K−álgebra) de K X

generado por K y el conjunto {X}. Igualmente, Z[i] es el subanillo del cuerpo de los complejos
C generado por Z y por {i}.
Definición 24 (Mono, epi, iso, endo, auto....morfismo de anillos). Sean (R, +, ·) y
(T, +, ·) dos anillos y sea f : (R, +, ·) −→ (T, +, ·) un morfismo de anillos. Usando el Teorema
de Schreier (Teorema 1.2.19 anterior) podemos definir los términos siguientes:
i) Diremos que f es monomorfismo si lo es como morfismo de grupos f : (R, +) −→
(T, +) (equivalentemente, si, como aplicación, es inyectiva).
ii) Diremos que f es epimorfismo si lo es como morfismo de grupos f : (R, +) −→ (T, +)
(equivalentemente, si, como aplicación, es suprayectiva).
iii) Diremos que f es isomorfismo si monomorfismo y epimorfismo a la vez (equivalen-
temente, si, como aplicación, es biyectiva). Esto, en particular significa que f es
isomorfismo si y solamente si existe otro morfismo de anillos g : (T, +, ·) −→ (R, +, ·)
tal que:
g ◦ f = IdR , f ◦ g = IdT .
iv) Diremos que es f endomorfismo si R = T .
v) Diremos que f es automorfismo si es endomorfismo e isomorfismo a la vez.
Proposición 1.4.9 (Propiedades elementales). Se tienen las siguientes propiedades ele-

mentales:
i) Los subanillos T de un anillo (R, +, ·) son ideales si y solamente si T = R. Equiva-
lentemente, los ideals a de un anillo (R, +, ·) son subannilos si y solamente si a = R.
ii) Los morfismos de anillos transforman subanillos en subanillos en ambas direcciones.
Es decir, si f : R −→ T es un morfismo de anillos, se tiene:
• Si S es subanillo de R, entonces f (S) := {f (x) : x ∈ S} es un subanillo de T .
En particular, Im(f ) = f (R) es un subanillo de T , que no suele ser ideal (salvo
en el caso en que f sea epimorfismo (i.e. salvo si Im(f ) = T ).
• Si U es un subanillo de T , entonces f −1 (U ) := {x ∈ R : f (x) ∈ U } es un
subanillo de R.
iii) Las imágenes inversas de ideales son ideales, pero no necesariamente lo son las imágenes
directas. Es decir, si f : R −→ T es un morfismo de anillos, se tiene:
• Si b es un ideal de T , entonces f −1 (b) := {x ∈ R : f (x) ∈ a} es un ideal de R.
En particular el núcleo ker(f ) := f −1 ({0}) es un ideal de R y f es monomorfismo
si y solamente si ker(f ) = (0) es el ideal nulo.
• Si b es un ideal de R, en general no es cierto que f (a) sea ideal de T .
Cuando no hay confusión sobre el morfismo f , al ideal f −1 (b) se le denota mediante
bc y se le denomina contracción del ideal b de T .
iv) Un subgrupo propio a ( R del grupo aditivo de un anillo (R, +, ·) es ideal si y solamente
si el grupo cociente (R/a, +) es anillo con la correspondencia siguiente:
· : R/a × R/a −→ R/a,
dada mediante
(x + a)(y + a) := xy + a, ∀x + a, y + a ∈ R/a.
Al anillo R/a se le denomina anillo cociente de R por el ideal a. Además, la proyección
canónica:
π : R −→ R/a
x 7−→ x + a,
es un epimorfismo de anillos.
60 1. PRE-ÁLGEBRA
v) Un anillo es cuerpo si y solamente si los únicos ideales son (0) y el ideal impropio.
En particular, si K es un cuerpo y R es una K−álgebra, (i.e. existe f : K −→ R un
morfismo de anillos), entonces f es inyectivo (monomorfismo) y K se puede identificar
isomórfimcamente con un subcuerpo de R (i.e. un subanillo de R que, además, es
cuerpo con las operaciones inducidas por las de R).
Demostración. La mayorı́a de estas propiedades son evidentes y no necesitan de mayor
discusión.
Ejemplo 1.4.10. Consideremos (X, T ) un espacio topológico y consideremos C 0 (X) (en oca-
siones se escribe también C (X) y usaremos ambas notaciones indistintamente) el anillo formado
por las funciones continuas f :−→ R. Es decir,
C 0 (X) := {f : X −→ R : f es aplicación continua}.
Podemos dotar a C 0 (X) con dos operaciones de suma y producto mediante la suma y producto
de funciones continuas. Esto es, dadas f, g ∈ C 0 (X), definimos
f +g : X −→ R f ·g : X −→ R
x 7−→ f (x) + g(x), x 7−→ f (x) · g(x),
donde + y · son la suma y producto usuales en R. Es fácil ver que (C 0 (X), +, ·) es un anillo.
Consideremos ahora F ⊆ X un subconjunto cualquiera. Entonces podemos definir el conjunto
de las funciones continuas que se anulan en F :
I(X) := IC 0 (X) (F ) := {f ∈ C 0 (X) : f (x) = 0, ∀x ∈ F } = {f ∈ C 0 (X) : f F = 0}.

Observamos que I(F ) es un ideal en C 0 (X) y no es subanillo salvo que 1 ∈ I(F ), en cuyo caso
F = ∅.
Ejemplo 1.4.11 (K−álgebras y cuerpos primos). Un ejemplo relevante de R−álgebras son

aquellas en las que K es un cuerpo. Ası́, si f : K −→ R es un morfismo de anillos, siendo K un
cuerpo (es decir R es un K−álgebra), entonces f es un monomorfismo y podemos identificar K
con un subanillo de R (podemos suponer entonces que K ⊆ R. Esta es la base de la noción de
caracterı́stica de un cuerpo. Ası́, se denominan cuerpos primos a la familia numerable siguiente
de cuerpos:
i) Para cada primo p ∈ N, denotamos por GFp o, simplemente por Fp al cuerpo de Galois
de cardinal p ∈ N. Se trata, obviamente, del cuerpo Fp := Z/pZ, donde Z/pZ es el
anillo residual de Z sobre el ideal pZ.
ii) El cuerpo primo de caracterı́stica 0 que es el cuerpo de los números racionales Q.
Se tiene la siguiente sencilla Proposición:
Proposición 1.4.12. Sea K un cuerpo. Dado un número natural n ∈ N definamos n · 1K a la
cantidad siguiente:
• Si n = 0, entonces n · 1K = 0K .
• Si n = 1, entonces 1 · 1K = 1K .
• Para n ≥ 2, se define recursivamente
n · 1K := (n − 1) · 1K + 1K .
Las siguientes propiedades son equivalentes:
i) Existe un número entero n ∈ N, n 6= 0, tal que n · 1K = 0. En ese caso, se tendrá que
el número natural:
p := min{n ∈ N : n 6= 0, n · 1K = 0} = min{n ∈ N : n 6= 0, n · x = 0, ∀x ∈ K},
es un número primo denominado la caracterı́stica del cuerpo K.
ii) Existe un único número primo p ∈ N tal que K es una Fp −álgebra (o, equivalente-
mente, Fp está identificado con un subanillo de K).
En caso de no existir ningún primo no nulo p ∈ N tal que se verifique algunas de las dos
propiedades equivalentes precedentes, diremos que K tiene caracterı́stica 0 y, en ese caso, K
será un Q−álgebra (o, equivalentemente, Q estará identificado con un subanillo de K).
En particular, la caracterı́stica de un cuerpo quedará definida por el tipo de Álgebra que es con
respecto a los cuerpo primos {Fp : p ∈ N, p 6= 0 primo} ∪ {Q}.
Ejemplo 1.4.13. Con las notaciones anteriores, R[X] es un subanillo de R[[X]] y existe un
monomorfismo de anillos entre R y R[X] que permite identificar R con un subanillo de R[X].
De hecho, tanto R[X] como R[[X]] son R−álgebras, lo cual es particularmente significativo en
Análisis Matemático cuando R = R o R = C.
Definición 25 (Divisores de cero, Dominio de Integridad). En un anillo (R, +, ·) se

dice que un elemento x ∈ R es un divisor de cero si existe otro elemento no nulo y ∈ R tales
que xy = 0. Un anillo sin divisores de cero no nulos se denomina dominio de integridad (o,
simplemente, dominio).
Ejemplo 1.4.14. Son ejemplos de dominios de integridad los siguientes:

i) Los cuerpos son dominios de integridad.
ii) Si R es un dominio de integridad también lo son los anillos de polinomios en una
variable con coeficientes en R: R[X]. Para probarlo, consideremos el grado deg :
R[X] −→ N ∪ {−1}. Es sencillo demostrar que si R es un dominio de integridad,
entonces el grado de un polinomio univariado satisface las dos propiedades siguientes
para dos polinomios no nulos f, g ∈ R[X]:
deg(f + g) ≤ max{deg(f ), deg(g)}.
deg(f g) = deg(f ) + deg(g).
La segunda propiedad era una desigualdad (≤) en el caso de que R no sea dominio de
integridad. Y es esa segunda propiedad la única que habrı́a que demostrar. Para ello
bastarı́a con repasar la expresión del producto de dos polinomios. Ası́ dados
m
X n
X
f := ai X i , g = bj X j ,
i=0 j=0
con am 6= 0 y bn 6= 0 como los respectivos coeficientes directores, entonces,

f g = am bn X n+m + h,
donde deg(h) < m + n. Por tanto, si R es dominio de integridad, am bn 6= 0 y
deg(f g) = deg(f ) + deg(g). En cambio, si R no fuera dominio de integridad podrı́a
darse am 6= 0, bn 6= 0 y am bn = 0, con lo que deg(f g) = deg(h) < deg(f ) + deg(g).
Con estas dos propiedades es claro que si R es dominio de integridad, el producto
de dos polinomios no nulos es un polinomio no nulo y, por tanto, también R[X] es
dominio de integridad. Dejamos para más adelante el probar que si R es dominio de
integridad también lo es el anillo de series R[[X]] (ver Teorema 1.4.39).
iii) Un caso interesante es el caso de un anillo R cualquiera y el producto de dos polinomios
f y g en R[X] de grados respectivos m y N , pero suponiendo que f es mónico con
respecto a la variable X. Es decir, si
n
X
m m−1
f := uX + am−1 X + · · · + a0 , g = bj X j ,
j=0
donde u ∈ R× es una unidad de R y bn 6= 0. Entonces,

f g = ubn X n+m + h,
donde h tiene grado en X menor que n + m. En este caso uan 6= 0 porque u es unidad
en R. Por tanto, en este caso, deg(f g) = deg(f ) + deg(g). De hecho, el verdadero
fenómeno es es f ∈ R[X] si es mónico no es divisor de cero en R[X], lo que no obsta
para que haya otros divisores de cero y que R[X] no sea dominio de integridad.
iv) Los subanillos de dominios de integridad también son dominios de integridad. El anillo
de los enteros Z es dominio de integridad.
62 1. PRE-ÁLGEBRA
Teorema 1.4.15 (División Euclı́dea en R[X] por un polinomio mónico). Sea R un anillo
y g ∈ R[X] un polinomio mónico (i.e. un polinomio cuyo coeficiente director es una unidad en
R× o, equivalentemente, g es de la forma:
g = uX d + ad−1 X d−1 + · · · + a1 X + a0 ,
con ai ∈ R y u ∈ R× ).
Entonces, existe división por g en R[X], es decir, para todo f ∈ R[X] existen q, r ∈ R[X] tales
que se verifican las dos propiedades siguientes:
i) f = qg + r,
ii) deg(r) ≤ deg(g) − 1.
Además, q y r son únicos con esa propiedad. Al elemento q lo llamamos el cociente de la
división (euclı́dea) de f por g y lo representamos mediante q := quo(f, g) y al elemento r lo
llamamos el resto de la división (euclı́dea) de f por g y lo representamos mediante rem(f, g).
Demostración. Probemos, en primer lugar, la existencia de q y r. Para ello, consideremos
el conjunto
I := {f − qg : q ∈ R[X]}.
Y consideremos el conjunto de sus grados:
deg(I ) := {n ∈ Z : ∃h ∈ I , n = deg(h)} ⊆ N ∪ {−1} ⊆ Z.
Observamos que deg(I ) es un subconjunto de Z inferiormente acotado (por −1) y, por tanto,
posee mı́nimo. Sea n0 := min (deg(I )) ese mı́nimo. Si n0 = −1, entonces 0 ∈ I (es el único
polinomio de grado −1) y se tiene la propiedad buscada tomando r = 0 y q ∈ R[X] tal que
f = qg, (que existe porque f − qg ∈ I ).
Supongamos que n0 ≥ 0 y que n0 ≤ deg(g) = d. Supongamos que g tiene la forma:
g = uX d + ad−1 X d−1 + · · · + a1 X + a0 ,
con ai ∈ R y u ∈ R× . Supongamos q ∈ R[X] tal que deg(f − qg) = n0 (que ha de existir porque
n0 ∈ deg(I ). Supongamos que
f − qg = bn0 X n0 + bn0 −1 X n0 −1 + · · · + b0 ,
con bi ∈ R. Como n0 ≥ d consideremos el polinomio:
q 0 := u−1 bn0 X n0 −d + q ∈ R[X].
Nótese que aquı́ usamos que u ∈ R× es unidad y, por tanto, posee inverso para el producto
(u−1 ). Entonces f − q 0 g ∈ I (por definición de I ) y observamos que
f −q 0 g = f −qg −u−1 bn0 X n0 −d g = (bn0 X n0 +· · ·+b0 )−bn0 X n0 −u−1 bn0 X n0 −d (g −uX n0 ) ∈ I .
Por tanto,
f − q 0 g = (bn0 −1 X n0 −1 + · · · + b0 ) − u−1 bn0 X n0 −d (g − uX d ) ∈ I .
Y, por tanto,
deg(f − g 0 q) ≤ max{n0 − 1, (n0 − d) + deg(g − uX d )} = max{n0 − 1, (n0 − d) + (d − 1)} = n0 − 1,
lo que contradice la minimalidad de n0 en I . Por tanto, si n0 ≥ 0, se ha de tener n0 6≥ deg(g)
(o, equivalentemente, n0 ≤ deg(g) − 1. Como n0 ≤ deg(g) − 1, ha de existir q ∈ R[X] tal que el
polinomio r = f − qg tiene grado n0 y, por tanto, se verifican las dos afirmaciones declaradas
en el enunciado.
Supongamos ahora que un polinomio admitiera dos descomposiciones del tipo indicado:
f = q1 g + r1 = q2 g + r2 ,
con deg(ri ) ≤ deg(g) − 1. Entonces tendremos:
q1 g + r1 = q2 g + r2 =⇒ (q1 − q2 )g = r1 − r2 .
Usando los grados tendremos que, como g es mónico con respecto a la variable
deg(q1 − q2 ) + deg(g) = deg(r1 − r2 ) ≤ max{deg(r1 ), deg(r2 )} ≤ deg(g) − 1.
Por tanto, necesariamente q1 = q2 y r1 = r2 y tendremos la unicidad.
Observación 1.4.16. Nótese que la propiedad “el coeficiente director es una unidad en R”
es una condición necesaria. Por ejemplo, dividir X por 2X en Z[X] no es posible con las
condiciones de la División euclı́dea.
Corolario 1.4.17. Si K es un cuerpo, entonces K[X] admite división euclı́dea, esto es, se
verifica:
Dados f, g ∈ K[X], g 6= 0, existen q, r ∈ K[X] tales que se verifican las dos propiedades
siguientes:
i) f = qg + r,
ii) deg(r) ≤ deg(g) − 1.
Además, q y r son únicos con esa propiedad.
Demostración. Es obvio dado que todo polinomio no nulo en K[X] posee un coeficiente
director que es una unidad en K.
Utilicemos este Teorema para mostrar ejemplos de extensiones de Z.
Ejemplo 1.4.18 (Enteros de Gauss, de nuevo). Es fácil ver que se tiene la identificación
Z[i] := Z[X]/(X 2 + 1).
Por ello, y por el Teorema precedente, podemos entender los enteros de Gauss como los restos
de la división por el polinomio mónico X 2 + 1. Claramente, tenemos una identificación
Z[i] := {a + bX : a, b ∈ Z},
donde a + bX denota la clase a + bX + (X 2 + 1) en el anillo cociente Z[X]/(X 2 + 1).
Ejemplo 1.4.19 (Enteros de Einsenstein). El anillo de los enteros de Eisenstein. Consider-

emos el polinomio X 3 − 1 ∈ Z[X] y su factorización:
X 3 − 1 = (X − 1)(X 2 + X + 1).
Podemos considerar el anillo cociente
Z[X]/(X 2 + X + 1).
Es fácil, de nuevo, comprobar que es el anillo de restos de la división por el polinomo mónico
X 2 + X + 1. Podemos escribir:
Z[X]/(X 2 + X + 1) = {a + bX : a, b ∈ Z},
donde a + bX denota la clase a + bX + (X 2 + X + 1) en el anillo cociente Z[X]/(X 2 + X + 1).
De hecho, podemos considerar el número complejo
√
−1 + −3
ω := ∈ C,
2
y considerar el subanillo de C:
Z[ω] := {a + bω : a, b ∈ Z}.
Es un sencillo ejercicio verificar que este anillo coincide con el anillo de enteros de Eisenstein,
es decir,
Z[ω] = Z[X]/(X 2 + X + 1).
Observación 1.4.20 (Operations matter!). En los dos ejemplos anteriores, hemos mostrado
los anillos Z[i] y Z[ω]. Para cada uno de ellos disponemos de una biyección:
ϕ : Z[i] −→ Z2 , ϕ(a + bi) = (a, b)
ψ : Z[ω] −→ Z2 , ψ(a + bω) = (a, b).
Cada una de ellas define una estructura de anillo en Z2 del modo siguiente.
• (Z2 , +, ∗1 ) siendo (Z2 , +) la estructura natural de grupo abeliano libre de rango 2 y
el producto viene dado por:
(a, b) ∗1 (c, d) := ϕ(ϕ−1 (a, b)ϕ−1 (c, d)) = (ac − db, ad + bc).
64 1. PRE-ÁLGEBRA
• (Z2 , +, ∗2 ) siendo (Z2 , +) la estructura natural de grupo abeliano libre de rango 2 y

el producto viene dado por13 :
(a, b) ∗2 (c, d) := ψ(ψ −1 (a, b)ψ −1 (c, d)) = (ac − bd, ad + bc − bd).
Pero, incluso, podemos definir una estructura más de anillo en Z2 del modo siguiente. Se trata
de la estructura (Z2 , +, ·), donde (Z2 , +) es la estructura usual de grupo, meintras que
·: Z2 × Z2 −→ Z2
((a, b), (c, d)) 7−→ (ac, bd).
La conclusión es que tenemos tres estructuras de anillo definidas sobre Z2 y las tres son diferentes
y no isomorfas. Para verlo, baste con observar lo siguiente:
• Las estructuras (Z2 , +, ∗1 ) y (Z2 , +, ∗2 ) le dan a Z2 una estructura de dominio de
integridad. En cambio, (Z2 , +, ·) no es dominio de integridad porque (1, 0) · (0, 1) =
(0, 0) y (Z2 , +, ·) posee divisores de cero no nulos.
• Las estructuras (Z2 , +, ∗1 ) y (Z2 , +, ∗2 ) tampoco son isomorfas entre sı́ porque el
número de elementos unidad en cada una de ellas es distinto. Esto se comprueba
probando que:
Z[i]× = {±1, ±i}, Z[ω]× = {±1, ±ω, ±ω 2 }.
Dado que el segundo posee 6 elementos unidad y el primero posee solamente 4, es
imposible que sean isomorfos.
La moraleja es que las operaciones sı́ importan y que en un mismo conjunto, incluso en un
mismo grupo abeliano, podemos inducir muy diferentes estructuras de anillo. En ocasiones
(y, muy comúnmente, en la literatura) se usa la expresión “...Sea R un anillo...”. Aunque
no se esté escribiendo explı́citamente, se está sobre-entendiendo la estructura subyacente y las
operaciones.
√
Ejemplo 1.4.21 (Los anillos Z[ m]). Sea m ∈ Z un entero que no es un cuadrado. Podemos
considerar el anillo cociente: √
Z[ m] := Z[X]/(X 2 − m).
Como en los casos anteriores, por ser X 2 − m mónico, tenemos la identificación siguiente:
√ √
Z[ m] = {a + b m : a, b ∈ Z} = {a + bX : a, b ∈ Z},
donde a + bX = a + bX + (X 2 − m) es la clase residual definida por a + bX. Como subanillos
de C, todos ellos son dominios de integridad pero toman estructuras y formas muy diversas.
Pongamos un par de ejmplos. Por supuesto, los enteros de Gauss son un caso particular.
√ √
• El anillo Z[ −5]. El elemento 2 ∈ Z deja de ser un primo si lo miramos en Z[ −5]
porque tendremos que 6 admite dos factorizaciones distintas:
√ √
6 = 2 · 3 = (1 + −5) · (1 − −5).
√
• El anillo Z[ 2] tiene una infinidad de unidades dado que:
√ √
±(1 + 2)n ∈ Z[ 2]× ,
√ √
para todo n ∈ N. La razón es que, obviamente, se tiene (1 + 2)(1 − 2) = −1.
2
Esto
√ confiere una estructura muy distinta a Z a través del isomorfismo de grupos con
Z[ 2].
√
Ejemplo 1.4.22 (Los anillos Z[ 1+2 m ]). Supongamos que m ∈ Z no es un cuadrado en Z y
consideremos el polinomio
√ √
2 1+ m 1− m
4X − 4X + (1 − m) = 4(X − )(X − ) ∈ Z[X].
2 2
Consideremos una de las raı́ces en C y pensemos en el conjunto siguiente :
√ √
1+ m 1+ m
Z+Z = {a + b : a, b ∈ Z}.
2 2
13Nótese que ω 2 = −1 − ω y que (a + bω)(c + dω) es igual a ac − db + (ad + bc − bd)ω.
Este conjunto es obviamente un subgrupo de (C, +) pero no siempre es un anillo. De hecho, la

condición clave es la siguiente:
m = 1 mod 4.
Si m 6= 1 mod 4, se tiene que:
√ √ √ √ √
1+ m 1+ m 1+ m1− m 1−m 1+ m
(1 − )= = 6∈ Z + Z .
2 2 2 2 4 2
√
Por tanto, si m 6= 1 mod 4, tenemos que el producto de dos elementos de Z + Z 1+2 m no
√
necesariamente está en Z + Z 1+2 m , con lo que, en este caso, no es un anillo. Sin embargo, si
m = 1 mod 4, podemos reemplazar el polinomio original por el siguiente:
1−m
4X 2 − 4X + (1 − m) = 4(X 2 − X + ).
4
El polinomio X 2 − X + 1−m4 ∈ Z[X] y tendremos:
√ √ √
1+ m 1+ m 1+ m 1−m
Z[ ]=Z+Z = {a + b : a, b ∈ Z} = Z[X]/(X 2 − X + ),
2 2 2 4
y recuperamos la analogı́a con situaciones anteriores y una nueva estructura de anillo sobre Z2 .
1.4.2. Anillos de polinomios y de series de potencias formales en varias va-

riables. Sea S un conjunto no vacı́o cualquiera y sea R un anillo. El conjunto RS de las
aplicaciones de S en R es claramente un anillo con las operaciones naturales de suma y producto
de aplicaciones. Recordaremos esta estructura de anillo.
En ocasiones usuaremos indistintamente cualquiera de las dos notationes siguientes:
RS = Ap(S, R) := {f : S −→ R : f es aplicación}.
Ejemplo 1.4.23 (Aplicaciones). Las operaciones de RS vienen dadas mediante la construcción
siguiente:
De una parte consideramos la suma usual de funciones, esto es, la aplicación:
+ : RS × RS −→ RS
(f, g) 7−→ f + g,
donde
(f + g)(x) := f (x) +R g(x), ∀x ∈ S,
y f (x) +R g(x) representa la suma en R. Es claro que (RS , +) es un grupo abeliano. De otra
parte podemos definir una operación producto:
· : RS × RS −→ RS
(f, g) 7−→ f · g,
donde
(f · g)(x) := f (x) ·R g(x), ∀x ∈ S.
y f (x) ·R g(x) representa el producto en R. Usaremos la notación clásica RS para el conjunto
de las aplicaciones de S en R.
Proposición 1.4.24. Con las anteriores notaciones e hipótesis (RS , +, ·) es un anillo conmu-
tativo con unidad.
Demostración. Mero ejercicio de comprobación de propiedades.
Retomemos el monoide (Nn , +) ya discutido en el Ejemplo 1.2.2 anterior. Queremos introducir

n
una estructura de anillo en el grupo abeliano (RN , +) y que tenga un buen comportamiento
cara a un procesio de división que se “parezca” a la división euclı́dea (en el Teorema 1.4.15
anterior) y que se denominará división de Hironaka (véase el Problema 67) . En el caso de la
división euclı́dea un elemento esencial es el orden natural del conjunto N (obsérvese que, en la
demostración, se usa de manera esencial la existencia del mı́nimo de un cierto conjunto y, para
haber un mı́nimo tiene que haber un orden y, a ser posible, un buen orden). Exploremos un
poco más esta idea.
66 1. PRE-ÁLGEBRA
Observación 1.4.25 (Orden en (Nn , +) y Biyecciones con N). Podemos identificar Nn con
N de diversas formas. Cada biyección ϕ : Nn −→ N induce una relación de orden sobre Nn del
modo siguiente:
Dados µ, θ ∈ Nn , µ ≤ϕ θ si y solamente si ϕ(µ) ≤ ϕ(θ). Nos interesa no solamente una biyección
sino que, además, se comporte bien sobre la estrcuctura de monoide. En este sentido, en lugar
de tratar con biyecciones, interesan, sobre todo, los órdenes monomiales.
Definición 26 (Orden Monomial). Un orden monomial sobre (Nn , +) es una relación de
orden ≤ sobre Nn que verifica las siguientes propiedades:
i) Es un buen orden (i.e. todo subconjunto no vacı́o de Nn posee mı́nimo para ≤)
ii) ∀µ, θ, τ ∈ Nn , si µ ≤ τ , entonces µ + θ ≤ τ + θ.)
iii) El elemento 0 = (0, . . . , 0) ∈ Nn es el mı́nimo de (Nn , ≤).
Ejemplo 1.4.26 (Orden Lexicográfico). El orden lexicográfico ≤lex es el orden dado por la
regla siguiente:
Dados µ := (µ1 , . . . , µn ) ∈ Nn y ν := (ν1 , . . . , νn ) ∈ Nn , diremos que µ ≤lex ν si existe
k ∈ {0, . . . , n − 1} tal que se verifican las dos propiedades siguientes:
• µi = νi , para 1 ≤ i ≤ k. Obsérvese que si k = 0, esta condición es la condici—ón
vacı́a.
• µk+1 ≤ νk+1 .
Es claramente un ordem monomial en Nn .
Ejemplo 1.4.27 (Orden Grado+lexicográfico). Otro ejemplo de orden monomial es el

≤deglex , también denominado “grado + lexicográfico” (≤deglex ) y en ocasiones denotado medi-
ante grlex , que se define del modo siguiente:
Sea ≤lex el orden lexicográfico en Nn . Obsérvese que ≤lex no es un orden que permita Identi-
ficar (biyectar) Nn con N. Entonces, definimos: para µ, θ ∈ Nn , diremos que µ ≤deglex θ si se
verifica:
[|µ| < |θ|] ∨ [(|µ| = |θ|) ∧ (µ ≤lex θ)] .
En el Problema 67 se discuten estos órdenes monomiales como preparación para la División de
Hironaka.
Independientemente de los órdenes monomiales que respetan la operación + en Nn , tenemos
también propiedades internas de finitud asociadas a la operación suma.
Lema 1.4.28. Sea µ ∈ Nn un multiı́ndice. Entonces, el siguiente conjunto es finito:
Tµ := {(α, β) ∈ Nn × Nn : α + β = µ}.
Además, si µ = (µ1 , . . . , µn ), el cardinal de Tµ satisface:
n
Y
] (Tµ ) = (µi + 1).
i=1
Demostración. Ver Problema 69.

n
Sea R un anillo y consideremos el grupo aditivo (RN , +) de las aplicaciones de Nn en R.
Definamos la función producto siguiente:
n n n
∗ : RN × RN −→ RN ,
dada mediante:
n
Dadas f, g ∈ RN , definamos: f ∗ g : Nn −→ R, mediante:
X
f ∗ g(µ) := f (θ)g(τ ).
θ,τ ∈Nn ,θ+τ =µ
Obsérvese que esta operación producto es la versión discreta de la convolución de funciones

medibles y que está bien definida gracias al Lema 1.4.28 precedente (porque se trata de una
suma finita en R).
n
Proposición 1.4.29. La terna (RN , +, ∗) es un anillo conmutativo con unidad que se denomina
anillo de series de potencias formales en n variables con coeficientes en R y se denota mediante
R[[X1 , . . . , Xn ]], sin necesidad de insistir en las operaciones + y ∗ definidas sobre él.
Demostración. Es un sencillo ejercicio de verificación.

n
Nótese que (RN , +, ·) difiere fuertemente de R[[X1 , . . . , Xn ]] como anillo. Por ejemplo, to-
dos los elementos σ ∈ RX tales que el soporte está estrictamente contenido en Nn (i.e. si
n
existe µ ∈ Nn tal que σ(µ) = 0) son divisores de cero en (RN , +, ·) lo que no es el caso en
R[[X1 , . . . , Xn ]]. Se puede verificar fácilmente tomando 1 ∈ R[[X1 , . . . , Xn ]]: 1 no es divisor
n
de cero en (R[[X1 , . . . , Xn ]], +, ∗) pero sı́ los es como elemento en (RN , +, ·). No sólo no son
isomorfos sino que tendrán más que notables diferencias.
n
Dada σ ∈ RN definamos su soporte mediante la siguiente identidad:
supp(σ) := {µ ∈ Nn : σ(µ) 6= 0}.
n
Designemos mediante R[X1 , . . . , Xn ] ⊆ RN al subconjunto formado por las series de soporte
finito. Esto es,
n
R[X1 , . . . , Xn ] := {σ ∈ RN : supp(σ) es un conjunto finito}.
Proposición 1.4.30. Con las anteriores notaciones R[X1 , . . . , Xn ] es un subanillo propio de
R[[X1 , . . . , Xn ]] que se denomina el anillo de polinomios en n variables con coficientes en R. A
los elementos de R[X1 , . . . , Xn ] se les denomina polinomios en las variables {X1 , . . . , Xn } con
coeficientes en R.
Demostración. Se trata simplemente de verificar las propiedades indicadas.
La siguiente es una Proposición de fácil demostración:

Proposición 1.4.31. Con las anteriores notaciones se tiene para cada m ≤ n:
i) R[[X1 , . . . , Xm ]][[Xm+1 , . . . , Xn ]] = R[[X1 , . . . , Xn ]].
ii) R[X1 , . . . , Xm ][Xm+1 , . . . , Xn ] = R[X1 , . . . , Xn ].
Demostración. Es de sencilla verificación, usando apropiadamente la terminologı́a de
n
aplicaciones en RN usada para definir series de potencias formales y polinomios multivariados.

Notación 1.4.32 (Monomios, términos, grado). Hay una notación estandarizada de estos
objetos. Supongamos dado un multi-ı́ndice µ := (µ1 , . . . , µn ) ∈ Nn . Se define el monomio
X µ := X1µ1 X2µ2 · · · Xnµn ∈ R[X1 , . . . , Xn ] como la transformación X µ : Nn −→ R, dada medi-
ante:
µ 1, si θ = µ,
X (θ) :=
0, en caso contrario.
Dado a ∈ R, se define el el término aX µ ∈ R[X1 , . . . , Xn ] como como la transformación
aX µ : Nn −→ R, dada mediante:

a, si θ = µ,
aX µ (θ) :=
Se dice que a 6= 0 es el coeficiente de aX µ , que µ es su exponente monomial (es decir, µ =
exp(aX µ )) y diremos que el grado del término es el grado del exponente monomial, esto es, el
número natural
deg(aX µ ) := |µ| = µ1 + µ2 + · · · + µn ∈ N.
como en el Ejemplo 1.2.2. En el caso a = 0 diremos que el grado del término es −1.
Lema 1.4.33. Con estas notaciones, R es un subanillo de R[X1 , . . . , Xn ], identificando R con
el conjunto de términos:
{λX (0) : λ ∈ R},
donde (0) = (0, . . . , 0) ∈ Nn es el elemento neutro de Nn como monoide. Escribiremos 1 en
lugar de X (0) y a ∈ R[[X1 , . . . , Xn ]] en lugar de aX (0) , para cada a ∈ R.
68 1. PRE-ÁLGEBRA
n
Notación 1.4.34. Definamos, además, los siguientes elementos de RN : {X1 , . . . , Xn } dados
mediante las reglas siguientes:

1, si θ = (1, 0, 0, . . . , 0),
X1 : Nn −→ R, X1 (θ) :=

1, si θ = (0, 1, 0, . . . , 0),
X2 : Nn −→ R, X2 (θ) :=
..
.

1, si θ = (0, 0, 0, . . . , 1),
Xn : Nn −→ R, Xn (θ) :=
Se denominan las variables X1 , . . . , Xn . Podemos definir también las potencias de variables a
n
partir de la operación producto ∗ de RN :
Xi0 := 1, Xi1 := Xi , Xi2 := Xi ∗ Xi ,
Xit := Xit−1 ∗ Xi .
Lema 1.4.35. Con las anteriores notaciones, dado µ = (µ1 , . . . , µn ) ∈ Nn , y para cada a ∈ R
se tiene:
aX µ = a ∗ X1µ1 ∗ · · · ∗ Xnµn .
Demostración. Es un ejercicio obvio.
Observación 1.4.36. En ocasiones se “olvida” que la operación entre variables es la operación

convolución ∗ y se omite. Por eso encontraremos como notación estandarizada:
aX µ = aX1µ1 · · · Xnµn .
Debe tenerse cuidado con esta omisión y ser siempre consciente de su presencia, sobre todo
cuando se comparan las operaciones producto de polinomios y series con las operaciones pro-
n
ducto de aplicaciones que definı́an el anillo (RN , +, ·).
Proposición 1.4.37. Con las anteriores notaciones, para cada polinomio f ∈ R[X1 , . . . , Xn ] y
su soporte finito supp(f ) ⊆ Nn de y existen {aµ : µ ∈ supp(f )} ⊆ R \ {0} una cantidad finita
de elementos del anillo tales que:
X X
f := aµ X µ = aµ X1µ1 ∗ · · · ∗ Xnµn .
µ∈supp(f ) µ∈supp(f )
Obviamente, se verifica que f 6= 0 si y solamente si supp(f ) 6= ∅. Al siguiente valor se le

denomina el grado de f ∈ R[X1 , . . . , Xn ] \ {0}:
deg(f ) := max{|µ| : µ ∈ supp(f )} ∈ N.
En el caso f = 0 diremos que deg(f ) = −1
Demostración. Mero ejercicio de comprobación a partir de las definiciones.
Observación 1.4.38. En el caso de series de potencias formales también se admite una repre-
sentación de la forma siguiente: Dada σ ∈ R[[X1 , . . . , Xn ]], escribiremos:
X X
σ := aµ X µ = aµ X µ ,
µ∈Nn µ∈supp(σ)
aunque, obviamente, se trata de una suma infinita y meramente simbólica. Sin embargo, será
posible generar una topologı́a (y una métrica) en algunos anillos de la forma R[[X1 , . . . , Xn ]]
(especialmente interesante en el caso de que R sea un cuerpo) para los que esa suma infinita es
un lı́mite, pero el asunto requiere varias discusiones ulteriores.
Teorema 1.4.39. Si R es dominio de integridad, también lo son R[X1 , . . . , Xn ] y R[[X1 , . . . , Xn ]].

Demostración. Bastará con probar el enunciado para R[[X1 , . . . , Xn ]] porque, al ser

R[X1 , . . . , Xn ] subanillo, la condición de ser dominio de integridad se hereda. Sean f, g ∈
R[[X1 , . . . , Xn ]] dos elementos ninguno de ellos nulo. Por tanto, sus respectivos soportes son
no vacı́os:
supp(f ) := {θ ∈ Nn : f (θ) 6= 0} =
6 ∅, supp(f ) := {θ ∈ Nn : f (θ) 6= 0} =
6 ∅.
Consideremos un orden monomial ≤ sobre Nn (como ≤deglex antes definido), que es un buen
orden sobre Nn . Ambos soportes poseen, por tanto, mı́nimo. Denotemos por µ := min supp(f )
y ν := min supp(g) los mı́nimos de los respectivos soportes. Definamos ρ := µ + ν ∈ Nn la
suma de ambos mı́nimos. Consideremos el conjunto de ı́ndices
Tρ := {(α, β) ∈ Nn : α + β = ρ},
y su subconjunto formado por los pares en los respectivos soportes de f y g:
Tρ0 := {(α, β) ∈ Tρ ×Tρ : f (α) 6= 0, g(β) 6= 0} = {(α, β) ∈ Tρ ×Tρ : α ∈ supp(f ), β ∈ supp(g)}.
Es claro que el la suma que define el valor f ∗ g(ρ) sólo intervienen los términos que viven,
respectivamente, en los soportes de f y g, esto es
X X
f ∗ g(ρ) := f (α)g(β) = f (α)g(β).
α+β=ρ (α,β)∈Tρ0
Veamos finalmente que Tρ0 = {(µ, ν)}. Es claro que el par (µ, ν) está en Tρ0 . Queda por ver el
otro contenido. Además, si (α, β) ∈ Tρ0 , entonces, α ∈ supp(f ) y β ∈ supp(g). Pero, como el
orden monomial escogido es un orden total, entonces,
α ≥ µ = min suppf (f ), β ≥ ν = min supp(g).
Concluyamos que si α > µ o β > ν, α ∈ supp(f ) y β ∈ supp(g), entonces, α + β > ρ y
(α, β) 6∈ Tρ0 . Supongamos, sin pérdida de la generalidad, que α > µ y que α + β = ρ. Nótese
que, en Nn , como subconjunto del grupo abeliano Zn , si µ + θ = α + θ, para algún θ ∈ Nn ,
entonces se debe tener µ = α. Por tanto, considerando el orden monomial, y su definición,
tendremos
µ < α =⇒ µ + ν < α + ν,
y
ν ≤ β =⇒ α + ν ≤ α + β.
En conclusión, tenemos
ρ = µ + ν < α + β,
y, por tanto, si µ < α , α ∈ supp(f ) y β ∈ supp(g), entonces y α + β 6= ρ y (α, β) 6∈ Tρ0 .
En suma, hemos probado que Tρ0 = {(µ, ν)} y, por ser R un dominio de integridad,
X
f ∗ g(ρ) := f (α)g(β) = f (µ)g(ν) 6= 0.
α+β=ρ
En particular, ρ ∈ supp(f ∗ g) 6= ∅ y, por tanto, f ∗ g 6= 0.
Proposición 1.4.40. Sea K un cuerpo y K[X1 , . . . , Xn ] el anillo de polinomios en n variables

con coeficientes en K. Entonces,
i) K[X1 , . . . , Xn ] es un K−espacio vectorial, con base dada por los monomios
{X µ : µ ∈ Nn }.
ii) Dado un polinomio f ∈ K[X1 , . . . , Xn ], tenemos una representación como suma finita:
X
f := aµ X µ ,
µ∈∈supp(f )
donde {aµ : µ ∈ I} ⊆ K es un conjunto finito.

70 1. PRE-ÁLGEBRA
iii) Dado un entero d ∈ N, denotaremos por Hd (X1 , . . . , Xn ) al K−subespacio vectorial

de K[X1 , . . . , Xn ] generado por los monomios de grado d, es decir, generado por:
{X µ : |µ| = d, µ ∈ Nn }.
A los elementos de Hd (X1 , . . . , Xn ) los llamamos polinomios homogéneos de grado d.
Entonces, Hd (X1 , . . . , Xn ) es un espacio vectorial de dimensión finita e igual a

d+n−1
dimK Hd (X1 , . . . , Xn ) = .
n−1
Más aún, tenemos la descomposición de K[X1 , . . . , Xn ] en suma directa de subespacios
siguiente: M
K[X1 , . . . , Xn ] := Hd (X1 , . . . , Xn ).
d∈N
Obviamente, se tiene que H0 (X0 , . . . , Xn ) = K.
iv) Con las notaciones de la afirmación precedente, se tiene:
∀f ∈ Hd (X0 , . . . , Xn ), ∀g ∈ Hk (X0 , . . . , Xn ) =⇒ f · g ∈ Hd+k (X0 , . . . , Xn ),
donde · es el producto de polinomios descrito anterioremente.
Demostración. Las afirmaciones son de mera comprobación.
1.4.3. Otros ejemplos.
Ejemplo 1.4.41 (Funciones Booleanas). Son funciones básicas en Lógica y en Electrónica
Digital, a través de los circuitos booleanos o digitales. Por ahora nos vamos a conformar con
definirlas. Comenzamos observando la identificación {0, 1} = Z/2Z que identifica los valores
boooleanos {0, 1} (o también en su versiones verdadero/falso: {V, F}) con el cuerpo primo de
caracterı́stica 2. Se denomina función booleana de n variables a toda aplicación: f : {0, 1}n −→
{0, 1}. Se define el conjunto de funciones booleanas :
Bn := {f : {0, 1}n −→ {0, 1} : f es aplicación}.
Es fácil de observar que podemos identificar
Bn ∼= P({0, 1}n ),
es decir, el conjunto de funciones booleanas con el conjunto de todos los subconjuntos de {0, 1}n .
La biyección entre ambos conjuntos es dada por las funciones caracterı́sticas:
• Dado un subconjunto L ∈ P({0, 1}n ), definimos la función booleana χL ∈ Bn dada
mediante:
∀x ∈ {0, 1}n , χL (x) = 1 ⇐⇒ x ∈ X.
• Recı́procamente, dada una función booleana f ∈ Bn , definimos el lenguaje aceptado
por f como L := f −1 ({1}) ∈ P({0, 1}n ).
{0,1}n
Ahora, identificando {0, 1} con Z/2Z, observamos que Bn := Ap({0, 1}n , Z/2Z) = (F2 ) y
tiene una estructura de anillo natural a través de las operaciones del cuerpo Z/2Z.
Podemos concluir:
Proposición 1.4.42. El conjunto de funciones booleanas Bn tiene una estructura natural de
anillo conmutativo con unidad, es biyectable al conjunto P({0, 1}n ) y tiene, por tanto, cardinal
dado por la siguiente identidad:
n
] (Bn ) = 22 .
Demostración. Es lo discutido en párrafos previos.
Ejemplo 1.4.43 (Funciones Holomorfas). Un ejemplo de dominio de integridad que se sale
del contexto de este curso es el siguiente:
• Sea U ⊆ Rn un abierto y consideramos el siguiente conjunto:
C ω (U ) := {f : U −→ R : f es analı́tica en U }.
Es un sencillo ejercicio de análisis, probar que C ω (U ) es un subanillo de (RU , +, ·) y,
por tanto, un anillo con las operaciones habituales de suma y producto de funciones.
Se llama el anillo de las funciones analı́ticas sobre U .
• Sea U ⊆ Cn un abierto y consideramos el siguiente conjunto:

H(U ) := {f : U −→ C : f es analı́tica en U }.
Un clásico ejercicio de Análisis consiste en probar que H(U ) es un subanillo de
(CU , +, ·) y, por tanto, un anillo con las operaciones habituales de suma y producto de
funciones. A las funciones en H(U ) se las denomina funciones holomorfas y a H(U )
se denomina anillo de las funciones holomorfas definidas en U .
Se tiene el siguiente resultado:
Teorema 1.4.44. Sea U ⊆ C un abierto no vacı́o. Entonces, el anillo de funciones holomorfas
definidas en U , que hemos denotado por H(U ), es un dominio de integridad si y solamente si
U es un abierto conexo.
Demostración. Baste con observar que el conjunto de ceros de una función holomorfa
compleja no nula es un conjunto numerable sin puntos de acumulación (i.e. que los ceros de
funciones holomorfas son puntos aislados 14). Con este resultado, supongamos que U es abierto
conexo y que el producto de dos funciones f, g ∈ H(U ) es tal que f g se anula idénticamente en
U . Entonces, podemos observar que
U = VU (f ) ∪ VU (g),
donde VU (f ) y VU (g) son los ceros en U de f y g necesariamente. Pero U es un abierto en
C, luego no es numerable, mientras que la unión de dos numerables es numerable. Esto quiere
decir que si f 6= 0 y g 6= 0, entonces tendrı́amos U como unión de dos numerables llegando a
contradicción. Luego, necesariamente U = VU (f ) o U = VU (g), lo que equivale a decir f = 0 o
g = 0 y H(U ) es dominio de integridad.
Para el recı́proco, baste con observar lo siguiente: Si U no fuera conexo, posee una descom-
posición como unión de dos abiertos disjuntos U = U1 ∪ U2 . Entonces, podemos definir dos
funciones no nulas f1 , f2 : U −→ C, del modo siguiente:

1 si x ∈ Ui
fi (x) :=
0 en caso contrario
Obviamente f1 f2 = 0 y ninguna de ellas es nula.
Observación 1.4.45. [Las funciones C y los divisores de cero] El anterior resultado es
∞
también cierto en el caso de funciones analı́ticas reales definidas sobre abiertos U ⊆ R, es decir
C ω (U ) es dominio de integridad si y solamente si U es conexo. En cambio, el resultado no
es cierto para funciones diferenciables o para funciones continuas. Si tratamos con funciones
C ∞ (R) podemos encontrar dos funciones f+ y f− : R −→ R tales que ambas son infinitamente
diferenciables y verifican:


 f+ (x) = 0, f− (x) = 1, si x ∈ (−∞, −1)
f+ (x) = 0, si x ∈ (−1, 0)


 f − (x) = 0, si x ∈ (0, 1)
f+ (x) = 1, f− (x) = 0, si x ∈ (1, +∞)

Claramente f+ f− = 0 y ninguna de ellas dos es un función nula, con lo que C ∞ (R) no es

dominio de integridad. Como ejercicio se propone buscar esas dos funciones en el caso U = R.

Problema 43. Pruébese que todas las afirmaciones descritas en la Proposición 1.4.9.
Problema 44. Pruébese la Proposición 1.4.24.
Problema 45. Pruébese la Proposición 1.4.42.
Problema 46. Pruébense las siguientes igualdades que caracterizan las unidades R× de los
anillos que se indican:
i) Z[i]× = {±1, ±i} ∼
= (Z/4Z).
14Buscar http://en.wikipedia.org/wiki/Zeros_and_poles.
72 1. PRE-ÁLGEBRA
ii) Si Z[ω] es el anillo de Eisenstein, probrar

Z[ω]× = {±1, ±ω, ±ω 2 }.
iii) Si m < −1 es un entero, probar que:
√
Z[ m]× = {±1}.
iv) Si m ∈ Z es un entero tal que m ≡ 1 mod 4 y m < −3, entonces
√ ×
1+ m
Z = {±1}.
2
Problema 47. Sea K un cuerpo y consideremos el conjunto de los polinomios en una variable
de grado a lo sumo d y con coneficientes en K. Esto es, el conjunto:
K[X]d := {f ∈ K[X] : deg(f ) ≤ d}.
Probad:
• (K[X]d , +) es un grupo con la suma de polinomios univariados.
• (K[X]d , +, ·K ) es un espacio vectorial de dimensión d + 1 con base monomial:
Md (X) := {1, X, X 2 , . . . , X d }.
• Pero (K[X]d , +, ·) no es anillo con las operaciones habituales de suma y producto de
polinomios.
Problema 48 (Funciones continuas). Sea (X, T ) un espacio topológico y sea U ⊆ X un
abierto. Consideramos el siguiente conjunto de las funciones continuas a valores reales definidas
en U ( a veces denotado mediante C 0 (U ) o C (U ), según el contexto)
C (U ) := {f : U −→ R : f es continua}.
Hay que probar que C (U ) es un subanillo de (RX , +, ·) y, por tanto, un anillo con las operaciones
habituales de suma y producto de funciones.
Problema 49 (Funciones continuas a valores complejos). Sea (X, T ) un espacio topológico
y sea U ⊆ X un abierto. Consideramos el siguiente conjunto:
C (U, C) := {f : U −→ C : f es continua}.
Se debe probar que C (U, C) es un subanillo de (CU , +, ·) y, por tanto, un anillo con las opera-
ciones habituales de suma y producto de funciones. ¿Qué relación tienen C (U ) y C (U, C)?.
Problema 50 (Funciones Diferenciables). Sea k ∈ N ∪ {∞}, k ≥ 1 y sea M una variedad
diferenciable de clase C ∞ . Sea U ⊆ M un abierto y consideramos el siguiente conjunto:
C k (U ) := {f : U −→ R : f es k veces diferenciable con derivada k−ésima continua}.
Probad que C k (U ) es un subanillo de (RU , +, ·) y, por tanto, un anillo con las operaciones
habituales de suma y producto de funciones.
Problema 51. Buscar ejemplos de funciones no nulas f+ y f− de clase C ∞ (R) y tales que
f+ f− = 0 en todo R y que se citan en la observación 1.4.45. Concluir que C k (R) no es dominio
de integridad para todo k, 0 ≤ k ≤ ∞. (Pista: Considerar la función f :−→ R siguiente:

0, si x ≤ 0
f (x)
e−1/x , si x > 0.
Problema 52. Buscar ejemplos de abiertos X en R tales que cada contenido es estricto (ver
cursos previos de Análisis Matemático) y, por tanto, dan lugar a un contenido estricto de
anillos:
• X tal que R ( C ω (X),
• X tal que C ω (X) ( C ∞ (X),
• X tal que C ∞ (X) ( C k (X), con k < ∞,
• X tal que C 2 (X) ( C 1 (X),
• X tal que C 1 (X) ( C (X).
Problema 53. Sea x un elemento nilpotente de un anillo R (un elemento x ∈ R se llama

nilpotente si ∃n ∈ N, xn = 0 ∈ R). Probad que 1 + x ∈ R× . Deducir que la suma de un
elemento nilpotente y una unidad en un anillo es una unidad del anillo.
Problema 54. Sea f = a0 +a1 X +· · ·+an X n ∈ R[X] un polinomio univariado con coeficientes
en un anillo R. Probad que f es una unidad en R[X] si y solamente si a0 es una unidad en
R y a1 , . . . , an son nilpotentes en R. Probad también que f es nilpotente si y solamente si
a0 , a1 , . . . , an son nilpotentes en R.
Problema 55. Con las notaciones de los problemas anteriores, probar que f es divisor de
cero en R[X] si y solamente si existe a ∈ R \ {0} tal que af = 0. ( Hint: Suponed que
f = a0 + a1 X + · · · + an X n , con an 6= 0, y considerad el conjunto de todos los polinomios
en R[X] que anulan f , es decir, AnnR[X] (f ) := {g ∈ R[X] : gf = 0}, que es un ideal de
R[X]. Considérese el conjunto de los grados de los polinomios no nulos en AnnR[X] (f ), es
decir, N (f ) := {deg(g) : g 6= 0, g ∈ AnnR[X] (f )}. Si f es un divisor de cero, entonces
N (f ) ⊆ N es un conjunto no vacı́o que posee un mı́nimo. Sea m := min(N (f )) ese mı́nimo
y sea g ∈ AnnR[X] (f ) un polinomio de grado m (y, por tanto, g 6= 0). Supongamos g =
b0 + b1 X + · · · + bm X m , con bm 6= 0. Sabemos que gf = 0 y consideremos el polinomio an g.
Del hecho gf = 0, concluimos que an bm = 0 y, además, an g es un polinomio de grado menor
o igual que m − 1. Pero, además, an g ∈ AnnR[X] (f ) por ser ideal. Por tanto, an g = 0.
Inductivamente, concluir que ai g = 0 para todo i, 0 ≤ i ≤ n. Concluid que, si se da ai g = 0,
para cada i, 0 ≤ i ≤ n, entonces, en particular, ai bm = 0 para cada i, 0 ≤ i ≤ n. Concluid,
finalmente, que bm f = 0 y bm 6= 0, que es lo buscado en el problema. )
Problema 56 (Funciones Polinomiales sobre un conjunto V ). Sea R un anillo y sea
V ⊆ Rn un subjconjunto cualquiera. Se definen las funciones polinomiales sobre V del modo
siguiente:
i) Son funciones polinomiales las siguientes:
(a) Son funciones polinomiales sobre V las constantes. Es decir, dado a ∈ R, la
siguiente es una función polinomial sobre V :
a: V −→ R
x 7−→ a.
(b) Son funciones polinomiales sobre V las proyecciones. Es decir, para cada i,
1 ≤ i ≤ n, la siguiente es una función polinomial sobre V :

πi V : V −→ R
(x1 , . . . , xn ) 7−→ xi .

En el caso V = Rn escribiremos simplemente πi en lugar de πi Rn .
ii) Las funciones polinomiales son estables por las siguientes reglas:
(a) Las funciones polinomiales son estables por la suma de funciones. Es decir, dadas
dos funciones polinomiales f, g : V −→ R, la siguiente es una función polinomial
sobre V :
f + g : V −→ R
x 7−→ f (x) + g(x).
(b) Las funciones polinomiales son estables por el producto de funciones. Es decir,
dadas dos funciones polinomiales f, g : V −→ R, la siguiente es una función
polinomial sobre V :
f ·g : V −→ R
x 7−→ f (x) · g(x).
Se define el anillo de funciones polinomiales R[V ] sobre V con respecto al anillo R como el
menor subanillo de RV que satisface las propiedades (1) y (2) anteriores. Pruébese que se
trata de la R−álgebra
(contenida
en RV ) generada por R y las proyecciones canónicas (es
decir R[V ] = R[π1 V , . . . , πn V ]) conforme a la Proposición 1.4.7 (debe tenerse en cuenta que

las proyecciones de referencia πi V son las restricciones a V de las proyecciones desde Rn ).
Pruébese que dado un subconjunto V ⊆ Rn , entonces existe un epimorfismo natural de anillos
Φ : R[X1 , . . . , Xn ] −→ R[V ],
74 1. PRE-ÁLGEBRA

tal que Φ(a) = a, ∀a ∈ R y Φ(Xi ) = πi V , para 1 ≤ i ≤ n.
Problema 57. Probad que si K es un cuerpo infinito, y V = An (K) = K n el espacio afı́n

sobre el cuerpo K, entonces el morfismo de anillos
Φ : K[X1 , . . . , Xn ] −→ K[An (K)] = K[π1 , . . . , πn ],
definido en el problema anterior es un isomorfismo de anillos. ( Hint: Prueba que si K es un
cuerpo finito, entonces el núcleo Ker(Φ) del morfismo anterior es no nulo y Φ no es inyectiva).
Problema 58. Prueba que si K es un cuerpo infinito, f ∈ K[X1 , . . . , Xn ] es un polinomio
y ϕf := Φ(f ) es la función polinomial asociada a f mediante Φ del Problema 57 anterior,
Entonces, si ϕf (x) = 0, ∀x ∈ K n , se tiene f = 0 en K[X1 , . . . , Xn ]. Comprobar que esta
implicación no es cierta cuando K no es un cuerpo infinito.
Problema 59. Probad que el anillo de funciones booleanas Bn está identificado con el anillo
n
de las aplicaciones del conjunto (Z/2Z) en el cuerpo F2 = Z/2Z. Y que se tiene Bn =
F2 [An (F2 )] = F2 [π1 , . . . , πn ].
Problema 60. Conforme a la Proposición 1.4.40, un polinomio f ∈ K[X1 , . . . , Xn ] se dice ho-
mogéneo si es una suma finita de términos del mismo grado. Pruébese que si f ∈ K[X1 , . . . , Xn ]
es un polinomio homogéneo de grado d, si x = (x1 , . . . , xn ) ∈ An (K) y si λ ∈ K, se tiene:
f (λx) = λd f (x).
Prueba también que para todo polinomio homogéneo f ∈ Hd (X0 , . . . , Xn ) (con d no divisible
por la caracterı́stica de K) se verifica la siguiente identidad ( Identidad de Euler):
n
X ∂f
df := Xi .
i=0
∂Xi
Concluir que todo polinomio homogéneo f (cuyo grado no es divisible por la caracterı́stica del
cuerpo) está en el ideal homogéneo generado por sus derivadas parciales, i.e.

∂f ∂f ∂f
f∈ , ,..., .
∂X0 ∂X1 ∂Xn
Problema 61. Probad que si U = U1 ∪ U2 ⊆ X es un abierto en un espacio topológico (X, T )
con dos componentes conexas U1 , U2 disjuntas, entonces C (U ) no es dominio de integridad.
Problema 62. Sea K ⊆ E una extensión finita de cuerpos (es decir, E es un K−espacio
vectorial de dimensión finita sobre K). Para cada α ∈ E, se define la siguiente aplicación:
ηα : E −→ E
x 7−→ αx.
Se pide probar las siguientes propiedades:
i) La aplicación ηα es un endomorfismo de espacios vectoriales de E.
ii) Fijada una base ordenada B de E como espacio vectorial, existe una matriz Mα ∈
Mn (K) que es la matriz de ηα con respecto a esa base.
iii) Dados α, β ∈ E y λ ∈ K se tiene las siguientes propiedades:
ηαβ = ηα ◦ ηβ = ηβ ◦ ηα , ηα+β = ηα + ηβ = ηβ + ηα , ηλα = ληα ,
donde las operaciones entre elementos de E son las propias del cuerpo E y las opera-
ciones entre endomorfismos son las propias de EndK (E).
iv) Dados α, β ∈ E y λ ∈ K se tiene las siguientes propiedades entre matrices:
Mαβ = Mα Mβ = Mβ Mα , Mα+β = Mα + Mβ = Mβ + Mα , Mλα = λMα ,
donde las operaciones entre elementos de E son las propias del cuerpo E y las opera-
ciones entre matrices son las propias de Mn (E).
v) Si p ∈ K[X] es un polinomio tal que p(Mα ) = 0, entonces p(α) = 0.
vi) Concluir que todos los elementos de E son algebraicos sobre K.
1.4.4.1. Problemas sobre cuerpos ordenados o formalmente reales.

Problema 63 (Órdenes sobre un cuerpo). Un orden sobre un cuerpo (K, +, ·) es un sub-
conjunto P ⊆ K tal que se verifica:
P + P ⊆ P, P · P ⊆ P, P ∩ (−P ) = {0}, P ∪ (−P ) = K,
donde −P = {−x : x ∈ P } y P + P o P · P son los conjuntos
P + P := {x + y : x ∈ P, y ∈ P },
P · P := {x · y : x ∈ P, y ∈ P },
P
Sea K el conjunto de las sumas finitas de cuadrados de elementos de K usados en el
Problema 4. Es decir,
X n
X
K := {b ∈ K : ∃m ∈ N, m ≥ 1, ∃a1 , . . . , am ∈ K, b = a2i }.
i=1
Pruébese:
i) La relación definida del modo siguiente:
∀x, y ∈, x ≤P y ⇐⇒ y − x ∈ P,
es una relación de orden total sobre el cuerpo K.
ii) Pruébese que esta relación de orden total respeta las operaciones del cuerpo, es decir,
se verifican las siguientes propiedades:
• ∀x, y ∈ K, x ≤ 0, y ≥ 0 =⇒ x + y ≥ 0.
• ∀x, y, K, x ≥ 0, y ≥ 0 =⇒ xy ≥ 0. P
iii) Pruébese que si P es un orden sobre un cuerpo se verifica K ⊆ P , pero −1 6∈ P
( Hint: Para la primera afirmación, dado x ∈ K, si x ∈ P , entonces x2 ∈ P ; pero si
x 6∈ P , entonces −x ∈ P y, por tanto, x2 = (−x)2 ∈ P . Para la segunda afirmción
obsérvese que 1 = 12 = (−1)2 ∈ P .)
iv) Pruébese que cualquier relación de orden total sobre un cuerpo K que respete las
operaciones del cuerpo, viene de un orden P que satisface las propiedades indicadas
( Hint: Úsese el conjunto P := {x ∈ K : x ≥ 0} y pruébese que P es un orden).
Problema 64. Sea (K, +, ·) un cuerpo. Pruébese que las dos propiedades siguientes son equiv-
alentes:
P
i) −1 6∈ K , Pn
ii) Dados x1 , . . . xn ∈ K, si i=1 x2i = 0, entonces xi = 0 para cada i, 1 ≤ i ≤ n.
Diremos que K es un cuerpo formalmente real (o real) si se verifica algunas de las dos propiedades
equivalentes anteriores. Pruébese que Q, R y cualquier subcuerpo de R es un cuerpo formal-
mente real. Pruébese que C no es un cuerpo formalmente real.
Problema 65 (Pre-orden sobre un cuerpo). Un pre-orden ( también denominado cono
por algunos autores) sobre un cuerpo (K, +, · · · ) es un subconjunto P ⊆ K que verifica las
siguientes propiedades:
X
P + P ⊆ P, P · P ⊆ P, P ∩ (−P ) = {0}, K ⊆ P.
Decimos que un pre-orden es propio si −1 6∈ P .
i) Pruébese que P define una relación de orden parcial sobre K.
ii) Pruébese que todo orden sobre P
un cuerpo es un Ppre-orden.
iii) Pruébese que si K = Q y P = Q , entonces Q es un pre-orden sobre Q que no
es un orden sobre Q. P
iv) Pruébese que si K es un cuerpo formalmente real, entonces K es un pre-orden
propio sobre K.
v) Pruébese que si P es un pre-orden sobre K y si a 6∈ −P , el siguiente conjunto es un
pre-orden sobre K que contiene al pre-orden P :
P [a] := {x + ya : x, y ∈ P }.
vi) Con las mismas notaciones del ı́tem precedente, si P es un pre-orden propio, y si
a 6∈ −P , entonces P [a] es un pre-orden propio.
76 1. PRE-ÁLGEBRA
Problema 66. Pruébese que si K es un cuerpo formalmente real se tiene:

X \ X
K − K = {0}.
Conclúyase el siguiente resultado:

Teorema 1.4.46 (Teorı́a de Artin-Schreier sobre cuerpos formalmente reales). Un
cuerpo es formalmente real si y solamente si admite algún orden P ⊆ K
( Hint: Consideremos el conjunto de todos los pre-órdenes propios de K:
A := {P ⊆ K : P es un pre-orden propio}.
K ∈ A (cf. problemas
P
Supóngase que K es formalmente real. Pruébese que, entonces,
precedentes) y A 6= ∅. Pruébese que A satisface la hipótesis del Axioma de Zorn (i.e. toda
cadena de elementos de A con respecto a la inclusión admite cota superior en A ). Sea P un
elemento maximal de A , que existirı́a por el Axioma de Zorn. Pruébese que, necesariamente,
para cada a ∈ K se ha de tener a ∈ P o −a ∈ P . Úsese para ello que si a 6∈ −P y P es
el elemento maximal de A , entonces P [a] es pre-orden propio (cf. problemas precedentes).
Conclúyase que K = P ∪ (−P ) y, entonces, P es un orden. La otra implicación es evidente).
1.4.4.2. Problemas sobre Órdenes Monomiales y división de Hironaka. La difi-

cultad principal en la algorı́tmica con polinomios multi-variados es la ausencia de un algoritmo
de división euclı́dea en el anillo K[X1 , . . . , Xn ] de polinomios multi-variados con coeficientes
en un cuerpo K. En particular, los ideales de este anillo de polinomios no son principales y
tampoco disponemos de un algoritmo de Euclides para el cálculo del máximo común divisor15.
El introductor de las bases de Gröbner fue Hironaka en sus famosos trabajos sobre resolución
de singularidades, de 1964, que la valió la medalla Fields. H. Hironaka llamó a estas bases
“bases standard” y demostró el Teorema de División que veremos más adelante. El algoritmo
de cálculo de bases standard (o de Gröbner) es debido a B. Buchberger. Los trabajos a los que
hacemos referencia son dos artı́culos aparecidos en el Annals of Mathematics: [Hir, 1964a] y
[Hir, 1964b]. La principal observación es la siguiente:
La división euclı́dea funciona por disponer N de un buen orden como monomio que, además, es
compatible con el producto de polinomios.
Esta observación permitirá extender la división euclı́dea (de una manera menos perfecta) al
anillo de polinomios en varias variables K[X1 , . . . , Xn ]. Usaremos las notaciones y terminologı́a
de la Subsección 1.4.2.
Problema 67. Con las notaciones de la Subsección 1.4.2, consideremos el monoide (Nn , +).
Recordemos de la Definición 26 que una relación de orden ≤ sobre Nn se denomina un orden
monomial si se verifican las siguientes propiedades :
i) La relación ≤ es un buen orden en Nn , ésto es, todo subconjunto no vacı́o de Nn posee
mı́nimo.
ii) Dados α, β, γ ∈ Nn , se tiene :
Si α ≤ β, entonces α + γ ≤ β + γ.
iii) El elemento 0 := (0, . . . , 0) es el mı́nimo de Nn .
Se pide probar que los siguientes son órdenes monomiales:
• El orden de N : Es el orden usual asociado a los algoritmos de división euclı́dea en
K[X].
• Lexicográfico (≤lex ): Es el orden dado por el orden lexicográfico. Viene dado en
los términos siguientes : Dados α := (α1 , . . . , αn ), β := (β1 , . . . , βn ) ∈ Nn , diremos
α ≤lex β si y solamente si se verifica la siguiente propiedad : existe k ∈ {0, . . . , n − 1},
tal que
αi = βi , ∀i, 1 ≤ i ≤ k, αk+1 ≤ βk+1 .
15Mejor dicho, disponemos del algoritmo de división (siempre que el divisor sea un polinomio mónico con
respecto a una de las variables), y de la noción de máximo común divisor (por el Lema de Gauss (cf. 6.2) pero
ni la una ni el otro tienen las buenas propiedades que tenı́an en el caso univariado.
• Graduado Lexicográfico ≤deglex (a veces ≤grlex ): Consiste en añadir el grado

al orden ≤lex . Con las anteriores notaciones, diremos que α ≤deglex β si y solamente
si se verifica : o bien |α| < |β| o bien |α| = |β| y α ≤lex β.
• Graduado reverso lexicográfico ≤revdeglex 16 (a veces denotado ≤revgrlex ): Con
las mismas notaciones diremos que que α ≤revdeglex β si y solamente si se verifica : o
bien |α| < |β| o bien |α| = |β| y existe j ∈ {1, . . . , n} tal que αi = βi para todo i tal
que j + 1 ≤ i ≤ n y αj > βj o bien α = β.
Pruébese que ≤revdeglex no es ≤deglex , ni siquiera permutando las variables. ( Hint: Tómese el
caso de, al menos, tres variables {X1 , X2 , X3 }. Consideramos el orden revdeglex y tenemos
que los monomios de grado 2 están ordenados del modo siguiente:
X12 > X1 X2 > X22 > X1 X3 > X2 X3 > X32 ,
mientras que el ≤revdeglex da el orden siguiente:
X12 > X1 X2 > X1 X3 > X22 > X2 X3 > X32 .)
Antes de concluir, introduzcamos un poco más de notación sobre la representación densa de
polinomios f ∈ K[X1 , . . . , Xn ]. Supongamos fijado un orden monomial ≤ sobre Nn :
i) Grado de f : deg(f ) es el máximo de los grados de sus términos (o, equivalentemente,
el máximo de su soporte supp(f ) como serie de potencias formal).
ii) Multigrado de f : md(f ) es el máximo de los multigrados de los términos de f con
respecto el orden monomial ≤ fijado.
iii) Término director de f : LT (f ) es el término de f cuyo multigrado coincide con el
multigrado de f
iv) Coeficiente director de f : LC(f ) es el coeficiente del LT (f ).
Problema 68 (División de Hironaka). Es el resultado crucial para entender las bases
de Gröbner. En principio, petende ser un análogo a la división euclı́dea. Supongamos que
disponemos de un orden monomial ≤ sobre Nn . Definamos el escalón asociado a un expo-
nente monomial α ∈ Nn . Se define mediante :
E(α) := α + Nn = {α + β : β ∈ Nn } ⊆ Nn ,
donde + es la operación del monoide (Nn , +). Pruébese que
E(α) ≡ {X µ : X α | X µ },
donde | significa “divide” en el anillo de polinomios K[X1 , . . . , Xn ].
Pruébese el siguiente resultado, conocido como División de Hironaka:
Existe un algoritmo que realiza la tarea siguiente :
Dados f1 , . . . , fr ∈ K[X1 , . . . , Xn ], y dado g ∈ K[X1 , . . . , Xn ]. Supongamos fijados los multi-
grados de cada fi mediante:
αi := md(fi ), 1 ≤ i ≤ r.
Definamos los conjuntos de exponentes monomiales (multi-ı́ndices) en el monoide (Nn , +):
∆1 := E(α1 ),
∆2 := E(α2 ) \ ∆1 ,
∆3 := E(α3 ) \ (∆1 ∪ ∆2 ),
..
.
∆r := E(αr ) \ ∪r−1

i=1 ∆i ,
∆ := Nn \ (∪ri=1 ∆i ) .
El algoritmo anterior genera polinomios g1 , . . . , gr , h ∈ K[X1 , . . . , Xn ] tales que se satisfacen
las siguientes propiedades :
i) Para cada i, 1 ≤ i ≤ r, los términos del polinomio gi tienen multigrado en ∆i ,
ii) Los términos del polinomio h tienen multigrado en ∆,
16No se trata de un orden obtenible mediante los anteriores y una permutación de las variables. Debe
señalarse que, a pesar de lo extraño de su definición, suele ser el orden que mejor se comporta en la ejecución del
algoritmo de cálculo de bases de Gröbner. No se sabe muy bien el porqué de este fenómeno con este particular
orden monomial.
78 1. PRE-ÁLGEBRA
iii) Se verifica la siguiente igualdad :

g := g1 f1 + · · · + gr fr + h.
iv) Los polinomios g1 , . . . , gr verificando las anteriores propiedades son únicos y se de-
nominan cocientes de la división de Hironaka.
v) El polinomio h es único y se denomina resto de la división de Hironaka.
Problema 69. Pruébese el Lema 1.4.28. Es decir, pruébese que dada µ ∈ Nn un lista de
exponentes. Entonces, el siguiente conjunto es finito:
Tµ := {(α, β) ∈ Nn × Nn : α + β = µ}.
Además, si µ = (µ1 , . . . , µn ), el cardinal de Tµ satisface:
n
Y
] (Tµ ) = (µi + 1).
i=1
( Hint: Por inducción en n.)
Problema 70. Prueba la Proposición 1.4.12 sobre la caracterı́stica de un cuerpo.
Problema 71 (Algoritmo de Karastuba-Ofman, [KO, 1962]). Se trata de analizar un
algoritmo más eficiente que el escolar para la multiplicación de números enteros. Como el signo
no es problema, nos dedicaremos a estudiar simplemente el producto de dos números naturales.
Consideremos, por tanto, dos número naturales N, M ∈ N dados por su expansión en una base
cualquiera c ≥ 2. Supongamos:
N := an cn + an−1 cn−1 + · · · + a0 , an 6= 0,
M := bm cm + cm−1 cm−1 + · · · + b0 , bm 6= 0,
donde ai , bj ∈ {0, . . . , c − 1}. Simplifiquemos suponiendo que n ≥ m y rellenemos (añadiendo
0’s si fuera necesarios) y escribiendo
N := an cn + an−1 cn−1 + · · · + a0 ,
M := bn cn + cn−1 cn−1 + · · · + b0 .
Digamos que n es la talla de ambos números (que es, esencialmente, el logaritmo en base c del
mayor de ambos).
Se pide probar:
i) El número de operaciones elementales (que se pueden interpretar como el número de
veces que se acude a las tablas de multiplicar “en base c”) del algoritmo aprendido en
la escuela es del orden O(n2 ).
Hint:Recuérdese que
O(f ) := {g : N −→ R+ : ∃c ∈ R+ , ∃nc ∈ N, g(n) ≤ cf (n), ∀n ≥ nc }.
ii) Supongamos que k ∈ N dado por k = n/2 si n es par o k = (n + 1)/2 si n es impar.
Los elementos N y M se pueden escribir del modo siguiente:
N := A1 ck + A0 , M := B1 ck + B0 ,
donde A0 , A1 , B0 , B1 ≤ ck . ( Hint: Sacar “factor común” ck )
iii) Con la descomposición precedente, sea P ∈ N es el producto N M . Se tiene:
P := N M = (A1 ck + A0 )(B1 ck + B0 ) = D2 c2k + D1 ck + D0 ,
donde:
D2 := A1 B1 , D0 := A0 B0 , D1 := (A0 + A1 )(B0 + B1 ) − D2 − D0 .
Concluir que para multiplicar dos números naturales de talla a lo sumo n (i.e. menores
que cn+1 ), basta con hacer 3 multiplicaciones de números naturales de talla (n + 1)/2.
iv) Concluir que si T (n) es la función que mide el número de operaciones elementales
necesarias para multiplicar dos números enteros de talla a lo sumo n, entonces
T (n) ∈ O(nlog2 3 ).
Concluir que el método de multiplicación de números enteros aprendido en la escuela
no es un método eficiente (i.e. que los hay mejores).
CAPı́TULO 2
Módulos, Determinantes y Teorema de Hamilton-Cayley

(“Begin at the beginning and go on till...”)
“On earth there is nothing great but [hu]man; in [hu]man

there is nothing great but mind.”
W.R. Hamilton, Lectures on Metaphysics, 1860.
“...‘Begin at the beginning,’ the King said, very gravely, ‘and

go on till you come to the end:...’ ”
L. Carroll, Alice’s Adventures in Wonderland, 1865.
Índice
2.2. Módulos, submódulos, morfismos de módulos 80
2.2.1. Generalidades 80
2.2.2. Operaciones básicas con submódulos e ideales 86
2.2.3. Teoremas de isomorfı́a 91
2.2.4. Módulos libres y bases 94
2.2.5. Diagramas conmutativos, complejos y sucesiones exactas (Opcional) 99
2.2.6.1. Breve recordatorio de Teorı́a elemental del Endomorfismo (en
caso de no disponer de formación previa) 104
2.2.6.2. Futuro: Homologı́a Singular 111
2.2.6.3. Futuro: Homotopı́a 111
2.2.6.4. Futuro: Co-homologı́a de de Rahm 111
2.3. Determinante. Teorema de Hamilton-Cayley 111
2.3.1. Determinante: propiedades básicas. 112
2.3.2. La Fórmula de Laplace 116
2.3.3. Polinomios con coeficiente matricial y matrices con coordenadas
polinomiales. Teorema de Hamilton-Cayley 126
2.3.4.1. Complejidad Algebraica en unos ejemplos 132
2.3.4.2. Sumas de Newton y Funciones simétricas elementales. 134
2.1. Introducción
El Capı́tulo introduce los R−módulos (noción fundamental, junto con la noción de anillo,
del Álgebra Conmutativa). Si el ejemplo primario puede ser el ejemplo de los K−espacios
vectoriales, pronto se observa la diferencia entre disponer de escalares en un cuerpo o en un
anillo cualquiera, simplemente considerando los grupos abelianos (noción equivalente a la de
Z−módulo), donde aparece la torsión o los divisores de cero de manera natural. Nos dedicamos
a establecer la noción y a demostrar algunas propiedades muy elementales, con una fuerte carga
de notación y cuantos ejemplos sea posible a partir del acerbo cultural de la audiencia.
La siguiente notable diferencia entre R−módulos y K−espacios vectoriales es la dificultad de
poseer una base en los R−módulos que, de forma elemental, existe en el caso de los K−espacios
vectoriales finitamente generados gracias al Teorema del Reemplazamiento. Ante la posible
ausencia de bases, hacemos una primera presentación de los R−módulos que poseen bases:
módulos libres. Por falta de suficientes medios de lenguaje, dejamos para más adelante la
discusión de si la existencia de base en R−módulos libres comporta la existencia de algún tipo
79
80 2. MÓDULOS, DETERMINANTES, HAMILTON-CAYLEY
de unicidad (como la dimensión en el caso de K−espacios vectoriales) y nos conformamos en

hablar, sin entrar en esa unicidad, de R−módulos de rango finito.
Los R−módulos de rango finito parecen apelar, casi inmediatamente, al uso de matrices con
coordenadas en un anillo Mn×m (R) como medio de representación de los morfismos entre
R−módulos de rango finito. Ciertamente, como R ya no es un cuerpo, estamos muy limitados
en lo que respecta al uso de las técnicas gaussianas de diagonalización (i.e., salvo equivalencia
de matrices): no podemos siempre dividir por un elemento no nulo si éste no es unidad del
anillo. Pero algunos elementos clásicos se preservan como son el determinante y el celebrado
Teorema de Hamilton-Cayley.
Algunos autores prefieren decir Teorema de Cayley-Hamilton, usando el orden lexicográfico en
su denominación. Personalmente, he preferido el orden inverso (i.e. Teorema de Hamilton-
Cayley) valorando la prioridad en el descubrimiento del resultado. Ası́, fue primero W.R.
Hamilton quien “descubrió” en resultado en [Hamilton, 1853], aunque de forma limitada para
cálculos de inversos de funciones lineales de cuaterniones (cuerpo no conmutativo que anunció
en [Hamilton, 1843] y a cuya defensa dedicó el texto [Hamilton, 1853]). Posteriormente,
será A. Cayley quien re-exprese el re-exprese esta idea primaria de Hamilton como un teorema
para matrices 2 × 2 y anuncie su validez para matrices 3 × 3 en [Cayley, 1858]. Habrá que
esperar a F.G. Frobenius para tener una forma completa del resultado en [Frobenius, 1878].
Ası́, en puridad, deberı́amos llamar Teorema de Frobenius a lo que la costumbre ha dado en
llamar Teorema de Cayley-Hamilton. Para no confundir más al lector, dejemos establecido el
nombre elegido en el tı́tulo del Capı́tulo.
Estos autores trabajan en el nacimiento del Álgebra Lineal, sujeto que tuvo sus dificultades
en establecerse y tendrá que esperar a Peano para poder hablar de espacios vectoriales en el
año 1900. Obviamente, todas estas disquisiciones tratan de matrices sobre cuerpos donde los
métodos de C.F. Gauss y el pensamiento de Frobenius sobre extensiones finitas de cuerpos nos
facilitan la argumentación. Pero en anillos generales, muchas de aquellas pruebas clásicas (con
matrices en Mn (K)) no sirven por las dificultades inherentes al uso de coordenadas en un anillo
R, posiblemente con divisores de cero y en el que no todo elemento no nulo es unidad.
La primera de las dificultades que uno encuentra es la noción de determinante. En muchos
casos, cada vez más habituales, se habla de la noción de determinante sólo para matrices
A ∈ Mn (K), donde K es un cuerpo. Y se define, si es que se define, que cada vez es más
inhabitual, a partir de una triangulación de A por métodos gaussianos. Pero se “olvidan”
que K[X] ya no es cuerpo sino dominio de integridad y que el polinomio caracterı́stico de
una matriz A ∈ Mn (K) es, en realidad, el determinante de una matriz A(X) ∈ Mn (K[X]).
Como consecuencia, todas esas definiciones y todas las propiedades que se le suponen viven
en un limbo de incertidumbre rayando la falsedad, lo cual es, desgraciadamente, cada vez más
habitual: impartir matemáticas como religión, donde la audiencia cree fervientemente lo que se
le dice. Porque o bien le importa poco una cierta dosis de verdad (i.e. le da lo mismo) o bien no
es capaz de percibir la incoherencia de la presentación. Si, al menos, explicaran que el cuerpo
de fracciones de K[X] (K(X) = qf (K[X])) puede servir para razonar, a lo mejor cerraban
bien sus presentaciones. Parafraseando el estribillo de G. Coppini “Malos tiempos para la ...”
Matemática.
Ası́ que el texto se carga de paciencia y, haciendo un incómodo rodeo, nos dedicamos a introducir
el determinante de matrices cuadradas con coordenadas en un anillo cualquiera y a mostrar sus
principales propiedades. Destacamos la Fórmula de Laplace (y su generalización) que nos
ayudará a mostrar como el determinante surge como el producto de una matriz por su adjunta.
Con ello, podemos dar una sencilla prueba del Teorema de Hamilton-Cayley, no sin hacer sufrir
al lector en el farragoso (agotador, muchas veces) detalle de las propiedades del determinante
de una matriz A ∈ Mn (R).
2.2. Módulos, submódulos, morfismos de módulos

2.2.1. Generalidades.
Definición 27 (Módulo). Sea (R, +, ·) un anillo. Llamaremos R−módulo a toda terna

(M, +, ·R ) donde:
i) (M, +) es un grupo abeliano,
2.2. MÓDULOS, SUBMÓDULOS, MORFISMOS DE MÓDULOS 81
ii) ·R : R × M −→ M es una acción a izquierda del monoide (R, ·) sobre M (usualmente

denominada operación externa), que denotaremos mediante ·R (x, m) := xm, y que
verifica dos propiedades distributivas:
(a) Propiedad Distributiva I: ∀x ∈ R, ∀m, n ∈ M, x(m + n) = xm + xn.
(b) Propiedad Distributiva II: ∀x, y ∈ R, ∀m ∈ M, (x + y)m = xm + ym.
Observación 2.2.1 (Módulo: otras definiciones equivalentes). Recordando nuestra definición

de acción de un monoide sobre un conjunto (ver Definición 11), la anterior definición es una
simplificación de la forma en que otros autores definen R−módulo. Por ello las reproducimos
aquı́, notando que, obviamente, son definiciones equivalentes:
Sea (R, +, ·) un anillo. Llamaremos R−módulo a toda terna (M, +, ·R ) donde:

i) (M, +) es un grupo abeliano,
ii) ·R : R × M −→ M es una aplicación, que se denomina operación externa y que se
representa mediante ·R (x, m) := xm, verificando:
(a) Propiedad Distributiva I: ∀x ∈ R, ∀m, n ∈ M, x(m + n) = xm + xn.
(b) Propiedad Distributiva II: ∀x, y ∈ R, ∀m ∈ M, (x + y)m = xm + ym.
(c) Propiedad Asociativa: ∀x, y ∈ R, ∀m ∈ N, (xy)m = x(ym).
(d) Elemento Neutro: ∀m ∈ M, 1m = m.
Definición 28 (Submódulo). Sea R un anillo y sean (M, +, ·R ) un R−módulo. Un subgrupo

(N, +) del grupo aditivo (M, +) se denomina submódulo de M si, además, verifica:
∀x ∈ R, ∀n ∈ N, xn ∈ N.
Ejemplo 2.2.2. Los siguientes son ejemplos básicos de módulos y submódulos:

i) Los ejemplos más evidentes de módulos son los espacios vectoriales: Un espacio vec-
torial V sobre un cuerpo K no es otra cosa que un K−módulo (ambas nociones son
equivalentes). Sus submódulos son los subespacios, obviamente.
ii) Los anillos son módulos sobre sı́ mismos. Y los submódulos de los anillos (R, +, ·)
como R−módulos sobre sı́ mismos son, precisamente, sus ideales (cf. Definición 23).
En cambio, los subanillos sólo son submódulos cuando son el total.
iii) Existe un R−módulo dado por el grupo abeliano con un único elemento, que es el
R−módulo {0} y denotaremos simplemente por 0.
iv) si M es un R−módulo, los subgrupos {0} y M de M son, obviamente, submódulos.
v) Si considero un R−módulo (M, +, ·R ) y un elemento m ∈ M , la órbita por la acción
del monoide (R, ·) sobre M y definida por el punto m ∈ M es un submódulo de M :
OR (m) := {λm : λ ∈ R}.
Normalmente este submódulo se presenta mediante Rhmi o mediante Rm y se deno-
mina submódulo generado por m. Obsérvese que los ideales principales de los anillos
son, precisamente, las órbitas de sus elementos por la acción de (R, ·) como monoide
actuando sobre R en su rol de R−módulo.
vi) En un sentido general se habla de producto y co-producto (o suma directa) de módulos.
Dada una familia de módulos {Mi : i ∈ I}, denotaremos
Y [ [
Mi := {ϕ : I −→ Mi : ϕ(i) ∈ Mi , ∀i ∈ I} ⊆ ( Mi )I .
i∈I i∈I i∈I
Nótese
Q que es esencial la propiedad ϕ(i) ∈ Mi , ∀i ∈ I. Definimos las operaciones sobre
i∈I Mi mediante el Qclásico procedimiento de “operar coordenada a coordenada”. Es
decir, dados ϕ, ψ ∈ i∈I Mi y dado a ∈ R, definimos las siguientes correspondencias:
S
ϕ + ψ : I −→ i∈I Mi
i 7−→ ϕ(i) + ψ(i).
S
a ·r ϕ : I −→ i∈I Mi
i 7−→ a ·R ϕ(i),
donde a ·R ϕ(i) es el resultado de la acción de (R, ·) sobre Mi (porque ϕ(i) ∈ Mi ).

En sencilo verificar que ambas correspondencias
Q ϕ + ψ y a ·r ϕ son aplicaciones
Q y que
ambas están son elementos de i∈I Mi . Es fácil también verificar que ( i∈I Mi , +)
es un grupo abeliano y que la siguiente es una acción a izquierda que satisface las dos
distributivas indicadas en la definición de R−módulo:
Q Q
·R : (R, ·) × i∈I Mi −→ i∈I Mi
(a, ϕ) 7−→ a ·R ϕ.
Q
En conclusión, ( i∈I Mi , +, ·R ) será un R−módulo conocido como el R−módulo pro-
ducto de la familia de R−módulos {Mi : i ∈ I}.
vii) Adicionalmente (como ya hicimos en el Capı́tulo precedente),Q se puede considerar el
soporte definido del modo obvio siguiente para cada f ∈ i∈I Mi :
supp(f ) := {i ∈ I : f (i) 6= 0Mi }.
Q
Nótese que si f, g ∈ i∈I Mi y si a ∈ R, se tiente:
supp(f + g) ⊆ supp(f ) ∪ supp(g),
supp(a ·R f ) ⊆ supp(f ).
Q
Por tanto, operando con elementos de i∈I Mi que tienen soporet finito, obtenemos un
nuevo
Q elemento que tiene soporte finito. Por eso, podemos considerar el subconjunto
de i∈I Mi de los elementos f con soporte finito. Se denomina el co-producto de la
familia {Mi : i ∈ I} (o también la suma directa):
a Y
Mi = ⊕i∈I Mi := {f ∈ Mi : supp(f ) es un conjunto finito}.
i∈I i∈I
Q
Por lo indicado sobre el soporte, ⊕i∈I Mi es un submódulo de i∈I Mi y, por tanto,
un R−módulo.
viii) Los anillos R[X1 , . . . , Xn ] y R[[X1 , . . . , Xn ]] tienen una estructura natural de R−módulo
que es compatible con sus operaciones como anillo.
ix) Nótese que si X es un conjunto y R es un anillo, el conjunto RX de las aplicaciones de
X en R es un producto cartesiano. Denotemos Rx = R para cada x ∈ X y, observamos
que Y
Rx = R X .
x∈X
Por tanto RX es un R−módulo. En particular, tomando X = Nn , en el anillo de
n
series de potencias formales R[[X1 , . . . , Xn]], cuyo conjunto base es RN , tenemos una
estructura de R−módulo compatible con su estructura de anillo. Más aún, el anillos
de series de potencias formales se puede identificar (como R−módulos y sólo como
R−módulos) del modo siguiente:
Y
R[[X1 , . . . , Xn ]] := Rµ ,
µ∈Nn
donde {Rµ : µ ∈ Nn } son copias del anillo R (i.e. Rµ = R) repetidas tantas veces
como elementos µ ∈ Nn . Por tanto, R[[X1 , . . . , Xn ]] es identificable como R−módulos
n
con RN , pero no son identificables como anillos, como ya se indición en su lugar.
x) De modo análogo a la construcción precedente, podemos considerar un conjunto X
cuanlquiera y una familia {Rx : x ∈ X} de R−módulos, donde Rx = R es el propio
anillo. Podemos considerar la suma directa de estos módulos que denotaremos del
modo siguiente: M M
Rx = R.
x∈X X
Se trata de un R−módulo que tendrá una importancia relevante en la siguiente sección
del Capı́tulo. Nótese que en el caso X = Nn , el anillo R[X1 , . . . , Xn ] se puede idetificar
con: M
R[X1 , . . . , Xn ] := Rµ ,
µ∈Nn
n
donde, de nuevo, {Rµ : µ ∈ N } son copias del anillo R (i.e. Rµ = R). Una vez más,
no es posible identificar ambos conjuntos como anillos.
xi) Sea f : R −→ B un morfismo de anillos(o, equivalentemente, una estructura de

R−álgebra sobre B, ver Definición 23) Podemos definir sobre B una estructura de
R−módulo sobre B mediante:
∗f : R × B −→ B
(2.2.1)
(x, b) 7−→ x ∗f b := f (x) ·B b,
donde ·B es el producto de B como anillo. Se llama la estructura de R−módulo sobre B
determinada por el morfismo f . Esto incluye el caso de subanillos (f será la inclusión)
y, por tanto, son R−álgebras C (X), C 1 (X), . . . , C ∞ , . . . y son C−álgebras C (X, C) y
H(X).
xii) Recı́procamente al ı́tem anterior, si (R, +, ·) y (B, +, ∗) son dos anillos y supongamos
que B tiene una estructura de R−módulo:
·R : R × B −→ B
(λ, b) 7−→ λ ·R b.
Supongamos que, adicionalmente, se satisface la siguiente propiedad (que hace com-
patible la estructura de R−módulo de B con su estructura de anillo):
(2.2.2) ∀λ, θ ∈ R, ∀a, b ∈ B, (λ · θ) ·R (a ∗ b) = (λ ·R a) ∗ (θ ·R b) ,
donde 1B es el elemento unidad del producto de B como anillo. Entonces podemos
definir un morfismo de anillos ϕ : R −→ B a partir de esa operación externa y dada
mediante:
ϕ : R −→ B
λ 7−→ ϕ(λ) := λ ·R 1B ,
Si ahora construimos la estructura de R−módulo de B asociada a este morfismo de
anillos ϕ: la operación externa ∗ϕ definida como en la Identidad (2.2.1) anterior, se
tendrá: ∗ϕ = ·R . Es decir, los morfismos entre dos anillos R y B están identificados
con las estructuras de R−módulo sobre B que satisfacen la identidad (2.2.2). Dicho
de otro modo:
Una R−álgebra es un anillo (A, +, ·) que posee una estructura de R−módulo (A, +, ·R )
y que satisface la Identidad (2.2.1).
El Problema 85 pedirá que se verifiquen todos los detalles de esta afirmación y,
por tanto, la frase recientemente citada. En particular, los anillos R[X1 , . . . , Xn ] y
R[[X1 , . . . , Xn ]] son R−álgebras que, además, contienen al anillo R (es decir, el mor-
fismo entre R y cualquiera de ellos es simplemente la incusión) ι : R ,−→ R[X1 , . . . , Xn ] ⊆
R[[X1 , . . . , Xn ]].
xiii) Los conjuntos de matrices Mn×m (R) tienen una estructura natural de R−módulo.
Simplemente, obsérvese que si escribimos [n] := {1, . . . , n} y [m] := {1, . . . , m}, las
matrices son simplemente el conjunto descrito por la igualdad siguiente:
Mn×m /R) = R[n]×[m] := {f : [n] × [m] −→ R : f es aplicación},
y su estructura se sigue de lo descrito para el producto cartesiano de R−módulos.
Ejemplo 2.2.3 (Grupos abelianos). Los grupos abelianos no son otra cosa que Z−módulos
(ambas nociones son equivalentes). Obviamente, todo Z−módulo es un grupo abeliano, ası́ que
se trata de ver el otro contenido. Para ello consideremos la siguiente notación para un grupo
abeliano (G, +):
Dado m ∈ N y g ∈ G, definamos:
• Si m = 0 ∈ N, definamos 0 · g = 0G ,
• Si m ≥ 1, definamos m · g = g + (m − 1) · g.
Para cada número entero n ∈ Z, definamos
• Si n ∈ N, definamos n · g ∈ G es el definido en el apartado anterior,
• Si n ≤ 0, definamos n · g = (−n) · (−g) (que está definido porque (−n) ∈ N).
Tenemos una aplicación:
·Z : Z × G −→ G
(n, g) 7−→ n · g.
Además, (G, +, ·Z ) es un Z−módulo. Los submódulos de un grupo abeliano son, precisamente,

sus subgrupos.
Ejemplo 2.2.4 (Teorı́a del endomorfismo). Sea V un espacio vectorial sobre un cuerpo K,
ϕ : V −→ V una aplicación lineal. Podemos definir una estructura de K[X]−módulo sobre
V que se conoce como Teorı́a del endomorfismo. Se define del modo siguiente: Definamos
recursivamente:
• ϕ0 = IdV (la identidad),
• ϕ1 = ϕ,
• Para n ≥ 2, ϕn := ϕ ◦ ϕn−1 , donde ◦ es la composición.
Dado p ∈ K[X], de la forma:
p := ao + a1 X + a2 X 2 + · · · an X n ,
definimos p(ϕ) : V −→ V mediante:
p(ϕ) := a0 IdV + a1 ϕ + a2 ϕ ◦ ϕ + · · · + an ϕn .
Finalmente, definimos
·K[X] : K[X] × V −→ V
(p(X), v) 7−→ p(ϕ)(v) ∈ V.
Se tiene que (V, +, ·K[X] ) es un K[X]−módulo. Los submódulos de V como K[X]−módulo serán
los subespacios vectoriales (como K−espacio vectorial) de V invariantes por ϕ (ver Problema
78).
Definición 29 (Morfismos). Sea R un anillo y sean M, M 0 dos R−módulos. Un morfismo

de grupos f : (M, +) −→ (M 0 , +) se denomina morfismo de R−módulos si verifica:
∀x ∈ R, ∀m ∈ M, f (xm) = xf (m).
El conjunto de todos los morfismos de R−módulo entre M y M 0 se denota mediante HomR (M, M 0 ).
Definición 30 (Mono, epi, iso, endo, auto....morfismo de R−módulos). Sea (R, +, ·)

un anillo, (M, +, ·R ) y (N, +, ·R ) dos R−módulos. Sea f ∈ HomR (M, N ) un morfismo de
R−módulos entre M y N . Definimos los términos siguientes:
i) Diremos que f es monomorfismo si lo es como morfismo de grupos f : (M, +) −→
(N, +) (equivalentemente, si como aplicación es inyectiva).
ii) Diremos que f es epimorfismo si lo es como morfismo de grupos f : (M, +) −→ (N, +)
(equivalentemente, si como aplicación es suprayectiva).
iii) Diremos que f es isomorfismo si es monomorfismo y epimorfismo a la vez (equiva-
lentemente, si como aplicación es biyectiva). Esto, en particular significa que f es
isomorfismo si y solamente si existe otro morfismo de R−módulos g ∈ HomR (M, N )
tal que:
g ◦ f = IdM , f ◦ g = IdN .
iv) Diremos que es f endomorfismo si M = N . Al conjunto de los endomorfismos de un
R−módulo M lo denotaremos mediante EndR (M ) := HomR (M, M ).
v) Diremos que f es automorfismo si es endomorfismo e isomorfismo a la vez.
Ejemplo 2.2.5. i) En el caso de espacios vectoriales, HomK (V, W ) son las aplicaciones
lineales.
ii) En el caso de grupos abelianos, HomZ (A, B) son los morfismos de grupos entre (A, +)
y (B, +).
iii) Consideremos una familia cualquieraQde R−módulos {Mi : i ∈ I}. Consideremos los
R−módulos producto y co-producto i∈I Mi y ⊕i∈I Mi . Los siguientes son morfismos
de R−módulos:
(a) Para cada j ∈ I,

Q
πj : Mi
i∈IS −→ Mj
ϕ : I −→ i∈I Mi 7−→ ϕ(j).
Se denominan proyecciones naturales del producto cartesiano.
(b) Para cada j ∈ I y cada m ∈ Mj definamos el elemento
S
λj (m) : I −→ i∈I Mi
m, si i = j
i 7−→
0, en otro caso.
Q
Claramente λj (m) ∈ ⊕i∈I Mi ⊆ i∈I Mi . Definimos
λ j : Mj −→ ⊕i∈I Mi
m 7−→ λj (m).
Se denominan inclusiones naturales en la suma directa.
Observación 2.2.6. Obsérvese que los morfismos de R−módulos f : M −→ N , preservan el

anillo R. En cambio, si f : R −→ B es un morfismo de anillos, cambia el anillo y nos permite
definir una estructura de R−módulo sobre cualquier B−módulo. Estas estructuras cambian,
obviamente, la percepción del módulo. Como ejemplo clásico el espacio vectorial complejo Cn es
un C−espacio vectorial de dimensión n, pero es también un R−espacio vectorial de dimensión
2n. Ası́, C es una recta compleja, pero un plano real. De modo similar, tenemos el morfismo
dado por la inclusión Q ,→ R. Si n ≥ 1, Rn es un espacio vectorial de dimensión R sobre
R pero tiene dimensión infinita no numerable como Q−espacio vectorial. De hecho, el único
espacio vectorial real V que tiene dimensión numerable como Q−espacio vectorial es el espacio
vectorial nulo V = {0}.
Proposición 2.2.7. Sean M y N dos módulos sobre un anillo R.

i) Un subgrupo M 0 de (M, +) es submódulo si y solamente el grupo cociente (M/M 0 , +)
es R−módulo con la acción a izquierda ∗R : (R, ·) × M/M 0 −→ M/M 0 dada mediante:
x ∗R (m + M 0 ) := xm + M 0 , ∀x ∈ R, ∀m + M 0 ∈ M/M 0 .
ii) Para cada morfismo f : M −→ N se verifica:
(a) Para cada submódulo S de M , f (S) := {f (m) : m ∈ S} es submódulo de N .
Un caso particular es el submódulo imagen de f Im(f ) := f (M ).
(b) Para cada submódulo T de N , f −1 (T ) := {m ∈ M ; f (m) ∈ T } es un submódulo
de M . Un caso particular es el submódulo conocido como el núcleo ker(f ) :=
f −1 ((0)).
iii) El conjunto HomR (M, N ) es un R−módulo con las operaciones dadas por las sigu-
ientes aplicaciones:
• La estructura de grupo abeliano (HomR (M, N ), +) es dada mediante:
+: HomR (M, N ) × HomR (M, N ) −→ HomR (M, N )
(f, g) 7−→ f + g,
donde
f +g : M −→ N
m 7−→ f (m) + g(m).
• La acción a izquierda del monoide (R, ·) es dada mediante:
·R : (R, ·) × HomR (M, N ) −→ HomR (M, N )
(x, f ) 7−→ xf,
donde
xf : M −→ N
m 7−→ x ·R f (m),
donde x ·R f (m) es la operación externa de (R, ·) sobre N .
Demostración. La prueba es un mero ejercicio.
Observación 2.2.8. Obviamente esta Proposición nos da toda una colección adicional de
módulos a través de operaciones de cociente y tomar morfismos.
Nótese también la discrepancia aparente entre el ı́tem ii), (a) de esta Proposición 2.2.7 y el ı́tem
iii), (b) de la Proposición 1.4.9. Si a es un ideal de un anillo R y f : R −→ T es un morfismo de
anillos, entionces f (a) es un submódulo de T como R−módulo. Pero no hay discrepancia salvo
en apariencia porque para ser ideal de T debemos exigir que f (a) sea submódulo de T ¡como
T −módulo!.
Definición 31 (Co-Núcleo). Dado un morfismo de R−módulos f : M −→ N , se define el

co-núcleo de f como el R−módulo Coker(f ) := N/ Im(f ).
Proposición 2.2.9. Dado un morfismo de R−módulos f : M −→ N , se verifican las siguientes
propiedades:
i) Son equivalentes las propiedades siguientes:
• f es inyectiva (es decir, es un monomorfismo),
• ker(f ) = 0.
ii) Son equivalentes las propiedades siguientes:
• f es suprayectiva (es decir, es un epimorfismo),
• Im(f ) = N ,
• Co − ker(f ) = 0.
iii) Son equivalentes las propiedades siguientes:
• f es biyectiva (es decir, es un isomorfismo),
• ker(f ) = 0 y Co − ker(f) = 0.
En este caso, su inversa f −1 : N −→ M también es un morfismo de R−módulos.
Demostración. Igual que en el caso de la Proposición precedente, las afirmaciones son
obvias.
Ejemplo 2.2.10. Siguiendo las notaciones del apartado iii) del Ejemplo 2.2.5 precedente, es
sencillo verificar que se tienen las siguientes propiedades:
Q
i) Para cada j ∈ I, cada proyección natural πj : i∈I Mi −→ Mj es un epimorfismo de
R−módulos.
ii) Para cada j ∈ I, cada inclusión natural λj : Mj −→ ⊕i∈I Mi es un monomorfismo de
R−módulos.
Ejemplo 2.2.11 (Módulo dual). Sea M un R−módulo y consideremos el R−módulo que se

proyecta sobre M , HomR (R, M ). Como se trata de morfismo de R−módulos para cada λ ∈ R
y dado f ∈ HomR (R, M ), tendremos que f (λ) = f (λ · 1R ) = λf (1R ). De hecho, tendremos un
morfismo natural de R−módulos definido del modo siguiente:
ev1 : HomR (R, M ) −→ M
f 7−→ f (1R ).
Es sencillo verificar que ev1 (evaluar en 1R ∈ R) es un isomorfismo de R−módulos:
HomR (R, M ) =∼ M.
De otro lado, podemos considerar el R−módulo HomR (M, R) que se denomina R−módulo
dual de M y se denota mediante M ∗ . En espacios vectoriales de dimensión finita se puede
probar el isomorfismo entre V ∗ y V y, sobre todo (V ∗ )∗ = V . Esto no sucederá en general para
R−módulos. El papel del uso del espacio vectorial dual V ∗ en Geometrı́a Proyectiva clásica (y
elemental) será desarrollado en otro tipo de curso.
2.2.2. Operaciones básicas con submódulos e ideales.

Proposición 2.2.12. La intersección de una familia cualquiera de submódulos es un submódulo.
Del mismo modo, la intersección de una familia cualquiera de ideales es un ideal.
Demostración. Mero ejercicio de comprobación formal.
Definición 32 (Submódulo generado por un subconjunto). Dado un subconjunto F ⊆

M de un R−módulo M. Llamaremos submódulo generado por F al menor submódulo que le
contiene. Es decir, usando la Proposición precedente, el submódulo generado por F y que
denotaremos por RhFi viene dado por la siguiente identidad:
\
RhFi := {N : F ⊆ N, N es submódulo de M }.
Diremos que F es un sistema generador del submódulo N de M si N = RhFi.
Del mismo modo definiremos el ideal de un anillo R generado por un subconjunto F ⊆ R como
el menor ideal de R que contiene a F . La notación que usaremos en este caso es ligeramente
diferente y escribiremos (F ) para denotar el ideal generado por F . Y diremos, igualmente, que
F es un conjunto (o sistema) de generadores del ideal (F ), dado que el anillo ambiente R se
sobrentiende.
Proposición 2.2.13. Sea M un R−módulo y F ⊆ M un subconjunto. La siguiente expresión

caracteriza el submódulo generado por F:
X
RhFi := {m ∈ M : ∃G ⊆ F finito, y ∃{xg ∈ R : g ∈ G} ⊆ R, tales que m = xg g}.
g∈G
En particular, una identidad similar se tendrá para ideales de un anillo. Es decir, si F ⊆ R es

un subconjunto de un anillo R se tiene:
X
(F ) := {m ∈ R : ∃G ⊆ S finito, y ∃{xg ∈ R : g ∈ G} ⊆ R, tales que m = xg g}.
g∈G
Demostración. Bastará con hacerlo para submódulos porque, al cabo, los ideales de un
anillo R son sus submódulos como R−módulo. Para pobar la identidad basta con demostrar
primero que la expresión de la derecha define un submódulo de M . Esto es mera escritura
cuidadosa de la fórmula expresada. Una vez probado que es submódulo, se prueba que para
cualquier otro submódulo N de M que contenga a F, N debe contener todos los elementos
que aparecen en el conjunto de la derecha de la igualdad buscada. Como RhFi es el menor
submódulo que contiene a F la prueba se concluirá.
Notación 2.2.14 (Módulos, submódulos e ideales finitamente generados). Módulos
y submódulos finitamente generados serán aquellos generados por un conjunto finito de el-
ementos. Como ya indicamos, escribiremos Rm para denotar al submódulo generado por
{m}. En ocasiones escribiremos Rm1 + · · · + Rmr o Rhm1 , . . . , mr i para denotar al módulo
Rh{m1 , . . . , mr }i generado por el conjunto finito {m1 , . . . , mr }. Para ideales, sin embargo, es-
cribiremos (a1 , . . . , am ) para denotar el ideal generado por la familia {a1 , . . . , am }. Nótese que,
en el caso de un conjunto de generadores finito se tiene:
• (Para submódulos) dado m ∈ M , se tiene m ∈ Rhm1 , . . . , mr i si y solamente si existen
x1 , . . . , xr ∈ R tales que:
Xr
m= xi m i .
i=1
• (Para ideales) dado x ∈ R, se tiene x ∈ (a1 , . . . , ar ) si y solamente si existen x1 , . . . , xr ∈
R tales que:
Xr
x= xi ai .
i=1
Observación 2.2.15. Sea M un R−módulo finitamente generado. Entonces, puedo considerar

el conjunto de todos los subconjuntos finitos que generan M . Es decir
G(M ) := {S ⊆ M : RhSi = M, ](M ) ∈ N}.
A su vez, podemos considerar el conjunto de todos los cardinales de conjuntos finitos que
generan M .
S (M ) := {n ∈ N : ∃S ∈ G(M ), ](S) = n}.
Como es un subconjunto de los naturales y no es vacı́o, entonces posee algún mı́nimo:
n0 ; = min (S (M )) ∈ N.
Es evidente que si K es un cuerpo y V es un K−espacio vectorial finitamente generado sobre

K, entonces V es un espacio vectorial de dimensión finita y el Teorema del Reemplazamiento 1
nos dice que todo sistema minimal de generadores de V es una base de V . Por suerte, o por
desgracia, no es igual para módulos, lo que obliga a hablar de R−módulos libres en la Subsección
2.2.4 siguiente.
Definición 33 (Número mı́nimo de generadores de M ). Sea M un R−módulo finitamente

generado. Llamaremos número mı́nimo de generadores de M (y lo denotaremos por µ(M )) al
mı́nimo de los cardinales de los conjuntos finitos que generan M . Es decir, al siguiente número
entero:
µ(M ) := min{](G) : RhGi, G es finito}.
A cualquier conjunto H tal que M = RhHi y ](H) = µ(M ) se le denomina conjunto minimal
de generadores de M .
En el caso en que M no sea finitamente generado escribiremos µ(M ) = ∞.
Definición 34 (R−álgebras finitas y finitamente generadas). Con estas notaciones:

• Una R−álgebra B se llama finitamente generada si es isomorfa a un cociente de algún
anillo de polinomios R[X1 , . . . , Xn ] por alguno de sus ideales a.
• Una R−álgebra B se denomina finita si B es un R−módulo finitamente generado.
Definición 35 (Suma de Submódulos e Ideales). Dada una familia {Ni : i ∈ I} de

submódulos de un R−módulo M , llamaremos submódulo suma de los submódulos de esta familia
al submódulo generador por la unión de todos ellos.
X
Ni := Rh∪i∈I Ni i.
i∈I
P
Del mismo modo, dada una familia de ideales {ai : i ∈ I}, denotaremos por i∈I ai al ideal
suma de esa familia.
Notación 2.2.16. En el caso de tener un número finito de submódulos e ideales usaremos

indistintamente las notaciones:
m
X
N1 + · · · + Nm := Ni ,
i=1
y, para ideales,
m
X
a1 + · · · + am := ai ,
i=1
En el caso de dos sumandos, usaremos a + b (para ideales) y N1 + N2 (para submódulos).
Definición 36 (Anillos Principales). Un anillo se denomina principal si todos sus ideales

son principales (ver Definición 1.4.6).
Ejemplo 2.2.17. Los ideales (0) y (1) son principales. En particular, los cuerpos son anillos
principales. Pero no todos los anillos principales son dominios de integridad. Por ejemplo Z/6Z
es un anillo principal que no es dominio.
1Los amables lingüistas de la RAE no conocen mucho de la terminologı́a de las matemáticas, ni de

las matemáticas en general, incluyendo las operaciones más elementales. No es el momento de descubrir el
analfabetismo matemático endémico de la sociedad española. Estos académicos están dispuestos a admitir
cualquier término de origen anglosajón sin mayor relevancia técnica, pero no reconocen el término “reemplaza-
miento” (acción y efecto de reemplazar), sugiriendo algo semánticamente muy distinto como es el término
“emplazamiento”. Amistosamente les emplazo a incorporar reemplazamiento al DRAE. El Teorema del Reem-
plazamiento es un resultado fundamental del Álgebra Lineal por el cual todo subespacio vectorial de un es-
pacio vectorial finitamente generado posee una base. Dejamos al lector la búsqueda de este Teorema, su
demostración y la razón por la cual “reemplazamiento” significa que la estructura de los conjuntos de vec-
tores linealmente independientes de los espacios vectoriales de dimensión finita poseen estructura de matroide
(https://en.wikipedia.org/wiki/Matroid).
Teorema 2.2.18. i) Los anillos Z y K[X], cuando K es un cuerpo, son principales y

también son anillos principales los cocientes de ambos anillos, aunque no siempre son
dominios de integridad.
ii) El anillo Z[X] no es principal. El ideal a := (2, X) no puede ser generado por un solo
elemento de Z[X].
Demostración. En el caso de Z, como en el caso de K[X], el argumento se basa en probar
la existencia de máximo común divisor. Pondremos, como recordatorio, la prueba en el caso
K[X]. Usando el valor absoluto en lugar del grado, de obtiene el enunciado para el caso Z. Sea
a un ideal en K[X] y consideremos el conjunto siguiente:
D(a) := {deg(f ) : f ∈ a, f 6= 0} ⊆ N.
Si a = (0), entonces es principal y hemos terminado. Si a 6= 0, entonces existe f ∈ a, con f 6= 0
y, por tanto, D(a) es un conjunto no vacı́o de números naturales. Por tanto, posee un mı́nimo.
Sea d0 := min(D(a)) ese mı́nimo y sea f0 ∈ a un elemento no nulo tal que deg(f0 ) = d0 .
Consideremos el ideal principal (f0 ) ⊆ a. Veamos que ambos ideales son iguales. Sea g ∈ a.
Usando la división euclı́dea, existirán q, r ∈ K[X] tales que
• g = qf0 + r,
• deg(r) ≤ deg(f0 ) − 1.
Por la primera afirmación r = g + (−q)f0 ∈ a. Si r 6= 0, entonces deg(r) ∈ D(a) y deg(r) <
min(D(a)), lo cual es imposible. Por tanto, r = 0, g = qf0 ∈ (f0 ) y tendremos probado que
a ⊆ (f0 ) como pretendı́amos. En lo que respecta a los cocientes de Z y K[X], queda como
sencillo ejercicio a partir del conocimiento de los anillos Z y K[X] que se le supone al lector.
Para la segunda afirmación, supongamos que a = (2, X) es un ideal principal. Entonces, existe
un elemento no nulo (y no unidad) f = ad X d + · · · + a0 ∈ Z[X] tal que
a = (2, X) = (f ).
Por tanto, existen polinomios qq , q2 ∈ Z[X] tales que
2 = q1 f, X = q2 f.
La primera identidad (i.e. 2 = q1 f ) nos indica que todos los coeficientes de f deben ser divisores
enteros de 2 y, por tanto, están en {±1, ±2}. La segunda identidad (i.e. X = q2 f ) nos indica
que todos los coeficientes de f son divisores de 1. Por tanto, juntando ambas afirmaciones, los
coeficientes deben estar en {±1}. De otro lado, ambas identidades indican que el grado de f
habrı́a de ser 0, con lo que, necesariamente f es una unidad. Pero (f ) = a no es el ideal total,
es un ideal propio y llegamos a contradicción.
Definición 37 (Producto de ideales y de ideales por submódulos). Se trata de las
nociones siguientes:
i) Dados dos ideales a y b de un anillo R, definimos el ideal producto como el ideal ab
generado por {xy : x ∈ a, y ∈ b}.
ii) Dado un ideal a de un anillo R y un submódulo N de un R−módulo M , escribiremos
aN para designar al submódulo generado por:
{xm : x ∈ a, m ∈ N }.
Proposición 2.2.19 (Producto y generadores). Sea a y b dos ideales en un anillo R,

respetivamente generados por conjuntos finitos
a = (f1 , . . . , fr ), b = (g1 , . . . , gs ).
Entonces, el ideal producto ab está generado del modo siguiente:
ab = ({fi gj : 1 ≤ i ≤ r, 1 ≤ j ≤ s}).
Una propiedad análoga se verifica para el producto de ideales por submódulos.
Demostración. Ejercicio de comprobación.
Afirmaciones análogas son obvias para ideales y módulos generados por familias cualesquiera,
teniendo en cuenta siempre que se trata de combinaciones lineales finitas.
Ejemplo 2.2.20 (Producto no significa que todos los elementos sean productos). Es
importante señalar que, salvo en el caso obvio de anillos principales, los productos aN y ab
no suelen coincidir con los productos de los objetos implicados. Es decir, existen ejemplos de
anillos y módulos tales que:
aN 6= {λn : λ ∈ a, n ∈ N },
ab 6= {xy : x ∈ a, y ∈ b}.
Pongamos un ejemplo con un producto de ideales que cubre ambas afirmaciones. Consideremos
los ideales a = (2, X) y b = (3, X + 1) en el anillo no principal Z[X]. El ideal producto ab es el
generado por los productos de los generadores, con lo que tendremos:
ab = (6, 3X, 2(X + 1), X(X + 1)).
Ahora observamos que el polinomio X − 2 ∈ ab:
(X − 2) = 3X − 2(X + 1).
Sin embargo, no es posible presentar X − 2 como un producto p(X)q(X) con p(X) ∈ a y
q(X) ∈ b. Razonemos por reducción al absurdo. Supongamos (X − 2) = p(X)q(X). Como
Z[X] es un dominio de integridad, se tendrá que
deg(p) + deg(q) = 1, 0 ≤ deg(p) ≤ 1, 0 ≤ deg(q) ≤ 1.
Por tanto, uno de los dos es una constante (en Z) no nula y el otro es un polinomio de grado
1. Sin pérdida de la generalidad podemos suponer:
p(X) = a ∈ Z \ {0}, q(X) = cX + b ∈ Z[X].
Como X − 2 = p(X)q(X), concluiremos:
ac = 1, ab = −2.
Pero, entonces, a ∈ {±1} y, a ∈ a. Basta con observar que (2, X) es un ideal propio en Z[X],
para concluir que esto no es posible. Luego X − 2 no es un producto de un elemento de a y
otro de b.
Proposición 2.2.21 (Propiedades Elementales para ideales). Las operaciones intersección,

suma y producto de ideales verifican las usuales propiedades asociativas, conmutativa, existencia
de elemento neutro. Además:
• Se verifica la Ley Modular de la intersección con respecto a la suma (por ser simple-
mente subgrupos). Es decir,
a ∩ (b + c) ⊇ a ∩ b + a ∩ c,
además, si b ⊆ a o c ⊆ a, el anterior contenido es una igualdad. Nótese que también
se da la igualdad si b ⊆ c o si c ⊆ b de manera obvia.
• La propiedad distributiva del producto con respecto a la suma.
a.(b + c) = a.b + a.b.
Definición 38 (Extensión de un ideal). Sea f : R −→ B un morfismo de anillos y a ⊆ R

un ideal de R. Llamaremos extensión del ideal a al anillo B al ideal generado por f (a) en B:
ae := (f (a)) .
Proposición 2.2.22. Sea f : (R, +, ·) −→ (B, +, ·) un morfismo de anillos y a ⊆ R un ideal de

R. El ideal extensión ae de a a B coincide con el submódulo producto aB, considerando en B
la estructura de R−módulo generada por el morfismo f .
Demostración. Es un ejercicio de mera comprobación a partir de las nociones.
Esto justifica que algunos autores prefieran escribir aB en lugar de ae al referirse a la extensión
de un ideal porque, además, intensifica el papel que juega B en la propia notación. Utilizaremos
ambas indistintamente a lo largo del texto.
Proposición 2.2.23. Sea f : R −→ B un morfismo de anillos, a ⊆ R un ideal y b ⊆ B otro
ideal. Se tiene:
c e
i) a ⊆ (ae ) , b ⊇ (bc ) .
c e e c
ii) ae = ((ae ) ) , bc = ((bc ) ) .
iii) Sea C es el conjunto de las contracciones a R de los ideales de B (i.e. C := {bc :
b ideal en B}). Sea E el conjunto de los ideales de B que son extensión de los ideales
de R (i.e.E := {ae : a ideal en R}). Las siguientes son aplicaciones biyectivas (una
inversa de la otra):
Φ : C −→ E
a 7−→ ae .
Φ−1 : E −→ C
b 7−→ bc .
Demostración. Véase el Problema 97.
Las extensiones y contracciones de ideales verifican algunas propiedades inmediatas más que
dejaremos como Problema y que resumimos a continuación:
Proposición 2.2.24. Sea f : R −→ B un morfismo de anillos. Sean a1 y a2 dos ideales del
anillo R. Se tiene:
e
i) (a1 + a2 ) = ae1 + ae2 .
e
ii) (a1 ∩ a2 ) ⊆ ae1 ∩ ae2 .
e
iii) (a1 a2 ) = ae1 ae2 .
Además, el contenido en la afirmación ii) es, en ocasiones, estricto.
Demostración. Se deja como Problema 98. Una pista para la afirmación última es la
siguiente. Considérense los anillos A = Q[Y, Z] y B := Q[X] y considérese el siguiente morfismo
de anillos:
ϕ: A −→ B
f (Y, Z) −→ f (X 2 , X 3 ).
Sean a1 = (Y ) y a2 = (Z). Entonces, compruébese que
a1 ∩ a2 = (Y Z),
lo que implicará que
e
(a1 ∩ a2 ) = (Y Z)e = (X 5 ),
mientras que
ae1 = (X 2 ), ae2 = (X 3 ),
y, por tanto,
ae1 ∩ ae2 = (X 3 ).

Proposición 2.2.25. Sea f : R −→ B un morfismo de anillos. Sean b1 y b2 dos ideales del

anillo B. Se tiene:
c
i) (b1 + b2 ) ⊇ bc1 + bc2 .
c
ii) (b1 ∩ b2 ) = bc1 ∩ bc2 .
c
iii) (b1 b2 ) ⊇ bc1 ac2 .
Demostración. Se deja como Problema 99.
2.2.3. Teoremas de isomorfı́a.

Teorema 2.2.26 (Primer Teorema de isomorfı́a). Dado f : M −→ N un morfismo de
R−módulos, f induce un isomorfismo
f˜ : M/ ker(f ) −→ Im(f ) ⊆ N,
dado mediante f˜(m + ker(f )) = f (m).
Demostración. Es la misma demostración de lo hecho para grupos en el Problema 16.
Teorema 2.2.27 (Otros Teoremas de isomorfı́a). Se verifican los siguientes resultados:
i) Segundo Teorema de Isomorfı́a para Módulos: Sean N ⊆ M ⊆ L R−módulos,

entonces se tiene un isomorfismo
(L/N ) / ∼
(M/N ) = L/M.
ii) Tercer Teorema de Isomorfı́a para Módulos: Dados M1 y M2 submódulos de
un R−módulo M , se tiene el isomorfismo canónico:
(M1 + M2 ) /M1 ∼ = M2 / (M1 ∩ M2 ) .
Demostración. Para la primera afirmación, consideremos la siguiente correspondencia:
π: (L/N ) −→ (L/M )
x + N 7−→ x + M.
Veamos, en primer lugar, que π es una aplicación. Para ello, sean x, y ∈ L tales que x + N =
y + N , es decir, x − y ∈ N . Pero, como N ⊆ M , se tiene también x − y ∈ M . Por tanto, la
definición de π no depende del representante elegido de una clase (i.e. π(x + N ) = π(y + N )
en el caso expuesto) y se tiene que π es aplicación. Para ver que es morfismo de R−módulos
basta con observar que se verifican las siguientes propiedades ∀x, y ∈ L y ∀λ ∈ R:
π((x+N )+(y +N )) = π((x+y)+N ) = (x+y)+M = (x+M )+(y +M ) = π(x+N )+π(y +N ),
π(λ(x + N )) = π((λx) + N )) = (λx) + M = λ(x + M ) = λπ(x + N ).
Para ver que π es un epimorfismo (i.e. suprayectiva) baste con observar que
∀x + M ∈ (L/M ), ∃(x + N ) ∈ (L/N ), π(x + N ) = x + M.
En cuanto a la inyectividad, basta con verificar la siguiente ingualdad:
ker(π) = {y + N ∈ (L/N ) : π(y + N ) = y + M = 0 + M } = {y + N : y ∈ M } = (M/N ).
Aplicando el Primer Teorema de Isomorfı́a (Teorema 2.2.26) concluiremos
(L/N ) / (L/N ) / ∼
(M/N ) = ker(π) = Im(π) = (L/M ).
Para el Tercer Teorema de Isomorfı́a consideremos los morfismos siguientes:
ι : M2 −→ M1 + M2 , π : M1 + M2 −→ (M1 + M2 )/M1
x 7−→ x z 7−→ z + M1 ,
donde ι es la inclusión canónica y π es la proyección canónica sobre el módulo cociente. Con-
sideremos el morfismo φ := π ◦ ι dado por la composición de ι y π. Probaremos las siguientes
propiedades:
• φ es un epimorfismo
• ker(φ) = M1 ∩ M2 .
Para ver que φ e suprayectiva, consideremos un elemento z + M1 ∈ (M1 + M2 )/M1 . Como
z ∈ M1 + M2 , han de existir x ∈ M1 e y ∈ M2 tales que z = x + y. Entonces, nótese que
z + M1 = (x + y) + M1 = y + M1 = π(y) = π(ι(y)) = φ(y) ∈ Im(φ),
y habremos probado que φ es suprayectiva. En cuanto al núcleo, sea x ∈ M2 tal que φ(x) =
0 + M1 ∈ (M1 + M1 )/M1 . Se tiene que
φ(x) = x + M1 = 0 + M1 ⇐⇒ x ∈ M1 .
Por tanto, x ∈ ker(φ) si y solamente si x ∈ M1 ∩ M2 . De nuevo, aplicando el Primer Teorema
de Isomorfı́a concluimos
M2 / ker(φ) = M2 / (M1 ∩ M2 ) ∼
= Im(φ) = (M1 + M2 ) /M1 .

Proposición 2.2.28 (Ideales y Submódulos del Cociente). Con las notaciones de los
Teoremas de Isomorfı́a, tendremos las siguientes propiedades:
i) Los ideales del anillo cociente R/a son de la forma b/a, donde b es un ideal de R que
contiene al ideal a.
ii) Los submódulos del módulo cociente M/N son de la forma L/N , donde L es un
submódulo de M que contiene al submódulo N .
Además esa relación es biyectiva y preserva el orden.
Demostración. Aunque las afirmaciones son evidentes, veamos en detalle las relaciones:
• En el caso de anillos. Sea a ( R un ideal propio del anillo R. Por ser ideal R/a
posee una estructura natural de anillo ya discutida anteriormente. Tenemos, además,
un epi–morfismo de anillos dado por la proyección canónica:
π : R −→ R/a
x 7−→ x + a.
Para un ideal b de R, uno puede observar que la imagen por π de b es dada por:
π(b) := {x + a : x ∈ b}.
Es fácil observar que π(b) = π(b + a) y que b + a es un ideal de R que contiene a a.
Por eso, si b es un ideal de R que contiene a a, entonces, π(b) es un ideal de R/a que
denotaremos mediante b/a.
De otro lado, para un ideal i de R/a, la anti–imagen por π es dada por
π −1 (i) = {x ∈ R : x + a ∈ i}.
Por lo visto anteriormente, π −1 (i) es ideal en R y dado que 0 + a ∈ i, uno concluye
que a ⊆ π −1 (i).
Con estas observaciones, es claro que la siguiente define una biyección entre ideales:
{b ⊆ R : b ⊇ a, b es ideal} −→ {i ⊆ R/a : i es ideal}
b 7−→ π(b) = b/a,
cuya inversa es dada por i 7−→ π −1 (i).
• En el caso de R−módulos. Se trata esencialmente del mismo tipo de argumento. Sea
N ⊆ M un submódulo del R−módulo M . El cociente M/N posee una estructura
natural de R−módulo anillo ya discutida. Tenemos, además, un epi–morfismo de
R−módulos dado por la proyección canónica:
π : M −→ M/N
x 7−→ x + N.
Para un Submódulo L de M , uno puede observar que la imagen por π de L es dada
por:
π(L) := {x + N : x ∈ L}.
Es fácil observar que π(L) = π(L + N ) y que L + N es un submódulo de M que
contiene a N . Por eso, si L es un submódulo de M que contiene a N , entonces, π(L)
es un submódulo de M/N que denotaremos mediante L/N .
De otro lado, para un submódulo K de M/N , la anti–imagen por π es dada por
π −1 (K) = {x ∈ M : x + N ∈ K}.
Por lo visto anteriormente, π −1 (K) es submódulo de M y dado que 0 + N ∈ K, uno
concluye que N ⊆ π −1 (K).
Con estas observaciones, es, de nuevo, claro que la siguiente define una biyección entre
submódulos:
{L submódulo de M : L ⊇ N } −→ {K submódulo de M/N }
L 7−→ π(L) = L/N,
cuya inversa es dada por K 7−→ π −1 (K).

Ejemplo 2.2.29. A modo de ejemplo, aunque ya se ha percibido en los casos de Z y K[X],

observamos que los cocientes de anillos principales son siempre principales. Puesto que si R es
un anillo principal y a ( R es un ideal propio, los ideales del cociente R/a debe ser principales.
Como se acaba de ver los ideales del anillo R/a son de la forma b/a, donde b es un ideal de
R. Como R es principal, b es un ideal principal. Supongamos b = (b). Es sencillo veficar que,
entonces, el ideal cociente satisface:
b/a = (b + a),
y es, por tanto, un ideal principal.
2.2.4. Módulos libres y bases.

Retomemos el ejemplo ya discutido en Ejemplo 2.2.2:
Ejemplo 2.2.30. Dado un conjunto X cualquiera, retomemos el conjunto RX de las aplicaciones
de un conjunto X en el anillo R. Vimos que tenı́a una estructura de R−módulo en el Ejemplo
2.2.2. La suma es la suma natural como grupo abeliano producto (cartesiano). También tiene
una estructura natural de anillo (con el producto “coordenada a coordenada” de aplicaciones
(una estructura que se diferenciaba de la convolución usada para definir polinomios y series de
potencias formales). Y le hemos dotado de una estructura de R−módulo mediante la operación:
·R : R × R X −→ RX
(λ, f ) 7−→ λf,
donde la aplicación λf viene dada por
λf : X −→ R
x 7−→ λ · f (x).
Asimismo, dado ϕ ∈ RX , definimos el soporte
supp(ϕ) := {x ∈ X : ϕ(x) 6= 0}.
Y podemos considerar el subconjunto: :
⊕X R := {f ∈ RX : supp(f ) es un conjunto finito}.
Obviamente, si X es un conjunto finito se tiene RX = ⊕X R. De hecho, si X es finito y biyectable
con el conjunto de números naturales [n] := {1, . . . , n}, la notación habitual es escribir Rn en
lugar de R[n] o R{1,...,n} .
Definición 39 (R−módulo libre). Un R−módulo M se denomina R−módulo libre si es

isomorfo como R−módulo a algún R−módulo de la forma ⊕X R, para algún conjunto X.
Observación 2.2.31. La Teorı́a de Módulos serı́a una sencilla traslación (con pocas variaciones)
de muchas de las ideas del Álgebra Lineal (la parte más “lineal” de la Matemática, por ausencia
de “ramificaciones”). Afortunadamente, los módulos interesantes tienden a no ser libres y, quizá
por ello, son más interesantes (lo lineal tiende a ser trivial si se estudia del modo esperable).
Para ver que no todo módulo es libre baste con observar que un grupo abeliano finito no puede
ser Z−módulo libre porque, si lo fuera, su cardinal serı́a, al menos, numerable infinito y no finito.
Pero podemos hablar de bases como en los espacios vectoriales con la definición siguiente:
Definición 40 (Base de un R−módulo). Se llama base de un submódulo N de un R−módulo

M , a todo subconjunto B ⊆ N tal que se verifican las siguientes dos propiedades:
i) El conjunto B es sistema generador de N como submódulo de M , es decir,
M := RhBi.
ii) Los elementos de B son una familia libre (también llamada linealmente independiente)
sobre R, es decir, para cualquier conjunto J finito, para cualquier lista indiciada por
J de elementos {vj : j ∈ J} ⊆ B, y para cualesquiera {aj ∈ R : j ∈ J}, se tiene
que si X
aj vj = 0,
j∈J
entonces aj = 0, ∀j ∈ J.
Proposición 2.2.32. Sean M y N dos R−módulos, y f : M −→ N un morfismo de R−módulos.

Sea T ⊆ M un submódulo y B ⊆ T un subconjunto de T .
Entonces, se tiene:
i) Si B es un sistema generador de T , entonces, f (B) es un sistema generador de f (T ).
Es decir,
T = RhBi =⇒ f (T ) := Rhf (B)i.
De hecho, f es epimorfismo si y solamente si transforma cualquier sistema generador
de M en un sistema generador de N .
ii) Si f es monomorfismo y B es una familia libre de elementos de M , como R−módulo,

entonces f (B) es una familia libre de elementos de N como R−módulo.
iii) Si f es un isomorfismo y B es una base de T como R−módulo entonces, f (B) es una
base de f (T ) como R−módulo.
Demostración. Los alumnos han debido probar similares afirmaciones en el caso de es-
pacios vectoriales, por lo que obvio el incluir aquı́ una prueba; pero propongo probarlo como
Problema 87.
Proposición 2.2.33. Un R−módulo es libre si y sólo si posee alguna base.

Demostración. Veamos que si M es un R−módulo libre entonces posee una base. Para
verlo, recordemos que M es un R−módulo libre si y sólo si es isomorfo a un R−módulo de la
forma ⊕X R. Por tanto, usando la Proposición precedente, bastará con probar que ⊕X R posee
una base y transferirla, vı́a el isomorfismo, a una base de M .
Para construir una base de ⊕X R, consideremos para cada x ∈ X consideremos el siguiente
elemento ex ∈ ⊕X R:
ex : X −→ R
1, si y = x
z 7−→
0, en otro caso.
Veamos que el conjunto BX := {ex : x ∈ X} es una base del R−módulo libre ⊕X R. Para ello,
consideremos f ∈ RX un elemento cualquiera. por definición sabemos que existe un conjunto
J ⊆ X finito tal que f (x) = 0 para todo x ∈ X \ J. Consideremos entonces el siguiente
elemento: X
g := f (y)ey .
y∈J
Es un elemento del submódulo RhBX i generado por BX : como J es finito, la suma es una
suma finita y como RhBX i es submódulo g ∈ RhBX i. Pero es, además, sencillo observar que
f y g coinciden como aplicaciones. La razón es que si x 6∈ J es claro que tanto g(x) como f (x)
valen 0 y, por tanto, conciden. En el caso de x ∈ J se tendrá que
X
g(x) = f (y)ey (x) = f (x)ex (x) = f (x).
y∈J
De otro lado, es fácil ver que la familia BX es una familia de elementos linealmente independi-
entes sobre R. Si tomamos J ⊆ X un conjunto finito y unos elementos {λx ∈ R : x ∈ J}, y si
suponemos X
ax ex = 0,
x∈J
entonces esa es una igualdad como funciones, por lo que

X 0, si y 6∈ J
0= ax ex (y) =
ax = ax ex (y) si y = x ∈ J.
x∈J
Con lo que tendremos la conclusión buscada y BX es base de ⊕X R.
Supongamos ahora que un R−módulo M posee una base B := {vi : i ∈ I} ⊆ M . Conluyamos
que, entonces, M es isomorfo a ⊕I R = ⊕B R y habremos probado que M es un R−módulo
libre. Nótese que ya hemos asumido que B e I son conjuntos biyectables y que, como tales
conjuntos biyectables ⊕I R y ⊕B R son isomorfos. De todos modos, es fácil definir la siguiente
correspondencia:
Φ : ⊕I R −→ P M
f 7−→ i∈I f (i)vi .
La primera dificultad es probar que se trata, efectivamente, de una aplicación. Para ello,
recordemos que f ∈ ⊕I R, luego es de soporte finito, por tanto,
X X
f (i)vi = f (i)vi ,
i∈I i∈supp(f )
que es una suma finita que, por tanto, es un elemento de M . Tendremos ası́ probado que se
trata de una correspondencia. Además, se observa que la suma finita sólo depende de f (de
supp(f ) y de los valores de f en supp(f )). Verificar que se trata de un morfismo de R−módulos
es un elemental ejercicio de comprobación que recomendamos al lector para familiarizarse con

el asunto, pero que omitimos or obvio. Además, si BI es la base de ⊕I R usada en la primera
parte de esta Demostración, es claro que Φ(BI ) = B. Como B es un sistema generador de
M , usando la Proposición precedente, conluimos que f es epimorfismo. Para ver que tenemos
un monomorfismo tampoco hay que hacer mucho esfuerzo. Supogamos que f ∈ ⊕I R es un
elemento del ker(Φ). Entonces,
X
0 = Φ(f ) := f (i)vi ,
i∈supp(f )
donde supp(f ) ⊆ I es un conjunto finito. Pero, por ser B una familia libre de elemntos de M
y por la identidad que acabamos de escribir (que es una suma finita de múltiplos “escalares”
de los elementos de B, igualada a cero) concluiremos sin esfuerzo que f (j) = 0 para todo
j ∈ supp(f ), con lo que f debe ser la aplicación nula.
Observación 2.2.34 (R[X1 , . . . , Xn ] como R−módulo libre y base monomial). Por la

propia definición del anillo de polinomios R[X1 , . . . , Xn ] hecha en el capı́tulo precedente, el
grupo aditivo subyacente era ⊕Nn R con lo que es un R−módulo libre. Es decir, se tiene un
isomorfismo de de R−módulos entre:
R[X1 , . . . , Xn ] ∼
= ⊕Nn R.
Además, una base de R[X1 , . . . , Xn ] es dada por los monomios. Es decir, la siguiente es una
base de R[X1 , . . . , Xn ]:
B := {X µ : µ ∈ Nn } = {X1µ1 · · · Xnµn : (µ1 , . . . , µn ) ∈ Nn }.
Se la denomina la base monomial de R[X1 , . . . , Xn ].
Observación 2.2.35 (Módulos libres y morfismos). En la prueba de la Proposición prece-

dente ya se deja entrever una propiedad esencial de los morfismos que parten de los módulos
libres: para determinar un morfismo de R−módulos entre un módulo libre M y otro módulo N
cualquiera, basta con determinar una imagen de una base. Fijemos esa idea.
Proposición 2.2.36 (Morfismos de la suma directa). Sea {Mi : i ∈ I} una familia de

R−módulos y sea N otro R−módulo. Entonces, los siguientes dos R−módulos son isomorfos:
HomR (⊕i∈I Mi , N ) ∼
Y
= HomR (Mi , N ).
i∈I
Demostración. En otros términos, supongamos dada una familia cualquiera de morfismos

de R−módulos F := {fi ∈ HomR (Mi , N ) : i ∈ I}, entonces existe un único morfismo
F
f : ⊕i∈I Mi −→ N,
tal que si λi : Mi −→ ⊕i∈I Mi son las inclusiones de cada Mi en ⊕i∈I Mi , se verifica
Ff◦ λi = fi , ∀i ∈ I.
Es fácil verificar que la anterior construcción define un morfismo de R−módulos del tipo sigu-
iente: Q
e· : i∈I HomR (Mi , n) −→ HomR (⊕i∈I Mi , N )
F := {fi ∈ HomR (Mi , N ) : i ∈ I} 7−→ F
f.
Para concluir la prueba basta con verificar que éste es un isomorfismo de R−módulos.
Corolario 2.2.37. Sea {Mi : i ∈ I} una familia de R−módulos. Se tiene:

∗ ∗
(⊕i∈I Mi ) ∼
Y
= (Mi ) ,
i∈I
∗
donde (·) significa dual.
Demostración. Como ya se indicó en la definición de módulo dual (Ejemplo 2.2.11), el
dual de un R−módulo M se define como M ∗ := HomR (M, R). Por tanto, el enunciado es
consecuencia inmediata de la Proposición precedente.
Proposición 2.2.38 (Propiedades básicas de los módulos libres). Se tienen las siguientes
propiedades:
i) Sean M y N dos R−módulos y supongamos que M es un R−módulo libre. Sea B =
{vi : i ∈ I} una base de M como R−módulo libre. Sea {ni : i ∈ I} una familia
cualquiera de elementos de N . Entonces, existe un único morfismo de R−módulos
f ∈ HomR (M, N ) tal que
f (vi ) = ni , ∀i ∈ I.
ii) Si M y N son dos R−módulos libres, fijadas unas bases B y B 0 en M y N , las
representaciones (coordenadas en R) en la base B 0 de las imágenes de los elemen-
tos de la base B determinan unı́vocamente los morfismos de R−módulos entre M y
N . En particular, si M y N son R−módulos libres con bases finitas, el R−módulo
HomR (M, N ) es también un R−módulo libre.
iii) Sumas directas de R−módulos libres son libres. Es decir, dada una familia {Mi : i ∈
I} una familia cualquiera de R−módulos libres (con I conjunto de cualquier cardinal),
entonces, el siguiente es un R−módulo libre:
⊕i∈I Mi .
iv) Producto cartesianos finitos de R−módulos libres es un R−módulo libre. Qr Es decir, si
{M1 , . . . , Mr } es una familia finita de R−módulos libres, el producto i=1 Mi es un
R−módulo libre.
Demostración. Las afirmaciones son esencialmente de mera verificación a partir de la
Proposición 2.2.36. Las proponemos como Problema.
Proposición 2.2.39. Todo R−módulo es la imagen por un epimorfismo de un R−módulo libre.

Demostración. Usemos la Proposición precedente. Sea M un R−módulo y consideremos
el R−módulo libre
F (M ) := ⊕M R.
Es decir, la suma directa de copias de R indiciada por el propio R−módulo M . Ahora, por la
afirmación i) de la Proposición precedente, para definir un morfismo entre F (M ) y M basta
con definir la imagen de una base. Una base de F (M ) como R−módulo libre es la siguiente:
B := {em : m ∈ M },
donde
em : M −→ R
1, si n = m
n 7−→ em (n) :=
0, en otro caso.
Ahira definamos π : F (M ) −→ M como el único morfismo de R−módulos tal que se satisface:
π(em ) := m, ∀m ∈ M.
Es morfismo de R−módulos por lo dicho en la Proposición precedente y es epimorfismo porque
M ⊆ Im(π).
Definición 41 (R−módulos libres (de rango finito)). Se denomina R−módulo libre de

rango finito a todo R−módulo M que posee una base B de cardinal finito. Llamaremos rango
de un R−módulo libre de rango finito al mı́nimo de los cardinales de sus bases2, es decir,
rankR (M ) := min{](B) : B es base finita de M }.
Ejemplo 2.2.40 (Ejemplos de módulos libres de rango finito). Los siguientes son ejemplos
de R−módulos libres y no libres:
i) Un espacio vectorial V sobre un cuerpo K son módulos libres, al rango se le llama
dimensión y está determinado de forma unı́voca.
2Esta es una definición “provisional”: no hemos probado aún que dos bases de un R−módulo libre tengan
que tener el mismo cardinal. Lo haremos en el Capı́tulo siguiente (Subsección 4.2.2 y, en particular, en la
Definición 69) con poco esfuerzo adicional, pero nos permitimos usar esta terminologı́a por el momento.
ii) Los anillos son módulos libres sobre sı́ mismos de rango acotado por 1.
iii) Los conjuntos de matrices Mn×m (R) tienen una estructura natural de R−módulo libre
de rango acotado por nm.
iv) Los polinomios homogéneos de grado fijado con coeficientes en R, i.e. el conjunto
Hd (X1 , . . . , Xn ) := {f ∈ R[X1 , . . . , Xn ] : deg(f ) = d} ∪ {0},
tendremos un R−módulo libre de rango acotado por

d+n−1
.
n−1
v) Los grupos abelianos finitos no son nunca Z−módulos libres. En particular, no son
Z−módulos libres los de la forma:
r
Y
G := (Z/pi Z) ,
i=1
con pi ∈ Z no nulos.
Proposición 2.2.41. En el caso finito, todo R−módulo finitamente generado es el cociente

de un R−módulo libre de rango finito por uno de sus submódulos. En particular, todo grupo
abeliano finitamente generado es de la forma (i.e. isomorfo) a un Z−módulo cociente del tipo
Zn /N , donde N es un subgrupo de Zn . No es cierto, en general, que todo R−módulo finitamente
generado sea libre.
Demostración. Se trata de analizar el caso finitamente generado. Sea X := {m1 , . . . , mr }
un conjunto de generadores de M . Consideremos F := Rr = R{1,...,r} . Nótese que F es un
R−módulo libre de rango finito. Consideremos la correspondencia siguiente:
Φ: F −→ Pr M
(x1 , . . . , xr ) 7−→ i=1 xi mi .
Es claro que Φ es una aplicación y es un ejercicio de comprobación el verificar que es un
epimorfismo de R−módulos. Mientras que los ejemplos de Z−módulos con torsión son buenos
ejemplos de módulos finitamente generados que no son libres. Por ejemplo los siguientes:
Z/2Z × Z/3Z,
no pueden ser Z−módulos libres porque son de cardinal finito y el único Z−módulo libre de
cardinal finito es (0).
Observación 2.2.42 (Módulos libres de rango finito y matrices). Sean M y N dos

R−módulos libres de rangos respectivos m y n. Supongamos B := {α1 , . . . , αm } una base de
M y B 0 = {ω1 , . . . , ωn } una base de N . Consideremos una matriz:
 
a1,1 a1,2 · · · a1,m
 a2,1 a2,2 · · · a2,m 
M :=  . ..  ∈ Mn×m (R).
 
 .. ..
. . 
an,1 an,2 ··· an,m
Entonces, existe un único morfismo de R−módulos f : M −→ N tal que
f (αi ) := a1,j ω1 + · · · + an,j ωn .
De hecho, ese único morfismo toma la forma
Xm n
X
f( xi αi ) = yj ωj ,
i=1 j=1
si y solamente si     
a1,1 a1,2 ··· a1,m x1 y1
 a2,1 a2,2 ··· a2,m 
  x2   y2 
   
..   ..  =  ..  .

 .. ..
 . . .  .   . 
an,1 an,2 ··· an,m xm yn
Proposición 2.2.43 (Matrices y morfismos entre módulos libres de rango finito). Sean
M y N dos R−módulos libres con bases respectivas B y B 0 de respectivos cardinales m y n.
Entonces, existe un isomorfismo de R−módulos
MB,B0 : HomR (M, N ) −→ Mn×m (R).
Para cada f ∈ HomR (M, N ), la matriz MB,B0 (f ) = A ∈ Mn×m (R) se la denomina matriz de
f en las bases B y B 0 .
Demostración. Es casi obvio desde la observación precedente y lo dejamos como ejercicio.
Debe tenerse en cuenta que no hemos demostrado la unicidad del rango, aspecto éste que
dejaremos para el Capı́tulo siguiente.
2.2.5. Diagramas conmutativos, complejos y sucesiones exactas (Opcional). Se

trata, por ahora, de fijar unos pocos términos para poder usarlos con posterioridad. Comence-
mos con una noción básica de Combinatoria.
Definición 42 (Grafo orientado). Un grafo orientado es un par G := (V, E), donde V es un
conjunto (cuyos elementos se denominan vértices o nodos) y E ⊆ V 2 es una relación (cuyos
elementos se denominan aristas). Un camino en un grafo orientado es una sucesión finita de
vértices
ν1 , . . . , νn ,
de tal modo que (νi , νi+1 ) ∈ E. En ocasiones, el camino se describe mediante la notación:
ν1 → ν2 → · · · → νn .
Un ciclo es un camino que comienza y termina en el mismo nodo.
Un grafo con pesos en un conjunto F es un par (G , A), donde G := (V, E) es un grafo y
A : E −→ F es una aplicación que asigna a cada arista (ν1 , ν2 ) un elemento A(ν1 , ν2 ) ∈ F .
Observación 2.2.44. Usualmente, en Combinatoria, se tratan los grafos G := (V, E) para

los que el conjunto de vértices V es finito. Sin embargo, esta restricción es, a veces, poco
enriquecedora.
Sin embargo, dado cualquier conjunto V y cualquier relación de orden ≤ sobre V tenemos un
grafo orientado mediante el conjunto de aristas E := {(ν1 , ν2 ) ∈ V 2 : ν1 ≤ ν2 }. De hecho,
también se da en el sentido recı́proco: dado un grafo orientado G := (V, E) sobre un conjunto
V que satisfaga las propiedades reflexiva y simétrica, podemos inducir una relación de orden
sobre V mediante transitividad.
Por supuesto, todo grafo de una correspondencia f : D(f ) ⊆ A −→ A define un grafo orientado
de modo obvio. Es el grafo G := (A, G) donde
G := {(x, y) ∈ A2 : x ∈ D(f ), y = f (x)}.
Otros ejemplos sintomáticos de grafos orientados son los sistemas dinámicos formados por un
par (M, f ) donde M es una variedad y f : M −→ M es un difeomorfismo. esto permite
introducir un grafo (M, Gr(f )), donde Gr(f ) es el grafo de f .
Definición 43 (Diagrama en la categorı́a de R−módulos). Un diagrama en la categorı́a
de R−módulos es un grafo con pesos (G , A) donde:
i) El grafo G = (V, E) es un grafo orientado cuyos vértices son R−módulos,
ii) Los pesos son morfismos de R−módulos, es decir, para cada (M, N ) ∈ E, A((M, N )) ∈
HomR (M, N ).
Un diagrama conmutativo en la categorı́a de R−módulos es un diagrama (G , A), siendo G =
(V, E), si verifica lo siguiente:
Dados cualesquiera dos caminos dos caminos en el grafo:
N1 → N2 → · · · → Nn ,
y
M1 → M2 → · · · → Mm ,
con el mismo punto inicial y final (M1 = N1 , Mm = Nn ) y dadas las asignaciones de morfismos
for A:
fi := A(Ni , Ni+1 ) ∈ HomR (Ni , Ni+1 ), 1 ≤ i ≤ n − 1,
gj := A(Mj , Mj+1 ) ∈ HomR (Mj , Mj+1 ), 1 ≤ j ≤ m − 1,

se tiene la igualdad entre las composiciones de morfismos obtenidas siguiendo indistintanmente
cada uno de los caminos señalados, es decir, la igualdad siguientes:
fn−1 ◦ fn−2 ◦ · · · ◦ f1 = gm−1 ◦ gm−2 ◦ · · · ◦ g1 ,
donde ◦ quiere decir, como siempre, composición.
Notación 2.2.45. Usualmente se usan los sı́mbolos o para representar la conmutatividad

de una diagrama. Ası́, la propiedad que define la conmutatividad de un diagrama se puede
escribir mediante una figura del tipo siguiente:
f2 fn−2
N2 ··· Nn−1
f1 fn−1
M 1 = N1 Mm = Nn
g1 g2 gm−2 gm−1
M2 ··· Mm−1
Ejemplo 2.2.46 (Diagramas conmutativos de los Teoremas de isomorfı́a). Veamos

algunos ejemplos sencillos de diagramas conmutativos asociados a los Teoremas de Isomorfı́a
de R−módulos discutidos en Capı́tulos anteriores.
• Primer Teorema de Isomorfı́a: Consideremos un morfismo de R−módulos f : M →
N . Consideremos M/ ker(f ) el cociente por el núcleo, sea π : M −→ M/ ker(f ) la
proyección canónica y sea i : Imf (f ) −→ N la inclusión de la imagen en N . El Primer
Teorema de Isomorfı́a afirma que existe un único isomorfismo fe : M/ ker(F ) −→ Im(f )
que hace conmutativo el diagrama siguiente:
f
M N
π i
M/ ker(f ) Im(f )
fe
• Segundo Teorema de Isomorfı́a: Consideramos N ⊆ L dos submódulos de M .

Como L/N es submódulo de M/N tenemos tres proyecciones:
π1 : M −→ M/N, π2 : M −→ M/L, π2 : M/N −→ (M/N )/(L/N ).
e : M/L −→
El Segundo Teorema de Isomorfı́a afirma que existe un único isomorfismo π
(M/N )/(L/N ) haciendo conmutativo el siguiente diagrama:
π1
M M/N
π2 π2
M/L (M/N ) / (L/N )

π
e
• Tercer Teorema de Isomorfı́a: Consideramos N1 , N2 dos submódulos de un R−módulo
M . Tenemos los morfismos siguientes: i : N1 −→ N1 + N2 dado como la inclusión,
tenemos que N1 ∩ N2 es submódulo de N1 y, por tanto, tenemos la proyección π1 :
N1 −→ N1 /(N1 ∩ N2 ) y, finalmente, N2 es submódulo de N1 + N2 con lo que tenemos
la proyección π2 : N1 + N1 −→ (N1 + N2 )/N2 . El Tercer Teorema de Isomorfı́a afirma
que existe un único isomorfismo de R−módulos ei : N1 /(N1 ∩ N2 ) −→ (N1 + N2 )/N2
haciendo conmutativo el siguiente diagrama:
i
N1 N1 + N2
π1 π2
N1 / (N1 ∩ N2 ) (N1 + N2 ) /N2

ei
Definición 44 (Complejos (de cadena) de R−módulos). Se denomina complejo (de ca-

dena) de R−módulos a todo diagrama dado como una secuencia decreciente (sub-indicada por
Z o N, según el caso) de módulos y morfismos:
dn+2 dn+1 dn dn−1
C : ... Mn+1 Mn Mn−1 Mn−2 ...
de tal modo que dn ◦ dn+1 = 0 (o, equivalentemente, Im(dn+1 ) ⊆ ker(dn )) para cada n ∈ Z. A
los elementos de Mn se les dnomina elementos de grado (o dimensión) n. A los morfismos dn
se les denomina morfismos frontera o diferenciales3. A los elementos de ker(dn ) ⊆ Mn se les
denomina ciclos de grado n y a los de Im(dn+1 ) ⊆ Mn se les denomina bordes (de grado n). A
los R−módulos cociente
Hi (C, R) := ker(di )/ Im(di+1 ),
se les denomina módulos de homologı́a del complejo C.
En ocasiones, módulos y morfismos aparecen con ı́ndices en sentido ascendente y en ese caso
hablamos de complejos de co-cadena. Por ahora, nos quedamos con la terminologı́a que será
recordada más adelante.
Definición 45 (Complejos (de co-cadena) de R−módulos). Se denomina complejo de
co-cadena de R−módulos a todo diagrama dado como una secuencia creciente (sub-indicada
por Z o N, según el caso) de módulos y morfismos:
n−2
c cn−1 cn cn+1 . . .
D : ... M n−1 Mn M n+1
de tal modo que cn ◦ cn−1 = 0 (o, equivalentemente, Im(cn−1 ) ⊆ ker(cn )). A los elementos de
M n se les denomina elementos del complejo de grado n. A los elementos de ker(cn ) ⊆ M n se les
denomina co-ciclos de grado n y a los elementos de Im(cn−1 ) ⊆ M n se les denomina co-bordes
de grado n. Al cociente de co-ciclos por co-bordes se le denomina grupo de co-homologı́a del
complejo:
H n (D, R) := ker(cn )/ Im(cn−1 ).
Ejemplo 2.2.47 (Dualidad). El elegir sentido decreciente (en términos de grado) o creciente es
un clásico convecionalismo (discutible salvo en las iterpretaciones más topológicas). Intentemos
explicar la razón del doble sentido (creciente/decreciente) y de las expresiones con prefijo “co-”
(co-cadena, co-ciclo, co-borde, co-homologı́a,...) mediante la dualización. Es decir, veamos que
se puede pasar de un complejo de cadena a un complejo de co-cadena mediante dualización,
lo que explicarı́a la principal deferencia y similitud de ambas nociones. Supongamos dado un
complejo de cadena:
dn+2 dn+1 dn dn−1
C : ... Mn+1 Mn Mn−1 Mn−2 ...
con la propiedad dn ◦ dn+1 = 0. Ahora definamos los R−módulos duales N n := Mn∗ =

HomR (Mn , R). Consideremos el morfismo dn : Mn −→ Mn−1 . Si tomamos h : Mn−1 −→ R
morfismo de R−módulos, componiendo con dn tendrı́amos el morfismo de R−módulos h ◦ dn :
Mn −→ R. Esto se observa con el diagrama siguiente:
3La terminologı́a viene de la Topologı́a Algebraica y los morfismos frontera inducidos por triangulaciones,
ası́ como los términos ciclo, borde para representar, respectivamente ker(di ) e Im(di+1 ).
dn
Mn Mn−1
h ◦ dn h
R
Por ello, podemos definir la siguiente aplicación:
d∗n := HomR (dn , R) : HomR (Mn−1 , R) −→ HomR (Mn , R)
h 7−→ h ◦ dn .
Es aplicación porque h ◦ dn es morfismo de R−módulos. Es sencillo, además, probar que d∗n es
∗
un morfismo de R−módulos entre los duales Mn−1 y Mn∗ (i.e. d∗n ∈ HomR (Mn−1∗
, Mn∗ )).
Sabemos que dn ◦ dn+1 = 0 para cada n ∈ Z porque C es un complejo de cadena. Consideremos
∗
ahora f ∈ Mn−1 , es decir un morfismo f : Mn−1 −→ R. Entonces, d∗n (h) = (h ◦ dn ) ∈
HomR (Mn , R) = Mn∗ . Podemos aplicar ahora d∗n+1 al elemento (h◦dn ) ∈ HomR (Mn , R) = Mn∗ .
Tendremos que d∗n+1 (f ◦ dn ) ∈ Mn+1
∗
y se tiene:
∗ ∗ ∗

dn+1 ◦ dn (h) = dn+1 (dn ◦ h) = h ◦ (dn ◦ dn+1 ) = h ◦ 0 = 0.
dn ◦ dn+1 = 0
dn+1 dn
Mn+1 Mn Mn−1
h ◦ dn ◦ dn+1 = 0 h ◦ dn h
R
Es decir,d∗n+1◦ = 0. Escribiendo, para ajustar los ı́ndices, cn−1 := d∗n , tenemos el siguiente
d∗n
complejo de co-cadena, dual del complejo de cadena C:
n−2
c ∗ cn−1 cn ∗ cn+1 . . .
C∗ : . . . Mn−1 Mn∗ Mn+1
En los que respeta a este Capı́tulo usaremos notación ascendente y lo llamaremos solamente
complejos.
Definición 46 (Sucesiones exactas de R−módulos). Las sucesiones exactas de R−módulos
son los complejos de R−módulos:
di−1 di di+1 di+2
C : ... Mi Mi+1 Mi+2 ...
que verifican:
Im(di+1 ) = ker(di ), ∀i.
Se llaman sucesiones exactas cortas a las sucesiones exactas de la forma:
f g
0 M0 M M 00 0
0 00
Donde 0 es el R−módulo nulo, y 0 −→ M , M −→ 0, son los morfismo obvios (y, por ello,
no se representan). A veces abreviamos el término escribiedndo simplemente s.e.c..
Observación 2.2.48 (Exactitud y homologı́a). Obsérvese que dado un complejo de cadena:

dn+2 dn+1 dn dn−1
C : ... Mn+1 Mn Mn−1 Mn−2 ...
Entonces, el complejo de cadena C es una sucesión exacta si y solamente si todos los R−módulos
de homologı́a Hn (C, R) son el módulo 0. Análogamente, dado un complejo de co-cadena:
n−2
c cn−1 cn cn+1 . . .
D : ... M n−1 Mn M n+1
Entonces el complejo D es exacto si y solamente si los R−módulos de co-homologı́a H n (D, R)
son todos nulos.
Observación 2.2.49 (Más observaciones elementales). Como comentarios obvios, supon-

gamos que tenemos una sucesión exacta de R−módulos:
f g
0 M0 M M 00 0
• Como es exacta y 0 −→ M 0 es el morfismo nulo 0, Im(0) = ker(f ) = 0 significa que
necesariamente f ha de ser inyectiva. Algunos autores usan la notación M 0 ,−→ M
• Como es exacta y M 00 −→ 0 es el morfismo nulo 0, ker(0) = M 00 = Im(g) significa que
f ha de ser necesariamente suprayectiva. Algunos autores usan M − M 00 .
• Finalmente, decir que la anterior sucesión es exacta es una forma distinta de escribir
que
M/f (M 0 ) ∼
= M 00 .
• En el caso de espacios vectoriales de dimensión finita, una sucesión exacta como la
anterior, implicarı́a que M ∼
= M 0 ⊕ M 00 . Esto, que es cierto para espacios vectoriales,
no es cierto para módulos. Baste con observar la s.e.c. siguiente:
f g
0 −→ 2Z−−−−−→ Z−−−−→ Z/2Z −→ 0,
donde f es la inclusión y g es la proyección. Claramente Z ∼
6 2Z ⊕ (Z/2Z), porque Z
=
es libre de torsión y 2Z ⊕ (Z/2Z) tiene torsión.
Ejemplo 2.2.50 (Núcleo, Co-núcleo). Dado un morfismo de R−módulos f : M −→ N ,

tenemos una sucesión exacta de la forma siguiente:
i f π
0 ker(f ) M N Coker(f ) 0,
donde i es la inclusión y π es la proyección obvia.
Proposición 2.2.51. Dado un complejo de R−módulos

di−1 di di+1 di+2
C : ... Mi Mi+1 Mi+2 ...
entonces C es exacto si y solamente si para cada i, la sucesión exacta corta siguiente es exacta:
ki di
0 ker(di ) M ker(di+1 ) 0
donde ki es la inclusión canónica.

Demostración. Si la sucesión C es exacta, entonces Im(di ) = ker(di+1 ) para cada i.
Claramente, Im(ki ) = ker(di ) por definición, ası́ que Ci es una sucesión exacta corta. El
recı́proco es igualmente obvio.

Problema 72 (Axiomas de Peano-Dedekind). Acude a la página web https: // en.
wikipedia. org/ wiki/ Peano_ axioms . Revisa los axiomas de Peano-Dedekind que definen
en conjunto de los números naturales. Copia los axiomas que definen N y, entre ellos, el Prin-
cipio de Inducción. Una vez asumidos puedes aplicar inducción en tus argumentos. Encuentra
el enunciado del Teorema de Dedekind sobre la unicidad de los modelos de números naturales.
Averigua si los axiomas de Peano han sido modificados en algún momento con posterioridad a
1889.
2.2.6.1. Breve recordatorio de Teorı́a elemental del Endomorfismo (en caso

de no disponer de formación previa).
Problema 73. Sea(V, +, ·K ) un K−espacio vectorial (i.e. un K−módulo, donde K es un
cuerpo). Sea f : V −→ V un endomorfismo de K−espacios vectoriales. Supongamos dimK (V ) =
n es un espacio vectorial de dimensión finita (i.e. un K−módulo libre de rango finito) y sea
dada una base ordenada, es decir,
B := ({v1 , . . . , vn }, ≤),
donde {v1 , . . . , vn } es una base de V como K−espacio vectorial y ≤ es una relación de orden
total sobre {v1 , . . . , vn }.
Salvo permutación de los subı́ndices de los elementos de la base, se suele suponer que los
subı́ndices están ligados al orden (es decir, se suele suponer que v1 ≤ · · · ≤ vn ) y se suele decir
simplemente: “Sea B := {v1 , . . . , vn } una base ordenada”. Usaremos la segunda expresión,
aunque entenderemos la primera.
i) Pruébese que dado un endomorfismo ϕ : V −→ V (como K−espacio vectorial) y
fijada la base B, existe una única matriz MB (f ) ∈ Mn (K) verificando la siguiente
propiedad:
Para vada v ∈ V si sus coordenadas en la base B son dadas por la siguiente identidad:
v = x 1 v1 + · · · + x n vn ,
entonces ϕ(v) ∈ V tiene coordenadas dadas (en la misma base) mediante:
ϕ(v) = y1 v1 + · · · + yn vn ,
y la relación entre las coordenadas de v y ϕ(v) viene dada por la siguiente identidad:
   
y1 x1
 ..   .. 
 .  = MB (ϕ)  .  .
yn xn
ii) Sean f, g : V −→ V dos endomorfismos de V como K−espacio vectorial, sea λ ∈ K.
Fijemos la base ordenada B precedente. Pruébese que, con las notaciones precedentes,
se tiene:
MB (f + g) = MB (f ) + MB (g), MB (λ ·K f ) = λMB (f ),
y
MB (f ◦ g) = MB (f ) · MB (g),
donde + y ·λ son las operaciones de K−módulo en HomK (V, V ) = EndK (V ), ◦ es la
composición de endomorfismos y las operaciones en todas las expresiones a la derecha
de cada igualdad son las operaciones usuales con matrices.
iii) Pruébese que (EndK (V ), +, ◦) es un anillo (con las operaciones de suma y com-
posición) no conmutativo y con unidad (el neutro para la composición es IdV ). Pruébese,
además, que el siguiente es un isomorfismo de anillos no conmutativos con unidad:
MB : (EndK (V ), +, ◦) −→ (Mn (K), +, ·)
f 7−→ MB (f ).
Pruébese que también es isomorfismo de K−módulos.
iv) Sea (GL(n, K), ·) el grupo de las matrices inversibles n × n con coordenadas K. Es
decir, el conjunto
GL(n, K) := {A ∈ Mn (K) : ∃A0 ∈ Mn (K), AA0 = A0 A = Idn },
donde Idn es la matriz identidad. Pruébese, con las notaciones precedentes, que son
equivalentes:
• f es un isomorfismo de K−espacios vectoriales,
• f es un monomorfismo de K−espacios vectoriales,
• f es un epimorfismo de K−espacios vectoriales,
• MB (f ) ∈ GL(n, K).
• f transforma bases ordenadas de V en bases ordenadas de V .
Problema 74. Con las mismas notaciones e hipótesis del problema precedente:
i) Sean B y B 0 := {w1 , . . . , wn } dos bases ordenadas de V . Pruébese que existe una

única aplicación K−lineal ψ : V −→ V tal que ψ(vi ) = wi . Pruébese que ψ es un
automorfismo de V como K−espacio vectorial. Conclúyase que la matrix MB (ψ) está
en GL(n, K). A la matriz MB (f ) se la suele denominar “matriz del cambio de base
de B a B 0 ” porque, como parece obvio por su propia definición, ψ es el isomorfismo
de “cambio de base”.
ii) Sean B y B 0 dos bases ordenadas de V , sea ψ : V −→ V el automorfismo asociado
a estas dos bases, como en el ı́tem precedente. Pruébese que para cada endomorfismo
f : V −→ V las matrices MB (f ) y MB0 (f ) en las respectivas bases verifican la
siguiente relación:
MB (f )−1 MB0 (f )MB (f ) = MB (f ).
iii) Dos matrices A, B ∈ Mn (K) se denominan semajantes si existe P ∈ GL(n, K)
tal que P AP −1 = B. Pruébese que la relación “ser semejante” es una relación de
equivalencia. Además, dado que MB : EndK (V ) −→ Mn (K) es un isomorfismo de
anillos, pruébese que las siguientes propiedades son equivalentes para dos matrices
A, B ∈ Mn (K):
• Las matrices A y B son semajantes,
• Existe un endormofismo f : V −→ V como K−espacio vectorial y existen dos
bases ordenadas B y B 0 de V tales que
A = MB (f ), AB0 (f ).
En otras palabras, purébese que dos matrices A, B ∈ Mn (K) son semejantes si y
solamente si están asociadas al mismo endomorfismo de V , aunque en bases diferentes.
Problema 75. Sea (Mn (K), +, ·K ) el espacio de matrices n × n con coordenadas en el cuerpo
K.
i) Pruébese que Mn (K) es un K−espacio vectorial de dimensón n2 . Exhı́base una base.
ii) Sea A ∈ Mn (K) una matriz y considérese el subespacio de Mn (K) generado por la
familia siguiente:
2 2
−1
P (A) := {Idn , A, A2 , . . . , An , An },
donde Ai := A · Ai−1 , para i ≥ 2, es la potencia i−ésima de la matriz A. Pruébese

que P (A) es una familia ligada (o, dicho de otro modo, que sus elementos no son
linealmente independientes en Mn (A)). Pruébese que existen a0 , a1 , . . . , an2 ∈ K, no
todos nulos, tales que:
2
n
X
ak Ak = 0.
k=0
iii) Considérese el anillo de polinomios p(X) ∈ K[X] y supongamos que
p(X) = am X m−1 + · · · + a1 X + a0 .
Dada una matriz A ∈ Mn (K) definamos la matriz:
p(A) := am Am + am−1 Am−1 + · · · + a1 A + a0 Idn ∈ Mn (K).
Pruébese que está bien definida.
iv) Considérese el conjunto siguiente:
AnnK[X] (A) := {q ∈ K[X] : q(A) = 0}.
Pruébese que AnnK[X] (A) es un ideal en K[X].
v) Pruébese que el ideal AnnK[X] (A) posee un polinomio no nulo de grado a lo sumo n2 .
Concluir que el ideal AnnK[X] (A) está generado por un polinomio mónico no nulo de
grado a lo sumo n2 . Intenta probar que AnnK[X] (A) está generado por un polinomio
mónico de grado a lo sumo n sin usar el Teorema de Hamilton-Cayley que viene en las
Secciones siguientes. Al polinomio generador de AnnK (A) se le denomina polinomio
mı́nimo de la matriz A.
vi) Dadas A, B ∈ Mn (K) dos matrices semejantes y sea P ∈ GL(n, K) tal que P AP −1 =
B, prueba que para cada polinomio h ∈ K[X] se tiene:
P h(A)P −1 = h(B).
Concluye que si dos matrices A y B son semejantes, se tiene:
AnnK[X] (A) = AnnK[X] (B),
y por tanto, dos matrices semejantes poseen el mismo polinomio mı́nimo.
vii) Recuérdese que un valor propio de una matriz A ∈ Mn (K) es una constante λ ∈ K
en el cuerpo tal que existe un vector no nulo v ∈ V \ {0} tal que Av = λv, donde v se
ha escrito como columna. Pruébese que si p ∈ K[X] es un polinomio, se verifica:
p(A)v = p(λ)v.
Conclúyase que si λ ∈ K es valor propio de A, entonces p(λ) = 0 para todo polinomio
p ∈ AnnK[X] (A). Es decir, pruébese que los valores propios de una matriz cuadrada
son la raı́ces de su polinomio mı́nimo y que, por el apartado precendente, el número
de valores propios distintos de una matriz cuadrada A ∈ Mn (K) en un cuerpo K no
puede exceder n2 .
Problema 76. Hágase el mismo análisis que en el problema precedente considerando el anillo
no conmutativo con unidad EndK (V ) en lugar de Mn (K). Conclúyase que el número de valores
propios distintos de un endomorfismo es finito. ( Hint: Usando la estructura de K[X]−módulo
de V descrita en el Ejemplo 2.2.4 precedente, obsérvese que para cada endomorfismo ϕ ∈
EndK (V ), cada polinomio p ∈ K[X] y cada base ordenada B de V , se tiene que:
MB (p(ϕ)) = p(MB (ϕ)).)
Problema 77. Sea R un anillo, a un ideal de R y M un R−módulo. Sea aM el submódulo
producto de a por M . Sea M/aM el R−módulo cociente. Probad que la siguiente correspon-
dencia:
·R/a : (R/a) × (M/aM ) −→ (M/aM )
(x + a, m + aM ) 7−→ xm + aM,
define una estructura de R/a−módulo sobre M/aM .
Problema 78 (Subespacios invariantes de un endomorfismo). Sea V un espacio vectorial
de dimensión finita sobre un cuerpo K y sea ϕ : V −→ V un endomorfismo. Consideremos la
estructura de K[X]−módulo inducida en V por el enfomorfismo ϕ: (V, +, ·K[X] ). Recuérdese
que un subespacio vectorial W de V se denomina ϕ−invariante sii ϕ(W ) ⊆ W . Pruébese que
son equivalentes para cada subespacio W de V :
i) El subespacio W es ϕ−invariante.
ii) W es un submódulo de V visto como K[X]−módulo.
Problema 79 (Cuerpos de Galois). Se denominan cuerpos de Galois a los cuerpos finitos
y para un cuerpo de cardinal q el cuerpo de Galois de cardinal q se denota mediante GFq o
simplemente mediante Fq . Se pide:
i) Pruébese que si un cuerpo K es finito tiene que tener caracterı́stica no nula y, por
tanto, existe un único primo p ∈ N no nulo tal que Fp ⊆ K.
ii) Pruébese que si un cuerpo K es finito de ceracterı́stica p, entonces la extensión de
cuepos Fp ⊆ K es finita (o, equivalentemente, pruébese que [K : Fp ] < +∞ o,
equivalentemente, K es un Fp − espacio vectorial de dimensión finita).
iii) Conclúyase que si K es un cuerpo finito, entonces existe un primo p ∈ N no nulo y
existe n ∈ N tal que su cardinal satisface ](K) = pn . Equivalentemente, conclúyase
que los únicos cuerpos de Galois posibles están son de la forma Fq con q = pn .
iv) Pruébese que no todos los cuerpos de caracterı́stica positiva son finitos ( Hint: Muestra
un ejemplo.)
v) Pruébese que para cualquier primo no nulo p ∈ N y para cualquier n ∈ N existe un
cuerpo de Galois Fpn ( Hint: Revisad los Apuntes de la asignatura “Teorı́a de Galois”
que precede a este curso.)
Problema 80. Consideremos el ideal a := 3Z del anillo Z y el Z−módulo M = Z6 . Probad
que el Z/3Z−módulo M/aM es el espacio vectorial sobre Z/3Z dado como (Z/3Z)6 .
Problema 81 (Caracterización del producto mediante propiedad universal). Probad

que el producto de R−módulos verifica la siguiente propiedad universal: Q
Sea {Mi : i ∈ I} una familia de R−módulos.
Q Para cada i ∈ I, sea πi : i∈I Mi −→ Mi la
proyección canónica. Entonces, el par ( i∈I Mi , {πi : i ∈ I}) verifica que
Dado cualquier otro par (N, {ϕi : N −→ Mi : i ∈ I}), donde N es un R−módulo y
ϕi ∈ HomQ R (N, Mi ) para cada i ∈ I, entonces existe un único morfismo de R−módulos f ∈
HomR (N, i∈I Mi ) tal que
πi ◦ f = ϕi , ∀i ∈ I.
Q
Probad que la anterior propiedad caracteriza de manera única (salvo isomorfismo) a i∈I Mi .
Problema 82 (Caracterización del co-producto mediante propiedad universal). Probad
que el co-producto de R−módulos verifica la siguiente propiedad universal: `
Sea {Mi : i ∈ I} una familia de R−módulos.
` Para cada i ∈ I, sea λi : Mi ,→ i∈I Mi la
inmersión canónica. Entonces, El par ( i∈I Mi , {λi : i ∈ I}) verifica que
Dado cualquier otro par (N, {ϕi : Mi −→ N : i ∈ I}), donde N es un R−módulo y
ϕi ∈ Hom `R (Mi , N ) para cada i ∈ I, entonces existe un único morfismo de R−módulos f ∈
HomR y( i∈I Mi , N ) tal que
f ◦ λi = ϕi , ∀i ∈ I.
`
Prueba que la anterior propiedad caracteriza de manera única (salvo
` isomorfismo) a i∈I Mi .
Cuando se hablar de R−módulos, la notación del co-producto se reemplaza por ⊕ y se
denomina suma directa. En este curso, por tanto, escribiremos :
a
⊕i∈I Mi := Mi .
i∈I
Problema 83. Completa los detalles de la prueba de la Proposición 2.2.36. ( Hint: Puedes
ayudarte de las caracterizaciones de producto y co-producto de módulos descritas en los dos
problemas precedentes).
Problema 84. Probad la siguiente variante del algoritmo de la división de Euclides:
Dados a, b ∈ N dos enteros positivos no nulos, existe q, r ∈ Z tales que:
i) a = qb + r,
ii) 0 ≤ |r| ≤ b/2.
Problema 85 (Morfismos de anillos y estructuras de anillos como R−módulos). Se
trata de probar que para dos anillos R y B, los morfismos de anillos entre R y B y las estructuras
de R−módulo sobre B que satisfacen la ropiedad (2.2.2) están identificadas. Definamos los
siguientes conjuntos:
i) El conjunto de todos los morfismos de anillo entre R y B:
M orf (R, B) := {f : R −→ B : h es morfismo de anillos}.
ii) El conjunto de todas las posibles estructuras de R−módulo sobre B que satisfacen
(2.2.2):
R−M od(B) := {∗R : R×B −→ B : B es R−módulo con la operación ∗R y satisface (2.2.2)}.
Definamos la transformación:
Φ : M orf (R, B) −→ R − M od(R, B)
f 7−→ ∗f ,
donde ∗f es la operación definida por la Identidad (85) de la lista de ejemplos dada en Ejemplo
2.2.2. Pruébese que Φ es una biyección entre esos dos conjuntos y, por tanto, que morfismos
entre anillos R y B es lo mismo que considerar estruturas de R−módulo sobre B que se portan
bien con respecto al producto de B. Las notaciones M orf (R, B) y R − M od(B) no se volverán
a usar y sólo sirven para clarificar la noción de R−álgebra.
Pruébese, finalmente, que:
Una R−álgebra es un anillo (A, +, ·) que posee una estructura de R−módulo (A, +, ·R ) y que
satisface la Identidad (2.2.1)
Problema 86. Sea f : S −→ R un morfismo de anillos. Probad que si (M, +, ·R ) es un

R−módulo, la siguiente operación “externa”:
·S : S × M −→ M
(s, m) 7−→ f (s) ·R m
define una estructura de S−módulo sobre M .
Dados M y N dos R−módulos y dado ϕ : M −→ N un morfismo de R−módulos entre M
y N (i.e. ϕ ∈ HomR (M, N )), pruébese que, entonces, ϕ ∈ HomS (M, N ), donde suponemos
en M y en N las respectivas estructuras de S−módulos definidas por el morfismo de anillos
f : S −→ R. En particular, se define un monomorfismo de grupos y S−módulos
HomR (M, N ) ,−→ HomS (M, N ).
Verifica esta última afirmación.
Problema 87. Prueba la Proposición 2.2.32.
Problema 88. Prueba la Proposición 2.2.38. En particular, prueba los siguientes hechos,
relatios a las dos últimas propiedades de esa proposición:
i) Probad que si {Mi : i ∈ I} es una familia cualquiera de R−módulos libres, el
co-producto o suma directa ⊕i∈I Mi tambiés es un R−módulo libre. En particular,
muestra cómo construir una base de ⊕i∈I Mi a partir de una familia {Bi : i ∈ I} de
tal modo que Bi es base de Mi .
ii) Probad que si {MQ 1 , . . . , Mr } es una familia cualquiera de R−módulos libres, el pro-
r
ducto cartesiano i=1 Mi tambiés Qr es un R−módulo libre. En particular, muestra
cómo construir una base de i=1 Mi a partir de una familia {Bi : 1 ≤ i ≤ r} de tal
modo que Bi es base de MQ i.
iii) Reflexiona si el producto i∈I Mi de una familia cualquiera de R−módulos libres
{Mi : i ∈ I} es R−módulo Q libre. (Hint: pensar en el anillo de series de potencials
formales Z[[X]] = ZN = N Z, también conocido como grupo de Baer-Specker. Buscad
en la web, por ejemplo en https: // wildtopology. wordpress. com/ 2014/ 07/ 02/
the-baer-specker-group/ . Explicad lo que se entienda de la prueba.)
Problema 89. Probad las afirmaciones de la Proposición 2.2.43.
Problema 90. Sea N un R−módulo y X un conjunto. Consideremos el conjunto N X de las
aplicaciones de X en el R−módulo N y la operación suma que hace de él un grupo abeliano
(N X , +). Probad que la siguiente es una operación externa:
·R : R × N X −→ NX
(λ, σ) 7−→ λσ : X −→ N,
donde
λσ : X −→ N
x 7−→ λ ·R σ(x).
Probad adicionalmente que
i) (N X , +, ·R ) es un R−módulo.
ii) Para cada R−módulo libre M , de base X, y para cada R−módulo N cualquiera, los
siguientes R−módulos son isomorfos:
HomR (⊕X R, N ) ∼
= NX.
Problema 91 (La filtración p−ádica sobre un anillo R). En este problema estudiaremos
la métrica definida en un anillo R, mediante la filtración p−ádica definida por un ideal p sobre
R. Esta filtración viene dada por la cadena descende de ideales de R siguiente:
R ⊇ p ⊇ p2 ⊇ p3 ⊇ · · · ⊇ pn ⊇ · · ·
i) Probad que la siguiente es una topologı́a sobre R:
T := {U ⊆ R : ∀x ∈ U, ∃n ∈ N, x + pn ⊆ U },
donde x + pn := {x + y : y ∈ pn }.
ii) Probad que en el espacio topológio (R, T ) las siguientes son aplicaciones continuas:
−: R×R −→ R
(a, b) 7−→ a + (−b).
×: R×R −→ R
(a, b) 7−→ a · b.
iii) Probad que la siguiente es una base de entornos de 0 ∈ R para la topologı́a T :
{pn : n ∈ N}.
Probad, asimismo, que la siguiente es una base de entornos de cualquier punto x ∈ R:
{x + pn : n ∈ N}.
iv) Supongamos que la filtración p−ádica verifica la siguiente propiedad:
\
(2.2.3) pn = (0).
n∈N
Probad que la siguiente función (llamada la función de orden de un punto x ∈ R con

respecto a la filtración p−ádica) está bien definida:
ordp : R −→ R ∪ {+∞}
x 7−→ ordp (x) := max{k ∈ N : x ∈ pk },
donde se sobre-entiende que ordp (0) = +∞.
v) Con la hipótesis (2.2.3) del ı́tem anterior, probad que la siguiente aplicación está bien
definida:
| · |p : R −→ R
x 7−→ |x|p := eord1p (x) ,
donde se sobre-entiende que |0|p = 0 y e ∈ R es una constante e > 1 fija. Probad
que esta apicación, llamada valor absoluto p−ádico sobre R, satisface las propiedades
siguientes:
• Es positiva: |x|p ≥ 0, ∀x ∈ R,
• Sólo se anula en x = 0, es decir |x|p = 0 ⇐⇒ x = 0.
• Se porta bien para el producto en el anillo R:
∀x, y ∈ R, |x · y|p ≤ |x|p |y|p .
• Verifica la desigualdad triangular fuerte sobre R, es decir,
∀x, y ∈ R, |x + y|p ≤ max{|x|p , |y|p }.
Se dice que | · |p es un valor absoluto no arquimediano sobre R.
vi) Concluid que la topologı́a definida por la filtración p−ádica sobre R (con la hipótesis
(2.2.3)) es una topologı́a metrizable. Es decir, hay que probar que la siguiente es una
métrica (i.e. distancia) sobre R:
distp : R × R −→ R
(x, y) 7−→ distp (x, y) := |x − y|p .
Probad que si B p (x, ε) es la bola cerrada de centro x ∈ R y radio ε > 0 sobre R con
respecto a la distancia distp , entonces,
1
) = x + pn .
B p (x,
en
Concluir que la topologı́a definida por la métrica distp coincide con la topologı́a T
descrita anteriormente.
Problema 92 (Las métricas p−ádicas sobre Q). Consideremos el anillo Z y el ideal p := pZ,
definido por un elemento primo p ∈ N, p 6= 0. Denotemos por ordp a la función de orden ordp
definida por el ideal p y para cada x ∈ Z, denotemos mediante | · |p el valor absoluto p−ádico
sobre Z definido mediante la igualdad siguiente:
1
|x|p := ord (x) .
p p
Pruébese que en Z, el ideal primo p verifica la propiedad (2.2.3) del Problema anterior. Exten-
damos esta métrica al cuerpo Q mediante:
| · |p : Q −→ R
x |x|p
y 7−→ | xy |p := |y|p .
Se pide probar las afirmaciones siguientes:

i) La función | · |p está bien definida y es un valor absoluto no arquimediano sobre Q
(que se denomina valor absoluto p−ádico sobre Q. Esto es, | · |p verifica las siguientes
propiedades:
• Es positiva: |x|p ≥ 0, ∀x ∈ Q,
• Sólo se anula en x = 0, es decir |x|p = 0 ⇐⇒ x = 0.
• Se porta bien para el producto en el cuerpo Q:
∀x, y ∈ Q, |x · y|p = |x|p |y|p .
• Verifica la desigualdad triangular fuerte sobre Q, es decir,
∀x, y ∈ Q, |x + y|p ≤ max{|x|p , |y|p }.
ii) La función distancia que induce es una métrica sobre Q. Es decir, la siguiente función
es una métrica sobre Q:
distp : Q × Q −→ R
(x, y) 7−→ distp (x, y) := |x − y|p .
Probad, asimismo, que si B p (x, ε) es la bola cerrada de centro x ∈ Q y radio ε > 0
sobre Q con respecto a la distancia distp , entonces,
a
B p (0, 1) = ZpZ := { ∈ Q : p - b}.
b
Probad que esta bola es un subanillo del cuerpo de números racionales (llamado loca-
lización de Z en pZ . Pruébese que los siguientes son ideales en ZpZ y hay que hallar
generadores para ellos:
1
B p (0, n ).
p
Conclúyase que la cadena de bolas siguiente:
1 1
B p (0, 1) ⊇ B p (0, n ) ⊇ · · · ⊇ B p (0, n ) ⊇ · · ·
p p
es una filtración q−ádica sobre ZpZ y detectad el ideal.
iii) Fórmula del producto de Weil: Denotemos mediante | · |0 : Q −→ R, el valor absoluto
usual sobre Q. Probad la siguiente igualdad, conocida como Fórmula del producto de
Weil,:  
Y
 |x|p  |x|0 = 1, ∀x ∈ Q.
p∈N, p ≥ 1 es primo
Nótese que hay que probar que este producto es finito antes de poder probar la igualdad.
iv) Buscad en internet referencias relativas al completado del espacio métrico (Q, distp ),
conocido como cuerpo de los números p−ádicos Qp .
Problema 93. Sea K un cuerpo, K[[X]] el anillo de series de potencias formales y m := (X)
el ideal generado por la serie X. Consideremos la filtración m−ádica sobre K[[X]] y sean ord0 y
|·|X respectivamente las funciones de orden y el valor absoluto definidos por este ideal m = (X).
Pruébese que, efectivamente la función de orden y el valor absoluto están bien definidos y
verifican las propiedades adecuadas4. Sea distX la distancia asociada al valor absoluto | · |X .
Probar la equivalencia entre las siguientes propiedades para cualesquiera series f, g ∈ K[[X]]:
i) ord0 (f − g) ≥ k,
ii) |f − g|X ≤ e1k ,
iii) distX (f, g) ≤ e1k ,
4Por lo visto en problemas anteriores, basta con ver que ∩∞ mn = (0) en K[[X]]
n=0
2.3. DETERMINANTE. TEOREMA DE HAMILTON-CAYLEY 111
iv) Si las siguientes son las expensiones como series de Taylor de f y g:

X∞ ∞
X
i
f := ai X , g= bi X i ,
i=0 i=0
Entonces, ai = bi , para todo i ∈ N. 0 ≤ i ≤ k.
Reflexionad sobre la relación entre esta noción de orden ord0 y la introducida en el curso de
variable compleja (orden como cero de f − g). Reflexionad sobre el significado de la métrica
m−ádica en K[[X]].
Problema 94. Pruébese la Ley Modular para submódulos de un R−módulo. Pruébese también
que si a es un ideal de un anillo R y N1 , N2 son dos submódulos de un R−módulo M , entonces
se verifica la distributiva siguiente:
a (N1 + N2 ) = aN1 + aN2 .
Problema 95. Sean X e Y dos conjuntos del mismo cardinal (i.e. dos conjuntos biyectables).
Pruébese que, entonces, los R−módulos RX y RY son isomorfos. Pruébese también que, bajo
las mismas hipótesis, los R−módulos ⊕X R y ⊕Y R también son isomorfos. Discútase si el
recı́proco es cierto en alguno de los casos.
Problema 96. Si M y N son dos R−módulos libres (de rango finito o infinito), entonces
HomR (M, N ) es también un R−módulo libre de rango finito. Pruébese.
Problema 97 (Propiedades de Extensión y contracción de ideales (I)). Sea f : R −→ B
un morfismo de anillos, a ⊆ R un ideal y b ⊆ B otro ideal. Pruébense las siguientes propiedades
(que constituyen la Proposición 2.2.23 del texto):
c e
i) a ⊆ (ae ) , b ⊇ (bc ) .
e c e e c
ii) a = ((a ) ) , b = ((bc ) ) .
e c
iii) Sea C es el conjunto de las contracciones a R de los ideales de B (i.e. C := {f rakbc :

b ideal en B}). Sea E el conjunto de los ideales de B que son extensión de los ideales
de R (i.e.E := {ae : a ideal en R}). Las siguientes son aplicaciones biyectivas (una
inversa de la otra):
Φ : C −→ E
a 7−→ ae .
Φ−1 : E −→ C
b 7−→ bc .
Problema 98 (Propiedades de Extensión y Contracción de Ideales (II)). Pruébese la
Proposición 2.2.24. Es decir, pruébense las afirmaciones siguientes:
Sea f : R −→ B un morfismo de anillos. Sean a1 y a2 dos ideales del anillo R. Se tiene:
e
i) (a1 + a2 ) = ae1 + ae2 .
e
ii) (a1 ∩ a2 ) ⊆ ae1 ∩ ae2 .
e
iii) (a1 a2 ) = ae1 ae2 .
Búsquese algún ejemplo en el que en la propiedad ii) no se de la igualdad.
Problema 99 (Propiedades de Extensión y Contracción de Ideales (III)). Pruébese
la Proposición 2.2.25. Es decir, pruébense las afirmaciones siguientes:
Sea f : R −→ B un morfismo de anillos. Sean b1 y b2 dos ideales del anillo B. Se tiene:
c
i) (b1 + b2 ) ⊇ bc1 + bc2 .
c
ii) (b1 ∩ b2 ) = bc1 ∩ bc2 .
c
iii) (b1 b2 ) ⊇ bc1 bc2 .
Búsquese ejemplos en los que en las propiedades i) y iii) no se de la igualdad.
2.2.6.2. Futuro: Homologı́a Singular.
2.2.6.3. Futuro: Homotopı́a.
2.2.6.4. Futuro: Co-homologı́a de de Rahm.
2.3. Determinante. Teorema de Hamilton-Cayley

En esta Sección recordaremos algunas propiedades básicas del determinante de matrices con
coordenadas en un anillo.
2.3.1. Determinante: propiedades básicas.

Definición 47 (Determinante). Sea R un anillo. El determinante n × n es un polinomio
homogéneo de grado n en n2 variables
det n ∈ R[X1,1 , . . . , X1,n , . . . , Xn,1 , . . . , Xn,n ] = R[Xi,j : 1 ≤ i, j ≤ n},
que viene dado por la siguiente expresión:
X n
Y
det n := I(σ) Xi,σ(i) ,
σ∈Sn i=1
donde I(σ) ∈ {±1} ⊆ R Q (es decir, es el ı́ndice de la permutación cuando −1 6= 1 en R) es el

n
coeficiente del monomio i=1 Xi,σ(i) y el resto de términos tienen coeficiente nulo.
También se denomina determinante a la función polinomial que define det n sobre el R−módulo
Mn (R) de matrices m × n con coordenadas en R:
detn : Mn (R) −→ RQ
P n
A := (ai,j )1≤i,j≤n 7−→ σ∈Sn I(σ) i=1 ai,σ(i) .
Definición 48 (Permanente). Se llama permanente a la función

Permn : Mn (R) −→ P QRn
A := (ai,j )1≤i,j≤n 7−→ σ∈Sn i=1 ai,σ(i) .
Observación 2.3.1. Usualmente se omite el sub-ı́ndice n de detn y de Permn , que se sobre-

entiende por el contexto. Nosotros lo omitiremos salvo que sea explı́citamente necesario indi-
carlo.
Observamos también que tanto el determinante como el permanente son polinomios homogéneos
de grado n (recordar Problema 60). Entonces para cada matriz A ∈ Mn (R) y para cada λ ∈ R
se tiene:
det(λA) = λn det(A),
y
Perm(λA) = λn Perm(A),
donde λA es la multiplicación de λ ∈ R por la matriz A del R−módulo Mn (R).
Proposición 2.3.2. Si una matriz M ∈ Mn (R) es tal que posee una fila idénticamente nula
(i.e. todas sus coordenadas en esa fila son 0 ∈ R), entonces
det(M ) = 0, Perm(M ) = 0.
Demostración. Obvio por la propia definición de ambas funciones. En cada término
de la suma aparece un producto de elementos. En cada uno de esos productos aparece una
coordenada de cada fila. Al haber un 0 en cada uno de los productos, todos los productos son
nulos y, en consecuencia, la suma de todos ellos es nula.
Definición 49 (Función multi-lineal). Sean M1 , . . . , Mn , T una lista finita de R−módulos.

Una función
f : M1 × · · · × Mn −→ T,
se denomina multi-lineal si es morfismo de R−módulos en cada grupo de variables separada-
mente. Es decir, si para cada i, 1 ≤ i ≤ n y para cada familia
Y
m := (m1 , . . . , mi−1 , mi+1 , . . . , mn ) ∈ Mj ,
j6=i
la función
f (m1 , . . . , mi−1 , ·, mi+1 , . . . , mn ) : Mi −→ T
v 7−→ f (m1 , . . . , mi−1 , v, mi+1 , . . . , mn ),
es un morfismo de R−módulos.
Definición 50 (Función multi-lineal alternada). Con las notaciones de la Definición prece-

dente, sea M un R−módulo y supongamos M = M1 = · · · = Mn . Una función multi-lineal
f : M1 × · · · × Mn = M n −→ T,
se denomina alternada si para cada permutación σ ∈ Sn y para cada lista de elementos
(m1 , . . . , mn ) ∈ M n se tiene
f (mσ(1) , . . . , mσ(n) ) = I(σ)f (m1 , . . . , mn ).
La función se llama simétrica si
f (mσ(1) , . . . , mσ(n) ) = f (m1 , . . . , mn ).
Nótese que se llama simétrica cuando su valor no se modifica tras permutar las coordenadas,
mientras que se llama alternada cuando preserva su valor para las permutaciones del subgrupo
alternado An (ver la definición de An en Proposición 2.3.8) y multiplica su valor por (−1) (i.e.
“cambia de signo”) cuando no lo son.
Teorema 2.3.3. Sea R un anillo. Con las notaciones precedentes, se tiene:

i) El determinante es una función multi-lineal alternada:
n
det : Rn × · · · × Rn = (Rn ) −→ R 
v1
(v1 , . . . , vn ) 7−→ det  ...  ,
 
vn
donde  
v1
 .. 
 .  ∈ Mn (R),
vn
es la matriz cuyas filas son los elementos v1 , . . . , vn ∈ Rn .
ii) El permanente Permn es una función multi-lineal simétrica.
iii) Las siguientes funciones son multi-lineales simétricas:
(n)
Sk : Rn −→ R,
donde
(n)
X Y
sk (α1 , . . . , αn ) := αi .
S⊂[n],](S)=k i∈S
Se las denomina funciones simétricas elementales .
Demostración. Probaremos solamente el caso del determinante, las otras afirmaciones se
siguen por un argumento similar (caso del permanente) o son conocidas (caso de las funciones
simétricas elementales). Es bastante sencillo verificar que es multi-lineal: en cada monomio sólo
aparece una variable por fila con lo que, sacándola como factor común, podemos verificar que
es multi-lineal. Esto se verá con más detalle tras la Fórmula de Laplace. Veamos solamente que
es alternada. Para ello, dada σ ∈ Sn una permutación, podemos definir una transformación
entre matrices de Mn (R) consistente en permutar filas. Es decir, dada la matriz
M := (ai,j )1≤i,j≤n ,
definimos la matriz
Mσ := (aσ(i),j )1≤i,j≤n ,
obtenida permutando las filas de M conforme a las reglas que indique σ. Ahora para cada
σ ∈ Sn , consideremos la siguiente biyección de Sn en sı́ mismo
φσ : S n −→ Sn
τ 7−→ τ ◦ σ −1 .
Obsérse que el ı́ndice satisface I(φσ (τ )) = I(σ)I(τ ). Para concluir escribamos la expresión del
determinante:
X Yn X n
Y
det(M ) := I(τ ) ai,τ (i) = I(φσ (ρ)) ai,φσ (ρ)(i) ,
τ ∈Sn i=1 ρ∈Sn i=1
donde simplemete hemos usado que φσ es biyectiva. Ahora, reescribiendo el valor de φσ ten-
dremos
 
X n
Y X n
Y
I(σ)I(ρ) ai,(ρ◦σ−1 )(i) = I(σ)  I(ρ) aσ(t),ρ(t)  = I(σ) det(Mσ ),
ρ∈Sn i=1 ρ∈Sn i=t
−1
donde hemos cambiado t = σ (i) en cada producto, concluyendo ası́ la prueba del enunciado.

Para más información sobre las funciones simétricas elementales, véase la Subsección de prob-
lemas 2.3.4.2.
Corolario 2.3.4. Sea A ∈ Mn (R) una matriz, λ ∈ R un elemento del anillo y sea M (λ, i) ∈
Mn (R) la matriz obtenida multiplicando la fila i de M por λ. Entonces,
det(M (λ, i))) = λ det(M ).
Demostración. Es consecuencia inmediata del hecho de ser det multilineal.
Corolario 2.3.5. Sea A ∈ Mn (R) una matriz, sea ρ ∈ Si una permutación y denotemos
por Aρ ∈ Mn (R) la matriz obtenida de A permutando sus filas mediante ρ. Es decir, si
A := (ai,j )1≤i,j≤n , la matriz Aρ viene dada mediante la siguiente identidad:
Aρ := (aρ(i),j )1≤i,j≤n .
Entonces, se tiene
det(Aρ ) = I(ρ) det(A).
Demostración. Es consecuencia inmediata del hecho de ser det alternada.
Corolario 2.3.6. El valor del determinante “cambia de signo” si se permutan dos filas. Esto
es, si M 0 ∈ Mn (R) es una matriz obtenida de otra matriz M ∈ Mn (R) tras permutar dos filas,
entonces,
det(M 0 ) = (−1) det(M ).
Demostración. Obvio por la Proposición precedente, dado que intercambiar dos filas es
aplicar una transposición σ = (r s) que tiene ı́ndice (−1).
Observación 2.3.7. Una forma inmediata de aplicar los resultados precedentes podrı́a ser
también la siguiente reflexión:
Sea R un anillo y supongamos que satisface la siguiente propiedad:
“El número entero 2 ∈ Z no es anulador de ningún elemento de un anillo R como Z−módulo.”
Una forma de interpretar esta propiedad, de modo equivalente, consiste en afirmar que para
cada a ∈ R, si a + a = 0, entonces a = 0.
Con esta propiedad, sea M ∈ Mn (R) una matriz tal que posee dos filas iguales. Supongamos
que las filas idénticas en M son las filas i y j. Definamos M 0 la matriz obtenida al intercambiar
las filas i y j de M . por los resultados precedentes tendremos:
det(M 0 ) = I((i j)) det(M ) = − det(M ).
Pero, obviamente, M 0 = M con lo que tendremos que
det(M ) = − det(M ).
Y nuestra hipótesis sobre R implicará que det(M ) = 0.
Esta propiedad para matrices con coordeanadas en anillos que satisfacen la hipótesis sugerida es
cierta, también, sin la hipótesis sobre la caracterı́stica de R. Es lo que se indica en la siguiente
proposición.
Proposición 2.3.8. Consideremos el morfismo de grupos dado por el ı́ndice de las permuta-
ciones:
I : Sn −→ Z× .
Se verifica:
i) El núcleo de I, es decir, el conjunto de las permutaciones de orden par, es un subgrupo

normal de Sn . Llamaremos a este grupo el grupo alternado y lo denotaremos por
An ⊆ Sn .
ii) El cardinal de Sn es 2](An ), por ser isomorfos Z× = {±1} y el grupo cociente:
Sn /An .
iii) La siguiente es una biyección entre An y su complementario en Sn :
Φ := Φ1,2 : An −→ Sn \ An ,
σ 7−→ σ ◦ (1 2).
iv) Si Φ es la biyección anterior, el ı́ndice verifica I(Φ(σ)) = −I(σ), ∀σ ∈ An .
v) Para cada matriz A := (ai,j ) ∈ Mn (R), se tiene:
n
! n
!
X Y X Y
det(A) := ai,σ(i) − ai,Φ(σ)(i) .
σ∈An i=1 σ∈An i=1
vi) Si las filas 1 y 2 de una matriz A son iguales, para cada σ ∈ An se tiene que
n
Y n
Y
ai,σ(i) = ai,Φ(σ)(i) .
i=1 i=1
vii) Si una matriz A tiene dos filas iguales, entonces, su determinante verifica det(A) = 0.
Demostración. Se deja como Problema 101.
Corolario 2.3.9. Sea dada una matriz M ∈ Mn (R) cuya fila i−ésima es dada por el elemento
u ∈ Rn y cuya fila j−ésima es el elemento v ∈ Rn . Sea M 0 la matriz cuyas filas k−ésimas
coinciden con las filas de M para k 6= i y tal que la fila k−ésima de M 0 es u + λv. Entonces,
det(M 0 ) = det(M ).
Demostración. Basta con recordar que det es multi-lineal. Por tanto,
det(M 0 ) = det(M ) + λ det(M 00 ),
donde M 00 es una matriz idéntica a M en todas las filas distintas de la fila i−ésima. pero en
la fila i−ésima M 00 tiene al elemento v ∈ Rn . Por tanto, M 00 tiene dos filas iguales y, por la
Proposición precedente, det(M 00 ) = 0, con lo que concluimos que det(M 0 ) = det(M ).
Definición 51 (Transpuesta de una matriz). Llamaremos transpuesta de una matriz A y

lo denotaremos mediante At a la matriz obtenida intercambiando filas por columnas en A.
Proposición 2.3.10. Para cada matriz A ∈ Mn (R), se tiene que det(A) = det(At ). Más aún,
sea τ ∈ Sn una permutación de [n] y sean A ∈ Mn (R) una matriz y sea Aτ la matriz obtenida
de A aplicando la permutación τ a las columnas de A. Es decir, Dada A := (ai,j )1≤ij≤n , se
define
Aτ = ar,τ (s) 1≤r,s≤s ∈ Mn (R),

Entonces,
det(Aτ ) = I(τ ) det(A).
Demostración. Para la primera afirmación, baste con notar que la siguiente es una
biyección sobre el grupo simétrico que preserva el ı́ndice:
−1
: Sn −→ Sn
σ 7−→ σ −1 ,
donde σ −1 es la inversa de σ.
Para la segunda apliquemos el argumento a las matrices transpuestas y el Corolario 2.3.5. Más
explı́citamente, observemos que si At es la transpuesta de A y (At )τ es la matriz obtenida desde
la transpuestas de A permutando sus filas conforme a τ , entonces,
(At )τ = (Aτ )t ,
Es decir, transposición de Aτ coincide con permutar filas de la transpuesta de A. Entonces,

tenemos
det(Aτ ) = det((Aτ )t ) = det((At )τ ) = I(τ ) det(At ) = I(τ ) det(A).
Lo que prueba la segunda afirmación.
2.3.2. La Fórmula de Laplace. El objetivo de esta subsección es dar una prueba de-
tallada de la famosa Fórmula de Laplace (también conocida vulgarmente como la fórmula del
desarrollo del determinante por los elementos de una fila o columna). Hemos elegido una de-
mostración muy detallada usando, precisamente, los caminos que prueban, por inducción en n,
que ](Sn ) = n!. Aunque la notación le da un aire complejo, las ideas subyacentes son muy
elementales y toda la dificultad nace del uso de notaciones precisas.
Notación 2.3.11. Sean i, j ∈ [n] y consideremos el conjunto de las permutaciones que trans-
forman i en j, es decir,
Sn (i, j) = {σ ∈ Sn : σ(i) = j}.
Nótese que Sn (n, n) = StabSn (n) es el estabilizador de n por la acción del grupo simétrico Sm
sobre el conjunto [n] := {1, . . . , n}. Estudiaremos estos conjuntos que definen una partición de
Sn como unión disjunta dada del modo siguiente para cada i ∈ [n]:
n
[
Sn = Sn (i, j).
j=1
Consideremos ahora i ∈ [n] y consideremos la siguiente permutación τi,n ∈ Sn :

τi,n := (n n − 1 · · · i + 1 i).
Es decir, la aplicación biyectiva
τi,n : [n] −→ [n],
dada mediante: 
r, si 1 ≤ r ≤ i − 1
τi,n (r) := n, si r = i
r − 1, si i + 1 ≤ r ≤ n

Observamos que τi,n ∈ Sn (i, n) admite la siguiente descomposición como producto de trans-
posiciones:
τi,n = (n n − 1) ◦ (n − 1 n − 2) ◦ · · · ◦ (i + 2 i + 1) ◦ (i + 1 i).
En particular, el ı́ndice de τi,n satisface
n−i n+i
I(τi,n ) = (−1) = (−1) ,
porque n − i y n + i son equivalentes módulo 2Z. En cuanto a su inversa, observamos que

 r, si 1 ≤ r ≤ i − 1
−1
τi,n (r) := r + 1, si i ≤ r ≤ n − 1
i, si r = n

Lema 2.3.12. Con las anteriores notaciones, la siguiente es una biyección para cualesquiera
ı́ndices i, j ∈ [n]:
φi,j : Sn (n, n) −→ Sn (i, j)
−1
σ 7−→ τj,n ◦ σ ◦ τi,n .
Más aún, para cada σ ∈ Sn (n, n) el ı́ndice de φi,j (σ) satisface:
2n−(i+j)
I(φi,j (σ)) = (−1) I(σ) = (−1)i+j I(σ).
Demostración. La igualdad entre los ı́ndices se sigue, obviamente, del valor de los ı́ndices
de τi,n y τj,n . Es decir, por ser morfismo de grupos, el ı́ndice satisface:
−1 2n−(i+j)
I(φi,j (σ)) = I(τj,n )I(σ)I(τi,n ) = I(τj,n )I(σ)I(τi,n ) = (−1) I(σ).
En cuanto al hecho de ser una biyección, baste con observar, en primer lugar, que para todo
σ ∈ Sn (n, n), φi,j (σ) ∈ Sn (i, j). Pero esto es claro, dado que:
−1 −1 −1
φi,j (σ)(i) = τj,n (σ(τi,n (i))) = τj,n (σ(n)) = τj,n (n) = j.
De otro lado, podemos definir la aplicación:

ψi,j : Sn (i, j) −→ Sn (n, n)
−1
σ 7−→ τj,n ◦ σ ◦ τi,n .
Es fácil verificar que
φi,j ◦ ψi,j = IdS , ψi,j ◦ φi,j = IdS .
n (i,j) n (n,n)
Por tanto, φi,j es una aplicación que posee inversa y la inversa satisface φ−1
i,j = ψi,j y es, por
tanto, biyectiva.
Lema 2.3.13. Con las anteriores notaciones, la siguiente aplicación es una biyección:
Φ : Sn (n, n) −→ Sn−1
σ 7−→ σ |[n−1] ,
donde σ |[n−1] es la restricción de σ a [n − 1] = {1, 2, . . . , n − 1}. Además, Φ preserva los
ı́ndices, esto es, I(Φ(σ)) = I(σ), ∀σ ∈ Sn .
Demostración. Es obvio, pero incluimos el detalle de la prueba para ayudar al lector en
su convicción. Lo primero que hay que observar es que Φ está bien definida. Es decir, que la
restricción σ |[n−1] es un elemento de Sn−1 . Esto es obvio porque σ ∈ Sn (n, n). Por tanto,
para todo r ∈ [n − 1], σ(r) 6= n y, por tanto, σ(r) ∈ [n − 1], luego se tiene una aplicación
inyectiva:
σ |[n−1] : [n − 1] −→ [n − 1].
Por ser inyectiva y ser [n − 1] de cardinal finito, concluimos que σ |[n−1] es biyectiva y σ |[n−1] ∈
Sn−1 . Que la aplicación Φ es inyectiva se sigue obviamente de su definción. Es decir, dadas
σ, σ 0 ∈ Sn (n, n), si Φ(σ) = Φ(σ 0 ), entonces,
σ(r) = σ |[n−1] (r) = σ 0 |[n−1] (r) = σ 0 (r), ∀r ∈ [n − 1].
Como, además, σ(n) = n y σ 0 (n) = n (porque ambas están en Sn (n, n)), concluimos que σ = σ 0
y que Φ es inyectiva. No es difı́cil verificar que la siguiente aplicación es la inversa de Φ:
Φ−1 : Sn−1 −→ Sn (n, n)
σ 7−→ σ
e,
donde
σ(r), si 1 ≤ r ≤ n − 1,
σ
e(r) =
n, si r = n.
Para la relación entre los ı́ndices, obsérvese que si τ ∈ Sn−1 es una transposición, entonces
τe ∈ Sn es también una transposición. Además, si σ ∈ Sn−1 admite una descomposición como
composición de transposiciones:
σ = τ1 ◦ τ2 ◦ · · · ◦ τr ,
r
tenemos que I(σ) = (−1) , mientras que
e = τe1 ◦ τe2 ◦ · · · ◦ τer ,
σ
es también una descomposición de σ e como composición de transposiciones, por lo que I(e
σ) =
r
(−1) , y se tiene la afirmación buscada.
Lema 2.3.14. Sea R un anillo y sea A ∈ Mn (R) una matriz de la forma siguiente:
 
a1,1 a1,2 ··· a1,n−1 a1,n
 a2,1
 a2,2 ··· a2,n−1 a2,n 
 .. ..  .
A :=  . . 
 
an−1,1 an−1,2 · · · an−1,n−1 an−1,n 
0 0 ··· 0 an,n
Entonces,
det(A) = an,n det(An,n ),
donde An,n ∈ Mn−1 (R) es la submatriz de A obtenida suprimiendo la fila y la columna

n−ésimas, esto es:
 
a1,1 a1,2 ··· a1,n−1
 a2,1 a2,2 ··· a2,n−1 
An,n :=  .  ∈ Mn−1 (R).
 
.
 .. .. 
an−1,1 an−1,2 · · · an−1,n−1
Demostración. Consideremos la definición del determinante introducida al comienzo de
la sección y tenemos
X Yn
det(A) := I(σ) ai,σ(i) .
σ∈Sn i=1
Usamos la descomposición de Sn siguiente, válida para cada ı́ndice i:
n
[
Sn = Sn (n, j).
j=1
Ésto nos da una descripción del sumatorio anteror mediante:

 
Xn X n
Y
det(A) =  I(σ) ak,σ(k)  .
j=1 σ∈Sn (n,j) k=1
Ahora bien, por la forma de nuestra matriz, an,σ(n) = 0 para cualquier σ ∈ Sn (n, j) cuando
j 6= n. Por tanto, la última igualdad tiene la forma:
X n−1
Y
det(A) = an,n I(σ) ak,σ(k) .
σ∈Sn (n,n) k=1
Ahora procedemos como en el Lema 2.3.13 y esta última identidad puede escribirse también
mediante:  
X n−1
Y
det(A) = an,n  I(σ) a .
k,σ (k)
σ∈Sn (n,n) k=1 [n−1]
Como la restricción a [n − 1] de las permutaciones en Sn (n, n) preserva el ı́ndice, concluimos

inmediatamente
 
X n−1
Y
det(A) = an,n  I(σ 0 ) ak,σ0 (k)  = an,n det(An,n ).
σ 0 ∈Sn−1 k=1
Lema 2.3.15. Sea R un anillo y sea A ∈ Mn (R) una matriz de la forma siguiente:
 
a1,1 ··· a1,i−1 a1,i a1,i+1 ··· a1,n
 a2,1
 · · · a2,i−1 a2,i a2,i+1 ··· a2,n 
A :=  ... ..  .

 .  
an−1,1 · · · an−1,i−1 an−1,i an−1,i+1 · · · an−1,n 
0 ··· 0 an,i 0 ··· 0
Entonces,
det(A) = (−1)n+i an,i det(An,i ),
donde An,i ∈ Mn−1 (R) es la submatriz de A obtenida suprimiendo la fila n−ésima y la columna
i−ésima, esto es:
 
a1,1 ··· a1,i−1 a1,i+1 ··· a1,n
 a2,1 ··· a2,i−1 a2,i+1 ··· a2,n 
An,i :=  . ∈ Mn−1 (R).
 
.
 .. ..

an−1,1 ··· an−1,i−1 an−1,i+1 ··· an−1,n
−1
Demostración. Para comenzar, consideremos la permutación τ := τi,n definida más ar-
riba. Esto es, la permutación τ : [n] −→ [n] dada mediante la siguiente formulación:

 s, si 1 ≤ s ≤ i − 1
τ (s) := s + 1, si i ≤ s ≤ n − 1
i, si s = n

−1
Sabemos que I(τ ) = I(τn,i ) = I(τn,i ) = (−1)n+i . Consideremos la matriz Aτ obtenida de
nuestra matriz A permutando las columnas de A mediante la permutación τ . Es un mero
ejercicio de comprobación el verificar que:
 
a1,1 ··· a1,i−1 a1,i+1 ··· a1,n a1,i
 a2,1
 ··· a2,i−1 a2,i+1 ··· a2,n a2,i 

τ
 .. ..  .
A := ai,τ (j) 1≤i,j≤n =  . . 
 
an−1,1 · · · an−1,i−1 an−1,i+1 · · · an−1,n an−1,i 
0 ··· 0 0 ··· 0 an,i
Seguidamente, observamos (es una mera verificación), que se tiene la siguiente igualdad:
(Aτ )n,n = An,i ,
donde (Aτ )n,n es la submatriz de Aτ obtenida suprimiendo la fila n y la columna n. Aplicando
el lema precedente tendremos que
det(Aτ ) = an,i det((Aτ )n,n ) = an,i det(An,i ).
Finalmente, aplicando la Proposición 2.3.10, obtenemos que
det(A) = I(τ ) det(Aτ ) = I(τ )an,i det(An,i ) = (−1)n+i an,i det(An,i ),
como se pretende.
Proposición 2.3.16 (Fórmula de Laplace para la última fila). Sea A := (ai,j )1≤i,j≤n ∈
Mn (R) una matriz con n filas y n columnas y coordenadas en el anillo R. Entonces, se tiene
n
X
det(A) := (−1)n+i an,i det(An,i ),
i=1
donde An,i ∈ Mn−1 (R) es la submatriz de A obtenida eliminando la fila n−ésima y la columna
i−ésima.
Demostración. Consideremos, para cada i, 1 ≤ i ≤ n, las siguientes matrices obtenidas
a partir de la matriz A:
 
a1,1 ··· a1,i−1 a1,i a1,i+1 ··· a1,n
 a2,1
 · · · a2,i−1 a2,i a2,i+1 ··· a2,n 

 .. ..
Ai :=  . .

 . 
an−1,1 · · · an−1,i−1 an−1,i an−1,i+1 ··· an−1,n 
0 ··· 0 an,i 0 ··· 0
Observamos que si en cada matriz Ai suprimimos su n−ésima fila y su i−ésima columna re-
obtenemos la matriz An,i . Esto es,
(Ai )n,i = An,i .
Finalmente, recordamos que det es una función multi-lineal por lo que tendremos que
X n
det(A) = det(Ai ).
i=1
Aplicando los Lemas predentes, concluimos que

det(Ai ) := (−1)n+i an,i det (Ai )n,i = (−1)n+i an,i det (An,i ) .
Y tenemos la prueba definitiva:
n
X
det(A) = (−1)n+i an,i det (An,i ) .
i=1
Teorema 2.3.17 (Fórmula de Laplace). Sea A = (ai,j )1≤i,j≤n ∈ Mn (R) una matriz cuadrada
con coordenadas en el anillo R. Entonces, para cada i, 1 ≤ i ≤ n, tenemos:
n
X i+j
det(A) := ai,j (−1) det(Ai,j ),
j=1
donde Ai,j ∈ Mn−1 (R) es la matriz obtenida suprimiendo las filas i y j de la matriz A.
Demostración. Comencemos considerando la permutación τ = τi,n ∈ Sn introducida
anteriormente. Es decir, τ : [n] −→ [n] definida mediante:

 r, si 1 ≤ r ≤ i − 1
τ (r) = τi,n (r) := n, si r = i
r − 1, si i + 1 ≤ r ≤ n

Recordemos que el ı́ndice de esta permutación verifica I(τ ) = I(τi,n ) = (−1)n+i . Consideremos
nuestra matriz A := (ai,j )1≤i,j≤n ∈ Mn (R) y consideremos la matriz Aτ obtenida a partir de
la matriz A permutando sus filas conforme a la permutación τ , es decir,
Aτ := (aτ (i),j )1≤i,j≤n .
Observamos la siguiente identidad:
 
a1,1 a1,2 ··· a1,j ··· a1,n
 .. .. 
 . . 
 
ai−1,1
 ai−1,2 ··· ai−1,j ··· ai−1,n 

Aτ := ai+1,1 ai+1,2 ··· ai+1,j ··· ai+1,n 
.
 . ..
 ..

 . 

 an,1 an,2 ··· an,j ··· an,n 
ai,1 ai,2 ··· ai,j ··· ai,n
Ahora, es un ejercicio de simple comprobación el verificar que el resultado de suprimir la fila
n−ésima y la columna j−ésima de la matriz Aτ es una matriz en Mn−1 (R) coincidente con la
submatriz Ai,j de la matriz A original, esto es,
(Aτ )n,j = Ai,j .
Aplicando la Proposición 2.3.16 a la matriz Aτ obtenemos:
X n Xn
det(Aτ ) = (−1)n+j aτ (n),j det (Aτ )n,j = (−1)n+j ai,j det (Ai,j ) .
j=1 j=1
Finalmente, como el determinante es una función multi-lineal alternada concluimos

 
n
X
det(A) = I(τ ) det(Aτ ) = (−1)n+i  (−1)n+j ai,j det (Ai,j ) .
j=1
Luego
n
X
det(A) = (−1)2n+i+j ai,j det (Ai,j ) ,
j=1
lo que prueba el enunciado.
Observación 2.3.18. Un resultado idéntico permitirı́a hacer la descripción del determinante a

partir de una columna:
Xn
i+j
det(A) := ai,j (−1) det(Ai,j ),
i=1
simplemente jugando con la matriz transpuesta de una matriz dada. Omitimos esta discusión
por no aportar nada adicional interesante.
Observación 2.3.19 (La Fórmula de Laplace no es un buen método para el Cálculo del
Determinante de una matriz). Aunque parezca una fórmula que potencialmente pudiera
servir para el cálculo de un determinante de una matriz n × n, la regla de Laplace no es
un buen algoritmo sino una buena presentación teórica del determinante de una matriz que
sirve para disponer de resultados teóricos relevantes sobre el comportamiento del determinante.
La principal dificultad es que, aún desarrollando el determinante por una fila o columna, el
número de operaciones aritméticas requeridas para calcularlo sigue el mismo patrón que el
uso de la definición directa: hay que hacer n! = ](Sn ) multiplicaciones. Nótese que tener
que hacer n! multiplicaciones para el cálculo de un determinante hace virtualmente imposible
calcular el determinante de una matriz de tamaño 100 × 100 ni por el ordenador ordenador más
potentes y rápido del mundo (se necesitarı́an hacer unas 100100 = 10200 operaciones, lo que es
completamente intratable con la informática imaginable (son más operaciones que el número
estimado de partı́culas del universo5). Tomando como ejemplo, la clasificación Top500 de 2018,
uno de los ordenadores más rápido del mundo podrı́a ser aún el ordenador Summit, IBM Power
System AC922 ), capaz de realizar unas 201 · 1015 operaciones (bit) por segundo. El cálculo
del determinante de una matriz 100 × 100 por la Definición o por el método que se sigue de la
Fórmula de Laplace tardarı́a más de 10180 segundos en terminar sus cálculos, lo que equivale a
más de 10160 millones de años.
En el caso de cuerpos, variantes del método original de C.F. Gauss (sean numéricas o exactas)
muestran que se puede triangular una matriz sin cambiar el valor del determinante. Ni este
método de Gauss, ni sus variaciones inmediatas, funcionan de modo adecuado cuando se trata de
cualquier anillo como se muestra en los Problemas 234 y 235. Por esa razón se han desarrollado
algoritmos eficientes para el cálculo con matrices cuyas coordenadas están en un anillo, que
son, ademś, los más eficientes para el cálculo cuando las coordenadas están en un cuerpo (y
sin hacer ningún tipo de pivoteo). Nótese que el famoso polinomio caracterı́stico de una matriz
M ∈ Mn (K) con coordenadas en un cuerpo es un ejemplo de determinante de una matriz cuyas
coordenadas no viven en un cuerpo sino en un anillo (ver la Subsección 2.3.3 siguiente para
las propiedades y definición del polinomio caracterı́stico). Por eso se han desarrollado técnicas
mucho más eficientes para el cálculo exacto del determinante de una matriz con coordenadas
en un anillo. En este curso presentaremos el método de Csanky-Leverrier-Fadeev-Souraiu en
la Subsección 5.4.3.1. Otros algoritmos clásicos de fácil comprensión son los algoritmos como
el propuesto por S.J. Berkowicz en [Berk, 1984] (el caso de los anillos Z y Z[X1 , . . . , Xn ]
está estudiado con precisión en [KrPa, 1996], por ejemplo). Desde entonces, algoritmos muy
eficientes han sido desarrollados. Resulta destacable el algortimo de V. Neiger y C. Pernet en
[NP, 21] que muestran un algoritmo muy eficiente para el cálculo del polinomio caracterı́stico
de una matriz, aunque su exposición resultarı́a excesiva en un curso como este. Una buena
fuente a actividad, donde se exponen los mejores algoritmos en términos de complejidad y
eficacia es el colectivo LinAlg (https://linalg.org/). No entraremos con detalle en estos
aspectos porque no corresponde a un curso como éste, no especialmente orientado al Álgebra
Lineal.
Observación 2.3.20 (Reglas mnemotécnicas revisitadas: Regla de Sarrus). Es inmedi-

ato que la regla de Laplace implica, sobre matruices 2 × 2 la regla usual del determinante de
tales matrices. Desarrollando por la primera fila:

a1,1 a1,2
= (−1)1+1 a1,1 det a2,2 + (−1)1+2 a1,2 det a2,1 = a1,1 a2,2 − a1,2 a2,1 .

det
a2,1 a2,2
La regla de Sarrus es una regla mnemotécnica debida al matemático francés Pierre Frédéric
Sarrus (1826–1856). Con esta regla son adoctrinados y entrenados los alumnos de Secundaria y
Bachillerato de todo el mundo para el cálculo de los determinantes de matrices 3×3, haciéndola
popular. Es fácil verificar que esa Regla es correcta a partir de la Fórmula de Laplace. Ası́a,
5No es una medida totalmente aceptable ni definitiva, pero podemos destacar una vieja estimación del
famoso divulgador I. Asimov quien estimó (en base a supuestos más que discutibles) que el número de nucleones
y electrones del universo es de unos 2, 2 · 1079 , cantidad que habrı́a que multiplicar por 2 si contamos la materia
oscura. Pero son estimaciones de juego intelectual sin mucho valor
dada una matriz genérica 3 × 3:

 
a1,1 a1,2 a1,3
A := a2,1 a2,2 a2,3  ,
a3,1 a3,2 a3,3
aplicando Laplace se tendrá:
det(A) = (−1)1+1 a1,1 det(A1,1 ) + (−1)1+2 a1,2 det (A1,2 ) + (−1)1+3 a1,3 det (A1,3 ) .
Luego:
det(A) = a1,1 (a2,2 a3,3 − a2,3 a3,2 ) − a1,2 (a2,1 a3,3 − a2,3 a3,1 ) + a1,3 (a2,1 a3,2 − a2,2 a3,1 ) .
Reordenando estos 6 términos (i.e. ](S3 ) = 6), agrupando los de coeficiente positivo por un
lado y los de coeficiente negativo por el otro, reobtenemos la mnemotécnica Regla de Sarrus.
Definición 52 (Matrix Adjunta de una dada). Sea A = (ai,j )1≤i,j≤n ∈ Mn (R). Se define
la matriz adjunta de A como la matriz
t
Adj(A) := ((ci,j )1≤i,j≤n ) ∈ Mn (R),
donde
i+j
ci,j = (−1) det(Ai,j ).
Teorema 2.3.21 (Fórmula de Laplace Generalizada). Con las anteriores notaciones, para
cada matriz A = (ai,j )1≤i,j≤n ∈ Mn (R), se tiene:
A · Adj(A) = Adj(A) · A = det(A)Idn ∈ Mn (R),
donde Idn es la matriz identidad n × n.
Demostración. Para probarlo, bastará con que escribamos las dos matrices:
 
a1,1 a1,2 a1,3 · · · a1,n
 a2,1 a2,2 a2,3 · · · a2,n 
 
A :=  a3,1 a3,2 a3,3 · · · a3,n  .
 
 .. .. .. .
.. 
 . . . 
an,1 an,2 an,3 ··· an,n
Por su parte, después de transponer, tenemos
(−1)1+1 det(A1,1 ) (−1)2+1 det(A2,1 ) (−1)n+1 det(An,1 )
 
···
 (−1)1+2 det(A1,2 ) (−1)2+2 det(A2,2 ) ··· (−1)n+2 det(An,2 ) 
1+3
det(A1,3 ) (−1)2+3 det(A2,3 ) (−1)n+3 det(An,3 ) 
 
Adj(A) :=  (−1)
 ··· .
 .. .. .. 
 . . . 
(−1)1+n det(A1,n ) (−1)2+n det(A2,n ) · · · (−1)n+n det(An,n )
Al mutiplicar tendremos AAdj(A) = (di,j )1≤i,j≤n ∈ Mn (R), donde
n
X
di,j = ai,k (−1)k+j det(Aj,k ).
k=1
Ahora, si i = j, tenemos que
n
X
di,i = ai,k (−1)k+j det(Ai,k ) = det(A),
k=1
conforme a la Fórmula de Laplace. En el caso i 6= j, tendremos que
n
X
di,j = ai,k (−1)k+j det(Aj,k ),
k=1
está relacionado con el determinante de una matriz M obtenida del modo siguiente:
• La fila j−ésima de M es la fila i−ésima de A: (ai,1 , ai,2 , . . . , ai,n )
• Las restantes filas de M son las filas de A.
Obviamente, las matrices Mj,k = Aj,k y, usando la Fórmula de Laplace, obtenemos que
n
X
di,j = ai,k (−1)k+j det(Aj,k ) = det(M ) = 0,
k=1
porque M posee dos filas iguales: la fila i−ésima y la fila j−ésima. Por tanto, se tiene el
resultado enunciado.
Corolario 2.3.22. Si A ∈ Mn (R) es una matriz tal que det(A) ∈ R× es una unidad de R,
entonces, A es una matriz inversible y, además,
A−1 = det(A)−1 Adj(A) ∈ Mn (R).
El siguiente resultado se expone con una prueba bruta. Una alternativa correcta pasarı́a por
probar la Fórmula de Cauchy-Binet, pero igualmente este resultado resulta incómodo en la
mayorı́a de sus pruebas. Ası́ que he optado por poner la prueba más directa, sin apoyos, a la
espera de disponer de una prueba elegante e igualmente elemental, válida sobre cualquier anillo.
Teorema 2.3.23 (Determinante del producto de matrices). Sean A, B ∈ Mn (R) dos
matrices, entonces
det(AB) = det(A) det(B).
Demostración. Supongamos que las matrices A y B vienen dadas por la igualdad si-
guiente:
A := (ai,j )1≤i,j≤n , B := (bi,j )1≤i,j≤n , AB := (ci,j )1≤i,j≤n ,
donde
n
X
ci,j := ai,k bk,j .
k=1
Con estas notaciones, tendremos:
n n n
!
X Y X Y X
det(AB) = I(σ) ci,σ(i) = I(σ) ai,ki bki ,σ(i) .
σ∈Sn i=1 σ∈Sn i=1 ki =1
Aplicando la distributiva, considerando el conjunto de ı́ndices [n]n := {1, . . . , n}n , podemos

reescribir esta expresión como:
 
X X Yn

det(AB) =  I(σ) ai,ki bki ,σ(i)  .
σ∈Sn (k1 ,...,kn )∈[n]n i=1
Lo que podemos reescribir también mediante:

n
!
X X Y
(2.3.1) det(AB) = I(σ) ai,ki bki ,σ(i) .
(k1 ,...,kn )∈[n]n σ∈Sn i=1
Para cada ı́ndice (k := k1 , . . . , kn ) ∈ [n]n , denotemos también por k a la aplicación

k: [n] = {1, . . . , n} −→ [n]
i 7−→ ki
Finalmente, denotemos por Mk a la matriz dada por la igualdad siguiente:
Mk := (ai,ki bki ,j )1≤i,j≤n ∈ Mn (R).
La ecuación (2.3.1) puede reescribirse mediante:
X
(2.3.2) det(AB) = det(Mk ).
k∈[n]n
Afirmación. Con estas notaciones, sea k := (k1 , . . . , kn ) ∈ [n]n . Se verifican las propiedades
siguientes.
i) Si existen i, r ∈ [n] tales que i 6= r y ki = kr , entonces det(Mk ) = 0.
ii) En caso contrario, (si ki 6= kr para cada i, r ∈ [n] con i 6= r) la aplicación k ∈ Sn es
una permutación.
Demostración de la Afirmación. La afirmación ii) es evidente: si k : [n] −→ [n] es inyectiva,

entonces es biyectiva y k ∈ Sn . Para la primera observación, veamos, por razones didácticas
de modo explı́cito, quién es la matriz Mk :
 
a1,k1 bk1 ,1 a1,k1 bk1 ,2 · · · a1,k1 bk1 ,n
 a2,k2 bk2 ,1 a2,k2 bk2 ,2 · · · a2,k2 bk2 ,n 
Mk =  .
 
.. .. .. ..
 . . . . 
an,kn bkn ,1 an,kn bkn ,2 ··· an,kn bkn ,n
Si fi denota la fila i−ésima de la matriz Mk obseramos que esa fila tiene la forma siguiente:
fi := (ai,ki bki ,1 , · · · , ai,ki bki ,n ) = ai,ki (bki ,1 , · · · , bki ,n ) ∈ Rn .
Denotemos por bi := (bki ,1 , · · · , bki ,n ) ∈ Rn para cada i ∈ [n].
Supogamos i < r, ambos en [n] y consideremos la matriz M gk (i, r) ∈ Mn (R) que tiene por fila
j−ésima a la fila jésima de Mk siempre que j 6= i, j 6= r. Mientras que, en las filas i−ésima
y r−ésima de M gk (i, r) ∈ Mn (R) hemos reemplazado (respectivamente) las filas i−ésima y
r−ésima de Mk respectivamente por bi y br . En otros términos, tomemos la descripción de
gk (i, r) ∈ Mn (R) por filas:
M
 
g1
 .. 
Mk (i, r) =  .  ,
g
gn
donde para cada j ∈ [n], se tiene

 fj si j 6= i, r
gj := bi si j = i,
br si j = r.

Obsérvese que la matriz Mk se obtiene de M gk (i, r) mediante dos pasos de la operación “multi-
plicar una fila por una columna”:
• Primero, multiplicando la fila i−ésima de M gk (i, r) por ai,k ,
i
• para multiplicar después la fila r−ésima de la matriz resultante por ar,kr .
Aplicando dos veces el Corolario 2.3.4, concluimos que

det(Mk ) = ai,ki ar,kr det Mgk (i, r) .
Ahora bien, si i < r y si ki = kr se tiene que bi = br y la matriz Mgk (i, r) tendrı́a dos filas

iguales. Aplicando la Proposición 2.3.8 concluiremos que det M
gk (i, r) = 0 y, por tanto, si k
no es inyectiva, concluimos det(Mk ) = 0 como se enuncia en la afirmación.
Para cada permutación ρ ∈ Sn denotemos por Mρ a la matriz

Mρ = M(ρ(1),ρ(2),...,ρ(n)) .
Ası́, mediante la Afirmación precedente, la Igualdad (2.3.2) se convierte en
X
(2.3.3) det(AB) = det(Mρ ).
ρ∈Sn
Más aún, el determinante de las matrices Mρ viene dado por la siguiente identidad:
X n
Y
det(Mρ ) = I(σ) ai,ρ(i) bρ(i),σ(i) .
σ∈Sn i=1
Qn
Sacando el factor común i=1 ai,ρ(i) de todos los sumandos, este determinante también concide
con la siguiente cantidad:
n
! n
!
Y X Y
(2.3.4) det(Mρ ) = ai,ρ(i) I(σ) bρ(i),σ(i) .
i=1 σ∈Sn i=1
Ahora, sea Bρ la matriz obtenida permutando las filas de B conforme a una permutación
ρ ∈ Sn (como en el Corolario 2.3.5). Como el determinante es una forma multi-lineal alternada
tendremos: !
X Yn
det(Bρ ) = I(σ) bρ(i),σ(i) = I(ρ) det(B).
σ∈Sn i=1
En consecuencia, la Igualdad (2.3.4) se transforma en
n
! n
!
Y Y
(2.3.5) det(Mρ ) = ai,ρ(i) det(Bρ ) = I(ρ) det(B) ai,ρ(i) .
i=1 i=1
Por tanto, la Identidad (2.3.3) se transforma en la siguiente
(2.3.6)  
X n
Y X n
Y
det(AB) = I(ρ) det(B) ai,ρ(i) = det(B)  I(ρ) ai,ρ(i)  = det(B) det(A),
ρ∈Sn i=1 ρ∈Sr i=1
lo que prueba finalmente el resutado buscado porque R es un anillo conmutativo.

Corolario 2.3.24. Una matriz A ∈ Mn (R) es inversible si y solamente si det(A) ∈ R× es
una unidad de R. En este caso, det(A−1 ) = det(A)−1 ∈ R× y se ha de tener:
A−1 := det(A)−1 Adj(A).
Por último, si A es una matriz inversible, el determinante de la matriz adjunta verifica
det (Adj (A)) = det(A)n−1 .
Demostración. Ya hemos probado una de las implicaciones en el Corolario 2.3.22 ante-
rior. En cuanto a la otra, si A es inversible, entonces, posee inversa y se verifica:
AA−1 = Idn .
Por tanto, det(AA−1 ) = 1 y se satisface:
det(A) det(A−1 ) = det(AA−1 ) = 1,
con lo que det(A) ∈ R× . En cuanto a la matriz adjunta:
det(A) det(Adj(A)) = det(AAdj(A)) = det(A)n det(Idn ) = det(A)n .
Como det(A) es inversible en R, esta igualdad implica det(Adj(A)) = det(A)n−1 y habremos
terminado.
Corolario 2.3.25 (El determinante es un morfismo de grupos). Sea R un anillo y sea
(R× , ·) el grupo multiplicativo de sus unidades. Definamos el conjunto
GL(n, R) := {A ∈ Mn (R) : det(A) ∈ R× },
el conjunto de las matrices inversibles con coordenadas en R. Se tiene:
i) (GL(n, R), ·), con la operación “producto de matrices”, es un grupo, no necesariamente
abeliano.
ii) La siguiente correspondencia es un morfismo de grupos:
det : (GL(n, R), ·) −→ (R× , ·)
A 7−→ det(A).
iii) El núcleo ker(det) del morfismo det anterior es un subgrupo normal de GL(n, R).
iv) En los casos R = R o R = C los subgrupos de matrices ortogonales y unitarias son
subgrupos del subgrupo normal ker(det) de matrices unimodulares sobre R o C 6.
Demostración. Mero ejercicio de comprobación.
6Algunos autores prefieren llamar matrices unimodulares sobre un anillo R simplemente a las matrices
inversibles (i.e. a las matrices en GL(n, R)). Personalmente, prefiero distinguir los dos nombres, siendo unas las
matrices inversibles (i.e. las de GL(n, R)) y otras las unimodulares (i.e. las de U nin (R) = det−1 ({1}) = ker(det))
que forman un subgrupo normal de GL(n, R). De todos modos, evitaré abusar de esta terminologı́a en cuanto
sigue.
2.3.3. Polinomios con coeficiente matricial y matrices con coordenadas polino-

miales. Teorema de Hamilton-Cayley. La prueba que sigue es un tanto inhabitual. Se
usa la Fórmula de Laplace Generalizada como único ingrediente técnico esencial y se observa la
intervención de matrices de polinomios (Mn (R[X])) actuando sobre Mn (R), gracias a coincidir
con el anillo de polinomios Mn (R)[X] con coeficientes en el anillo Mn (R) (cf. Ejemplo 1.4.4).
El resto es esencialmente lo esperable.
Definición 53 (Polinomio Caracterı́stico). Sea A ∈ Mn (R) una matriz con coordenadas
en un anillo R. Llamaremos polinomio caracterı́stico de A al polinomio dado mediante :
χ (X) := det(XId − A) ∈ R[X].
A n
Lema 2.3.26. Si A ∈ Mn (R) es un matriz cuadrada con n filas y n columnas y coeficientes en

R, entonces χA (X) es un polinomio mónico de grado n y coeficientes en R, es decir,
n−1
X
χ (X) := X n + ai X i ∈ R[X].
A
i=0
Demostración. Por inducción en n. Es claro que se verifica en el caso n = 1. Para n ≥ 2,

tomemos la Fórmula de Laplace. y escribamos
 
X − a1,1 −a1,2 ··· −a1,n
 −a2,1 X − a2,2 · · · −a2,n 
AX := XIdn − A =  .
 
.. .. ..
 . . . 
−an,1 −an,2 ··· X − an,n
Por la Fórmula de Laplace, queda
n
X
(2.3.7) χ (X) = det(XId − a) = (X − a1,1 ) det((AX )1,1 ) +
A n
(−1)1+j a1,j det((AX )1,j ).
j=2
Analicemos las distintas matrices (AX )1,j . Tenemos dos casos:

• Para el caso j = 1, se tiene (AX )1,1 = XIdn−1 − A1,1 con lo que, por hipótesis
inductiva, det((AX )1,1 ) ∈ R[X] es un polinomio mónico de grado n − 1.
• Para j ≥ 2, la matriz (AX )1,j es una matriz que tiene una primera columna en la
que sólo aparecen elementos de R, la fila j también está formada por elementos del
anillo R y, descartando fila j y columna 1 es una matriz en Mn−2 (R[X]) de la forma
XIdn−2 B. Dicho de otra manera:
(AX )1,j = (Ar,s )1≤r,s≤n−1 .

donde Ar,s ∈ R o Ar,s es un polinomio de grado a lo sumo 1 en X. Por tanto,
X n−1
Y
det ((AX )1,j ) I(σ) Ar,σ(r) .
σ∈Sn i=1
En particular, el grado en X verifica:

n−1
Y
degX (det ((AX )1,j )) ≤ max{degX ( Ar,σ(r) ) : σ ∈ Sn−1 }.
i=1
Luego
n−1
X
degX (det ((AX )1,j )) ≤ max{ degX (Ar,σ(r) ) : σ ∈ Sn−1 } ≤ n − 1.
r=1
Por tanto, concluimos que

degX ((X − a1,1 ) det((AX )1,1 )) = n,
y será un producto de dos polinomios mónicos de grados respectivos 1 y n − 1 por lo que

(X − a1,1 ) det((AX )1,1 ) ∈ R[X] es un polinomio mónico de grado n. Por su parte, el resto de
los términos de la Identidad (2.3.7) verifican:
 
Xn
degX  (−1)1+j a1,j det((AX )1,j ) ≤ max{degX (a1,j det((AX )1,j )) : 2 ≤ j ≤ n} ≤ n − 1.
j=2
Finalmente, χA (X) es la suma de un polinomio mónico de grado n con otro polinomio de grado
a lo sumo n − 1 y, en consecuencia, χA (X) es un polinomio mónico de grado n.
Comencemos con una sencilla operación del anillo de polinomios R[X] sobre el R−módulo
Mn (R) de las matrices cuadradas con coordenadas en R.
Proposición 2.3.27 (La operación de R[X] sobre Mn (R)). Sea R un anillo y R[X] el anillo
de polinomios en una variable con coeficientes en R. Entonces, podemos definir una aplicación
externa del grupo aditivo (R[X], +) sobre Mn (R) mediante:
·R[X] : R[X] × Mn (R) −→ MP
n (R)
m
(p(X), M ) 7−→ p(M ) := i=0 ai M i ,
Pm
siendo p(X) := i=0 ai X i ∈ R[X].
Esta operación respeta la operación suma del grupo (R[X], +) sobre Mn (R):
∀p, q ∈ R[X], ∀M ∈ Mn (R), (p + q)(M ) = p(M ) + q(M ).

Además, esta operación tiene un buen comportamiento con respecto al producto de polinomios.
Es decir, dados p, q ∈ R[X], dado h ∈ R[X] el producto de ambos polinomios (i.e. h = p · q) y
dada cualquier matriz M ∈ Mn (R), se tiene:
h(M ) = p(M )q(M ) = q(M )p(M ).
Sin embargo, no induce una estructura de R[X]−módulo sobre Mn (R).
Demostración. Es un ejercicio de mera comprobación.
Vamos a extender esta operación externa a un anillo no conmutativo con unidad, formado
por las matrices con coeficientes en Mn (R). Recordemos que (Mn (R0 ), +, ·) es un anillo no
conmutativo con unidad para cualquier anillo R0 . Si R es un anillo, y R0 = R[X] es el anillo
de polinomios en una variable con coeficientes en R, entonces (Mn (R[X]), +, ·) también es un
anillo, en general no conmutativo, con unidad. Además, como Mn (R0 ) es un R0 −módulo libre,
también podemos concluir que Mn (R[X]) es un R[X]−módulo libre de rango n2 .
Además, como R ⊆ R[X], tenemos un subanillo Mn (R) ⊆ Mn (R[X]). Por tanto, dado p(X) ∈
R[X] y M (X) ∈ Mn (R[X]) tiene sentido considerar las matrices
p(X)M (X) ∈ Mn (R[X]).
Para ser más precisos, si M := (ai,j (X))1≤i,j≤n , estas matrices producto son, en realidad, el
producto de matrices
  
p(X) 0 ··· 0 a1,1 (X) a1,2 (X) . . . a1,n (X)
 0 p(X) · · · 0   a2,1 (X) a2,2 (X) · · · a2,n (X) 
 
p(X)M (X) =  . .

. . . . .
 .. .. ..   .. .. ..
 

0 0 ··· p(X) an,1 (X) an,2 (X) · · · an,n (X)
Podemos escribir:  
p(X) 0 ··· 0
 0 p(X) ··· 0 
(p(X)Idn ) =  . ,
 
.. ..
 .. . . 
0 0 ··· p(X)
y, además, este tipo de matrices diagonales verifica:
p(X)M (X) = (p(X)Idn )M (X) = M (X)(p(X)Idn ).
Incluso podemos considerar el conjunto Mn (R)[X] como el conjunto de la forma:

m
X
Mn (R)[X] := {N ∈ Mn (R[X]) : ∃m ∈ N, ∃B0 , . . . , Bm ∈ Mn (R), N = Bk X k },
k=0
donde Bk X k = Bk · (Idn X k ) = (Idn X k ) · Bk en el sentido de lo discutido anteriormente. Nótese

que si p(X) ∈ R[X] es un polinomio sobre R, hemos identificado p(X) con el polinomio sobre
Mn (R) dado mediante p(X)Idn ∈ Mn (R)[X].
Es un sencillo ejercicio probar la siguiente:

Proposición 2.3.28. Con las anteriores notaciones, se tiene:
i) Mn (R)[X] es un subanillo de Mn (R[X]). Es más, Mn (R)[X] es el menor subanillo
de Mn (R[X]) que contiene a Mn (R) y las matrices {Idn X k : k ∈ N}.
ii) Más aún Mn (R)[X] = Mn (R[X]). Es decir, todo elemento M (X) ∈ Mn (R[X])
admite una única representación de la forma
Xm
M (X) = Mk X k ,
k=0
con Mk ∈ Mn (R), Mm 6= 0.
iii) Dados M (X), N (X) ∈ Mn (R)[X] y sea H(X) = M (X)N (X) ∈ Mn (R)[X]. Si tene-
mos ambas matrices dadas por sus coeficientes en Mn (R):
Xm Xn
M (X) := Mi X i , N (X) := Nj X j ,
i=0 j=0
donde Mi , Nj ∈ Mn (R) y si escribimos

m+n
X
H= Ck X k ,
k=0
entonces, podemos escribir
 
X
(2.3.8) Ck :=  M i Nj  .
i+j=k
Observación 2.3.29. Un detalle importante en la proposición anterior es la identidad descrita

en el apartado iii) (Identidad (2.3.8) anterior):
 
X
Ck :=  M i Nj  .
i+j=k
El lector puede acudir al Ejemplo 1.4.4 pra refrescar ideas. Como en el caso del anillo de
polinomios, esta igualdad es consecuencia de aplicar la operación convolución en Mn (R)[X].Es
decir,
m
! n 
n+m
 
X X X X
Mi X i  Nj X j  = M i X i Nj X j  .

M (X) · N (X) = 
i=0 j=0 k=0 i+j=k
Por lo discutido anteriormente, las matrices Idn X i conmutan con cualquier matriz en Mn (R[X]),
con lo que tendremos que tal expresión se corresponde con las propiedades distributivas en
Mn (R[X]):
   
X n+m
X X
Mi X i Nj X j  = Mi Nj  X i+j ,

M (X) · N (X) =  
i+j=k k=0 i+j=k
lo que da la identidad descrita en (2.3.8). Pero debe tenerse en cuenta que, en esta “con-
volución”, el orden de multiplicación (Mi Nj ) importa, salvo que todas las matrices Mi y Nj
conmuten entre sı́, lo que es un caso excepcional. Es decir, el orden en el que aparecen los
factores en la Identidad (2.3.8) es relevante.
Proposición 2.3.30 (La operación de Mn (R[X]) sobre Mn (R)). Con las anteriores nota-
ciones, definamos la correspondencia siguiente:
·Mn (R[X]) Mn (R[X])
Pm × Mn (R) −→ MP
n (R)
m
(M := i=0 Mi X i , A) 7−→ M (A) := i=0 Mi Ai .
Se tiene:
i) La anterior correspondencia define una operación externa de Mn (R[X]) sobre Mn (R)
que respeta la suma. Es decir,
∀M, N ∈ Mn (R[X]), ∀A ∈ Mn (R), (M + N )(A) = M (A) + N (A).
ii) Dicha operación extiende la operación externa de R[X] sobre Mn (R) descrita en la
Proposición 2.3.27 anterior: Es decir, dado p(X) ∈ R[X], consideremos p(X)Idn ∈
Mn (R[X]) y sea A ∈ Mn (R), entonces
(p(X)Idn ) ·Mn (R[X]) A = p(A),
donde p(A) es el valor del polinomio p ∈ R[X] en la matriz A ∈ Mn (R) como en la
Proposición 2.3.27 anterior.
Demostración. Ejercicio de comprobación
Observación 2.3.31. En La Proposición 2.3.27 observamos que la operación de R[X] sobre
Mn (R) se “porta bien” con respecto a la operación producto en R[X]. En esta nueva operación
debemos ser más cuidadosos: se necesita un hipótesis adicional sobre ciertos elementos en
Mn (R) que conmutan para el producto de matrices. Es lo que se destaca en la siguiente
Proposición, que hemos decidido escribir separadamente.
Proposición 2.3.32. Sean M (X), N (X) ∈ Mn (R[X]) y A ∈ Mn (R). Sea H(X) ∈ Mn (R[X])
dado mediante M (X)N (X) = H(X) (producto en Mn (R[X])). Supongamos que:
m
X n
X
M (X) := Mi X i , N (X) := Nj X j ,
i=0 j=0
con Mi , Nj ∈ Mn (R). Supongamos también que A conmuta en Mn (R) con los coeficientes de
N . Es decir, supongamos que
ANj = Nj A, ∀j, 0 ≤ j ≤ n.
Entonces, se veirifica:
H(A) = M (A) · N (A),
donde · es el producto en Mn (R).
Demostración. Daremos una prueba por simplicidad y por su implicación en el Teorema
de Hamilton-Cayley. Tenemos:
m
X n
X
M (X) := Mi X i , N (X) := Nj X j .
i=0 j=0
Luego
m
X n
X
M (A) := Mi Ai , N (A) := Nj Aj .
i=0 j=0
Entonces,
m
! n

m+n
 
X X X X
M (A)N (A) = M i Ai  Nj Aj  =  M i Ai Nj Aj  .
i=0 j=0 k=0 i+j=k
Usando el hecho de que ANj = Nj A y la distributiva del producto en Mn (R), concluiremos:

 
m
X X
M (A)N (A) =  Mi Nj  Ai+j = H(A).
k=0 i+j=k

Teorema 2.3.33 (Teorema de Hamilton-Cayley). Con las anteriores notaciones, sea n ≥

1 un entero positivo, R un anillo y A ∈ Mn (R) una matriz n × n con coordenadas en R.
Sea χA (X) ∈ R[X] en polinomio caracterı́stico de A (conforme a la Definición 53 anterior).
Entonces,
χ (A) = 0, en Mn (R).
A
Demostración. Apliquemos la Fórmula de Laplace Generalizada (ver Teorema 2.3.21

anterior). Consideremos en anillo R0 := R[X], y sea AX la matriz en Mn (R[X]) dada mediante:
AX := (XIdn − A) ∈ Mn (R0 ).
Sea Adj(AX ) la matriz adjunta de AX en Mn (R[X]). Por la Fórmula de Laplace Generalizada
tendremos la siguiente igualdad en Mn (R[X]):
(2.3.9) Adj(AX )AX = Adj(XIdn − A)(XIdn − A) = χA (X)Idn .
Apliquemos ahora la Proposición 2.3.32 precedente. Tenemos, dos matrices en Mn (R)[X] que
podemos denotar por
n−1
X
M (X) = Adj(AX ) := Bi X i , N (X) := Idn X − A.
i=0
Los coeficientes de N (X) son precisamente la matriz identidad Idn y la matriz (−A). Clara-
mente, A conmuta con los coeficientes (en Mn (R)) de N (X). Por tanto, si H(X) = M (X)N (X)
se tendrá:
H(A) = M (A)N (A).
Ahora bien, N (A) = Idn A − A = 0, luego M (A) = 0 en Mn (R). Pero, además, obsérvese que
H(X) = χA (X)Idn ,
con lo que
H(A) = χA (A),
y tendremos que
χ (A) = 0,
A
como querı́amos demostrar.
Corolario 2.3.34. Sea R un anillo conmutativo con unidad, A ∈ Mn (R) una matriz y sea
N ⊆ Mn (R) el submódulo (como R−módulo) generado por todas las potencias de la matriz A:
N := Rh{An : n ∈ N}i.
Entonces, N es un R−módulo finitamente generado.
Demostración. Usando el Teorema de la División Euclı́dea por polinomios mónicos (Teo-
rema 1.4.15), usando que el polinomio caracterı́stico χA (X) ∈ R[X] es mónico de grado n, es
fácil concluir que para cualquier polinomio q(X) ∈ R[X], existe un polinomio r(X) ∈ R[X] de
grado a lo sumo n − 1 tal que q(A) = r(A). Esto permite concluir que
N := Rh{A0 , A1 , . . . , An−1 }i,
y N será un R−módulo finitamente generado.
Corolario 2.3.35. Sea K un cuerpo y K ⊆ L una extensión de cuerpos (o, equivalentemente,

L es cuerpo y K es subcuerpo de L). Sea A ∈ Mn (K) una matriz con coordenadas en K.
Entonces, el número de valores propios de A en L está acotado por n y es, por tanto, un
número finito.
Demostración. La primera observación, conocida de cursos previos de Álgebra Lineal,
es que los valores propios de A en L son raı́ces del polinomio caracterı́stico de A. Esto es, si
λ ∈ L es un valor propio de A en L, entonces existe v ∈ Ln no nulo tal que
Av = λv.
Es fácil de verificar que, para cualquier polinomio p ∈ L[X], se tiene:
p(A)v = p(λ)v.
Por tanto, χA (λ) = 0 para cualquier valor propio λ ∈ L de A en L. Todo lo que resta por ver
es que el número de raı́ces de un polinomio no nulo en un cuerpo es finito. Para ello, baste con
revisar la resolución del Problema 57.

Problema 100. Búsquese información relativa a la relación entre la evaluación del permanente
de una matriz y el estudio del Matching problem en grafos. Resume y explica la información
obtenida.
Problema 101. Prueba la Proposición 2.3.8.
Problema 102. Probad las siguientes propiedades de las matrices transpuestas:
i) (At )t = A,
ii) (A + B)t = At + B t ,
iii) (AB)t = B t At ,
iv) (λA)t = λ(A)t , ∀λ ∈ R, A ∈ Mn (R).
Problema 103. Sea R un dominio de integridad. Probad que si A ∈ Mn (R) es una matriz y
χ (X) ∈ R[X] es su polinomio caracterı́stico, el término independiente de χ (X) (i.e. χ (0) ∈
A A A
R) se relaciona con det(A) del modo siguiente:
χ (0) := (−1)n det(A).
A
Más aún, supongamos que el polinomo caracterı́stico χA (X) tiene la forma siguiente:
χ (X) := X n + an−1 X n−1 + · · · + a1 X + a0 ∈ R[X].
A
Supongamos det(A) 6= 0. Pruébese que, entonces, la matriz adjunta de A (construida como en

52) verifica:

Adj(A) = (−1)n+1 An−1 + an−1 An−2 + · · · + a1 Idn .
Problema 104. Sea R un anillo y A ∈ Mn (R). Definamos el conjunto siguiente:

AnnR[X] (A) := {p ∈ R[X] : p(A) = 0}.
Probad:
i) AnnR[X] (A) es un ideal de R[X], llamado el anulador de A.
ii) AnnR[X] (A) es un ideal no trivial que contiene un polinomio con coeficiente director
unitario (unidad en R× ).
iii) ¿Es AnnR[X] (A) un ideal principal en R[X]?. Intentar demostrarlo si R = K es un
cuerpo o si R = Z. √
iv) Consideremos el dominio de integridad R = Z[ 3 16] dado mediante:
√ √ √
R = Z[ 16] := {a + b 16 + c( 16)2 : a, b, c ∈ Z}.
3 3 3
Pruébese que la siguiente matriz A ∈ M3 (R)

 √
3

√0 2 16
A :=  2 3 16 √0 4 ,
3
4 16 0
• El polinomio caracterı́stico χA (X) ∈ R[X] es un polinomo mónico de grado 3.
Hallarlo.
• La matriz verifica que f ∈ AnnR[X] (A), donde f es el polinomio
√ √
f (X) := 2X 2 − ( 16)2 X − 16( 16) ∈ R[X].
3 3
Probad que no hay ningún polinomio mónico de grado 2 que se anule en A.

• Deducid que AnnR[X] (A) no siempre es un ideal principal en R[X], ni siquiera
cuando R es dominio.
Problema 105. Explica por qué la operación definida por (R[X], +) sobre Mn (R) (en la
Proposición 2.3.27), no define una estructura de R[X]−módulo sobre Mn (R)
Problema 106. Igualmente al caso del Problema anterior, explica las dificultades que ves en
la operación del grupo aditivo (Mn (R[X]), +) sobre Mn (R) (según las Proposiciones 2.3.30 y
2.3.32) para que Mn (R) fuera un Mn (R[X])−módulo.
Problema 107. Revisa todas las pruebas de la Sección sobre el determinante (Sección 2.3) y
detecta las erratas que encuentres.
Problema 108. Sea K = Fq un cuerpo finito de caracterı́stica p ∈ N. Considera la matriz

siguiente:
 
1 1 ··· 1
1 1 · · · 1
1 :=  . ..  ∈ Mp (K),
 
 .. .
1 1 1··· 1
donde p es la caracterı́stica del cuerpo. Se pide:
i) Verifica que la matriz 1 ∈ Mp (K) es una matriz simétrica.
ii) Prueba que el polinomio mı́nimo de la matriz 1 es el polinomio m(X) = X 2 ∈ K[X].
Es decir, verifica que
AnnK[X] (A) = (X 2 ) ⊆ K[X].
iii) Prueba que el polinomio caracterı́stico de esta matriz es χ1 (X) = X p ∈ K[X].

iv) Prueba que el orden en 0 del polinomio caracterı́stico no coincide con el rango del
núcleo de la aplicación lineal definida por 1. Es decir,
dimK (ker(A)) 6= ord0 (χ1 (X)).
v) Concluye que la matriz 1 no es diagonalizable sobre ninguna clausura algebraica de

K.
vi) Prueba que la matriz 1 es semejante a la matriz
 
0 0 0 ··· 0
1 0 0 · · · 0
 
0 0 0 · · · 0
 .
 .. .
. · · · .. 
0 0 0 ··· 0
vii) Concluye que el Teorema Espectral no es, en general, cierto en caracterı́stica posi-
tiva( Hint: Para un “recordatorio” del Teorema Espectral ver:
http: // en. wikipedia. org/ wiki/ Spectral_ theorem . )
2.3.4.1. Complejidad Algebraica en unos ejemplos.
Problema 109 (Multiplicación de números complejos). Prueba que existe un modelo de

cálculo tal que para multiplicar dos números complejos a + bi, c + di ∈ C, basta con hacer tres
multiplicaciones de números reales y algunas operaciones de adición.
Problema 110 (Multiplicación rápida de matrices por el método de V. Strassen). A

finales de los años 60, V. Strassen (cf. [Str, 1969]) sorprendió a la comunidad internacional
con un algoritmo que era capaz de multiplicar dos matrices n × n usando menos de O(n3 ) mul-
tiplicaciones sobre el cuerpo base. Este Problema pretende mostrar la idea de Volker Strassen.
Se trata de probar lo siguiente:
i) Sea R un anillo y sean dadas

A B E F
, ∈ M2 (R).
C D G H
Definamos los siguientes elementos de R:



 s1 := (B − D)(G + H) ∈ R
s := (A + D)(E + H) ∈ R

 2


s3 := (A − C)(E + F ) ∈ R


(2.3.10) s4 := H(A + B) ∈ R
s5 := A(F − H) ∈ R




s6 := D(G − E) ∈ R




s7 := E(C + D) ∈ R

Demuéstrese que se verifica:

A B E F s + s2 − s4 + s6 s4 + s5
· = 1
C D G H s6 + s7 s2 − s3 + s5 − s7
donde los elementos s1 a s7 son los calculados mediantes las reglas de las Ecuaciones
(2.3.10).
ii) Extiende, mediante una estrategia de divide y vencerás (Divide and Conquer), el
método de Strassen para multiplicar dos matrices M, N ∈ Mn (R).
iii) Concluye que el producto de matrices n × n puede hacerse con O(7log2 n ) = O(nlog2 (7) )
multiplicaciones (y no en O(n3 ) como en el método tradicional).
Problema 111 (Multiplicación rápida de matrices por el método de S. Winograd).

Prueba la siguiente identidad entre matrices con coordenadas en un anillo (debida a Sh. Wino-
grad), como alternativa al método de V. Strassen anterior.
Dadas matrices a, b, c, d, A, B, C, D ∈ Mt (R). la matriz

a b A B
P := ∈ M2t (R),
c d C D
satisface:

aA + bC w + (c + d)(B − A) + (a + b − c − d)D
P := ,
w + (a − c)(D − B) − d(A − B − C + D) w + (a − c)(D − B) + (c + d)(B − A)
donde
w = aA − (a − c − d)(A − B + D),
Problema 112 (Inversión de matrices triangulares). Sea R un anillo y sea A ∈ Mn (R)
una matriz triangular inferior. Supongamos que A ∈ GL(n, R). Se pide:
i) Probar que todos los elementos de la diagonal principal de A son unidades en R (i.e.
elementos de R× ).
ii) Supongamos que la matriz A se descompone del modo siguiente:

B 0
A := .
C D
Probar que
B −1

0
A−1 := .
−D−1 CB −1 D−1
iii) Probar que la inversa de la matriz A puede hacerse mediante un proceso iterativo que
hace a lo sumo O(n3 log2 n) multiplicaciones de elementos de R, usando los inversos
de los elementos de la diagonal principal de A como únicas “divisiones”.
Problema 113 (Resolviendo Sucesiones Recurrentes Lineales.). Sea R un anillo y con-
sideremos una serie de valores dados del modo siguiente :
a1 = b1
a2 = c2,1 a1 + b2
a3 = c3,1 a1 + c3,2 a2 + b3
..
.
an = cn,1 a1 + ··· + cn,n−1 an−1 + bn
Una sucesión recurrente lineal es una sucesión {an }n∈N de elementos del anillo R que se genera
mediante un procedimiento como el anterior. El ejemplo más clásico puede ser la sucesión de
Fibonacci :
F1 = 1
F2 = 0F1 + 1
F3 = 1F1 + 1F2 + 0
F4 = 0F1 + 1F2 + 1F3 + 0
..
.
Fn = 0F1 + · · · + 1Fn−2 + 1Fn−1 + 0
Se pide:
i) Probar que si tenemos una sucesión recurrente lineal {an }n∈N de elementos del anillo
R, como las anteriores, entonces existen matrices C ∈ Mn×n (R) y una matriz columna
B tales que    
a1 a1
 ..   .. 
 .  := C  .  + B.
an an
ii) Pruébese que si {an }n∈N es una sucesión recurente lineal de elementos del anillo R,
entonces existe una matriz triangular inferior D ∈ GL(n, R) cuyos elementos de la
diagonal principal son todos 1 y tales que
 
a1
 ..  −1
 .  = D B,
an
donde B es el del item anterior.
iii) Usando el Problema precedente, pruébese que para cada n ∈ N, y para cualquier anillo
R, se pueden calcular los n primeros términos de una sucesión recurrente lineal ha-
ciendo O(n3 log2 n) operaciones aritméticas y ninguna división.
2.3.4.2. Sumas de Newton y Funciones simétricas elementales. Vamos a hacer
una serie de problemas relativos al cálculo con sumas de Newton que, más adelante (cf. Sub-
sección 5.4.3.1), nos servirá para justificar algoritmos eficientes para calcular determinantes y
polinomios caracterı́sticos. Supongamos R un dominio de integridad, K = qf (R) su cuerpo
de francciones (cf. la descripción en el Párrafo 3.2.0.1 del Capı́tulo siguiente) y K la clausura
algebraica de K. Sea
f (T ) := T n + a1 T n−1 + a2 T n−2 + · · · + a0
un polinomio mónico con coeficientes en R. Podemos factorizarlo mediante :
n
Y
f (T ) := (T − αi )
i=1
donde las races αi ∈ K son repetidas con su multiplicidad. Vamos a definir dos tipos de
funciones simétricas de las raı́ces de f . Denotemos por [n] := {1, . . . , n} :
• Las funciones simétricas elementales (cf. Teorema 2.3.3): Son las dadas mediante :
(n)
X Y
sk (α1 , . . . , αn ) := αi .
S⊂[n],](S)=k i∈S
Es conocida la siguiente representación de f a partir de sus raı́ces :

n
X
f (T ) := T n + (−1)k sk (α1 , . . . , αn )T n−k
k=1
En otras palabras,
ak := (−1)k sk (α1 , . . . , αn )
• Las sumas de Newton : Son definidas del modo siguiente :
n
(n)
X
Nk (α1 , . . . , αn ) := αik
i=1
Estos dos grupos de funciones simétricas tienen una forma de relacionarse conocida a partir de
Newton que vamos a analizar como una serie de problemas.
Definición 54. Sea {X1 , . . . , Xn } una lista de variables, sea [n] := {1, . . . , n} y sea R un
anillo.
i) Para cada k, 0 ≤ k ≤ n definiremos el polinomio :
(n)
X Y
σk (X1 , . . . , Xn ) := Xi ∈ R[X1 , . . . , Xn ].
S⊂[n],](S)=k i∈S
(n)
Los llamaremos funciones simétricas elementales. Nótese que σ0 =1
ii) Para cada k ∈ N, definiremos los polinomios :
n
(n)
X
Nk (X1 , . . . , Xn ) := Xik ∈ R[X1 , . . . , Xn ].
i=1
(n)
Los llamaremos sumas de Newton. Nótese que N0 = n.
iii) Definamos la siguiente colección de polinomios auxiliares : Para k ≥ 1, m ≥ 0 :
 
n
(n)
X X Y
F :=
(k,m)
 Xi  Xjm .
j=1 S⊂[n],](S)=k,j6∈S i∈S
Escribamos :
(n) (n)
F(0,m) := Nm (X1 , . . . , Xn ).
Problema 114. Con las notaciones anteriores, pruébense las siguientes propiedades
i) Para cada k, 1 ≤ k ≤ n, se tiene :
(n)
F(k,0) = (n − k)σk (X1 , . . . , Xn )
ii) Para cada k, 1 ≤ k ≤ n, se tiene :
(n) (n) (n) (n)
σk (X1 , . . . , Xn )Nm (X1 , . . . , Xn ) = F(k,m) + F(k−1,m+1) .
iii) Además,
(n) (n) (n)
σ 0 Nm = F(0,m) .
(n) (n) (n)
σ k N0 = nσk .
iv) Para cada k ≥ 1,
(n) (n)
F(k−1,1) = kσk .
Problema 115. Con las notaciones anteriores, pruébese que se verifian las siguientes identi-
dades:
k
(n) (n) (n)
X
(−1)i σk−i Ni = F(k,0) .
i=0
Problema 116 (Newton). Con las notaciones anteriores, sea R un anillo cualquiera y supong-
amos que {1, 2, . . . , n} ⊆ R× . Pruébese que :
i) Para todo k, 1 ≤ k ≤ n :
k
!
(n) 1 X i+1 (n) (n)
σk = (−1) σk−i Ni .
k i=1
ii) Para k = 1 se tiene :

(n) (n)
σ1 = N1 .
iii) Para k = 0 se tiene :
(n)
σ0 = 1.
Problema 117. Usando los problemas precedentes, concluir que las funciones simétricas ele-
mentales se pueden obtener mediante la inversión de una recurrencia lineal a partir de las sumas
de Newton, usando como únicas “divisiones” la inversión de los elementos {1, 2, . . . , n} en R× .
Es decir, Si R un dominio de integridad cuya caracterı́stica sea mayor que n. Entonces, existe
un esquema de evaluación sobre R que realiza O(n3 log2 n) operaciones aritméticas y tal que, a
partir de los datos :
1
{ Ni (α1 , . . . , αn ) : 1 ≤ k ≤ n, 1 ≤ i ≤ k},
k
calcula los coeficientes del polinomio
n
Y
(X − αi ).
i=1
CAPı́TULO 3
Dominios de Ideales Principales. Anillos Noetherianos.

Dominios Enclı́deos. Con unas reflexiones sobre
algoritmos de Cálculo del Máximo Común Divisor “ à la
Sylvester”.
(À la recherche du temps perdu)
Et tout d’un coup le souvenir m’est apparu. Ce goût, c’était

celui du petit morceau de madeleine que le dimanche matin à
Combray.... La vue de la petite madeleine ne m’avait rien
rappelé avant que je n’y eusse goûté; .... leur image avait
quitté ces jours de Combray pour se lier à d’autres plus
récents; .... Mais, quand d’un passé ancien rien ne subsiste,
après la mort des êtres, après la destruction des choses,
seules, plus frêles mais plus vivaces, plus immatérielles, plus
persistantes, plus fidèles, l’odeur et la saveur restent encore
longtemps, comme des âmes, à se rappeler, à attendre, à
espérer, sur la ruine de tout le reste, à porter sans fléchir,
sur leur gouttelette presque impalpable, l’édifice immense du
souvenir.
Et dès que j’eus reconnu le goût du morceau de madeleine
trempé dans le tilleul que me donnait ma tante (....), aussitôt
la vieille maison grise sur la rue, où était sa chambre, vint
comme un décor de théâtre s’appliquer au petit pavillon
donnant sur le jardin, ...; ; et avec la maison, la ville, la
Place ..... Et comme dans ce jeu où les Japonais s’amusent
....de même maintenant toutes les fleurs de notre jardin et
celles du parc de M. Swann, et les nymphéas de la Vivonne,
et les bonnes gens du village et leurs petits logis et l’église et
tout Combray et ses environs, tout cela qui prend forme et
solidité, est sorti, ville et jardins, de ma tasse de thé....
Marcel Proust, “À la Recherche du temps perdu”,
B.Grasset & Gallimard, 1913-1927.
137
138 3. DIVISIBILIDAD EN ANILLOS: DIP’S, NOETHER Y DE’S. ALGORITMOS
Índice
3.1. Introducción: DIP’s, Noetherianos y Dominios Euclı́deos. 138
3.2. Dominios de ideales principales, propiedades elementales,
elementos primos e irreducibles. 139
3.2.0.1. Construcción: Cuerpo de Cocientes (o cuerpo de fracciones) de
un Dominio de Integridad 142
3.3. Anillos noetherianos: aplicación del pensamiento noetheriano a la
factorización en dominios de ideales pincipales. 143
3.4. Dominios Euclı́deos 147
3.4.1. Dominios Euclı́deos: Elementos básicos 147
3.4.2. Existencia de factorización en primos en dominios euclı́deos (Opcional) 151
Dedekind-Hasse (Opcional) 152
3.4.4. Ejercicios y problemas de las secciones 3.2, 3.3 y 3.4 156
3.4.4.1. Problemas sobre el Lema de Dickson. 158
3.4.4.2. Basissatz de Hilbert en K[X1 , . . . , Xn ] 159
3.5. Sobre la eficiencia del Algoritmo de Euclides en Z 159
3.5.1. Divisiones del algoritmo de Euclides en Z 159
3.6. Eliminación univariada clásica: la Matriz de Sylvester 162
3.6.1. Extensiones algebraicas (Resumen Opcional) 162
3.6.2. Cuerpos algebraicamente cerrados (Resumen opcional) 165
3.6.3. La matriz de Sylvester y el máximo común divisor en K[X] 168
3.6.3.1. Mutiplicar por un polinomio. 168
3.6.3.2. La matriz de Sylvester-Bézout 169
3.6.3.3. Resultante de Sylvester-Bézout 172
3.6.4. Resultante de Sylvester-Bézout y Eliminación: cuando los coeficientes están
en un anillo 172
3.6.5.1. Ecuación de Pell en el caso m = 2. 177
3.6.5.2. El algoritmo de Berlekamp 179
3.6.5.3. Teorema Pequeño de Fermat y Función de Euler 179
3.6.5.4. El Sistema Criptográfico RSA 180
3.1. Introducción: DIP’s, Noetherianos y Dominios Euclı́deos.

En lo concerniente a este Capı́tulo, rozaremos un poco alguno de los temas que los almunos
deberı́an conocer como pre-Álgebra Conmutativa y nos adentraremos en el universo del pen-
samiento de E. Noether.
Ası́ que comenzaremos revisando la noción de dominio de ideales principales, pero, tras una
rápida revisión, pronto nos adentraremos en el pensamiento de E. Noether quien pergeñó las
primeras formas “modernas” del Álgebra Conmutativa, sobre la que reposa el resto de con-
strucciones ulteriores. La generalización natural de un ideal principal es un ideal finitamente
generado. Del mismo modo, los anillos de Noether (o anillos noetherianos) son la generalización
natural de los anillos principales. Un anillo será noetheriano si todos sus ideales son finita-
mente generados. Esta simple definición requiere de un poco de elaboración adicional y sus
consecuencias (tanto para la factorización de ideales como para la compacidad de la topologı́a
de Zariski, entre otros) se posponen a los Capı́tulos 6 o 7.
La razón última es que los dominios de ideales principales son un caso muy particular y muy
elemental de anillo noetheriano. A tal punto es ası́, que la existencia de factorización en producto
finito primos en los dominios de ideales principales puede interpretarse un caso particular del
Teorema de Lasker-Noether (cf. Teoremas 6.3.23 y 6.3.27). El elemento clave subyacente
es la noción de anillo noetheriano y la caracterización qye daremos en el Teroema 3.3.2 de
este Capı́tulo: Los anillos noetherianos son los anillos introducidos por Emmy Noether (y
continuados por sus alumnos y seguidores) y son los anillos que satisfacen la Condición de
Cadena Ascendente Numerable para ideales. Un pequeño diagrama mnemoténico que expresa
los contenidos estrictos en el caso de dominios serı́a:
DE ( DIP ( DominiosN oetherianos ( DOminiosdeIntegraidad (Ctivos. con unidad).
3.2. DIP-ELEMENTOS PRIMOS E IRREDUCIBLES 139
La estructura del Capı́tulo es la siguiente: Comenzaremos con una revisión de la terminologı́a

de dominios de ideales principales (Sección 3.2). Seguiremos, en la Sección 3.3, definiendo y
estableciendo las propiedades más inmediatas de los anillos noetherianos. En esa misma sección
aplicaremos el pensamiento noetheriano, en la forma más elemental, para mostrar la existencia
de factorización única en DIP’s. Seguidamente, daremos un paso atrás en la abstracción y nos
iremos al caso particular de dominio de ideales principales conocido como dominio euclı́deo
(Sección 3.4). En la Subsección 3.4.3 veremos que los dominios euclı́deos son una clase es-
trictamente contenida en la clase de dominios de ideales principales. Se trata del Teorema de
Dedekind-Hasse que analizamos en la Subsección 3.4.3.
La última parte del Capı́tulo se de dedica a aspectos más algorı́timicos que, en algún sentido,
deberı́an formar parte del conocimiento previo del alumno. Nos dedicaremos a la eliminación
de un cuantificador existencial afectando a una única variable (Teorı́a de la Eliminación, caso
univariado) o, si se prefiere, a reflexionar sobre el cálculo del máximo común divisor de dos
polinomios univariados con coeficientes en un cuerpo. Esto nos lleva al siglo XIX y a los
trabajos de J.J. Sylvester (cf. [Syl, 1840] o [Syl, 1853]) sobre la resultante univariada. A
esto dedicaremos la Sección 3.6.
3.2. Dominios de ideales principales, propiedades elementales, elementos primos e

irreducibles.
Definición 55 (Dominios de Ideales Principales). Un dominio de ideales principales es
un dominio de integridad que es, a la vz, anillo principal. Esto es, satisface, a la vez,
i) R no posee divisores de cero no nulos y,
ii) todos los ideales de R son ideales principales.
Ejemplo 3.2.1. A partir de los Teoremas 2.2.18 y 1.4.39 anteriores, se tienen los siguientes
ejemplos:
i) El anillo Z es un dominio de ideales principales.
ii) El anillo K[X] es un dominio de ideales principales, cuando K es un cuerpo.
iii) El anillo Z[X] es un dominio de integridad, pero no es un anillo principal.
iv) El anillo K[X, Y ], cuando K es un cuerpo, es dominio de integridad pero no es anillo
principal. Para verlo, baste con ver que el ideal m := (X, Y ) no es un ideal principal.
Para verlo, baste con ver que si fuera un ideal principal, entonces, las variables X e
Y poseerı́an un divisor común no unidad. Pero, nótese que m es un ideal propio de
K[X, Y ] porque:
m := {f ∈ K[X, Y ] : f (0, 0) = 0}.
Finalmente, las variables X e Y no pueden tener un divisor no unidad común en
K[X, Y ]. Dejamos como ejercicio, verificar esta última condición.
v) El anillo cociente Z/6Z es un anillo principal, pero no es dominio de integridad.
Notación 3.2.2. Utilizaremos la notación x | y para indicar y ∈ (x) y diremos que x divide a
y.
Lema 3.2.3. Si R es un dominio de integridad, a un ideal de R y a, b dos generadores de a (i.e.

a = (a) = (b)) entonces, existe u ∈ R× tal que ua = b. Es decir,
a = (a) = (b) =⇒ ∃u ∈ R× , ua = b.
Demostración. Obvio dado que b ∈ (a) =⇒ ∃x ∈ R, b = xa y a ∈ (b) =⇒ ∃y ∈ R, a =
yb, entonces
a = yb = yxa =⇒ (1 − yx)a = 0,
con lo que o bien a 6= 0 (e, en ese caso, a = (0) = (b) y, por tanto, b = 0) o bien (1 − xy) = 0
de donde se concluye que x ∈ R× .
Definición 56. Se dice que dos elementos a, b ∈ R en un dominio de integridad R son asociados
si (a) = (b) o, equivalentemente, si difieren en una unidad de R, es decir si existe u ∈ R× tal
que a = ub. Se denotará mediante a ∼ b.
Nótese que elementos iguales también son asociados.
Definición 57 (Máximo Común Divisor en Dominios de Ideales Principales). Sea R

un dominio de integridad y sea F = {ai : i ∈ I} ⊆ R un conjunto de elementos del anillo.
Llamaremos máximo común divisor de F (en el sentido de dominios de ideales pricnipales)
a cualquier generador del ideal principal a = (F) ⊆ R generador por el conjunto F, si tal
elemento existira. Lo denotaremos mediante gcd(F ).
En el caso finito F = {a1 , . . . , am }, escribiremos gcd(a1 , . . . , am ) para designar su máximo
común divisor, i.e.
gcd(F) = h ⇐⇒ (h) = (F),
y
gcd(a1 , . . . , am ) = h ⇐⇒ (h) = (a1 , . . . , am ).
Observación 3.2.4. Por lo dicho anteriormente, si R es dominio de integridad, cualesquiera

dos máximos comunes divisores h y h0 de una familia F generan el mismo ideal (F ). Por tanto,
son elementos asociados y podemos concluir que el máximo común divisor, de existir, es único
salvo unidades en el anillo.
Proposición 3.2.5. En dominios de ideales principales, toda familia F posee máximo común
divisor.
Observación 3.2.6. Obsérvese que la noción de máximo común divisor antes descrita sólo tiene
sentido en el caso de que el ideal generado por F sea principal. Eso está garantizado cuando
R es dominio de ideales principales, pero no está garantizado en otros anillos, ni siquiera en
dominios de integridad. Si se trata de un ideal (F ) no principal, los elementos de F podrı́an
no tener máximo común divisor en el sentido recedente. Volveremos a este caso en el caso de
dominios de factorización única (en la Sección 6.2 siguiente). De todos modos, tomemos el anillo
R = K[X, Y ] de polinomios en dos variables con coeficientes en un cuerpo y consideremos el ideal
m = (X, Y ). Podemos tener una noción de divisor común de grado máximo de los elementos
X e Y . Ese polinomio serı́a el polinomio 1 y sus asociados en K[X, Y ]. Pero, como ya hemos
discutido, (1) 6= m = (X, Y ) y los elementos {X, Y } no poseen máximo común divisor en el
sentido precedente.
Un resultado clásico (sin cotas) proveniente de la obra precursora de É. Bézout (cf. [Béz, 1779])
es el siguiente, que Bézout probó para polinomios univariados con coeficientes “complejos”.
Sobre el caso de los enteros, se conoce un antecedente parcial en la obra de Claude Gaspard
Bachet (sieur de Méziriac)“Problèmes plaisants & délectables qui se font par les nombres”,
Lyons, France: Pierre Rigaud & Associates, 1624,1 donde el caso Z aparece reflejado como
Proposition XVIII, páginas 18-33:
Teorema 3.2.7 (Identidad de Bézout (sin cotas)). Sea R un dominio de ideales principales
y sea a1 , . . . , an ∈ R un conjunto finito de elementos. Sea h su máximo común divisor .
Entonces, existen x1 , . . . , xn ∈ R tales que
h = x1 a1 + · · · + an xn .
Demostración. Es obvio porque h es el máximo común divisor si y solamente si (h) =
(a1 , . . . , an ), con lo que se tiene que dar la propiedad indicada.
1https://www.bsb-muenchen-digital.de// web/web1008/bsb10081407/images/index.html?digID=
~
bsb10081407&pimage=38&v=100&nav=0&l=de
3.2. DIP-ELEMENTOS PRIMOS E IRREDUCIBLES 141
Teorema 3.2.8 (Identidad de Bézout (caso infinito)). Sea R un dominio de ideales prin-
cipales y sea F = {ai : i ∈ I} un conjunto cualquiera de elementos de R. Sea h su máximo
común divisor. Entonces, existe un conjunto finito J ⊆ I y existen {xi : i ∈ I} ⊆ R tales que
X
h= xj aj .
j∈J
Demostración. Es obvio por que h es el máximo común divisor si y solamente si (h) =

(F), con lo que se tiene que dar la propiedad indicada.
Definición 58 (Elementos irreducibles y elementos primos). Sea R un dominio de

integridad.
i) Un elemento q ∈ R no unidad se dice irreducible si o bien q = 0 o bien q 6= 0 y el
ideal (q) = qR ⊆ R que genera es maximal entre los ideales principales propios de R
para la relación de inclusión. Es decir, q = 0 o q 6= 0 y se verifica:
∀a ∈ R, (q) ⊆ (a) =⇒ (a) = (q) ∨ (a) = R.
ii) Un elemento p ∈ R no unidad se dice primo si el anillo cociente R/pR es un dominio
de integridad.
Observación 3.2.9. La definición dada de elementos primos e irreducibles es la usual, aunque

escrita de otro modo. Dejamos al lector la verificación de la propiedad:
• Un elemento q ∈ R que no sea unidad es un elemento irreducible si y solamente si
verifica:
∀a ∈ R, a | q, =⇒ (a ∈ R× ) ∨ (a ∼ p).
• Un elemento p ∈ R que no sea unidad es primo si y solamente si verifica la siguiente
propiedad:
∀a, b ∈ R, p | ab, =⇒ [p | a] ∨ [p | b].
Ejemplo 3.2.10. Se tienen los siguientes ejemplos:

i) Si R es un dominio de integridad, entonces 0 ∈ R es un elemento primo. De hecho, R
es dominio si y solamente 0 es primo.
ii) El elemento 2 ∈ Z es primo e irreducible
√ en Z.
iii) El elemento 2 es irreducible en Z[ −5] pero no es primo, dado que:
√ √
2 | (1 − −5)(1 + −5) = 6,
pero √ √
2 - (1 − −5), 2 - (1 + −5).
√
La irreducibilidad de 2 en Z[ −5] se prueba del modo siguiente:
√ √ √ √
2 = (a + b −5)(c + d −5) =⇒ 2 = (a − b −5)(c − d −5),
aplicando conjugación en C y dado que a, b, c, d ∈ Z. Entonces, tendremos
√ √ √ √
4 = 22 = (a + b −5)(a − b −5)(c + d −5)(c − d −5) = (a2 + 5b2 )(c2 + 5d2 ).
Por tanto, a2 + 5b2 es un divisor de 4 en Z. Nótese que si b 6= 0, entonces, a2 + 5b2 ≥ 5
y no podrı́a ser un divisor entero de 4. Por tanto, es necesario b = 0 y tendremos que
los únicos casos posibles son
(a, b) ∈ {(±1, 0), (±2, 0)}.
√ √ √
En estos casos o bien (a+b
√ −5) = ±1 y es unidad en Z[ −5] o bien (a+b −5) = ±2
y es asociado a 2 en Z[ −5].
Proposición 3.2.11. Si R es un dominio de integridad, todo elemento p ∈ R que sea primo,

ha de ser irreducible en R.
Demostración. Es consecuencia inmediata de las definiciones. Si p ∈ R es primo y a | p
en R, entonces, ∃b ∈ R tal que p = ab. Por ser p primo, y p | ab, se ha de tener una de las dos
opciones siguientes:
• o bien p | a, en cuyo caso p ∼ a y son asociados

• o bien p | b, en cuyo caso es fácil deducir que a ha de ser una unidad de R.
En cualquier caso, p es irreducible.
3.2.0.1. Construcción: Cuerpo de Cocientes (o cuerpo de fracciones) de un

Dominio de Integridad. Sea R un dominio de integridad y su subconjunto S := R \ {0}.
Consideremos el conjunto R × S y definamos la siguiente relación:
∀(a, s), (b, r) ∈ R × S, (a, s) ∼ (b, r) ⇐⇒ ar − bs = 0.
Se prueba que
i) La relación ∼ anterior es una relación de equivalencia.
ii) Denotaremos mediante qf (R) o S −1 R al conjunto cociente y a las clases de equivalencia
[(a, s)]∼ ∈ qf (R) la denotaremos mediante as . Definimos la siguientes correspondencias
en qf (R):
+ : qf (R) × qf (R) −→ qf (R), 6 · : qf (R) × qf (R) −→ qf (R)
( as , rb ) 7−→ ar+bs
rs , 6 ( as , rb ) 7−→ ab
rs
Entonces, ambas correspondencias son aplicaciones y (qf (R), +, ·) es un cuerpo que
se denomina cuerpo de fracciones de R.
iii) Todo dominio de integridad es subanillo de su cuerpo de fracciones.
iv) Se tiene, por ejemplo,
√ √
qf (Z) = Q, qf (Z[i]) = Q(i), qf (Z[ m]) = Q( m),
v) El cuerpo de fracciones de K[X] es el cuerpo de funciones racionales en una variable
con coeficientes en K y se denota mediante:
p(X)
K(X) := { : p, q ∈ K[X]}.
q(X)
Se tiene que qf (Z[X]) = qf (Q[X]) = Q(X), luego diversos dominios pueden tener el
mismo cuerpo de fracciones.
Notación 3.2.12 (Cuerpo de funciones racionales (en n variables)). Sea K[X1 , . . . , Xn ]
el anilo de polinomios en n variables sobre el cuerpo K. Llamaremos cuerpo de funciones
razcionales en n variables sobre K, y lo denotaremos mediante, K(X1 , . . . , Xn ) al cuerpo
de fracciones de K[X1 , . . . , Xn ]. A los elementos de K(X1 , . . . , Xn ) se las denomina fun-
ciones racionales K−definibles en n variables . Claramente K[X1 , . . . , Xn ] es un subanillo
de K(X1 , . . . , Xn ) o, equivalenetmente, las operaciones de K(X1 , . . . , Xn ) “extienden” a las
operaciones de K[X1 , . . . , Xn ].
Proposición 3.2.13. Sea R un dominio de integridad y sea F = qf (R). Supongamos que R

verifica la siguiente curiosa propiedad:
“Para todo polinomio f ∈ R[X] de grado 2, si f posee una raı́z en F , entonces el polinomio
factoriza como el producto de dos polinomios de grado 1 en R[X]”.
Entonces, todo elemento de R es irreducible si y solamente si es primo.

Demostración. Supongamos que p ∈ R es irreducible y que existen a, b ∈ R tales que
p | ab. Consideremos el siguiente polinomio con coeficientes en F [X]:
a b
f (X) = p(X − )(X − ).
p p
Es fácil verificar que

2 a+b ab
f (X) = pX − p X+ = pX 2 − (a + b)X + r ∈ R[X],
p p
donde ab = pr, para algún elemento r ∈ R. Por tanto, tenemos un polinomio f (X) ∈ R[X] que
posee una solución en F (de hecho, dos ap y pb ). Aplicando la propiedad indicada, tendemos que
f factoriza en producto de dos polinomios de grado 1 en R[X]. Es decir
f (X) = (cX + d)(eX + `), (eX + c), (cX + `) ∈ R[X].
3.3. ANILLOS NOETHERIANOS: FACTORIZACIÓN EN D.I.P.’S 143
Pero eso implicarı́a p = ce y p es irreducible. Luego o bien c o bien e son unidades en R.

Supongamos que c ∈ R× es unidad. Entonces, p = ce =⇒ e = c−1 p. Luego,
f (X) = c(X + c−1 d)(c−1 pX + `).
Luego la raı́z −c−1 d del polinomio f tiene que ser una de sus dos raı́ces. Es decir, se ha de
tener una de las dos opciones siguientes:
a b
= −c−1 d ∈ R ∨ = −c−1 d ∈ R.
p p
Es decir, habremos probado que, tomando x = −c−1 d ∈ R e y = −c−1 d ∈ R, se tiene:
[∃x ∈ R, a = px] ∨ [∃y ∈ R, b = py] .
con lo cual concluimos que p | a o p | b y tendremos que p es un elemento primo.
Teorema 3.2.14. En un dominio de ideales principales, un elemento p ∈ R es primo si y

solamente si es irreducible.
Demostración. Hemos visto que “primo” =⇒ “irreducible”, ası́ que toca probar la afir-
mación recı́proca. Supongamos que p ∈ R es un elemento irreducible y supongamos que p | ab,
con a, b ∈ R dos elementos no unidades. Supongamos ab = rp, con r ∈ R. Supongamos que
p - a y consideremos el ideal suma (p) + (a) = (p, a) ⊆ R. Como R es dominio de ideales
principales, tendremos que existe un elemento c ∈ R tal que
(c) = (p, a).
Además, p ∈ (p, a) con lo que p ∈ (c) y, por tanto, c | p. Como p es irreducible, caben dos
opciones:
O bien p ∼ c, en cuyo caso (p) = (c) y, en consecuencia, (p) = (p, a), con lo cual a ∈ (p) y p | a,
lo que es imposible por hipótesis.
O bien c ∈ R× es una unidad en R, con lo cual
R = (c) = (a, p),
En este caso, tendremos que existe x, y ∈ R tales que 1 = xp + ya. Luego,
b = b · 1 = b(xp + ya) = xbp + yba = xbp + yrp = (xb + yr)p,
con lo cual habremos concluido que p | b y tendremos probada la primalidad de p.
3.3. Anillos noetherianos: aplicación del pensamiento noetheriano a la

factorización en dominios de ideales pincipales.
Como ya indicamos en la Introducción, en este Sección nos dedicamos a introducir la noción
de anillo cuyos ideales son finitamente generados. Buscamos la caracterización tradicional de
E. Noether que presupone el Axioma de Elección Dependiente.
Presentaremos un primer ejemplo de argumentación noetheriana, posiblemente un tanto exce-
siva e innecesaria: vamos a demostrar la existencia de factorización de los elementos de dominios
de ideales pincipales como producto de irreducibles. Dado que ya hemos visto que en dominios
de ideales principales primo equivale a irreducible (ver Teorema 3.2.14), podemos usar indis-
tintamente en ambos casos los términos primo e irreducible sin necesidad de explicar que son
la misma noción. La demostración en el caso de dominios de ideales principales usa un ar-
gumento tı́picamente noetheriano. No es una necesidad, pero ejemplifica bien lo que Noether
hará después con esta forma de pensamiento. Posteriormente veremos que, si es un dominio
euclı́deo, este Axioma no es necesario, con el enunciado del Teorema 3.4.10 en la Subsección
3.4.2 posterior.
Comencemos con un axioma esencial para captar el pensamiento noetheriano:
Axioma 3.3.1 (Axioma de Elección Dependiente). Sea X un conjunto no vacı́o y R ⊆
X × X una relación. Supongamos que R satisface la siguiente propiedad:
∀a ∈ X, ∃b ∈ X, aRb.
Entonces, existe una sucesión {xn : n ∈ N} ⊆ X de tal modo que xn Rxn+1 , ∀n ∈ N.
Teorema 3.3.2 (Teorema de Noether sobre la Condición de Cadena Ascendente

numerable para anillos). Sea R un anillo. Asumiendo el Axioma de Elección Dependiente,
las siguiente tres propiedades son equivalentes:
i) Condición de Cadena Ascendente Numerable de Ideales (abreviado CCA):
Toda cadena ascendente numerable de ideales se estabiliza, es decir, dada una cadena
ascendent numerable de ideales de R:
a0 ⊆ a1 ⊆ a2 ⊆ · · · ⊆ an ⊆ · · · ,
existe m ∈ N tal que an = am , para todo m ≥ n.
ii) Todo conjunto no vacı́o de ideales de R posee elemento maximal. Es decir, dado S un
conjunto no vacı́o de ideales de R, entonces existe a ∈ S tal que para cada b ∈ S, si
a ⊆ b, entonces a = b.
iii) Todos los ideales de R poseen un sistema generador de cardinal finito (i.e. son finita-
mente generados).
Demostración. Probemos las distintas implicaciones:
• i) ⇒ ii): Es simplemente el enunciado del Axioma de Elección Dependiente. Es
decir supongamos que R satisface CCA y, razonando por reducción al absurdo, su-
pongamos que existe un conjunto S de ideales de R que no posee elemento maximal.
Consideremos sobre S la relación R :=( dada por la inclusión estricta. Como ningún
elemento de S es maximal, para cada a ∈ S se verificará que ∃ b ∈ S tal que a (
b. Aplicando literalmente el Axioma de Elección Dependiente, existirá una sucesión
{an : n ∈ N} ⊆ S tal que:
a0 ( a1 ( · · · ( an ( · · · .
Pero la existencia de esta cadena ascendente numerable que no se estabiliza contradice
la CCA que se satisface en R.
• ii) ⇒ iii): Claramente los ideales (0) y R = (1) están generados por conjuntos finitos
de generadores. Sea a ( R un ideal propio. Definamos el conjunto:
Sa := {b ⊆ a : b es un ideal finitamente generado}.
Como (0) ∈ Sa , éste es un conjunto no vacı́o y, por ii) posee elementos maximales.
Sea n uno de esos maximales de Sa . Veamos que n = a.
Es claro, por hipótesis, que n ⊆ a. Sea c ∈ a un elemento cualquiera. Como n es un
ideal finitamente generado existirá un conjunto finito {c1 , . . . , cr } de elementos de n
tales que
n = (c1 , . . . , cr ).
Por tanto, el ideal siguiente también es finitamente generado:
n + (c) = (c1 , . . . , cr ) + (c) = (c1 , . . . , cr , c).
Además, como c ∈ a tenemos que n + (c) ⊆ a. Concluimos ası́ que n + (c) ∈ Sa . Pero,
como n ⊆ n + (c) y n es maximal en Sa , sólo nos queda la posibilidad de que
n = n + (c).
Y, en particular, c ∈ n, para cualquier c ∈ a.
• iii) ⇒ i): Supongamos que R satisface la propiedad iii) y consideremos una cadena
ascendente numerable de ideales de R:
a0 ⊆ a1 ⊆ a2 ⊆ · · · ⊆ an ⊆ · · ·
Por ser cadena asecendente, es fácil verificar que el siguiente conjunto
[
a := ai ,
i∈N
es un ideal de R. Por tanto, por la propiedad iii), a está generado por un conjunto
finito de elementos {a1 , . . . , ar }. Pero, como a es una unión, para cada i, 1 ≤ i ≤ r, ha
de existir k(i) tal que ai ∈ ak(i) . Definamos m := max{k(1), . . . , k(r)} y observamos
que
∀i, 1 ≤ i ≤ r, ai ∈ am ,
3.3. ANILLOS NOETHERIANOS: FACTORIZACIÓN EN D.I.P.’S 145
simplemente porque como m ≥ k(i), ak(i) ⊆ am . En conclusión,

a = (a1 , . . . , ar ) ⊆ am .
Por tanto, para cada n ≥ m tendremos:
[
an ⊆ a = ai ⊆ am ⊆ an ,
i∈N
y la cadena se estabiliza a partir del ı́ndice m.

Observación 3.3.3. Usualmente, la prueba de la equivalencia entre estas tres propiedades

(esencialmente la prueba de ii) ⇒ iii) o, equivalentemente, la prueba de ii) ⇒ i) se hace sin
dar relevancia al Axioma de Elección Dependiente. Este aspecto fue destacado por W. Hodges,
en su trabajo de 1974 (cf. [Hod, 1974]). La salida natural es asumir el Axioma de Elección
Dependiente (cf. Axioma 3.3.1), como axioma de nuestra teorı́a de conjuntos subyacente.
Definición 59 (Anillo Noetheriano). Un anillo R se dice noetheriano (o de Noether) si

satisface una cualquiera de las propiedades i) a iii) (y, por tanto, todas) del Teorema 3.3.2
precedente.
Corolario 3.3.4. Los anillos principales son anillos noetherianos. Los cocientes de anillos
noetherianos por cualquiera de sus ideales son noetherianos.
Demostración. La primera de las afirmaciones es obvia, mientras que la segunda se sigue
de lo probado en la Proposición 2.2.28. Si a ( R es un ideal propio de un anillo noetheriano y
si R/a es el anillo cociente, los ideales del cociente R/a son de la forma b/a, donde b es ideal
de R y b ⊇ a. Como R es noetheriano, b es finitamente generado como ideal de R. Ahora,
si {b1 , . . . , br } es un conjunto finito de generadores de b como ideal de R, entonces las clases
módulo a dadas por {b1 + a, . . . , br + a} son un conjunto finito de generadores de b/a como
ideal de R/a. Esta última afirmación es de mera verificación y no tiene dificultades. Lo que
nos permite concluir que todo ideal de R/a es finitamente generado.
Ejemplo 3.3.5 (Ni todo anillo noetheriano es principal, ni todo anillo noetheriano
es dominio). Como veremos más adelante, no todos los anillos noetherianos son principales:
por ejemplo, los anillos de polinomios K[X1 , . . . , Xn ] son dominios noetherianos que no son
principales para n ≥ 2, como ya hemos visto (cf. la Subsección (de Problemas) 3.4.4.2 y el
Problema 135). Obviamente, no todo anillo noetheriano es dominio, como lo prueban los dos
anillos noetherianos Z/6Z y Q[X]/(X 2 − 1).
Ejemplo 3.3.6 (Hay anillos que no son noetherianos). Consideremos el anillo C 0 (R) de
funciones continuas sobre R. Consideremos el conjunto n ∈ N de los números naturales y para
cada n ∈ N, definamos el siguiente ideal:
an := {f ∈ C 0 (R) : f (i) = 0, ∀i ∈ N, i ≥ n}.
Es evidente que tenemos la cadena ascendente numerable de ideales siguiente:
a0 ⊆ a1 ⊆ · · · ⊆ an ⊆ an+1 ⊆ · · ·
La siguiente es una función continua fn+1 ∈ an+1 \ an :

 1, si x ≤ n,
fn+1 (x) := −x + (n + 1), si n ≤ x ≤ n + 1,
0, si x ≥ n + 1.

Es claro que fn+1 ∈ an+1 , pero fn+1 (n) = 1 6= 0, con lo que fn+1 6∈ an . Esta cadena de
ideales es, por tanto, numerable y estrictamente creciente. Luego, C 0 (R) no verifica la CCA.
Por tanto C 0 (R) no es un anillo noetheriano y podemos concluir, por ejemplo, que en C 0 (R)
existen ideales que no son finitamente generados. Similares resultados son fáciles de obtener
para todos los anillos de la forma C k (R) para 1 ≤ k ≤ ∞.
Corolario 3.3.7. Asumiendo el Axioma de Elección Dependiente, todo anillo noetheriano

posee ideales que son elementos maximales del conjunto de ideales propios con la relación de
orden dada por la inclusión.
Demostración. Se trata de considerar el conjunto siguiente, formado por los ideales pro-
pios de un anillo noetheriano R:
I := {a ( R : a es ideal en R}.
Obviamente, (0) ∈ I 6= ∅. Por tanto, la afirmación ii) del Teorema de Noether nos permite
concluir que I posee algún elemento maximal.
Observación 3.3.8 (Ideales maximales). Nótese que los elementos maximales m a los que
hace referencia el anterior corolario, satisfacen las siguientes dos propiedades:
• m ( R es un ideal propio de R.
• m es maximal entre los ideales propios de R, es decir, dado a ( R un ideal propio de
R, si m ⊆ a, entonces m = a.
Este tipo de ideales se denominan ideales maximales de un anillo y volveremos sobre ellos en
la Sección 4.2 del Capı́tulo 4.
Corolario 3.3.9. Suponiendo el Axioma de Elección dependiente, todo dominio de ideales

principales que no sea cuerpo, posee elementos primos e irreducibles no nulos.
Demostración. Como R no es cuerpo, podemos considerar el conjunto de sus ideales
propios que es un conjunto no vacı́o:
S := {a : (0) $ a $ R}.
Por ser anillo noetheriano, dicho conjunto posee elemento maximal, usando el Corolario anterior.
Sea m un elemento maximal de S. COmo el anillo es principal, existe p ∈ R tal que m = (p).
Como m es propio y no es el ideal (0), p 6= 0 y p no es unidad en R. Finalmente, m es maximal
entre los ideales principales propios de R, luego p es irreducible y, por ser R dominio de ideales
principales, también es primo. .
Teorema 3.3.10 (Existencia de factorización en dominios de ideales principales).

Suponiendo el Axioma de Elección Dependiente, en dominios de ideales principales, todo ele-
mento es producto finito de irreducibles y/o unidades.
Demostración. Razonemos por reducción al absurdo. Supongamos que hay elementos
en R que no son producto finito de unidades e irreducibles. De momento, R no puede ser un
cuerpo porque en cuerpos todos los elementos son o primos (el elemento 0) o unidades (todo
elemento R \ {0}). Esto quiere decir que el siguiente conjunto es no vacı́o:
S := {a = (a) : a no es producto finito de irreducibles y/o unidades de R}.
Como R es noetheriano, S posee un elemento maximal m = (p) ∈ S. Veamos que p ha de ser
un elemento irreducible no nulo. Observemos, en primer lugar que:
• Se tiene p 6= 0, porque 0 es primo (e irreducible) y p no puede ser irreducible.
• El elemento p no es unidad en R porque p no es producto de unidades de R.
Es decir, tenemos (0) ( m = (p) ( R. Pero, además, p no es irreducible (erı́a un producto
finito de irreducibles). Por tanto, p es reducible. Por tanto, existen x ∈ R e y ∈ R tales que
p = xy con p - x y p - y. Esto significa que
m $ (x), m $ (y).
Además, ni x ni y pueden ser unidades en R (en otro caso, p dividirı́a al que no fuera unidad).
Por tanto, tenemos
m $ (x) $ R, m $ (y) $ R.
Por la maximalidad de m no puede ser que (x) ∈ S ni (y) ∈ S. Si alguno de ellos estuviera
en S estarı́amos en contradicción con la maximallidad de m. Pero si (x) 6∈ S, siendo un ideal
propio de R, no se cumple la propiedad que define S. Por tanto, x no cumple que no es un
producto finito de irreducibles y/o unidades de R. Es decir, x es producto finito de unidades e
3.4. DOMINIOS EUCLÍDEOS 147
irreducibles de R. Del mismo modo concluimos que y ha de ser un producto finito de unidades
e irreducibles de R. Pero, como p = xy concluirı́amos que p es también un producto finito de
unidades e irreducibles de R, con lo que m 6∈ S, llegando a contradicción con la hipótesis m ∈ S.
Por tanto, no pueden existir x, y ∈ R tales que p = xy con p - x y p - y. Luego p es irreducible
no trivial.
3.4. Dominios Euclı́deos

Si antes dimos un pequeño salto hacia arriba en términos de abstracción, el propósito ahora es
dar un paso hacia abajo en términos de abstracción: nos vamos a un ejemplo muy particular de
anillos principales. En este caso, la presencia de una cierta función (llamada función euclı́dea)
permite “medir” el número de pasos en algoritmos y el “tamaño” de cocientes y restos. Esto
nos acerca a los aspectos más algorı́tmicos asociados a la divisibilidad y, más adelante, a los
algoritmos de división y cálculo del máximo común divisor en Z y K[X] que ocuparán la sección
siguiente.
3.4.1. Dominios Euclı́deos: Elementos básicos. Se trata de un caso particular de
dominio de ideales principales.
Definición 60 (Función euclı́dea sobre un dominio). Sea R un dominio de integri-
dad. Una aplicación φ : R −→ Z se denomina función euclı́dea sobre R si satisface las dos
i) φ(ab) ≥ φ(a), ∀a, b ∈ R, b 6= 0.
ii) División Euclı́dea: Si a, b ∈ R con b 6= 0, entonces existen q, r ∈ R tales que
• a = qb + r,
• φ(r) < φ(b).
Llamaremos dominio euclı́deo a todo par (R, φ) donde R es dominio de integridad y φ es un
función euclı́dea sobre R. . También diremos que R admite una función φ euclı́dea.
Ejemplo 3.4.1. Se tienen los ejemplos siguientes:
i) El anillo de los enteros Z posee la función euclı́dea dada por el valor absoluto.
ii) El anillo de polinomios en una variable con coeficientes en un cuerpo posee como
función euclı́dea al grado deg (cf. Teorema 1.4.15 del Capı́tulo anterior) definido del
modo siguiente:
n, si f = an X n + · · · + a0 , an 6= 0

deg(f ) :=
−1, f =0
iii) El “resto” en dominios euclı́deos no es necesariamente único. Ası́, dados a, b ∈ Z,
b 6= 0 y dados q, r ∈ R tales que
a = qb + r, |r| ≤ |b| − 1,
El par (q, r) no es necesariamente único. Por ejemplo,
5 = 2 · 3 − 1 = 1 · 3 + 2,
y los pares (2, −1) y (1, 2) satisfacen la condición ii) de las funciones euclı́deas.
iv) El “resto” y el “cociente” sı́ son únicos en el caso de K[X], cuando K es un cuerpo.
De hecho, algunos autores (cf [Rha, 1962], [Jod, 1967]) han demostrado el siguiente
resultado que no reproduciremos aquı́:
Teorema 3.4.2. Sea (R, φ) un dominio euclı́deo. Supongamos que para cada par
a, b ∈ R, con b 6= 0, el resto y el cociente de la división euclı́dea está determinado de
manera unı́voca. Entonces, o bien R es un cuerpo o bien R = F [X], donde F es un
cuerpo.
v) En cualquier caso (sea o no único el resto) escribiremos rem(a, b) para denotar el
conjunto de todos los restos de la división eculı́dea de dos elementos a, b ∈ R, cuando
(R, ϕ) sea un dominio euclı́deo, poniendo especial atención a que este conjunto puede
tener más de un elemento.
Proposición 3.4.3. Si (R, φ) es un dominio euclı́deo, se verifican las propiedades siguientes:
i) Si b 6= 0, b ∈ R, entonces φ(b) ≥ φ(1).

ii) Más aún, para todo a ∈ R, a 6= 0, φ(a) > φ(0).
iii) Si (a) = (b), entonces φ(a) = φ(b), para cualesquiera a, b ∈ R.
iv) Si a | b y φ(a) = φ(b), entonces (a) = (b), para cualesquiera a, b ∈ R.
v) Un elemento a ∈ R es unidad (i.e. a ∈ R× ) si y solamente si φ(a) = φ(1).
Demostración. La propiedad i) es consecuencia inmediata de la primera propiedad que
ha de verificar una función euclı́dea, esto es, si b 6= 0, se tiene:
φ(b) = φ(b · 1) ≥ φ(1).
Sin embargo, la propiedad ii) es más fuerte por lo siguiente. Sea a ∈ R, a 6= 0. Apliquemos la
división euclı́dea y tendremos que existen q, r ∈ R tales que
0 = qa + r,
y φ(r) < φ(a). Supongamos que φ(a) ≤ φ(0). Entonces, φ(r) ≤ φ(a) − 1 < φ(0), con lo que
tendrı́amos que r 6= 0. Pero R es un dominio de integridad y tenemos que r = (−q) · a. Por
tanto, (−q) 6= 0 y, por la primera de las propiedades de las funciones euclı́deas, concluiremos
que
φ(r) = φ((−q)a) ≥ φ(a),
contradiciendo la hipótesis φ(r) < φ(a). La conclusión será, por tanto, que φ(a) > φ(0) si a 6= 0.
La propiedad iii) es casi evidente. Si alguno de los elementos a, b ∈ R fueran nulo, la propiedad
se sigue de modo evidente. Supongamos que ninguno de los dos es nulo (i.e. a 6= 0 y b 6= 0).
Entonces, (a) = (b) significa que podemos escibir a = ub y b = ra, para algunos valores u, r ∈ R,
Por tanto, de nuevo por la primera propiedad de las funciones euclı́deas, tenemos:
φ(a) = φ(u · b) ≥ φ(b), porque u 6= 0,
φ(b) = φ(r · a) ≥ φ(a), porque r 6= 0,
Para la propiedad iv), supongamos que a | b y φ(a) = φ(b). Supongamos que b 6= 0. En el
caso b = 0, concluirı́amos φ(a) = φ(b) = φ(0), por cuanto se tendrı́a a = 0 y la obvia igualdad
(a) = (b). Con la hipótesis b 6= 0, podemos escribir
a = qb + r,
con φ(r) < φ(b) = φ(a). Pero existe s ∈ R tal que b = sa, por lo que concluimos
a = qb + r = qsa + r =⇒ (1 − qs) · a = r.
Si (1 − qs) 6= 0, por la primera propiedad de las funciones euclı́deas, enonces,
φ(r) = φ((1 − qs) · a) ≥ φ(a) = φ(b) > φ(r).
Lo que nos lleva a contradicción. En conclusión, (1 − qs) = 0, por cuanto s es una unidad en
R y, por lo tanto, b = sa, s ∈ R× , lo que implica a = qb = s−1 b ∈ (b) y, por tanto, (a) ⊆ (b) y
tenemos la igualdad entre los dos ideales.
Para la propiedad v), tenemos que φ(a) ≥ φ(1) siempre, por la propiedad i). Si a ∈ R× es
unidad, entonces, sea s ∈ R× su inverso y tenemos as = 1. Obviamente, a 6= 0 y s 6= 0 porque
son unidades, luego
φ(1) = φ(a · s) ≥ φ(a).
Para la afirmación recı́proca, si φ(a) = φ(1), dado que 1 | a, usando la propiedad iv) nos lleva
a que (1) = (a) y, por tanto, a es una unidad en R× .
Teorema 3.4.4. Sea R un dominio de integridad. Si R posee alguna función euclı́dea definida
en él, entonces R es un dominio de ideales principales.
Demostración. Recordemos que todo subconjunto de Z acotado inferiormente posee
mı́nimo. El caso del ideal nulo (0) es obvio: es un ideal principal. Sea a un ideal de R,
a 6= (0), y consideremos el conjunto:
Sa := {φ(a) : a ∈ a, a 6= 0}.
Como φ(a) ≥ φ(0), para todo a ∈ R, a 6= 0, el conjunto Sa es un subconjunto de Z acotado
inferiormente. Por tanto, posee un mı́nimo. Sea n := min(Sa ) el mı́nimo de Sa .
Sea a ∈ a un elemento no nulo tal que φ(a) = n (existe porque n es un mı́nimo). Es claro
que (a) ⊆ a. Veamos que se verifica el recı́proco de esta inclusión. Sea b ∈ a otro elemento
cualquiera. Hagamos la división euclı́dea
b = qa + r, φ(r) < φ(a) = n.
Nótese que r ∈ a porque r = b + (−q)a ∈ a. Por tanto, si r 6= 0, φ(r) ∈ Sa . Pero φ(a) = n =
min(Sa ), luego no es posible que φ(r) ∈ Sa y la única posibilidad es que r = 0. En ese caso
tendremos que b = qa, luego a | b o, equivalentemente, b ∈ (a), con lo que habremos probado
la igualdad entre los ideales (a) y a.
Teorema 3.4.5 (Algoritmo de Euclides). Sea (R, φ) un dominio euclı́deo y sean a, b ∈ R

tales que φ(a) ≥ φ(b). Sea a = (a, b) el ideal que generan. Definamos la siguiente sucesión de
elementos de R:
r0 := a, r1 := b.
Para i ≥ 2, si ri−1 6 0, definamos ri como cualquier elemento que satisface:
=
ri ∈ rem(ri−2 , ri−1 ),
(i.e. ri es un resto euclı́deo de la división de ri−2 por ri−1 ). Si ri− = 0, definamos ri = 0. Se
tiene:
i) Para cada n ∈ N, a = (rn , rn+1 ). Es decir, el ideal a es invariante durante el proceso.
ii) Existe n ∈ N, tal que rn = 0 y rm ≥ 0 para cada m ≥ n.
iii) Sea m ∈ N dado mediante
m := max{n ∈ N : rn 6= 0}.
Entonces, rm := gcd(a, b).
Demostración. Veamos cada airmación:
• La afirmación i) dice que el ideal a no es modificado a lo largo del proceso, con lo que
se convierte en un invariante del algoritmo. Hagamos la prueba por inducción en n.
El caso n = 0 es obvio dado que a = (a, b) = (r0 , r1 ).
Supongamos ahora que el resultado es cierto para el casi n, es decir, sunpogamos
que a = (rn , rn+1 ). Ahora observamos que rn+2 ∈ rem(rn , rn+1 ). Por tanto, existe
qn+2 ∈ R tal que rn = qn+2 rn+1 + rn+2 . Pero esto implica inmediatamente que
rn ∈ (rn+1 , rn+2 ), con lo cual concluimos a ⊆ (rn+1 , rn+2 ). Pero esa misma identidad
nos indica que rn+2 = rn + (−qn+2 )rn+1 , con lo que rn+2 ∈ (rn , rn+1 ) = a y, por
tanto, (rn+1 , rn+2 ) ⊆ a.
• La propiedad ii) es inmediata por lo siguiente: tenemos una cadena descendente de
elementos de Z:
φ(r0 ) ≥ φ(r1 ) > φ(r2 ) > φ(r3 ) > · · · > φ(rj ).
Además, esta cadena descendente está inferiormente acotada porque φ(a) ≥ φ(0), para
todo a 6= 0. Entonces, ha de existir un k tal que rk = 0, como afirma la propiedad ii).
• La propiedad iii) es consecuencia inmediata de las dos anteriores. Dada la definición
de rm (que está bien definido por causa de ii)), y aplicando i) tendremos que rm+1 = 0
y
(a, b) = a = (rm , rm+1 ) = (rm , 0) = (rm ),
y se sigue que rm es el máximo común divisor de a y b por nuestra definición de
máximo común divisor en dominios de ideales principales.

Teorema 3.4.6 (Identidad de Bézout con cotas). Sea (R, φ) un dominio euclı́deo. Sean
a, b ∈ R dos elementos no nulos, y sea h su máximo común divisor.
i) Supongamos que la función euclı́dea φ verifica las propiedades siguientes:
(a) ∀a, b ∈ R, φ(a + b) ≤ φ(a) + φ(b),
(b) ∀a, b ∈ R, φ(ab) ≤ φ(a)φ(b),
(c) ∀a, b ∈ R, φ(ab) = φ(a)φ(b), ∀a, b ∈ R, ab 6= 0.
(d) φ(a) > 0, ∀a ∈ R, a 6= 0.

Entonces, existen x, y ∈ R tales que
h = xa + yb,
con
φ(x) ≤ φ(b), φ(y) ≤ φ(a).
ii) Si, en lugar de las propiedades anteriores, la función euclı́dea φ verifica las siguientes;
(a) ∀a, b ∈ R, φ(a + b) ≤ max{φ(a), φ(b)},
(b) ∀a, b ∈ R, φ(ab) ≤ φ(a) + φ(b),
(c) ∀a, b ∈ R, φ(ab) = φ(a) + φ(b), ∀a, b ∈ R, ab 6= 0.
(d) φ(a) > 0, ∀a ∈ R, a 6= 0.
Entonces, si a, b 6∈ R× (es decir, si ninguno de los dos es unidad) , existen x, y ∈ R
tales que
h = xa + yb,
con
φ(x) < φ(b), φ(y) < φ(a).
Demostración. Supongamos que h es el máximo común divisor de a y b. Entonces,
existen α, β ∈ R tales que
h = αa + βb.
Supongamos que φ(a) ≥ φ(b): Por ser dominio euclı́deo, existen q, x ∈ R tales que
α = qb + x, φ(x) < φ(b).
Entonces,
h = (qb + x)a + βb = xa + (β + qa)b.
Ahora, escribamos y = (β + qa) y tenemos φ(h) ≤ min{φ(a), φ(b)} por ser h | a y h | b. que
φ((β + qa))b) = φ(h − xa).
• En el caso i), el caso β +qa = 0 (o, equivalentemente, h = xa) es evidente y lo dejamos
para el lector. Supongamos queβ + qa 6= 0. Tendremos:
φ(y)φ(b) = φ((β + qa))φ(b) = φ((β + qa))b) ≤ φ(h) + φ(xa).
Luego
φ(y)φ(b) ≤ φ(h) + φ(x)φ(a) ≤ (1 + φ(x))φ(a).
Pero φ(x) ≤ φ(b) − 1 y φ(h) ≤ φ(b), por lo que tendremos:
φ(y)φ(b) ≤ φ(b) + (φ(b) − 1)φ(a) = φ(b)φ(a).
Si b 6= 0, claramente tendremos φ(b) 6= 0 y φ(y) ≤ φ(a).
• En el caso ii), si x 6= 0, tendremos
φ(y) + φ(b) = φ(yb) = φ((β + qa))b) ≤ max{φ(h), φ(xa)} = max{φ(h), φ(x) + φ(a)}.
Como h es un divisor de a, entonces φ(h) ≤ φ(a). De otro lado, como x 6= 0 φ(x) > 0
y φ(x) ∈ Z, Por tanto, φ(x) ≥ 1 y, en conclusión, φ(x) + φ(a) ≥ φ(a) ≥ φ(h). Es decir,
en este caso tendremos:
φ(y) + φ(b) ≤ max{φ(h), φ(x) + φ(a)} = φ(x) + φ(a).
φ(y) + φ(b) ≤ φ(x) + φ(a) ≤ φ(b) − 1 + φ(a) = (φ(a) − 1) + φ(b).
Concluimos que
φ(y) ≤ φ(a) − 1,
como pretendı́amos.
En el caso x = 0, tendremos que el máximo común divisor h de a y b ha de verificar
h = xa + yb = yb.
Por tanto, y es una unidad de anillo, φ(y) = φ(1) y φ(a) ≥ φ(y). Como a no es unidad,
se tiene φ(a) > φ(y) y φ(x) < φ(b) como pretendı́amos.

Los dos casos del Teorema anterior se corresponden con los casos básicos R = Z (caso (i)) y
R = K[X] (caso ii)). Nótese que el caso de K[X] hace pensar que el grado (deg) se comporta
como un logaritmo de un valor absoluto que, sin embargo, es el que aparece en el caso de Z.
Esto se expresa mediante los siguientes Corolarios:
Corolario 3.4.7 (Bézout con cotas en Z). Sean a, b ∈ Z dos enteros no nulos, y sea h su
máximo común divisor. Entonces, existen x, y ∈ R tales que
h = xa + yb,
con
|x| ≤ |b|, |y| ≤ |a|.
Demostración. Basta con observar que el valor absoluto | · | verifica las condiciones indi-
cadas en el Teorema anterior.
Corolario 3.4.8 (Bézout con cotas en K[X]). Sean f, g ∈ K[X] dos polinomios univariados
no nulos y no unidades (i.e. f, g 6∈ K), y sea h su máximo común divisor.
Entonces, existen α, β ∈ K[X] tales que
h = αf + βg,
con
deg(α) < deg(g), deg(β) < deg(f ).
Demostración. Simplemente recordar (K[X], deg) como dominio euclı́deo.
Observación 3.4.9. El algoritmo de Euclides no siempre es un algoritmo adecuado para el

cálculo de máximos comunes divisores. Distinguiremos dos casos: Z y K[X]. En el primer caso,
analizaremos el número de divisiones necesarias para calcular el gcd de dos números enteros y
veremos que el algoritmo de Eudlides es mucho más efciente que el mal hábito escrolar de usar
las factorizaciones en números primos. En el segundo caso, trataremos el caso de polinomios
univariados con técnicas de eliminación “à la Sylvester”.
3.4.2. Existencia de factorización en primos en dominios euclı́deos (Opcional).
En la Sección 3.3 anterior, hemos demostrado que todo elemento de un dominio de ideales
principales admite una factorización como producto de elementos primos. También hemos
visto que los dominios euclı́deos son dominios de ideales principales (ver Teorema 3.4.4), con
lo que podı́amos concluir que en los dominios euclı́deos todo elemento se factoriza en producto
finito de primos. Sin embargo, para probar el Teorema 3.3.10 sobre los dominios de ideales
principales, hemos usado el Axioma de Elección Dependiente. Para aquellos puristas que no
deseen admitir este axioma de la Teorı́a de Conjuntos, redemostramos el enunciado, sólo en el
caso de dominios euclı́deos, para lo cual basta con usar que el orden usual de los naturales es
un buen orden.
Teorema 3.4.10 (Existencia de factorización en dominios euclı́deos). Sea (R, φ) un do-
minio euclı́deo. Entonces, todo elemento a ∈ R es producto finito de elementos primos (o irre-
ducibles) y unidades en R. Es decir, para cada a ∈ R, existen u ∈ R× y existen {p1 , . . . , pn } ⊆ R
un conjunto finito de primos tales que
a = up1 · · · pn .
Demostración. Como los dominios euclı́deos son dominios de ideales principales, los el-
ementos son primos si y solamente si con irreducibles. Si a ∈ R× es unidad, ya tenemos la
prueba. Si a ∈ R no es unidad, consideremos el siguiente conjunto.
Sa := {φ(p) : p no es producto finito de irreducibles y unidades, (a) ⊆ (p)} ⊆ Z.
Supongamos que a no es producto de irreducibles y unidades. Entonces, φ(a) ∈ Sa 6= ∅ es
un conjunto no vacı́o de números enteros. Además está acotado inferiormente por φ(1). Todo
conjunto no vacı́o y acotado inferiormente de enteros posee elemento minimal. Por tanto, Sa
posee un mı́nimo.
Sea φ(p) = min(Sa ) ese mı́nimo de tal modo que p no es producto de irreducibles y unidades.
Luego p no es unidad, ni tampoco es irreducible. Pero esto significa que existen x, y ∈ R tales
que:
• p = xy
• x 6∈ R× , y 6∈ R× ,
• x 6∼ p, y 6∼ p.
Esto significa que los siguientes contenidos son estrictos:
(p) $ (x) $ R, (p) $ (y) $ R.
En particular, φ(p) > φ(x) y φ(p) > φ(y) como consecuencia de esos contenidos estrictos. Luego
φ(x) 6∈ Sa , φ(y) 6∈ Sa .
Además, se tiene
(a) ⊆ (x), (a) ⊆ (y).
Por tanto, de las dos condiciones que definen Sa , φ(x) no puede satisfacer la primera de esas
condiciones “x no es producto finito de irreducibles y unidades”. Luego x es producto finito de
unidades e irreducibles. Y lo mismo pasa con y. Es decir,
x = uq1 q2 · · · qn , y = vt1 t2 · · · tm ,
×
donde u, v ∈ R y {q1 , q2 , . . . , qn , t1 , t2 , . . . , tm } son irreducibles en R. Pero, entonces, como
p = xy concluimos:
p = (uv)q1 q2 · · · qn t1 t2 · · · tm ,
y habremos concluido que p es producto finito de irreducibles y unidades. Luego la única opción
es que Sa = ∅ y, por tanto, a debe ser un producto finito de unidades e irreducibles.
Corolario 3.4.11. Si R es un dominio euclı́deo y no es cuerpo, entonces existen elementos

irreducible no nulos en R, es decir,
{(p) : p es primo en R} =
6 ∅.
Demostración. Basta con observar que si R no es un cuerpo, debe existir un elemento
a ∈ R \ R× y a 6= 0. Entonces a es producto finito de unidades e irreducibles. Pero como no es
unidad, debe haber algún divisor irreducible de a y como a 6= 0 debe haber algún irreducible
no nulo que es divisor de a, luego hay algún irreducible (o primo) no nulo en R.

Dedekind-Hasse (Opcional). Hemos visto que los dominios euclı́deos son dominios de ide-
ales principales. Es conveniente observar que este contenido es estricto. Los ejemplos se conocen
desde [Mtz, 1949], aquı́ usaremos la prueba que se exhiben en [Wls, 1973], basada en el Cri-
terio de Dedekind-Hasse, para probar que nuestro ejemplo es un dominio de ideales principales.
Para probar que no es euclı́deo, usaremos la no existencia de divisor lateral universal descrita
en el Problema 131. Veámos el Ejemplo: Consideremos el anillo
√
1 + −19
R := Z .
2
Lema 3.4.12. El anillo √
1+ −19
R=Z ,
2
no es dominio euclı́deo.
Demostración. Comencemos recordando el conjunto de las unidades de este anillo (que
hemos estudiado en el Problema 46) donde vimos la siguiente igualdad:
√ ×
1 + −19
Z = {±1}.
2
Seguidamente recordemos el Problema 131. En él vimos que si un aillo no posee divisores
laterales universales, entonces no puede ser dominio euclı́deo para ninguna función euclı́dea
posible. Supongamos que tal divisor lateral universal existe y sea
√ √
1 + −19 1 + −19
u := a + b ∈Z ,
2 2
√
−19
con a, b ∈ Z ese elemento. Entonces, dado el elemento 2 ∈ Z[ 1+ 2 ], u debe dividir a alguna
de las tres cantidades siguientes:
1 = 2 − 1, 2 = 2 − 0, 3 := 2 + (−1).
Como los divisores laterales universales no son unidades, podemos descartar que u | 1 y nos
quedamos con las otras dos posibilidades.
Definamos la función
h √ i
Φ√−19 : Z 1+ 2−19 −→ Z+
√
2
y 2
1+ −19
7−→ x + 2 − −19y

x+y 2 .

2
Nótese que se trata de multiplicar por el conjugado complejo y, por tanto, da lugar al módulo.
Esto es
√ √ √
√
1 + −19 1 + −19 1 + −19
Φ −19 x + y = x+y x+y ,
2 2 2
donde · significa conjugado complejo. Por tanto, Φ√−19 calcula el valor absoluto (el módulo)
del número complejo al que se le aplica y, en particular, es un entero positivo. Más aún, nótese
que
√
y 2 −19y 2

1 + −19
= x2 + xy + 5y 2 ∈ Z,

Φ√−19 x + y = x + −
2 2 2
es un número entero siempre que x e y sean enteros. Usaremos esta función y supongamos que
u | 2 o u | 3.
• Supongamos la primera opción: u | 2. Entonces, han de existir x, y ∈ Z tales que
√ √ √
1 + −19 1 + −19 1 + −19
u x+y = a+b x+y = 2.
2 2 2
pero, entonces,
√ √
1 + −19 1 + −19
Φ√−19 a + b Φ√−19 x + y = Φ√−19 (2) = 4.
2 2
Por tanto, el siguiente número entero es un divisor entero positivo de 4:
√
1 + −19
√
Φ −19 a + b = a2 + ab + 5b2 .
2
Pero eso sólo es posible si b = 0 (porque si b es un entero no nulo, a2 +ab+5b2 ≥ 5 > 4).
En el caso b = 0, necesaiamente u = a ∈ {±2}. Pero, si u es un elemento de
ese conjunto, por ser divisor lateral universal, debe ser divisor de alguno de los tres
elementos siguientes:
√ √ √
1 + −19 1 + −19 1 + −19
− 1, , + 1,
2 2 2
lo que no es posible en ningún caso.
• Supongamos la segunda opción: u | 3. Entonces, han de existir enteros x, y ∈ Z tales
que se da la siguiente igualdad:
√ √
1 + −19 1 + −19
a+b x+y = 3.
2 2
De nuevo, usando Φ√−19 , tendremos que
a2 + ab + 5b2 x2 + xy + 5y 2 = 9.

Distingamos dos casos:

– Si b 6= 0, entonces, a2 + ab + 5b2 > 3, con lo que, forzosamente, a2 + ab + 5b2 =
9 y, x2 + xy + 5y 2 = 1. Pero
√ √ √
1 + −19 1 − −19 1 + −19
1− = ∈Z .
2 2 2
Por tanto, tendremos

√ √
1 + −19 1 − −19
1 = x2 + xy + 5y 2 = x + y

x+y ,
2 2
y, en consecuencia,
√ √ ×
1 + −19 1 + −19
x+y ∈ Z = {±1}.
2 2
Por tanto, u ∈ {±3} y u debe ser un divisor lateral universal, luego debe dividir,
como en el caso precedente, a alguno de los siguientes elementos:
√ √ √
1 + −19 1 + −19 1 + −19
− 1, , + 1,
2 2 2
lo que no es posible en ningún caso con u ∈ {±3}.
– En el caso b = 0, u = a será un divisor entero de 3 y no es unidad, con lo que
u ∈ {±3} y tenemos la misma dificultad que en el caso anterior.
En conclusión, el anillo √

1 + −19
Z
2
no posee divisores laterales universales, con lo que no es dominio euclı́deo.
Proposición 3.4.13 (Criterio de Dedekind-Hasse). Sea R un anillo cualquiera decimos
que R verifica el criterio de Dedekind-Hasse si verifica lo siguiente:
i) Existe |·| : R −→ N una función definida positiva (i.e. [|a| ≥ 0, ∀a ∈ R], y [|a| = 0 ⇐⇒ a = 0]).
ii) La función | · | satisface:
Para cualesquiera x, y ∈ R no nulos o bien y | x, o bien existen u, v ∈ R tales que
0 < |ux − vy| < |y|.
Si R es un anillo que satisface el Crieterio de Dedekind-Hasse, entonces R un dominio de
ideales principales.
Demostración. Es bastante evidente. Consideremos a un ideal de R, supongamos que
a 6= (0), que ya serı́a un ideal principal, y consideremos el siguiente conjunto no vacı́o de
números naturales:
N := {|a| ∈ N : a ∈ a, a 6= 0}.
Este conjunto posee un mı́nimo, |y| ∈ N , con y ∈ a, y 6= 0. Por tanto, el ideal b = (y) es
principal y b ⊆ a. Ahora consideremos x ∈ a un elemento cualquiera no nulo. Entonces, por
la condición verificada por | · |, o bien y | x (en cuyo caso x ∈ b = (y), o bien existen u, v ∈ R
tales que
0 < |xu − yv| < |y|.
Pero, en este segundo caso, como x, y ∈ a, entonces, ux, vy ∈ a (porque es ideal) y, finalmente,
ux−vy ∈ a. Pero la desigualdad anterior nos dice que ux−vy 6= 0 y contradice la minimalidad de
|y| en N . Por tanto, no se puede dar la segunda condición para ningún x ∈ a y, en consecuencia,
y | x, para todo x ∈ a, con lo que habremos probado la igualdad a = b.
Lema 3.4.14. El anillo √
1+ −19
R=Z
2
verifica el criterio de Dedekind-Hasse para el cuadrado del valor absoluto complejo.
Demostración. Recuérdese que el cuadrado del valor absoluto complejo es la función
Φ√−19 usada en la demostración del Lema 3.4.12 anterior. Por simplicidad de la notación
escribiremos Φ en lugar de Φ√−19 .
Consideremos x, y ∈ R dos elementos no nulos tales que y - x. Entonces, queremos probar que
existen u, v ∈ R tales que
0 < Φ(ux − vy) < Φ(y).
Pero, nótese que Φ(rs) = Φ(r)Φ(s) (es el cuadrado de la norma usual en C), luego esta última
desigualdad es equivalente a:

x
0 < Φ(u − v) < 1.
y
Como y - x, tendremos que existen a, b, c ∈ Z enteros, con c > 0 y gcd(a, b, c) = 1 tales que
√
x a + b −19
= .
y c
Distingamos varios casos:
• Supongamos c ≥ 5. Como gcd(a, b, c) = 1, existen d, e, f ∈ Z tales que
ae + bd + cf = 1.
√
Elijamos u = d + e −19 y el producto u xy tiene la forma siguiente:
√ √
√

x a + b −19 (ad − 19be) + (ae + bd) −19
u = d + e −19 = .
y c c
Luego, como ae + bd = 1 − cf , tendremos
√
√

x (ad − 19be) −19
u = + − f −19.
y c c
Como (ad − 19be), c ∈ Z, podemos aplicar el algoritmo euclı́deo en Z (modificado con
la condición descrita en el Problema 84 y tendremos:
(ad − 19be) = qc + r,
con 0 ≤ |r| ≤ 2c . Por tanto, queda:
√
√

x r −19
u =q+ + − f −19.
y c c
Esto nos lleva a
√
√

x r + −19
u − (q − f −19) = .
y c
√
Poniendo v = (q − f −19), tendremos:
√
x r + −19
u −v = ,
y c
con lo que queda solemente por probar que si c > 5, se tiene
√
r + −19 (r2 + 19) r2 19 1 19
Φ( )= 2
≤ 2 + < + < 1.
c c c 36 4 36
En el caso c = 5, tendremos r ≤ 2 y, por tanto,
√
r + −19 r2 19 4 19
Φ( )≤ 2 + < + < 1.
c c 25 25 25
Quedan sólo los caso c = 2, 3, 4. Veámoslos separamente.
• Si c = 2. Como gcd(a, b, c) = gdc(a, b, 2) = 1, es claro que a y b tienen distinta paridad
(ni ambos son pares, ni ambos son impares, simultáneamente), luego a − b − 1 ∈ 2Z.
Elijamos v dado por:
√ √ √
(a − 1) + b −19 (a − b − 1) 1 + −19 1 + −19
v= = +b ∈Z .
2 2 2 2
Elijamos u = 1 y tenemos

x 1
Φ(u − v) = Φ( ) < 1.
y 2
• Si c = 3. Como gcd(a, b, c) = gcd(a, b, 3) = 1 tendremos que

a2 + 19b2 = a2 + b2 6= 0 mod 3,
2 2
porque 3 es primo en Z[i] y si 3 | (a + b ), entonces 3 | (a + bi) o 3 | (a − bi). En
cualquiera de las dos opciones, 3 deberı́a ser divisor de a y b simultáneamente, lo que
contradice el hecho gcd(a, b, 3) = 1.
Aplicando división euclı́dea, existirán q, r ∈ N, con r 6= 0 y r < 3 tal que
a2 + 19b2 = q3 + r.
√
Elijamos u = a − b 19 y v = q ∈ Z, tendremos
(a2 + 19b2 ) (a2 + 19b2 ) − 3q

x r
Φ(u − v) = Φ( − q) = Φ( ) = Φ( ) < 1.
y 3 3 3
• Si c = 4. Como gcd(a, b, c) = gcd(a, b, 4) = 1, entonces, a y b no poseen la misma
paridad. En particular, a + b y a − b son ambos impares y no divisibles por 2. Ahora,
obsérves que
a2 + 19b2 = a2 .b2 6= 0 mod 4,
porque 2 - (a + b) y 2 - (a − b). Repetimos el mismo argumento que en el caso 3.
Hallamos cociente y resto de la división de a2 + b2 19 por 4:
a2 + 19b2 = q4 + r,
√
con u = a − b −19 y v = q, tendremos que

x
Φ(u − v) < 1.
y

Teorema 3.4.15 (Un ejemplo de un DIP que no es eculı́deo). El anillo
√
1 + −19
R=Z
2
es un dominio de ideales principales que no es dominio euclı́deo.
Demostración. El Lema 3.4.12 nos muestra que no es un dominio euclı́deo y el Lema
3.4.14 prueba que verifica la condición de Dedekind-Hasse y es, por tanto, un dominio de
ideales principales.
3.4.4. Ejercicios y problemas de las secciones 3.2, 3.3 y 3.4.
Problema 118. Sea p ∈ N un √ primo. Sea m ∈ Z √ un entero con m ≤ −(p + 1). Prueba que,
entonces, p es irreducible en Z [ m]. Discute si Z[ −5] es dominio√de ideales principales. Si
la respuesta es afirmativa, ¿Será cierto que toda factorización en Z[ −5] es única?.
Problema 119. Sea p ∈ N un primo. Sea mh ∈ Z uni entero con m ≡ 1 mod 4 y m ≤ −(4p+1).
√
Prueba que, entonces, p es irreducible en Z 1+2 m .
Problema 120. Sea m ∈ Z un entero positivo que no es un cuadrado perfecto. Sea α =

√ √ √ ×
a + b m ∈ Z[ m]. Prueba que si a2 − mb2 ∈ {±1}, entonces α ∈ (Z[ m]) .
Problema 121. Como en el problema previo, sea m ∈ Z √un entero √
positivo que no es un
1+ m 1+ m
cuadrado perfecto y tal que m = 1 mod 4. Sea α = a + b 2 ∈ Z[ 2 ]. Prueba que si se
verifica
2 1−m 2
a + ab + b ∈ {±1},
4
√ ×
entonces α ∈ Z[ 1+2 m ] .
Problema 122. Con las notaciones habituales, hay que realizar las siguientes tareas:
• Prueba que el ideal (1 − 3i, 3 − i) es un ideal principal
√ en el anillo de Gauss Z[i].
• Prueba las siguientes
√ relaciones
√ entre ideales de Z[ −5]:
i) (2, 1 + √−5) = (2, 1 − √−5),
ii) (3, 1 + −5) 6= (3, 1 − −5),
√ √
iii) (2, 1 + √−5) 6= (3, 1 + √−5),
iv) (2, 1 + −5) 6= (3, 1 − −5).
Problema 123. Sea R un dominio de integridad. Sean a, b, c ∈ R tales que (a, c) = R. Prueba
que (a, bc) = (a, b).
√ √ √
Problema 124. Prueba que 17 − 3 3 y 83 + 47 3 son asociados en Z[ 3].
√ √
Problema 125. Expresar 2 + 8 −5 como producto de irreducibles √ en Z[ −5]. ¿Es posible
hallar más de una expresión?. Intentar lo mismo con 6. ¿Es Z[ −5] dominio de factorización
única?, ¿será un dominio de ideales principales?.
√ √
Problema
√ 126. Prueba que 10 no es primo en Z[ 10] y probar que sı́ es irreducible. Concluir
que Z[ 10] no es un dominio de ideales principales.
Problema 127. Sea r ∈ Z \ {−2, 0} un entero y consideremos el polinomio:
f (X) := X 3 + rX + 1.
Sea R el anillo cociente Z[X]/(f ). Prueba que R es un dominio de integridad. Sea θ := X + (f )
la clase definida por el elemento X ∈ Z[X]. Prueba que θ ∈ R× .
Problema 128. Sea m ∈ Z un entero sin factores primos múltiples. Definamos la función:
√
φm : Q[ √ m] −→ Q,
a + b m 7−→ |a2 − mb2 |.
Nótese que √ √ √
φm (a + b m) = |(a + b m)(a − b m)|.
Prueba que se verifican las siguientes propiedades:
√
i) φm (Z[ m] ⊆ N,
ii) φm (x) = 0√⇐⇒ x = 0,
iii) ∀x, y ∈ Z[ m], φm (xy) = φm √(x)φm (y),
iv) φm (xy) ≥ φm (x), ∀x, y ∈ Z[ m], y 6= 0.
√ √
Problema 129. Sea φm y Z[ m] como en el problema anterior. Prueba que (Z[ m], φm ) es
un dominio euclı́deo si y solamente si se verifica la siguiente propiedad:
√ √
∀x, y ∈ Q, ∃a, b ∈ Z, tales que φm (x + y m) − (a + b m) < 1
Problema
√ 130. Prueba que si m ∈ Z es un entero negativo sin factores múltiples, entonces
(Z[ m], φm ) es dominio euclı́deo si y solamente si m ∈ {−2, −1}.
Problema 131 (Divisor Lateral Universal). Sea R un dominio de integridad que no es
cuerpo. Un elemento u ∈ R que no está en R× ∪ {0} se denomina divisor lateral universal en
R si verifica:
∀x ∈ R, ∃z ∈ R× ∪ {0}, tal que u | x − z.
Se pide probar las afirmaciones siguientes :
i) Si (R, φ) es un dominio euclı́deo, entonces posee divisor lateral universal. (Pista:
Elegir un elemento u ∈ R que minimice {φ(x) : x ∈ R, x 6∈ R× ∪ {0}}).
m es un entero sin factores múltiples, tal que m = 2, 3 mod 4 y m < −2, entonces
ii) Si √
Z[ m] no posee divisores√laterales universales y, en consecuencia, no existe ninguna
función euclı́dea sobre Z[ m]. (Pista: si hubiera divisor universal lateral,√entonces
tiene que ser divisor de alguno de los elementos 2 − 1, 2 + 0, 2 + 1 en Z[ m]. Los
√ {±2,√±3}.√ Pero ninguno de esos 4 elementos
únicos divisores laterales posible serán
divide a ninguno de los elementos m − 1, m, m + 1.)
Problema 132. Demuestra que si K es un cuerpo, el anillo de series de potencias formales
en una variable K[[X]] verifica las siguientes propiedades:
i) Los ideales de K[[X]] no nulos son de la forma (X k ), con k ∈ N ( Hint: Usa el orden
en cero discutido en el Problema 93).
ii) Concluye que K[[X]] es un dominio de ideales principales y un anillo noetheriano.
iii) Prueba que su único ideal maximal es el ideal m = (X).
iv) Describe la factoriación en primos de cualquier elemento de K[[X]].
v) ¿Admite K[[X]] una función euclı́dea?.
3.4.4.1. Problemas sobre el Lema de Dickson. En esta Subsección encadenaremos

tres problemas que demuestran una serie de resultados clásicos. De hecho, probaremos que si
K es un cuerpo, entonces el anillo de polinomios K[X1 , . . . , Xn ] satisface la propiedad descrita
en el Teorema 3.3.2: todo ideal de K[X1 , . . . , Xn ] son finitamente generados. Comenzaremos
con un sencillo resultado combinatorio sobre el monoide conmutativo (Nn , +) conocido como
Lema de Dickson (cf. [Dix, 1913]), aunque parece que también era conocido por P. Gourdan.
Aplicaremos el Lema de Dickson para probar la existencia de bases estándar (o de Gröbner) y,
al final, concluiremos el resultado buscado conocido como Hilbert Basissatz para K[X1 , . . . , Xn ].
Recomendamos leer sobre órdenes monomiales, División de Hironaka y los problemas descritos
en la Subsección 1.4.4.2.
Problema 133 (Lema de Dickson). Consideremos el monoide (Nn , +) y consideremos la

relación de orden siguiente:
Dados α = (α1 , . . . , αn ), β = (β1 , . . . , βn ) ∈ Nn , diremos que α es menor que β con respecto al
Orden de Dickson si se satisface
∃ γ ∈ Nn , α + γ = β.
Escribiremos α β para indicar esa relación. Se pide probar:
i) En el caso n = 1 el orden es el orden usual en N.
ii) La relación es una relación de orden sobre Nn . Discutir también si es un orden
monomial (en el sentido de los discutido en la Subsección 1.4.4.2, Problema 67).
iii) Si ≤ es un orden monomial en Nn , para cada α, β ∈ Nn , si α β, entonces α ≤ β.
En otras palabras, si α es menor que β para el Orden de Dickson, entonces también
sucede que α es menor que β para cualquier orden monomial en Nn .
iv) Para cada α = (α1 , . . . , αn ) ∈ Nn , denotemos por
X α := X1α1 · · · Xnαn ∈ K[X1 , . . . , Xn ],
el monomio cuyos exponentes vienen dados por las coordenadas de α, siendo K un
cuerpo cualquiera. Entonces, para cada α, β ∈ Nn se tiene que
α β ⇐⇒ X α | X β ,
donde | significa “divide” en K[X1 , . . . , Xn ].
v) Lema de Dickson: Con las notaciones predentes, todos subconjunto no vacı́o S ⊆ Nn
posee un número finito de elementos minimales para el orden . ( Hint: Esta es,
obviamente, la parte más delicada del Problema. Para demostrarlo conviene hacerlo
por inducción en n. Para el caso n = 1 es sencillo de verificar por i). Para n ≥ 2,
se toma la proyección π : Nn −→ Nn−1 . Se considera la proyección π(S) ⊆ Nn−1 que,
por hipótesis inductiva, tiene un número finito de elementos minimales para sobre
Nn−1 . Ahora basta con analizar las imágenes inversas π −1 ({x}) para cada minimal x
de S.)
Obsérvese que el Lema de Dickson sirve para , aunque no sea un orden monomial para n ≥ 2,
pero será usado para órdenes monomiales que son buen orden en los problemas que siguen,
Problema 134 (Existencia de Bases de Estándar (o de Gröbner)). Probaremos que los
ideales en K[X1 , . . . , Xn ] posee sistema generadores finitos especiales, asociados a los órdenes
monomiales dados. Para probarlo, comencemos definiendo los conjuntos siguientes (ver también
Subsección 1.4.4.2 y Problema 68:
• Para cada α ∈ Nn , definamos su escalón E(α) mediante:
E(α) := α + Nn = {α + β : β ∈ Nn }.
• Dado un monomio X α ∈ K[X1 , . . . , Xn ] denotemos su exponente mediante:
exp(X α ) = α ∈ Nn .
• Sea ≤ un orden monomial en Nn . Para cada polinomio f ∈ K[X1 , . . . , Xn ], supong-
amos que el término director LT (f ) de f con respecto al orden monomial ≤ es
LT (f ) := aX α , llamaremos exponente monomial de f con respecto al orden monomial
≤ sobre Nn a
exp≤ (f ) := α ∈ Nn .
3.5. EFICIENCIA Y ALGORITMO DE EUCLIDES 159
• Dado un ideal a ⊆ K[X1 , . . . , Xn ] llamaremos conjuno de exponentes monomiales del

ideal a con respecto al orden monomial ≤ en Nn al conjunto:
exp≤ (a) := {exp≤ (f ) : f ∈ a}.
Con estas notaciones, se pide probar lo siguiente:
i) Para cada α ∈ exp≤ (a), se tiene que:
E(α) ⊆ exp≤ (a).
n
ii) Sean α1 , . . . , αs ∈ N los elementos minimales de exp≤ (a) para el orden de Dickson
(como en el Problema precedente). Entonces,
s
[
exp≤ (a) = E(αi ).
i=1
( Hint: El contenido ⊇ es obvio. Para el otro contenido, probar que si µ ∈ exp≤ (a)
entonces ha de existir αi tal que µ ∈ E(αi ).)
iii) Con las notaciones precedentes, sean α1 , . . . , αs ∈ exp≤ (a) los elementos minimales
de exp≤ (a) para el orden de Dickson . Sean f1 , . . . , fs ∈ a elementos en el ideal tales
que
exp≤ (fi ) = αi , 1 ≤ i ≤ s.
Entonces
a = (f1 , . . . , fs ).
( Hint: De nuevo, ⊇ es obvio. Para el otro contenido usar la División de Hironaka
descrita en el Problema 68.)
Los polinomios {f1 , . . . , fs } ⊆ a que satisfacen las propiedades descritas en el apartado iii)
anterior se denominan Base de Gröbner del ideal a.
3.4.4.2. Basissatz de Hilbert en K[X1 , . . . , Xn ]. Para el siguiente problema úsense los
Problemas de la Subsección 3.4.4.1 y, muy especialmente, el Problema 134.
Problema 135 (Hilbert Basissatz para K[X1 , . . . , Xn ]). Se trata de probar la siguiente
afirmación:
Si K es un cuerpo, todo ideal a de K[X1 , . . . , Xn ] es finitamente generado y, por tanto,
K[X1 , . . . , Xn ] es un anillo noetheriano (cf. Definición 59).
3.5. Sobre la eficiencia del Algoritmo de Euclides en Z

3.5.1. Divisiones del algoritmo de Euclides en Z.
Definición 61 (Números de Fibonacci). Se define la sucesión denúmeros de Fibonacci
{Fn : n ∈ N} ⊆ Z como la sucesión dada mediante:
[F0 = 0], [F1 = 1], [∀n ∈ N, n ≥ 2, Fn = Fn−1 + Fn−2 ].
Proposición 3.5.1 (Fórmula de de Moivre-Binet). La sucesión de Fibonacci {Fn : n ∈ N}
satisface:
ϕn − ψ n
(3.5.1) Fn := √ ,
5
donde √ √
1+ 5 1− 5
ϕ := , ψ := .
2 2
Demostración. Consideremos la ecuación con coeficientes en Z siguiente:
X 2 − X − 1 = 0.
Las soluciones de esta ecuación son dadas por:
√ ! √ !
2 1+ 5 1− 5
X −X −1= X − X− = (X − ϕ)(X − ψ).
2 2
Nótese que multiplicando esta ecuación por potencias de X, transformamos la ecuación inicial
en
X n−2 (X 2 − X − 1) = X n − X n−1 − X n−2 .
Como ϕ y ψ son ceros de X 2 − X − 1 también lo serán de estas ecuaciones, con lo que podemos
concluir:
(3.5.2) ϕn − ϕn−1 − ϕn−2 = 0, ψ n − ψ n−1 − ψ n−2 = 0.
Ahora bien, para n = 0 y para n = 1 la identidad 3.5.1 se satisface:
ϕ0 − ψ 0 1−1
0 = F0 = √ = √ ,
5 5
√
1+ 5
√
1− 5
√
5
√
ϕ1 − ψ 1 2 − 2 2 2 5
F1 = √ = √ = √ = √ = 1.
5 5 5 5
Para n ≥ 1 tendemos, aplicando la hipótesis inductiva:
ϕn−1 − ψ n−1 ϕn−2 − ψ n−2 ϕn−1 + ϕn−2 ψ n−1 + ψ n−2
Fn = Fn−1 + Fn−2 = √ + √ = √ − √ .
5 5 5 5
Usando las identidades de 3.5.2 concluimos:
ϕn−1 + ϕn−2 ψ n−1 + ψ n−2 ϕn ψn ϕn − ψ n
Fn = √ − √ =√ −√ = √ .
5 5 5 5 5

Corolario 3.5.2. Con las anteriores notaciones:

ϕn 1
Fn = √ + ,
5 2
donde b·c es la función “parte entera”.
Demostración. Baste con observar que
ψn 1
|√ | < .
5 2

EL siguiente resultado es un histórico debido a G. Lamé (cf. [Lm, 1844]) y conocido desde
1844.
Teorema 3.5.3 (Lamé, 1844). Sean a > b > 0 dos números enteros positivos, supongamos
que el algoritmo de Euclides, aplicado a a y b realiza n divisiones. Entonces,
Fn+1 ≤ a, Fn ≤ b.
Demostración. Comencemos considerando la sucesión de divisiones realizadas por el al-
goritmo de Euclides:


 r0 = a,



 r1 = b,


 r0 = q1 r1 + r2 , 0 ≤ r2 ≤ r1 − 1,
.. ..


(3.5.3) . .
r = qi−1 ri−1 + ri , 0 ≤ ri ≤ ri−1 − 1,

i−2




 .. ..
. .




rn−1 = qn rn + rn+1 , rn+1 = 0.

En la que se hacen n divisiones. Podemos revisar esta secuencia de divisiones, para hacer alguna
observación.
Es claro que se tiene:
r0 > r1 > r2 > r3 > · · · > rn−1 > rn > rn+1 = 0.
Es una cadena estrictamente decreciente y, en particular, rn 6= 0 porque, en otro caso, habrı́amos
hecho n − 1 divisiones. Pero, además, por ser decreciente, qi 6= 0 para todo i. Y es que si qi = 0
para algún i, tendrı́amos:
ri−1 = 0ri + ri+1 = ri+1 , 0 ≤ ri+1 < ri < ri−1 ,
lo que nos llevarı́a a contradicción. En particular, tenemos qi ≥ 1 para todo i.
3.5. EFICIENCIA Y ALGORITMO DE EUCLIDES 161
Si comenzásemos por debajo, tendrı́amos que rn+1 = 0, pero rn 6= 0, luego:

rn+1 = 0 = F0
rn ≥ 1 = F1 .
Además, cada qi ≥ 1, luego
rn−1 = qn rn + rn+1 ≥ rn + rn+1 ≥ F0 + F1 = F2 .
Procediento inductivamente, tendremos, por ser qi ≥ 1:

 rn−2 = qn−1 rn−1 + rn ≥ rn−1 + rn ≥ F2 + F1 = F3 ,
..



.




ri−2 = qi−1 ri−1 + ri ≥ ri−1 + ri ≥ Fn−i+2 + Fn−i+1 = Fn−(i−2)+1 ,

(3.5.4) ..
.




r1 = q2 r2 + r3 ≥ r2 + r3 ≥ Fn−1 + Fn−2 = Fn ,




r0 = q1 r1 + r2 ≥ r1 + r2 ≥ Fn−1 + Fn = Fn+1 .

En conclusión, hemos probado que

a = r0 ≥ Fn+1 , b = r1 ≥ Fn .

Definición 62 (Talla de un número natural). Dados dos números naturales a, b ∈ N,

se llama talla de a en base b al número de dı́gitos necesarios para escribir a en base b y lo
denotaremos por `b (a). Es decir el número k ∈ N de elementos a0 , a1 , . . . , ak ∈ {0, 1, . . . , b − 1},
tales que
a := a0 + a1 b + · · · + ak bk .
Obsévese que se tiene que
blogb (a)c ≤ `b (a) ≤ blogb (a)c + 1,
En el caso b = 2, la cantidad `(a) := `2 (a) se denomina altura logarı́mica o talla bit del número
natural a ∈ N.
Corolario 3.5.4. Dados dos números enteros a, b ∈ Z, el número de divisiones necesario para
hallar el máximo común divisor de ambos está acotado linealmente por el número de dı́gitos
necesarios para escribir ambos números. Es decir, el número n de divisiones está acotado por
max{logc (|a|), logc (|b|)} + logc ( ϕ5 )
n≤ .
logc (ϕ)
donde logc es el logaritmo en base c.
Demostración. Si se hacen n divisiones, tenemos que Fn+1 ≤ max{|a|, |b|}. Para n ≥ 0,
se tiene que
ϕn+1
an+1 := √ ≥ Fn+1 ≥ F1 = 1.
5
Como an+1 ≥ 1 se tiene:
ϕn+1 1 ϕn+1 1 1 1 1 ϕn+1 ϕn+1
Fn+1 = b √ + c ≥ √ − = an+1 − ≥ √ an+1 = √ √ = .
5 2 5 2 2 5 5 5 5
Tomando logaritmos tenemos
(n + 1) logc (ϕ) − logc (5) ≤ log(Fn+1 ) ≤ max{logc (|a|), logc (|b|)},
Concluimos
1
(n + 1) ≤ (max{logc (|a|), logc (|b|)} + logc (5)) .
logc (ϕ)
Y, por tanto, tenemos
max{logc (|a|), logc (|b|)} + logc (5)
n≤ − 1.
logc (ϕ)
max{logc (|a|), logc (|b|)} + logc (5) − logc (ϕ) max{logc (|a|), logc (|b|)} + logc ( ϕ5 )
n≤ = .
logc (ϕ) logc (ϕ)

3.6. Eliminación univariada clásica: la Matriz de Sylvester

Una de las aplicaciones clásicas de la Identidad de Bézout con cotas, expresada en el Corolario
3.4.8, es la idea de la matriz, que hoy llamamos de Sylvester, y la idea de resultante que
tendrá fuertes consecuencias en la Teorı́a de la Eliminación del Siglo XIX. La resultante de dos
polinomios aparece descrita por vez primera en el texto de J.J. Sylvester [Syl, 1840], aunque
el término “resultante” es debido a É. Bézout en su trabajo [Béz, 1779]. Cauchy redescubre la
noción de resultante pero, sabiamente, le otorga la prioridad a Sylvester que es quien la tenı́a.
Posteriormente, Sylvester desarrolla en 1853 una forma matricial de la idea original de Bézout
en su trabajo [Syl, 1853]. Aquı́ daremos un tratamiento actualizado (y formalmente completo)
de las ideas de Sylvester.
3.6.1. Extensiones algebraicas (Resumen Opcional). Comencemos con un breve

recordatorio de ciertas propiedades de las extensiones algebraicas de cuerpos y, por extensión,
de los cuerpos algebraicamente cerrados y de las clausuras algebraicas de cuerpos.
Definición 63 (Elementos Algebraicos y Trascedentes). Sea K ⊆ L una extensión de
cuerpos y sea ζ ∈ L un elemento. Decimos que ζ es algebraico sobre K si existe un polinomio
no nulo f ∈ K[X] tal que f (ζ) = 0.
A los elementos de L que no son algebraicos sobre K se les denomina elementos trascendentes
sobre K.
Proposición 3.6.1. Sea K ⊆ L una extensión de cuerpos y sea ζ ∈ L. Definamos :

AnnK (ζ) := {f ∈ K[X] : f (ζ) = 0}.
Entonces,
i) AnnK (ζ) es un ideal principal en K[X], distinto del ideal (0). Denotaremos por
IrrK (ζ) al generador de ese ideal y lo denominaremos polinomio mı́nimo de ζ sobre
K.
ii) El ideal AnnK (ζ) es un ideal primo o, equivalentemente, IrrK (ζ) es un elemento
primo del anillo K[X].
Demostración. La propiedad i) es obvia: si f, g ∈ K[X] se anulan en ζ, también se
anulará f + g y f − g. De otro lado, si f ∈ K[X] y g ∈ AnnK (ζ), entonces f g también se anula
en ζ. Por tanto AnnK (ζ) es un ideal de K[X]. Como existe un polinomio no nulo f ∈ K[X]
que se anula en ζ, entonces f ∈ AnnK (ζ) y este ideal no puede ser el idesl (0). Finalmente,
como K[X] es dominio de ideales principales, AnnK (ζ) es un ideal principal.
Supongamos ahora que f (X) = IrrK (ζ) ∈ K[X]. Veamos que f es irreducible y, por el Teorema
3.2.14, será un elemento primo de K[X]. En primer lugar, f es un polinomio no nulo porque
AnnK (ζ) es un ideal no nulo.
Supongamos, entonces, que f es reducibe en K[X] y que existen g, h ∈ K[X] no unidades tales
que f = gh. Las unidades en K[X] son los elementos no nulos de K (esto es K \ {0}). pero ni
g ni h pueden ser nulos porque f no lo es. De otro lado, sabemos que
0 = f (ζ) = g(ζ)h(ζ).
Esta igualdad se da en L que es un cuerpo y, en particular, un dominio de integridad. Por
tanto, concluimos que o bien g(ζ) = 0 o h(ζ) = 0. Supongamos, sin pérdida de la generalidad,
que g(ζ) = 0. Entonces, g ∈ AnnK (ζ). Como f (X) = IrrK (ζ) genera AnnK (ζ), entonces f | g.
En conclusión, h ha de ser una unidad en K[X] (i.e. un polinomio no nulo de grado 0) y f será
irreducible.
3.6. ELIMINACIÓN UNIVARIADA CLÁSICA: LA MATRIZ DE SYLVESTER 163
Proposición 3.6.2. Sea K ⊆ L una extensión de cuerpos y sea ζ ∈ L un elemento algebraico

sobre K. Sea f (X) := IrrK (ζ) ∈ K[X] el polinomio mı́nimo de ζ sobre K. Supongamos que
d = deg(f ) es el grado de f . Consideremos el conjunto siguiente:
K(ζ) := {b0 + b1 ζ + · · · + bd−1 ζ d−1 : b0 , . . . , bd−1 ∈ K} ⊆ L.
Entonces,
i) K(ζ) es un subcuerpo de L (un subanillo que es cuerpo) que contiene al cuerpo K.
ii) K(ζ) es un K−espacio vectorial de dimensión d.
Demostración. Es claro que K(ζ) ⊆ L es un subgrupo del grupo aditivo (L, +). Veamos
que es un subanillo. Para ello, consideremos dos elementos
x := b0 + b1 ζ + · · · + bd−1 ζ d−1 ∈ K(ζ), y := c0 + c1 ζ + · · · + cd−1 ζ d−1 ∈ K(ζ).
Consideremos también los polinomios de grado a lo sumo d − 1 siguientes:
g(X) := b0 + b1 X + · · · + bd−1 X d−1 ∈ K[X], h(X) = c0 + c1 X + · · · + cd−1 X d−1 ∈ K[X].
Observamos que g(ζ) = x y h(ζ) = y. Como K[X] es un dominio euclı́deo, existen q, r ∈ K[X]
tales que:
• gh = qf + r
• deg(r) ≤ deg(f ) − 1 = d − 1.
Supongamos r(X) := e0 + e1 X + · · · ed−1 X d−1 .
Ahora tenemos la siguiente cadena de igualdades:
d−1
X
xy = g(ζ)h(ζ) = q(ζ)f (ζ) + r(ζ) = r(ζ) = ek ζ k ∈ K(ζ).
k=0
Como 1 ∈ K ⊆ K(ζ) es inmediato que es un subanillo. Veamos finalmente que es un cuerpo.

Para ello, consideremos un elemento no nulo x := b0 + b1 ζ + · · · + bd−1 ζ d−1 ∈ K(ζ). De
nuevo, definamos el polinomio g(X) := b0 + b1 X + · · · + bd−1 X d−1 ∈ K[X] y tendremos que
g(ζ) = x 6= 0. Como f (X) := IrrK (ζ) es irreducible y g(ζ) 6= 0, entonces f - g. Sea h el
máximo común divisor de f y g. Se tiene que h es un divisor de f y, por ser f irreducible,
entonces o bien h es unidad en K[X] o bien (h) = (f ). Pero si (h) = (f ) , como h | g, entonces
g ∈ (f ) = AnnK (ζ), lo cual no es posible. Por tanto, h es una unidad en K[X]. Las unidades
en K[X] son las unidades de K, es decir, K \ {0}. En conlusión, si h es el máximo común
divisor de f y g, necesariamente h ∈ K \ {0}. En otras palabras, tenemos que K[X] = (f, g)
y que 1 ∈ (f, g). Por la Identidad de Bézout con cotas en K[X] (Corolario 3.4.8), existirán
h1 (X), h2 (X) ∈ K[X] tales que se verifica:
• deg(h1 ) ≤ deg(g) − 1 ≤ d − 2 y deg(h2 ) ≤ deg(f ) − 1 = d − 1,
• 1 = h1 f + h2 g.
Concluiremos la siguiente cadena de igualdades:
1 = h1 (ζ)f (ζ) + h2 (ζ)g(ζ) = h2 (ζ)g(ζ),
porque f (ζ) = 0. Supongamos h2 (X) = c0 + c1 X + · · · + cd−1 X d−1 , con ci ∈ K, 0 ≤ i ≤ d − 1.
Entonces,
h2 (ζ) = c0 + c1 ζ + · · · + cd−1 ζ d−1 ∈ K(ζ), 1 = h2 (ζ)g(ζ) = h2 (ζ)x.
COn lo que habremos probado que x posee inverso en K(ζ). Juntando todo lo probado con-
cluimos que (K(ζ), +, cot) es un cuerpo y es un subcuerpo de K.
De otro lado, por definición del conjunto, se tiene que K(ζ) está generado como K−espacio
vectorial por el conjunto
B := {1, ζ, . . . , ζ d−1 },
con lo que es un K−espacio vectorial de dimensión a lo sumo d. Queda por ver que ese conjunto
es una base de K(ζ). Para probarlo, supongamos que tenemos una combinación lineal igualada
a cero de estos elementos:
d−1
X
bi ζ i = 0.
i=0
De nuevo, consideremos el polinomio

d−1
X
g := bi X i ∈ K[X].
i=0
Si g(ζ) = 0, entonces g(X) ∈ AnnK (ζ) = (IrrK (ζ)). Como IrrK (ζ) es un polinomio no nulo
de grado d, entonces IrrK (ζ) | g(X) y, necesariamente, G(X) es el polinomio nulo, con lo que
sus coeficientes han de verificar b0 = b1 = · · · = bd−1 = 0 que es lo mismo que afirmar que la
familia B es una familia libre y, por tanto, conluimos que B es una base de K(ζ).
Observación 3.6.3. Obsérvese que, implı́ticamente, la anterior Proposición prueba lo siguiente:

Sea K ⊆ L una extensión de cuerpos, sea ζ ∈ L un elemento algebraico sobre K y sea f (X) =
IrrK (ζ) el polinomio mı́nimo de ζ sobre K. Entonces,
K(ζ) ∼
= K[X]/(f ),
y el anullo residual K[X]/(f ) es un cuerpo.
Definición 64 (Grado de una extensión de cuerpos). Dada una extensión de cuerpos

K ⊆ L, como L es un K−espacio vectorial, llamamos grado de la extensión de cuerpos K ⊆ L
a la dimensión de L como K−espacio vectorial y lo denotaremos mediante [L : K]. Es decir,
[L : K] := dimK (L).
A las extensiones de cuerpos K ⊆ L tales que el grado es finito (i.e. tales que [L : K]∞) se
las denomina extensiones finitas de cuerpos.
Proposición 3.6.4. Sea K ⊆ L una extensión de cuerpos y sea ζ ∈ L un elemento. Son

equivalentes:
i) ζ es algebraico sobre K
ii) Existe un cuerpo intermedio K ⊆ B ⊆ L tal que B es un K−espacio vectorial de
dimensión finita sobre K y ζ ∈ B.
Demostración. La implicaciı́n i) =⇒ ii) es consecuencia inmediata de la Proposición
precedente, simplemente eligiendo B := K(ζ). Para la otra implicación, supongamos que
B es un subcuerpo de L y que B es un K−espacio vectorial de dimensión finita sobre K.
Consideremos ζ ∈ B un elemento cualquiera y consideremos la siguiente aplicación:
ηζ : B −→ B
x 7−→ ζx.
Tenemos que ηζ es un endomorfismo sobre un espacio vectorial de dimensión finita sobre K.
Entonces, por el Teorema de Hamilton-Cayley (ver Teorema 2.3.33), existe un polinomio no
nulo f (X) ∈ K[X] tal que f (ηζ ) es el endomorfismo nulo sobre B. Como 1 ∈ B, tendremos que
el endomorfismo f (ηζ ) aplicado a 1 es cero, es decir, f (ηζ )(1) = 0 en B. Sólo falta observar que
el endomorfismo f (ηζ ) verifica:
f (ηζ )(1) = f (ζ) = 0.
Y tendremos que ζ es algebraico sobre K.
Lema 3.6.5. Sea K ⊆ L una extensión de cuerpos y sea V un L−espacio vectorial de dimensión
finita. Entonces, si [L : K] < ∞, V es también un K−espacio vectorial de dimensión finita
sobre K.
Demostración. Es un resultado obvio. Es claro que L es un K−espacio vectorial. Ahora,
supongamos los siguientes dos conjuntos:
• Una familia finita de vectores B := {v1 , . . . , vm } que forman una base de V como
L−espacio vectorial.
• Una familia finita de elementos de L: β := {λ1 , . . . , λn } que forman una base de L
como K−espacio vectorial.
Entonces, basta con probar que el conjunto siguiente es un sistema generador de V como
K−espacio vectorial:
β · B := {λi vj : 1 ≤ i ≤ n, 1 ≤ j ≤ m}.

Proposición 3.6.6. Sea K ⊆ L una extensión de cuerpos y sean ζ, θ ∈ L dos elementos

algebraicos sobre K. Entonces, ζ + θ y ζθ también son algebraicos sobre K.
En particular, el siguiente es un subcuerpo de L que contiene a K:
alg
K := {ζ ∈ L : ζ es algebraico sobre K}.
alg
A este cuerpo K se le denomina clausura algebraica de K en L.
Demostración. Supongamos ζ, θ ∈ L dos elementos algebraicos sobre K. por la Proposición
3.6.2 precedente, tenemos un cuerpo K1 := K(ζ) que extiende a K y es subcuerpo de L, siendo,
además, una extensión finita de K. Ahora, la extensión K1 ⊆ L verifica que θ es algebrico sobre
K1 (porque ya lo era sobre K ⊆ K1 ). Por tanto, K1 (θ) es una extensión finita de K1 . Por
el Lema 3.6.5 precdente, como K1 es una etensión finita sobre K y K1 (θ) es un K1 −espacio
vectorial finitamente generado, entonces, K1 (θ) es un K−espacio vectorial finitamente gener-
ado y la extensión de cuerpos K ⊆ K1 (θ) es una extnesión finita de cuerpos. Ahora es fácil
observar (por la construcción de las extensiones de la forma K(ζ) en la Proposición 3.6.2) que
los siguientes elementos pertenecen a K1 (θ):=
ζ + θ = g(θ), ζθ = h(θ),
donde
g(X) = X + ζ ∈ K1 [X], h(X) = ζX ∈ K1 [X].
Por tanto, ζ + θ y ζθ son elementos de un cuerpo K1 (θ) que es un K−espacio vectorial de
dimensión finita sobre K. Por la Proposición 3.6.4, concluimos que ζ + θ y ζθ también son
algebraicos sobre K.
alg
La afirmación sobre K se sigue de los hechos siguientes. Obviamente, los elementos ζ ∈ K
alg
están en K porque satisfacen la ecuación no nula f (X) = Xζ ∈ K[X]. En particular,
alg alg
1 ∈ K . Además, como la suma y producto de algebraicos es algebraico, es claro que K
alg
es un subanillo de L. Queda sólo por demostrar que K es un cuerpo. Para ello, como ya
alg
es subanillo, basta con ver que si un elemento ζ ∈ K es no nulo y si ζ −1 es su inverso en
alg alg
L, entonces ζ −1 ∈ K . Ahora bien, si ζ ∈ K es algebraico sobre K, ya hemos visto en la
Proposición 3.6.2 que K(ζ) es un cuerpo. Por tanto, ζ tiene inverso ζ −1 ∈ K(ζ) y ese inverso es
único, con lo que es también el inverso de ζ en L. Por la Proposición 3.6.4, como K(ζ) es una
extensión finita de K, entonces todos sus elementos son algebraicos sobre K. En particular,
alg alg
ζ −1 es algebraico sobre K y ζ −1 ∈ K , con lo que habremos probado que el subanillo K es
un subcuerpo de L.
3.6.2. Cuerpos algebraicamente cerrados (Resumen opcional). Se trata de una

forma teórica de agrupar a todos los elementos algebraicos sobre un cuerpo o a todas las
clausuras algebraicas posibles de un cuerpo en un sólo cuerpo.
Definición 65 (Cuerpo Algebraicamente Cerrado). Un cuerpo K se dice algebraicamente
cerrado si para todo polinomio f ∈ K[X] \ K (i.e. no nulo y no unidad) existe ζ ∈ K tal que
f (ζ) = 0.
Proposición 3.6.7 (Teorema del Resto (aka Ruffini)). Sea R un dominio de integridad,
f ∈ R[X] un polinomio y sea ζ ∈ R. El resto de la división de f por (X − ζ) (conforme a lo
descrito en el Teorema 1.4.15) es el resultado de eveluar el polinomio f en el punto ζ, es decir
el resto de esa división es f (ζ) ∈ R. En particular, son equivalentes:
i) f (ζ) = 0,
ii) (X − ζ) | f en R[X].
Más aún, si R = K es un cuerpo, son equivalentes
i) El cuerpo K es algebraicamente cerrado

ii) Para todo d ∈ N, d ≥ 1 y para todo polinomio f ∈ K[X] de grado d, existen ζ1 , . . . , ζr ∈
K, distintos dos a dos, y m1 , . . . , mr ∈ K y a ∈ K, a 6= 0 tales que:
• m1 + m2 + · · · + mr = d,
• La siguiente igualdad se da en K[X]:
f = a(X − ζ1 )m1 (X − ζ2 )m2 · · · (X − ζr )mr .
Los elementos ζ1 , . . . , ζr ∈ K se llaman las raı́ces o los ceros del polinomio f en K y los
números entereos positivos m1 , . . . , mr se denominan (respectivamente) las multiplicidades de
esas raı́ces.
Demostración. Para la primera afirmación, apliquemos la división euclı́dea (como en el
Teorema 1.4.15) y tendremos que existen q, r ∈ R[X] tales que deg(r) ≤ deg(X − ζ) − 1 =
1 − 1 = 0 (i.e. r ∈ R es una constante) y se verifica:
f (X) = q(X)(X − ζ) + r(X).
Evaluando en ζ ∈ R en los dos lados obtenemos:
f (ζ) = q(ζ)(ζ − ζ) + r(ζ) = q(ζ)0 − r(ζ) = r(ζ).
Pero como r es una constante r(ζ) = r y tenemos f (ζ) = r = 0 como pretendı́amos. La
implicación (X − ζ) | f =⇒ f (ζ) = 0 es obvia.
Para el caso en que R = K sea un cuerpo algebraicamente cerrado, procedamos por inducción
en d. Para el caso d = 1 la propiedad es obvia porque f = aX + b = a(X + a−1 b) por ser
a ∈ K \ {0}. Tomando ζ = −a−1 b habremos terminado.
Para el caso d ≥ 1, la definición de cuerpo algebraicamente cerrado, nos garantiza que existe
ζ ∈ K tal que f (ζ) = 0. Por tanto, (X − ζ) | f y tendremos que exite g ∈ K[X] tal que
f = (X − ζ)g.
por tanto deg(g) = d − 1 y, por hipótesis inductiva, tendremos que existen ζ1 , . . . , ζr ∈ K,
m1 , . . . , mr ∈ K y a ∈ K, a 6= 0 tales que:
i) m1 + m2 + · · · + mr = d − 1,
ii) La siguiente igualdad se da en K[X]:
g = a(X − ζ1 )m1 (X − ζ2 )m2 · · · (X − ζr )mr .
Luego
f = a(X − ζ)(X − ζ1 )m1 (X − ζ2 )m2 · · · (X − ζr )mr .
y tenemos la afirmación en el caso d.
Nos queda pro probar que si se verifica la propiedad descrita, entonces K es algebraicamente
cerrado. Pero eso es obvio: cualquier polinomio f ∈ K[X] de grado positivo, admite una
factorización como la descrita y, entonces, posee al menos un cero en K.
Corolario 3.6.8. Si K es un cuerpo algebraicamente cerrado, los elementos irreducibles (y

los elementos primos) de K[X] son:
[
{0} {a(X − ζ) : a ∈ K \ {0}, ζ ∈ K}.
Demostración. Obvio desde la Proposición predente. Lo único que conviene recordar es

que, como K[X] es un dominio de ideales principales (por ser dominio euclı́deo) un elemento
es primo si y solamente si es irreducible (ver Teorema 3.2.14).
Proposición 3.6.9. Todo cuerpo algebraicamente cerrado tiene cardinal infinito.

Demostración. Supongamos que K = {a1 , . . . , am } fuera un cuerpo finito. Definamos
entonces el siguiente polinomio f ∈ K[X]:
f := (X − a1 )(X − a2 ) · · · (X − am ) + 1.
Claramente f (ζ) = 1 para cualquier ζ ∈ K y, por tanto, f no posee ninguna raı́z en K o, lo
que es lo mismo, K no puede ser algebraicamente cerrado.
Definición 66 (Clausura Algebraica). Si K es un cuerpo, llamamos clausura algebraica de

K al menor cuerpo algebraicamente cerrado que contiene a K.
Observación 3.6.10. El concepto “menor” en la definición anterior debe entenderse como

“menor salvo K−isomorfismo de cuerpos”. Es decir, la clausura algebraica de un cuerpo K
será un cuerpo K algebraicamente cerrado que satisface las siguientes propiedades:
• K es algebraicamente cerrado,
• K ⊆ K (o, salvo isomorfismo, K contiene una copia isomorfa de K),
• Para todo cuerpo L algebraicaente
cerrado que contiene a K, existe ϕ : K −→ L un
morfismo de anillos tal que ϕK = IdK .
Nótese que la existencia de un morfismo de anillos implica, por ser cuerpos todos ellos, que es
un monomorfismo y, por tanto, K es isomorfo a un subcuerpo de L. De ahı́ viene el concepto
de “menor salvo isomorfismo” usado en la Definición.
Un resultado importante, que no demostraremos en este curso, sino en el curso correspondiente,
afirma lo siguiente.
Teorema 3.6.11 (Existencia de Clausura Algebraica). Suponiendo el Lema de Zorn, todo
cuerpo posee una clausura algebraica y ésta es única salvo isomorfismo de cuerpos. Más aún, la
clausura algebraica de un cuerpo es la mayor extensión algebraica de ese cuerpo. En particular,
si K es la clausura algebraica de K, todos los elementos α ∈ K son algebraicos sobre K, es
decir,
∀α ∈ K, ∃f ∈ K[X] \ K, f (α) = 0.
Finalmente, si K ⊆ L es una extensión algebraica de cuerpos, existe un monomorfismo de
cuerpos ϕ : L −→ K tal que ϕK = IdK .
Ejemplo 3.6.12. El “Teorema Fundamental del Álgebra” (un Teorema de Análisis) dice que
C es un cuerpo algebraicamente cerrado. Por tanto, los elementos irreducibles de C[X] son los
dados mediante: [
{0} {a(X − ζ) : a ∈ C \ {0}, ζ ∈ C}.
Por la relación entre R y C es fácil deducir que los elementos irreducibles de R[X] son los dados
por la siguiente colección:
[ [
{0} {a(X − ζ) : a ∈ R \ {0}, ζ ∈ R} {a((X − b)2 + c2 ) ; a, c ∈ R \ {0}, b ∈ R}.
Además, C es la clausura algebraica de R. En el caso de Q es claro que Q no es un cuerpo
algebraicamente cerrado porque X 2 + 1 no posee raı́ces en Q. Por ejemplo, el polinomio
√ √
X 4 + 1 = (X 2 − 2X + 1)(X 2 + 2X + 1),
muestra que los irreducibles en Q[X] no tiene por qué ser irreducibles en R[X]. También
puede probarse que Q[X] posee elementos irreducibles de grado tan grande como se quiera. La
clausura algebraica Q de Q son los elementos de C algebraicos sobre Q, es decir,
Q = {ζ ∈ C : ∃f ∈ Q[X], f (ζ) = 0}.
En el caso de cuerpos finitos, consideremos la clausura algebraicas Fq de cualquier cuerpo finito
Fq , de cardinal q := pn , p := caract(Fq ) su caracterı́stica, con p ∈ N primo no nulo. Veamos
que Fq tiene cardinal infinito por el sencillo argumento siguiente:
Consideremos N \ pZ los números naturales que no son múltiplos de p. Consideremos, para
cada n ∈ N \ pZ, el polinomio X n − 1. Este polinomio es libre de cuadrados (no posee factores
múltiples o, equivalentemente, sus raı́ces son simples o, si se prefiere, su discriminante es no
nulo): como nX n−1 6= 0, porque p - n, el máximo común divisor de fn := X n −1 y fn0 := nX n−1
en Fq [X] es 1. Esto significa que no tiene raı́ces múltiples. Por tanto fn tiene n raı́ces distintas
para cada n ∈ N \ pZ. Como N \ pZ es un conjunto no acotado, el siguiente conjunto tiene
cardinal infinito:
{ζ : ∃n ∈ N \ pZ, ζ n − 1 = 0}.
Y es un conjunto cuyos elementos deben estar en Fq porque en la clausura algebraica todo
polinomio se escinde completamente. Luego la clausura algebraica de Fq tiene cardinal infinito.
3.6.3. La matriz de Sylvester y el máximo común divisor en K[X]. Consideremos,

en lo que queda de Subsección, que K la clausura algebraica del cuerpo K de coeficientes. Un
problema evidente es el siguiente: Supongamos que nos dan un cuerpo K cuyos elementos
podemos podemos escribir, o, más generalmente, que podemos “conocer” (un cuerpo primo,
por ejemplo) y nos dan dos polinomios no triviales f, g ∈ K[X]. Nos preguntan la respuesta a
la siguiente pregunta:
∃ζ ∈ K, f (ζ) = g(ζ) = 0?
Obviamente, lo natural serı́a resolver las ecuaciones f (X) = 0 y g(X) = 0 (es decir, hallar
sus raı́ces en K) y compararlas. Pero esto no es eficiente: calcular un cuerpo donde viven las
raı́ces de un polinomio requiere clacular su clausura normal (como en Teorı́a de Galois) y ese
es un problema de gran complejidad. Sin embargo, en el siglo XIX (incluso en el XVIII con
Bézout) ya sabı́an cómo responder a esa pregunta a través del máximo común divisor. Se tiene
el siguiente resultado clásico:
Lema 3.6.13. Dados dos polinomios f, g ∈ K[X] no nulos, son equivalentes:
i) ∃ζ ∈ K, tal que f (ζ) = g(ζ) = 0.
ii) Existe un cuerpo L que extiende a K y existe un elemento ζ ∈ L algebraico sobre K
tal que g(ζ) = f (ζ) = 0.
iii) Si h es un máximo común divisor de f y g en K[X], entonces deg(h) ≥ 1.
Demostración. La equivalencia entre i) y ii) se sigue de la propia noción de clausura
algebraica. Queda , por tanto, le equivaencia entre i) y ii): Para la implicación i) =⇒ ii),
considérese que existe ζ ∈ K tal que f (ζ) = 0 y g(ζ) = 0. Consideremos el siguiente conjunto
a ⊆ k[X] dado mediante:
a := {p(X) ∈ K[X] : p(ζ) = 0}.
Es sencillo comprobar que a es un ideal de K[X]. Además, no es el ideal nulo (i.e. a 6= (0))
porque, como hemos indicado más arriba, todos los elementos de K son algebraicos sobre K.
Esto significa que, como ζ es algebraico sobre K, existe un polinomio no constante p ∈ K[X]
tal que p(ζ) = 0. Luego p ∈ a 6= (0) y, adicionalmente, a 6= (1), porque 1 no se anula en ζ. En
conclusión, a es un ideal propio de K[X] es un dominio de ideales principales, a = (h) es un
ideal principal no nulo y distinto del total. En términos de extensiones de cuerpos, el generador
h es el polinomio mı́nimo de ζ sobre K o, con otras notaciones, h = IrrK (ζ) ∈ K[X]. Como
f (ζ) = g(ζ) = 0, entonces, f, g ∈ a y, por tanto, h | f y h | g y h es no constante. Por tanto,
deg(gdc(f, g)) ≥ 1 y habremos terminado.
Para la implicación iii) =⇒ i), sea h = gcd(f, g) y supongamos deg(h) ≥ 1 (es decir, h no es
constante). Como K es un cuerpo algebraicamente cerrado, todo polinomio no constante posee,
al menos, una raı́z. Es decir, existe ζ ∈ K tal que h(ζ) = 0. Como h es el máximo común
divisor de f y g, h | f y h | g, obviamente se tiene f (ζ) = 0 y g(ζ) = 0 como indica la propiedad
(1).
La propuesta de JJ. Sylveste consiste en trasnformar estas reflexiones en cálculos de Álgebra

Lineal elemental. Su principal observación para por estudiar cómo es la matriz de multiplicación
por un polinomio:
3.6.3.1. Mutiplicar por un polinomio. Consideremos el conjunto K[X]d formado por
los polinomios univariados de grado a lo sumo d, es decir, K[X]d := {f ∈ K[X] : deg(f ) ≤ d}.
Como se indica en el Problema 47, con las operaciones suma y producto por un escalar en K,
tenemos que:
(K[X]d , +, ·K ),
es un K−espacio vectorial de dimensión d + 1. Una base ordenada de K[X]d como K−espacio
vectorial es la dada por los monomios {1, X, X 2 , . . . , X d } (llamaremos base monomial a toda
base dada por monomios de un K−espacio vectorial). Ahora consideremos un polinomio no
nulo f := am X m + am−1 X m−1 + · · · + a1 X + a0 y supongamos am 6= 0. Es claro que para
cada polinomio g ∈ K[X]d , el polinomio f g es de grado d + m. Esto nos permite definir, una
aplicación
ρf : K[X]m −→ K[X]d+m ,
dado mediante:
ρf (g) := f g.
Se tiene:
Proposición 3.6.14. La aplicación ρf : K[X]m −→ K[X]m+d es una aplicación lineal que,
en las respectivas bases monomiales ({1, X, X 2 , . . . , X m } para K[X]m y {1, X, X 2 , . . . , X d+m }
para K[X]d+m ), viene dada por la matriz Sm+1 (f ) ∈ M(d+m+1)×(m+1) (K) (i.e. m + d + 1 filas
y m + 1 columnas), dada mediante la expresión siguiente:
 
a0 0 ··· 0
a1 a0 ··· 0 
 .. .. ..
 
. . 
.
 . . . 

ad ad−1 · · · ad−m 
Sm+1 (f ) :=  .
0
 ad · · · ad−m+1 

0
 0 · · · ad−m+2 

. .. . ..
. .

. . . . 
0 0 ··· ad
Demostración. Supongamos que las coordenadas de un polinomio g ∈ K[X]m en la base
monomial {1, X, X 2 , . . . , X m } son dadas mediante la lista (z0 , z1 , . . . , zm ). En otras palabras,
estamos diciendo que
g = z0 + z1 X + z2 X 2 + · · · + zm X m .
Ahora multiplicamos
f g := c0 + c1 X + c2 X 2 + · · · cm+d X m+d ,
donde X
ck := ai zj .
i+j=k
Escrita esta expresión en forma matricial (suponiendo d ≥ m por simplicidad de la expresión)
tendremos:
···
   
a0 0 0 c0
 a1 a0 ··· 0   c1 
 .. .. .  .. 
   
. . . 
 .
 . . .    . 
  
 am
 am−1 · · · a0  z0

 cm 
 
am+1
 am ··· a1   z1  cm+1 
   

 .. .. .. ..   z2   .. 
 . . . . = .
  ..   . 
   

 ad
 ad−1 · · · ad−m   . 
 cd 
 
 0
 ad · · · ad−m+1  zm

 cd+1 
 
 0
 0 · · · ad−m+2 

 cd+2 
 
 . . . .  . 
 .. .. .. ..  .. 


0 0 ··· ad cd+m

3.6.3.2. La matriz de Sylvester-Bézout. Comencemos con una construcción. Sea

f, g ∈ K[X] dos polinomios no nulos de grados respectivos m y n. Consideremos la siguiente
aplicación lineal
φf,g : K[X]n−1 × K[X]m−1 −→ K[X]m+n−1
(h1 , h2 ) 7−→ h1 f + h2 g.
Teorema 3.6.15 ([Syl, 1853]). Con las notaciones precedentes, se tiene:
i) La aplicación φf,g anterior es una aplicación lineal entre dos K−espacios vectoriales
de dimensión m + n (ambos).
ii) Sea B1 en K[X]n−1 × K[X]m−1 la base del espacio vectorial producto formada a
partir de las bases monomiales K[X]n−1 y K[X]m−1 . Sea B2 la base monomial de
K[X]m+n−1 . Entonces la matriz de φf,g en las bases B1 y B2 es dada mediante:
SylvX (f, g) := (Sn (f ) | Sm (g)) ,
donde Sn (f ) y Sm (g) son las matrices introducidas en la Subsección 3.6.3.1 precedente.

A esta matriz se la denomina la matriz de Sylvester-Bézout de f y g o simplemente
matriz de Sylvescter de f y g.
iii) El subespacio imagen Im(φf,g ) de esta aplicación lineal es dado por la siguiente iden-
tidad:
Im(φf,g ) = {p ∈ K[X]m+n−1 : p ∈ (f, g)},
iv) El máximo común divisor h de f y g no nulos es el polinomio no nulo de menor grado
en Im(φf,g ).
v) El grado del máximo común divisor h = gcd(f, g) de f y g satisface la siguiente
igualdad:
m + n = deg(h) + dimK (Im(φf,g ) = deg(h) + rank (Sylv(f, g)) .
Demostración. Es claro que φf,g es una aplicación lineal bien definida. Es claro también
que ambos espacios (K[X]n−1 × K[X]m−1 de una parte y K[X]m+n−1 de la otra) tienen di-
mensión m + n. Por tanto ∆φf,g es una aplicación lineal entre dos espacios de la misma
dimensión.
Consideremos entonces las bases B1 y B2 referidas en el enunciado:

• En K[X]m−1 y en K[X]n−1 las respectivas bases monomiales. En el producto K[X]m−1 ×
K[X]n−1 la base “producto” de las respectivas bases monomiales:
[
B1 := {(X i , 0) : 0 ≤ i ≤ m − 1} {(0, X j ) : 0 ≤ j ≤ n − 1}.
• En K[X]n+m la base monomial B2 dada mediante

B2 := {1, X, X 2 , . . . , X n+m−1 }.
Supongamos
f := am X m + am−1 X m−1 + · · · + a1 X + a0 ,
y
g := bn X n + bn−1 X n−1 + · · · + b1 X + b0 ,
con am 6= 0 y bn 6= 0. Con las bases B1 y B2 prefijadas, es un sencillo ejercicio de mera
comprobación el conluir que la matriz de φf,g en esas bases tiene la forma: donde
 n m 
z }| { z }| {
 a0 0 ··· 0 b0 0 ··· 0 
··· ··· 0 
 
 a1 a0 0 b1 b0
 .. .. .. .. .. .. .. . 
 
 . . . . . . . .. 
 .. .. .. ..
 
.. .. 
 . . . a0 . . . b0 
..  ∈ Mn+m (K),
 
SylvX (f, g) := (Sn (f ) | Sm (g)) =  .. .. .. ..
 am am−1 · · ·
 . . . . . 

 . . .
. .
.

 0
 am . . bn bn−1 · · · .  
 . .. .. .. .. .. 
 .. . . . 0 bn . . 
 
 . .. .. .. .. .. .. .. 
 .. . . . . . . . 
0 0 · · · am 0 0 · · · bn
Con esto quedan probadas las afirmaciones i) y ii) del enunciado. Pasemos a analizar la
propiedad iii):
Es claro que si p ∈ Im(φf,g ) entonces, existe p1 ∈ K[X]n−1 y p2 ∈ K[X]m−1 tales que p =
φf,g (p1 , p2 ) = p1 f + p2 g. Por tanto, p ∈ (f.g) y teemos la inslución más sencilla
Im(φf,g ) ⊆ (f, g).
De otro lado, consideremos p ∈ K[X]m+n−1 un polinomio de grado a los sumo m + n − 1 en el
ideal (f, g). Por estar en el ideal (f, g) existiráon dos polinomios P1 , P2 ∈ K[X] tales que
p = P1 f + P2 g.
Ahora, aplicamos el mismo argumento usado en la Identidad de Bézout con cotas para K[X]
(Corolario 3.4.8). Tomamos p1 := rem(P1 , g), el resto de la división de P1 por g, supongamos
P1 = Q1 g + p1 , con deg(p1 ) ≤ deg(g) − 1 = n − 1 y escribimos
p := p1 f + (P2 + Q1 f )g.
Denotemos por p2 := (P2 + Q1 f ) y el mismo argumento uado en el Corolario 3.4.8 nos dará
deg(p2 ) ≤ deg(f ) − 1 = m − 1. Por tanto, tendremos:
p := p1 f + p2 g = φf,g (p1 , p2 ) ∈ Im(φf,g ),
lo que prueba el otro contenido y completa la prueba de iii).
La propiedad iv) es evidente a partir de la pa prueba del Teorema 3.4.4. COmo K[X] es un
dominio euclı́deo con deg, el máximo común divisor de dos polinomios no nulos f, g ∈ K[X] es
el polinomio no nulo de menor grado en el ideal (f, g). Por iii) los elementos de Im(φf,g ) son
los polinomios de grado menor o igual que m + n − 1 que están en el ideal (f, g). Por tanto, el
polinomio no nulo de menor grado en Im(φf,g ) tiene que ser necesariamente gcd(f, g).
Para la propiedad v) hagamos una pequeña construcción: Supongamos que h = gcd(f, g) es un
polinomio de grado k. Consideremos ahora la familia de polinomios en Im(φf,g ):
β := {h, Xh, X 2 h, . . . , X m+n−1−k h} ⊆ Im(φf,g ).
Todos los elementos de β son múltiplos del máximo común divisor de f u G, por tant, están en
el ideal (f, g). Como, además, es claro que el grado de todos los elementos de β está acotado
por m+n−1, la propiedad iii) nos dice que son elementos de Im(φf,g ). Más aún, los polinomios
de esta familia verifican deg(X i h) = i + k. Es decir, son todos polinomios de grado distinto y
sus grados van desde k (grado de h) hasta m + n − 1 (grado de X m+n−1−k h). Por tanto, si los
escribimos como vectores por sus coeficientes en la base monomial de K[X]m+n−1 observamos
que esas coordenadas determinan una matriz triangular. Es decir, los elementos de la colección
β son linealmente independientes sobre K. Como tenemos una familia de m + n − k polinomios
linealmente independientes sobre K en Im(φf,g ), concluimos
(3.6.1) dim(Im(φf,g )) + deg(h) = dim(Im(φf,g )) + k ≥ m + n.
De otro lado, consideremos la familia β 0 := {1, X, . . . , X k−1 } de elementos en K[X]m+n−1 .
Estos vectores son claramente linealmente independientes en K[X]m+n−1 y designemos por W ⊆
K[X]m+n−1 el K−subespacio vectorial que generan. Obviamente, dim(W ) = k. Observamos
que
(3.6.2) Im(φf,g ) ∩ W = (0).
Esto es consecuencia de iv): si hubiera un polinomio no nulo en W y en Im(φf,g ), serı́a un
polinomio de grado a lo sumo k − 1 en Im(Φf,g ) y eso no es posible porque el grado de h es k.
En conclusión, estamos en presencia de una suma directa de subespacios (i.e. W ⊕ Im(φf,g ) =
W + Im(φf,g )). Por el Tercer Teorema de Isomorfı́a, combinado con la noción de dimensión en
espacios vectoriales de dimensión finita, tendremos
dimK (W + Im(φf,g )) + dimK (W ∩ Im(φf,g )) = dim(W ) + dimK (Im(φf,g )) .
Por la Desigualdad (3.6.1) y la Igualdad (3.6.2) concluimos
dimK (W + Im(φf,g )) + 0 = k + dimK (Im(φf,g )) ≥ k + (m + n − k) = m + n.
Por tanto, W + Im(φf,g ) = K[X]m+n−1 y se tendrá:
m + n = dimK (W + Im(φf,g )) = k + dimK (Im(φf,g )) ,
que demuestra la afirmación v) del enunciado.
Usualmente, cuando no hay confusión sobre la variable X eliminada, se escribe simplemente

Sylv(f, g). Además el resultado nos dice que podemos conocer el grado del máximo común
divisor de dos polinomios simplemente conociendo el rango de la matriz Sylv(f, g), lo que nos
lleva a pensar en métodos del cálculo del rango de una matriz como los descritos mediante el
método de K. Mulmuley in [Mul, 1986].
3.6.3.3. Resultante de Sylvester-Bézout. Un de los resultados más reconocibles de

la Teorı́a de la Eliminación es la noción de resultante de dos polinomios univariados.
Definición 67 (Resultante de Sylvester-Bézout). Dados dos polinomios f, g ∈ K[X] no
nulos de grados respectivos m y n, llamamos Resultante de Sylvester-Bézout de f y g con
respecto a la variable X al valor:
Res(f, g) := det (Sylvx (f, g)) ∈ K.
Nótese que la resultante de Sylvester Bézout es un polinomio en los coeficientes de f y g. Las

principales propiedades de este objeto se resumen en el siguiente Teorema:
Teorema 3.6.16 (Resultante de Sylvester-Bézout). Sea K un cuerpo y K su clausura
algebraica. Sean f y g dos polinomios no constantes en K[X] de grados respectivos n y m.
Consideremos la matriz Sylv(f, g) ∈ Mn+m (K) y la resultante:
ResX (f, g) := det (SylvX (f, g)) .
Son equivalentes:
i) ∃ζ ∈ K, tal que f (ζ) = g(ζ) = 0
ii) El máximo común divisor h de f y g es un polinomio de grado mayor o igual que 1.
iii) La aplicación lineal φf,g no es un epimorfismo.
iv) El rango de la matriz de Sylvester es menor o igual que n + m − 1,
v) La resultante verifica ResX (f, g) = 0.
Demostración. El enunciado es casi consecuencia inmediata de lo discutido anterior-
mente. Por el Lema 3.6.13 tenemos la equivalencia entre i) y ii). EL resto de las equivalencias
son consecuencia del Teorema 3.6.15 precedente. Como Sylv(f, g) es la matriz de la aplicación
lineal φf,g entre ciertas bases, tenemos que φf,g no es epimorfismo si y solamente si el rango
de Sylv(f, g) es, a lo sumo m + n − 1. Lo que prueba la equivalencia entre iii) y iv). Como
φf,g es una aplicación lineal entre dos espacios vectoriales de la misma dimensión, φf,g no es
epimorfismo si y solamente si no es isomorfismo, lo cual equivale a que cualquier matriz que la
represente tienen determinante nulo (ver Corolario 2.3.22). Esto prueba la equivalencia entre
iv) y v). Finalemente, la afirmación v) del Teorema 3.6.15 prueba la equivalencia entre ii) y
iv).
3.6.4. Resultante de Sylvester-Bézout y Eliminación: cuando los coeficientes

están en un anillo. Del mismo modo que en los resultados procedentes podemos hacer la
construcción para un anillo R cualquiera, aunque ahora no podemos hablar del máximo común
divisor. Volveremos sobre la idea más adelante. Por ahora, consideremos R[X]n el conjunto de
todos los polinomios con coeficientes en R de grado acotado por n. Es decir,
R[X]n := {f ∈ R[X] : deg(f ) ≤ n}.
R[X]n es un R−módulo libre de base {1, X, X 2 , . . . , X n }. Consideremos dos polinomios f, g ∈
R[X] de grados respectivos n y m y consideremos también el morfismo de R−módulos libres
de rango finito dado mediante las reglas siguientes:
Sf,g : R[X]m−1 × R[X]n−1 −→ R[X]m+n−1
(h1 , h2 ) 7−→ h1 f + h2 g.
Es obvio que la imagen de este morfismo de R−módulos satisface:
Im(Sf,g ) ⊆ (f, g) ∩ R[X]m+n−1 ,
donde (f, g) es el ideal de R[X] generado por f y g. La matriz de Sf,g es las respectivas bases
monomiales de R−módulos libres sigue las mismas pautas que en el caso de que R sea un
cuerpo y se denomina matriz de Sylvester-Bézout con respecto a X. La denotaremos mediante
SylvX (f, g) ∈ Mn+m (R) y llamaremos resultante de f y g con respecto a X a su determinante,
que denotaremos mediante
ResX (f, g) := det (SylvX (f, g)) ∈ R.
Proposición 3.6.17. Con las notaciones precedentes, se tienen las siguientes propiedades:
i) ResX (f, g) está en el ideal contracción a R del ideal (f, g) generado por f y g en
R[X]. Es decir, ResX (f, g) ∈ (f, g)c = (f, g) ∩ R. Se suele denomiar a ResX (f, g) el
elemento elminante del ideal (f, g) en R. Si, a su vez, R es un anillo de polinomios
con coeficientes en un cuerpo, se le denomina “polinomio eliminante en una variable”.
ii) Si ResX (f, g) ∈ R× es una unidad en R, entonces el ideal (f, g) = R[X].
iii) Si uno de los polinomios es mónico, entonces (f, g) ∩ R[X]m+n−1 = Im(Sf,g ). En este
caso, si R es dominio de integridad, (f, g) = R[X] si y solamente si ResX (f, g) ∈ R× .
Demostración. Los resultados son muy similares al caso K[X] (Teorema 3.6.16), con el
debido cuidado al tener coeficientes en un anillos R y no en un cuerpo.
i) Para este resultado recuérdese la Fórmula de Laplace Generalizada (Teorema ??) y
sea Adj(S) la matriz adjunta de la matriz de Sylvester SylvX (f, g) ∈ Mm+n (R).
Tendremos que
ResX (f, g)Idn+m = det (SylvX (f, g)) Idn+m = SylvX (f, g)Adj(S).
Supongamos que, descrita por columnas, la matriz adjunta toma la forma:
 
c1,1 c1,2 ··· c1,n+m
 c2,1 c2,2 ··· c2,n+m 
Adj(S) :=  . .
 
. . ..
 .. .. .. . 
cn+m,1 cn+m,2 · · · cn+m,n+m
Tendremos, en particular, que las primeras columnas verifican:
   
ResX (f, g) c1,1
 0   c2,1 
 = SylvX (f, g)  ..  .
   
 ..
 .   . 
0 cn+m,1
Consideremos ahora los dos polinomios siguientes:
h1 := c1,1 + c2,1 X + · · · + cm,1 X m−1 ∈ R[X]m−1 ,
h2 := cm,1 + cm+1,1 X + · · · + cn+m,1 X n−1 ∈ R[X]n−1 .

Entonces, el polinomio h := h1 f + h2 g ∈ (f, g) ∩ R[X, y]n+m−1 (i.e. está en el ideal
generado por f y h en R[X]. Pero si los coeficientes de h fueran
h := d0 + d1 X + d2 X 2 + · · · + dn+m−1 X n+m−1 ,
entonces satisfarı́an:
   
d0 c1,1
 d1   c2,1
 = SylvX (f, g)  .
   
 .. ..
 .    .
dn+m−1 cn+m,1
Por tanto,
h := ResX (f, g) + 0X + 0X 2 + · · · 0X n+m−1 = ResX (f, g) ∈ (f, g) ∩ R,
como se pretendı́a.
ii) Por lo anterior, si ResX (f, g) ∈ R× , como las unidades de R× son unidades en R[X],
fácilmente se concluye que (f, g) = R[X].
iii) Para esta afirmación retomemos el Teorema 1.4.15 anterior. Supongamos h = pf +qg ∈
R[X] es un polinomio cuyo grado en X es menor o igual que n + m − 1. Apliquemos
la división de p por g (que puede hacerse porque g es mónico, ver Teorema 1.4.15):
p = p1 g + r,
donde r ∈ R[X] es un polinomio de grado estrictamente menor que el grado de g con
respecto a X. De hecho r ∈ R[X]m−1 . Reescribamos la presentación de h mediante:
h = rf + (q + p1 f )g.
Como deg(h) ≤ n + m − 1 y deg(r1 f ) ≤ deg(r1 ) + deg(f ) ≤ (m − 1) + n, concluiremos

que
deg ((q + p1 f )g) ≤ n + m − 1.
Pero, como g es mónico el grado del producto es la suma de los grados (las unidades
no son divisores de cero en R). Es decir,
deg(g) + deg(q + p1 f ) = deg((q + p1 f )g) ≤ n + m − 1.
Como deg(g) = m, entonces el polinomio s := (q + p1 f ) tiene grado a lo sumo n − 1
y tendremos
h = rf + sg, con r ∈ R[X]m−1 y s ∈ R[X]n−1 ,
por tanto f ∈ Im(Sf,g ). Como ya habı́amos indicado que Im(Sf,g ) ⊆ (f, g)∩R[X]n+m−1 ,
la prueba de la primera parte de iii) está concluida.
Para la segunda parte, ya hemos visto una de las implicaciones. Supongamos, en cam-
bio que (f, g) = R[X]. En ese caso, por la primera parte, concluimos que Im(Sf,g ) =
R[X]m+n−1 . Por tanto, Sf,g es un epimorfismo de R−módulos libres. Consideremos
ahora el cuerpo de fracciones de R (i.e. K := qf (R), como en la Subsección 3.2.0.1).
Y consideremos la extensión de Sf,g dada mediante
φf,g : K[X]n−1 × K[X]m−1 −→ K[X]m+n−1 .
Como (f, g) = R[X], entonces 1 ∈ (f, g) y también 1 ∈ (f, g)e , donde (f, g)e es la
extensión del ideal (f, g) al anillo K[X]. Por el Teorema 3.6.16, φf,g es un epimorfismo
y, por tanto, un isomorfismo entre dos K−espacios vectoriales de la misma dimensión.
En particular, φf,g es un monomorfismo y, como se tiene que

φf,g R[X] ×R[X] = Sf,g ,
n−1 m−1
concluimos que Sf,g es también un monomorfismo. En suma, Sf,g es un isomorfismo

de R−módulos libres de rango finito y, por tanto, su determinante es una unidad en
R.

Ejemplo 3.6.18 (Proyectando o Eliminando via Resultante). Sea K un cuerpo alge-
braicamente cerrado. Sean f, g ∈ K[X1 , . . . , Xn ] dos polinomios en n variables con coeficientes
en K, de grados respectivos d y r con respecto a la variable Xn . Supongamos d ≥ 1 y r ≥ 1.
Supongamos:
f := ad Xnd + ad−1 Xnd−1 + · · · + a0 ∈ K[X1 , . . . , Xn−1 ][Xn ],
g := br Xnd + br−1 Xnr−1 + · · · + b0 ∈ K[X1 , . . . , Xn−1 ][Xn ],
donde ai , bj ∈ K[X1 , . . . , Xn−1 ], para cada i, 0 ≤ i ≤ d, y cada bj , con 0 ≤ j ≤ r. Donde,
además, ad , br ∈ K[X1 , . . . , Xn−1 ] \ {0}. Los polinomios f y g definen las siguientes hiper-
superficies en An (K) := Kn :
V1 := VA (f ) := {x ∈ An (K) : f (x) = 0},
V2 := VA (g) := {x ∈ An (K) : g(x) = 0}.
Consideremos, además, la proyección canónica πn : Kn −→ Kn−1 que “olvida” la última coor-
denada. Nos queremos hacer preguntas sobre la proyección πn (V1 ∩ V2 ) y sobre la intersección
V1 ∩ V2 de ambas hiper-superficies. Obsérvese que
πn (V1 ∩ V2 ) = {x ∈ Kn−1 : ∃ζ ∈ K, (x, ζ) ∈ V1 ∩ V2 }.
Por el apartado i) de la Proposición 3.6.17 concluimos que ResXn (f, g) ∈ (f, g)c = (f, g) ∩
K[X1 , . . . , Xn−1 ]. Es decir, ResXn (f, g) están en el anillo K[X1 , . . . , Xn−1 ] y está en el ideal
(f, g). Por tanto,
∀ζ ∈ Kn , f (ζ) = 0, g(ζ) = 0 =⇒ ResXn (f, g)(ζ) = 0.
O, equivalentemente, como ResXn (f, g) es un polinomio que sólo depende de las variables
X1 , . . . , Xn−1 , se tendrá:
∀ζ := (ζ1 , . . . , ζn ) ∈ Kn , ζ ∈ V1 , ζ ∈ V2 =⇒ ResXn (f, g)(ζ1 , . . . , ζn−1 ) = 0.
Como (ζ1 , . . . , ζn−1 ) = πn (ζ), habremos probado que

πn (V1 ∩ V2 ) ⊆ VA (ResXn (f, g)) := {x ∈ Kn−1 : ResXn (f, g) = 0}.
Sea ζ := (ζ1 , . . . , ηn ) ∈ Kn y consideremos los polinomios
F (Xn ) := ad (ζ1 , . . . , ζn−1 )Xnd + ad−1 (ζ1 , . . . , ζn−1 )Xnd−1 + · · · + a0 (ζ1 , . . . , ζn−1 ) ∈ K[Xn ],
G(Xn ) := br (ζ1 , . . . , ζn−1 )Xnd + br−1 (ζ1 , . . . , ζn−1 )Xnr−1 + · · · + b0 (ζ1 , . . . , ζn−1 ) ∈ K[Xn ].
Supongamos que ad (ζ1 , . . . , ζn−1 ) 6= 0 y que br (ζ1 , . . . , ζn−1 ) 6= 0 y consideremos la matriz de
Sylvester con respecto a Xn asociada a F y G: SylvXn (F, G). De otro lado, consideremos
la matriz de Sylvester de f y g con respecto a la variable Xn : SylvXn (f, g). Observamos
que SylvXn (f, g) es una matriz cuyas coordenadas están en K[X1 , . . . , Xn−1 ]. Escribiremos
SylvXn (f, g)(ζ1 , . . . , ζn−1 ) ∈ M(d+r) (K) para designar a la matriz obtenida sustituyendo las
variables X1 , . . . , Xn−1 de las coordenadas de la matriz SylvXn (f, g) por los valores ζ1 , . . . , ζn−1 .
Observamos que
SylvXn (F, G) = SylvXn (f, g)(ζ1 , . . . , ζn−1 ).
De otro lado, como ResXn (f, g) es el determinante de la matriz SylvX−n (f, g), y el determinante
es un polinomio en las coordenadas de las matrices, si sustituimos las variables X1 , . . . , Xn−1
por la constantes ζ1 , . . . , ζn−1 de los polinomios que forman las coordenadas de la matriz
SylvXn (f, g) y procedemos, después, calculando el determinante de esa matriz produce el mismo
resultado que si calculamos el determinante de la matrix SylvXn (f, g) (que es un polinomio en
K[X1 , . . . , Xn−1 ]) luego sustituimos las variables X1 , . . . , Xn−1 por las constantes ζ1 , . . . , ζn−1 .
Es decir, se tiene:

det SylvXn (f, g)(ζ1 , . . . , ζn−1 ) = ResXn (f, g)(ζ1 , . . . , ζn−1 ).
Por tanto, tenemos la propiedad siguiente para cualquier punto ζ 0 := (ζ1 , . . . , ζn−1 ) ∈ Kn−1 :
si ad (ζ 0 ) 6= 0 y br (ζ 0 ) 6= 0, entonces:
ResXn (f, g)(ζ 0 ) = 0 =⇒ ResXn (f (ζ1 , . . . , ζn−1 , Xn ), g(ζ1 , . . . , ζn−1 , Xn )) = 0,
Como F (Xn ) := f (ζ1 , . . . , ζn−1 , Xn ) y G(Xn ) := (ζ1 , . . . , ζn−1 , Xn ) son univariados de grados
respectivos d y r, si su resultante es nula es porque existe θ ∈ K tal que
F (θ) := f (ζ1 , . . . , ζn−1 , θ) = 0, G(θ) := g(ζ1 , . . . , ζn−1 , θ) = 0.
En otras palabras, hemos probado que
VA (ResXn (f, g)) \ (VA (ad ) ∪ VA (br )) ⊆ πn (V1 ∩ V2 ),
donde
VA (ResXn (f, g)) \ (VA (ad ) ∪ VA (br )) := VA (ResXn (f, g)) \ {ζ 0 ∈ Kn−1 : ad (ζ 0 ) 6= 0, br (ζ 0 ) 6= 0}.
Por lo anterior, habremos probado:
VA (ResXn (f, g)) \ (VA (ad ) ∪ VA (br )) = πn (V1 ∩ V2 ) \ (VA (ad ) ∪ VA (br )) .
En particular, si f y g son mónicos con respecto a la variable Xn , tendremos que los ceros
de la resultante son exactamente los puntos de la proyección de la intersección. Es decir si
ad , bf ∈ K× , se tiene:
VA (ResXn (f, g)) = πn (V1 ∩ V2 ).
Finalmente, vamos con una forma de usar la resultante que es esencialmente para detectar si
una intersección de dos hiper-superficies es o no vacı́a. Usando la afirmación ii) en Proposición
×
3.6.17 tendremos que si ResX−n (f, g) ∈ (K[X1 , . . . , Xn−1 ]) = K× (si es una constante no
nula), entonces 1 ∈ (f, g) y concluimos que existe h1 , h2 ∈ K[X1 , . . . , Xn ] tales que
1 := h1 f + h2 g.
Debe notarse que no estamos usando la Identidad de Bézout (Teorema 3.2.7) dado que si n ≥ 2
el anillo K[X1 , . . . , Xn ] no es dominio de ideales principales. Si existiera ζ ∈ V1 ∩ V2 , entonces,
1 = h1 (η)f (ζ) + h2 (ζ)g(ζ) = 0 + 0 = 0,
lo que nos llevarı́a a contradicción. Por tanto, hemos probado que
ResXn (f, g) ∈ K× =⇒ V1 ∩ V2 = ∅,
o, equivalentemente,
ResXn (f, g) ∈ K× =⇒ ¬ [∃x ∈ Kn , f (x) = g(x)) = 0] .
Finalmente, supongamos que f y g son mónicos con respecto a la variable Xn , y si suponemos
que ResXn (f, g) 6∈ K× (es decir ResXn (f, g) es o bien el polinomio nulo o bien un polinomio no
constante). Como K es un cuerpo algebraicamente cerrado, entonces existe ζ 0 ∈ Kn−1 tal que
ResXn (f, g)(ζ) = 0. Por el enunciado del Problema 160, ha de existir un punto ζ 0 ∈ Kn−1 tal
que ResXn (f, g)(ζ 0 ) = 0. Como f y g son mónicos con respecto a Xn sabemos que πn (V1 ∩ V2 )
es el conjunto de ceros en Kn−1 de ResXn (f, g). En ese caso, V1 ∩ V2 6= ∅ (la proyección del
vacı́o es el vacı́o). Por tanto, hemos probado que, si f y g son mónicos con respecto a la variable
Xn , se tiene:
ResXn (f, g) 6∈ K× ⇐⇒ ∃ζ ∈ Kn , f (ζ) = g(ζ) = 0.
Lo discutido en este Ejemplo se resume en la siguiente Proposición:

Proposición 3.6.19 (Preludio del Nullstellensatz). Sea K un cuerpo algebraicamente cer-
rado. Sean f, g ∈ K[X1 , . . . , Xn ] dos polinomios en n variables con coeficientes en K, de grados
respectivos d y r con respecto a la variable Xn . Supongamos d ≥ 1 y r ≥ 1. Supongamos:
f := ad Xnd + ad−1 Xnd−1 + · · · + a0 ∈ K[X1 , . . . , Xn−1 ][Xn ],
g := br Xnd + br−1 Xnr−1 + · · · + b0 ∈ K[X1 , . . . , Xn−1 ][Xn ],
donde ai , bj ∈ K[X1 , . . . , Xn−1 ], para cada i, 0 ≤ i ≤ d, y cada bj , con 0 ≤ j ≤ r. Donde,
además, ad , br ∈ K[X1 , . . . , Xn−1 ] \ {0}. Los polinomios f y g definen las siguientes hiper-
superficies en An (K) := Kn :
V1 := VA (f ) := {x ∈ An (K) : f (x) = 0},
V2 := VA (g) := {x ∈ An (K) : g(x) = 0}.
Sea πn : Kn −→ Kn−1 la proyección que “olvida” la última coordenada de los puntos en Kn .
Sea ResXn (f, g) ∈ K[X1 , . . . , Xn−1 ] la resultante de f y g con respecto a la variable Xn . Se
tienen las siguientes propiedades:
i) La proyección de la intersección está contenida en la hiper-superficie definida por la
resultante de f y g. Es decir,
πn (V1 ∩ V2 ) ⊆ VA (ResXn (f, g)) := {x ∈ Kn−1 : ResXn (f, g) = 0}.
ii) Fuera de las hipersuperficies donde se anulan los coeficientes directores, los ceros de
la resultante ResXn (f, g) coinciden con la proyección de la intersección. Es decir:
VA (ResXn (f, g)) \ (VA (ad ) ∪ VA (br )) = πn (V1 ∩ V2 ) \ (VA (ad ) ∪ VA (br )) ,
donde
(VA (ad ) ∪ VA (br )) := {ζ 0 ∈ Kn−1 : ad (ζ 0 ) 6= 0, br (ζ 0 ) 6= 0}.
iii) En particular, si f y g son mónicos con respecto a la variable Xn , tendremos que los
ceros de la resultante son exactamente los puntos de la proyección de la intersección.
Es decir si ad , bf ∈ K× , se tiene:
VA (ResXn (f, g)) = πn (V1 ∩ V2 ).
iv) Si la resultante es una constante no nula, entonces V1 ∩ V2 = ∅. Es decir,
ResXn (f, g) ∈ K× =⇒ ¬ [∃x ∈ Kn , f (x) = g(x)) = 0] .
v) Si f y g son mónicos con respecto a la variable Xn , se tiene:
ResXn (f, g) 6∈ K× ⇐⇒ ∃ζ ∈ Kn , f (ζ) = g(ζ) = 0.
Observación 3.6.20. Veremos más adelante que basta con que uno de los dos polinomios f o
g sea mónico para disponer de las equivalencias. También veremos cóno la última afirmación
preludia el Nullstellensatz (ver Teorema 8.5.2). Nótese, además, que he usado la expresión
“eliminación”. La idea viene del término “eliminación de cuantificadores” de la Lógica: se
trata de eliminar cuantificadores en una expresión matemática que los tiene. Ası́, la expresión
∃ζ ∈ Kn , f (ζ) = g(ζ) = 0,
contiene un cuantificador existencial ∃ y se pretende “eliminar”, es decir, quitarlo de esa ex-

presión, modificando la expresión hasta hallar otra equivalente en la que no haya cuantificadores.
La resultante ayuda en esta tarea dado que, en el caso de que ambos polinomios sean mónicos,
hemos probado que la expresión anterior es equivalente a la siguienet:
ResXn (f, g) 6∈ K× .
Ese es el espı́ritu del Nullstellensatz de Hilbert-Kronecker-Netto que analizaremos en el Capı́tulo
8.
Problema 136. Usando las matrices Sm (f ) que se describen en la Sección 3.6, hay que probar
que la división euclı́dea en el anillo de polinomios es, en realidad, la resolución de un sistema
de ecuaciones lineales compatible y determinado. Describe ese sistema de ecuaciones.
Problema 137. Prueba las siguientes afirmaciones:
i) Verificar que si K = Q es el cuerpo de los racionales, el siguiente conjunto no es ideal
en Q[X]:
{f ∈ Q[X] : f (0) ∈ Z}.
ii) Verificar que si a ∈ Q, el conjunto siguiente es un ideal principal de Q[X]:
ma := {f ∈ Q[X] : f (a) = 0}.
Hallar un generador. Comprobar que ma no es subanillo de Q[X] y que 1 6∈ ma .
iii) Si a ∈ C es un número complejo, algebraico sobre Q. Describir quién es el siguiente
conjunto:
ma := {f ∈ Q[X] : f (a) = 0}.
¿ Es ideal principal?, ¿Quién es su generador?.
iv) Hacer el mismo análisis de ma cuando a ∈ C es un número trascendente sobre Q.
Problema 138. Verifica el número de divisiones para hallar el máximo común divisor mediante
el método de Euclides en los casos siguientes. Intenta comparar con aplicar el método escolar
basado en la Criba de Eratóstenes.
i) a = 8633, b = 4171
ii) a = 15251, b = 1751,
iii) a = 123521, b = 20467,
iv) a = 942373, b = 6589,
v) a = 1015103, b = 1073287.
3.6.5.1. Ecuación de Pell en el caso m = 2. Se conoce como ecuación de Pell a la
resolución de la ecuación X 2 − mY 2 − 1 = 0, con m ∈ N un entero positivo y soluciones no
triviales (x, y) ∈ Z2 . En esta secuencia de problemas √
estudiaremos la ecuación de Pell en el
caso m = 2 y estudiaremos el grupo de las unidades Z[ 2]× .
Problema
√ 139 (Ecuación de Pell √ en el caso m = 2. Parte I). Consideremos el anillo
Z[ 2] y las dos inmersiones de Q( 2) en C:
√
I, σ : Q( 2) ,→ C,
√ √ √
√ I es la inclusión canónica y σ(a + b 2) = a − b 2. Nótese que tanto Z[ 2] como
donde
σ(Z[ 2]) son subconjuntos de la recta real R. Se pide:
√
i) Probar que para cada λ ∈ Z[ 2], se tiene
λ + σ(λ)
∈ Z.
2
√ ×
ii) Probar que si λ ∈ Z[ 2] es una unidad, entonces λσ(λ) ∈ {±1}.
√ −1 √
iii) Probar que 1 + 2 = 2 − 1.
√ √
iv) Probar que si λ ∈ Z[ 2]× , λσ(λ) = 1 y si 1 ≤ λ < 1 + 2, entonces
√ √
2 λ + σ(λ) 2
≤ <1+ .
2 2 2
Concluir que, entonces, λ + σ(λ) = 2.
√ ×
v) En las condiciones
√ del item precedente, concluir que si λ ∈ Z[ 2] es una unidad y si
1 ≤ λ < 1 + 2, entonces λ = 1.
Problema 140 (Ecuación de Pell en el caso m = 2. Parte II). Con las notaciones del
problema precedente, se pide:
√ √
i) Probar que si λ ∈ Z[ 2], 1 < λ < 1 + 2 y si λσ(λ) = −1, entonces
√
−1 < σ(λ) < 1 − 2.
√ √
ii) Con las condiciones del item precedente, concluir que si λ ∈ Z[ 2], 1 < λ < 1 + 2 y
λσ(λ) = −1, entonces
λ + σ(λ)
0< < 1,
2
y, por tanto, este caso no es posible. √ √
iii) Concluir que no hay unidades
√ × λ ∈ Z[ 2]× tales que 1 < λ < 1 + 2.
iv) Probar que si λ ∈ Z[ 2] es una unidad tal que λ > 1, entonces, existe un único
número natural n ∈ N positivo tal que
√ n √ n+1
1+ 2 ≤λ< 1+ 2 .
√ m √ √
v) Probar que { 1 + 2 : m ∈ Z} ⊆ Z[ 2]× . Concluir que si λ ∈ Z[ 2]× es una
unidad tal que λ > 1 y si n es el exponente del item precedente, entonces
λ √
1 ≤ η := √ n < 1 + 2 ,
1+ 2
√
y, η ∈ Z[ 2]× . √
vi) Concluir que si λ√∈ Z[ 2]× es una unidad y si λ > 1, entonces, existe un único n ∈ N
n
tal que λ = 1 + 2 .
Problema 141 (Ecuación de Pell en el caso m = 2. Parte III). Con las notaciones del
problema precedente, se pide:
√
i) Probar que si λ ∈ Z[ 2]× es una unidad y si 0 √< λ < 1, entonces 1/λ es una unidad
que satisface 1/λ > 1. Concluir que si λ ∈ Z[ 2]× es una unidad y si 0 < λ < 1,
entonces existe n ∈ N positivo tal que
√ −n
λ= 1+ 2 .
√ √
ii) Probar que si λ ∈ Z[ 2]× es una unidad y si −1 < λ < 0, entonces −1/λ ∈ Z[ 2]× y
−1/λ > 1. Concluir que, en este caso, existe n ∈ Z tal que
√ n
η =− 1+ 2 .
√
iii) De modo análogo al item precedente, probar que si si λ ∈ Z[ 2]× es una unidad y si
λ < −1, entonces existe n ∈ Z tal que
√ n
η =− 1+ 2 .
√
iv) Concluir la siguiente igualdad que caracteriza las unidades de Z[ 2]× :
√ √ n
Z[ 2]× := {± 1 + 2 : n ∈ Z}.
Problema 142 (Ecuación

√ de Pell en el caso m = 2. Parte IV). Probar que el grupo
multiplicatizo (Z[ 2]× , ·) es isomorfo al grupo producto Z× × Z, donde la operación en Z× es
el producto y la operación en Z es la suma de números enteros.
3.6.5.2. El algoritmo de Berlekamp. La siguiente serie de problemas muestra un al-

goritmo de factorización de polinomios sobre un cuerpo finito, conocido como algoritmo de
Berlekamp ([Be, 1970]).
Problema 143. Pruébese la siguiente propiedad, base del algorimo de factorización de Berlekamp;
Sea Fq el cuerpo finito de q elementos. Sea g ∈ Fq [T ] un polinomio cualquiera, entonces, se
tiene : Y
g(T )q − g(T ) := (g(T ) − x)
x∈Fq
Qr
Problema 144. Supongamos ahora que f := i=1 fi es una factorización de un polinomio
f ∈ Fq [T ], sabiendo que
gcd(fi , fj ) = 1,
i.e. suponemos que f no posee factores irreducibles múltiples.
Consideremos el anillo cociente :
R := Fq [T ]/(f )
Para cada g ∈ Fq [T ], denotemos por g ∈ R su clase módulo f . Pruébese la siguiente afirmación :
Para cada g ∈ Fq [T ] tal que g q − g = 0 es cierta en R, y para cada factor irreducible fi de f ,
existe un único xi ∈ Fq tal que :
f | g(T ) − xi
en Fq [T ].
Problema 145. Con las anteriores notaciones, pruébese la siguiente afirmación:
Para cada punto (x1 , . . . , xr ) ∈ Frq existe un polinomio g ∈ Fq [T ] de grado estrictamente menor
que el grado de f tal que :
gq − g = 0 en R y g + (fi ) = xi + (fi ) en Fq [T ]/(fi ).
( Hint: Se requiere el uso del Teorema Chino de los Restos en Fq [T ]. Buscar información más
adelante en este mismo texto.)
Problema 146. Con las anteriores notaciones, pruébese la afirmación siguiente:
El conjunto de polinomios g ∈ Fq [T ] de grado menor estricto que el grado de f y tales que
g q − g = 0 en R es un Fq −espacio vectorial cuya dimensión coincide con el número de factores
irreducibles de f .
Problema 147. Defı́nase, usando los Problemas precedentes, un algoritmo que decide si un
polinomio univariado f ∈ Fq [T ], sin factores múltiples, es irreducible o no en Fq [T ].
Problema 148. Diseña un algoritmo que factorice polinomios con coeficientes en el cuerpo
finito Fp , donde p ∈ N es un primo no nulo.
Trata de estimar cuántas operaciones en el cuerpo de coeficientes (operaciones en {+, −, ×, ·−1 }
y tests de signo = 0?) son necesarias para factorizar un polinomio univariado con ese método.
3.6.5.3. Teorema Pequeño de Fermat y Función de Euler.
Problema 149 (Función de Euler). Definiremos la función de Euler φ : N \ {0} −→ N del
modo siguiente :
φ(n) := ]{m ∈ N : m ≤ n, gcd(m, n) = 1}.
Se pide probar las siguientes afirmaciones:
i) La función de Euler es el cardinal del grupo multiplicativo de las unidades de Z/nZ),
es decir,
×
φ(n) = ] (Z/nZ) .
ii) Para cada número natural n ∈ N, n ≥ 2, las siguientes propiedades son equivalentes :
(a) n ∈ Z es primo,
(b) Z/nZ es un dominio de integridad.
(c) Z/nZ es un cuerpo
(d) φ(n) := n − 1
(e) (Z/nZ)× con la operación producto es un grupo abeliano de orden n − 1.
Problema 150 (Teorema Pequeño de Fermat (versión débil)). Probar la siguiente afir-
mación:
Sea p ∈ N un número primo y n ∈ N un número natural, entonces
φ(pn ) = pn − pn−1 .
Probar, como consecuencia el teorema Pequeño de Fermat:
Dado n ∈ N un número primo, n ≥ 2. Entonces, para cada x ∈ Z/nZ \ {0}, se tiene :
xn−1 ≡ 1 mod n.
Verifica que esta propiedad no caracteriza a los números primos. Desgraciadamente hay más
números que los números primos verificando esta propiedad. Son los llamados números de
Carmichael. El más pequeño número de Carmichael conocido que no es primo es 561. Prueba
que no es primo y sı́ verifica la condición del Teorema Pequeño de Fermat. Busca información
adicional sobre los números de Carmichael en Wikipedia e incorpóralo al Problema.
Problema 151 (Teorema Pequeño de Fermat (versión fuerte)). Prueba el siguiente
enunciado usado por [Pr, 1975]:
Un número natural n ∈ N, n ≥ 2 es un número primo si y solamente si una cualquiera de las
siguienets condiciones son equivalentes :
i) (Z/nZ)× es un grupo cı́clico de orden n − 1,
ii) La ecuación X n−1 − 1 posee una raı́z primitiva en el anillo Z/nZ.
Problema 152. Prueba que la función de Euler satisface: φ(1) = 1 y para n ≥ 2 se tiene:
X
φ(m) = n
m|n
Problema 153 (La función de Euler es multiplicativa). Prueba que la función de Euler
es multiplicativa. Es decir, dados n, m ∈ N, n, m ≥ 2 dos números naturales coprimos (i.e.
gcd(m, n) = 1), entonces
φ(nm) = φ(n)φ(m).
Concluir que si p y q son dos primos no nulos y distintos en Z, entonces
φ(pq) = (p − 1)(q − 1).
Hint: usa el teormea de los Chinos sobre Z (visto en Introducción al Lenguaje Matemático) o
la versión más avanzada en Teorema 5.2.2.
3.6.5.4. El Sistema Criptográfico RSA. Lo que sigue es una serie de problemas que
explican el funcionamiento interno del sistema criptográfico RSA a través de una serie de sen-
cillos problemas (cf. [RSA, 1978]).
Problema 154 (RSA: Definición de Clave Pública). Se trata de suponer una red de
usuarios (tipo internet o cualquier red social) que ponen a disposición de todo el mundo una
clave pública. Si los mimebros de esa red son los elementos de un conjunto I, cada individuo
publicará una clave pública Ni que será visible para todo miembro de la red. El siguiente proceso
determina como un individuo i prepara su clave pública Ni := (n, e).
• El individuo i elige dos números primos grandes que ólo él conoce y que denotaremos
por p y q. Para ello usará distintos Tests de Primalidad disponibles en el mercado.
• El individuo prepara su clave pública n := pq, pero se reserva el coocimiento de p y
q. Adicionalmente, calcula la función de Euler φ(n) = (p − 1)(q − 1). Prueba que
existen primos p y q tales que p < q < 2p, para p suficentemente grande. Pruébese que
n y φ(n) son co-primos en este caso. El valor de la función de Euler φ(n) se oculta
provisionalmente para preparar las claves.
• Seguidamente el individuo halla un elemento e ∈ N tal que 1 < e < φ(n) y tal que
gcd(e, φ(n)) = 1. Pruébese que ese elemento e existe.
• Pruébese que, en el caso p < q < 2p, el resto e de la división de n por φ(n) puede ser
elegido para ese propósito. Pruébese que ese resto vale e = p + q − 1. Nótese que, sin
embargo, eligiendo e como ese resto, cualquier agente de la red pública descubrirá los
mensajes que se envı́en hacia el miembro que haya elegido e como clave.
• Pruébese que el número e elegido anteriomente posee inverso en el anillo cociente

Z/φ(n)Z.
• Hállese el inverso d ∈ N de e en Z/φ(n)Z. Hint: usar la Identidad de Bézout con
cotas en Z (ver Corolario 3.4.7).
El usuario define su clave pública como el par de números enteros (n, e). El usuario se guarda
su clave privada d y tira todo el resto de la infromación y los cálulos realizados. Verifica que si
se conoce el valor de la función de Euler φ(n), se puede conocer la clave privada d. Verifica que
la función de Euler se puede conocer a partir de los dos primos p y q. Deduce que factorizar
número enteros dados como producto de dos primos, permite “romper” la clave privada de todo
usuario de esa red encriptada.
Problema 155. Verifica que, en el sistema de clave pública anterior, si de un usuario i se
conocen su clave pública (n, e) y su clave privada d, se pueden hallar los dos números primos
p y q de la factorización de n. Verifica también que se puede calcular fácilmente la función de
Euler φ(n) a partir de n, d y e.
Problema 156 (Codificación y decodificación de un mensaje en RSA). Los mensajes
se presentan como números, bien usando usna asignación de números de dos dı́gitos a cada
sı́mbolo del teclado o por otro medio (alfabeto ASCII, por ejemplo, buscar en wiki ASCII y
su codificación en base 2). El individuo i (con clave pública (ni , ei ) quiere enviar un mensaje
M ∈ N al individuo j (con clave pública (nj , ej )). Para empezar elige M con gcd(M, nj ) = 1
×
(es decir, M ≤ nj − 1 y M ∈ (Z/nj Z) ). En caso de que no sea ası́, el individuo i trocea M en
varias partes, cada una de las cuales es menor que nj − 1 y es unidad. Proceden como sigue:
i) El emisor i del mensaje procede como sigue :
• Calcula el criptograma C := M ej (mod nj ) y lo expone públicamente. Manda un
mensaje al individuo j indicándole que le ha dejado un mensaje. Todo el mundo
puede leer el Criptograma C y todos saben que es para el individuo j de parte de
i.
Prueba que el individuo i puede escribir el criptograma C con el sólo conocimiento de
su mensaje y la clave pública del individuo j.
ii) El receptor j del mensaje procede como sigue:

• Calcula el criptograma C 0 := C dj (mod nj ) y lee el mensaje.
Prueba que el receptor j puede hallar C 0 y que recupera el mensaje original M de i,
es decir, prueba que
C 0 = M mod nj .
Problema 157. Usando en sistema criptográfico de clave pública RSA anterior, con varios
usuarios
{(ni , ei ) : i ∈ I},
de tal modo que cada usuario y sólo cada usuario, conoce su clave privada di . Supongamos
que tres individuos i, j, k realizan las tareas siguientes: i envı́a a j el mensaje M siguiendo el
procedimiento anterior. El individuo k puede ver:
• Las claves públicas de i y j : (ni , ei ), (nj , ej ).
• El criptoograma C publicado por i como mensaje a j.
Intenta definir el procedimiento algorı́tmico que debe seguir el individuo k para descrifrar en
mensaje M a partir de esta información. Deduce si es fácil o difı́cil factorizar números enteros.
Explica el error que se produce cuando, en los algoritmos escolares, se enseña a clacular el
máximo común divisor de dos números enteros. Busca en wikipedia algunos de los sistemas de
comunicación segura basados en RSA (ssh, PGP, SSL/TLS, S/MIME). Resume lo que entiendas
sobre estos protocolos.
Problema 158 (Autentificación y Firma Digital). De nuevo supongamos una read formada
por individuos de los que se conocen sus claves públicas:
{(ni , ei ) : i ∈ I}.
Los individuos quieren enviarse mensaje encriptados con la conidicón de que el receptor pueda
verificar que el emisor es el individuo previsto y no otro individuo de la red
haciéndose pasar por él.
El individuo i de clave (ni , ei ) quiere enviar un mensaje M cifrado y firmado al individuo j (de
clave (nj , ej )). Procede como sigue:
• Calcula la siguiente cntidad que sólo él conoce porque s’olo es conoce su clave privada
propia di :
C1 := M di mod ni .
• Calcula:
e
C2 := C1 j mod nj .
y lo hace público a toda la red.
El individuo j puede recuperar la información oroginal sin conocer la clave pribada di del emisor.
Además, puede estar seguro de que esa informaciń viene “firmada” por el individuo i. Procede
como sigue:
• El individuo j debe calcular:
d
C3 := C2 j mod nj ,
y lo puede conocer porque C2 es público y dj es su clave privada que sólo j conoce.
• Posteriormente el individuo j calcula:
C4 := C3ei mod ni .
Verifica que el individuo j puede calcular C4 y que se verifica:
M = C4 mod ni .
Explica por qué ese mensaje de i para j viene firmado por i con su clave digital (privada).
Problema 159. Un sistema de clave pública es seguro por la razón siguiente: En un sistema
basado en “libro de claves”, basta con que un miembro externo a un red {ci : i ∈ I} sobre el
libro de claves de uno de los miembros ci de la red para disponer de toda la información que
los miembros de la red están distribuyendo unos a otros. Es el fallo de sistemas tipo la famosa
máquina Enigma (busca en internet). En cambio en sistema de clave pública (tipo RSA) este
problema no se produce: si alguien roba la clave privada de un miembro, sólo podrá descrifrar
la información que emita el individuo robado, pero no podrá disponer de otra información
circulando en esa red y que no involucre al individuo robado. Explica la razón.
Problema 160. Sea K un cuerpo algebraicamente cerrado y sea p ∈ K[X1 , . . . , Xn ] un poli-
nomio no constante, es decir p 6∈ K× . Entonces, existe un punto ζ ∈ Kn tal que p(ζ) = 0.
( Hint: Por inducción en el número de variables).
CAPı́TULO 4
Ideales Primos y Maximales. Módulos Libres. Con una

coda sobre la Forma Normal de Smith
(Le temps retrouvé)
“Cubum autem in duos cubos, aut quadratoquadratum in

duos quadratoquadratos & generaliter nullam in infinitum
ultra quadratum potestatem in duos eiusdem nominis fas est
dividere cuius rei demonstrationem mirabilem sane detexi.
Hanc marginis exiguitas non caperet”.
Traducción Libre: Es imposible separar un cubo en dos
cubos, una potencia cuarta en dos potencias cuartas o, en
general, una potencia mayor que dos en dos potencias
similares. He encontrado una maravillosa verdadera prueba
de este hecho. Pero no cabe en este margen estrecho.
P. de Fermat, en “Arithmetica” de Diofanto de

Alejandrı́a.
183
184 4. PRIMOS, MAXIMALES. MÓDULOS LIBRES. FORMA NORMAL DE SMITH
Índice
4.1.1. Motivación: El ejemplo de las ecuaciones diofánticas lineales:
Diagonalización, forma normal de Smith y aplicaciones. 185
4.2. Ideales primos e ideales maximales. La noción de rango de un
R−módulo libre. 187
4.2.1. Las nociones y primeras propiedades 187
4.2.2. La noción de rango de un R−módulo libre 192
4.2.3. Generación finita sobre anillos noetherianos es hereditaria 196
4.3. Proyectivos, libres y dominios de ideales principales 197
4.4. Libres y Libres de Torsión sobre dominios de ideales principales 204
4.4.1. Libres de Torsión sobre dominios de ideales principales 204
4.4.2. Libres de torsión sobre dominios euclı́deos (Opcional) 208
4.4.3. Ejercicios y problemas de las secciones 4.2 y 4.3 211
4.4.3.1. Forma (Canónica Racional) de Frobenius de un endomorfismo 212
4.5. Diagonalización de Matrices sobre un DIP 217
4.5.1. Motivaciones 217
4.5.1.1. Ecuaciones diofánticas 217
4.5.2. Matrices de operaciones elementales en GL(2, R) 218
4.5.2.1. Tipo 1: Intercambio de Filas o columnas. 218
4.5.2.2. Tipo 2: Multiplicar a una fila (o columna) por una unidad del
anillo. 218
4.5.2.3. Tipo 3: Sumar a una fila (o columna) un múltiplio de otra fila
(o columna). 219
4.5.2.4. Tipo 4: Encontrar el máximo común divisor. 219
4.5.3. Generalizando a matrices m × n: Operaciones elementales sobre DIP’s 220
4.5.4. Matrices elementales particulares 222
4.5.5. Orlar una matriz 225
4.5.6. “Algoritmo”: Hacer ceros por filas o columnas 226
4.5.6.1. El Caso de Dominios de Ideales Principales. 226
4.5.6.2. El Caso de Dominios Euclı́deos. 226
4.5.7. Hacer ceros en filas y columnas 228
4.5.7.1. El caso de Dominios de Ideales Principales 228
4.5.7.2. El caso de dominios euclı́deos 230
4.5.8. Diagonalización de una matriz sobre un DIP: “algoritmo” primario 230
4.5.9. Resolución de ecuaciones lineales diofánticas 231
4.6. Forma Normal de Smith 234
4.6.1. Estructura de grupos abelianos finitamente generados 237
4.7. Forma de Frobenius y Factores Invariantes de un endomorfismo
sobre un espacio vectorial de dimensión finita. 241
4.7.1. Factores invariantes de un endomorfismo 241
4.7.2. Forma de Frobenius de un endomorfismo: factores invariantes en K[X] 242
4.7.3. El álgebra R[X]/(f ), con f ∈ R[X]mon . 242
4.7.3.1. La Estructura de K[X]−módulo que define un endomorfismo. 245
4.7.4.1. Ecuaciones Diferenciales Ordinarias Homogéneas 254
4.1. Introducción
Este Capı́tulo pretende, sobre todo establecer las claves de los módulos libres de rango finito y la
clasificación de los grupos abelianos finitamente generados. Pero los elementos que intervienen
en las demostraciones elegidas hacen conveniente explorar un espectro más amplio y más propio
del Álgebra Conmutativa. Ası́, comenzaremos revisando las nociones de ideal primo e ideal
maximal y los sustratos de los espacios Spec(R) y MaxSpec(R) donde forman un grafo orientado
no necesariamente finito. Nos facilitará poder definir la noción de rango de un R−módulo libre.
A esto dedicaremos la Sección 4.2.
Seguidamente retomamos las condiciones noetherianas, esta vez orientóndonos a los módulos
finitamente generados sobre anillos noetherianos. En realidad, este estudio es un artificio en
4.1. INTRODUCCIÓN 185
la medida en que lo que nos interesa es el caso de dominios de ideales principales. Pero la
demostración de que la propiedad de generación finita es hereditaria para dominios de ideales
principales o para anillos noetherianos es la misma, ası́ que hemos ptado por darle un poco
más de generalidad. En la Sección ?? estudiaremos con más detalle estos módulos y aquı́ nos
limitaremos a tratar esa condición hereditaria. En todo caso, sigue el pensamiento noetheriano
que, subrepticiamente, se esconde en estas notas.
También dedicaremos un esfuerzo a introducir los módulos proyectivos en la Sección 4.3. Aquı́,
nos interesa fundamentalmente el caso de módulos sobre dominios de ideales principales, noción
que es equivalente a la de módulo libre en el caso finitamente generado. No será equivalente en
el caso más general. Esta equivalencia no será cierta para el caso de anillos de coeficientes más
generales, de ahı́ un tratamiento más amplio en la Sección ??.
El uso de la terminologı́a de módulos proyectivos sobre dominios de ideales principales nos per-
mite una demostración más directa y elegante del Teorema de Dedekind, del que nos ocuparemos
en la Sección 4.3.
Disponiendo ya del Teorema de Dedekind, es sencillo probar que un módulo sobre un DIP
es libre y de rango finito si y solamente si es finitamente generado y libre de torsión (i.e. el
módulo no posee divisores de cero en el anillo). A eso dedicamos la Sección ??. De nuevo,
la equivalencia no será cierta para anillos más generales, exceptuando el caso del Teorema de
Quillen-Suslin.
Finalmente, debemos ocuparnos de la motivación de estos estudios, que será también, el punto
de partida del Tema.
4.1.1. Motivación: El ejemplo de las ecuaciones diofánticas lineales: Diagonal-

ización, forma normal de Smith y aplicaciones. Hasta aquı́ la abstracción del Capı́tulo,
pero es necesario finalizar con respuestas a preguntas de carácter más terrestre que subyacen
a todo el discurso. La primera pregunta es ¿por qué trabajar con módulos sobre anillos?. Y,
más técnicamente, ¿por qué preocuparse por grypos abelianos finitamente generados (esto es,
Z−módulos)?. El origen está en las ecuaciones diofánticas lineales, esto es, se trata de enfrentar
el siguiente
Problema Clásico 4.1.1 (Ecuaciones diofánticas lineales). Sean dados:
i) Una matriz A ∈ Mm×n (Z) con m filas, n columnas y coordenadas enteras.
ii) Un elemento B ∈ Zm dado como columna.
iii) Una columna de variables X:
 
X1
 X2 
X :=  .  .
 
 .. 
Xn
Resolver el sistema de ecuaciones lineales diofántico:
(4.1.1) AX = B.
Para resolverlo se deben responder las siguientes preguntas:
• Q1: ¿Es el sistema (4.5.1) compatible (consistente o satisfactible) sobre Z n ?. Es decir,
respóndase a la siguiente pregunta:
∃x := (x1 , . . . , xn ) ∈ Zn , Axt = B?,
donde xt significa traspuesta de x.
• Q2 Si el sistema (4.5.1) es compatible en el sentido de Q1, hallar una solución par-
ticular x0 ∈ Rn de ese sistema.
• Q3 Da una descripción completa del conjunto de todas las soluciones del sistema
(4.5.1).
Obviamente, a la manera clásica, las soluciones completas (Pregunta Q3) están relacionads con
el conocimiento del conjunto de soluciones del sistema homogéneo asociado:
(4.1.2) AX = 0t ,
donde 0t es la traspuesta del vector (0, . . . , 0) ∈ Zm .

El conjunto de las soluciones de este sistema de ecuaciones es un submódulo de Zn y, por ser Zn
noetheriano, es un Z−módulo finitamente generado. El Teorema de Dedekind nos dirá que es un
submóudlo libre del módulo libre Zn y que tiene rango acotado por n. Esto, por sı́, ya justifica
el intento de comprender los módulos finitamente genrados sobre anillo noetherianos y, de paso,
los Z−módulos finitamente generados (que no es otra cosa que los grupos abelianos finitamente
generados). Más aún, las preguntas Q1 y Q2 requieren de alguna forma de diagonalización de
matrices aunque,a diferencia del caso de matrices sobre un cuerpo, con los anillos no disponemos
de elemento inverso salvo que el elemento sea unidad.
A partir de este sencillo ejemplo, entramos en la diagonalización (hasta donde es posible) de
matrices sobre un DIP (a lo que dedicamos la Sección 4.5, donde daremos un pseduo-algoritmo
de digonalización de matrices sobre un DIP, para el cual la condición noetheriano es esencial
para probar la finitud de los cálculos sobre un Input dado.
Si bien la mera “diagonalización sobre un DIP” puede ser suficiente para responder a las pregun-
tas Q1, Q2 y Q3 anteriores, es calro que un matemático se siente intrigado por aspectos como
la unicidad de las diagonalizaciones y esto conduce a un resultado clásico del matemático H.J.S.
Smith (cf. [Smith, 1861]) quien establece una forma natural de escribir esa diagonalización
y que es conocida como Forma Normal de Smith. Los elementos de la diagonal son únicos
salvo unidades si están ordenados por divisibilidad y se conocen como factores invariantes de
la matriz. A establecer este resultado dedicamos la Sección 4.6.
Dos aplicaciones naturales (en dos contextos, sólo aparentemente, distintos) se siguen de la
exploración de las ideas de Smith. La primera es el Primer Teorema de Estructura de los
grupos abelianos finitamente generados (Teorema 4.6.3 de la Subsección 4.6.1). Dicho Teorema
establece que todo grupo abeliano finitamente generado es isomorfo a un único Z−módulo de
la forma: !
Yr
(Z/di Z) × Zr ,
i=1
donde d1 , . . . , dr ∈ N son números enteros positivos (di > 0) y Zr es la “parte” libre de torsión
del grupo abeliano.
La segunda aplicación tiene que ver con Teorı́a del Endomorfismo. Dado un endomorfismo
f : V −→ V , sobre un espacio vectorial V de dimensión finita sobre un cuerpo K, disponemos
de una estructura de K[X]−módulo sobre K. Esta estructura induce una relación de seme-
janza entre matrices que proviene de isomorfismos de K[X]−módulos y permiten descomponer
una matriz (salvo semejanza) en suma diaginal de matrices compañeras. Esto se expone y se
explica (con más dedicación de lo que es habitual en los textos de ÁLgebra Lineal al uso) en la
Subsección 4.7. Esencialmente, toda matriz cuadrada M ∈ Mn (K), donde K es un cuerpo, es
semejante a una matriz suma diagonal de matrices compañeras, esto es de la forma:
 
C(f1 ) 0 0 0
 0 C(f2 ) 0 0 
(4.1.3) ..  ,
 
 .. .. . .
 . . . . 
0 0 0 C(fr )
donde C(fi ) quiere decir matriz compañera del polinomio fi ∈ K[X] y fi | fi−1 , para cada
i. Esta forma se conoce como Forma de Frobenius de un endomorfismo y se presenta en esta
Sección. Los polinomios f1 , . . . , fr ∈ K[X] son precisamente los factores invariantes de XIdn −
M como matrix en Mn (K[X]), recordando que K[X] es un dominio de ideales principales.
Una de las consecuencias clásicas más inmediatas es que toda ecuación diferencial lineal ho-
mogénea con coeficientes constantes es equivalente (salvo semejanza) a una unión independiente
(suma diagonal) de ecuaciones diferenciales lineales homogéneas de la forma más simple:
dx d(n−1) x dn x
(4.1.4) a0 x + a1 + · · · + an−1 (n−1) + n = 0.
dt dt dt
donde a0 , . . . , an−1 ∈ R. Con las condiciones iniciales en un punto t0 ∈ R dadas mediante:
dx dn x
x(t0 ) = v0 , (t0 ) = v1 , . . . , n (t0 ) = vm .
dt dt
4.2. PRIMOS, MAXIMALES, RANGO 187
En este sentido, los R[X]−módulos se encuentran con esta manera de descomponer las ecua-
ciones diferenciales lineales y, además, esta descomposición es algorı́tmicamente calculable en
tanto en cuanto los coeficientes de las matrices ivolucradas vvan en un cuerpo computable.
Ciertamente, los objetivos se podrı́an haber abordado con menos aparato teórico, pero el aparto
teórico tiene sus orı́genes en la comprensión de los fenómenos subyacentes al caso particular,
un fenómeno común en Matemáticas.
4.2. Ideales primos e ideales maximales. La noción de rango de un R−módulo

libre.
4.2.1. Las nociones y primeras propiedades.
Definición 68 (Ideales Primos o Maximales. Anillos Locales.). Sea R un anillo:

i) Un ideal propio p ( R, se llama primo si el anillo cociente R/p es un dominio de
integridad. Denotaremos por Spec(R) al conjunto de todos los ideales primos del anillo
R y lo denominaremos espectro primo de R.
ii) Un ideal propio m ( R, se llama maximal si el anillo cociente R/m es un cuerpo.
Denotaremos por MaxSpec(R) al conjunto de todos los ideales maximales del anillo R
y lo denominaremos espectro maximal de R.
Un anillo se dice anillo semi-local si su espectro maximal es finito (i.e. MaxSpec(R) es un
conjunto finito. El anillo se dice local si sólo posee un ideal maximal (i.e. ] (MaxSpec(R)) = 1).
Ejemplo 4.2.1.
i) Un anillo R es dominio de integridad si y solamente si (0) ∈ Spec(R).
ii) Todo ideal maximal es obviamente primo (y tenemos MaxSpec(R) ⊆ Spec(R)), pero
el recı́proco no es cierto en general. Ası́, (0) ∈ Spec(Z) \ MaxSpec(Z) 6= ∅.
iii) Obviamente si K es un cuerpo Spec(K) = MaxSpec(K) = {(0)} y ambos espectros
están constituidos por un único elemento. En particular, los cuerpos son anillos locales.
iv) En un dominio de ideales principales, un ideal p = (p) es un ideal primo si y solamente
si el generador p es un elemento primo o, equivalentemente, irreducible.
v) En un dominio de ideales principales, los ideales maximales son los ideales primos no
nulos.
vi) Consideremos K un cuerpo, K[X1 , . . . , Xn ] el anillo de polinomios en n variables con
coeficientes en K. Consideremos x = (z1 , . . . , zn ) ∈ K n un punto en el espacio afı́n
n−dimensional sobre K y consideremos la siguiente función:
evx : K[X1 , . . . , Xn ] −→ K
p(X1 , . . . , Xn ) 7−→ p(x) := p(z1 , . . . , zn ).
Es sencillo observar que evx es un morfismo de anillos y que es un epimorfismo. El
núcleo de evx viene dado por la siguiente identidad:
ker(evax ) = {p ∈ K[X1 , . . . , Xn ] : p(x) = 0}.
Denotaremos por mx al ker(evζ ) y obseramos que mx es un ideal maximal porque
K[X1 , . . . , Xn ]/mx ∼
= K.
De hecho, tenemos una identificación del espacio afı́n K n con una parte del espectro
maximal y del espectro primo, es decir,
Kn ∼
= {mx : ζ ∈ K n } ⊆ MaxSpec(K[X1 , . . . , Xn ]) ⊆ Spec(K[X1 , . . . , Xn ]).
Una aplicación recursiva de la división euclı́dea por un polinomio mónico (cf. Teo-
rema 1.4.15) prueba fácilmente que mx es el ideal generado por los polinomios {X1 −
z1 , . . . , Xn − zn }, donde x = (z1 , . . . , zn ). Es decir:
mx = (X1 − z1 , . . . , Xn − zn ).
vii) Una construcción análoca puede hacerse en cualquier anillo de funciones razonable
(R−álgebras o C−álgebras, por ejemplo). Ası́, consideremos el anillo C (C) de fun-
ciones continuas sobre un espacio topológico (X, T ). Consideremos x ∈ X un punto
cualquiera y definamos:
evx : C (X) −→ R
f 7−→ f (x).
De nuevo es un morfismo de anillos, de nuevo es epimorfismo porque es una R−álgebra
(y contiene a las constantes) y, de nuevo, tenemos un ideal maximal dado por el núcleo:
mx := ker(evx ) = {f ∈ C (X) : f (x) = 0}.
Con lo que tenemos una identificación:
X∼ = {mx : ζ ∈ X} ⊆ MaxSpec(C (X)) ⊆ Spec(C (X)).
Volveremos a estas ideas con el Nullstellensatz.
viii) El anillo de series de potencias formales K[[X]] es un anillo local cuyo único ideal
maximal m es el ideal generado por X, i.e. m = (X).
ix) Obviamente, y ya hemos visto ejemplos, los ideales primos y maximales no tienen por
qué ser principales. El ejemplo más inmediato, tras los anteriores, podrı́a ser el ideal
m := (3, X 2 + 1) en Z[X] que es un ideal maximal no principal, cuyo cociente es el
cuerpo de 3 elementos, i.e. Z[X]/m = F3 .
x) Los anillos para los cuales MaxSpec(R) = Spec(R) se denominan anillos de dimensión
cero y si verifican ciertas condiciones de cadena, los llamaremos anillos de Artin (pero
esto corresponde a capı́tulos más avanzados del curso).
xi) Los conjuntos Spec(R) y MaxSpec(R) son conjuntos parcialmente ordenados con re-
specto a la inclusión ⊆. Con esta ordenación tiene una estructura de grafo orientado.
La longitud del camino más largo en Spec(R) se denominará la dimensión de Krull de
R y tiene sentido cuando R es un anillo noetheriano.
Proposición 4.2.2. Las siguientes son caracterizaciones alternativas de ideales primos y ma-
ximales en un anillo R:
• Un ideal p ( R es primo si verifica:
∀x, y ∈ R, xy ∈ p =⇒ (x ∈ p) ∨ (y ∈ p).
• Un ideal m ( R es maximal si y solamente si es maximal en el conjunto de los ideales
propios a ( R, ordenados por la inclusión. Es decir m ( R es maximal si y solamente
si para cualquier ideal propio a ( R, se tiene
m ⊆ a =⇒ m = a.
Demostración. Para la primera de las afirmaciones obsérvese que xy ∈ p es equivalente
a
(x + p)(y + p) = 0, en R/p,
mientras que x ∈ p e y ∈ p son respectivamente equivalentes a
x + p = 0, y + p = 0, en R/p.
Con estas observaciones es clara la equivalencia entre las afirmaciones R/p es dominio de inte-
gridad y la descrita en la primera de las afirmaciones de esta proposición.
Para la segunda afirmación, supongamos que R/m es un cuerpo. Y sea a ( R un ideal propio
de R tal que m ⊆ a. Por la Proposición 2.2.28, el ideal a/m es un ideal del anillo cociente R/m.
Como R/m es un cuerpo y a 6= m, entonces necesariamente
a/m = (0 + m) ⊆ R/m,
con lo que concluiremos que a = m y tendremos la maximalidad de m entre los ideales propios
de Rcon la inclusión ⊆ como relación de orden.
Recı́procamente, si m es un elemento maximal entre los ideales propios de R, entonces el cociente
R/m sólo puede poseer dos ideales: R/m y (0 + m). Supongamos ahora un elemento f ∈ R tal
que f + m 6= 0 + m en R/m. Esto implica que f 6∈ m y, por tanto, tendremos un contenido

estricto de ideales:
m ( m + (f ) ⊆ R.
Como m es un elemeno maximal entre los ideales propios de R, tendremos que m + (f ) = R.
En particular, existirán g ∈ R y m ∈ m, tales que
1 = m + f g.
Pero, entonces,
1 + m = f g + m = (f + m)(g + m),
lo que significa que f + m ∈ (R/m)× es una unidad. Por tanto,
R/m \ {0 + m} = (R/m)× ,
y R/m es un cuerpo.
Observación 4.2.3. Obsérvese que hemos probado que un anillo R es cuerpo si y solamente si
{(0)} = MaxSpec(R) = Spec(R).
Nótese que (0) ∈ Spec(R) si y solamente si R es dominio de integridad y la equivalencia se sigue
de la prueba de la afirmación ii) anterior.
Corolario 4.2.4. Sea R un dominio de ideales principales, entonces

MaxSpec(R) := {(p) : p es irreducible y p 6= 0}.
Es decir, los maximales en los dominios de ideales principales son los ideales primos no nulos
o, equivalentemente, los generados por elementos irreducibles.
Demostración. El resultado es consecuencia inmediata del Teorema 3.2.14. Lo que vamos
a hacer es dar una demostración equivalente, pero descriptiva en términos de ideales maximales.
Supongamos que p 6= 0 es un elemento irreducible de un dominio de ideales principales y sea
m := (p) el ideal que genera. Supongamos a un ideal propio de R tal que
m ⊆ a ( (1) = R.
Entonces, a = (a) por ser R un dominio de ideales principales y a | p. Como p· es irreducible
concluiremos que o bien a ∈ R× ∆ (lo que no es el caso porque (a) = a ( R) o bien a ∼ p (i.e.
son asociados) con lo que (p) = (a) o, equivalentemente, m = a y tenemos la maximalidad de
m. Recı́procamente, si m ∈ MaxSpec(R) es un ideal maximal de R y dado que R es dominio de
ideales principales, existe q ∈ R tal que m = (q). Veamos que q es necesariamente irreducible.
Porque si x | q, entonces, si x 6∈ R× (i.e. x no es unidad), entonces, tenemos m ⊆ (x) ( R, la
maximalidad de m nos indica que m = (x) lo que implica que q ∼ x y hemos probado que q es
irreducible. Dado que los ideales maximales son primos, todo elemento irreducible no nulo es
primo por generar un ideal primo.
Corolario 4.2.5. Si a ( R es un ideal de un anillo R, podemos observar:

i) Los ideales primos del anillo cociente R/a está biyectivamente identificados con los
ideales primos de Spec(R) que contienen al ideal a, mediante la transformación
p 7−→ p/a.
En particular, se tiene:
Spec(R/a) := {p/a : p ⊇ a, p ∈ Spec(R)}.
ii) Los ideales maximales del anillo cociente R/a está biyectivamente identificados con los
ideales maximales de MaxSpec(R) que contienen al ideal a, mediante la transformación
p 7−→ p/a.
En particular, se tiene:
MaxSpec(R/a) := {p/a : p ⊇ a, p ∈ MaxSpec(R)}.
Demostración. Retomamos la Proposición 2.2.28 y los Teoremas de Isomorfı́a. A partir

de los Teoremas de Isomorfı́a, tenemos para cada ideal b ( R de R que contiene a a el ideal del
anillo cociente b/a dado mediante:
b/a := {x + a : x ∈ b}.
Además, tenemos el isomorfismo de anillos:

R/a
ϕ: /b/a −→ R/b
.
(x + a) + (b/a) 7−→ x+b
Por tanto, se tiene:

R/a
• R/b es dominio de integridad si y solamente si /b/a es dominio de integridad.
Traducido, esto significa b ∈ Spec(R)

siy solamente si b/a ∈ Spec(R/a).
R/a
• R/b es cuerpo si y solamente si / b/a es cuerpo. Traducido, esto significa
b ∈ MaxSpec(R) si y solamente si b/a ∈ MaxSpec(R/a).
La identificación entre los ideales de R/a y los ideales en R que contienen a a ya fue discutida
en la Proposición 2.2.28, lo que completa la demostración.
Recordemos de la Proposición 1.4.9 la noción de contracción de un ideal a través de un morfismo

de anillos.
Proposición 4.2.6 (Contracción de primos y maximales). Sea f : R −→ T un morfismo
de anillos y q ∈ Spec(T ) un ideal primo de T . Entonces, la contracción qc := f −1 (q) es un
ideal primo de R. No sucede lo mismo, en general, si reemplazamos “primo” por “maximal”.
Demostración. Consideremos f : R −→ T y la componemos con la proyección π : T −→
T /q y tendremos el morfismo de anillos:
π ◦ f : R −→ T /q.
Usando el primer Teorema de Isomorfı́a (Teorema 2.2.26), tendremos una aplicación inyectiva
(y morfismo de anillos):
ϕ : R/ker(π ◦ f ) −→ T /q.
Con lo que R/ker(π ◦f ) está indentificado con un subanillo de T /q. Además, como q es un ideal
primo de T , el cociente T /q es un dominio de integridad y también son dominios de integridad
todos sus subanillos. En particular, R/ker(π ◦ f ) es un dominio de integridad. Lo único que
falta para probar el enunciado es probar la siguiente igualdad:
−1
ker(π ◦ f ) = (π ◦ f ) ((0)) = f −1 (ker(π)) = f −1 (q) = qc .
Para el caso de los ideales maximales baste con considerar le inclusión i : Z −→ Q y observar
que (0) ∈ MaxSpec(Q), mientras que (0) = i−1 ((0)) no es ideal maximal en Z.
En el enunciado que sigue utilizaremos el Lema (o Axioma) de Zorn. En todo caso, para aquellos
anillos que interesan en este curso (los anillos noetherianos) el enunciado se puede probar sin
el Lema de Zorn, aunque con el Axioma de Elección Dependiente. Recuérdese que un conjunto
parcialmente ordenado (T, ≤) se denomina cadena si la relación de orden ≤ es una relación de
orden total. Dado un conjunto parcialmente ordenado (S, ≤) llamaremos cadena en (S, ≤) a
todo subconjunto T ⊆ S tal que con la relación de orden inducida por la de S, se tenga que
(T, ≤) es una cadena. El Axioma de Zorn se enuncia del modo siguiente:
Axioma 4.2.7 (Lema de Zorn). Sea (S, ≤) un conjunto parcialmente ordenado. Si, para toda
cadena T ⊆ S existe cota superior en (S, ≤), entonces, existe elemento maximal en (S, ≤).
Se tiene:
Teorema 4.2.8. Asumiendo el Lema de Zorn, todo anillo R posee al menos un ideal maximal
(i.e. MaxSpec(R) 6= ∅).
Demostración. Para demostrarlo, consideremos el conjunto I(R) de todos los ideales

a ( R. Ordenemos I(R) con la inclusión y tendremos el conjunto parcialmente ordenado
(I(R), ⊆).
Sea T ⊆ I(R) una cadena en (I(R), ⊆). Supongamos
T := {ai : i ∈ I}.
Entonces, se puede comprobar fácilmente que se verifica:
S
• El conjunto a := i∈I ai es un ideal de R. Para ello, obsérvese que si x, y ∈ a, entonces
existen i, j ∈ I tales que x ∈ ai , y ∈ aj . Por ser T cadena tendremos ai ⊆ aj o aj ⊆ ai .
En el primer caso, x, y ∈ aj o, en el segundo, x, y ∈ ai . Por ser ai y aj ideales, ésto
implica que, en el primer caso, x + y ∈ aj ⊆ a o, en el segundo caso, x + y ∈ ai ⊆ a.
En cualquier caso, x + y ∈ a. Con mayor facilidad se probarı́a que ∀x ∈ R, ∀y ∈ a, se
ha de tener xy ∈ a.
• 1 6∈ a. Esto es más simple, dado que ai ∈ I(R), tenemos 1 6∈ ai , para todo i ∈ I, con
lo que 1 6∈ a y habremos terminado.
Es claro, además, que a es una cota superior de T en I(R). En consecuencia, aplicando el Lema
de Zorn, debe existir un elemento maximal en I(R) y por lo antedicho, ese elemento maximal
está en MaxSpec(R).
Corolario 4.2.9. Asumiendo el Lema de Zorn, si a ( R es un ideal de R, entonces, existe un

ideal maximal m ∈ MaxSpec(R), tal que a ⊆ m. Adicionalmente, existirá p ∈ Spec(R) tal que
a ⊆ p.
Demostración. A partir de la Proposición 2.2.28, tenemos que los ideales del anillo co-
ciente R/a están identificados con los ideales de R que contienen a a. Además, el corolario
4.2.5 anterior identifica los maximales del coeciente R/a con los maximales de R que contienen
a a. En consecuencia, si R/a tiene algún maximal es de la forma m/a, siendo m ∈ MaxSpec(R)
y m ⊇ a. Ası́, la Proposición anterior, que asume el Lema de Zorn, implica la existencia de
ideales maximales que contienen al ideal a.
Corolario 4.2.10. Con las mismas hipótesis, si R es un anillo, sus unidades son los elementos
que no pertenecen a ningún ideal maximal. Es decir,
 
\ [
R× := (R \ m) = R \  m .
m∈MaxSpec(R) m∈MaxSpec(R)
Demostración. Si un elemento x ∈ R no es unidad, entonces, el ideal (x) que genera

satisface (x) ( R. Existirá un maximal m ⊇ (x) y, por tanto, x ∈ m. Recı́procamente, si x ∈ m,
con m ∈ MaxSpec(R), entonces x 6∈ R× . Pues si x fuera unidad en R, tendrı́amos que existe
x0 ∈ R, tal que x0 x = 1 y, en particular, concluirı́amos
1 = x0 x ∈ m = R,
contradiciendo el hecho m ( R.
Observación 4.2.11. Ejemplos triviales de anillos conmutativos sin uniddad que no tienen
ideales maximales propios pueden verse en [Hen, 75].
Proposición 4.2.12. Se tienen las siguientes propiedades para un anillo R:

i) Sean a, b0 , b1 , . . . bs una familia de ideales propios de tal modo que:
• a ⊆ ∪si=0 bi ,
• b0 ∈ Spec(R).
Entonces, existe un subconjunto propio J ( {0, 1, . . . , s} tal que
a ⊆ ∪j∈J bj .
ii) Sean p1 , . . . , pn ∈ Spec(R) ideales primos y sea a un ideal propio contenido en ∪ni=1 pi .
Entonces, existe i tal que a ⊆ pi .
iii) Sean a1 , . . . , am ideales propios de R y sea p un ideal primo que contiene a la inter-
sección ∩mi=1 ai . Entonces, p ⊇ ai para algún i.
Demostración. El resultado está tomado de [AtMc, 1969] y [Rag et al., 1975] combi-
nados. Haremos la prueba de cada propiedad:
i) Supongamos que a ⊆ ∪si=0 bi . Razonemos por reducción al absurdo, si el resultado
fuera falso, entonces para cada i ∈ {0, . . . , s}, debe existir algún elemento xi ∈ a que
no es miembro de la unión ∪j6=i bj . Considero el elemento
x := x0 + x1 · · · xs .
Como todos los xi ’s son elementos de a, es claro que Qs x ∈ a. De otro lado, no es posible
que x ∈ b0 . Porque si x ∈ b0 , entonces x − x0 = i=1 xi ∈ b0 . Pero, por construcción
xi 6∈ ∪j6=i bj . Por tanto, xi 6∈ b0 lo cual contradice la primalidad de b0 .
ii) Usamos la propiedad i). Si a está, contenido en una unión finita de primos p1 , . . . , pn .
Consideremos J ⊆ {1, . . . , m} un sunconjunto de cardinal minimal tal que
a ⊆ ∪j∈J pj .
Pero si J tiene cardinal mayor o igual que 2, como todos ellos son primos, la propiedad
i) implicarı́a que J no es minimal. Por tanto, ](J) = 1 y tenemos la afirmación ii).
iii) De nuevo, por reducción al absurdo, supongamos que p no contiene a ningı́n ai . Esto
es ası́ porque, para cada i, existe xi ∈ ai \ p. Pero, entonces, el elemento
x = x1 · · · xm ∈ ∩m
i=1 ai ,
no puede estar en el ideal p, lo que contradice nuestra hipótesis de p ⊇ ∩m

i=1 ai .

4.2.2. La noción de rango de un R−módulo libre. En el Capı́tulo anterior (ver, por

ejemplo, la Definición 41) hemos usado la expresión R−módulo libre de rango finito. Pero, en
realidad, no hemos definido qué es el rango. Pasamos a analizarlo ahora. El punto de partida
es la noción de dimensión en espacios vectoriales sobre un cuerpo. Sin emargo, incluso esta
noción requiere de algunos comentarios previos.
Observación 4.2.13 (Axioma de Elección y Existencia de Bases). El Axioma de Elección
es un Axioma adicional de la Teorı́a de Conjuntos y que puede enunciarse del modo siguiente:
Axioma 4.2.14 (de Elección). Dada una familia no vacı́a Q de conjuntos no vacı́os {Si : i ∈ I}
existe un elemento en el producto cartesiano (xi ) : i ∈ I ∈ i∈I Si .
Se trata de un Axioma adicional introducido por E. Zermelo (cf. [Zer, 1904]) en 1904 para
poder demostrar el Teorema sobre el Buen Orden (Todo conjunto admite un Buen Orden).
Desde entonces se ha mostado una buena herramienta añadible a los Axiomas de la Teorı́a de
Conjuntos que permiten , por ejemplo, probar el teorema de Tichonoff (Producto de Compactos
es Compacto). En matemáticas Constructivistas no es usualmente aceptado.
En 1984, A. Blass (cf. [Bls, 1984]) demostró que con la axiomática de Zermelo-Frenkel, el
Axioma de Elección es equivalente a la Existencia de Base para cualquier espacio vectorial.
Observación 4.2.15 (Lema de Zorn e Igualdad de los cardinales de las bases). Es
probable que los alumnos hayan visto que en espacios vectoriales finitamente generados, dos
bases cualesquiera tienen la misma cardinalidad. Es un resultado popularmente conocido como
el “Teorema del Reemplazamiento” porque muetra cómo se van reemplazando elementos de
un sistema linealmete independiente por elementos de un sistema generador hasta encontrar
una base dentro de dicho sistema generador. Para la dimensión infinita se necesita algo más
sofisticado, incluyendo el Lema de Zorn, la tricotomı́a de los cardinales (i.e. que todos los
cardinales son comparables) y el Ultrafilter Lemma como axiomas adicionales de la Teorı́a
de Conjuntos (ZFA o similares). De hecho, H. Läuchli (cf. [Lau, 1962]) mostró en 1962 un
ejemplo de axiomática de ZFA con un espacio vectorial que posee dos bases de distinto cardinal.
Observación 4.2.16 (Equivalencia entre estos Axiomas Adicionales). B.L. van de Waer-
den (1903-1996) fue un alumno de doctorado de E. Noether y quedó fuertemente influenciado por
su pensamiento.Su libro en dos volúmenes ([vdW, 1930], [vdW, 1931]), escrito cuando sólo
tenı́a 27 años, a partir de los semiarios impartidos por E. Noether y E. Artin, sigue conteniendo
una visión interesante del Álgebra Moderna, de los primeros fundamentos de la Geometrı́a Al-
gebraica, entendida como Teorı́a de la Eliminación clásica. Bajo su impulso se empezaron a
estudiar las interacciones entre estos axiomas adicionales a la Teorı́a de Conjuntos, que desem-
bocaron en el siguiente:
Teorema 4.2.17. Bajo los Axiomas de Zermelo-Fraenkel para Teorı́a de Conjuntos, los si-
guientes Axiomas son equivalentes (e independientes de ZF)
i) Axioma de Elección.
ii) Lema de Zorn
iii) Principio de Buena Ordenación: Todo conjunto X admite un buen orden.
iv) Compatibilidad de Cardinales (también llamado Teorema de Bernstein) Dados dos
conjuntos X e Y , existe o bien una biyección entre ellos o una biyección entre Y y un
subconjunto de X o, recı́procamente, una biyección entre X y un subconjunto de Y .
La prueba, desgracidamente, se sale de este curso, pero se pueden localizar fácilmente textos
con pruebas correctas en la red.
A partir de ahora asumiremos tanto el Axioma de Elección como el Lema de Zorn. Y añadiremos,
con prevención, el siguiente Axioma de la Dimensión de Espacios Vectoriales:
Axioma 4.2.18 (Existencia de dimensión en espacios vectoriales). Sea K un cuerpo, sea
V un espacio vectorial. Entonces,
i) V posee una base como espacio vectorial (equivalente al Lema de Zorn).
ii) Dadas β1 y β1 dos bases de V como K−espacio vectorial. Entonces β1 y β2 son
conjuntos biyectables (demostrable a partir del Lema del Ultrafiltro).
Al cardinal de cualquiera de sus bases, lo llamaremos dimensión de V sobre K.
Recomendamos al lector revisar la noción de base de un R−módulo introducida en la Definición

40. Recuérdese también la noción de R−módulo libre y sus propiedades elementales discutidas
en la Proposición 2.2.38.
Ejemplo 4.2.19. i) Si M es un R−módulo libre de rango finito, entonces existe n ∈ N
tal que M es isomorfo a algún Rn . Queda por probar que Rn no es isomorfo a Rm
cuando m 6= n.
ii) El R−módulo R[X1 , . . . , Xn ] tiene por base el conjunto de todos los monomios
{X µ : µ ∈ Nn },
iii) El R−módulo Hd (X1 , . . . , Xn ) de los polinomios homogéneos en n variables y de grado
d tiene por base
{X µ : µ = (µ1 , . . . , µn ) ∈ Nn , |µ| = µ1 + · · · + µn = d},
que es un conjunto de cardinal d+n−1

n−1 .
iv) El R−módulo de las matrices Mn×m (R) posee una base de cardinal nm.
Lema 4.2.20. Sea R un anillo, M un R−módulo, m ∈ MaxSpec(R) un ideal maximal de R.

Denotemos por k(m) := R/m el cuerpo residual. Consideremos la estructura de k(m)−espacio
vectorial inducida en M/mM conforme a lo indicado en el Problema 77.
Supongamos que M es un R−módulo libre y sea B una base de M como R−módulo libre.
Denotemos por B/m al subconjunto de M/mM dado mediante:
B/m := {b + mM : b ∈ B}.
En tonces, se tiene:
i) El conjunto B/m es una base de M/mM como k(m)−espacio vectorial.
ii) Los conjuntos B y B/m son biyectables y, en particular, tiene el mismo cardinal.
Demostración. Hagamos la prueba de cada parte por separado. Supongamos B := {mi :
i ∈ I} por simplicidad de la lectura.
• Prueba de i): Veamos, en primer lugar, que B/m es sistema generador del k(m)−espacio
vectorial M/mM .
Dado m+mM ∈ M/mM un elemento cualquiera, como m ∈ M , y B es sistema gener-
ador, sabemos que existe un conjunto finito J ⊆ I y un subconjunto {λi ∈ R : i ∈ J}
tal que X
m= λi mi .
i∈J
Tomando clases módulo mM , tendremos:
X
m + mM = (λi + m)(mi + mM ).
i∈J
Como λi + m ∈ k(m) y J es finito, concluiremos que para cualquier m + mM ∈ M/mM

está en el subespacio generado por B/m y, por tanto, este conjunto es generador de
M/mM como k(m)−espacio vectorial.
En cuanto a ser familia libre,supongamos que existe J ⊆ I y existen {λi ∈ R : i ∈ J}
tales que X
(λi + m)(mi + mM ) = 0 + mM, en M/mM .
i∈J
Es decir, X
λi mi ∈ mM.
i∈J
Por tanto, existirá otro conjunto finito T ⊆ I y constantes {θk ∈ m : k ∈ T } tales
que X X
λi mi = θk mk .
i∈J k∈T
Esta identidad se transforma en la siguiente:
X X X
(λi − θk )mk + λi mi + (−θk )mk = 0.
i∈J∩T i∈J\T k∈T \K
Concluiremos que
i) Para cada i ∈ J ∩ T , λi = θi ∈ m. Luego λi + m = 0 + m, para todo i ∈ J ∩ T .
ii) Para cada i ∈ J \ T , λi = 0. Luego λi + m = 0 + m, para todo i ∈ J \ T .
iii) Para cada k ∈ T \ J, θk = 0.
Habremos concluido que λi + m = 0, para todo i ∈ J y, por tanto, B/m es un sistema
de vectores linealmente independientes en el k(m)− espacio vectorial M/mM .
• Prueba de ii): Se parece mucho a la prueba del apartado i). en primer lugar conside-
remos la siguiente aplicación, que es, por definición, suprayectiva:
Φ: B −→ B/m
m 7−→ m + mM.
Si no fuera inyectiva, existirı́an mi1 , m2 ∈ B, con i1 , i2 ∈ I tales que mi1 − mi2 ∈ mM .
Esto implica que tenemos una combinación lineal no trivial en M/mM .
(1 + m)(mi1 + mM ) + (−1 + m)(mi2 + mM ) = 0 + mM.
Pero como B/m es base, esta combinación lineal igualada a cero, con coeficientes en
k(m) no es posible, con lo que llegamos a contradicción.

Corolario 4.2.21 (Teorema de Existencia de rango de R−módulos libres). Asumiendo

el Axioma de la Existencia de dimensión para espacios vectoriales, dos bases de un R−módulo
libre tienen el mismo cardinal. En el caso de R−módulos de rango finito (i.e. que poseen, al
menos, una base de cardinal finito), el resultado es cierto sin necesidad de ampliar la axiomática
de nuestra Teorı́a de Conjuntos. En particular Rn es isomorfo a Rm si y solamente si n = m.
Un módulo es de rango finito n si y solamente si es isomorfo a Rn .
Demostración. Son consecuencia inmediata del Lema previo.
Definición 69 (Rango de un R−módulo libre). Dado un R−módulo libre, llamaremos

rango como R−módulo (o simplemente rango si el anillo R se sobre-entiende) al cardinal de
una cualquiera de sus bases y lo denotaremos mediante:
rankR (M ).
Un R−módulo es libre de rango finito si y solamente si rankR (M ) ∈ N.
Observación 4.2.22 (No se da el Teorema del Reemplazamiento). En espacios vecto-

riales sobre un cuerpo se da el conocido como Teorema del Reemplazamiento (“Todo sistema
generador de un K−espacio vectorial V finitamente generado contiene una base de V ”). Este
Teorema se usa para denotar la estructura de matroide de las bases contenidas en un sistema
generador y que, en particular, permite encontrar bases como cualquier subconjunto de vectores
linealmente independientes y maximal con esa propiedad dentro de un sistema generador. Esto
no se da en módulos libres ni en el caso de dominios de ideales principales. Por ejemplo, Z
admite como sistema generador como Z−módulo al conjunto {2, 3} (i.e. Z = Zh{2, 3}i). Sin
embargo, ningún subconjunto de {2, 3} es una base de Z como Z−módulo libre.
Corolario 4.2.23. Si un R−módulo M es libre de rango n, y m ∈ MaxSpec(R) es un ideal

n
maximal de R, entonces M/mM es isomorfo como R/m− espacio vectorial a (R/m) .
Ejemplo 4.2.24. Sea K un cuerpo y sea f ∈ K[X] un polinomio no nulo. Entonces, el anillo
cociente K[X]/(f ) no es un K[X]−módulo libre. Simplemente porque todo K[X]−módulo libre
tiene que tener dimensión infinita como espacio vectorial sobre K, mientras que K[X]/(f ) es
un K−espacio vectorial finitamente generado.
Corolario 4.2.25. Si M y N son dos R−módulos libres también lo es M ⊕ N . Más aún, si

M y N son dos R−módulos libres de rango finito, M ⊕ N también lo es y el rango verifica:
rankR (M ⊕ N ) = rankR (M ) + rankR (N ).
Demostración. Sean M = (⊕X R) y N = (⊕Y R) dos R−módulos libres. La primera
afirmación es cierta dado que
(⊕X R) ⊕ (⊕Y R) = ⊕X ∪Y
˙ R,
˙ denota la unión “disjunta” de X e Y , lo que se puede describir mediante:
donde X ∪Y
\
˙ := (X × {0}) ({0} × Y ) ⊆ .
X ∪Y
La segund afimación es consecuencia de esta descripción. Sin embargo, por ayudarnos, recorde-
mos que M ⊕ N = M × N y que si tenemos dos bases B1 := {m1 , . . . , mr } B2 := {n1 , . . . , ns }
respectivamente de M y N , es sencillo verificar que la siguiente es una base de M × N como
R−módulo libre:
B := {(m1 , 0), . . . , (mr , 0)} ∪ {(0, n1 ), . . . , (0, ns )} ⊆ M × N.
La base B tiene cardinal r +s (lo que implica la igualdad de rangos, y no es sino la construcción,
en el caso finito de la construcción B1 ∪B
˙ 2

Proposición 4.2.26. Sea M y N dos R−módulos libres de rangos respectivos m y n. Entonces,

existe un isomorfismo de R−módulos entre HomR (M, N ) y Mn×m (R). En particular, cuando
M y N son R−módulos libres de rango finito, HomR (M, N ) también lo es y su rango coincide
con rankR (M ) rankR (N ).
Demostración. Sin pérdida de la generalidad podemos suponer que M = Rm y N = Rn .
Podemos, además, fijar dos bases ordenadas β1 en M y β2 en N . Sin pérdida de la generalidad,
podemos suponer que son las llamadas bases canónicas. Ahora, para cada ϕ ∈ HomR (M, N ),
definamos la matrix M (ϕ) ∈ Mn×m (R) cuyas columnas sean las imágenes (en Rn ) de los
elementos de la base β1 . M (ϕ) es una matriz con n filas y m columnas. Queda como ejercicio
comprobar que M : HomR (M, N ) −→ Mn×m (R) es un isomorfismo de R−módulos. Es el
mismo argumento obvio ya hecho en el caso del Álgebra Lineal.
4.2.3. Generación finita sobre anillos noetherianos es hereditaria. Retomemos

los R−módulos finitamente generados, pero esta vez supondremos que el anillo R es un anillo
noetheriano (ver Definición 59 de la Sección 3.3). Observaremos que los submódulos de módulos
finitamente generados sobre anillos noetherianos son también finitamente generados (es decir
que la condición es hereditaria para submódulos). Observamos que esta condición es heredi-
taria para sus submódulos. Más adelante, en la Sección ??, retomaremos el asunto de modo
más general usando sucesiones exactas cortas y expresando simplemente que si R es un anillo
noetheriano, un R−módulo es noetheriano si y solamente es finitamente generado.
Proposición 4.2.27. Sea R un anillo noetheriano y M un R−módulo finitamente generado.

Entonces, todos los submódulos de M son finitamente generados.
Demostración. Demostraremos el resultado por inducción en µ(M ) que denota el número
mı́nimo de generadores de M (ver Definición 33).
En el caso µ(M ) = 1, tenemos que M está generado por un conjunto formado por un
único elemento. Esto es, tenemos M = Rha1 i. Ahora, consideramos el siguiente morfismo
de R−módulos:
π : R −→ M
x 7−→ xa.
Es evidente que π es suprayectiva (porque {a1 } genera M ). Sea a := ker(π) el núcleo de π
que es un submódulo de R (y, por tanto, un ideal de R). Por el Primer Teorema de Isomorfı́a
(ver la Subsección 2.2.2) tendremos un isomorfismo de R−módulos entre R/a y M . Por ese
isomorfismo, los submódulos de M son los submódulos de R/a que son los ideales de R/a. Por
la Proposición 2.2.28, los ideales de R/a) son los ideales de R que contienen a a. Como R es
un anillo noetheriano, sus ideales son finitamente generados (recuérdese el Teorema 3.3.2). Por
tanto, los ideales del cociente R/a también son finitamente generados y, en conclusión, cualquier
módulo isomorfo a un ideal de R/a es finitamente generador. En particular, los submódulos de
M son finitamente generados.
En el caso µ(M ) = n ≥ 2, consideremos un sistema minimal de generadores de M β :=

{a1 , . . . , an }. Consideremos el submódulo M1 de M generado por {a2 , . . . , an }, es decir
M1 := Rha2 , . . . , an i.
Se tiene que M1 es finitamente generado y µ(M1 ) ≤ n − 1 y, aplicando la hipótesis inductiva,
todo submódulo de M1 es finitamente generado. En particular, N ∩ M1 es finitamente generado
y puedo suponer:
N ∩ M1 := Rhc1 , . . . , cr i,
donde {c1 , . . . , cr } ⊆ N . De otro lado, consideremos el siguiente morfismo de R−módulos:
π: M −→ M/M1
x 7−→ x + M1 .
El morfismo π es suprayectivo y es fácil ver que
M/M1 := Rha1 + M1 i,
siendo µ(M/M1 ) ≤ 1. Por lo discutido en el caso µ(M ) = 1 anterior, todo submódulo de M/M1
es finitamente generado. Ahora consideremos la restricción

π N : N −→ M/M1 .

Entonces, π N (N ) = π(N ) = Rhb1 + M1 , . . . , bs + M1 i es finitmente generado con bi ∈ N , para
todo i, 1 ≤ i ≤ s.
Considero el conjunto
β 0 := {c1 , . . . , cr } ∪ {b1 , . . . , bs },
Y probemos que
N = Rhβ 0 i,
con lo que habrı́amos probado que N es finitamente generado. Para ver esta igualdad, comence-
mos observando que c1 , . . . , cr ∈ N ∩ M1 ⊆ N y b1 , . . . , bs ∈ N , con lo cual β 0 ⊆ N y como
4.3. PROYECTIVOS, LIBRES Y DOMINIOS DE IDEALES PRINCIPALES 197
Rhβ 0 i es el menor submódulo que contiene a β 0 , tendremos una primera inclusión Rhβ 0 i ⊆ N .
Para la otra inclusión, consideremos m ∈ N un elemento cualquiera. Consideremos su imagen
π(m) = m + M1 ∈ π(N ) ⊆ M/M1 .
Entonces, existirán λ1 , . . . , λs ∈ R tales que
s
X
π(m) = m + M1 = λi (bi + M1 ),
i=1
s
X
m− λi bi ∈ M1 .
i=1
Como m ∈ N y b1 , . . . , bs ∈ N , se tiene, en realidad,
Xs
m− λi bi ∈ M1 ∩ N.
i=1
Por tanto, como M1 ∩ N = Rhc1 , . . . , cr i, existirán θ1 , . . . , θr ∈ R tales que
X s Xr
m− λ i bi = θi ci ,
i=1 i=1
y, por tanto,
s
X r
X
m= (−λi )bi + θi ci ∈ Rhβ 0 i,
i=1 i=1
con lo que habremos probado N ⊆ Rhβ 0 i y R es finitamente generado.
En particular, como los dominios de ideales principales son anillos noetherianos se tiene:
Proposición 4.2.28. Sea R un anillo dominio de ideales principales y M un R−módulo fini-
tamente generado. Entonces, todos los submódulos de M son finitamente generados.
4.3. Proyectivos, libres y dominios de ideales principales

Definición 70 (Módulo Proyectivo). Un R−módulo P se dice proyectivo si y solamente
si se verifica la siguiente propiedad:
Para cada R−módulo M y para cada epimorfismo de R−módulos π : M −→ P , existe un
morfismo g : P −→ M tal que π ◦ g = IdP .
Observación 4.3.1 (Lifting Property). La Propiedad descrita en la definición de módulo

proyectivo precedente se conoce también como Lifting Property y, gráficamente, se puede ree-
scribir del modo siguiente:
Se dice que un módulo es proyectivo si satisface:
Dado un epimorfismo de R−módulos f : N −→ M cualquiera y dado cualquier morfismo de
R−módulos g : P −→ M , entonces existe un morfismo de R−módulos h : P −→ N tal que
g ◦ h = f . Gráficamente, dado un diagrama como el siguiente, en el que la sucesión horizontal
es exacta :
P
g
N M 0
f
entonces existe h : P −→ N tal que el siguiente diagrama es conmutativo:
P
∃h g
N M 0
f
Lema 4.3.2. Con las notaciones precedentes, un R−módulo es proyectivo si y solamente si se

verifica:
Para cada R−módulo libre F y para cada epimorfismo de R−módulos π : F −→ P , existe un
morfismo g : P −→ F tal que π ◦ g = IdP .
Demostración. Obviamente, si el R−módulo P es proyectivo se satisface esta propiedad.
De otro lado, hemos visto que todo R−módulo es la imagen por un epimorfismo de un R−módulo
libre (Proposición 2.2.41). Supongamos que se verifica la propiedad anterior para R−módulos
libres y sea
π : M −→ P,
un epimorfismo de R−módulos, donde M es un R−módulo cualquiera. Por la Proposición
2.2.41, existe un R−módulo libre F y un epimorfismo de R−módulos h : F −→ M . Tenemos
el siguiente diagrama de R−md́ulos y morfismos::
h
F M
Como π ◦ h es epimorfismo (por ser coposición de epimorfismos), entonces existe g : P −→ F

tal que (π ◦ h) ◦ g = IdP .
h
F M
∃g π
Entonces, tomando ge := h ◦ π tendremos que fe : P −→ M satisface

π ◦ ge = IdP .

Lema 4.3.3. Todo módulo libre es proyectivo.

Demostración. Lo haremos para el caso de rango finito, aunque la prueba es la misma en
el caso de bases no necesariamente finitas utilizando la Proposición 2.2.36. Sea F un R−módulo
libre de rango finito, sea {e1 , . . . , es } es una base de F como R−módulo libre y sea f : M −→ F
un epimorfismo. Del mismo modo que en la Proposición 2.2.36 podemos construir un morfismo
g : F −→ M del modo siguiente:
Por ser f epimorfismo, existen m1 , . . . , ms ∈ M tales que f (mi ) = ei , para cada i, 1 ≤ i ≤ s.
Definamos
g: F −→ M
x1 e1 + · · · + xs es 7−→ x1 m1 + · · · + xs ms .
Es fácil verificar que g es un morfismo de R−módulos y que verifica la condición indicada.
Observación 4.3.4. De hecho, no se necesita la condición de finitud del rango, como uno puede
fácilmente verificar.
La siguiente es una prueba del Teorema de Dedekind para el caso de rango finito. La incluimpos
porque no depende del Axioma de Zorn.
Teorema 4.3.5 (Teorema de Dedekind (para módulos libres finitamente generados

sobre un DIP)). Si R es un dominio de ideales principales, todo submódulo de un R−módulo
libre y de rango finito es libre. Más concretamente, si M es un R−módulo libre de rango finito
y si F es un submódulo de M , entonces F es libre de rango finito y satisface:
rankR (F ) ≤ rankR (M ).
Demostración. Basta con hacer el caso M = Rn . Supongamos que N es un submódulo
de Rn y demostremos, por inducción en n, que N es un R−módulo libre. Para ello, recordemos
que en el caso n = 1, los submódulos de R son los ideales del anillo R y son principales, luego
son libres. Además, como R es un dominio de ideales principales, todo los ideales de R son
principales y, por tanto, su rango está acotado por 1.
Supongamos el resultado cierto para n − 1 y veamos el caso n. Comencemos considerando la
proyección canónica π1 : Rn −→ Rn−1 que “olvida” la primera coordenada. Consideremos el
submódulo π1 (N ) ⊆ Rn−1 . Por hipótesis inductiva, π1 (N ) es un R−módulo libre. Por tanto,
tenemos un epimorfismo de R−módulos:

π := π1 : N −→ π1 (N ),
N
dado por la restricción de π1 a N . Como π1 (N ) es libre, es, por tanto, proyectivo, y ha de
existir un morfismo de R−módulos g : π1 (N ) −→ N tal que π ◦ g = Idπ1 (N ) .
Finalmente, definamos la siguiente aplicación, recordando que, en el caso finito, producto y
suma directa coinciden:
f : N −→ π1 (N ) ⊕ ker(π)
n 7−→ (π1 (n), n − g (π1 (n))) .
En primer lugar, veamos que está bien definida, para lo cual sólo tenemos que ver que para
cada n ∈ N , n − g(π1 (n)) ∈ ker(π). Esto es evidente porque
π (n − g (π1 (n))) = π(n) − π (g(π1 (n))) = π(n) − π1 (n) = 0,

porque π ◦ g = Idπ1 (N ) y π = π1 N .
Ahora observemos que ker(π) = ker(π1 ) ∩ N . Pero ker(π1 ) = R × {0}n−1 por definición de
π1 . Luego ker(π1 ) es un R−módulo libre de rango 1 (por ser isomorfo a R) y N ∩ ker(π1 )
es un submódulo de un R−módulo libre de rango 1. Por lo visto en el caso de rango 1,
ker(π) = ker(π1 ) ∩ N es un R−módulo libre.
Finalmente, es fácil verificar que f es un isomorfismo de R−módulos. Es evidente que es
morfismo. Ahora, si (m1 , m2 ) ∈ π1 (N ) ⊕ ker(π), considero el elemento:
n := g(m1 ) + m2 ∈ N.
Nótese que π(n) = π(g(m1 )) + π(m2 ) = m1 porque π ◦ g = Idπ1 (N ) y π(m2 ) = 0 porque
m2 ∈ ker(π). De otro lado,
n − g (π1 (n)) = (g(m1 ) + m2 ) − g (π1 (n)) = (g(m1 ) + m2 ) − g(m1 ) = m2 .
Por tanto, f es un epimorfismo de R−módulos. En cuanto a la inyectividad,
(0, 0) = f (n) = (π1 (n), n − g (π1 (n))) ,
implica que π(n) = π1 (n) = 0, luego g (π1 (n)) = 0 y, por tanto, n − g (π1 (n)) = n = 0, lo que
implica la inyectividad. Por último, para la prpiedad de los rangos, tenemos que
rankR (N ) = rankR (π(N ) ⊕ ker(π)) = rankR (π(N )) + rankR (ker(π)) .
Ahora es claro que π(N ) es submódulo de Rn−1 y, por hipótesis inductiva, rankR (π(N )) ≤ n−1.
Por su parte, ker(π) es isomorfo a un submódulo de R, con lo que rankR (ker(π)) ≤ 1. Con lo
que concluimos que
rankR (N ) = rankR (π(N )) + rankR (ker(π)) ≤ n,
como pretendı́amos.
En general, los módulos proyectivos no tienen por qué ser libres aunque dejaremos la discusión
para más adelante en el texto.
Corolario 4.3.6. Si R es un dominio de ideales principales y M es un R−módulo libre, son
equivalentes:
i) M es de rango finito,
ii) M es finitamente generado.
Además, en ese caso rankR (M ) = µ(M ), donde µ(M ) es el mı́nimo de los cardinales de los
sistemas generadores de M .
Demostración. La implicación i) =⇒ ii) se da obviamente: todo R−módulo libre de
rango finito es finitamente generado.
Para la otra, se trata de probar que el rango de un R−módulo libre finitamente generado
coincide con µ(M ). Para ello observemos que, por ser M finitamente generado, supongamos
µ(M ) = n y existe un sistema generador G := {m1 , . . . , mn } de M formado por n elementos.
Entonces, existe un epimorfismo de R−módulos π : Rn −→ M , donde π(ei ) = mi para cada i,
1 ≤ i ≤ n, siendo {e1 , . . . , en } la base “canónica” de Rn como R−módulo libre.
Por ser proyectivo, existe un morfismo g : M −→ Rn tal que π ◦ g = IdM . En particular, g es
monomorfismo y, por tanto, M y su imagen g(M ) ⊆ Rn son isomorfos como R−módulos. Como
g(M ) es submódulo de un R−módulo libre de rango finito, por el Teorema precedente, g(M )
es libre de rango finito y también lo será M . Además, rankR (M ) = rankR (g(M )) ≤ n = µ(M ).
Para probar la igualdad rankR (M ) = µ(M ). Nótese que si M es libre de rango finito, una
base de M es un sistema generador de M y, dado que µ(M ) es un mı́nimo, entonces tenemos
µ(M ) ≤ rankR (M ) y tenemos la igualdad buscada.
Corolario 4.3.7. Si R es un dominio de ideales principales y M es un R−módulo, son equiv-

alentes:
i) M es un módulo libre de rango finito
ii) M es un R−módulo proyectivo finitamente generado.
Demostración. Ya hemos visto que i) =⇒ ii) en el Lema 4.3.3 precedente. De otro lado,
supongamos que M es un R−módulo finitamente generado y proyectivo. Por ser finitamente
generado, existirá un epimorfismo
π : F := Rn −→ M,
donde F es un R−módulo libre de rango igual al número mı́nimo de generadores de M . Como
M es proyectivo, existirá
g : M −→ F,
tal que π ◦ g = IdM . Por tanto, g es un monomorfismo y tendremos, por restricción del rango
en g, un isomorfismo de R−módulos:
g : M −→ g(M ).
En otras palabras, M es isomorfo a un submódulo de F y, por el Teorema precedente, g(M ) es
libre de rango satisfaciedo rankR (g(M )) ≤ rankR (F ) = n. De ello concluimos que M (que es
isomorfo a g(M )) ha de ser también libre.
Observación 4.3.8. La condición de ser dominio de ideales principales es crucial para el Teo-
rema 4.3.5 anterior y para su Corolario. El ideal maximal m := (X, Y ) ∈ MaxSpec (K[X, Y ])
es un submódulo de un K[X, Y ]−módulo libre como es K[X, Y ]. Sin embargo, no puede
ser libre. Si fuera libre poseerı́a una base de cardinal menor que el rango de K[X, Y ] como
K[X, Y ]−módulo libre, que es de rango 1. Es decir si m fuera libre serı́a un ideal principal,
pero no lo es como ya hemos visto anteriormente. En cambio, la condición de ser finitamente
generado es superfua. El Teorema de Dedekind, que usa el Lema de Zorn, demuestra que todo
subgrupo de un grupo abeliano libre es un grupo abeliano libre. Dejamos la prueba como
problema.
Camuflada en la prueba del Teorema precedente hemos usado la prueba de la siguiente Proposición:
Proposición 4.3.9. Las siguientes propiedades son equivalentes para un R−módulo P :
i) P es un R−módulo proyectivo (i.e. satisface la lifting property).
ii) El R−módulo P es un sumando directo de un R−módulo libre. Es decir, existe un
R−módulo Q tal que F ∼ = P ⊕ Q es un R−módulo libre.
iii) Toda sucesión exacta corta como la siguiente:
f g
0 M0 M P 0,
es escindida. Esto es, existe una sucesión exacta corta de la forma:
λ π
0 M0 M0 ⊕ P P 0,
donde λ : M 0 ,−→ M 0 ⊕P es la inclusión canónica, y π : M 0 ⊕P −→ P es la proyección
canónica y existe un isomorfismo ψ : M −→ M 0 ⊕ P tal que es siguiente diagrama es
conmutativo:
f g
0 M0 M P 0
IdM 0 ψ IdP
λ π
0 M0 M0 ⊕ P P 0
Demostración. Hagamos las distinas implicaciones:

• i) =⇒ ii): El R−módulo P es la imagen por un epimorfismo π : F −→ P de un
R−módulo libre. Como P es proyectivo, existe g : P −→ F tal que
π ◦ g = IdP .
Observamos que g es inyectiva (porque π◦g lo es) y, por tanto, tenemos un isomorfismo
de R−módulos
g : P −→ g(M P ).
Veamos que g(P ) es un sumando directo de F y habremos terminado. Para ello,
consideremos K := ker(π) y el morfismo:
ψ : g(P ) ⊕ K −→ F
(n, e) 7−→ n + e.
Veamos que ψ es un isomorfismo y tendremos ii):
Es claro que está bien definido y que es un morfismo de R−módulos. Veamos que
es inyectiva y consideremos (n1 , e1 ) ∈ ker(ψ). Entonces, n1 + e1 = 0 o, equivalente-
mente, n1 = −e1 ∈ K = ker(π). Pero n1 ∈ g(P ) con lo que existirá m1 ∈ P tal que
n1 = g(m1 ). Por tanto, g(m1 ) ∈ ker(π) y, al mismo tiempo m1 = π(g(m1 )). Por tanto,
m1 = 0 y, en consecuencia, n1 = g(m1 ) = g(0) = 0. Finalmente, e1 = −n − 1 = 0 y ψ
es monomorfismo.
Supongamos ahora n ∈ F . Tomemos π(n) ∈ P y consideremos g(π(n)) ∈ F . Obser-
vamos que
π (n − g(π(n))) = π(n) − π(g(π(n)) = π(n) − π(n) = 0.
Por tanto, n − g(π(n)) ∈ ker(π). Obviamente, g(π(n)) ∈ g(P ) porque π(n) ∈ P y
concluimos que
ψ(g(π(n)), n − g(π(n))) = n,
con lo que ψ es suprayectiva. Por tanto, ψ es un ismorfismo de R−módulos y P es
isomorfo a un sumando directo de F .
• ii) =⇒ iii): Como en la prueba precedente, por ser P proyectivo, existirá h : P −→ M
un morfismo de R−módulos tal que g ◦ h = IdP . En particular, h es un monorfismo
de R−módulos. Considero el morfismo de R−módulos siguiente:
ψ: M −→ P ⊕ M0
−1
m 7−→ (g(m), f (m − h(g(m)))).
Veamos, en primer lugar, que está bien definida. Comencemos verificando que m −
h(g(m)) ∈ ker(g). Esto es obvio porque:
g (m − h(g(m))) = g(m) − (g ◦ h)(g(m)) = g(m) − g(m) = 0.
De otro lado, la sucesión exacta corta inicial era exacta con lo que Im(f ) = ker(g). Es
decir, m − g(h(m)) Im(f ). Pero f : M 0 −→ Im(f ) es un isomorfismo de R−módulos,
con lo que tiene sentido considerar la imagen inversa de todos los elementos de Im(f ).
En particular, tiene sentido considerar f −1 (m − h(g(m))) y tenemos bien definido ψ.
Veamos que ψ es un isomorfismo. Para ello, veamos que es inyectiva. Pero si m ∈ M

es tal que ψ(m) = (0, 0) entonces, g(m) = 0, luego h(g(m)) = 0 y tendremos que
(0, 0) = ψ(m) = (0, m − h(g(m))) = (0, m),
de donde concluimos que m = 0 y ψ es un monomorfismo de R−módulos.
En cuanto a la suprayectividad, si (n1 , e1 ) ∈ P ⊕ M 0 , observamos que f (e1 ) ∈ M y es
un elemento del núcleo de g. Considero el siguiente elemento de M :
m := h(n1 ) + f (e1 ) ∈ M.
Entonces, tenemos que:
ψ(m) = (g(m), f −1 (m − h(g(m))) .
Pero
g(m) = g(h(n1 ) + f (e1 )) = g(h(n1 )) + g(f (e1 )) = n1 + 0 = n1 ,
mientras que
−1
f (m − h(g(m))) = f −1 (m − h(n1 ))) = f −1 (h(n1 ) + f (e1 ) − h(n1 )) = f −1 (f (e1 )) = e1 .
Con lo que concluimos que ψ(m) = (n1 , e1 ) y ψ es un epimorfismo. Como ya probamos
que ψ es monomorfismo, entonces es un isomorfismo de R−módulos.
Para concluir, basta con observar que el siguiente diagrama es conmutativo con las
funciones que hemos definido, lo cuale s un mero ejercicio de verificación:
f g
0 M0 M P 0
IdM 0 ψ IdP
λ π
0 M0 M0 ⊕ P P 0
• iii) =⇒ ii) : El R−módulo P es siempre la imagen de un epimorfismo que parte de
una R−módulo libre o, equivalentemente, existe una sucsesión exacta corta como la
siguiente:
f g
0 K F P 0,
donde F es un R−módulo libre. Por iii) esa sucesión exacta corta es escindida y, en
particular, existe un isomorfismo ϕ = ψ −1 : K ⊕ P −→ F . Pero eso ya significa que
F = ϕ(K) ⊕ ϕ(P ), con lo que ϕ(P ) es un sumando directo de un R−ódulo libre (i.e.
F ) y P y ϕ(P ) son, obviamente, isomorfos.
• ii) =⇒ i): Supongamos que P es un sumando directo de un R−módulo libre F = Q⊗P
y consideremos un epimorfismo π : M −→ P . Entonces, tengo un epimorfismo de
Q ⊕ M en F dado mediante:
ψ : Q⊕M −→ Q⊕P =F
(q, m) 7−→ (q, π(m)).
Es claramente epimorfismo por serlo π y, como F es un R−módulo proyectivo, existe
un morfismo φ : F −→ Q ⊕ M tal que
ψ ◦ φ = IdF = IdQ⊕P .
Escribamos φ := (φ1 , φ2 ) y reescribamos φ como el morfismo
φ: Q⊕P −→ Q⊕M
(e, n) 7−→ (φ1 (e, n), φ2 (e, n)).
Componiendo con ψ observamos que para (0, n) ∈ {0} ⊕ P se tiene:
(0, n) = ψ(φ((0, n))) = ψ(φ1 (0, n), φ2 (0, n)) = (φ1 (0, n), π(φ2 (0, n))).
En particular, concluimos las dos igualdades siguientes para cada n ∈ P :
φ1 (0, n) = 0, π(π2 (0, n)) = n.
Definamos
Φ: P −→ M
n 7−→ φ2 (0, n).
Se trata de un morfismo de R−módulos y, por lo visto anteriormente,
π(Φ(n)) = π(φ2 (0, n)) = n.
Con lo que P hi satisface la propiedad buscada y P es un R−módulo proyectivo.

Corolario 4.3.10. Todo R−módulo finitamente generado es el co-núcleo de un morfismo en-

tre módulos libres. Es decir, existe una matriz A ∈ Mm×n (R) que define un morfismo de
R−módulos
ϕA : Rn −→ Rm ,
(x1 , . . . , xn ) 7−→ ϕA (x1 , . . . , xn ) := (y1 , . . . , ym ),
dado mediante:
   
y1 x1
 y2   x2 
ϕA (x1 , . . . , xn ) = (y1 , . . . , ym ) ⇐⇒   = A .
   
.. ..
 .   . 
ym xn
De tal modo que M es el co-núcleo de ϕA , esto es,
M∼
= Rm / Im(ϕA ).
Demostración. Por ser M finitamente generado, existe un epimorfismo π : Rm −→ M

de R−módulos. Por el Primer Teorema de Isomorfı́a, tendremos que
M∼
= Rm /K, K = ker(π).
Como K es un submódulo de Rn , existe, a su vez, un R−módulo libre de rango finito Rn y

un morfismo suprayectivo de R−módulos ψ : Rn −→ K. Obviamente, ψ puede verse como un
morfismo entre R−módulos libres ψ : Rn −→ Rm , tal que su imagen verifica Im(ψ) = K =
ker(π). Entonces, M es el co-núcleo de ψ. Ahora, aplicando la Proposición 4.2.26, tenemos que
necesariamente ψ ha de ser de la forma ϕA para alguna matriz A ∈ Mm×n (R).
Corolario 4.3.11. Si R es un dominio de ideales principales, un R−módulo M es finitamente

generado si y solamente si es el cociente de dos R−módulos libres de rango finito.
Demostración. Usando el Corolario precedente, si M es un R−módulo finitamente ge-

nerado, entonces es un co-núcleo de un morfismo entre dos R−módulos libres. Es decir,
M∼
= Coker(π),
donde π : Rn −→ Rm es un morfismo de R−módulos. Pero, por el Teorema precedente,

Im(π) ⊆ Rm será un R−módulo libre y
M∼
= Coker(π) = Rm / Im(π),
resulta ser un cociente de dos R−módulos libres de rango finito. La otra implicación es evidente.

4.4. Libres y Libres de Torsión sobre dominios de ideales principales

4.4.1. Libres de Torsión sobre dominios de ideales principales.
Definición 71 (Elemento de torsión). Sea M un R−módulo. Para cada m ∈ M , llamare-
mos anulador de m y lo denotaremos por AnnR (m) ⊆ R, al siguiente conjunto:
AnnR (m) := {λ ∈ R : λm = 0}.
Se trata de un ideal de R y lo llamaremos ideal anulador del elemento m. Un elemento m ∈ M
se denomina elemento de torsión si su anulador AnnR (m) 6= (0) es un ideal no nulo de R o,
equivalentemente, si se satisface:
∃λ ∈ R \ {0}, λm = 0.
Denotaremos por T orR (M ) al conjunto de los elementos de torsión de M .
Un módulo que no posee elementos de torsión no nulos se denomina R−módulo libre de torsión.
Observación 4.4.1. Si R es un dominio de integridad, el conjunto T orR (M ) es un submódulo

de M . En general, si R no es dominio de integridad, T orR (M ) no necesariamente es submódulo.
La razón es que, en ese caso, puede no ser subgrupo para la suma. Por ejemplo, si R := Z/6Z
y si M = Z/6Z, los elementos de torsión son los divisores de cero de Z/6Z que es dado como
la unión de los ideales (2Z/6Z) ∪ (3Z/6Z). Y claramente, (2 + 6Z) + (3 + 6Z) = 5 + 6Z no es
elemento de torsión porque es unidad en el anillo. En general, si R es un anillo y M = R es
visto como R−módulo sobre sı́ mismo, los elementos de torsión de M son, precisamente, los
divisores de cero de R. Por eso, en general, a los elementos de torsión se les denomina también
divisores de cero del R−módulo. Conservaremos nuestra terminologı́a con T orR (M ) porque nos
ocuparemos, en este Capı́tulo, solamente del caso de anillos R que son dominios de integridad.
Estas observaciones se resumen en la siguiente:

Proposición 4.4.2. Sea R un dominio de integridad y M un R−módulo. Entonces T orR (M ) ⊆
M es un submódulo y el R−módulo cociente
M/T orR (M ),
es libre de torsión.
Demostración. Ya hemos observado que si R es dominio de integridad T orR (M ) es
submódulo. Veamos que el cociente es libre de torsión. Para ello, sea m + T orR (M ) un
elemento de torsión del módulo cociente y sea λ ∈ R un elemento no nulo tal que:
λ ∈ AnnR (m + T orR (M )).
Esto significa que λm ∈ T orR (M ), luego existe un elemento m0 ∈ T orR (M ) tal que λm = m0 .
entonces, existe ξ ∈ R \ {0} tal que ξm0 = 0. Finalmente, (λξ) ∈ AnnR (m) y, como R es
dominio de integridad, λξ ∈ AnnR (m) \ {0}. Por tanto, m ∈ T orR (M ) o, equivalentemente,
m + T orR (M ) = 0 + T orR (M ).
Proposición 4.4.3. Sea R un dominio de integridad y M un R−módulo libre. Entonces M es

libre de torsión.
Demostración. Como M es libre posee una base β := {mi : i ∈ I}. Si m ∈ M fuera un
elemento no nulo y de torsión, tendrı́amos que existe J ⊆ I un conjunto finito y {λj : j ∈ J}
tales que X
m= λj mj .
j∈J
Como m 6= 0, J es no vacı́o y algunos de los λj han de ser no nulos. De hecho, podemos suponer
que todos son no nulos (i.e. podemos suponer que λj 6= 0, ∀i ∈ J 6= ∅).
Como m es un elemento de torsión, existe λ ∈ R, λ 6= 0, tal que se verifica:
 
X X
0 = λm = λ  λj mj  = (λλj ) mj .
j∈J j∈J
4.4. LIBRES Y LIBRES DE TORSIÓN SOBRE DOMINIOS DE IDEALES PRINCIPALES 205
Pero como β es base, entonces debemos tener:
λλj = 0, λj 6= 0, ∀j ∈ J.
Como R es un dominio de integridad, entonces se tiene que producir λ = 0 y habremos llegado

a contradicción.
Ejemplo 4.4.4. Se tienen los siguientes ejemplos:

i) Todo R−módulo de la forma Rn es libre de torsión cuando R es dominio. Por ejemplo,
Zm es Z−módulo libre de torsión, K[X]n es un K[X]−módulo libre de torsión.
ii) Si R es un dominio, R[X1 , . . . , Xn ] es un R−módulo libre de torsión. Lo mismo se
puede decir de Hd (X1 , . . . , Xn ).
iii) Todos los grupos cı́clicos finitos poseen elementos de torsión no nulos. Por ejemplo,
todos los Z−módulos de la forma Z/mZ, con m ∈ N, m ≥ 2.
iv) La existencia de elementos de torsión no nulos depende del anillo y no solamente
del conjunto de elementos de M . Nótese que los Z/mZ−módulos (Z/mZ)n son
Z−módulos que poseen elementos de torsión no nulos, pero, si p ∈ N es primo, los
Z/pZ−módulos (Z/pZ)n son Z/pZ−espacio vectoriales y son libres de torsión como
Z/pZ−módulos. En cambio, si m ∈ N es no primo, los Z/mZ−módulos (Z/mZ)n
también poseen elementos de torsión como Z/mZ−módulos. Por ejemplo, el elemento
(2 + 6Z, 0 + Z/6Z) en (Z/6Z)2 es un elemento de torsión no nulo sobre Z/6Z, dado
que
AnnZ/6Z ((2 + Z/6Z, 0 + Z/6Z)) = (3 + Z/6Z) ⊆ Z/6Z.
v) Argumentos similares al apartado anterior pueden construirse cuando se tratan módulos
sobre K[X].
Vamos a proceder a caracterizar la condición de ser libre de torsión en el caso de R−módulos

libres finitamente generados sobre un dominio de ideales principales en las páginas siguientes.
Teorema 4.4.5. Sea R un dominio de ideales principales y M un R−módulo finitamente

generado y libre de torsión. Entonces, todo sistema generador de M de cardinal minimal es
base de M .
Es decir, si R es dominio de ideales principales, las siguientes propiedades son equivalentes para
un R−módulo M :
i) M es libre de torsión y finitamente generado.
ii) M es libre de rango finito.
iii) M es proyectivo y finitamente generado.
Demostración. La equivalencia entre ii) y iii) ya se ha discutido en el Corolario 4.3.7

anterior. La otra equivalencia se sigue de la primera afirmación del enunciado: se trata de
ver que todo conjunto minimal de generadores de un R−módulo libre de torsión finitamente
generado sobre un DIP es una base como R−módulo libre. Supongamos que S := {e1 , . . . , em }
es un conjunto minimal de generadores de M como R−módulo, que existe porque M es finita-
mente generado. Dentro de ese conjunto podemos elegir un subconjunto maximal de elementos
linealmente independientes sobre R. Salvo reordenación de los ı́ndices, podemos suponer que
existe s ≤ m tal que S := {e1 , . . . , es } son un conjunto maximal de elementos de S linealmente
independientes sobre R. Existe con s ≥ 1 por ser libre de torsión. Sea F el submódulo que
genera S, que es un R−módulo libre. Si s = m, entonces F = M y habremos terminado.
Supongamos que fuera posible que s < m. Entonces, para cada i, s + 1 ≤ i ≤ m, existe λi ∈ R
no nulo tal que λi ei ∈ F . Basta con ver que {e1 , . . . , es , ei } ha de verificar una combinación
lineal no trivial igualada aQcero y que, en esa combinación lineal, el coeficiente de ei ha de ser
m
no nulo. Definamos Λ := i=s+1 λi ∈ R. Tenemos que Λ 6= 0 en R porque R es un dominio de
integridad. Definamos la aplicación siguiente:
Λ: M −→ M
m 7−→ Λm.
Es un endomorfismo de R−módulos y su imagen Λ(M ) está contenida en F . Para verlo,

observemos que Λej ∈ F para 1 ≤ j ≤ s porque ej ∈ F . De otro lado,
 
Y
Λei =  λk  λi ei ∈ F,
k6=i
porque λi ei ∈ F . Como Λ(M ) ⊆ F y F es libre de rango finito, por el Teorema 4.3.5 precedente,
Λ(M ) es un R−módulo libre y su rango verifica
rankR (Λ(M )) ≤ rankR (F ) = s.
Podemos reescribir el morfismo de R−módulos Λ por restricción del rango:
Λ: M −→ Λ(M )
m 7−→ Λm.
De momento tenemos un morfismo suprayectivo por obvias razones y, como M es libre de
torsión, entonces Λ debe ser un monomorfismo. Nótese de Λ 6= 0, luego Λm = 0 implica m = 0
en M por ser M libre de torsión.
En conclusión, M es isomorfo a un R−módulo libre de rango menor que s < m, con lo que
tiene un sistema generador con, a lo sumo, s elemetos (la imagen inversa de la base de Λ(M ))
que tiene, a lo sumo, s elementos). En suma, si s < m, habrı́amos llegado a contradicción con
la minimalidad de m entre los cardinales de los sistemas de generadres de M .
Corolario 4.4.6. Si R es un dominio de ideales principales y M es un R−módulo libre de

torsión finitamente generado, todo conjunto generador de cardinal minimal es una base de M
como R−módulo libre.
Demostración. Es exactamente lo que se prueba en el Teorema precedente.
Corolario 4.4.7. Si R es un dominio de ideales principales y M es un R−módulo finitamente

generado, El R−módulo cociente:
M/T orR (M ),
es un R−módulo libre de rango finito.
Demostración. Ya hemos visto que M/T orR (M ) es libre de torsión en una Proposición
pecedente y, como M es finitamente generado, entonces también es R−módulo finitamente
generado el cociente M/T orR (M ). Por tanto, el Teorema precedente nos dice que M/T orR (M )
es libre de rango finito.
Ejemplo 4.4.8. Los siguientes ejemplos son también ejemplos donde los módulos lo son sobre
dominios euclı́deos.
i) Los Z−módulos libres de torsión y finitamente generados son los isomorfos a Zn . Todo
submódulo de Zn es libre y de rango finito. Pero el rango del submódulo no es siempre
estrictamente menor que el rango del módulo libre del que partı́amos. Por ejemplo,
3
(2Z) es un Z−módulo libre de rango 3 que es submódulo de Z3 que también es libre
de rango 3, pero no son iguales.
ii) Los K[X]−módulos libres de torsión y finitamente generados son los isormorfos a
K[X]n . Lo mismo se aplica a sus submódulos y al rango.
iii) En el Ejemplo de la Teorı́a del endomorfismo (ver 2.2.4), la estructura de K[X]−módulo
del espacio vectorial V , de dimensión finita sobre K, con respecto a un endomorfismo
ϕ : V −→ V no es la estructura de un K[X]−módulo libre. En particular no es libre
de torsión y todos los elementos v ∈ V poseen anulador no trivial. De hecho, el ideal
AnnK[X] (v) := {p ∈ K[X] : p ·K[X] v = p(ϕ)(v) = 0},
es un ideal principal en K[X] generado por un polinomio que se denomina polinomio
mı́nimo del endomorfismo ϕ con respecto al vector v.
Observación 4.4.9 (Contraejemplos). Las hipótesis del Teorema 4.4.5 precedente son in-
evitables.
i) Sobre dominios de ideales principales, hay módulos libres de torsión que no son libres,
porque no son finitamente generados. A modo de ejemplo, Q es un Z−módulo libre de
torsión. Ahora bien, cualesquiera dos números racionales son linealmente dependientes
sobre Z (ver Problema 166). Por tanto, si Q es un Z−módulo libre, la base sólo puede
tener un elemento y Q serı́a libre de rango 1. Pero, entonces, todos los números
racionales tendrı́an el mismo denominador, lo que no es el caso.
ii) Sobre anillos que no son dominios de ideales principales, hay módulos libres de torsión
y finitamente generados que no son libres. El ejemplo más simple es el anillo K[X, Y ]
y el ideal m := (X, Y ). Se trata de un ideal de un dominio de integridad, ası́ que es
un módulo libre de torsión. Es claro, por su definición que es un ideal (y, por tanto,
un módulo) finitamente generado sobre K[X, Y ]. Sin embargo, no es libre. Si fuera
libre, entonces serı́a un ideal principal (ver Problema 167) y ya hemos indicado que m
no es un ideal principal en los Ejemplos 3.2.1.
Teorema 4.4.10. Sea R un dominio de ideales principales. Entonces, todo módulo finitamente
generado M , admite una descomposición de la forma:
M∼ = F (M ) ⊕ T orR (M ),
donde F (M ) ∼
= M/T orR (M ) es un R−módulo libre de rango finito.
Demostración. Para ello, consideremos el R−módulo cociente:
F (M ) := M/T orR (M ).
Por la Proposición 4.4.2, M/T orR (M ) es libre de torsión y finitamente generado y por el
Teorema 4.4.5 es un R−módulo libre. Consideremos la proyección canónica
π : M −→ M/T orR (M ) = F (M ).
Por el Lema 4.3.3, F (M ) es un R−módulo proyectivo. Tenemos la sucesión exacta corta:
i π
0 T orR (M ) M M/T orR (M ) 0,
donde i es la inclusión y π es la proyección canónica. Como M/T orR (M ) es proyectivo, por el

apartado iii) de la Proposición 4.3.9, esta sucesión exacta corta es escindida. Existirá entonces
un isomorfimos de R−módulos ψ : M −→ T orR (M ) ⊕ M , lo que concluye la prueba del
enunciado.
Corolario 4.4.11. En particular, todo grupo abeliano finitamente generado es el cociente de

dos Z−módulos libres de rango finito.
Demostración. Ver Corolario 4.3.11.
Corolario 4.4.12 (Estructura de Grupos Abelianos Finitamente Generados (Parte

I)). Sea G un grupo abeliano finitamente generado, entonces, existen r, m ∈ N, G es isomorfo
al producto de grupos abelianos:
Zr × G1 ,
donde G1 = T orZ (G) es un grupo abeliano finito (i.e. de cardinal finito) igual a m formado por
los elementos de torsión de G.
Demostración. Por el resultado precedente, como Z es un dominio de ideales principales
y G es un Z−módulo finitamente generado, podemos concluir que
G := F (G) × T orZ (G).
Como F (G) es libre y finitamente generado, entonces F (G) = Zr y nos queda por analizar
solamente T orZ (G) y probar que es un grupo abeliano de cardinal finito.
Ahora, T orZ (G) es un Z−módulo finitamente generado porque G es finitamente generado y Z
es un anillo noetheriano (cf. Proposición 4.2.27) y, además, todos sus elementos son de torsión.
Sea {g1 , . . . , gt } un sistema generador de cardinal minimal de T orZ (G). Definamos:
ϕ: Zt −→ T or (G)
Pt Z
(x1 , . . . , xt ) 7−→ i=1 xi gi .
Claramente, ϕ es un morfismo suprayectivo de Z−módulos y denotemos por K su núcleo. De

otro lado, como g1 , . . . , gt son todos elementos de torsión, para cada i, 1 ≤ i ≤ t, existe mi ∈ N,
mi ≥ 1 tal que mi gi = 0 en G (es decir, mi ∈ AnnZ (gi )). Entonces, es fácil observar que el
siguiente subgrupo libre de Zt está contenido en K:
t
Y
mi Z ⊆ K.
i=1
Por tanto, usando el Primer y el Segundo Teorema de Isomorfı́a, observamos que
Q
t t
Z / mi Z
T orZ (G) ∼
= Zt /K ∼
i=1

= / Q
t
.
K/ i=1 mi Z
Q
t
Por tanto, T orZ (G) es un cociente del grupo abeliano G0 := Zt / i=1 mi Z , por un subgrupo
suyo. Pero, el grupo G0 es un grupo abeliano de cardinal finito: es un producto de grupos
cı́clicos
Yt
G0 := (Z/mi Z) ,
i=1
luego también es de cardinal finito cualquiera de sus cocientes. Hemos probado ası́ que T orZ (G)
es un grupo abeliano de cardinal (orden) finito.
Observación 4.4.13. Veremos más adelante que todo grupo abeliano finito es un producto
finito de grupos cı́clicos y por tanto, T orZ (G) es un producto finito de grupos cı́clicos de orden
finito.
Corolario 4.4.14 (Conjunto de Soluciones de un sistema lineal homogéneo de ecua-

ciones diofánticas). Todo conjunto de soluciones de un sistema lineal de ecuaciones diofánticas
homogéneas es un Z−módulo libre. Es decir, sea dada una matriz A ∈ Mn×m (Z) con n filas,
m columnas y coordenadas en Z. Consideremos el conjunto de soluciones del sistema de ecua-
ciones lineales diofánticas homogéneo definido por A:
   
x1 0
 x2   0 
(x1 , . . . , xn ) ∈ Zn , A  .  =  .  ∈ Zm .
   
 ..   .. 
xn 0
El conjunto de soluciones diofánticas de este sistema homogéneo es un Z−módulo libre (submódulo
de Zn ) de rango finito.
Demostración. Es obvio que el conjunto de soluciones es submódulo de Zn (por ser
homogéneas). Entonces, por lo visto anteriormente, es libre de torsión y, por tanto, es un
Z−módulo libre.
4.4.2. Libres de torsión sobre dominios euclı́deos (Opcional). En la Sección prece-

dente (Subsección 4.4.2 hemos demostrado el Teorema 4.4.5 que muestra que en el caso de
módulos finitamente generados sobre un dominio de ideales principales, libre equivale sobre
libre de torsión. Ahora vamos a hacer una prueba distinta en el caso de dominios euclı́deos. La
razón de incluir este segundo enunciado es que contiene una cierta forma de poder controlar
cómo se produce este resultado en función del crecimiento y decrecimiento de los coeficientes.
Lo dejamos como Subsección opcional del curso.
Proposición 4.4.15. Sea (R, φ) un dominio euclı́deo y sea M un R−módulo finitamente gen-
erado. Sea β := {a1 , . . . , an } un sistema generador de M y sea Λ := (λ1 , . . . , λn ) ∈ Rn una
lista de elementos de R (tantos como elementos tiene el sistema generador). Supongamos que
gcd(λ1 , . . . , λn ) = (1).
Entonces, existe un sistema generador de M con el mismo cardinal que β
β 0 := {b1 , . . . , bn },
de tal modo que

n
X
b1 ; = λi ai .
i=1
Demostración. Dada una lista Λ = (λ1 , . . . , λn ) ∈ Rn , definamos el conjunto: J(Λ) :=

{i ∈ {1, . . . , n} : λi 6= 0}, y la función:
r
X
Φ(Λ) := φ(λi ).
i=1
Nótese que si gcd(λ1 , . . . , λn ) = 1, necesariamente J(Λ) 6= ∅.
Comencemos observando que la propiedad se verifica si alguno de los λi es unidad en R: Porque

si existe i ∈ J(Λ) tal que λi ∈ R× , podemos suponer, reordenando los elementos de la base y
de la lista si fuera necesario, que i = 1 y que λ1 ∈ R× . En ese caso, el conjunto
β 0 := {b1 , a2 , . . . , an },
Pn
con b1 := i=1 λi ai , es también un sistema generador de M , dado que
n
!
X
−1 −1
a1 := λ1 b1 − λ1 λi ai .
i=2
Y la afirmación se verifica obviamente.
Nótese que como gcd(λ1 , . . . , λn ) = 1, J(Λ) 6= ∅ y necesariamente se ha de tener:
Φ(Λ) ≥ φ(1) + (n − 1)φ(0) > nφ(0).
La razón es simple. Como hemos visto, en la Proposición 3.4.3, que φ(a) > φ(0) para todo
a ∈ R, a 6= 0, y que φ(a) ≥ φ(1), si a 6= 0. Podemos suponer, por ejemplo, que 1 ∈ J(Λ) 6= ∅ y,
por tanto,
Xn
Φ(Λ) ≥ φ(λ1 ) + φ(λi ) ≥ φ(λ1 ) + (n − 1)φ(0) ≥ φ(1) + (n − 1)φ(0).
i=2
Como Φ(Λ) ∈ Z y Φ(Λ) ≥ φ(1)+(n−1)φ(0), probaremos la Proposición por inducción en Φ(Λ).
Supongamos Φ(Λ) = φ(1) + (n − 1)φ(0). Como J(Λ) 6= ∅, podemos suponer, reordenando los
ı́ndices si fuera necesario que 1 ∈ J(Λ), es decir, λ1 6= 0. Entonces tenemos,
n
X
(φ(λ1 ) − φ(1)) + (φ(λi ) − φ(0)) = 0.
i=1
Como φ(λ1 ) − φ(1) ≥ 0 y φ(λi ) − φ(0) ≥ 0 para todo i, 2 ≤ i ≤ n, esta suma es una suma de
enteros positivos igualada a cero, por cuanto, tendrı́amos:
φ(λ1 ) − φ(1) = 0, φ(λ2 ) − φ(0) = 0, . . . , φ(λ2 ) − φ(0) = 0.
Por tanto λ1 ∈ R× y λi = 0, 2 ≤ i ≤ n. Pero, entonces, estarı́amos en el caso que ya hemos
visto que se verifica por defecto.
Supongamos ahora que Φ(Λ) = m > φ(1). Si alguno de los λi es unidad, ya habremos
terminado. Supongamos, entonces, que ninguno de los λi es unidad. Supongamos
Λ := (λ1 , . . . , λn ),
con la propiedad gcd(λ1 , . . . , λn ) = 1. Entonces, el conjunto J(Λ) no puede ser un conjunto de
cardinal 1. Porque si J(Λ) tuviera un sólo elemento, por ejemplo J(Λ) = {i}, tendrı́amos
gcd(λ1 , . . . , λn ) = gcd(0, . . . , 0, λi , 0, . . . , 0) = λi .
Como Φ(Λ) = m > φ(1) + (n − 1)φ(0), concluirı́amos que
Φ(Λ) = φ(λi ) + (n − 1)φ(0) = m > φ(1) + (n − 1)φ(0),
con lo que λi no serı́a unidad de R y, por tanto, gcd(λ1 , . . . , λn ) 6= 1, contradiciendo nuestras
hipótesis.
Dado que J(Λ) posee más de un elemento, podemos suponer que 1, 2 ∈ J y que φ(λ1 ) ≥ φ(λ2 ).
Además, como ninguno de los dos es unidad, se tiene:
φ(λ1 ) ≥ φ(λ2 ) > φ(1) ≥ 0.
Podemos aplicar divisón euclı́dea y tendremos que existen q, r ∈ R tales que
λ1 = qλ2 + r, φ(r) < φ(λ2 ) ≤ φ(λ1 ).
Ahora consideremos la lista
Λ1 := (r, λ2 , . . . , λn ) ∈ Rn .
Nótese que gcd(r, λ2 , . . . , λn ) = 1 porque se tiene la coincidencia de ideales:
a := (r, λ2 , . . . , λn ) = (λ1 , λ2 , . . . , λn ) = b.
Para verlo, es claro que b ⊆ a, dado que λ1 = qλ2 + r ∈ b. Pero también se tiene que a ⊆ b,
dado que r = λ1 − qλ2 ∈ b.
De otro lado, se tiene
n
X n
X
Φ(Λ1 ) = φ(r) + < φ(λ1 ) + φ(λi ) = Φ(Λ).
i=2 i=2
Consideremos ahora la lista de elementos de M dada mediante:

β1 := {a1 , (a2 + qa1 ), a3 , . . . , an },
junto con la lista Λ1 antes introducida. Observamos que β1 es un sistema generador de M .
Para verlo, sea N el submódulo de M generador por β1 . Es claro que {a1 , a3 , . . . , an } ⊆ N .
Pero además,
a2 = (−1)a1 + (a2 + qa1 ) ∈ N,
con lo cual β ⊆ N y M ⊆ N ⊆ M .
Como Φ(Λ1 ) < Φ(Λ) podemos aplicar la hipótesis inductiva al par (β1 , Λ1 ) y existirá un sistema
generador β 0 := {b01 , b02 , . . . , b0n } de M tal que
b01 = ra1 + λ2 (a2 + qa1 ) + λ3 a3 + · · · λn an .
Ahora bien, el conjunto β es un conjunto de generadores de M que verifica:
b01 = (qλ2 + r)a1 + λ2 a2 + · · · + λn an = λ1 a1 + λ2 a2 + · · · + λn an ,
y β 0 verifica la propiedad enunciada para el (β, Λ), con lo que la Proposición queda demostrada
por inducción.
Teorema 4.4.16. Sea (R, φ) un dominio euclı́deo y M un R−módulo libre de torsión y finita-
mente generado. Entonces, todo sistema generador de M de cardinal minimal es base de M .
En particular, si (R, φ) es euclı́deo y M es finitamente generado, entonces,
M es libre de torsión ⇐⇒ M es libre
Demostración. La segunda afirmación es consecuencia de la primera. Si M es finita-
mente generador, existe un sistema generador de M de cardinal minimal y, por tanto, si M es
libre de torsión, entonces ese sistema generador es base de M como R−módulo, por cuanto M
es libre. Para la otra implicación véase la Proposición 4.4.3 anterior.
Para la primera afirmación usaremos la Proposición 4.4.15 anterior. Sea β = {a1 , . . . , an } ⊆ M

un sistema generador minimal de M . Supongamos que β no fuera libre. Entonces, existe una
lista (λ1 , . . . , λn ) ∈ Rn de elementos no todos nulos tales que
λ1 a1 + · · · + λn an = 0.
Como R es dominio de ideales principales, sea h = gcd(λ1 , . . . , λn ) ∈ R. Como no todos los
λi son nulos y R es dominio, necesariamente se ha de tener h 6= 0. La identidad anterior será
ahora:
h (λ01 a1 + · · · + λ0n an ) = 0,
donde λ0i h = λ. Sea m := (λ01 a1 + · · · + λ0n an ) entonces hm = 0 y m es un elemento de torsión

de M . Como M es libre de torsión, entonces m ha de ser nulo, esto es, tenemos
(λ01 a1 + · · · + λ0n an ) = 0.
Pero, además gcd(λ01 , . . . , λ0n ) = 1, por ser hλ0i = λi y h = gcd(λ1 , . . . , λn ). Por tanto estamos
en las hipótesis de la Proposición 4.4.15 anterior con
β := {a1 , . . . , an },
y
Λ := (λ01 , . . . , λ0n ).
Por tanto, debe existir un sistema genedaor de M
β 0 := {b1 , . . . , bn },
donde
n
X
b1 = λ0i ai = 0.
i=1
Pero entonces, el siguiente conjunto
β 00 := {b2 , . . . , bn },
genera M como R−módulo y tiene cardinal n − 1, lo que contradice la minimalidad del cardinal
de β como generador de M .
Obsérvese que, en este caso, el Teorema 4.3.5 pasa a ser un Corolario.

Corolario 4.4.17. Si (R, φ) es un dominio euclı́deo, todo submódulo de un R−módulo libre
finitamente generado es libre.
Demostración. Si M es un R−módulo libre finitamente generado, entonces es libre de
torsión. Si M es libre de torsión, todo submódulo suyo es libre de torsión. Además, por la
Proposición 4.2.27 todo submódulo de M es finitamente generado (porque R es dominio de
ideales principales y M es finitamente generado. Entonces, N es libre de torsión y finitamente
generado sobre un dominio euclı́deo, luego M es un R−módulo libre de rango finito.
4.4.3. Ejercicios y problemas de las secciones 4.2 y 4.3.
Problema 161. Pruébese la Proposición 4.2.28. Es decir, pruébese que si R es un anillo
noteheriano y M es un R−módulo finitamente generado, todo submódulo de M es también
finitamente generado. ( Hint: Seguir la estructura de la demostración de la Proposición 4.2.27,
adaptando el argumento al caso en que R es noetheriano, aunque no sea DIP.)
Problema 162. Hallar Spec(Z[X]) y MaxSpec(Z[X]).
Problema 163. Dar ejemplos de K[X]−módulos que tengan las propiedades que se indican a
continuación:
i) Un ejemplo de un K[X]−módulo M que posee elementos de torsión, pero existe un
polinomio f ∈ K[X] tal que M es un K[X]/(f )−módulo libre de torsión.
ii) Un ejemplo de un K[X]−módulo M que posee elementos de torsión, y tal que existe
f ∈ K[X] tal que M posee elementos de torsión no nulos como K[X]/(f )−módulo.
Problema 164. Prueba que si K es un cuerpo de cardinal infinito y si f ∈ K[X1 , . . . , Xn ] es
un polinomio no nulo, entonces existe (x1 , . . . , xn ) ∈ K n tal que p(x1 , . . . , xn ) 6= 0.
Problema 165 (Polinomio mı́nimo de un endomorfismo). Sea V un espacio vectorial de
dimensión finita sobre K, sea ϕ : V −→ V un endomorfismo, Sea
·K[X] : K[X] × V −→ V
(p(X), v) 7−→ p(ϕ)(v) ∈ V,
la operación de que hace que V sea un K[X]−módulo, como se discute en el Ejemplo 2.2.4.
Para cada v ∈ V , denotemos por µv ∈ K[X] el polinomio generador de AnnK[X] (V ) tal y como
se define en el Ejemplo 4.4.8. Sea
β := {v1 , . . . , vn }
una base de V como K−espacio vectorial. Prueba:
i) Existe un polinomio mónico y de grado n p ∈ K[X] tal que para todo v ∈ V p ∈

AnnK[X] (v).
ii) Los polinomios µv ∈ K[X] tienen todos grado acotado por n.
iii) Sea h(X) el mı́nimo común múltiplo de {µv1 , . . . , µvn } en K[X]. Entonces h ∈
AnnK[X] (v), para todo v ∈ V .
iv) Concluir que el h anterior es el polinomio de mı́nimo grado tal que h(ϕ) = 0 como
endomorfismo. Este polinomio es el polinomio mı́nimo de ϕ y se denotará mediante
µϕ .
v) Prueba el siguiente resultado (conocido como el Avoidance Lemma):
Lema 4.4.18 (Avoidance Lemma). Sea K un cuerpo infinito y sea V un es-
pacio vectorial no nulo. Entonces, V no se puede escribir como unión de dos o más
subespacios propios distintos. Es decir, si V = W1 ∪ · · · ∪ Wr , con r ≥ 2, entonces
existe i ∈ {1, . . . , r} tal que V = Wi . Discute un enunciado si K no es infinito.
vi) Prueba que si K es un cuerpo infinito, existe un vector v ∈ V tal que
µv = µϕ .
Problema 166. Probar que Q es un Z−módulo libre de torsión. Pruébese asimismo que cua-
lesquiera dos números racionales son linealmente dependientes sobre Z. Concluir que si Q fuera
un Z−módulo libre, entonces tendrı́a rango 1.
Problema 167. Probar que si R es un dominio de integridad y a es un ideal de R que es,
además, libre como R−módulo, entonces a ha de ser un ideal principal.
4.4.3.1. Forma (Canónica Racional) de Frobenius de un endomorfismo. Los ejer-
cicios que siguen muestran la presentación de todo endomorfismo como suma diagonal de ma-
trices compañeras sobre el cuerpo de base.
Problema 168 (Matriz compañera de un polinomio). Sea R un anillo y sea f (X) ∈ R[X]
un polinomio mónico con coeficientes en R. Supongamos:
f (X) := X n + an−1 X k−1 + · · · + a1 X + a0 .
Se denomina matriz compañera de f a la matriz
 
0 0 0 ··· 0 −a0
 1
 0 0 ··· 0 −a1 

 0 1 0 ··· 0 −a2 
C(f ) :=  0 .
 
 0 1 ··· 0 −a3 
 .. .. .. . . .. .. 
 . . . . . . 
0 0 0 ··· 1 −an−1
Se pide:
i) Hallar las matrices compañeras de los siguientes polinomios:
X 3 − 2X + 1, X 2 − 2X − 1, X 5 − 3X 3 + X + 1.
ii) Supongamos R = K es un cuerpo. Considera el ideal a := (f ) generado por f en K[X]
y el anillo cociente K[X]/a. Prueba que K[X]/a es un espacio vectorial de dimensión
finita sobre K y que la siguiente es una base de K[X]/a como K−espacio vectorial:
β := {1 + a, X + a, . . . , X n−1 + a}.
iii) Hallar la dimensión de K[X]/a como K−espacio vectorial.
iv) Con las mismas notaciones, consideremos la siguiente correspondencia:
ηX := K[X]/a −→ K[X]/a
h+a 7−→ Xh + a.
Prueba que ηX es aplicación, probar que es un endomorfismo de K[X]/a como K−espacio
vectorial y probar que la matriz de coordenadas de ηX en la base β es justamente la
matriz compañera C(f ) del polinomio f dado.
v) Con las mismas notaciones, para cada polinimio g ∈ K[X] definamos la siguiente
correspondencia:
ηg := K[X]/a −→ K[X]/a
h+a 7−→ gh + a.
Prueba que es un endomorfismo de espacios vectoriales (que se denomina homotecia
de razón g de K[X]/a y que es un endomorfismo de K[X]−módulos. Prueba que se
dan las siguientes propiedades:
ηg1 +g2 = ηg1 + ηg2 , ηg1 g2 = ηg2 ◦ ηg1 = ηg1 ◦ ηg2 , ∀g1 , g2 ∈ K[X].
η0 = 0, η1 = IdK[X]/a .
vi) Prueba que la matriz de ηg en la base β anterior es
g(C(f )) ∈ Mn (K),
donde C(f ) es la matriz compañera de f y g(C(f )) es el resultado de evaluar g en
X = C(f ) matricialmente.
Problema 169. Con las mismas notaciones, si v ∈ V es un vector y µv es un polinomio de
grado k, el siguiente subespacio vectorial de V es submódulo como K[X]−módulo:
W (v, ϕ) := Khv, ϕ(v), ϕ2 (v), . . . , ϕk−1 (v)i.
(Pista: probar que es invariante con respecto a ϕ) Se pide también:
i) La dimensión de W (v, ϕ) es k. (Pista: probar que {v, ϕ(v), ϕ2 (v), . . . , ϕk−1 (v)} son
linealmente independientes sobre K).
ii) Consideremos la restricción de ϕ al subespacio W (v, ϕ) (tiene sentido porque W (v, ϕ)
es subespacio invariante):

φ := ϕW (v,ϕ) : W (v, ϕ) −→ W (v, ϕ)
w 7−→ ϕ(w).
Prueba que existe una base β de W (v, ϕ) tal que la matriz de φ en esa base β es la
matriz compañera del polinomio mı́nimo de f en v. (Pista: usar
β := {v, ϕ(v), ϕ2 (v), . . . , ϕk−1 (v)}).
Problema 170. Con las notaciones de los problemas anteriores, sea ϕ : V −→ V un endo-
morfismo de un espacio vectorial V de dimensión n sobre un cuerpo K. Sea v ∈ V un vector
no nulo y sea µv el polinomio mı́nimo de ϕ en v. Supongamos que el grado de µv es k. Prueba
que se puede encontrar un subespacio V1 ⊆ V de dimensión n − k, tal que:
M
V = W (v, ϕ) V1 ,
y se satisface la siguiente propiedad: Existe una base {wk+1 , . . . , wn } de V1 tal que para todo i,
1 ≤ i ≤ n − k, existen ci ∈ K y hi ∈ V1 tales que
ϕ(wi ) = ci v + hi .
( Pista: Completa la base {v, ϕ(v), ϕ2 (v), . . . , ϕk−1 (v)} de W (v, ϕ) hasta obtener una base de
V : β0 := {v, ϕ(v), ϕ2 (v), . . . , ϕk−1 (v), uk+1 , . . . , un }. Denotemos por V0 el subespacio generado
por {uk+1 , . . . , un }. Para cada i, k + 1 ≤ i ≤ n, la imagen de ui a través de ϕ será de la forma:
k−1
X
ϕ(ui ) = c0 v + cj f j (v) + λui + hi ,
j=1
donde
• c0 , c1 , . . . , ck−1 , λ ∈ K,
• hi es un elemento del subespacio de V0 generado por los elementos que la base de V0
que no son ui . Es decir,
hi ∈ Kh{ut : t 6= i}.
Con estas notaciones, construye una solución (x0 , . . . , xk−2 ) ∈ K n−2 del siguiente sistema de
ecuaciones lineales: 

 Xk−2 + ck−1 = 0,


 Xk−3 + c k−2 + λX k−2 = 0
.



 ..

 Xt + ct+1 + λXt+1 = 0

 ..
.




X0 + c1 + λX1 = 0.

Es decir, prueba que este sistema es compatible y considera (x0 , . . . , xk−2 ) ∈ K n−1 una solución.
Define c00 := c0 + λx0 . Define:
k−2
X
wi := ui + xi f t (v).
t=0
Verifica que, construyendo iterativamente wk+1 , . . . , wn , el subespacio V1 := Khwk+1 , . . . , wn i

generador por estos elementos verifica las condiciones indicadas, con
ϕ(wi ) = c0i v + Hi ,
con Hi ∈ V1 .) Adicionalmente, prueba que el conjunto β siguiente es base de V :
β := {v, ϕ(v), ϕ2 (v), . . . , ϕk−1 (v), wk+1 , . . . , wn }.
Prueba que la matriz de ϕ en la base β anterior tiene la forma siguiente:

C(µv ) N
M (ϕ) := ,
0 M
donde
• C(µv ) ∈ Mk (K) es la matriz compañera del polinomio mı́nimo µv ,
• 0 ∈ M(n−k)×k (K) es la matriz nula con n − k filas y k columnas,
• La matriz N ∈ Mk×(n−k) (K) es una matriz con k filas y n − k columnas en la que
sólo la primera fila puede contener elementos no nulos y tiene la forma:
 0
ck+1 c0k+2 · · · c0n

 0 0 ··· 0 
N :=  . ..  .
 
. ..
 .. .. . . 
0 0 ··· 0
• La matriz M ∈ Mn−k (K) es una matriz cualquiera con n − k filas y columnas.
Problema 171. Con las notaciones de los problemas anteriores, sea ϕ : V −→ V un endo-
morfismo de un espacio vectorial V de dimensión n sobre un cuerpo K. Sea v ∈ V un vector
no nulo y sea µv el polinomio mı́nimo de ϕ en v. Supongamos que el grado de µv es k. Sea
V1 ⊆ V un subespacio de dimensión n − k, y sea una base {w1 , . . . , wn−k } de V1 tal que para
todo i, 1 ≤ i ≤ n − k, existen ci ∈ K y ωi ∈ V1 tales que
ϕ(wi ) = ci v + ω1 .
Sea β la siguiente base de V construida en el problema precedente :
β := {v, ϕ(v), ϕ2 (v), . . . , ϕk−1 (v), wk+1 , . . . , wn }.
Supongamos que la matriz de ϕ en la base β tiene, como en el problema precedente, la forma
siguiente:

C(µv ) N
M (ϕ) := ,
0 M
donde
• C(µv ) ∈ Mk (K) es la matriz compañera del polinomio mı́nimo µv ,
• 0 ∈ M(n−k)×k (K) es la matriz nula con n − k filas y k columnas,
• La matriz N ∈ Mk×(n−k) (K) es una matriz con k filas y n − k columnas en la que

sólo la primera fila puede contener elementos no nulos y tiene la forma:
 
ck+1 ck+2 · · · cn
 0 0 ··· 0 
N :=  . ..  .
 
. .
. . .
 . . . . 
0 0 ··· 0
• La matriz M ∈ Mn−k (K) es una matriz cualquiera con n − k filas y columnas.
Prueba que si existe i, k + 1 ≤ i ≤ n tal que ci 6= 0, entonces el polinomio mı́nimo asociado a ϕ
con respecto al vector wi tiene grado estrictamente mayor que el grado del polinomio mı́nimo
µv , es decir, probar que
deg(µwi ) > deg(µv ).
(Pista: Prueba que los vectores siguientes son linealmente independientes en V :
{wi , f (wi ), . . . , f k−1 (wi ), f k (wi )}.
Para ello, hallar sus coordenadas en la base β a partir de las matrices dadas.)
Problema 172. Deducir del problema anterior que si K es un cuerpo (finito o infinito) y si
V es un espacio vectorial de dimensión finita sobre K, y si ϕ : V −→ V es un endomorfismo,
entonces existe un vector v ∈ V tal que µv es igual al polinomio mı́nimo de ϕ.
Problema 173 (Existencia de forma canónica cı́clica (racional o de Frobenius) de
un endomorfismo). Prueba que si ϕ : V −→ V es un endomorfismo de un espacio vectorial
de dimensión finita n sobre K, existen polinomios f1 (X), . . . , fr (X) tales que
r
Y
fi = χA (X),
i=1
y existe una base β de V tal que la matriz de ϕ en la base β es de la forma:
 
C(f1 ) 0 0 ··· 0

 0 C(f2 ) 0 ··· 0  
M (ϕ) := 
 0 0 C(f 3 ) · · · 0  ,
 .. .. .. .. 
 . . . . 
0 0 0 · · · C(fr )
donde los 00 s son matrices nulas de tallas adecuadas y las matrices C(f1 ), . . . , C(fr ) son respec-
tivamente las matrices compañeras de f1 , . . . , fr . probar que los polinomios fi pueden elegirse
de tal modo que fi | fi−1 . En este caso, se dice que los polinomios {f1 , . . . , fr } son los factores
invariantes de ϕ. Se llama forma canónica racional (también forma cı́clica o forma canónica
de Frobenius, según los autores).
Problema 174 (Interpolación de Polinomios). Sea K un cuerpo y sean α1 , . . . , αn ∈ K ele-
mentos del cuerpo. Se denomina matriz de Vandermonde (Alexandre-Théophile Vandermonde)
n × m sobre K determinada por esta lista de valores, a la matriz:
1 α1 α12 · · · α1m
 
1 α2 α22 · · · α2m 
V dMn×m (α1 , . . . , αn ) :=  . ..  .
 
. ..
. . . 
1 αn αn2 · · · αnm
En el caso m = n − 1 escibiremos simplemente
V dM (α1 , . . . , αn ) = V dMn×m (α1 , . . . , αn ).
Se pide:
i) Considerar el K−espacio vectorial K[X]m de los polinomios univariados de grado
acotado por m. Y para el punto α := (α1 , . . . , αn ) ∈ K n , consideremos la aplicación
siguiente:
evalα : K[X]m −→ Kn
f 7−→ (f (α1 ), . . . , f (αn )).
Prueba que es una aplicación lineal entre K−espacios vectoriales. Considerar en

K[X]m la base monomial {1, X, X 2 , . . . , X m } y en K‘n la base canónica. probar que
la matriz de evalα en esas bases es la matriz de Vandermone, es decir, probar que:

M evalα = V dMn×m (α1 , . . . , αm ).
ii) Prueba que, en el caso m = n − 1, el determinante de la matriz de Vandermonde
verifica
Y
det (V dM (α1 , . . . , αn )) = (αi − αj ) .
i<j
iii) Prueba que el determinante de la matriz de vandermondeQn V dM (α1 , . . . , αn ) está rela-

cionado con el discriminante del polinomio f (X) := i=1 (X − αi ).
iv) Prueba que si m = n − 1, la aplicación lineal evalα es un isomorfismo de K−espacio
vectoriales si y solamente si αi 6= αj , ∀i 6= j.
v) Prueba que si m = n − 1, la aplicación lineal evalα es suprayectiva si y solamente si
αi 6= αj , ∀i 6= j.
vi) Concluir que si m ≥ n − 1 la aplicación lineal evalα es suprayectiva si y solamente si
αi 6= αj , ∀i 6= j.
Se llaman procedimientos de interpolación a todo procedimiento de resolución del sistema de
ecuaciones lineales:    
A0 b1
 A1   b2 
V dMn×m (α1 , . . . , αn )  .  =  .  ,
   
 ..   .. 
Am bn
donde los datos son el vector (b1 , . . . , bn ) ∈ K n y el punto α = (α1 , . . . , αn ) ∈ K n , además del
grado m. A toda solución de ese sistema de ecuaciones (a0 , . . . , am ) ∈ K m+1 le corresponde un
único polinomio solución
f = am X m + · · · a1 X + a0 ∈ K[X]m .
Prueba que un problema de interpolación posee solución si αi 6= αj , ∀i 6= j.
Problema 175 (Interpolación de Lagrange). Sea K un cuerpo que tiene, al menos, n
elementos distintos α1 , . . . , αn ∈ K. Sea (b1 , . . . , bn ) ∈ K n un punto en el espacio afı́n
n−dimensional y sea m ≥ n − 1. Consideremos el Problema de Interpolación definido por
estos tres elementos sobre K.
   
A0 b1
 A1   b2 
V dMn×m (α1 , . . . , αn )  .  =  .  .
   
 ..   .. 
Am bn
Se pide:
i) Interpolación de Lagrange: Probar que el siguiente polinomio es la única solución
de grado menor o igual que n − 1 en K[X]m del problema de interpolación anterior:
n Q
j6=i (X − αj )
X
fLg := bi Q .
i=1 j6=i (αi − αj )
ii) Probar que si f, g ∈ K[X] son dos soluciones del Problema de Interpolación, entonces,
f − g es una solución del Problema de Interpolación homogéneo:
   
A0 0
 A1  0
V dMn×m (α1 , . . . , αn )  .  =  .  .
   
 ..   .. 
Am 0
Probar que el conjunto de soluciones de este Problema de Interpolación homogéneo es
la intersección n ∩ K[X]m , donde n es el ideal dado mediante: n := ∩ni=1 mαi .
4.5. DIAGONALIZACIÓN DE MATRICES SOBRE UN DIP 217
iii) Con las notaciones anteriores, probar que el conjunto de todas las soluciones del Prob-
lema de Interpolación inicial es dado mediante:
fLg + (n ∩ K[X]m ) = {fLg + h : h ∈ n ∩ K[X]m }.
Problema 176. Sea K un cuerpo cualquiera y p ∈ K[X] un polinomio de grado a lo sumo n.
Prueba que p no puede tener más de n raı́ces distintas en K. (Pista: recordar qué raı́ces son
las soluciones de la ecuación p(X) = 0. Prueba la afirmación usando el Problema precedente).
Problema 177. Sea K un cuerpo cualquiera y A ∈ Mn (K) una matriz cuadrada. Se pide:
i) Prueba que A no puede tener más de n valores propios distintos.
ii) Prueba que si A posee n valores propios distintos, entonces es diagonalizable.
iii) Prueba que el recı́proco de la afirmación anterior no es cierto.
( Hint: Aplicar interpolación al polinomio caracterı́stico (para la afirmación i). Para las otras
usar la forma cı́clica del endomorfismo.)
Problema 178. Lee el extracto de texto que aparece descrito al principio del Capı́tulo. La “es-
cena” descrita es un clásico, amplia y universalmente reconocible para cualquiera mı́nimamete
educado, sin necesidad de acudir a Wikipedia. Explica quién fue su autor, a qué obra pertenece,
qué papel juega la evocación y la decadencia en su contenido semántico y sintático. ¿Tiene la
obra de este autor, y en especial el tı́tulo de su obra, algo que ver con el contenido del Capı́tulo?.
4.5. Diagonalización de Matrices sobre un DIP

En la Sección 4.3 y en la Subsección 4.4.2 hemos visto que sobre dominios de ideales principales
y sobre dominios euclı́deos, en el caso de módulos finitamente generados, libre equivale a libre
de torsión. Vamos a ver esta idea en acción a través de la diagonalización de matrices sobre
ambos casos de anillos. La idea es originaria del matemático británico Henry J. Stephen Smith
en 1861 (cf. [Smith, 1861]).
4.5.1. Motivaciones.
4.5.1.1. Ecuaciones diofánticas. La forma normal de Smith nos permitirá analizar sis-
temas de ecuaciones lineales sobre un DIP y nos permitirá disponer de “algoritmos” en el caso
de que ese anillo sea un dominio euclı́deo. En esencia, sean dados
i) Una matriz A ∈ Mm×n (R) con m filas, n columnas y coordenadas en un dominio de
ideales principales R.
ii) Un elemento B ∈ Rm dado como columna.
iii) Una columna de variables X:
 
X1
 X2 
X :=  .  .
 
 .. 
Xn
el objetivo consiste en resolver el sistema de ecuaciones siguiente:
(4.5.1) AX = B.
Se trata de resolver y responder a las siguentes preguntas:
• ¿Es el sistema (4.5.1) compatible sobre Rn ?. Es decir, responde a la siguiente pregunta:
∃x := (x1 , . . . , xn ) ∈ Rn , Axt = B?,
donde xt significa traspuesta de x.
• Si el sistema (4.5.1) es compatible, hallar una solución particular x0 ∈ Rn de ese
sistema.
• Da una descripción completa del conjunto de todas las soluciones del sistema (4.5.1).
Para la tercera de las preguntas ya tenemos una resuesta parcial. Supongamos que x0 ∈ Rn
es una solución particular del sistema (4.5.1). Entonces, consideramos el conjunto K ⊆ Rn de
todas las soluciones del sistema homogéneo asociado al sistema (4.5.1) anterior. Es decir, el
sistema:
(4.5.2) AX = 0,
donde 0 es el vector columna formado solamente por ceros. Entonces se tiene:
Proposición 4.5.1. Con las anteriores notaciones, supongamos que existe x0 ∈ Rn una
solución particular de un sistema de ecuaciones del tipo (4.5.1) anterior y sea K ⊆ Rn el
conjunto de las solciones del sistema (4.5.2) homogéneo asociado. Entonces, el conjunto de
todas las soluciones del sistema (4.5.1) es dado por el conjunto:
x0 + K := {x0 + u : u ∈ K} ⊆ Rn .
Más aún, K es un submódulo libre de Rn de rango a lo sumo n. Una descripción completa de
las soluciones de un sistema (4.5.1) compatible vendrı́a dada por la siguiente información:
i) La solución particular x0 ∈ Rn ,
ii) Una base de K como R−módulo libre: β := {v1 , . . . , vn } ⊆ Rn .
El conjunto de todas las soluciones del sistema (4.5.1) en forma paramétrica vendrı́a dado por:
m
X
x0 + K := {x0 + ti vi : (t1 , . . . , tm ) ∈ Rm }.
i=1
Demostración. No hay mucho que demostrar en virtud de todo lo discutido en secciones

precedentes. Es obvio.
4.5.2. Matrices de operaciones elementales en GL(2, R). Comencemos recordando
cómo son las matrices de GL(n, R) (ver Corolario 2.3.22).
Corolario 4.5.2. Si A ∈ Mn (R) es una matriz tal que det(A) ∈ R× es una unidad de R,
entonces, A es una matriz inversible y, además,
A−1 = det(A)−1 Adj(A) ∈ Mn (R).
El recı́proco es obviamente cierto.
Consideraremos varios tipos de matrices regulares en GL(2, R) en Esta subsección.
4.5.2.1. Tipo 1: Intercambio de Filas o columnas. Se describen en el enunciado
siguiente:
Lema 4.5.3 (Tipo 1: Intercambiar filas o columnas). Consideremos la matriz

0 1
P := ∈ M2 (R).
1 0
i) La matriz P ∈ GL(2, R) y la inversa es ella misma.
ii) Su determinante verifica det(P ) = −1.
iii) Para cada matriz A ∈ M2×n (R), con 2 filas y n columnas, P A es la matriz obtenida
intercambiando las filas 1 y 2 de la matriz A.
iv) Para cada matriz A ∈ Mm×2 (R), con m filas y 2 columnas, la matriz AP es la matriz
obtenida intercambiando las columnas 1 y 2 de la matriz A.
4.5.2.2. Tipo 2: Multiplicar a una fila (o columna) por una unidad del anillo.
Lema 4.5.4 (Multiplicar a una fila (o columna) por una unidad del anillo). Sea u ∈ R×
una unidad en el anillo R. Consideremos la matriz

u 0
U := ∈ GL(2, R),
0 1
cuya inversa es la matriz:
u−1 0

U :=−1
∈ M2 (R),
0 1
cuyo determinante verifica det(P ) = u ∈ R∗.
Se verifican las propiedades siguientes:
i) Para cada matriz A ∈ M2×n (R), con 2 filas y n columnas, la matriz U A es la matriz
obtenida multiplicando la fila 1 de A por u.
ii) Para cada matriz A ∈ Mm×2 (R), con m filas y 2 columnas, la matriz AU es la matriz
obtenida multiplicando la columna 1 de la matriz A por u.
4.5.2.3. Tipo 3: Sumar a una fila (o columna) un múltiplio de otra fila (o

columna).
Lema 4.5.5 (Sumar a una fila o columna un múltiplo de otra fila o columna). Sea
a ∈ R un elemento cualquiera en el anillo R. Consideremos la matriz

1 0
P := ∈ GL(2, R),
a 1

1 0
P −1
:= ∈ M2 (R),
−a 1
y cuyo determinante verifica det(P ) = 1.
i) Para cada matriz A ∈ M2×n (R), con 2 filas y n columnas, la matriz P A es la matriz
obtenida sumando a la fila 2 de A su fila 1 multiplicada por a.
ii) Para cada matriz A ∈ Mm×2 (R), con m filas y 2 columnas, la matriz AP es la matriz
obtenida sumando a la columna 1 de la matriz A la columna 2 multiplicada por a.
4.5.2.4. Tipo 4: Encontrar el máximo común divisor. Consideremos la siguiente

construcción. Supongamos que R es un dominio de ideales principales. Sean a, b ∈ R dos
elementos en un dominio de ideales principales y sea h su máximo común divisor. Distinguiremos
dos casos:
• Supongamos que a | b. En estecaso h = gcd(a, b) = a. Entonces, definimos la matriz
siguiente (que pertenece al Tipo 3):

α β 1 0
P := = ,
−τ σ −q 0
donde b = qa.
• En otro caso, sean α, β ∈ R dos elementos que verifican la identidad de Bézout para
a y b. Es decir,
αa + βb = h.
Sean σ, τ ∈ R los elementos dados mediante:
a b
σ := , τ := .
h h
Definamos la matriz
α β
P := .
−τ σ
Lema 4.5.6 (Encontrar el máximo común divisor.). Con las anteriores notaciones, sea
P ∈ M2 (R) la matriz definida en cualquiera de los dos casos que denotaremos por:

α β
P := .
−τ σ
Se tiene:
i) La matriz P es una matriz inversible. En ambos casos la matriz inversa P −1 viene
dada por:

−1 σ −β
P := .
τ α
ii) En ambos casos det(P ) = 1.
iii) Supongamos dada una matriz A ∈ M2×n (A) de la forma siguiente:

a ··· c ···
A := .
b ··· d ···
Entonces, se tiene:

h ··· ∗···
PA = ,
0 ··· ∗···
Es decir, en la columna primera hemos reemplazado los elementos {a, b} por su máximo
común divisor y 0.
iv) Con las mismas notaciones, supongamos que la matriz A es dada mediante:
 
a b
 .. .. 
. .
 c d .
A :=  
 
.. ..
. .
Entonces, se tiene:
 
h 0
 .. .. 
 . .
 ∗ ∗ ,
AP =  
 
.. ..
. .
Es decir, en la fila primera hemos reemplazado los elementos {a, b} por su máximo
común divisor y 0.
Demostración. Hagamos la descripción mediante operaciones por fila. Es claro que se

tiene:

α β a ··· c ··· αa + βb ··· ∗ ···
= .
−τ σ b ··· d ··· (−τ )a + σb · · · ∗ · · ·
Es claro que h = αa + βb y que
b a
(−τ )a + σb = − a + b = 0.
h h

4.5.3. Generalizando a matrices m × n: Operaciones elementales sobre DIP’s.

Comenzamos con la descripción de la construcción de la Forma Normal de Smith de una matriz.
La siguiente es una definición de las matrices Elementales por filas sobre un dominio de ideales
principales.
Proposición 4.5.7. [Matrices Elementales sobre un dominio de integridad] Sean dados

m, n ∈ N dos enteros positivos y R un dominio de integridad. Sea P ∈ M2 (R) una matriz
inversible sobre R, dada mediante:

α β
P := ,
σ τ
con inversa

−1 τ −β
P := ε ,
−σ α
con ε = det(P )−1 ∈ R× .

Para r = m ∨ n. Para 1 ≤ i, j ≤ r, consideremos las matrices Ei,j (P ) ∈ Mr (R) siguientes:
 
1 0
 .. 

 . 

0 1 
 

 α β 

Ei,j (P ) := 
 .. .

 . 

 σ τ 


 1 0
 .. 
 . 
0 1
Estas matrices, verifican las propiedades siguientes:
i) Las matrices Ei,j (P ) matrices inversibles en Mr (R) y sus inversas son Ei,j (P −1 ), es
decir Ei,j (P )Ei,j (P −1 ) = Idr .
ii) Para cada matriz A ∈ Mm×n (R), con m filas y n columnas, de la forma:
∗ ∗
 
 .. 

 . 

∗ ∗ 
 

 a c 

A := 
 .. ,

 . 

 b d 


 ∗ ∗
 .. 
 . 
∗ ∗
donde ∗ representa elementos de R. Entonces, tomando r = m, la matriz Ei,j (P )A

es la matriz con una forma como la siguiente:
∗ ∗
 
 .. 

 . 

∗ ∗ 
 

 αa + βb αc + βd 

Ei,j (P )A := 
 .. ,

 . 

 σa + τ b σc + τ d 


 ∗ ∗
 .. 
 . 
∗ ∗
es decir,
• la fila i−ésima de Ei,j (P )A es la suma de la fila i−ésima de A multiplicada por
α más la fija j−ésima de A multiplicada por β,
• la fila j−ésima de Ei,j (P )A es la suma de la fila i−ésima de A multiplicada por
σ más la fija j−ésima de A multiplicada por τ ,
dejando sin modificar el resto de filas.
iii) Para cada matriz A ∈ Mm×n (R), con m filas y n columnas, como en el ejemplo
anterior, tomando r = n, la matriz AEi,j (P ) es la matriz de la forma:
∗ ∗
 
 .. 

 . 

∗ ∗ 
 

 αa + σc βa + τ c 

AEi,j (P ) := 
 .. ,

 . 

 αb + σd βb + τ d 


 ∗ ∗
 .. 
 . 
∗ ∗
es decir,
• la columna i−ésima de AEi,j (P ) es la suma de la columna i−ésima de A multi-
plicada por α más la columna j−ésima de A multiplicada por σ,
• la columna j−ésima de AEi,j (P )A es la suma de la columna i−ésima de A mul-
tiplicada por β más la columna j−ésima de A multiplicada por τ ,
dejando sin modificar el resto de columnas.
A las matrices Ei,j (P ) anteriores se las denomina matrices elementales sobre un dominio de
ideales principales R.
Demostración. Ejercicio de mera comprobación.
4.5.4. Matrices elementales particulares. Sea R un dominio de ideales principales.
Consideraremos las siguientes clases de matrices elementales:
Corolario 4.5.8 (Intercambiar dos filas o dos columnas). Consideremos la matriz

0 1
P := ∈ M2 (R).
1 0
Sea r = m ∨ n, entonces, las matrices
Ei,j := Ei,j (P ),
verifican las propiedades siguientes:
i) Son matrices inversibles en Mr (R) y sus inversas son ellas mismas, es decir Ei,j
2
=
Idr .
ii) Para cada matriz A ∈ Mm×n (R), con m filas y n columnas, tomando r = m, la matriz
Ei,j A es la matriz obtenida intercambiando las filas i y j de la matriz A.
iii) Para cada matriz A ∈ Mm×n (R), con m filas y n columnas, tomando r = n, la matriz
AEi,j es la matriz obtenida intercambiando las columnas i y j de la matriz A.
Demostración. Basta con aplicar la Proposición 4.5.7.
Corolario 4.5.9 (Multiplicar una fila o columna por una unidad). Sea u ∈ R× una
unidad en el anillo R. Consideremos la matriz

u 0
P := ∈ M2 (R),
0 1
u−1

0
P −1
:= ∈ M2 (R),
0 1
Ti (u) := Ei,j (P ),
i) Son matrices inversibles en Mr (R) y sus inversas son dadas por la inversa de P , es
decir Ti (u)Ti (u−1 ) = Idr .
Ti (u)A es la matriz obtenida multiplicando la fila i de A por u.
ATi (u) es la matriz obtenida multiplicando la columna i de la matriz A por u.
Demostración. De nuevo, basta con aplicar la Proposición 4.5.7.
Corolario 4.5.10 (Sumar a una fila o columna un múltiplo de otra fila o columna).
Sea a ∈ R un elemento cualquiera en el anillo R. Consideremos la matriz

1 0
P := ∈ M2 (R),
a 1

1 0
P −1
:= ∈ M2 (R),
−a 1
Si,j (a) := Ei,j (P ),

i) Son matrices inversibles en Mr (R) y sus inversas son dadas por la inversa de P , es
decir Si,j (a)Si,j (−a) = Idr .
Si,j (a)A es la matriz obtenida sumando a la fila i de A su fila j multiplicada por a.
ASi,j (a)) es la matriz obtenida sumando a la columna i de la matriz A la columna j
multiplicada por a.
Demostración. De nuevo, basta con aplicar la Proposición 4.5.7.
Corolario 4.5.11 (Reemplazar dos elementos de una columna (o fila) por su máximo
común divisor). Sean a, b ∈ R dos elementos en un dominio de ideales principales y sea h su
máximo común divisor. Distingamos dos casos:
• Si a | b, definamos:

α β 1 0
P := = ,
−τ σ −q 1
donde b = qa.
• En otro caso, sean α, β ∈ R dos elementos que verifican la identidad de Bézout para
a y b. Es decir,
αa + βb = h.
Sean σ, τ ∈ R los elementos dados mediante:
a b
σ := , τ := .
h h
Y definamos la matriz P ∈ M2 (R) mediante:

α β
P := .
−τ σ
Se tiene:
i) La matriz P es una matriz inversible, con matriz inversa:

σ −β
P −1 := .
τ α
Por tanto, la matriz Ei,j (P ) asociada a esta operación elemental (en el sentido de la
Proposición 4.5.7 anterior) es inversible.
ii) Supongamos dada una matriz A ∈ Mm×n (A) de la forma siguiente:

∗ ∗
 
 .. 

 . 

∗ ∗ 
 

 a c 

A := 
 . .. .

 

 b d 


 ∗ ∗
 .. 
 . 
∗ ∗
Entonces, se tiene:
∗ ∗
 
 .. 

 . 

∗ ∗ 
 

 h ∗ 

Ei,j (P )A = 
 .. ,

 . 

 0 ∗ 


 ∗ ∗
 .. 
 . 
∗ ∗
Es decir, en la columna i−ésima hemos reemplazado los elementos {a, b} por su
máximo común divisor (en el lugar (i, i)) y 0 (en el lugar (j, i)).
iii) Con las mismas notaciones, supongamos que la matriz A es dada mediante:
∗ ∗
 
 .. 

 . 

∗ ∗ 
 

 a b 

A := 
 . .. .

 

 c d 


 ∗ ∗
 .. 
 . 
∗ ∗
Entonces, se tiene:
∗ ∗
 
 .. 

 . 

∗ ∗ 
 

 h 0 

AEi,j (P ) = 
 .. ,

 . 

 ∗ ∗ 


 ∗ ∗
 .. 
 . 
∗ ∗
Es decir, en la fila i−ésima hemos reemplazado los elementos {a, b} por su máximo
común divisor (en el lugar (i, i)) y 0 (en el lugar (i, j)).
Demostración. Para la propiedad i) basta con observar que:
a b αa + βb
det(P ) = ασ − (−τ )β = α +β = = 1.
h h h
El resto se sigue de la Proposición 4.5.7.

4.5.5. Orlar una matriz. Sea dada una matriz A ∈ Mm×n (R), donde R es un dominio
de ideales principales.
Orlar1 la matriz A: La matriz orlada de una matriz A consiste en añadir a la matriz A las
matrices identidades correspondientes del modo siguiente:

Idm A
Orl(A) := .
0 Idn
A lo largo de proceso iremos haciendo cambios sobre Orl(A) cion las reglas siguientes: Supong-
amos que tenemos una matriz orlada de la forma:

S B
Orl := .
0 T
• Regla por filas: Cada vez que realicemos un cálculo sobre B por filas, se hará a lo
largo de toda la fila de Orl (es decir, afectará a la fila de B y a la fila correspondiente
de S).
• Regla por columnas: Cada vez que realicemos un cálculo sobre B por columnas,
se hará a lo largo de toda la columna de Orl (es decir, afectará a B y a la columna
correspondiente de T ).
Proposición 4.5.12. Supongamos Dada una matriz orlada

S A
M := ,
0 T
donde S ∈ GL(m, R) y T ∈ GL(n, R) y A ∈ Mm×n (R). Supongamos que, tras un número
finito de pasos de los anteriores sobre M (tanto por filas como por columnas) obtenemos una
nueva matriz orlada 0
S B
N := .
0 T0
Entonces, S 0 ∈ GL(m, R), T 0 ∈ GL(n, R) y se verifica:
S −1 AT −1 = (S 0 )−1 B(T 0 )−1 .
Más aún, si
Idm A
M = Orl(A) = ,
0 Idn
entonces
S 0 AT 0 = B.
Demostración. En primer lugar observamos que si S ∈ GL(m, R) y T ∈ GL(n, R), tras
relizar un número finito de operaciones por filas y columnas de las indicadas, las matrices S 0
y T 0 se optienen multiplicando cada una de ellas por un número finito de matrices del tipo
Ei,j (P ) inversibles con respecto al anillos R (a S la multilicamos por la izquierda y a T la
multiplicamos por la derecha). En otras palabras, hemos seleccionado una serie de matrices
regulares P1 , . . . , Ps ∈ GL(m, R) y Q1 , . . . , Qr ∈ GL(n, R) tales que
!  
Ys Yr
S0 = Pi S, T 0 := T  Qj  ,
i=1 j=1
mientras que, por las reglas descritas, A es afectado por ambos tipos de operacioes:
s
!  r 
Y Y
B := Pi A  Qj  .
i=1 j=1
1De acuerdo con el Diccionario de la R.A.E. orlar significa “ Adornar un vestido u otra cosa con guarniciones
al canto. Poner la orla en el escudo.” Recuérdese que “orla” significa: “ Orilla de paños, telas, vestidos u otras
cosas, con algún adorno que la distingue. Adorno que se dibuja, pinta, graba o imprime en las orillas de una
hoja de papel, vitela o pergamino, en torno de lo escrito o impreso, o rodeando un retrato, viñeta, cifra, etc.”..
Obviamente, como GL(m, R) y GL(n, R) son grupos y las matrices Pi y Qj son inversibles,
S 0 ∈ GL(m, R) y T 0 ∈ GL(n, R). Además, obviamente, se tendrá:
 !−1   s !  r   −1 
s
Y Y Y r
 Y 
(S 0 )−1 B(T 0 )−1 = S −1 Pi Pi A  Qj   Qj T −1  .
 
i=1 i=1 j=1 j=1
Lo que se traduce en cancelaciones:

(S 0 )−1 B(T 0 )−1 = S −1 AT −1 ,
como se afirma en el enunciado. Si, además, S = Idm y T = Idn , entonces, esa identidad se
convierte en
B = S 0 AT 0 .

4.5.6. “Algoritmo”: Hacer ceros por filas o columnas.

4.5.6.1. El Caso de Dominios de Ideales Principales. Supongamos dada una matriz
A ∈ Mm×n (R) donde R es un dominio de ideales principales. Supongamos que la matriz A
tiene la forma:  
a1 ∗ · · · ∗
 a2 ∗ · · · ∗
A :=  . . ,
 
 .. ..
. .. 
am ∗ ··· ∗
Proposición 4.5.13. Con las anteriores notationes, existe un número finito de operaciones
elementales por filas (i.e. multiplicar por matrices del tipo Ei,j (P )) que permiten transformar
Orl(A) en una matriz

S B
Orl := ,
0 T
tal que SAT = B, S y T son producto de matrices elementales Ei,j (P ) y B tiene la forma:
 
h ∗ ··· ∗
 0 ∗ · · · ∗
B :=  . . ,
 
 .. ..
. .. 
0 ∗ ··· ∗
donde h = gcd(a1 , . . . , am ).
Un resultado idéntico se obtiene reemplazando filas por columnas en la descripción anterior.
Demostración. Usaremos la Proposición 4.5.7 y el Corolario 4.5.11. No pondremos las
operaciones en la matriz orlada para evitar repeticiones. A partir de esa Proposición es claro
que podemos multiplicar por una matriz de tipo E1,2 (P ) para obtener una nueva matriz con la
forma siguiente:
 
h1 ∗ · · · ∗
 0 ∗ · · · ∗
 
E1,2 (P )A :=  a3 ∗ · · · ∗ ,
 
 .. . .
. . .. 
 . 
am ∗ ··· ∗
donde h1 = gcd(a1 , a2 ). Repitiendo el proceso (un humilde for i = 2 to m do) con a3 hasta
am , obtendremos el resultado apetecido.
4.5.6.2. El Caso de Dominios Euclı́deos. En el caso de dominios de ideales principales

anterior, hemos supuesto que nos “dan” a cada paso tanto el mácimo común divisor como los
ceoficientes de una identidad de Bézout. Pero eso no suele ser lo habitual, incluso podrı́a no ser
algoritmizable. Por eso nos ocupamos de un caso más cercano a la algorı́tmica: el caso euclı́deo.
Supongamos ahora (R, φ) un dominio euclı́deo y una matriz A ∈ Mm×n (R). Supongamos que
la matriz A tiene la forma:  
a1 ∗ · · · ∗
 a2 ∗ · · · ∗
A :=  . . ,
 
 .. ..
. .. 
am ∗ · · · ∗
Proposición 4.5.14. Supongamos que a1 6= 0 por simplicidad. Con las anteriores notationes,
existe un número finito de operaciones elementales por filas (i.e. multiplicar por matrices del
tipo Ei,j (P )), con los tipos 1 a 3, que permiten transformar Orl(A) en una matriz

S B
Orl := ,
0 T
tal que SAT = B, S y T son producto de matrices elementales Ei,j (P ) y B tiene la forma:
 
h ∗ ··· ∗
 0 ∗ · · · ∗
B :=  . . ,
 
 .. ..
. .. 
0 ∗ ··· ∗
donde h = gcd(a1 , . . . , am ).
Un resultado idéntico se obtiene reemplazando filas por columnas en la descripción anterior.
Demostración. Usaremos fundamentalmente el Algoritmo de Euclides para el cálculo del
máximo común divisor (cf. Teorema 3.4.5). El proceso se descompone del modo siguiente. En
primer lugar, aplicamos el siguiente algoritmo (escribimos solamente el efecto sobre la matriz
A,aunque debe entenderse que las operaciones realizadas se extienden a la matriz orlada):
Supongamos como hipótesis que
φ(a1,1 ) = min{φ(ai,1 ) : 1 ≤ i ≤ m} > φ(0).
Algoritmo 4.5.15 (Reemplazar por Restos).
Input: A ∈ Mm×n (R).

φ(a1,1 ) = min{φ(ai,1 : 1 ≤ i ≤ m}
for i = 2 to m do
* Hallar cociente qi := quo(ai,1 , a1,1 ) y resto ri := rem(ai,1 , a1,1 )

de la división Euclı́dea de ai,1 por a1,1 .
% con φ(ri ) < φ(a1,1 ), incluyendo el caso ri = 0
* Restar a la fila i la fila 1 multiplicada por qi
od
Output: La matriz orlada resultado de estas operaciones.
Es obvio que este procedimiento nos devuelve una matriz orlada

0
S B
N := ,
0 T0
donde B tiene la forma siguiente:
 
a1 ∗ ··· ∗
 r2 ∗ ··· ∗
B :=  . ..  .
 
 .. ..
. .
rm ∗ ··· ∗
Ahora se pueden dar dos situaciones:
• O bien ri = 0, i = 2, . . . , m, en cuyo caso hemos terminado.
• O bien existe ri 6= 0 con φ(ri ) < φ(a1 ).
Esto nos lleva al algoritmo siguiente (de nuevo describo el algoritmo solamente sobre la matriz
de interés, asumiendo que el lector es consciente de la presencia de las matrices de cambio de
base)):
Algoritmo 4.5.16 (Hacer Ceros en primera Columna (DE)).
Input: A ∈Mm×n (R). 

h ∗ ··· ∗
0 ∗ · · · ∗
while A 6=  . ..  , do
 
 .. ..
. .
0 ∗ ··· ∗
* Hallar j tal que
φ(aj,1 ) = min{φ(ai,1 ) : 1 ≤ i ≤ m}.
* Intercambiar fila 1 y fila j.
*Reemplazar por restos en la primera columna.
return
Output: La matriz orlada resultado de estas operaciones.
Obviamente, el procedimiento irá reemplazando el elemento que aparece en el lugar (1, 1) por un
elemento con menor valor de φ. Como en la Demostración del Algoritmo de Euclides (Teorema
3.4.5), al cabo de un número finito de pasos encontraremos una matriz de la forma deseada.
4.5.7. Hacer ceros en filas y columnas.

4.5.7.1. El caso de Dominios de Ideales Principales. Supongamos, de nuevo que R
es un dominio de ideales principales y supongamos dada una matriz A ∈ Mm×n (R) de la forma:
 
a1,1 a1,2 · · · a1,n
 a2,1 ∗ ··· ∗ 
A :=  . ..  .
 
 .. . .. . 
am,1 ∗ ··· ∗
Proposición 4.5.17. Supongamos que, con estas notaciones, realizamos de manera alternativa
las operaciones hacer ceros por columna o hacer filas en la primera fila y primera columna.
Entonces, tras una número finito de aplcaciones de matrices Ei,j (P ) (por filas y por columnas)
obtendremos una nueva matriz de la forma:
 
h1,1 0 · · · 0
 0 ∗ · · · ∗
A0 :=  . ..  .
 
. . .
 . . .
0 ∗ ··· ∗
Demostración. Usaremos el algoritmo hacer ceros por filas y hacer ceros por columnas y
la condición de Dominio de Ideales Principales y el subalgoritmo (por filas o columnas) descrito
en la Proposición 4.5.13. Tras aplicar este procedimiento, llegamos a una matriz de la forma:
 
h b1,2 ··· b1,n
0 ∗ ··· ∗ 
B :=  . ..  .
 
 .. ..
. . 
0 ∗ ··· ∗
Ahora tocarı́a hacer ceros por columnas. Pero debemos observar que aplicamos las matrices
Ei,j (P ) por la derecha, donde P es del tipo 4. Esto significa que, trabajando una sola vez con
la primera y segunda columnas, la nueva matriz tendrá la forma:
h0
 
0 c1,3 · · · c1,n
 c2,1 ∗ ∗ ··· ∗
B 0 :=  . ..  ,
 
 .. ..
. .
cm,1 ∗ ∗ ··· ∗
donde la primera columna de B 0 se obtiene como combinación de las dos primeras columnas de
B. Es decir,  0     
h h b1,2
 c2,1  0  b2,2 
 ..  = α  ..  + β  ..  ,
     
 .  .  . 
cm,1 0 bm,2
donde
h0 := gcd(h, b1,2 ), αh + βb1,2 = h0 .
En particular: ¡Hemos perdido la condición de que todas las coordenadas de la primera columna
sean nulas a partir de la segunda!.
Esto es lo que obliga a definir un algoritmo como el siguiente (de nuevo se describe usando
solamente la matriz sobre la que se trabaja prioritariamente, dejando las matrices de la orla a
la discrecionalidad del lector):
Algoritmo 4.5.18 (Hacer Ceros en primera fila y primera columna).
Input: A ∈Mm×n (R). 

h 0 ··· 0
0 ∗ · · · ∗
while A 6=  . ..  , do
 
 .. ..
. .
0 ∗ ··· ∗
* Hacer ceros en fila 1 de A. Guardar en A el resultado.
* Hacer ceros en columna 1 de A. Guardar en A el resultado.
return
Output: La matriz orlada conteniendo estas operaciones.
Llamemos hi al resultado escrito en el lugar (1, 1) de la matriz obtenida tras i pasos por el ciclo
while. Observamos que, en cada caso, hi | hi−1 puesto que hi el máximo común divisor de
hi−1 con elementos de la primera fila o la primera columna. Por tanto, tenemos una cadena de
ideales en R. Definamos ai = (hi ) ⊆ R el ideal generado por hi . Entonces, tenemos una cadena
ascendente de ideales de R:
a0 ⊆ a1 ⊆ · · · ⊆ an ⊆ · · · ⊆ R,
donde h0 = a1,1 . Ahora interviene la condición noetheriana de los dominios de ideales princi-
pales (cf. Teorema 3.3.2). Es decir, existe r ∈ N tal que at = ar , ∀t ≥ r. Es decir, la cadena se
estabiliza a partir del lugar r.
Supongamos, sin pérdida de la generalidad, que hr se obtuvo dentro del ciclo while después de
hacer ceros en la primera columna y tenemos una matriz de la forma:
 
hr k1,2 · · · k1,n
0 ∗ ··· ∗ 
Ar :=  . ..  .
 
. . .
. . . 
0 ∗ ··· ∗
La siguiente operación serı́a hacer ceros en la primera fila y poner, en lugar de hr a hr+1 que es
hr+1 = gcd(hr , k1,2 , . . . , k1,n ).
Pero, como ar = ar+1 , hr y hr+1 son elementos asociados de R, luego también podemos escribir
hr = gcd(hr , k1,2 , . . . , k1,n ).
Esto quiere decir que hr | k1,i para todo i, 2 ≤ i ≤ n. Por tanto, al realizar el proceso de hacer
ceros en la primera fila de la nueva matriz podemos, simplemente, restar a cada columna, la
k
primera columna multiplicada por h1,i r
∈ R y obtendremos una matriz de la forma deseada.
4.5.7.2. El caso de dominios euclı́deos. El procedimiento es exactamente el mismo y

la misma dificultad descrita en la Demostración del caso de Dominios de Ideales Principales
aparece en el caso euclı́deo. Por tanto, las mismas razones de establidad de la condición noethe-
riana nos garantizan que el proceso se establiza.
4.5.8. Diagonalización de una matriz sobre un DIP: “algoritmo” primario. Usa-

remos los subalgoritmos descrito en Subsecciones precedentes.
Algoritmo 4.5.19 (Diagonalización simple de una matriz en Mn (R)).
Input: Una matriz A ∈ Mm×n (R), con m ≥ n de la forma:

 
a1,1 a1,2 ··· a1,n
 a2,1 a2,2 ··· a2,n 
A :=  . ..  .
 
 .. ..
. . 
am,1 am,2 ··· am,n
Inicializar:
P := Idm , Q := Idn , B := A.
k := 1
P B
C := .
0 Q
bi,j := el elemento de R que ocupa el lugar (i, j) de la submatriz B de C.
Hacer ceros en la fila y columna k−ésimas. La matriz resultante se “guarda” en la
matriz C, eliminando la matriz precedente.
while k < min{m, n} do
while ∃i, j, k < i ∨ k < j, bi,j 6= 0 do
* Intercambiar filas y columnas hasta tener en el lugar k+1, k+1
un elemento no nulo.
* Hacer ceros en la fila y columna k + 1.
* Guardar en la matriz C los resultados de la acción precedente:

P B
C :=
0 Q
od
k := k + 1
od
Ouput: La matriz C que contiene como submatrices a las matrices P ∈ GL(m, R), Q ∈
GL(n, R) y B tales que P AQ = B y, además, B es diagonal y tiene la forma:
 
a1 0 ··· 0
 0 a2 ··· 0 
.. .. 0 
 
B := 
 ..  ∈ Mm×n (R),
 . . . 
 0 0 ··· ar 
0 0
Proposición 4.5.20. En anterior procedimiento, permite transformar cualquier matriz A con

coordenaas en un dominio de ideales principales en una matriz diagonal B y permite hallar las
matrices regulares P y Q (como producto finito de las operaciones elementales realizadas) tales
que
 
a1 0 · · · 0
 0 a2 · · · 0 
0 
P AQ = B =  ... ..
 
 ..  ∈ Mm×n (R).
 . . 
 0 0 ··· ar 
0 0
Demostración. En realidad, todo es consecuencia del hecho de poder llegar a una matriz
de la forma:  
h 0 ··· 0
 0 ∗ · · · ∗
B :=  . ..  .
 
 .. .
0 ∗ ··· ∗
Esto se obtiene por el procedimiento de hacer ceros en primera fila y primera columna descrito
en la Proposición 4.5.17 que, a su vez se sigue de la condición notheriana. Seguidamente se
trata de hacer ceros en la primera fila y columna de la submatriz
 
∗ ··· ∗
B 0 :=  ... ..  .

.
∗ ··· ∗

4.5.9. Resolución de ecuaciones lineales diofánticas. Se denominan ecuaciones diofánticas

lineales a ecuaciones lineales del tipo siguiente:
(4.5.3) AX = B,
donde
i) A ∈ Mm×n (Z) es una matriz con m filas y n columnas con coordenadas en Z. Podemos
suponer:
 
a1,1 · · · a1,n
A :=  ... .. ..  .

. . 
am,1 ··· am,n
ii) X es un vector columna de variables:
 
X1
X :=  ... 
 
Xn
iii) B es un vector columna con coordenadas en Z:
 
b1
B :=  ...  ∈ Zm .
 
bm
El objetivo del estudio de las ecuaciones lineales diofánticas es estudiar la existencia de solu-
ciones en Zn de ecuaciones del tipo descrito en la identidad (4.5.3) anterior. Es decir, estudiar:
      
x1 a1,1 · · · a1,n x1 b1
 ..  n  .. . . .
.   ..   .. 
∃ .  ∈ Z ,  . . .  .  =  . .
xn am,1 ··· am,n xn bm
El siguiente resultado no sólo caracteriza la existencia, sino que también caracteriza las solu-
ciones en caso de que existan.
Corolario 4.5.21. Sea dada una ecuación diofántica lineal

AX = B,
con A ∈ Mm×n (Z), B ∈ Z columna y X una columna de variables, como en las notaciones
m
anteriores. Sean P ∈ GL(m, Z) y Q ∈ GL(n, Z) dos matrices inversibles sobre Z y sea D ∈

Mm×n (Z) la matriz diagonal obtenida tras aplicar el algoritmo precedente, es decir,
 
d1 0 · · · 0
 0 d2 · · · 0 
 .. .. 0
 
D :=  . ..  ∈ Mm×n (Z),

 . . 
 0 0 · · · dr 
0 0
de tal modo que
P AQ = D.
Sea
b01
 
B 0 := P B =  ...  ∈ Zm .
 
b0m
Entonces,
i) El sistema de ecuaciones es compatible sobre Zn (es decir posee soluciones en Zn ) si
y solamente si se verifican las siguientes propiedades:
(a) b0i = 0, para todo i, con r + 1 ≤ i ≤ m.
(b) dj | b0j , para todo j, con 1 ≤ j ≤ r.
ii) Si el sistema es compatible sobre Zn , entonces, una solución del sistema viene dada
por la siguiente identidad:
 b0 
1
 d.1 
.
.
 
x1  b0r 
 .. 
X0 :=  .  = Q  dr  ∈ Zn ,
 
0
xn  
.
 .. 
0
n
iii) Si el sistema es compatible sobre Z , el conjunto de todas las soluciones del sistema
AX = B viene dado por el conjunto siguiente:
X0 + N := {X0 + z : z ∈ N },
donde N es el submódulo libre de Zn generado por las n − r últimas columnas de Q.
Demostración. Nótese que Q : Zn −→ Zn define un isomorfismo dado que Q es una
matriz inversible sobre Z. Esto significa que podemos considerar un “cambio de variables” del
modo siguiente:    
Y1 X1
Y =  ...  = Q−1 X = Q−1 X :=  ... 
   
Yn Xn
Y podemos considerar un nuevo sistema de ecuaciones lineales diofánticas lineales dado medi-
ante:
(AQ)Y = B.
Nótese que se tiene la obvia propiedad siguiente:
     
y1 x1 y1
 ..  n  ..   ..  n
 .  ∈ Z satisface (AQ)Y = B ⇔  .  = Q  .  ∈ Z satisface AX = B.
yn xn yn
Las condiciones de compatibilidad y los tipos de soluciones se preservan con la identificación
propuesta.
Ahora consideremos la ecuación (AQ)Y = B y recordemos que P ∈ GL(m, Z) es una matriz

inversible. Por tanto, podemos considerar una nueva ecuación lineal diofántica:
(P AQ)Y = B 0 ,
donde B 0 := P B es la matriz columna descrita en el enunciado. Es obvio que se tiene la

equivalenecia:
   
y1 y1
 ..  n  ..  n
 .  ∈ Z satisface (AQ)Y = B ⇔  .  ∈ Z satisface (P AQ)Y = B 0 .
yn yn
Ahora, como P AQ = D es una matriz diagonal, observamos que la ecuación (P AQ)Y = B 0

tiene la forma siguiente:
b01

 d1 Y1 =
b02



 d2 Y2 =
..



.



dr Yr = b0r
0
 0 = br+1




 ..
.




0 = b0m

Ahora es evidente que este sistema de ecuaciones posee soluciones en Zn si y solamente si se

satisface: dj | b0j , 1 ≤ j ≤ r y b0i = 0, r + 1 ≤ i ≤ m, con lo que tenemos la primera de las
propiedades indicadas.
De otro lado, una “solución particular” a esta última ecuación serı́a la dada mediante
 b0 
1
 d.1 
.
.
 b0r 
 dr  ∈ Zn .
 
0
 
.
 .. 
0
Pero como sabemos que las soluciones de esta ecuación están relacionadas con las soluciones de
la ecuación AX = B a través de Q tendremos que una solución particular del sistema AX = B
es la dada mediante:
 b0 
1
 d.1 
.
.
 
x1  b0r 
 ..  n
 .  = Q  dr  ∈ Z ,
 
0
xn  
.
 .. 
0
y tenemos probada la afirmación ii) del enunciado. Para estudiar el conjunto de todas las
soluciones, baste con observar que se tiene la siguiente propiedad:
Dados x, z ∈ Zn soluciones del sistema AX = B, entonces x − z ∈ Zn es solución del sistema
AX = 0, donde 0 es el vector columna en Zm con coordenadas todas nulas. Por tanto, se
trata de estudiar cómo son todas las soluciones del sistema “homogéneo” AX = 0. De nuevos,
usando Q y P podemos observar que las soluciones de AX = 0 son dadas mediante QN , donde
N ⊆ Zn es el conjunto de las las soluciones del sistema homogéneo (AQ)Y = 0. Por ser P
inversible las soluciones de (AQ)Y = 0 con las solciones de (P AQ)Y = 0 y, de nuevo, son las
soluciones del sistema DY = 0 dado mediante:



 d1 Y1 = 0


 d 2 Y2 = 0
..



.



dr Yr = 0
0 = 0





 ..
.




0 = 0

O, equivalentemente, 

 d1 Y1 = 0
 d2 Y2

= 0
..


 .
dr Yr = 0

Luego las soluciones del sistema (P AQ)Y = 0 son los elementos de N := {0}r × Zn−r ⊆ Zn .
Concluiremos ası́ que las soluciones del sistema “homogéneo” original son los elementos del
siguiente conjunto:
Q {0}r × Zn−r .

Pero este submódulo es un submódulo libre de Zn y es, simplemente, el submódulo generado

por las imágenes a través de Q de los generadores de ({0}r × Zn−r ) que era un submóudlo
libre. Es decir, si ei Zn es el elemento de Zn (dado en columna) cuyas coordenadas son nulas
exceptuando la coordenada i−ésima que es 1 (i.e. la base “canónica” de Zn ). Entonces, un
sistema generador (y base como Z−módulo libre) de Q ({0}r × Zn−r ) es dada por:
Qer+1 , . . . , Qen .
Es obvio que estos n−r elementos son, precisamente, las n−r últimas columnas de Q y tenemos
probada la afirmación iii).
4.6. Forma Normal de Smith

Ahora se trata de explorar una cierta unicidad en la forma final de la matriz diagonal. Es decir,
tratamos de determinar unicidad sobre los elementos que aparecen en la diagonal principal. En
este caso, las aplicaciones serán fundamentalmente las que corresponden a la clasificación de
grupos abelianos finitamente generados y de torsión y a la Teorı́a del Endomorfismo.
Usaremos los subalgoritmos descrito en Subsecciones precedentes.
Algoritmo 4.6.1 (Cálculo de la Forma Normal de Smith de una matriz en Mm×n (R)).
Input: Una matriz A ∈ Mm×n (R), con m ≥ n de la forma:

 
a1,1 a1,2 ··· a1,n
 a2,1 a2,2 ··· a2,n 
A :=  . ..  .
 
 .. ..
. . 
am,1 am,2 ··· am,n
Inicializar
P := Idm , Q := Idn , B := A.
k := 1
P B
C := .
0 Q
bi,j := el elemento de R que ocupa el lugar (i, j) de la submatriz B de C.
Aplicar el Algoritmo de Diagonalización simple anterior para obtener:

P D
C := ,
0 Q
4.6. FORMA NORMAL DE SMITH 235
donde D es una matriz diagonal:

 
a1 0 ··· 0
 0 a2 ··· 0 
.. .. 0 
 
D := 
 ..  ∈ Mm×n (R).
 . . . 
 0 0 ··· ar 
0 0
Sumar a la primera fila las demás filas para obtener:

P B
C := ,
0 Q
donde B es una matriz de la forma:
 
a1 a2 ··· ar
 0 a2 ··· 0 
0 
B :=  ... ..
 
 ..  ∈ Mm×n (R).
 . . 
 0 0 ··· ar 
0 0
Hacer ceros en la primera fila hasta obtener:

P B
C := ,
0 Q
 
b1,1 0 ··· 0
 b2,1 b2,2 ··· b2,r 
0 
B :=  ... ..
 
 ..  ∈ Mm×n (R),
 . . 
 br,1 br,2 ··· br,r 
0 0
donde b1,1 = gcd(a1 , . . . , ar ). % Obsérvese que b1,1 | bi,j para todo i, j
Hacer ceros en la primera columna hasta obtener:

P B
C := ,
0 Q
donde B es una matriz diagonal:
 
d1 0 ··· 0
 0 b2,2 ··· b2,r 
0 
B :=  ... ..
 
 ..  ∈ Mm×n (R),
 . . 
 0 br,2 ··· br,r 
0 0
donde d1 := b1,1
% Obsérvese que b1,1 sigue siendo un divisor de todos los términos de la submatriz
B 0 := (bi,j )2≤i,j≤r .
Proceder igualmente con la submatriz B 0 dada mediante:
 
b2,2 ··· b2,r
 .. .. .. 0 

B 0 :=  .
 . .  ∈ Mm×n (R).
 br,2 ··· br,r 
0 0
Ouput: La matriz C que contiene como submatrices a las matrices P ∈ GL(m, R), Q ∈
GL(n, R) y B tales que P AQ = B y, además, B es diagonal y tiene la forma:
 
d1 0 ··· 0
 0 d2 ··· 0 
.. .. 0 
 
B := 
 ..  ∈ Mm×n (R),
 . . . 
 0 0 ··· dr 
0 0
de tal modo que di | di+1 , 1 ≤ i ≤ r − 1.
Teorema 4.6.2 (Forma Normal de Smith). El anterior procedimiento es, de hecho, un

rocedimiento que termina en la forma indicada en un número finito de pasos para cualquier
matriz A cuyas coordenadas están en un dominio de ideales principales. La matriz diagonal
resultante se llama la Forma Normal de Smith de A y es única salvo unidades en el anillo R.
Más aún, los elementos d1 , . . . , dr de la diagonal se llaman los factores invariantes de A. Se
verifica, además, que di es dado por la regla siguiente:
Sea gi (A) el máximo común divisor de los menores i×i de la matriz A. Supongamos g0 (A) = 1.
Entonces,
gi (A)
di = ,
gi−1 (A)
gi−1 (A)di = gi (A).
Demostración. Lo primero que hay que probar es que el proceso anterior alcanza el
objetivo indicado en un número finito de pasos. Para ello comenzamos con la diagonalización
simple de la Subsección precedente. Haciendo las operaciones indicadas llegamos a una matriz
de la forma:
P B
C := ,
0 Q
 
a1 a2 · · · ar
 0 a2 · · · 0 
 .. . 0 
 
(4.6.1) B :=  . . . . ..  ∈ Mm×n (R).
 
 0 0 · · · ar 
0 0
Ahora, hacemos ceros en la primera file. Pero, como se indicó en su momento (Proposición
4.5.13 anterior), se obtendrá una matriz de la forma:
0
P B0

C := ,
0 Q0
 0
···

b1,1 0 0
 b02,1 b02,2 · · · b02,r 
0 
 
 .. . .
0
B :=  . .. ..  ∈ Mm×n (R),
 
0 0
 br,1 br,2 · · · br,r0 
0 0
donde b01,1 = gcd(a1 , . . . , ar ). Obsérvese, además, que todas las operaciones por filas o columnas
(Tipos 1 a 4) suponen hacer combinaciones lineales (con coeficientes en R) de las coordenadas
de la matriz original. Si nos fijamos en la matriz B de la Identidad (4.6.1) anterior, todas las
coordenadas de la matriz B 0 son combinaciones lineales (con coeficientes en R) de elementos en
el conjunto {a1 , . . . , ar }. Luego
b0i,j ∈ a,
donde a es el ideal generado por {a1 , . . . , ar }. En suma, como b01,1 = gcd(a1 , . . . , ar ), se tiene
que a = (b01,1 ) = b01,1 R y, por tanto, b01,1 | b0i,j para cualesquiera i, j.
Repitiendo el mismo procedimiento con la submatriz indicada, se obtiene el resultado apetecido.
En cuanto a la condición de los factores invariantes en términos de los máximos comunes
divisores de los menores de la matriz inicial, basta también con aplicar inducción. El caso k = 1
es claro. El paso inductivo se basa en que las matrices P y Q usadas para las transformaciones
son producto de matrices elementales de las descritas anteriormente y no modifican el máximo
común divisor de los menores. Omitimos el detalle.
4.6.1. Estructura de grupos abelianos finitamente generados.

Teorema 4.6.3 (Estructura de Grupos Abelianos Finitamente Generados). Sea (G, +)
un grupo abeliano finitamente generado. Entonces, G es isomorofo como grupo a una descom-
posición:
G∼= Zm ⊕ T orZ (G),
donde T orZ (G) son los elementos de torsión de G. Además, existen d1 , . . . , dr ∈ N, di ≥ 1,
verificando di | di+1 y se tiene:
r
Y
T orZ (G) := (Z/di Z) .
i=1
Además, los elementos d1 , . . . , dr son únicos y se denominan factores invariantes del grupo G.
Demostración. Comencemos recordando que todo grupo abeliano finitamente generado
es el co-núcleo de un morfismo entre Z−módulos libres finitamente generados, es decir, existe
una matriz A ∈ Mm×n (Z) que define un morfismo de Z−módulos A : Zn −→ Zm , de tal modo
que G es isomorfo al cociente:
Zm / Im(A) ∼
= G.
Más correctamente, tenemos una sucesión exacta
Zn −→ Zm −→ G −→ 0.
Ahora bien, usando la forma normal de Smith de A podemos disponer de isomorfismos de los
Z−módulos (dados por las matrices P y Q que nos conducen a un diagrama conmutativo de
Z−módulos que tiene la forma siguiente:
A
Zn −→ Zm −→ G −→ 0
Q ↓ ↓ P ↓
Zn −→ Zm −→ G −→ 0
D
donde D es una matriz diagonal, que puedo suponer de la forma:
 
d1 0 · · · 0
 0 d2 · · · 0 
 .. .. 0
 
D :=  . ..  ∈ Mm×n (Z).

 . . 
 0 0 · · · dr 
0 0
La conclusión obvia es que G es también isomorfo al cociente siguiente como Z−módulo:
Zm / Im(D) ∼
= G.
Ahora bien, por ser D diagonal es obvio que el cociente tiene la forma:
r
!
∼ Z / Im(D) = ∼
Y
m
G= (Z/di Z) ⊕ Zn−r .
i=1
Este isomorfismo indica obviamente que

r
!
T orZ (G) ∼
Y
= (Z/di Z) ,
i=1
y se sigue la existencia en el Teorema de Estructura. La unicidad se puede probar de varias

maneras, una de las más elegantes es la de [Gen, 1976] que no tiene en cuenta la existencia
de factorización única en Z. Comencemos con la siguiente Afirmación:
Afirmación. Sea M un grupo abeliano finito y supongamos que M admite dos descomposi-
ciones: ! !
r s
M∼ (Z/di Z) ∼
Y Y
= = (Z/gi Z) ,
i=1 i=1
de tal modo que ninguno de los di ’s ni ninguno de los gj ’s es unidad en Z y se satisface di | di+1
y gi | gi+1 . Entonces,
r = s.
Demostración de la Afirmación. Para empezar tenemos que el orden del grupo M satisface:
r
Y s
Y
] (M ) = di = gj .
i=1 j=1
Por tanto, dado que ninguno

Qrde estos dos productos es una unidad, los elementos de MaxSpec(Z)
Qs
que contienen al producto i=1 di son los mismos maximales que contienen al producto j=1 gj .
De otro lado, la condición sobre divisibilidad nos dice que los maximales que contienen a
cualquiera de esos productos son exactamente los maximales de Z que contienen a d1 y/o
a g1 . Elijamos m ∈ MaxSpec(Z) un ideal maximal tal que
r
Y s
Y
di = gj ∈ m.
i=1 j=1
Ahora consideremos el Z−módulo mM . Es sencillo observar que:

r s
(m/di Z) ∼
Y Y
mM = = (m/gj Z) .
i=1 j=1
Seguidamente, tenemos el Z/m−espacio vectorial M/mM que admite las siguientes dos repre-
sentaciones:
r r
M/mM ∼ ((Z/di Z) / (m/di Z)) ∼
Y Y
= = (Z/m) ,
i=1 i=1
y
s s
M/mM ∼ ((Z/gj Z) / (m/gj Z)) ∼
Y Y
= = (Z/m) ,
j=1 j=1
donde hemos usado el Segundo Teorema de Isomorfı́a. Pero, entonces, tenemos la siguiente
igualdad de dimensiones entre espacios vectoriales sobre Z/m:
dimZ/m (M/mM ) = r = s.
Con lo que hemos concluido que r = s.
Tenemos ası́ dos descomposiciones de la forma siguiente:
r
!  r 
∼ ∼
Y Y
(4.6.2) M = T orZ (G) = (Z/di Z) = (Z/gi Z) ,
i=1 j=1
De tal modo que ninguno de los di ’s ni ninguno de los gj ’s es unidad en Z y se satisface di | di+1
y gi | gi+1 .
Consideremos x ∈ Z y la siguiente homotecia
ηx : M −→ M
m 7−→ xm.
Es un morfismo de grupos abelianos que, obviamente, se interpreta sobre las dos descomposi-
ciones del modo obvio:
Qr Qr
ηx : ( i=1 (Z/di Z)) −→ ( i=1 (Z/di Z))
(h1 + (d1 ), . . . , hr + (dr )) 7−→ (xh1 + (d1 ), . . . , xhr + (dr )).
Q Q
r r
ηx : j=1 (Z/gi Z) −→ j=1 (Z/gi Z)
(h1 + (g1 ), . . . , hr + (gr )) 7−→ (xh1 + (g1 ), . . . , xhr + (gr )).
Dado que todos son enteros positivos, podemos suponer que existe t ≤ r tal que 1 ≤ t y di = d1 ,
para 1 ≤ i ≤ t y dj > d1 para t + 1 ≤ j ≤ r. Supongamos x = d1 y consideremos la homotecia
ηd1 precedente. Tenemos que, dado que d1 | di , por la primera forma se tiene:
r
Y
Im(ηd1 ) = (d1 Z/di Z) ,
i=1
por lo que el co-núcleo toma la forma:

r r
Coker(ηd1 ) ∼ ((Z/di Z) / (d1 Z/di Z)) ∼
Y Y r
= = (Z/d1 Z) = (Z/d1 Z) .
i=1 i=1
De otro lado, observamos que

r r
((d1 Z + gi Z) /gi Z) ∼
Y Y
Im(ηd1 ) = = (qi Z/gi Z) ,
i=1 i=1
donde qi := gcd(d1 , gi ). Por tanto, el conúcleo tomará la forma:

r
Coker(ηd1 ) ∼
Y
= (Z/qi Z) .
i=1
Dado que el co-núcleo no depende de la representación, obtendremos que:

r
Y
dr1 = gcd(gi , d1 ).
i=1
Qr supongamos que d1 ≥ g1 en la descomposición de la igualdad

Usando esta descomposición,
(4.6.2). Entonces, si dr1 = i=1 gcd(gi , d1 ), como d1 ≥ gcd(gi , d1 ), para que se de esta igualdad
es necesario que d1 = gcd(gi , d1 ) para cada i y, por tanto, tendrı́amos que d1 ≤ g1 , con lo cual
d1 = g1 . Del mismo modo se harı́a en el otro caso, intercambiando los roles de d1 y g1 .
Podemos ası́ suponer que existe k ≤ r tal que di = gi para cada 1 ≤ i ≤ k. Veamos qué sucede
para el caso k + 1. Suponemos que dk+1 ≥ gk+1 y usamos la homotecia de razón x = dk+1 .
Obsérvese que, como di | di+1 se tendrá:
r r
Im(ηdk+1 ) ∼
Y Y
= (dk+1 Z/di Z) = (dk+1 Z/di Z) ,
i=1 i=k+1
porque dk+1 Z/di Z = 0 para 1 ≤ i ≤ k (porque di | dk+1 en esos casos). De otro lado, como
gi = di para 1 ≤ i ≤ k, la imagen tendrá también la forma siguiente:
r r
Im(ηdk+1 ) ∼
Y Y
= ((dk+1 Z + gj Z) /gj Z) = (pj Z/gj Z) ,
j=k+1 j=k+1
donde pj := gcd(dk+1 , gj ). Tomando los conúcleos de nuevo, tendremos:

k
!  r 
k
!  r 
Coker(ηdk+1 ) ∼ Z/dk+1 Z ∼
Y Y Y Y
= Z/di Z ×  = Z/gi Z ×  Z/pj Z .
i=1 j=k+1 i=1 j=k+1
Como di = gi , 1 ≤ i ≤ k y estamos ante un grupo finito, tendremos:

 
Yk k
Y r−k
Y
di dr−k

k+1 = gi  pj  ,
i=1 i=1 j=1
lo que implica
r
Y
dr−k
k+1 = gcd(dk+1 , gj ).
j=k+1
Usando el mismo argumento que en el caso d1 , concluiremos que dk+1 ≤ gk+1 y, en particular,
dk+1 = gk+1 .
Por tanto, di = gi para cada i, 1 ≤ i ≤ r y tenemos la unicidad buscada.
Corolario 4.6.4. Sea (G, +) y (G0 , +) dos grupos abelianos libres. Supongamos que G es sub-
grupo de G0 y que ambos tienen el mismo rango como Z−módulos: rankZ (G) = rankZ (G0 ) = n.
Sea B 0 := {u1 , . . . , un } una base cualquiera de G0 y sea B := {v1 , . . . , vn } una base cualquiera
de G. Sea A ∈ Mn (Z) la matriz cuyas columnas son las coordenadas de los vectores de la base
B de G en la base B 0 de G0 . Supongamos que det(A) 6= 0. Entonces, el grupo cociente G0 /G
es un grupo abeliano finito y su orden satisface:
] (G0 /G) = | det(A)|.
Demostración. Consideremos la Forma Normal de Smith de A y las matrices de la trans-
formación P, Q ∈ GL(n, Z) de tal modo que
 
f1 0 · · · 0
 0 f2 · · · 0 
(4.6.3) P AQ = N :=  . ..  ,
 
 .. ..
. .
0 0 · · · fn
donde f1 , . . . , fn son los factores invariantes. Nótese que son todos no nulos porque det(A) 6= 0.
De hecho, tenemos que la matriz A es la matriz del morfismo de Z−módulos que, en términos
de coordenadas, viene dado del modo siguiente:
0
A: G 7−→ G 
x1
 .. .
(x1 , . . . , xn ) 7−→ A . 
xn
0
Obsérvese que se trata de la inclusión de G en G escrita en las coordenadas de las distintas
bases. Entonces, la Igualdad (4.6.3) se transforma en el siguiente diagrama conmutativo de
Z−módulos:
A
G G0
Q N
G G0
P
A partir de este diagrama, concluimos que los siguientes grupos abelianos son isomorfos:
G0 /G ∼
= G0 / Im(A) ∼
= G0 / Im(N ).
Ahora bien, como N es una matriz diagonal, es obvio que
n
G0 / Im(N ) ∼
Y
= Z/fi Z.
i=1
En particular, el grupo cociente G0 /G es un grupo finito y su orden satisface las siguientes

igualdades.
n
Y
0
] (G / Im(N )) = |fi | = | det(N )|.
i=1
Por la Igualdad (4.6.3) y dado que | det(P )| = | det(Q)| = 1 por ser matrices regulares sobre Z,
concluimos:
] (G0 /G) = ](G0 / Im(N )) = | det(N )| = | det(P ) det(A) det(Q)| = | det(A)|,
lo que demuestra el enunciado.
Argumentos similares a los del Teorema 4.6.3 se aplican a cualquier dominio de ideales prin-
cipales, dando lugar al Teorema General de Estuctura de R−módulos finitamente generados
sobre un DIP:
4.7. FORMA DE FROBENIUS Y FACTORES INVARIANTES 241
Teorema 4.6.5 (Estructura de Módulos Finitamente Generados sobre DIP). Sea R

un dominio de ideales principales y M un R−módulo finitamente generado. Entonces, M es
isomorofo como R−módulo a una descomposición:
M∼
= Rm ⊕ T orR (M ),
donde T orR (M ) son los elementos de torsión de G, i.e.
T orR (M ) := {m ∈ M : AnnR (m) 6= (0)}.
Además, existen d1 , . . . , dr ∈ R verificando di | di+1 y se tiene:
r
Y
T orR (M ) := (R/di R) .
i=1
Además, los elementos d1 , . . . , dr son únicos (salvo unidades en R) y se denominan factores

invariantes del módulo M .
Demostración. Misma prueba que el caso de Z.
4.7. Forma de Frobenius y Factores Invariantes de un endomorfismo sobre un

espacio vectorial de dimensión finita.
4.7.1. Factores invariantes de un endomorfismo.
Teorema 4.7.1 (Factores Invariantes de un Endomorfismo). Sea K, sea V un K−espacio
vectorial de dimensión finita sobre K y sea ϕ : V −→ V un endomorfismo de V . Sea M la
matriz de ϕ en cualquier base de V y consideremos la matriz:
XIdn − M ∈ Mn (K[X]),
donde n = dimK (V ). Entonces, existen:
• Matrices P, Q ∈ GL(n, K[X]) (o, equivalentemente, det(P ) ∈ K \ {0}, det(Q) ∈
K \ {0})
• Un entero positivo r ∈ N, r ≥ 1, y polinomios mónicos f1 , . . . , fr ∈ K[X] tales que
fi | fi+1 , para 1 ≤ i ≤ r − 1.
Tales que
 
Idn−r 0

 f1 0 · · · 0  
P · (XIdn − M ) · Q = 
 0 f2 · · · 0 
0

.. .. . 
. .. 

 .
0 0 ··· fr
Tanto el entero positivo r ∈ N como los polinomios mónicos f1 , . . . , fr son únicos satisfaciendo
estas propiedades. Además, satisfacen
r
Y
(4.7.1) χM (X) = fi (X).
i=1
A los polinomios mónicos f1 , . . . , fr ∈ K[X] se les denomina factores invariantes del endomor-
fismo ϕ (o de la matriz M ).
Demostración. Como K[X] es un dominio de ideales principales, lo único que manifiesta
este enunciado es la existencia de factores invariantes de la matriz XIdn − M ∈ Mn (K[X]).
Lo único a observar, para tener la Igualdad (4.7.1), es que las unidades del anillo K[X] vienen
dadas por K[X]× = K \ {0}. Por la propiedad del producto de los determinantes, se ha de
tener:
Y r
det(P ) det (XIdn − M ) det(Q) = fi ,
i=1
Como el polinomio caracterı́stico es mónico y los polinomios fi ’s elegidos son también mónicos,
entonces det(P ) det(Q) = 1 y se tiene la igualdad buscada.
4.7.2. Forma de Frobenius de un endomorfismo: factores invariantes en K[X].

En la subsección precedente hemos introducido los factores invariantes de un endomorfismo
dado por una matriz M ∈ Mn (K) a partir de la matriz XIdn − M ∈ Mn (K[X]). Sin embargo,
no parece inmediato que estos objetos tengan algo que ver con la naturaleza intrı́nseca del
endomorfismo en cuestión. En esta subsección mostraremos que esos factores inavariantes que
surgen de la forma normal de Smith de la matriz XIdn − M tienen ua interpretación natural
en la forma de Frobenius de un endomorfismo que ya vimos en la Subsección 4.7.2 y, muy
particularmente, en el Problema 173 precedente.
Comencemos recordando lo descrito sobre la matriz compañera de un polinomio mónico en el
Problema 168
4.7.3. El álgebra R[X]/(f ), con f ∈ R[X]mon . Sea R un anillo y supongamos f :=
X n + an−1 X n−1 + · · · + a1 X + a0 ∈ R[X]mon , un polinomio univariado mónico Consideremos
el anillo cociente A := R[X]/(f ). Siguiendo las ideas del Problema 168 tenemos el siguiente
enunciado:
Proposición 4.7.2. Con las anteriores notaciones, se tiene:
i) El anillo cociente A = R[X]/(f ) es un R−módulo libre de rango finito una de cuyas
bases es la siguiente:
B0 := {1 + (f ), X + (f ), . . . , X n−1 + (f )}.
En paricular, el rango de A como R−módulo libre satisface:
rankR (A) := deg(f ) = n.
ii) Dado X ∈ R[X], podemos definir la aplicación:
ηX : R[X]/(f ) −→ R[X]/(f )
h + (f ) 7−→ Xh + (f ),
es un endomorfismo de R[X]/(f ) como R−módulo. Más aún, la matriz MX ∈
Mn (R), de ηX en la base B0 anterior, es, justamente, la matriz compañera de f ,
esto es,  
0 0 0 ··· −a0
1 0 0 · · · −a1 
 
0 1 0 · · · −a2 
MX := C(f ) = 0 0 1 · · · .
 
 −a3 

 .. .. . . .. .. 
. . . . . 
0 0 0 · · · −an−1
La matriz MX se denomina también el tensor de multiplicación de la R−álgebra
R[X]/(f ).
iii) Dado g ∈ R[X], podemos definir la aplicación:
ηg : R[X]/(f ) −→ R[X]/(f )
h + (f ) 7−→ gh + (f ).
De nuevo, ηg es un endomorfismo de R−módulos. Además, dados g1 , g2 ∈ R[X] y
λ ∈ R se tiene:
ηg1 +g2 = ηg1 + ηg2 , ηg1 ·g2 = ηg1 ◦ ηg2 , ηλg1 = ληg1 .
A los endomorfismos ηg se les denomina homotecias de razón g sobre R[X]/(f ).
iv) En particular, la matriz Mg ∈ Mn (R), de ηg en la base B0 anterior, es, justamente,
Mg := g(MX ) = g(C(f )).
v) Denotemos por g := g + (f ) ∈ R[X]/(f ) la clase residual de g módulo el ideal (f ).
Se tiene que la homotecia ηg sólo depende de la clase residual g. Y definamos los
siguientes dos subconjuntos de R[X]:
AnnR[X] (Mg ) := {m(X) ∈ R[X] : m(Mg ) = 0 ∈ Mn (R)},
AnnR[X] (g) := {m(X) ∈ R[X] : m(g) = 0 + (f ) ∈ R[X]/(f )},
es decir,
AnnR[X] (g) = {m(X) ∈ R[X] : m(g) ∈ (f )}.
Ambos conjuntos son ideales de R[X] y son iguales, i.e.

AnnR[X] (Mg ) = AnnR[X] (g).
vi) Más aún, existe un polinomio mónico χ ∈ R[T ]mon tal que χ(g) = 0 + (f ).
Demostración. Repetimos los resultados por afirmación:
i) Como se observa en el Teorema 1.4.15, la división euclı́dea con resto es factible siem-
pre que el divisor sea un polinomio mónico. El resto de esa división determina los
coeficientes de cualquier h ∈ R[X]/(f ). La unicidad deterina que B0 es base.
ii) Es obvio que se trata de un endomorfismo de R−módulos y es clara también la manera
de determinar la matriz de ηX en la base B0 .
iii) Es de mera comprobación a partir de las definiciones.
iv) Se sigue de aplicar las igualdades precesentes a la expansión monomial de g(X).
v) Es inmediato (por las meras definiciones) que ambos son ideales de R[X]. También es
claro que si g1 − g2 ∈ (f ) se tiene que
ηg1 (h + (f )) = g1 h + (f ) = g2 h + (f ) = ηg2 (h + (f )),
para cualquier h + (f ) ∈ R[X]/(f ).
Finalemente, usando las propiedades descritas en el apartado iii) precedente, obser-
vamos que para cada m(X) ∈ R[X] se tiene:
m(ηg ) = ηm(g) : R[X]/(f ) −→ R[X]/(f ).
Por tanto, m(ηg ) = 0 como endomorfismo si y solamente si
ηm(g) (h + (f )) = m(g)h + (f ) = 0 + (f ) ∈ R[X]/(f ).
Ası́ pues, si m ∈ AnnR[X] (Mg ) es porque m(ηg ) = 0 como endormismo y, por tanto,
m(ηg )(1 + (f )) = m(g) + (f ) = 0 + (f ) ∈ R[X]/(f ).
Luego m(g) = m(g) + (f ) = 0 + (f ) y m ∈ AnnR[X] (g).
Para el otro contenido, si m(g) = 0 + (f ), entonces m(g) ∈ (f ) y, en paricular,
m(ηg ) = ηm(g) = 0 como endomorfismos. Por tanto m(Mg ) = 0 como matriz y
tenemos el otro contenido.

Proposición 4.7.3. Con las mismas notaciones que en la proposición precedente, daod f ∈
R[X]mon un polinomio mónico, y dada g ∈ R[X], definamos la resultante de f y g mediante:
ResX (f, g) := det(Mg ) = det(g(C(f )),
donde C(f ) es la matriz compañera de f . Se tiene:
i) Se verifica:
ResX (f, g) ∈ (f, g)c = (f, g) ∩ R.
ii) Se tiene ResX (f, g) ∈ R× si y solamente si 1 ∈ (f, g).
Demostración. Las afirmaciones una tras otra:
i) Recordemos el Problema 103 y sea XMg (X) ∈ R[X] el polinomio caracterı́stico de Mg .
Supongamos,
χMg (X) := X n + bn−1 X n−1 + · · · + b1 X + b0 ,
donde
b0 = (−1)n det(Mg ) = (−1)n Resx (f, g).
Ahora, por el aparatado v) de la Proposición precedente y por el Teorema de Hamilton-
Cayley, tendremos que
χMg (Mg ) = 0 =⇒ χMg (g) ∈ (f ).
Es decir, se tiene
g(g n−1 + bn−1 g n−2 + · · · + b1 ) + b0 ∈ (f ).
Luego b0 ∈ (f, g) y, por tanto, ResX (f, g) = (−1)n b0 ∈ (f, g).
ii) Por el ı́tem precedente, si ResX (f, g) ∈ R× es una unidad de R, entonces, 1 ∈ (f, g)c ⊆
(f, g). Recı́procamente, si 1 ∈ (f, g) en R[X], es porque g es una unidad en R[X]/(f ).
Es decir, porque existe h ∈ R[X] tal que
hg + (f ) = 1 + (f ).
En particular, se tiene la siguiente igual de homotecias:
ηh ◦ ηg = ηhg = η1 ,
lo que conlleva la igualdad matricial:
Mh Mg = Mhg = M1 = Idn ,
donde la última igualdad se sigue porque la homotecia η1 es la identidad como endo-
morfismo de R[X]/(f ). Como el determinante es un morfismo de grupos (cf. Teorema
2.3.23), tendremos que
det(Mh Mg ) det(Mh ) det(Mg ) = det(Mgh ) = det(Idn ) = 1.
Luego det(Mg ) ∈ R× y la resultante ResX (f, g) = det(Mg ) ∈ R× .

Corolario 4.7.4. Con las notaciones precedentes, supongamos R = K un cuerpo, f ∈ K[X]mon

un polinomio mónico de grado n y g ∈ K[X]. Se tiene:
i) El polinomio mı́nimo de la matriz compañera C(f ) es justamente f , es decir
mC(f ) = χC(f ) = f,
donde mC(f ) es el polinomio mı́nimo de C(f ).
ii) Si K es la clausura algebraica de K son equivalentes:
(a) gcd(f, g) = 1,
(b) ∃ζ ∈ K, f (ζ) = g(ζ) = 0,
(c) ResX (f, g) = 0.
Demostración. Retomemos la afirmación v) de la Proposición 4.7.2 anterior. Tomemos
g = X y X = X + (f ) en K[X]/(f ) la matriz MX = C(f ). Entonces, se tiene que
AnnK[X] (C(f )) = {m ∈ K[X] : m(X) = 0} = {{m ∈ K[X] : m(X) ∈ (f )}.
Como K[X] es un dominio de ideales principales, AnnK[X] (C(f )) es un ideal principal cuyo
generador es, precisamente, el polinomio mı́nimo de la matriz C(f ), que denotaremos por
mC(f ) . Pero, al mismo tiempo, el polinomio f es el polonomio no nulo de menor grado tal que
f (X) ∈ (f ). luego
mC(f ) = f ∈ K[X].
En particular, el grado del polinomio mı́nimo de C(f ) es n = deg(f ). Pero el polinomio
caracterı́stico de C(f ) también tiene grado n y, como mC(f ) es divisor de χC(f ) , concluimos la
igualdad:
mC(f ) = χC(f ) = f.
Para la aformación ii) el Corolario ?? precedente, aplicado al caso n = 1 ya nos indica la
equivalencia entre (a) y (c). Para la equivalencia de (a) y (b) nos remontamos al Lema 3.6.13.
Lema 4.7.5. Sean f1 , . . . , fr ∈ K[X] una familia finita de polinomios mónicos, Sea
r
Y
V := K[X]/(fi (X)),
i=1
el espacio vectorial dado como el producto cartesiano de las K−álgebras cociente. Consideremos
el endomorfismo:
ηX : V −→ V
(h1 + (f1 ), . . . , hr + (fr )) 7−→ (Xh1 + (f1 ), . . . , Xhr + (fr )).
Entonces, existe una base de V en la que la matriz de ηX en esa base es de la forma suma
diagonal de las matrices compañeras de f1 , . . . , fr . Es decir, la matriz es la dada por:
 
C(f1 ) 0 0 0
 0 C(f2 ) 0 0 
M (ϕ) :=  .
 
.. .. .. ..
 . . . . 
0 0 0 C(fr )
Demostración. A partir de la Proposición precedente es obvio que toma esa forma
tomando para V la base del producto cartesiano de cada uno de los espacios vectoriales
K[X]/(fi ) según se describe en el apartado ii) de la Proposición precedente.
Observación 4.7.6. En el caso del Problema 173 se observa que cada fi es divisible por el
siguiente. En el enunciado que acabamos de dar la condición de divisibilidad no es necesaria.
4.7.3.1. La Estructura de K[X]−módulo que define un endomorfismo. Sea V un

espacio vectorial de dimensión n sobre un cuerpo K, ϕ : V −→ V un endomorfismo y sea
(V, +, ·K[X] ) la estructura de K[X]−módulo inducida sobre V por el endomorfismo ϕ (como en
el Ejemplo 2.2.4 del primer Capı́tulo). Entonces, V es un K[X]−módulo finitamente generado
y totalmente de torsión (i.e. V = T orK[X] (V ) como consecuencia del Teorema de Hamilton-
Cayley, Teorema 2.3.33).
Supongamos que dimK (V ) = n es la dimensión de V como K−espacio vectorial. Sea
(4.7.2) B := {v1 , . . . , vn },
una base cualquiera de V y sea M = M (ϕ) ∈ Mn (K) la matriz de ϕ en esa base.
En primer lugar, como V es un K−espacio vectorial generado por B, entonces B es también
un sistema generador de V como K[X]−módulo. En particular, existe un epimorfismo de
K[X]−módulos (y de espacios vectoriales sobre K) de la forma:
π : K[X]n −→ V.
De hecho, consideremos la base usual del K[X]−módulo libre K[X]n dada por:
(4.7.3) T := {e1 , . . . , en } ⊆ K[X]n ,
donde ei := (0, . . . , 0, 1, 0, . . . , 0) ∈ K[X]n , es decir todas sus “coordenadas” son nulas excepto
la coordenada que ocupa el lugar i que es 1 ∈ K ⊆ K[X].
El epimorfismo de K[X]−módulos π : K[X]n −→ V es el único morfismo de K[X]−módulos
tal que
π(ei ) = vi , 1 ≤ i ≤ n.
Lema 4.7.7. Con las notaciones precedentes, sea (p1 , . . . , pn ) ∈ K[X]n un elemento cualquiera
del K[X]−módulo libre K[X]n . Entonces,
n
X
π(p1 , . . . , pn ) := pi (ϕ)(vi ),
i=1
donde pi (ϕ) : V −→ V es el enfomorfismo de V en notación usual.

Demostración. Es un resultado obvio teniendo en cuenta la definición de la estructura
de K[X]−módulo que ϕ induce en V . Pero lo ponemos a modo de recordatorio de esa idea.
Nótese que:
n
X n
X n
X
π(p1 , . . . , pn ) = π(pi ei ) = pi (X) ·K[X] π(ei ) = pi (X) ·K[X] vi ,
i=1 i=1 i=1
por ser morfismo de K[X]−módulos y satisfacerse π(ei ) = vi , donde ·K[X] es la operación

externa (con escalares en K[X]) definida sobre V por ϕ. Pero esa operacón externa significa:
pi (X) ·K[X] vi := pi (ϕ)(vi ), 1 ≤ i ≤ n.
Y tenemos probado el enunciado.
Ahora retomemos la matriz M ∈ Mn (K) de ϕ en la base B y definamos la matriz

MX := XIdn − M ∈ Mn (K[X]).
Consideremos el endomorfismo de K[X]−módulos libres ΦX : K[X]n −→ K[X]n cuya matriz
en la base T de K[X]n , descrita en la Identidad (4.7.3), es la matriz MX . Entendiendo que
ambos K[X]−módulos tienen fijada la misma base. Entonces, tenemos:
Proposición 4.7.8. Con estas notaciones se tiene:
i) El morfismo ΦX es un monomorfismo de K[X]−módulos.
ii) El espacio vectorial V es isomorfo como K[X]−módulo al Co-núcleo de ΦX . Es decir,
V ∼
= K[X]n / Im(ΦX ).
Dicho de otro modo, la siguiente es una sucesión exacta corta de K[X]−módulos:
ΦX π
0 K[X]n K[X]n V 0
Demostración. Ser sucesión exacta corta ((cf. Subsección 2.2.5 del Capı́tulo 2)) equivale
a las propiedades i) y ii) del enunciado. Probemos, por tanto, esas propiedades i) y ii). Para
la propiedad i) recordemos la noción de polinomio caracterı́stico de un endomorfismo. Es decir,
el polinomio descrito en la Definición 53 siguiente:
χM (X) := det(XIdn − M ) ∈ K[X].
Se trata de un polinomio mónico de grado n y, por tanto, es no nulo. En particular, considerando

el cuero de fracciones K(X) del anillo K[X], se tiene que la matriz XIdn − M ∈ Mn (K(X))
es inversible (i.e. XIdn − M ∈ GL(n, K(X))). por tanto, para cualesquiera (p1 , . . . , pn ) ∈
K[X]n ⊆ K(X)n , si se tiene:
   
p1 0
 ..   .. 
(XIdn − M )  .  =  .  ,
pm 0
entonces,
   
p1 0
 ..   .. 
 .  = . ,
pm 0
y ΦX es momomorfismo de K[X]−módulos. Además, su imagen Im(ΦX ) es un submódulo libre
de K[X]n . Más aún, supongamos que la matriz M viene dada por:
 
a1,1 · · · a1,n
M :=  ... .. ..  .

. . 
an,1 ··· an,n
Las columnas de la matriz M son las coordenadas en la base B de las imágenes de los elementos
de la base B por el morfismo ϕ. Por su parte, Im(ΦX ) es el submódulo libre de rango n de
K[X]n generado por los elementos (descritos en columna) siguientes:
 
X − a1,1
 −a2,1  Pn
ΦX (u1 ) :=   = (X − a1,1 )e1 + k=2 (−ak,1 )ek ,
 
..
 . 
−an,1
..
  .
−a1,1
 −a2,1  P
n−1
ΦX (un ) :=   = k=1 (−ak,n )ek + (X − an,n )en .
 
..
 . 
X − an,1
El Lema precedente nos permite concluir que:

n
X
(π ◦ ΦX )(ei ) := π(ΦX (ei )) = (X − ai,i ) ·K[X] π(ei ) + (−ai,k ) ·K[X] π(ek ),
k=1,k6=i
o lo que es lo mismo:
n
X
(π ◦ ΦX )(ei ) = (ϕ − ai,i IdV )(vi ) + (−ak,i )vk .
k=1,k6=i
Pn
Ahora nótese que ϕ(ei ) = k=1 ak,i vk , lo que nos permite concluir que
n
X
(π ◦ ΦX )(ei ) = ϕ(ei ) − (−ak,i )vk = 0.
k=1
Con ello hemos probado que

π ◦ ΦX = 0.
En particular,
Im(ΦX ) ⊆ ker(π).
Ahora observemos que, como π es un epimorfismo de K[X]−módulos, tenemos un isomorfismo
de K[X]−módulos asociado al 1er. Teorema de Isomorfı́a:
K[X]n / ker(π) ∼
= V.
Como es isomorfismo de K[X]−módulos, también es isomorfismo de K−espacios vectoriales.
En particular, K[X]n / ker(π) es un K−espacio vectorial de dimensión n.
De otro lado, el 2o. Teorema de Isomorfı́a indica que tenemos un isomorfismo de K− espacios
vectoriales de la forma:
(K[X]n / Im(ΦX )) / ∼ n
(ker(π)/ Im(ΦX )) = K[X] / ker(π).
Ahora, si probamos que K[X]n / Im(ΦX ) es K−un espacio vectorial de dimensión finita y si
probamos que se tiene:
(4.7.4) dimK (K[X]n / Im(ΦX )) = n,
entonces tendremos la siguiente igualdad de dimensiones entre K−espacios vectoriales de di-
mensión finita:
dimK (K[X]n / Im(ΦX ))−dim (ker(π)/ Im(ΦX )) = n dim (ker(π)/ Im(ΦX )) = dimK (K[X]n / ker(π)) = n.
Con lo que concluirı́amos que
dimK (ker(π)/ Im(ΦX )) = 0,
Im(ΦX ) = ker(π),
lo que conluye la prueba de que la sucesión de K[X]−módulos del enunciado es una sucesión
exacta corta.
A partir de ahora trataremos de probar simplemente la Igualdad (4.7.4) precedente.

Para ello, observemos que podemos definir un morfismo de K[X]−módulos que sigue siendo
epimorfismo:
e : K[X]n / Im(ΦX ) −→
π V
(4.7.5)
h + Im(ΦX ) 7−→ π(h).
La buena definición de este morfismo es consecuencia del contenido de submódulos Im(ΦX ) ⊆
ker(π). Y sigue siendo epimorfismo por la misma razón. Es epimorfismo de K[X]−módulos y,
en particular, es epimorfismo de K−espacios vectoriales porque K ⊆ K[X].
Ahora calculemos la forma normal de Smith de la matriz XIdn − M que tendrá la forma para
P, Q ∈ GL(n, K[X]):
 
Idn−r 0
 f1 · · · 0 
P (XIdn − m)Q :=  ,
 
0 . .
 0 . 0
0 · · · fr
donde Idn−r es la matriz identidad con n−r filas y columnas, y f1 , . . . , fr ∈ K[X] son polinomios
mónicos verificando fi | fi+1 para cada i, 1 ≤ i ≤ r − 1. En particular, existe una unidad
u ∈ K[X]× = K \ {0} tal que:
Yr
χM (X) := u fi (X).
i=1
Por lo tanto, salvo las matrices P, Q ∈ GL(n, K[X]), el cociente de K[X]n por Im(ΦX ) es
isomorfo como K[X]−módulo a:
r
K[X]n / Im(ΦX ) ∼
Y
= (K[X]/(fi )) .
i=1
Esto significa que también son isomorfos como K−espacios vectoriales y, en particular, ten-
dremos que la dimensión como K−espacio vectorial satisface:
Xr
dimK (K[X]n / Im(ΦX )) = deg(fi ) = deg(χM (X)) = n.
i=1
En particular, el epimorfismo π
e de la Ecuación (4.7.5) es un epimorfismo entre dos espacios
vectoriales de la misma dimensión. Es, por tanto, un isomorfismo de K−espacios vectoriales y
de K[X]−módulos y queda probada la Igualdad (4.7.4) y el enunciado.
A continuación, demostramos la existencia de la forma de Frobenius de un endomorfismo so-

bre un espacio vectorial de dimensión finita (también llamada, según diversos autores forma
canónica racional o forma cı́clica del endomorfismo).
Teorema 4.7.9 (Existencia de forma de Frobenius de un endomorfismo). Sea V un
espacio vectorial de dimensión n sobre un cuerpo K, ϕ : V −→ V un endomorfismo y sea
(V, +, ·K[X] ) la estructura de K[X]−módulo inducida sobre V por el endomorfismo ϕ. Sea M
la matriz de ϕen una base cualquiera de V y sea XIdn − M ∈ Mn (K[X]) la matriz definida
anterioremente. Sea f1 , . . . , fr ∈ K[X] los factores invariantes (mónicos) que no son unidades
entre los de la matriz XIdn − M ∈ Mn (K[X]) (cf. Teorema 4.7.1 precedente), con la propiedad
fi | fi+1 , 1 ≤ i ≤ r − 1.
Entonces, V es isomorfo como K[X]−módulo (y como K−espacio vectorial) a:

r
V ∼
Y
= K[X]/(fi (X)).
i=1
En particular, existe una base Θ de V en la que la matriz de ϕ en esa base toma la forma
siguiente :
 
C(f1 ) 0 0 0
 0 C(f 2) 0 0 
(4.7.6) M (ϕ) :=  . ,
 
. .. ..
 .. .. . . 
0 0 0 C(fr )
siendo C(fi ) la matriz compañera del polinomio fi ∈ K[X].
Además, el polinomio fr será el polinomio mı́nimo del endomorfismo ϕ (y de la matriz M ), i.e.
fr = mM (X) ∈ K[X].
En cuanto al caracterı́stico, se tendrá:
r
Y
χM (X) := fi ,
i=1
donde χM (X) = det(XIdn − M ) es el polinomio caracterı́stico de M.

Demostración. Esencialmente se ha visto en la demostración predente que hay un iso-
morfismo
Yr
θ: K[X]/(fi (X)) −→ V,
i=1
que es isomorfismo de K[X]−módulos y de K−espacios vectoriales.
Para concluir, consideremos el siguiente diagrama conmutativo
Qr θ
i=1 K[X]/(fi (X)) V
ηX ϕ
Qr θ
i=1 K[X]/(fi (X)) V
Para verificar que es un diagrama conmutativo basta con recordar (una vez más) la operación
·K[X] que ϕ induce sobre V . Ahora consideremos en la columna izquierda la base Θ de
Qr
i=1 K[X]/(fi (X)) en la que la matriz de ηX sea la suma diagonal de matrices compañeras de-
scrita en la identidad (4.7.6) anterior. Entonces, trasladando la base Θ a través del isomorfismo
θ a una base β := θ(Θ) de V tendremos una base de V en la que la matriz de ϕ es precisamente
la matriz M (ϕ) de la identidad (4.7.6) anterior. Y, por tanto, toda matriz admite forma de
Frobenius.
El lo que respecta al polinomio fr , retomemos la Proposición 4.7.2 precedente. Observa-
mos que el anulador de una matriz depende solamente de su clase de semejanza. Es decir,
si M, M 0 ∈ Mn (K) son dos matrices semejantes, entonces
AnnK[X] (M ) = {m ∈ K[X] : m(M ) = 0} = {m ∈ K[X] : m(M 0 ) = 0} = AnnK[X] (M 0 ).
Y el polinomio mı́nimo de una matriz es, precisamente, el generador de AnnK[X] (M ). Supong-
amos, como en el enunciado que la matriz M es semejante a la suma diagional de matrices
compañeras siguiente:
 
C(f1 ) 0 0 0
 0 C(f2 ) 0 0 
FM :=  . ..  ,
 
. .
 .. .. .. . 
0 0 0 C(fr )
de la identidad (4.7.6) precedente, con fi | fi+1 . Consideremos un polinomio m ∈ K[X] y
tendremos:  
m(C(f1 )) 0 0 0
 0 m(C(f2 )) 0 0 
m(FM ) =  .
 
.. .. . .. .
..
 . . 
0 0 0 m(C(fr ))
Por tanto, m(FM ) = 0 si y solamente si
m(C(fi )) = 0, ∀i, 1 ≤ i ≤ r.
Pero el Corolario 4.7.4 nos indica que los polinomios mı́nimos de las matrices compañeras C)fi )
son precisamente los polinomios fi ∈ K[X]. Por tanto, concluimos que para cada polinomio
m ∈ K[X] se tiene:
m(M ) = 0 ⇔ m(FM ) = 0 ⇔ fi | m, ∀i, 1 ≤ i ≤ r.
Como fi | fi+1 para cada i se tiene:
fi | m, ∀i, 1 ≤ i ≤ r ⇐⇒ fr | m.
En conclusión fr es el generador de AnnK[X] (M ) y es, por tanto, el polinomio mı́nimo mM de M .
En lo que respecta al polinomio caracterı́stico, recordemos que también es un invariante de la

clase de semejanza. Además, tenemos la identidad
 
XIdn1 − C(f1 ) 0 0 0
 0 XId n 2 − C(f 2 ) 0 0 
XIdn − FM =  ,
 
.. .. .. ..
 . . . . 
0 0 0 XIdn2 − C(fr )
donde ni = deg(fi ). Como el determinante multiplica los determinantes de los bloques de
matrices, concluiremos
r
Y r
Y
χM (X) = χFM (X) = det(XIdn − FM ) = det(XIdni − C(fi )) = χC(fi ) (C).
i=1 i=1
Por el Corolario 4.7.4 precedente, el polinomio caracterı́stico de C(fi ) es el propio polinomio fi

con lo que habremos concluido:
r
Y
χM (X) = χFM (X) = fi ,
i=1
lo que prueba la última afirmación de enunciado.

Corolario 4.7.10 (Teorema de Hamilton-Cayley). Sea M ∈ Mn (K) una matriz cuadrada,

sean g1 , . . . , gr ∈ K[X] los factores invariantes mónicos y no unidad, dados en orden creciente
de grados, de la matrix XIdn − M ∈ Mn (K[X]), entonces se verifica el Teorema de Hamilton-
Cayley. i.e. χM (M ) = 0.
Demostración. Nótese que si M denota el endomorfismo de K‘n determinado por M ,
la estructura de K[X]−módulo que M induce sobre K n hace que haya un isomorfismo de
K[X]−módulos (y, por ende, de K−espacios vectoriales) de la forma:
r
= K[X]n / Im((XIdx − M ) ∼
Kn ∼
Y
= K[X]/(gi ).
i=1
Como gr es el mı́nimo común múltiplo de g1 , . . . , gr , entonces, el anulador en K[X] del tercer

K[X]−módulo satisface:
Y r
(gr ) := AnnK[X] ( K[X]/(gi )).
i=1
n
Luego gr ∗K[X] v = 0 para cada v ∈ K . Pero esto significa que
0 = gr ∗K[X] v = gr (M )(v), ∀v ∈ V.
Luego gr (M ) = 0 y, como gr es un divisor de χM , entonces χM (M ) = 0 y concluimos una
prueba alternativa del Teorema de Hamilton-Cayley (Teorema 2.3.33 anterior).
Corolario 4.7.11 (Matrices cuyo polinomio mı́nimo coincide con su caracterı́stico).

Sea K un cuerpo cualquiera, M ∈ Mn (K) la matriz de un endomorfismo ϕ : V −→ V , donde
V es un K−espacio vectorial de dimensión n. Son equivalentes:
i) El polinomio mı́nimo y el polinomio caracterı́stico de ϕ coinciden.
ii) El polinomio mı́nimo y el polinomio caracterı́stico de M coinciden.
iii) La matriz M es semejante a una matriz compañera C(f ) de un polinomio mónico
f ∈ K[X] de grado n.
iv) Existe un polinomio mónico f ∈ K[X] de grado n y un isomorfismo de K−espacios
vectoriales Φ : V −→ K[X]/(f ) tal que el siguiente diagrama es conmutativo:
Φ
V K[X]/(f )
ϕ ηX
V K[X]/(f )
Φ
Demostración. Por el Teorema de la Existencia de Froma de Frobenius precdente, si M

es una matriz cuyo polinomio caracterı́stico χM coincide con su polinomio mı́nimo mM , la forma
de Frobenius de FM de M debe satisfacer
 
C(f1 ) 0 0 0
 0 C(f2 ) 0 0 
FM :=  . ..  ,
 
. .
 .. .. .. . 
0 0 0 C(fr )
donde
fr = mM ,
Yr
χM (X) = fi .
i=1
Pero ambas propiedades combinadas con χM (X) = mM se satisfacen si y solamente si r = 1,
FM = C(fr ) y tenemos todas de las equivalencias del enunciado en una sola.
Observación 4.7.12. En otras palabras, el anterior corolario simplemente dice que una matriz
(o un endomorfismo) verifican que su polinomio mı́nimo y su polinomio caracterı́stico coinciden
si y solamente si la matriz (o el endomorfismo) es simplemente la matriz de la homotecia ηX
pero en una base equivocada.

Problema 179. Calcular la forma Normal de Smith de las siguientes matrices sobre Z:
i)
2 1
5 3
ii)
2 −1 2
−6 3 6
iii)  
1 0 0
0 2 0
0 0 3
iv)  
9 8 7
6 5 4
3 2 1
Problema 180. Discutir si son compatibles y, en su caso, resolver los siguientes sistemas de
ecuaciones lineales diofánticos:
i) 
 X1 + X2 + 3X3 = 3
X1 + 3X2 + 5X3 = 7
X1 − 2X2 = −3

ii)

4X1 + 2X2 + 6X3 = 0
X1 + 2X2 = 3
iii)

 X1 + 2X2 + X3 + 2X4 = 3
X1 + X3 = 2
3X1 + 3X3 + 4X4 = 2

Problema 181. Prueba que para todo dominio de ideales principales R y para cada número
natural n ∈ N, los submódulos de rango r de Rn coinciden con los conjuntos de soluciones de
sistemas de ecuaciones homogéneos de la forma BX = 0, donde B ∈ M(n−r)×n (R) es una
matriz con n − r filas y n columnas de rango n − r.
Problema 182. Prueba que si M y N son dos R−módulos libres de rango finito, se tiene:
rankR (M ⊕ N ) = rankR (M × N ) = rankR (M ) + rankR (N ).
Prueba que si M es un submódulo de N con las anteriores condiciones, no es cierto que si
rankR (M ) = rankR (N ), entonces M = N .
Problema 183. Reflexionar sobre el significado del Teorema de Estructura para módulos fini-
tamente generados sobre DIP en el caso R = K[X] y M la estructura de K[X]−módulo definida
sobre un espacio vectorial finitamente generado V por un endomorfismo de K−espacios vecto-
riales f : V −→ V . ¿Tiene algo que ver con la forma de Frobenius del endomorfismo?.
Problema 184. Hallar la Forma Normal de Smith sobre Q[X] de la siguiente matriz:
 
X −2 −1 0 0
 0
 X −2 0 0 
 0 0 X −2 0 
0 0 0 X −2
Problema 185. Hacer lo mismo que en el problema anterior para las siguientes matrices:
 
X −2 −1 0 0
 0
 X −2 0 0  
 0 0 X −2 −1 
0 0 0 X −2
 
X −2 −1 0 0
 0
 X −2 −1 0  
 0 0 X −2 −1 
0 0 0 X −2
 
X −2 −1 0 0
 0
 X −2 0 0  
 0 0 X −3 −1 
0 0 0 X −3
 
X −2 0 0 0
 0
 X −2 0 0  
 0 0 X −3 0 
0 0 0 X −3
Problema 186. Considerar el grupo abeliano libre Zn y varios subgrupos que se citan a contin-
uación. Hallar la estructura del subgrupo de los elementos de torsión del grupo cociente Zn /H.
Decidir, en cada caso, si el grupo cociente es completamente de torsión o si su descomposición
posee “parte libre de torsión” (i.e. decidie si T or(Zn /H) = Zn /H en cada caso.
i) Supongamos n = 2 y H1 es el subgrupo de Z2 generado por {(1, 2), (3, 4)}.
ii) Supongamos n = 2 y H2 es el subgrupo de Z2 generado por {(2, 3)}.
iii) Supongamos n = 3 y H3 es el subgrupo de Z2 generado por {(1, 1, 1), (2, 4, 6), (3, 7, 11)}.
iv) Supongamos n = 3 y H4 es el subgrupo dado como la imagen del morfismo de grupos

siguiente:
A: Z2 −→ Z3
(x, y) 7−→ (2x − 2y, 4x + 2y, 2y).
Observar que, en este caso Z3 /H4 es el Co-núcleo de A.
v) Supongamos n = 3 y H5 es el subgrupo dado como la imagen del morfismo de grupos
siguiente:
A: Z3 −→ Z3
(x, y, z) 7−→ (x + 2y + 3z, x + 4y + 7z, x + 6y + 11z).
Observar que, en este caso Z3 /H5 es el Co-núcleo de B.
Problema 187 (Retı́culos). Sea denomina retı́culo de dimensión n en Rn al Z−módulo libre
generado por una base de Rn . Se denota mediante Λ(β) := Zh{v1 , . . . , vn }i al retı́culo generado
en Rn por la base β := {v1 , . . . , vn }. Se llama paralelepı́pedo fundamental de un retı́culo Λ(β)
al polı́topo determinado por los puntos v1 , . . . , vn ∈ Rn y el origen. Es decir, el conjunto
X n
P(β) := { ti vi : ti ∈ [0, 1], }.
i=1
Se llama volumen de un retı́culo Λ(β) al volumen de su paralelepı́pedo fundamental.
i) Sea Λ(β) un retı́culo con paralelepı́pedo fundamental P(β). Sea M la matriz cuyas
columnas están formadas por las coordenadas de los vectores de la base β. Probar que
se satisface: p
vol(Λ(β)) =| det(M ) |= det(M t M ).
ii) Sean Λ un retı́culo y P ∈ GL(n, Z) una matriz inversible sobre Z. Pruébse que el
conjunto P Λ siguiente es también un retı́culo:
P Λ := {w ∈ Rn : ∃v ∈ Λ, wt = P v t }.
Pruébese también que vol(Λ) = vol(P Λ) para calquier P ∈ GL(n, Z).
iii) Sean Λ ⊆ Λ0 dos retı́culos, siendo Λ un submódulo de Λ0 del mismo rango (y, por
tanto, libre). Probar que vol(Λ) ≥ vol(Λ0 ).
iv) Con las condiciones anteriores, pruébese que el Z−módulo cociente Λ0 /Λ es un grupo
abeliano finito y que su orden satisface:
vol(Λ)
] (Λ0 /Λ) = .
vol(Λ0 )
v) Busca en internet el enunciado del Teorema del Cuerpo Convexo de Minkowski. Busca
también una demostración y trata de entenderla. Explica su significado.
vi) Sea K ⊆ Rn un cerrado convexo y acotado y sea Λ ⊆ Rn un retı́culo. Trata de estabecer
una relación entre el volumen de K, el volumen del paralelepı́pedo fundamental de Λ y
el número de puntos de la intersección de K con Λ. Diseña un algoritmo que aproxime
el volumen de un conjunto convexo mediante el número de puntos ](Λ ∩ K).
Problema 188. Sean a1 , . . . , as ∈ Z números enteros dados y sea h su máximo común divisor.
Consideremos la ecuación diofánticas:
(4.7.7) a1 X1 + · · · + as Xs = h.
Consideremos el conjunto de las soluciones (x1 , . . . , xs ) ∈ Zs de este sistema y lo denotamos
por S. Hay que probar que
S = (x1 , . . . , xs ) + Syz(a1 , . . . , as ),
donde (x1 , . . . , xs ) es una solución de la ecuación (4.7.7) y Syz(a1 , . . . , as ) es el Z−módulo de
las Syzygı́as de Hilbert de la lista (a1 , . . . , as ) ∈ Zs dado mediante:
s
X
Syz(a1 , . . . , as ) = {(y1 , . . . , ys ) ∈ Zs : yi ai = 0}.
i=1
Pruébese también que Syz(a1 , . . . , as ) es un Z−módulo libre de rango acotado por s. Con-
strúyase un algoritmo tal que dada una ecuación como (4.7.7), el algoritmo devuelve todas sus
soluciones (o, al menos, una descripción explı́tica de las mismas).
Problema 189 (Hilbert’s Tenth Problem). Busca en Wikipedia información sobre el Prob-
lema X de Hilbert. Escribe su enunciado. Escribe también el enunciado del Teorema de
Matjasevich (cf. [Matj, 1970]), fuertemente basados en los trabajos de Julia Robinson (cf.
[Rob, 1950], [Rob, 52]), aunque algunos historiadores añaden el nombre de M. Davis (cf.
[Dav, 49]) y el nombre de Hilary W. Putnam. Dicho enunciado afirma que no existe algo-
ritmo que decida si una ecuación polinomial con coefcientes enteros posee una solcuión entera.
Usando este resultado, prueba el siguiente:
“ No existe ningún algoritmo que resuelva el siguiente problema:
Dada una familia de polinomios de grado a lo sumo 2, cada uno de los cuales sólo depende de, a
lo sumo, tres variables, f1 , . . . , fs ∈ Z[X1 , . . . , Xn ], decide si existe una solución x ∈ Zn común
a todos ellos”.
Concluye que, en lo concerniente a la decisión de la existencia de solcuiones diofánticas para
ecuaciones polinomiales de grado 2 o superior, no es posible obtener algoritmos. ( Hint: Prueba
que toda ecuación polinomial con coeficientes enteros, se puede escribir como varias ecuaciones
polinomiales de grado 2 con coeficientes enteros, cada una de las cuales involucra a lo sumo
tres variables).
4.7.4.1. Ecuaciones Diferenciales Ordinarias Homogéneas. En este bloque de prob-
lemas, consideraremos dos maneras de presentar ecuaciones diferenciales ordinarias homogéneas
con coeficientes constantes, para un valor inicial dado. De una parte, una sola ecuación difer-
encial de orden n y de la otra un sistema de ecuaciones diferenciales lineales con coeficientes
constantes.
i) Una sola ecuación diferencial de orden n: Esto es, se considera una ecuación diferencial
ordinaria lineal y homogénea con coeficientes constantes. Es decir, consideramos una
ecuación diferencial de la forma:
(4.7.8) a0 f + a1 f 0 + · · · + an−1 f (n−1) + f (n) = 0.
donde a0 , . . . , an−1 ∈ R. Con las condiciones iniciales en un punto x0 ∈ R dadas
mediante:
f (x0 ) = v0 , f 0 (x0 ) = v1 , . . . , f (n) (x0 ) = vm .
ii) Un sistema de ecuaciones diferenciales homogéneo con coeficientes constantes: En
este caso se trata de considerar una matriz A ∈ Mn (R), un vector (expresado como
columna) b ∈ Rn y una sucesicón de n funciones {X1 (t), . . . , Xn (t)} que son las
incógnitas a resolver. Denotaremos por Ẋ al vector de las derivadas de las funciones
y por X al vector de las funciones a encontrar. Es decir,
 0   
X1 (t) X1 (t)
 X20 (t)   X2 (t) 
Ẋ :=  .  , X :=  .  .
   
 ..   .. 
Xn0 (t) Xn (t)
Se considera el siguiente sistema de ecuaciones diferenciales lineales homogéneas con
coeficientes constantes:
(4.7.9) Ẋ = AX,
con la condición inicial
X(x0 ) = b ∈ Rn .
Problema 190. Pruébese los siguiente:
i) Las ecuaciones diferenciales ordinarias del tipo descrito en la ecuación (4.7.8) son un
caso particular de los sistema de ecuaciones del tipo descrito en la ecuación (4.7.9).
Hint: Introduce variables para las funciones, usando X1 := f, X1 := f 0 , . . . , Xn :=
f (n−1) , Xn+1 := f (n) . ¿Qué tipo de matriz aparece como matriz de coeficientes?.
ii) Toda ecuación dferencial lineal homogénea con coeficientes constantes del tipo descrito
en la ecuación (4.7.9) se puede transformar, salvo un cambio lineal de coordenadas,
P ∈ GL(n, R) en una suma diagonal de ecuaciones diferenciales lineales del tipo de-
scrito en (4.7.8). Hint: Úsese la forma de Frobenius de la matriz A de coeficientes.
Ası́, el sistema (4.7.9) se transforma en un sistema de la forma:

 
C(p1 ) 0 ··· 0
 0 C(p2 ) · · · 0 
 −1
Ẋ = P  .  P X,

. . .
 . . 0 
0 0 ··· C(pr )
donde p1 , . . . , pr ∈ R[X] son polinomios mónicos, las matrices C(pi ) son las matrices
compañeras de esos polinomios y
Yr
pi (X) = χA (X),
i=1
es el polinomio caracterı́stico de A. Haciendo el cambio de “variables”
Y := P −1 X,
se obtienen las ecuaciones del tipo (4.7.8) indicadas.
CAPı́TULO 5
El Teorema Chino de los Restos (Opcional)

(..nanos gigantum humeris insidentes)
“..What Descartes did was a good step.

You have added much several ways, and
especially in taking the colours of thin
plates into philosophical consideration. If
I have seen a little further it is by
standing on the shoulders of Giants”.
I. Newton, 1676
Índice
5.2. El anillo producto y el Teorema Chino de los Restos 258
5.3. El Teorema Chino de los Restos en el caso R = Z 260
5.3.1. En relación con el problema de Sun Tzu. 261
5.3.2. En computación: cálculo del determinante por algoritmos modulares. 262
5.3.2.1. La Búsqueda de un Buen Número Primo. 265
5.3.2.2. Tests de Primalidad. 265
5.3.2.3. Combinando el Teorema de Densidad y los Tests de Primalidad. 266
5.3.2.4. La Estrategia Final. 267
5.3.3. Secretos compartidos. 268
5.3.4. Grupos abelianos finitamente generados: estructura, divisores elementales. 269
5.3.5.1. El Test de G. Miller y M.O. Rabin 272
5.4. El Teorema Chino de los Restos en el caso R := K[X]: Forma de
Jordan. 275
5.4.1. La forma canónica de Jordan: divisores elementales en K[X]. 275
5.4.2. Teorı́a del endomorfismo y el máximo común divisor en K[X]. 278
Otra demostación (más explı́cita) de la correctitud del algoritmo. 283
5.4.3.1. El algoritmo de Csanky-Leverrier-Fadeev-Souriau. 289
5.1. Introducción
En esta Sección recordaremos el teorema Chino de los Restos y algunas de sus aplicaciones más
notables. Aunque se desconoce su origen preciso, las fuentes más clásicas apuntan al texto Sun
Zi suan-ching (traducido, malamente, como “Las Matemáticas Clásicas de Sun Zi”), publicado
en el tercer siglo antes de Cristo por Sun Tzu. Reaparece, con otros resultados interesantes
como el método de Newton, en 1274 en un texto de Qin Jiushao titulado Shushu Chiu-zhang.
El Problema que trata es el siguiente:
Problema Clásico 5.1.1. ¿Cuál es el número entero más pequeño tal que
f ≡ 2 mod 11, f ≡ 3 mod 5, f ≡ 2 mod 7?.
En todo caso, sigue este Capı́tulo formando parte del conjunto de requisitos aunque, aderezado
de forma conveniente, puede permitir revisar otros requisitos (fundamentalmente la Forma
Canónica de C. Jordan o la Clasificación de Grupos Abelianos finitamente generados) y algunas
aplicaciones de la misma. Como “novedad”, se expone un algoritmo de cálculo del máximo
común divisor en K[X], usando Álgebra Lineal en dimensión mı́nima (lo que es un preludio
257
258 5. TEOREMA CHINO DE LOS RESTOS
a los algoritmos de la Escuela TERA-Kronecker). EL aderezo vuelve a ser el de un curso de

Álgebra Conmutativa por la terminologı́a usada.
5.2. El anillo producto y el Teorema Chino de los Restos

Proposición 5.2.1 (Anillo Producto). Sean {Ri : 1 ≤ i ≤ r} una colección finita de
anillos. Definamos las operaciones siguientes:
Qr Qr Qr
+: ( i=1 Ri ) × ( i=1 Ri ) −→ ( i=1 Ri )
(5.2.1)
((x1 , . . . , xr ), (y1 , . . . , yr )) 7−→ (x1 + y1 , . . . , xr + yr ),
y
Qr Qr Qr
·: ( i=1 Ri ) × ( i=1 Ri ) −→ ( i=1 Ri )
(5.2.2)
((x1 , . . . , xr ), (y1 , . . . , yr )) 7−→ (x1 y1 , . . . , xr yr ).
Qr
i) El conjunto ( i=1 Ri , +, ·) es un anillo Q conmutativo con unidad. El elemento neutro
r
para la suma es el elementoQ(0, . . . , 0) ∈ i=1 Ri y el elemento neutro para el producto
r
es el elemento (1, . . . , 1) ∈ i=1 Ri .
ii) Cualquiere
Qr elemento de la forma (x1 , . . . , xr ) con algún xi = 0, es un divisor de cero
de i=1 Ri .
Qr
Al anillo i=1 Ri se le denomina anillo producto de los anillos en la familia {Ri : i ∈ I}.
Qr
Demostración. Para comprobar que ( i=1 Ri , +, ·) es un anillo conmutativo con Qr unidad,
recuérdese el producto de grupos abelianos, lo que nos daráQla condición de grupo en ( i=1 Ri , +)
r
y el elemento neutro para la suma dado por (0, . . . , 0) ∈ i=1 Ri . Verificar que es anillo con la
operación producto es mera comprobación de las propiedades a partir de las que verifica cada
uno de los Ri . La otra propiedad señalada es obvia.
Definición 72 (Ideales co-maximales). Dos ideales a y b de un anillo R se denominan
co-maximales si a + b = R.
Algunos autores prefieren el término “co-primo” en lugar de co-maximales, es una cuestión de
gusto. Aquı́ elegiremos el término co-maximal como queda dicho.
Teorema 5.2.2 (Teorema Chino de los Restos). Sea {ai : 1 ≤ i ≤ n} un conjunto finito
de ideales en un anillo R. Supongamos que son dos a dos co-maximales (i.e. ai + aj = R,
∀i 6= j) y consideremos el morfismo de anillos:
Qn
Φ : R −→ i=1 (R/ai )
(5.2.3)
a 7−→ (a + a1 , a + a2 , . . . , a + an ).
Se tiene:
i) Φ es un epimorfismo de anillos.
ii) El núcleo verifica:
n
Y
ker(Φ) = ∩ni=1 ai = ai .
i=1
iii) φ induce un isomorfismo de anillos:
Qn
Φ
e: R/ (∩ni=1 ai ) −→ i=1 (R/ai )
(5.2.4)
x + (∩ni=1 ai ) 7−→ (x + a1 , x + a2 , . . . , x + an ).
Demostración. Comencemos observando que Φ está bien definida dado que es la com-
posición de los dos morfismos de anillo siguientes:
Qn
i : R −→ Rn := i=1 R
(5.2.5)
x 7−→ (x, x, . . . , x).
y
Qn n
Qn
(5.2.6) i=1 πi : R −→ i=1 (R/ai ) ,
donde πi : R −→ R/ai es la proyección canónica. A partir de aquı́, probemos las propiedades
descritas.
5.2. EL ANILLO PRODUCTO Y EL TEOREMA CHINO DE LOS RESTOS 259
Comencemos considerando
Qn unos elementos especiales. Para cada i ∈ {1, . . . , n}, consideremos
el elemento ei ∈ i=1 (R/ai ) dado mediante:
n
Y
ei := (εi,1 + a1 , εi,2 + a2 , . . . , εi,n + an ) ∈ (R/ai ) ,
i=1
donde
1, si i = j
εi,j :=
0, en caso contrario
Nótese que ei es el elemento que “tiene un 0 en todos los lugares, excepto en el lugarQ i en el que
n
tiene un 1”. Consideremos ahora un elemento cualquiera ζ := (x1 +a1 , . . . , xn +an ) ∈ i=1 R/ai .
Se tiene la siguiente identidad:
n
X
(5.2.7) ζ := Φ(xi )ei .
i=1
Por tanto, probar que Φ es suprayectiva se reduce a probar que {e1 , . . . , en } ⊆ Im(Φ). Por
simplicidad de la expresión de la prueba, probemos que e1 ∈ Im(Φ) y, análogamente, se hará
para todos los otros elementos.
dado que a1 y ai son co-maximales para todo i 6= 1, 1 ≤ i ≤ n, podemos suponer que existen
xi ∈ a1 e yi ∈ ai tales que xi + yi = 1 en R. Definamos el elemento
n
Y n
Y
(5.2.8) z1 := yi = (1 − xi ).
i=2 i=2
Entonces, se tiene Φ(z1 ) = e1 . Para comprobarlo, recordemos que:

Φ(z1 ) := (z1 + a1 , z2 + a2 , . . . , z1 + an ).
Qn
• Como yj ∈Qaj , para todo j ≥ 2, entonces i=2 yi ∈ aj , para todos j ≥ 2 y, por tanto,
n
z1 + aj = i=2 yi + aj = 0 + aj , para todo Qn j ≥ 2. Qn
• De otro
Pn lado, desarrollando el producto i=2 (1−xi ) obtendremos z1 = i=2 (1−xi ) =
1 + i=2 xi hi (x2 , . . . , xn ), donde
n
Y
hi (x2 , . . . , xn ) = − (1 − xj ),
j=i+1
para 2 ≤ i ≤ n − 1 y hn = −1. En particular, hi (x2 , . . . , xn ) ∈ R. Para cada i,

2≤i≤ Pn, xi ∈ a1 , por tanto, xi hi (x2 , . . . , xn ) ∈ a1 , para cada i, 2 ≤ i ≤ n y, por
n
tanto, i=2 xi hi (x2 , . . . , xn ) ∈ a1 . Hemos concluido que z1 = 1 + h, con h ∈ a1 y,
finalmente, z1 + a1 = 1 + a1 .
Juntando estas afirmaciones, tendremos:
Φ(z1 ) := (1 + a1 , 0 + a2 , . . . , 0 + an ) = e1 ,
y queda probada la suprayectividad.
En cuanto al núcleo de Φ, es claro que dicho núcleo coincide con ∩ni=1 ai . Sin embargo, el
enunciado dice algo más. Dice que, en el caso de que los ideales sean co-maximales dos a dos,
entonces la intersección y el producto coinciden, es decir
n
Y n
\
ai = ai .
i=1 i=1
Qn Tn
Hay un contenido claro por las definiciones de los propios ideales i=1 ai ⊆ i=1 ai , luego sólo
queda por probar el recı́proco. Hagamos la prueba por inducción. Comencemos en el caso
n = 2. En ese caso, por ser a1 y a2 co-maximales, tendremos a1 + a2 = R y han de existir
x1 ∈ a1 y x2 ∈ a2 tales que x1 + x2 = 1. Sea ahora x ∈ a1 ∩ a2 .
• Como x ∈ a2 (por estar en a1 ∩ a2 ) y x1 ∈ a1 , entonces xx1 ∈ a1 a2 ,
• Recı́procamente, como x ∈ a1 (por estar en a1 ∩ a2 ) y x2 ∈ a2 , entonces xx2 ∈ a1 a2 .
En conclusión, xx1 , xx2 ∈ a1 a2 , luego

x = x · 1 = x(x1 + x2 ) = xx1 + xx2 ∈ a1 a2 ,
y queda probado el caso n = 2. Para el caso n, vamos a reproducir el argumento del modo
siguiente:
Se tiene que si aQi , 1 ≤ i ≤ n es una familia de ideales dos a dos co-maximales, entonces, los
ideales ai y bi := j6=i aj son co-maximales también (i.e. ai + bi = R). Para probarlo, haremos
solamente el caso i = 1 y el resto de los casos es análogo. Dado que a1 y ai son co-maximales,
han de existir xi ∈ a1 e yi ∈ ai , i ≥ 2, tales que
xi + yi = 1.
Qn Qn
Consideremos ahora el elementos z1 := i=2 yi ∈ b1 = i=2 ai . De otro lado, como el la prueba
del epimorfismo, tendremos que
n
Y Xn
z1 = (1 − xi ) = 1 + xi hi (x2 , . . . , xn ) = 1 + h,
i=2 i=2
donde h ∈ a1 . Concluiremos ası́ que
1 = (−h) + z1 ,
siendo −h ∈ a1 y z1 ∈ b1 . Por tanto, a1 y b1 son co-maximales y, por el caso n = 2, tendremos
\
a1 b1 = a1 b1 .
Ahora aplicamos la hipótesis inductiva y concluimos
Yn \n
b1 = ai = ai ,
i=2 i=2
lo que, juntado con la igualdad inmediatamente anterior, implica la afirmación descrita en ii).
La afirmación iii) del enunciado es evidente a partir del primer Teorema de Isomorfı́a y de las
afirmaciones i) y ii).
5.3. El Teorema Chino de los Restos en el caso R = Z

Utilizaremos los muchos resultados ya descritos sobre las propiedades básicas del anillo Z como
el Teorema 2.2.18, que nos indicaba que Z es un dominio de ideales principales, o la Identidad
de Bézout con cotas (ver Corolario 3.4.7). Seguidamente recordemos en el caso de dominios
de ideales principales, y en el caso de Z en particular, los significados de los ideales, suma,
producto e intersección.
Proposición 5.3.1. Dados n1 , . . . , nr ∈ Z números enteros y sean ai = (ni ) los ideales en Z
que generan. Entonces, se tienen las siguientes propiedades:
Pn
i) El ideal suma i=1 ai es el ideal generado por el máximo común divisor m := gcd(n1 , . . . , nr ).
ii) El ideal intersección a := ∩ni=1 ai es el ideal generado por el mı́nimo común múltiplo
m := mcm(n1 , . . . , nr ).
Qr
iii) El ideal producto b := i=1 ai es el ideal (N ), generado por el producto
r
Y
N := ni .
i=1
Finalmente, si gcd(ni , nj ) = 1 para todo i 6= j, entonces el mı́nimo común múltiplo m coincide

con N , esto es, en el caso de ser dos a dos co-maximales, se tiene:
r
Y
mcm(n1 , . . . , nr ) = ni .
i=1
Demostración. Ya se ha insistido abundantemente en la propiedad i), por lo que no insi-

stiremos en ello. El mı́nimo común múltiplo de varios números enteros se define, precisamente,
como el generador de la intersección de ideales. Recordémoslo: m = mcm(n1 , . . . , nr ) si y
solamente si se verifica:
5.3. EL TEOREMA CHINO DE LOS RESTOS EN EL CASO R = Z 261
• ni | m, para cada i, 1 ≤ i ≤ r.
• m es mı́nimo con esa propiedad.
Ahora nótese que la primera condición significa m ∈ (ni ) para cada i, 1 ≤ i ≤ r. Por tanto,
la primera condición significa m ∈ ∩ri=1 (ni ) y, por tanto, significa también (m) ⊆ ∩ri=1 ai . En
cuanto a la condición de minimalidad, recordemos el Teorema 2.2.18, en el cual se afirma que
el elemento no nulo de valor absoluto (resp. grado) mı́nimo en un ideal es el generador en
Z (resp. K[X]). Podemos ası́ concluir que si m es el mı́nimo con esa propiedad, entonces,
(m) = ∩ri=1 (ni ). Qr
De otro lado, por la definición del ideal producto, el ideal i=1 (ni ) es el ideal generado por los
productos de los generadores y, por tanto, el ideal generado por N .
La última de las afirmaciones es consecuencia inmediata del apartado ii) del Teorema Chino
de los Restos.
Qr Efectivamente, si ni es una familia cuyos elementos son dos a dos co-maximales,
los ideales i=1 (ni ) y ∩ri=1 (ni ) han de coincidir y, por tanto, sus generadores son iguales (salvo
unidad en Z) por lo que podemos concluir que
r
Y
mcm(n1 , . . . , nr ) = ni ,
i=1
como se pretendı́a.
El Teorema Chino de los Restos sobre Z se convierte en el enunciado siguiente:

Teorema 5.3.2 (Teorema Chino de los Restos en Z). Sean dados n Q1r, . . . , nr números
enteros positivos de tal modo que gcd(ni , nj ) = 1 para todo i 6= j. Sea N := i=1 ni . Entonces,
la siguiente aplicación es un isomorfismo de anillos:
e : Z/ (N ) −→ Qr
Φ i=1 (Z/(ni ))
(5.3.1)
x + (N ) 7−→ (x + (n1 ), x + (n2 ), . . . , x + (nr )).
Demostración. Es una trasliteración del Teorema Chino de los Restos anterior.
5.3.1. En relación con el problema de Sun Tzu. Retomemos el enunciado:

Cuál es el número entero más pequeño tal que
f ≡ 2 mod 11, f ≡ 3 mod 5, f ≡ 2 mod 7?.
Nótese que 11, 5 y 7 son primos y, por tanto, co-maximales. Ahora se trata de hallar, conforme
a las ecuaciones (5.2.7) y (5.2.8) anteriores la siguiente información:
i) En primer lugar N := 7 · 5 · 11 = 385.
ii) En segundo lugar, los elementos z1 , z2 , z3 ∈ Z tales que (como en la prueba del Teorema
Chino de los Restos) se verifique:
Φ(z1 ) = e1 = (1 + (11), 0 + (5), 0 + (7)), Φ(z2 ) = e2 = (0 + (11), 1 + (5), 0 + (7)),
y
Φ(z3 ) = (0 + (11), 0 + (5), 1 + (7)).
Para ello, obsérvese (via la identidad de Bézout) que se tiene:
11 + (−2)5 = 1, (−2)7 + 3 · 5 = 1, 2 · 11 + (−3) · 7 = 1.
• Para z1 : elijamos x2 , x3 , y2 , y3 tales que x2 , x3 ∈ (11), y2 ∈ (5), y3 ∈ (7) y
x2 + y2 = 1, x3 + y3 = 1.
Es decir, x2 = 11, x3 = 2 · 11 = 22, y2 = (−2)5 = −10, y3 = (−3) · 7 = −21 y
Q3
definamos z1 := i=2 yi = (−10)(−21) = 210.
x01 + y10 = 1, x03 + y30 = 1.
Es decir, x01 = (−2)5 = −10, x03 = 3 · 5 = 15, y10 = 11, y30 = (−2)7 = −14 y
definamos z2 := y10 y30 = 11(−14) = −154.
x001 + y100 = 1, x002 + y200 = 1.
Es decir, x001 = (−3)·7 = −21, x002 = (−2)7 = −14, y100 = 2·11 = 22, y200 = 3·5 = 15
y definamos z3 := y100 y200 = 15 · 22 = 330.
Para mayor simplicidad podemos hacerlos todos positivos, reduciendo módulo N y
eligiendo:
z1 = 210, z2 = 231, z3 = 330.
iii) Con estos tres elementos y la fórmula (5.2.7) podemos hallar, dados x1 , x2 , x3 un
número x ∈ Z tal que
x mod (11) = x1 mod (11), x mod (5) = x2 mod (5), x mod (7) = x3 mod (7).
De hecho, tenemos que el número x1 z1 + x2 z2 + x3 z3 verificará:
Φ(x1 z1 + x2 z2 + x3 z3 ) = Φ(x1 )Φ(z1 ) + Φ(x2 )Φ(z2 ) + Φ(x3 )Φ(z3 ),
lo que es una formulación equivalente.
iv) Con los datos del enunciado del texto de Sun Tzu, tendemos que
z := 2 · 210 + 3 · 231 + 2 · 330 mod 385 = 233,
satisface los requerimientos (si no se ha traspapelado algún error de cálculo por en
medio).
5.3.2. En computación: cálculo del determinante por algoritmos modulares.
Una de las aplicaciones más importantes del Teorema Chino de los Restos sobre Z son los
algoritmos modulares, usados en la programación de paquetes de software simbólico comerciales
como Maple, Mathematica y otros. Aquı́ ejemplificamos esta estrategia con el ejemplo del
cálculo del determinante de una matriz A ∈ Mn (Z) con coordenadas enteras. El asunto es el
siguiente:
En el algoritmo de Gauss clásico, aprendido en las asignaturas básicas de Álgebra Lineal, se
produce un fenómeno singular con la concatenación de elecciones de pivotes. Si supongo que
todas las coordenadas de la matriz A = (ai,j )1≤i,j≤n original, verifican |ai,j | ≤ H, tras haber
elegido k pivotes, el tamaño de los números enteros que aparecen en la matriz es del orden
k
H 2 . Esto significa, por ejemplo, que para matrices de tamaño 200 × 200 no existen suficientes
electrones en el Universo para almacenar los dı́gitos de uno de esos números enteros a razón de
un dı́gito por electrón. Ni que decir tiene de la imposibilidad de manejar matrices razonables
en la práctica con tamaños del orden 1000 × 1000.
La conclusión es que el método de Gauss, tal y como se enseña, no sirve. Surgen ası́ diversas
alternativas. Algunas hacen modificaciones del algoritmo de Gauss (con búsquedas de otros
pivotes y otras operaciones, reduciendo a cada paso), otros se centran en algoritmos bien par-
alelizables (que evitan el crecimiento de los resultados intermedios a través de estructurar las
operaciones a realizar mediante grafos bien paralelizables). Una vı́a más son los Algoritmos
Modulares que vamos a describir, basándonos en el TCR anterior.
Comencemos recordando los rudimentos del Teorema de Gram-Schmidt.
Observación 5.3.3. Aunque parece que el método de cálculo de bases ortogonales ya era
conocido por Laplace y habı́a sido usado por Cauchy en 1836, se asigna este método a Jorgen
P. Gram y Erhardt Schmidt. El trabajo de E. Schmidt donde introdujo formalmente su método
de ortogonalización es [Schm, 1907]. Los trabajos de Gram (un matemático “amateur” danés)
son más difı́ciles de rastrear para mı́ y no he sido capaz de saber con certeza dónde publicó sus
resultados.
Algoritmo 5.3.4 (Gram -Schmidt). Sea v1 , . . . , vn una base ordenada de Rn . Definamos la
secuencia de vectores v1∗ , . . . , vn∗ siguiente:
v1∗ := v1
hv2 ,v1∗ i
v2∗ := v2 − µ2,1 v1∗ , µ2,1 = hv1∗ ,v1∗ i
(5.3.2) ..
.
Pi−1 hvi ,vj∗ i
vi∗ := vi − j=1 µi,j vj∗ , µi,j := hvj∗ ,vj∗ i
Teorema 5.3.5 (Teorema de Gram-Scmidt). En las notaciones anteriores, v1 , . . . , vn una

base de Rn . Sean v1∗ , . . . , vn∗ los vectores obtenidos tras aplicar Gram-Schmidt a esta base.
Entonces,
i) ||vi∗ || ≤ ||vi ||,
ii) hvi∗ , vj∗ i = 0, para todo i 6= j.
Demostración. Son meras comprobaciones, la segunda propiedad implicando la primera.

Continuaremos con un clásico, conocido como Desigualdad de Hadamard.
Proposición 5.3.6 (Desigualdad de Hadamard). Sea A ∈ Mn (C) una matriz con coorde-
nadas complejas. Sean v1 , . . . , vn ∈ Cn los vectores dados por sus columnas. Entonces,
n
Y
| det(A)| ≤ ||vi ||2 ,
i=
donde || · ||2 denota la norma hermı́tica usual en Cn .

Demostración. Para demostrar el resultado utilizaremos la ortogonalización de Gram-
Schmidt. Dicho procedimiento establece que si A es la matriz dada, existe una matriz triangular
superior, con solo 1’s en la diagonal principal P tal que
P A = A1 ,
donde los vectores dados como las columnas de A1 son precisamente la base ortogonal, asociada
a los vectores columna de A :
{v1∗ , . . . , vn∗ }.
Ahora consideramos la matriz de Wishart de A:
W (A) := A∗ A,
donde A∗ es la traspuesta conjugada. Adicionalmente, se tiene :
| det(A)|2 = det(W (A)) = det(AA∗ ).
Además,
hv1∗ , v1∗ i · · · hv1∗ , vn∗ i
 
det(A1 A∗1 ) = det  .. .. ..

.
 
. . .
∗ ∗ ∗ ∗
hvn , v1 i · · · hvn , vn i
Como hvi∗ , vj∗ i = 0 para i 6= j, tendremos
n
Y
| det(A1 )|2 = ||vi∗ ||2 .
i=1
Finalmente, usando la Proposición anterior,
n
Y n
Y
| det(A)|2 = | det(A1 )|2 = ||vi∗ ||2 ≤ ||vi ||2 .
i=1 i=1

Corolario 5.3.7. Sea A = (ai,j )1≤i,j≤n ∈ Mn (Z) una matriz con coordenadas enteras y
supongamos |ai,j | ≤ H. Entonces,
| det(A)| ≤ nn/2 H n .
Demostración. Baste con observar que si vi es la fila i−ésima de A, entonces
 
Xn
||vi ||22 =  |ai,j |2  ≤ nH 2 ,
j=1
con lo cual √
||vi ||2 ≤ nH,
y se sigue obviamente la desigualdad.
Definamos la siguiente transformación sobre las clases de restos módulo un entero M ∈ N,

M ≥ 2. Dado b ∈ {0, . . . , M − 1}, sea :
si 0 ≤ x ≤ b M

eb := b 2 c
b − M si b M
2 c < x ≤ M −1
Lema 5.3.8 (Lehmer). Con las notaciones precedentes, sean x ∈ Z y M ∈ N, M ≥ 2 tales que
2|x| ≤ M − 1. Sea a ∈ {0, . . . , M − 1} el resto de la división de x por M , i.e.
a := x mod M.
Entonces,
a = x.
e
Demostración. Es una mera comprobación a partir de las definiciones. La incluyo por
completitud. Dado x ∈ Z, con 2|x| ≤ M − 1, si x ≥ 0, tendremos
M −1 M
0≤x≤ < ,
2 2
luego a = x ∈ {0, 1, . . . , M − 1} y a ≤ b M
2 c, luego e
a = x, como se indica.
Supongamos que, por el contrario, x < 0. Tendremos que, tras la división euclı́dea, se dará la
siguiente igualdad con q ∈ Z: x = qM + a. Como a ≥ 0 y x < 0 se tendrá, necesariamente, que
q ≤ 0. De otro lado, 2|x| ≤ M − 1, implica que |x| = −x ≤ M2−1 , luego
M −1 M +1 M
M −1≥M +x≥M − ≥ > b c.
2 2 2
Para ver la última desigualdad, discutamos dos casos. Si M es par M = 2k, entonces k =
bM M
2 c = 2 y k <
M +1 M
2 . Si, por el contrario, M = 2k + 1 es impar, entonces k = b 2 c y
M +1
k+1= 2 .
Por tanto x = (−1)M + a , a := x mod M y
M
b c < a ≤ M − 1.
2
a = a − M = x y el resultado se sigue.
En conclusión e
Observación 5.3.9 (Primera aproximación modular). Est resultado ya bastarı́a para

poder diseñar un primer algoritmo por métodos modulares para el cálculo del determinante
de una matriz A ∈ Mn (Z) con control del crecimiento de los resultados intermedios.
Algoritmo 5.3.10.
Input: Una matriz M := (ai,j )1≤i,j≤n ∈ Mn (Z), tal que H := max{|ai,j | : 1 ≤ i, j ≤ n}.
Initialize: M := nn/2 H n + 1.
eval:
x := det(A) mod 2M ∈ Z/(2M )Z.
e ∈ Z.
Ouput: x
Este algoritmo usa número enteros cuyo tamaño máximo está acotado por el tamaño de 2M .
Esto significa que todas las operaciones se hacen en un anillo de restos Z/(2M )Z y el número
de bits de los números involucrados está limitado por
log2 (n)
log2 M + log2 (2) ≤ 2n( + log2 (H)) + 1.
2
Lo que sigue nos permitirá observar que incluso esta talla (que evita crecimientos desmesurados
de resultados intermedios) es excesiva y que se puede hacer trabajando con clases de restos
módulo enteros mucho más peque nos.
5.3.2.1. La Búsqueda de un Buen Número Primo. Comencemos con un somero recorda-

torio del Teorema de los Números Primos (véase, por ejemplo, el texto clásico de G.H. Hardy y
E.M. Wright, [Hardy-Wright, 1938]). Este Teorema fue postulado tanto por A.-M. Legendre
como por C.F. Gauss, a base de evidencia numérica y fue demostrado simultánea e independien-
temente por J. Hadamard y por Ch.-J. de la Vallée Poussin en 1896. Resultados más refinados
han sido logrados posteriormente. Por el momento, nos conformamos con versiones simples. Se
trata de unos de los grandes resultados en Teorı́a de Números. Una demostración puede verse
también en el texto de H. E. Rose ([Ro, 1994], capı́tulos 12 y 13).
Comencemos con un poco de notación :
Notación 5.3.11. • Dadas dos funciones f, g : R −→ R, escribiremos f ∈ θ(g) cuando
f (x)
limx→∞ =1
g(x)
Obsérvese que f ∈ θ(g) ⇐⇒ g ∈ θ(f ).
• Definamos la función π : N −→ N dada por π(x) es el cardinal del conjunto de números
primos p tales que 2 ≤ p ≤ x.
Teorema 5.3.12 (Teorema (de Densidad) de los Números Primos). En las anteriores
notaciones,
π ∈ θ(Li(x)),
donde donde Z x
dt
Li(x) := ,
2 ln(t)
donde ln se refiere al logaritmo neperiano. Además, se tiene que, para x ≥ 55,
x x
≥ π(x) ≥ .
ln(x) − 4 ln(x) + 2
Aunque hay acotaciones más finas, nos bastan. Ver una prueba de la desigualdad expuesta en
[Rosser, 1941].
5.3.2.2. Tests de Primalidad. Se trata de un problema clásico tanto en Matemáticas
como en Informática.
Problema Clásico 5.3.13 (PRIMES). Dado un número natural n ∈ N, decidir si n es primo.
El algoritmo más inmediato es el algoritmo conocido como Criba de Eratóstenes. El problema
es el tiempo
√ necesario para ejecutarlo. Ası́ para decidir si un número n es primo hay que
realizar n operaciones elementales (operaciones bit). Se dice que es un algoritmo exponencial
o ineficiente porque el número de operaciones a realizar depende esencialmente del número n y
no de su tamaño que es log(n).
Se conocen algoritmos aleatorios (probabilistas eficientes en tiempo logO(1) (n)) desde mediados
de los años 70. Se conocen también como algoritmos Monte Carlo para testar composición y
son altamente eficaces en la práctica. Su aparición histórica es debida a los tests de composición
en la clase RP como son:
• El test de R. Solovay y V. Strassen de 1977 (cf. [SoStr, 1977]). En la Subsección
6.2.4.4 de los Problemas, mostraremos la presentación de este algoritmo, basado fuerte-
mente en el sı́mbolo de Jacobi-Legendre y en la Ley de Reciprocidad Cuadrática.
• El test de M.O. Rabin y G. Miller (cf. [Milr, 1976] y [Rabin, 1980]). En la Sub-
sección 5.3.5.1 mostraremos este algoritmo descompuesto en una serie de problemas.
Posteriormente se obtienen resultados eficientes en el trabajo de M. Agrawal, N. Kayal y N.
Saxena (cf [AKS, 04]) muestran un algoritmo polinomial (en P, es decir en tiempo O(log9 (n))
) para decidir si un número natural dado es primo.
El algoritmo subyacente se basa en la idea siguiente :
Lema 5.3.14. Sea n ∈ N un número entero dado. Supongamos n > 2. Las siguientes
propiedades son equivalentes :
i) n ∈ N es un número primo.
ii) Para todo q, 1 ≤ q ≤ n − 1, se verifica :

n
=0 mod n.
q
iii) Para cada a ∈ {0, . . . , n − 1}, los siguientes polinomios son iguales en Z/nZ[X] :
n
X n − a = (X − a) en Z/nZ[X].
La clave de la prueba es la formulación del item iii). Se trata de verificar esta propiedad (que
no es sino una comparación de coeficientes entre dos polinomios de grado p) y para todos los
valores a ∈ {0, . . . , p−1}. Ası́ descrito el método propuesto por estos tres autores seguirı́a siendo
exponencial porque necesitarı́amos testar todos los coeficientes de O(p) polinomios de grado p.
El resultado principal de estos autores afirma que basta con hacer la comparación de O(log 2 p)
polinomios ( sólo valores pequeños de a) y que no es necesario hacer una comparación de todos
los coeficientes, sino una cantidad log O(1) p interpolaciones. No explicaremos más detalles y
orientamos al lector a la obra original, de sencilla lectura y, por ello, de gran creatividad.
5.3.2.3. Combinando el Teorema de Densidad y los Tests de Primalidad.
Proposición 5.3.15. Dados un número natural H ∈ N y un número s ∈ N, s ≥ 2, se pueden
hallar números naturales positivos n1 , . . . , nr verificando las siguientes propiedades:
i) El número de dı́gitos (talla bit, número de cifras) necesarios para representar el más
grande de estos números está acotado por 2(log2 (log2 (H)) + 1)s.
ii) La cantidad de números r es, a lo sumo 2 log(H).
iii) Los números n1 , . . . , nr son co-primos dos a dos.
iv) Se verifica la siguiente desigualdad:
r
Y
Hs ≤ ni .
i=1
El número de operaciones elementales (bit) necesarias para calcularlos está acotado por
O s log22 (s) log2 (H) + log22 (H) log22 (log2 (H)) .

Demostración. Elijamos un número entero positivo k ∈ N. Por el Teorema de Densidad

de los números primos, tenemos:
22k
2k ≤ ≤ π(22k ).
2k
Además, sean 2 := p1 ≤ p2 ≤ · · · ≤ p2k los números primos menores que 22k . Entonces,
k
2
2k
Y
2 ≤ pi .
i=1
Elijamos k := log2 (log2 (H)) + 1, tenemos r := 2k = 2 log2 (H) números primos distintos y,
claramente,
k
2
Y r
Y
H≤ pi = pi .
i=1 i=1
Más aún, el número primo pi más grande de esta lista, es de valor absoluto menor que 22k =
(2 log2 (H))2 y, por tanto, su tamaño en base 2 (tamaño bit) es, a lo sumo, 2(log2 (log2 (H)) + 1).
Para calcularlos, basta con hallar los primeros 2k números primos menores que 22k . Usando la
clásica Criba de Eratóstenes (sin mayor esfuerzo), el número de operaciones a realizar (escritura
2
de 1 a 22k , lectura y tachado) es del orden de 22k O(log2 k) . Nótese que el factor O(log2 k)
aparece por el esfuerzo de lectura de cada uno de los números de la lista. El cuadrado viene
porque hay que leer la lista entera cada vez que detectamos un nuervo número primo. Luego
el número total de operaciones realizadas está acotado por
2
(log2 (2H)O(log2 log2 H)) .
Finalmente, elijamos ni := psi , 1 ≤ i ≤ r . Claramente, son co-primos dos a dos, su tamaño
en base 2 (talla bit) está determinada por su logaritmo y está, por tanto, acotado por 2ks =
2(log2 (log2 (H)) + 1)s. El número de números obtenidos sigue siendo r y, obviamente, su pro-
ducto es mayor que H s . Para calcularlos, tenemos que realizar a lo sumo r log2 (s) multiplica-
ciones adicionales de números de tamaño acotado por s max{log2 (pi ) : 1 ≤ i ≤ r} ≤ s(2k). Us-
ando el reciente método de multiplicación de D. Harvey y J. an der Hoeven (cf. [HarvdH, 19]),
estas multiplicaciones pueden hacerse mediante el siguiente número de operaciones adicionales:
r log2 (s)O(s(2k) log2 (2ks)) ≤ (2 log2 (H)) log2 (s)O (s (2(log2 (log2 (H)) + 1)) (log2 (s) + log2 (2k))) .
Luego, con un número máximo de operacioens adicionales:
r log2 (s)O(s(2k) log2 (2ks)) ≤ O s log2 (H) log22 (s) + log22 (log2 (H)) .

En total, el número de operaciones bit a realizar está, por tanto, acotado por
2
(log2 (2H)O(log2 log2 H)) + O s log2 (H) log22 (s) + log22 (log2 (H)) ,

Y, por tanto, acotado por

O s log22 (s) log2 (H) + log22 (H) log22 (log2 (H))

.

5.3.2.4. La Estrategia Final. Consideremos el siguiente algoritmo:
Algoritmo 5.3.16 (Determinante modular en Z).
Input: A := (ai,j )1≤i,j≤n ∈ Mn (Z) y H tal que |ai,j | ≤ H = 2h .

% Por tanto, por la Desigualdad de Hadamard (Corolario 5.3.7): | det(A)| ≤ (nH)n
Hallar (como el la Proposición 5.3.15) números enteros n1 := pn1 , . . . , nr := pnr con r =

2 log2 (3nH) = 2(h + log2 n + log2 (3)) tales que
Qr
• N := i=1 ni ≥ 3(nH)n ≥ 2| det(A)| + 1,
• gcd(ni , nj ) = 1, para todos i 6= j.
% El número más grande de esa lista es de tama~
no (número de dı́gitos) acotado por
2 log2 (log2 ((3nH)n ) ≤ 2(log2 (n log2 (3nH))) ≤ 2(log2 (n) + log2 (log2 (n) + log2 (H) + log2 (3)),
o, equivalentemente, tiene talla bit acotada por:
O(log2 (n) + log2 (log2 (H)) + log2 (log2 (n))).
Hallar: di := det(A) mod ni , para cada i, 1 ≤ i ≤ r.
Aplicar el Teorema Chino de los Restos, para hallar

D e −1 (d1 + (n1 ), d2 + (n2 ), . . . , dr + (nr )).
mod N := Φ
% Usar el Problema 191
Aplicar el Lema 5.3.8 anterior:

Ouput: De ∈Z
end
El resultado final serı́a el siguiente: Consideremos la siguiente notación (conocida como Big-O-
tilde o Landau-Big-O) :
g ∈ Oe(f ) ⇔ ∃k ∈ N, g ∈ O(f logk2 (f )).
Es decir “olvida” factores poli-logarı́micos por simplicidad de la escritura y teniendo en cuenta
que logk (n) tiene menor crecimiento que n para cualquier ε > 0.
Teorema 5.3.17. Aplicando técnicas modulares al cálculo del determinante podemos concluir :
El determinante de una matriz A ∈ Mn (Z) cuyos coeficientes tienen tamaño (logarı́tmo en base
2) acotado por h se puede calcular en tiempo
Oe(n3 h2 ).
Además, todos los cálculos se realizan en anillos de la forma Z/pZ, donde la talla bit de p está
acotada por:
O(log2 (n) + log2 (log2 (H)) + log2 (log2 (n))).
Demostración. Para calcular los números n1 , . . . , nr requeriremos un tiempo del orden:
O n log22 (n)(log2 (h) + log2 (n)) + (log2 (h) + log2 (n))2 log22 (log2 (h) + log2 (n))) .

Lo que, en notación Big-O de Landau, queda resumido en Oe(n log22 (h)). Ahora, para cada i,
debemos calcular en determinante de A módulo ni . Para cada i esto se puede realizar en O(n3 )
operaciones aritméticas (y divisiones euclı́deas) usando números enteros de tamaño acotado por
el tamaño de ni que, a su vez, está acotado por O(log2 (n) + log2 (log2 (H)) + log2 (log2 (n))) =
Oe(log2 (n) + log2 (h)), olvidando términos del tipo log2 (log2 (n)).
Por tanto, el tiempo requerido para la ejecución de esta parte del algoritmo está acotada
por el tiempo requerido en calcular del determinante usando O(n3 ) operaciones aritméticas
con números de tamaños acotados por lo indicado anteriormente. Esto da una cota del tipo
siguiente asumiendo el algoritmo escolar sobre Z/ni Z:
Oe(n3 (log2 (n) + log2 (h))2 ).
Como r ∈ O(h + log2 (n)), el coste del cálculo de todos los restos en todos los Z/nZ condiere a
una acotación del tipo:
Oe(n3 log22 (n) + h log22 (h)).
Finalmente, siguiendo el problema Problema 191, tenemos que aplicar el algorimo de Eu-
clides con números enteros acotados (en valor absoluto) por 3(nH)n r veces. Se trata de
rO(n(log2 (H) + log2 (n))) = O(rn(h + log2 (n))) divisiones euclı́deas. Como r = 2 log2 (3nH) =
2(h + log2 n + log2 (3)) = O(h + log2 (n)), se trata de realizar Oe(nh2 ) divisiones euclı́deas
de enteros de tamaños acotados por O(n(h + log2 (n))). Esto puede realizarse en un número
de operaciones bit acotadas por Oe(n3 h2 ). Dado que la operación de Lehmer final es lineal en
O(n(h+log2 (n))), el tiempo final para calcular un determinante por este método estará acotado
por
Oe(n3 h2 ).

Debe señalarse que se han usado los algoritmos más “escolares” tanto para el cálculo del deter-
minante módulo ni como para la división euclı́dea. La cota es obviamente refinable por diversas
técnicas; pero no modifica lo esencial de la estrategia: se hacen del orden de O(n3 ) operaciones
aritméticas con números enteros (modulares) de tamaño muy controlado.
5.3.3. Secretos compartidos. Una de las aplicaciones estándar del Teorema Chino de
los Restos es el sistema de compartimentar la información llamado Secretos Compartidos (del
inglés “secret sharing”) y que se usa, por ejemplo, en los cajeros automáticos. Se trata de lo
siguiente : se dispone de una información codificada en un número entero n ∈ N. Ahora se
eligen r personas distintas, cada una de las cuales lleva asociado un módulo mi . Suponemos
que los módulos mi y mj son dos a dos comaximales. Ahora se entrega a cada persona la
información rem(n, mi ). Para poder recuperar la información inicial es necesario que todas
las personas estén dispuestas a aportar su información y ejecutar el algoritmo subyacente al
Teorema Chino de los Restos. Por ejemplo, el cajero (la máquina) posee posee una parte del
código de autorización de una cuenta/tarjeta y el propietario de la tarjeta una segunda parte:
su código personal PIN.
5.3.4. Grupos abelianos finitamente generados: estructura, divisores elemen-

tales.
Teorema 5.3.18 (3er. Teorema de Estructura de módulos finitamente generados
sobre un DIP). Sea R un dominio de ideales principales. Para cada R−módulo finitamente
generado M existen los siguientes elementos (asociados a M ):
i) Un R−módulo libre de rango finito F ∼= Rn .
ii) Una familia finita de elementos irreducibles, co-maximales dos a dos, p1 , . . . , pr ∈ R.
iii) Una matriz de números naturales
N := (ai,j )1≤i≤r,1≤j≤m ,
tales que para cada i, 1 ≤ i ≤ r, se tiene
ai,1 ≥ ai,2 ≥ · · · ≥ ai,m ≥ 0,
de tal modo que hay un isomorfismo de R−módulos:
  
r
a
M∼
Y Y
=F ⊕  R/pi i,j R ,
i=1 j=1
a
donde, en el caso de que qi,j = = p0i = 1 ∈ R, se sobreentiende que R/qi,j R = 0 es el
pi i,j
R−módulo nulo.
Además, los elementos descritos en la lista i), ii) y iii) anterior son únicos salvo permutaciones
a
y unidades en R. A los elementos {qi,j := pi i,j : 1 ≤ i ≤ r, 1 ≤ j ≤ m} se les denominan los
divisores elementales (de la torsión) del R−módulo M .
Demostración. Retomamos el Segundo Teorema de Estructura de R−módulos sobre un
dominio de ideales principales (Teorema 4.6.5 anterior). Por ese teorema sabemos que M es
isoformo a
M∼ = Rn ⊕ T orR (M ),
donde T orR (M ) son los elementos de torsión de M , i.e.
T orR (M ) := {m ∈ M : AnnR (m) 6= (0)}.
Además, existen d1 , . . . , dm ∈ R verificando di+1 | di y se tiene:
m
Y
T orR (M ) := (R/di R) .
i=1
Luego
m
!
M∼
Y
(5.3.3) = Rn ⊕ (R/di R) .
i=1
Además, los elementos d1 , . . . , dm son únicos (salvo unidades en R) y se denominaban factores

invariantes del módulo M . Ahora observemos los siguiente: como di+1 | di , entonces los factores
irreducibles de di+1 son algunos de los factores irreducibles de di y, en caso de que un factor
irreducible aparezca en ambos, la multiplicidad (el exponente) que aparece en di+1 tiene que
ser menor que la multiplicidad en di . En otras palabras y más formalmente. Consideremos una
factorización de d1 como la siguiente:
Yr
d1 = pα
i .
i
i=1
Escribamos a1,j := αj . Ahora, como dj | d1 para cada j ≥ 2, los factores irreducibles de dj

tienen que estar asociados con alguno de los de d1 y su multiplicidad tiene que ser menor que
la que aparece en d1 . Es decir, para cada j ≥ 2, existe una unidad uj ∈ R y existen exponentes
aj,1 , . . . , aj,r tales que
r
a
Y
dj := uj pi i,j .
i=1
Como dj+1 | dj es claro que necesariamente, los exponentes de los factores pi disminuyen cuando
crece el sub-ı́ndice. Es decir, necesariamente ai,j ≥ ai,j+1 para cada i, 1 ≤ i ≤ r y 1 ≤ j ≤ m,
incluyendo los casos en los que ai,j = 0 que significará que ai,t = 0, para cada t ≥ j. Tenemos ası́
los elementos descritos en las propiedades i), ii) y iii) del enunciado. Para concluir, baste con
utilizar el Teorema Chino de los Restos precedente (Teorema 5.2.2). Para cada j, 1 ≤ j ≤ m,
tenemos un isomorfismo de anillos
Y
ϕj : R/dj R −→ (R/qi,j R) ,
ai,j 6=0
a Q
donde qi,j = pi i,j . Nótese que hemos escrito ai,j 6=0 porque los primos pi que tengan exponente
nulo no aparecen en el cociente como anillo (no tiene unidad el cociente R/qi,j R = R/R = 0). Es
un ejercicio de fácil verificación el observar que los morfismo de anillo ϕ del Teorema 5.2.2 son,
en este caso, morfismo de R−módulos. Como añadir la suma directa de copias del R−módulo
0, no cambia el R−módulo, tenemos también un isomorfismo de R−módulos
 
Y Y Y r
ϕj : R/dj R −→ (R/qi,j R) ⊕  {0} = R/qi,j R,
ai,j 6=0 ai,j =0 i=1
a
donde qi,j := pi i,j . Reintegrando estos isomorfismos de R−módulos, tenemos un isomorfismo
de R−módulos
r m m r
!
ai,j
Y Y Y Y
ϕ := ϕj : (R/dj R) −→ R/pi R .
i=1 j=1 j=1 i=1
Finalmente re-integrando este isomorfismo en el isomorfismo (5.3.3) concluimos el enunciado

del Teorema:
 !   
m r r m
a a
M∼ R/pi i,j R  ∼
Y Y Y Y
= Rn ⊕  = Rn ⊕   R/pi i,j R .
j=1 i=1 i=1 j=1
El caso particular de grupos abelianos se sigue de manera obvia:
Corolario 5.3.19 (3er. Teorema de Estructura de módulos finitamente generados

sobre un DIP). Para cada grupos abeliano finitamente generado M existen los siguientes
elementos (asociados a M ):
i) Un Z−módulo libre de rango finito F ∼ = Zn .
ii) Una familia finita de enteros irreducibles, co-maximales dos a dos, p1 , . . . , pr ∈ Z.
iii) Una matriz de números naturales
N := (ai,j )1≤i≤r,1≤j≤m ,
tales que para cada i, 1 ≤ i ≤ r, se tiene
ai,1 ≥ ai,2 ≥ · · · ≥ ai,m ≥ 0,
de tal modo que hay un isomorfismo de grupos abelianos:

  
r
a
M∼
Y Y
=F ⊕  Z/pi i,j Z ,
i=1 j=1
a
donde, en el caso de que qi,j = pi i,j = p0i = 1 ∈ Z, se sobreentiende que Z/qi,j Z = 0 es el
Z−módulo (o grupo abeliano) nulo.
Además, los elementos descritos en la lista i), ii) y iii) anterior son únicos salvo permutaciones
a
y unidades en Z. A los elementos {qi,j := pi i,j : 1 ≤ i ≤ r, 1 ≤ j ≤ m} se les denominan los
divisores elementales (de la torsión) del grupo abeliano G.

Problema 191 (Versión Eficiente del TCR en Z). Supongamos dados números naturales
no nulos co-primos dos a dos {ai : 1 ≤ i ≤ m} ⊆ \{0}. Supongamos dada una secuencia de
restos modulares
x1 mod a1 , . . . , xm mod am .
Qm
Definamos M := i=1 ai y definamos:
M
Mi := , 1 ≤ i ≤ m.
ai
Probar:
i) Los enteros Mi y ai son co-primos dos a dos (i.e. gcd(Mi , ai ) = 1). Pruébese que,
entonces, existe hi ∈ Z tal que Mi hi = 1 mod ai .
ii) Sea x ∈ Z el número entero dado por la siguiente igualdad:
m
X
x= (Mi hi xi ) .
i=1
Probar que si ϕ es el isomorfismo del Teorema Chino de los Restos, se tiene:

ϕ(x + M Z) = (x1 + a1 Z, . . . , xm + am Z).
iii) Probar que estas afirmaciones son válidas sobre todo dominio de ideales principales.
Problema 192. Hallar el entero positivo más pequeño tal que al dividirlo por 10, 17, y 19 da
restos 8, 11, y 14 respectivamente.
Problema 193. Supongamos que creamos un banco nuevo en el que aspiramos a que el número
de cuentas bancarias sea como mucho:
9.699.690.000 = 24 · 54 · 3 · 7 · 11 · 13 · 17 · 19.
Asociamos a cada cliente un número de cuenta PAN (Personal Account Number) entre 0 y este
número. Además, a cada cliente le reglamos una tarjeta de crédito que llevará asociado un
PIN (Personal Identification Number) a elección del usuario con 4 dı́gitos (es decir, un número
menor que 104 ). Por su parte, la tarjeta debe tener asignado un número CCN (Credit Card
Number) menor que 969.969. Proponemos un sistema de seguridad basado en el Teorema Chino
de los Restos. Se pide:
i) Si un usuario tiene una cuenta con PAN=400.022. ¿Cuál ha de ser su PIN? y ¿cuál
ha de ser su CCN? con este esquema basado en TCR.
ii) Si un usuario nos pide por teléfono que su PIN sea PIN=2345, ¿Cuántas posibles
CCN le podrı́amos asignar a su tarjeta?
iii) En el caso inmediato anterior, ¿Es posible que la petición de PIN de un usuario, cuyo
PAN ya ha sido fijado, sea imposible?. ¿Cómo sugieres corregir ese efecto?.
Problema 194. Busca en internet uno de los Tests de Primalidad citados. Describe en qué
consiste el agoritmo que has elegido y aplı́calo a 4 números enteros de tu elección con, al menos,
4 dı́gitos cada uno. Explica los resultados de tu experimento.
Problema 195. Busca en internet el sistema criptográfico RSA (de Rivest, Shamir y Adle-
mann). Explica su funcionamiento, demuestra la veracidad de su funcionamiento, genera una
clave pública propia y comprueba su funcionamiento encriptando y desencriptando mensajes.
Haz lo mismo con mensajes firmados, generando dos usuarios con dos claves públicas.
Problema 196. Busca en wikipedia que es el sistema de seguridad TLS1 y explica cuál es su
relación con alguno de los contenidos anteriores. Abre tu navegador usual y trata de obtener
información sobre los protocolos de seguridad que se usan en conexión con una u otra página
web. Encuentra alguno que use TLS. Busca otras aplicaciones de esta versión del Teorema
Chino de los Restos.
1http://en.wikipedia.org/wiki/Transport_Layer_Security
5.3.5.1. El Test de G. Miller y M.O. Rabin. Vamos a trabajar en esta serie de prob-
lemas el test de M.O. Rabin y G. Miller entre 1976 y 1980 (cf. [Milr, 1976] y [Rabin, 1980]).
Se trata del segundo test de primalidad probabilista (o, para ser exactos, el segundo test de
composición probabilista) de la literatura matemática. Originariamente fue presentado por G.
Miller bajo la hipótesis de Riemann y, posteriormente, M.O. Rabin demostró que la hipótesis
de Riemann no era necesaria. El algoritmo hace uso intenso del Teorema Pequeño de Fermat y
la función de Euler (véase la Subsección de Problemas 3.6.5.3).
Problema 197. Para n ∈ N, sea 1 ≤ d ≤ n − 1, definamos el grupo de las raı́ces d−ésimas de
la unidad módulo n como:
K(d) := {a ∈ {1, . . . , n − 1} : ad − 1 = 0(mod n)}
Pruébese que para cada n ∈ N, K(d) es un subgrupo del grupo de las unidades (Z/nZ)× . En
particular, ](K(n − 1)) | ](Z/nZ)× y se tiene:
](K(n − 1)) | ϕ(n)
Algoritmo 5.3.20 (Test de Composición de Miller-Rabin).
Input n ∈ 2N + 1
compute ` tal que n − 1 = 2` m, m impar.
guess randomly a ∈ {1, . . . , n − 1}
compute am mod n
if am = 1 mod n, aceptar, Output Probablemente primo.
2 `
else compute am mod n, a2m mod n, a2 m mod n, . . . , a2 m mod n
n−1
if a 6= 1 mod n, aceptar y Output Compuesto.
k
else encontrar el mayor k such that a2 m 6= 1 mod n
k
if a2 m = −1 mod n, aceptar, Output Probablemente primo.
else Output Compuesto.
fi
fi
fi
end
Problema 198. Pruébese que si n ∈ N es un número primo impar, el anterior procedimiento

siempre responde Probablemente primo.
Problema 199. Pruébese que si n ∈ N un número compuesto que no es un número de
Carmichael (cf. Problema 150 anterior para la noción de número de Carmichael), el algo-
ritmo de Miller-Rabin responder compuesto con probabilidad > 1/2.
Problema 200. Con las notaciones de los problemas precdente, fijado n ∈ N definamos:
d−1
[
R(d) := ](K(d) \ K(i)).
i=1
Pruébese que si n es un número primo, se tienen las propiedades siguientes :
i) R(d) = 0 si d 6 | n − 1,
ii) R(d) ≤ ϕ(d),
Pn−1
iii) d=1 R(d) = n − 1
(Hint: Úsense también los Problemas de la Subsección 3.6.5.3).
Problema 201. Pruébese que las potencias de primos no son números de Carmichael.
Problema 202. Pruébese que si p es un número primo impar, el anillo
Z/pd Z,
tiene exactamente dos raı́ces cuadradas de la unidad. Son exactamnente las clases módulo pd
de los enteros {1, −1}.
Problema 203. Pruébese que si c, d ∈ N son dos enteros coprimos c, d ≤ n − 1, se tiene :

K(cd) ∼
= K(c) × K(d).
αk
Problema 204. Sea n ∈ N un número compuesto impar, supongamos n = pα
1 · · · pk , con
1
p1 , . . . , pk números primos distintos. Entonces, pruébese que

Z/nZ ∼
= (Z/pα
αk
1 Z) × · · · × (Z/pk Z)
1
es un isomorfismo de anillos. Además, el número de raı́ces cuadradas de la unidad en Z/nZ es

exactamente 2k .
Problema 205. Comencemos construyendo una estructura de grafo orientado cobre K(2` ).
Para cada número natural impar se tiene :
K(n − 1) ∼
= K(2` ) × K(m)
con ` maximal. Luego K(2` ) es la parte dominante del algoritmo. La clase de aristas en el
grafo será la siguiente :
E := {(a2 , a) : a ∈ K(2` )}
Esto genera una estructura del tipo siguiente :
{1}
.↓&
{−1} {w} {−w} ···
.. .. ..
. . .
Nótese que los elementos de profundidad i dentro del grafo son, justamente, las raı́ces primitivas
i−ésimas de la unidad.
Para cada elemento x ∈ K(2` ), denotamos por Tx el árbol formado por sus sucesores, es decir,
por sus raı́ces cuadradas y las raı́ces cuadradas de sus raı́ces cuadradas, etc. Formalmente,
k
Tx := {a ∈ K(2` ) : ∃k, a2 = x mod n}.
Con las anteriores notaciones, pruébese :
i) Se da la siguiente igualdad:
 
[ [ [
K(2` ) = T1 = {1} T−1  Tω  .
ω 2 =1,ω6=−1
ii) Dados ω, ω 0 ∈ K(2` ) \ {1}, tales que ω 2 = 1 mod n, (ω 0 )2 = 1 mod n y ω 6= ω 0 ,

entonces,
\
Tω Tω0 = ∅.
En particular, pruébese que
X
](K(2` )) = 1 + ](T−1 ) + ](Tω ).
ω 2 =1,ω6=−1
Problema 206. Sea ω ∈ K(2` ) una raı́z cuadrada de la unidad distinta de la unidad (i.e.
ω 2 = 1 mod n y ω 6= 1). Definamos el conjunto :
k
Tω,k := {a ∈ (Z/nZ)× : a2 = x mod n, `(a) = k}.
Pruébese, que, con estas notaciones, la siguiente es una descomposición como unión disjunta
de Tω :
[
Tω := Tω,k .
k≥0
Pruébese que, en particular,

X
](Tω ) = ](Tω,k ).
k≥0
Problema 207. Con las notaciones del problema prcedente, para cada ω ∈ K(2` ) una raı́z
cuadrada de la unidad distinta de la unidad (i.e. ω 2 = 1 mod n y ω 6= 1), definamos :
L(ω) := max {k : Tω,k 6= ∅}.
En otras palabras, L(ω) = k si y solamente si existe x ∈ Tω con `(x) = k y no hay ningún
y ∈ Tω con `(ω) > k. Con estas notaciones, pruébese que para cada ω ∈ K(2` ) una raı́z
cuadrada de la unidad distinta de la unidad (i.e. ω 2 = 1 mod n y ω 6= 1), se tiene :
L(ω)
X
](Tω ) = ](Tω,k ).
k=0
Problema 208. Con las anteriores notaciones, pruébense las siguientes propiedades:
i) Para cada raı́z cuadrada de la unidad ω 2 = 1, con ω 6= 1 t para cada k ≤ L(ω), si
Tω,k 6= ∅, se tiene :
](Tω,k ) = ](K(2k )).
ii) Con las notaciones del apartado i), se tiene que si Tω,k 6= ∅, para algún k, entonces,
Tω,j 6= ∅, para todo j < k.
iii) Finalmente, L(−1) ≤ L(ω) para todo ω tal que ω 2 = 1 mod n, ω 6= 1, −1 mod n.
En particular, pruébese que se tiene:
L(−1) L(−1) L(ω)
X X X
](T−1 ) := ](T−1,k ) = ](Tω,k ) ≤ ](Tω,k ) = ](Tω ).
k=0 k=1 k=1
Problema 209. Pruébese que si n ∈ N es un número de Carmichael impar, que no es un

número primo, el algoritmo de Miller-Rabin responde Probablemente primo con probabilidad
menor estricto que 1/2. (Hint: Nótese que el algoritmo sólo responde Probablemente primo
si hemos elegido un valor a ∈ {1, . . . , n − 1}, a ∈ (Z/nZ)× . Por ser compuesto, considerar
A := {1, . . . , n − 1} \ (Z/nZ)× 6= ∅ y la cantidad t := ](A)
n−1 > 0. Dado que n es un número de
Carmichael, tenemos el isomorfismo :
ϕ: (Z/nZ)× = K(n − 1) −→ K(2` ) × K(m)
`
a 7−→ (am , a2 ).
Por tanto, el algoritmo responde Probablemente primo solamente si
am = 1 (mod n)
o si
k
∃k, (am )2 = −1 (mod N )
En otros términos, responde Probablemente primo, solamente si
a ∈ K(m) o am ∈ T−1 .
Controlando los cardinales con las estimaciones precedentes, la probabilidad de error estará
acotada estrictamente por 1/2).
Problema 210 (Test de Miller-Rabin). Con los resultados precedentes, pruébense las sigu-
ientes afirmaciones:
i) Si el algoritmo responde Compuesto, el input n ∈ N es un número compuesto.
ii) Si n ∈ N es un número primo impar, el algoritmo siempre produce Probablemente
primo.
iii) Si n ∈ N es un número compuesto, el algoritmo produce Compuesto con probabilidad
≥ 1/2.
iv) El número de operaciones aritméticas realizadas es polinomial en el número de dı́gitos
de n (O(log2 (n))) y en k. Además, los enteros más grandes involucrados son de talla
acotada por O(log2 (n))
De nuevo, se trata de un algoritmo de tipo MonteCarlo (y, al ejecutarse en tiempo
polinomial se denotan como la clase RP (random polynomial time)) En este caso, es un test
de Composición y no un test de primalidad (dado que la seguridad en la respuesta está del
lado de los número compuestos). Una manera alternativa de presentarlo consiste en decir que
Primes está en co-RP.
5.4. FORMA DE JORDAN 275
5.4. El Teorema Chino de los Restos en el caso R := K[X]: Forma de Jordan.

En la Sección 4.7 y en la Subsección de problemas 4.7.2, hemos dado dos demostraciones equiv-
alentes de que todo endomorfismo es semejante a la suma diagonal de las matrices compañeras
de sus factores invariantes, que culmina en el Teorema 4.7.9. Nuestro propı́sto en esta Sección
es avanzar un poco más en las presentaciones simplificadas de los endomorfismos: la forma
canónica de Jordan de un endomorfismo. Aprovecharemos la existencia de esa representación
para presentar un algoritmo de cálculo del máximo común divisor de dos polinomios en K[X]
que minimiza la dimensión del Álgebra Lineal involucrada hasta, justamente, trabajar con ma-
trices r × r, donde r es el grado del máximo común divisor. De hecho, probamos que el máximo
común divisor de dos polinomios es el polinomio caracterı́stico de una matriz contsryida a partir
de los dos polinomios dados.
5.4.1. La forma canónica de Jordan: divisores elementales en K[X]. Camille
Jordan introduce su forma canónica en su texto de 667 páginas [Jordan, 1870]. Este tratado es
un estudio completo de la teorı́a de E. Galois, resolución de ecuaciones polinomiales univariadas,
teorı́a de grupos y, en particular, contiene la forma canónica de Jordan (que lo hizo sólo para un
cuerpo finito, llamados “cuerpos de Galois” (ver Problema 79, por ejemplo)). El texto, usado
en la École Polytechnique, recibió en Premio Poncelet de la Academia de Ciencias de Parı́s.
Ahora vamos a intentar hacerlo, recuperando su formalismo original.
Proposición 5.4.1. Sea ζ ∈ K un elemento en un cuerpo K y consideremos el polinomio
mónico f = (X − ζ)n . Consideremos el anillo cociente K[X]/(f ). Se tiene:
i) La siguiente colección es una base de K[X]/(f ) como K− espacio vectorial, a la que
llamaremos base monomial en ζ de K[X]/(f ):
(n)
βζ := {1 + (f ), (X − ζ) + (f ), . . . , (X − ζ)n−1 + (f )}.
ii) La matriz en la base βζ de la homotecia ηX es, justamente, la caja de Jordan de orden
n y valor “propio” ζ. Es decir, la matriz J(ζ, n) ∈ Mn (K) dada mediante:
 
ζ 0 0 ··· 0 0
1 ζ 0 · · · 0 0
 
J(ζ, n) := 0 1 ζ · · · 0 0 .
 
 .. .. . . . .
. . .. 
. . . 
0 0 0 ··· 1 ζ
A la matriz J(ζ, n) se la denomina caja de Jordan de orden n en honor del matemático
C. Jordan. .
Demostración. La demostración de i) más “natural” pasa por usar el desarrollo de Tay-
lor en ζ de los polinomios. Expresamos ese noción del modo siguiente:
Dado cualquier polinomio univariado g ∈ K[X], de grado n, existen elementos únicos a0 , a1 , . . . , an ∈
K tales que
g = an (X − ζ)n + an−1 (X − ζ)n−1 + · · · a1 (X − ζ) + a0 .
Para ello, consideramos la siguiente transformación en K[X]:
Tζ : K[X] −→ K[X]
g 7−→ Tζ (g) := g(X + ζ).
Es claro que Tζ es un isomorfismo de anillos cuyo inverso es T−ζ . Más aún, deg(Tζ (g)) = deg(g),
para cualquier g ∈ K[X]. Ahora bien, si g es un polinomio de grado n, entonces h(X) = Tζ (g) =
g(X + ζ) es un polinomio de grado n en K[X]. Por tanto, existen a0 , . . . , an ∈ K tales que
h = an X n + · · · a1 X + a0 .
Por tanto,
g = T−ζ (h) = T−ζ (Tζ (g)) = an (X − ζ)n + · · · + a1 (X − ζ) + a0 ,
y tenemos probada la afirmación. La u8nicidad se sigue de la unicidad de los coeficientes de
h = Tζ (g).
En particular, para la afirmación i), los restos en K[X]/(f ) se escriben de manera única como
(n)
combinación lineal de los elementos de la base βζ y tenemos que es sistema generador. Dado
(n)
que βζ es de cardinal n, y n es la dimensión de K[X]/(f ), tenemos que es base.
Para la afirmación ii), observemos la siguiente cadena:
ηX (1 + (f )) = ((X − ζ) + (f )) + ζ (1 + (f )) = v2 + ζv1
ηX ((X − ζ) + (f )) = (X − ζ)2 + (f ) + ζ ((X − ζ) + (f )) = v3 + ζv2
ηX (X − ζ)2 + (f ) = (X − ζ)3 + (f ) + ζ (X − ζ)2 + (f ) = v4 + ζv3
.. ..
. .
ηX (X − ζ)n−1 + (f ) = ((X − ζ)n + (f )) + ζ (X − ζ)n−1 + (f ) = 0 + ζvn−1 ,
(n)
donde hemos escrito βζ := {v1 , v2 , . . . , vn } y vi := (X − ζ)i−1 + (f ), para 1 ≤ i ≤ n. Esta
(n)
cadena de igualdades justifica que la matriz de ζX en la base βζ sea justamente la “caja” de
Jordan J(ζ, n).
Estamos ya en condiciones de justificar una primera interpretación del Teorema Chino de los
Restos en el caso de polinomios mónicos que se descomponen completamente sobre un cuerpo
K.
Proposición 5.4.2. Sea f ∈ K[X] un polinomio mónico de grado n y supongamos que existen
ζ1 , . . . , ζr ∈ K, con ζi 6= ζj , y exponentes mi ∈ N, con mi ≥ 1, 1 ≤ i ≤ r, tales que:
r
Y
f (X) := (X − ζi )mi .
i=1
Consideremos:
• Sea Φe : K[X]/(f ) −→ Qr (K[X]/(X − ζi )mi ) el isomorfismo de anillos del Teo-
i=1
rema Chino de los Restos. Entonces, Φ e es también un isomorfismo de K−espacios
vectoriales.
• En K[X]/(f ) la base monomial βQ:= {1 + (f ), X + (f ), X 2 + (f ), . . . , X n−1 + (f )}.
r
• En el espacio vectorial producto i=1 (K[X]/(X − ζi )mi ), la base Γ inducida por las
(m )
bases βζi i en cada uno de los espacios vectoriales K[X]/(X − ζi )mi .
• Y sea MΦ la matriz del isomorfismo Φ e en las bases β y Γ.
Entonces, se tiene:
 
J(ζ1 , m1 ) 0 ··· 0
 0 J(ζ 2 , m2 ) ··· 0 
C(f ) := MΦ−1   MΦ .
 
.. . .. .. ..
 . . . 
0 0 ··· J(ζr , mr )
En paricular, C(f ) posee forma canónica de Jordan, ésta es única (salvo permutación de los
bloques) y la matriz de cambio de base es la matriz del Teorema Chino de los Restos.
Demostración. Obsérvese que si ζi 6= ζj , entonces, (X −ζi )k y (X −ζj )s son co-maximales
para k, s ≥ 1. Por tanto, el hecho de ser Φ
e un isomorfismo se sigue del Teorema Chino de los
Restos. De otro lado, tenemos el siguiente diagrama conmutativo:
Φ
e
Qr
K[X]/(f ) −→ i=1 (K[X]/(X − ζi )mi )
Qr (i)
ηX ↓ ↓ i=1 ηX
Qr mi
K[X]/(f ) −→ i=1 (K[X]/(X − ζi ) )
Φe
Qr (i)
Este diagrama es conmutativo, donde i=1 ηX es el endomorfismo dado mediante el producto
de los endomorfimos
(i)
ηX : K[X]/(X − ζi )mi −→ K[X]/(X − ζi )mi .
La conmutatividad del diagrama nos dice que

r
!
(i)
Y
e −1 ◦
ηX = Φ ηX ◦ Φ.
e
i=1
Por lo visto anteriormente, MX = C(f ) es la matrix de la homotecia ηX en la base β.

(i) (i) (m )
De otro lado, M (ηX ) = J(ζi , mi ) es la matriz de ηX cuando se considera la base βζi i en
K[X]/(X − ζi )mi .
Qr (i)
En particular, la matriz M ( i=1 ηX ) en la base producto es la suma diagonal de las matrices
(i)
M (ηX ), es decir,
 
J(ζ1 , m1 ) 0 ··· 0
r  0 J(ζ2 , m2 ) · · · 0 
(i)
Y
M ( ηX ) =  .
 
.. . .. . .. .
..
i=1
 . 
0 0 ··· J(ζr , mr )
Traduciendo la conmutatividad del diagrama a matrices, esto significa
r
!
(i)
Y
−1
M (ηX ) = M (Φ) ◦ M
e η ◦ M (Φ),
X
e
i=1
es decir
 
J(ζ1 , m1 ) 0 ··· 0
 0 J(ζ2 , m2 ) · · · 0 
C(f ) = MΦ−1   MΦ ,
 
.. .. .. ..
 . . . . 
0 0 ··· J(ζr , mr )
que es la propiedad buscada.
Teorema 5.4.3 (Existencia de Forma canónica de Jordan de un enfomorfismo de

espacios vectoriales). Sea K un cuerpo y M ∈ Mn (K) una matrix cuadrada. Supongamos
que todas las raı́ces del polinomio caracterı́stico χM (X) ∈ K[X] están en K (i.e. que χM se
escinde completamente en K). Entonces, existen Jord(M ) una suma de diagonal de cajas de
Jordan con coordenadas en K y una matriz regular P ∈ GL(n, K) de tal modo que
M = P Jord(M )P −1 .
A la matriz Jord(M ) se la llama forma canónica de Jordan de M y es única salvo permutación
de las cajas de Jordan que aparecen en Jord(M ).
Demostración. Es consecuencia inmediata de la existencia de forma de Frobenius (ver

Problema 173) que muestra que la matriz M es semejante (con cambios de coordenadas “racionales”
(i.e. en GL(n, K))) a una matriz suma diagonal de matrices compañeras. Ahora, aplicando la
Proposición 5.4.2, cada una de las matrices compañeras que aparecen en la forma de Frobe-
nius es semejante a una matriz suma diagonal de cajas de Jordan asociada a los ceros de ese
polinomio y con talla sus multiplicidades. Recomponiendo todos los cambios de variables como
suma diagonal, obtendremos Jord(M ) y la matriz de cambo de base P ∈ GL(n, K).
Observación 5.4.4 (La forma canónica de Jordan). Retomando los cursos básicos de
Álgebra Lineal, la anterior Proposición nos dice que si el polinomio mı́nimo de un endomorfismo
A se escinde completamente en un cuerpo, entonces, existe una única forma canónica de Jordan.
Obviamente, si K es algebraicamente cerrado, tanto el mı́nimo como el caracterı́stico se escinden
completamente en K. La unicidad viene dada por los divisores de la forma (X − ζ)m de los
factores invariantes y las matrices de paso de la forma de Frobenius (suma diagonal de matrices
compañeras) a la forma canónica de Jordan son las matrices del Teorema Chino de los Restos
en bases adecuadas.
5.4.2. Teorı́a del endomorfismo y el máximo común divisor en K[X]. Como apli-
cación final del Teorema Chino de los Restos (al menos en esta parte del curso), veremos cómo
predecir el grado del máximo común divisor de dos polinomios usando Teorı́a del Endomorfismo
y sin acudir a la matriz de Sylvester de la Eliminación Univariada Clásica. Comencemos con
algunos resultados clásicos de Álgebra Lineal.
Lema 5.4.5. Sea K un cuerpo, y sea K su clausura algebraica. Sea g ∈ K[X] un polinomio
univariado. Tendremos las siguientes propiedades :
i) Sea J(0, m) una caja de Jordan con valor propio 0 de tamaño m × m. Entonces,
• Para todo k, 1 ≤ k ≤ m, se tiene :

k 0 0
J(0, m) = ,
Idm−k 0
donde Idm−k es la matriz identidad (m − k) × (m − k) y los 0’s representan
matrices rectangulares de tamaño apropiado.
• Para todo k ≥ m, se tiene :
J(0, m)k = 0.
ii) Si J(ζ, m) es una caja de Jordan de orden m y valor propio ζ ∈ K y denotamos por
ordζ (g) como el máximo número natural k ∈ N tal que (X −ζ)k | g en K[X], entonces,
tenemos
rank (g(J(ζ, m))) = max{0, m − ordζ (g)}.
Demostración. Las propiedades descritas en i) son las propiedades habituales de las
matrices nilpotentes, esto es, de las matrices tales que existe una potencia que se anula. Más
aún, son propiedades de las cajas de Jordan de valor propio 0. Para la propiedad ii), obsérvese
que ha de existir h ∈ K[X] un polinomio tal que g = h(X)(X − ζ)k , donde:
• h(ζ) 6= 0,
• k = ordζ (g).
Ahora, observamos que
g(J(ζ, m)) = h(J(ζ, m))(J(ζ, m) − ζIdm )k ,
Obsérvese que  
h(ζ) 0 0 ··· 0
 ∗ h(ζ) 0 ··· 0 
 
 ∗ ∗ h(ζ) · · · 0 
h(J(ζ, m)) =  ,
 .. .. .. .. .. 
 . . . . . 
∗ ∗ ∗ · · · h(ζ)
donde ∗ denota un elemento de K cuyo valor no nos ocupa. En otras palabras, h(J(ζ, m))
es una matriz triangular inferior con el valor h(ζ) en la diagonal principal. Como h(ζ) 6= 0,
entonces, es una matriz regular y, por tanto, el rango de g(J(ζ, m)) es igual al rango de ma
matriz (J(ζ, m) − ζIdm )k . Ahora observemos que
(J(ζ, m) − ζIdm )k = (J(0, m))k .
Luego el rango de g(J(ζ, m)) es igual a m − k si m ≥ k y 0 en caso contrario. ésto es lo que se
indica en el enunciado del Lema.
Proposición 5.4.6 (Resultante y ceros de un polinomio). Sea K un cuerpo, f ∈ K[X]mon

un polinomio mónico y g ∈ K[X]. Supongamos K la clausura algebraica de K y que f factoriza
del modo siguiente en K[X]:
r
Y
f (X) := (X − ζi )ni ,
i=1
con ζ1 , . . . , ζr ∈ K y ni ∈ N, ni ≥ 1. Entonces, la resultante ResX (f, g) satisface:
Yr
ResX (f, g) := g(ζi )ni ,
i=1
lo que fortalece la equivalencia del Corolario 4.7.4 precedente.
Demostración. Por la Proposición 5.4.2, sabemos que C(f ) es semejante (en Mn (K) a
la matriz suma diagonal de bloques de Jordan siguiente:
 
J(ζ1 , n1 ) 0 ··· 0
 0 J(ζ2 , n2 ) · · · 0 
C(f ) ∼
=
 
.. . . . . .
. 
 . . . . 
0 0 · · · J(ζr , nr )
Por tanto, la matriz g(C(f )) es una matriz semejante a una matriz de la forma:
 
g(J(ζ1 , n1 )) 0 ··· 0
 0 g(J(ζ 2 , n2 )) ··· 0 
g(C(f )) ∼
= .
 
.. . .. ..
 . ··· . 
0 0 · · · g(J(ζr , nr ))
Como el determinante es un invariate de la clase de semejanza, tendremos que
 
g(J(ζ1 , n1 )) 0 ··· 0
 0 g(J(ζ2 , n2 )) · · · 0 
ResX (f, g) = det (g(C(f ))) = det  .
 
.. . . .
.
 . . ··· . 
0 0 · · · g(J(ζr , nr ))
Como el determinante se porta bien con las sumas diagonales de matrices, lo anterior implica:
r
Y
ResX (f, g) = det (g(J(ζi , ni ))) .
i=1
Como en la demostración del ı́tem ii) del Lema 5.4.5 precedente, cada matriz g(J(ζi , ni )) tiene
la forma:  
g(ζi ) 0 0 ··· 0
 ∗ g(ζ i ) 0 ··· 0 
 
 ∗ ∗ g(ζ i) ··· 0
g(J(ζi , ni )) =   ∈ Mni (K),

 .. .. .. .. .. 
 . . . . . 
∗ ∗ ∗ ··· g(ζi )
que es una matriz triangular inferior en la que los elementos por debajo de la diagonal principal
no nos interesan demasiado por ahora. Por tanto,
det (g(J(ζi , ni ))) g(ζi )ni .
con lo que concluimos:
r
Y r
Y
ResX (f, g) = det (g(J(ζi , ni ))) = g(ζi )ni .
i=1 i=1
Proposición 5.4.7 (Barnett, Grado del máximo común divisor de dos polinomios).
Dados dos polinomiso f, g ∈ K[X] supongamos que f es mónico. Entonces, el grado d del
máximo común divisor h de f y g satisface:
deg(f ) = rank(g(C(f )) + deg(h),
donde C(f ) es la matriz compañera de f .
Demostración. En primer lugar, podemos suponer que existen ζ1 , . . . , ζr ∈ K, con ζi 6=
ζj , cuando i 6= j, y existen m1 , . . . , mr ∈ N, con mi ≥ 1, 1 ≤ i ≤ r, tales que
r
Y
f (X) := (X − ζi )mi .
i=1
Pr
En particular tenemos i=1 mi = deg(f ) = m. Gracias al Teorema Chino de los Restos
podemos suponer que existe una matriz regular P con coordenadas en K tal que
 
J(ζ1 , m1 ) 0 ··· 0
 0 J(ζ2 , m2 ) · · · 0 
C(f ) = P −1   P.
 
.. .. .
..
 . . ··· 
0 0 ··· J(ζr , mr )
Entonces,
 
g(J(ζ1 , m1 )) 0 ··· 0
 0 g(J(ζ 2 , m2 )) ··· 0 
g(C(f )) = P −1   P.
 
.. . . ..
 . . ··· . 
0 0 ··· g(J(ζr , mr ))
Como P es una matriz regular, el rango de la matriz g(C(f )) viene dado por:
 
g(J(ζ1 , m1 )) 0 ··· 0
0 g(J(ζ ··· r
2 , m2 )) 0
  X
rank (g(C(f ))) = rank  = rank (g(J(ζi , mi )))) .
 
.. . .. ..
 . ··· .  i=1
0 0 ··· g(J(ζr , mr ))
Ahora, usando el Lema anterior, tendremos:
r
X
rank (g(C(f )))) = max{0, mi − ordζi (g)}.
i=1
Escribamos νi := ordζi (g) por simplicidad notacional. Para concluir, probemos que la suma
descrita a la derecha es igual a deg(f ) − deg(h) donde h es el gcd(f, g).
Supongamos, entonces, que
Yr
g = p(X) (X − ζi )νi ,
i=1
donde p(ζi ) 6= 0 para todo i y νi = ordζi (g). El máximo común divisor de g y f vendrá dado
por la igualdad
Y r
h(X) := (X − ζi )min{mi ,νi } .
i=1
Luego
r
X
deg(h) = min{mi , νi }.
i=1
Pero, nótese que
mi − min{mi , νi } = max{0, mi − νi }.
Por tanto,
r
X r
X r
X
deg(h) = min{mi , νi } = mi − max{0, mi − νi } = deg(f ) − rank (g(C(f ))) ,
i=1 i=1 i=1
como se pretende en el enunciado.
Observación 5.4.8. En el caso de la que la caracterı́stica de los cuerpos K y K es cero, podemos

describir con detalle la matriz g(J(ζ, m)) mediante las derivadas sucesivas
···
 
g(ζ) 0 0 0
0
 g (ζ) g(ζ) 0 ··· 0 
1 00 0
· · ·
 
g(J(ζ, m)) = 
 2 g (ζ) g (ζ) g(ζ) 0 ,

 .. .. .. .. .. 
 . . . . . 
1 (m−1) 1 (m−2) 1 (m−3)
(m−1)! g (ζ) (m−2)! g (ζ) (m−3)! g (ζ) · · · g(ζ)
donde g 0 (α), g 00 (α), . . . , g (m−1) (α) son las sucesivas derivadas.

Corolario 5.4.9. Con las anteriores notaciones, el grado del máximo común dividor de f y g
con f mónico satisface:
deg (gcd(f, g)) = dim ker (Mg ) .
Demostración. Obvio desde lo anterior, dado que
dim (ker (Mg )) = deg(f ) − rank (Mg ) .

Tenemos ası́ el siguiente algoritmo:
Algoritmo 5.4.10 (Cálculo del gcd en dimensión intrı́nseca).
Input: Dos polinomios f, g ∈ K[X], siendo f mónico.
initialize: M := C(f ) % la matriz compañera de g.
eval: N := g(M ) % la matriz de ηf sobre Ag .
compute: β una base ordenada cualquiera de KN := ker(N ) como K−subespacio vectorial de

K[X]/(f )
compute: la matriz B de ηX |KN : KN −→ KN en la base β. % posible por ser

ηX −invariante.
Output: h(X) := χB (X) := det(XId − B) % el polinomio caracterı́stico de B (que es, a la

vez, su polinomio mı́nimo).
%: El output es el máximo común divisor de f y g.
end
Proposición 5.4.11. Con las notaciones del algoritmo precedente, sean f, g ∈ K[X] y sea
h := gcd(f, g) y supongamos que h es mónico. Consideremos el anillo R := K[X]/(f ) y las
homotecias ηg , ηh : R −→ R. Se tiene:
i) Los subespacios ker(ηh ) = ker(ηg ) y las dimensiones como K−espacios vectoriales
satisfacen:
dimK (ker(ηh )) = dimK (ker(ηg )) = deg(h).
ii) Sea f1 ∈ K[X] polinomio mónico tal que hf1 = f , sea a = (f1 ) ⊆ K[X] el ideal que
genera f1 (y que es un ideal que contiene al ideal (f ) generado por f en K[X]. Sea
a/(f ) su proyección al anillo de restos R = K[X]/(f ). Entonces,
ker(ηh ) = ker(ηg ) = a/(f ).
Más aún, el siguiente conjunto es una base de ker(ηg ) como K−subespacio:
B := {f1 , Xf1 , X 2 f1 , . . . , X deg(h)−1 f1 },
donde X i f1 = X i f1 + (f ) es la clase de X i f1 módulo (f ).
iii) El subespacio K := ker(ηg ) es un subespacio ηX −invariante (i.e. ηX (K) ⊆ K) y tiene
sentido considerar el siguiente endomorfismo de espacios vectoriales:
ηX : K −→ K.
iv) La matriz del endomorfismo ηX : K −→ K en la base B es la matriz compañera de
h.
En particular, el máximo común divisor de f y g es precisamente el poliomio caracterı́stico de
la restricción de ηX a ker(ηg ).
Demostración. Probaremos cada una de las propiedades indicadas:
i) Para la primera propiedad, comencemos observando que

dimK (ker(ηg )) = deg(f ) − rank(Mg ) = deg(gcd(f, g)) = deg(h).
Pero también es cierto que gcd(f, h) = h, por lo que también tenemos:
dimK (ker(ηh )) = deg(f ) − rank(Mh ) = deg(gcd(f, h)) = deg(h).
De otro lado si q + (f ) ∈ R es un elemento tal que ηh (q + (f )) = hq + (f ) = 0 + (f ),
como h | g, si g = hg1 , entonces,
ηg (q + (f )) = gq + (f ) = (g1 + (f )) (hq + (f )) = (g1 + (f )) (0 + (f )) = 0 + (f ).
Por tanto, hemos probado que ker(ηh ) ⊆ ker(ηg ) y, como ambos son subespacios vec-
toriales de igual dimensión y ésta es, además, finita, concluimos la igualdad ker(ηh ) =
ker(ηg ).
ii) Sea q ∈ K[X] un polinomio cualquiera y consideremos la clase qf1 + (f ). Entonces,
ηh (qf1 + (f )) = qhf1 + (f ) = qf + (f ) = 0 + (f ).
Por tanto, el ideal cociente satisface:
a/(f ) ⊆ ker(ηh ) = ker(ηg ).
De otro lado, sea q + (f ) un elemento de ker(ηh ). Entonces, f | qh, luego existe
q 0 ∈ K[X] tal que q 0 f = qh. Por tanto, tenemos
q 0 f1 h − hq = 0 =⇒ h(q 0 f1 − q) = 0 =⇒ q 0 f1 = q =⇒ q ∈ a.
Por tanto, ker(ηh ) ⊆ a/(f ) y tenemos la igualdad buscada.
De otro lado, tenemos que el K−subespacio generado por la familia B está contenido
en a/(f ) = ker(ηh ). Por otro lado, sea q ∈ a. Entonces, q = q 0 f1 y supongamos
q 0 = q 00 h + r, donde deg(r) ≤ deg(h) − 1. Tendremos que
q + (f ) = q 0 f1 + (f ) = ((q 00 h + r)f1 ) + (f ) = rf1 + (f ).
Como deg(r) ≤ deg(h) − 1, podemos suponero r = at X t + at−1 X t−1 + a0 , con t =
deg(h) − 1. Por tanto, haremos probado que si q ∈ a, entonces
deg(h)−1
X
ai X i f1 + (q) .

q + (f ) = rf1 + (f ) =
i=0
En particular, B es un sistema generador con deg(h) elementos de a/(f ) = ker(ηh ),
que es un subespacio de dimensión deg(h). Por tanto, B es base de ker(ηh ) = ker(ηg ).
iii) Es obvio que si q + (f ) ∈ ker(ηg ), entonces ηX (q + (f )) = Xq + (f ) ∈ ker(ηg ). Es obvio
porque
ηg (Xq + (f )) = Xgq + (f ) = (X + (f ))(gq + (f )) = (X + (f ))(0 + (f )) = 0 + (f ).
iv) Es claro que para cada i, 0 ≤ i ≤ deg(h) − 2, se tiene
ηX (X i f1 ) = X i+1 f1 .
Para el caso i = deg(h) − 1, tendremos que existen a0 , . . . , adeg(h)−1 ∈ K tales que:
deg(h)−1
X
deg(h)
ηX (X deg(h)−1 f1 ) =X f1 + (f ) = (−ai )X i f1 .
i=0
Pdeg(h)−1
Considero el polinomio µ = X deg(h) + i=0 ai X i ∈ K[X]. La última identidad
puede reescribirse mediante
 
deg(h)−1
X
µf1 = X deg(h) + ai X i  f1 ∈ (f ) =⇒ f | µf1 .
i=0
Pero como deg(µf1 ) = deg(µ) deg(f1 ) = deg(h) + deg(f1 ) = deg(f ), y todos son
mónicos, concluimos que µf1 = f , con lo que, por ser K[X] un dominio de integridad,
concluiremos que µ = ff1 = h. En particular, la matriz de ηX en la base B es la
matrix compañera de µ y, por tanto,
MB (ηX ) = C(h).
La conclusión es obvia dado que

det(XIddeg(h) − MB (ηX )) = det(XIddeg(h) − C(h)) = h.

Como conclusión de la Proposición precedente tendremos:

Teorema 5.4.12 (Algoritmo para el gcd con dimensión mı́nima). El anterior algoritmo
calcula el máximo común divisor de f y g. El número de operaciones aritméticas a realizar es
ω
del orden O (deg(g) (deg(f )) ), donde ω es el exponente del álgebra lineal. Nótese que el álgebra
lineal implicada es del orden de deg(f ) para operaciones Gaussianas y deg(gcd(f, g)) para el
cálculo de un polinomio caracterı́stico.
Otra demostación (más explı́cita) de la correctitud del algoritmo.
Demostración. Retomemos las notaciones de la demostración precedente. Sea K una

clausura algebraica de K y trabajemos en K con las formas de Jordan. Suponemos f (X) ∈
K[X] ⊆ K[X] un polinomio mónico de grado n := deg(f ), que factoriza en K[X] del modo
siguiente.
r
Y
f (X) := (X − ζi )mi .
i=1
Pr
En particular tenemos i=1 mi = deg(f ) = m. Para cada i, 1 ≤ i ≤ r consideremos el ideal
ai ⊆ K[X] dado por ai = ((X − ζi )mi ). Consideremos el isomorfismo del Teorema Chino de los
Restos (Teorema 5.2.2) siguiente:
Qr
ϕ : K[X]/(f ) −→ i=1 (K[X]/ai )
(5.4.1)
h + (f ) 7−→ (h + a1 , h + a2 , . . . , h + ar ).
Para cada i, 1 ≤ i ≤ r, consideremos las homotecias siguientes:
i) La homotecia de multiplicación por X sobre K[X]/(f ):
ηX : K[X]/(f ) −→ K[X]/(f )
h + (f ) 7−→ Xh + (f ).
ii) La homotecia de multiplicación por g sobre K[X]/(f ):
ηg : K[X]/(f ) −→ K[X]/(f )
h + (f ) 7−→ gh + (f ).
iii) Para cada i, 1 ≤ i ≤ r, la homotecia de multiplicación por X sobre cada K[X]/ai :
(i)
ηX : K[X]/ai −→ K[X]/ai
h + ai 7−→ Xh + ai .
iv) Para cada i, 1 ≤ i ≤ r, la homotecia de multiplicación por g sobre cada K[X]/ai :
(i)
ηg : K[X]/ai −→ K[X]/ai
h + ai 7−→ gh + ai .
Podemos pasar a los productos, mediante el producto de las homotecias considerando:
(i)
• El producto de las homotecias ηX :
Qr (i) Qr Qr
ηeX := i=1 ηX : i=1 (K[X]/ai ) −→ i=1 (K[X]/ai )
(h1 + a1 , . . . , hr + ar ) 7−→ (Xh1 + a1 , . . . , Xhr + ar ).
(i)
• El producto de las homotecias ηg :
Qr (i) Qr Qr
ηeg := i=1 ηg : i=1 (K[X]/ai ) −→ i=1 (K[X]/ai )
(h1 + a1 , . . . , hr + ar ) 7−→ (gh1 + a1 , . . . , ghr + ar ).
De hecho, los siguientes dos diagramas de K−espacios vectoriales son conmutativos:
ϕ Qr
K[X]/(f ) i=1 (K[X]/ai )
ηX ηeX
Qr
K[X]/(f ) i=1 (K[X]/ai )
ϕ
ϕ Qr
K[X]/(f ) i=1 (K[X]/ai )
ηg ηeg
Qr
K[X]/(f ) i=1 (K[X]/ai )
ϕ
Es decir, se verifican las dos igualdades siguientes:
(5.4.2) ηeX ◦ ϕ = ϕ ◦ ηX , ηeg ◦ ϕ = ϕ ◦ ηg .

Probemos una de ellas, la otra será análoga. Ası́, consideremos h + (f ) ∈ K[X]/(f ), entonces,
ηeg ◦ ϕ(h + (f )) = ηeg (h + a1 , . . . , h + ar ) = (gh + a1 , . . . , gh + ar ) = ϕ(gh + (f )) = ϕ ◦ ηg (h + (f )).
Veamos varias propiedades que se infieren de estos diagramas conmutativos:
Qr
• Fijado cualquier par de bases ordenadas Θ en K[X]/(f ) y β en i=1 (K[X]/ai ), se
tiene que las correspondientes matrices verifican:
M (ηX ) := M (ϕ)−1 M (e
ηX )M (ϕ),
M (ηg ) := M (ϕ)−1 M (e
ηg )M (ϕ),
Siendo M (ϕ) ∈ GL(n, K) una matriz regular (porque corresponde a un isomorfismo
de espacios vectoriales.
• Para cada i, 1 ≤ i ≤ r, consideramos la base βi de K[X]/ai dada por (ver Proposición
5.4.1 anterior):
(5.4.3) βi := {1 + ai , (X − ζi ) + ai , . . . , (X − ζi )mi −1 + ai }.
Qr
• Definamos para el espacio vectorial producto i=1 (K[X]/ai ), la base natural del
espacio producto dada mediante:
r
[ r
Y
β := {0}i−1 × βi × {0}r−i ⊆ (K[X]/ai ) .
i=1 i=1
• La matriz en la base β de ηX es dada por una suma de cajas de Jordan asociada a los
ceros de f contando su mutiplicidad:
 
J(ζ1 , m1 ) 0 ··· 0
 0 J(ζ2 , m2 ) ··· 0 
Mβ (eηX ) = 
 
.. . . .. 
 . . ··· . 
0 0 ··· J(ζr , mr )
• La matriz de ηeg en la base β viene dada por:

 
g(J(ζ1 , m1 )) 0 ··· 0
 0 g(J(ζ 2 , m2 )) ··· 0 
Mβ (e
ηg ) = g(Mβ (e
ηX )) =  .
 
.. . . ..
 . . ··· . 
0 0 ··· g(J(ζr , mr ))
• Definamos la base Θ de K[X]/(f ) mediante
Θ := ϕ−1 (β) ⊆ K[X]/(f ).
Entonces,
Qr la matriz del isomorfismo ϕ en las bases respectivas Θ en K[X]/(f ) y β en
i=1 (K[X]/a i ), verifica que:
MΘ,β (ϕ) := Idn .

• De lo anterior se infiere que las matrices de ηX y ηg en la base Θ son respectivamente:
 
J(ζ1 , m1 ) 0 ··· 0
 0 J(ζ2 , m2 ) ··· 0 
(5.4.4) MΘ (ηX ) = Mβ (e ηX ) = 
 
.. . .. .. 
 . ··· . 
0 0 ··· J(ζr , mr ).
 
g(J(ζ1 , m1 )) 0 ··· 0
 0 g(J(ζ2 , m2 )) · · · 0 
(5.4.5) MΘ (ηg ) = Mβ (e
ηg ) =  .
 
.. .. ..
 . . ··· . 
0 0 ··· g(J(ζr , mr ))
Podemos ahora considerar la base ordenada Θ := {v1 , . . . , vn } y descoponerla en los trozos:
Θi := {vPi−1 mk +1 , . . . , vPik=1 mk } = {vi,1 , . . . , vi,m1 }.
k=1
Nótese que son los trozos ordenados de la base Θ ue se corresponde con los bloques de Jordan
J(ζi , mi ) y g(J(ζi , mi )). De hecho, podemos observar los siguiente:
• Los subespacios vectorials Vi ⊆ K[X]/(f ) generados por la subbase Θi son invariantes
por ηX y la matriz en la base Θi de Vi de ηX : Vi −→ Vi es dada mediante:
(5.4.6) MΘi (ηX ) = J(ζi , mi ) ∈ Mmi (K).
• Los subespacios vectorials Vi ⊆ K[X]/(f ) generados por la subbase Θi son invariantes
por ηg y la matriz en la base Θi de Vi de ηg : Vi −→ Vi es dada mediante:
MΘi (ηg ) = g(J(ζi , mi )) ∈ Mmi (K).
Ambas afirmaciones son consecuencia inmediata de tener forma de suma diagonal de cajas las
matrices asociadas a ηX y ηg en la base
Θ := Θ1 ∪ · · · ∪ Θr .
Supongamos que, para cada i, 1 ≤ i ≤ r, g factoriza en K[X] del modo siguiente:
g(X) := hi (X)(X − ζi )ti ,
donde hi (ζi ) 6= 0 y ti := ordζi (g). Entonces, tendremos que:
t
g(J(ζi , mi )) = hi (J(ζi , mi )) (J(ζi , mi ) − ζi Idmi ) i = hi (J(ζi , mi ))J(0, mi )ti ,
donde hi (ζi , mi ) ∈ GL(mi , K) es una matriz regular.
Ahora retomamos el Lema 5.4.5 sobre matrices nilpotentes y concluimos que:
• Si ti < mi se tiene:
0 0
J(0, mi )ti = ,
Idmi −ti 0
donde Idmi −ti es la matriz identidad (mi −ti )×(mi −ti ) y los 0’s representan matrices
rectangulares de tamaño apropiado.
• Si ti ≥ mi tenemos directamente J(0, mi )ti = 0 ∈ Mmi (K).
Construyamos el trozo de base siguiente:
• Si ti < mi definamos el conjunto de los ti últimos vectores de Θi , que son linealmente

independientes:
e i := {vi,m −t +1 , . . . , vi,m }.
Θ i i i
• Si ti ≥ mi definamos Θi := Θi .
e
Observamos que Θe i es la base de la intersección siguiente:
e i i = ker(ηg ) ∩ Vi .
KhΘ
La prueba es obvia dada la forma de las matrices g(J(ζi , mi ) discutida más arriba. Juntemos
estos trozos de base para defnir en conjunto de vectors linealmente independientes:
Θ e1 ∪ · · · ∪ Θ
e := Θ e r ⊆ Θ.
Son vectores linealmente independientes dado que son una unión disjunta de vectores que forman
parte de la base Θ. Además, Θ e ⊆ ker(ηg ) por construcción. Finalmente, ker(ηg ) que es
invariante por ηg se descompone mediante:
ker(ηg ) = (ker(ηg ) ∩ V1 ) ⊕ · · · (ker(ηg ) ∩ Vr ) ,
luego Θ
e es una base de ker(ηg ). Se tiene:
KhΘi
e = ker(ηg ).
Observemos seguidamete que ker(ηg ) es invariante por la acción de ηX . De hecho, si h + (f ) ∈
ker(ηg ), tendremos que
ηX (ηg (h + (f ))) = ηg (ηX (h + (f ))) = 0 + (f ).
Podemos construir, por tanto, el endomorfismo:
(5.4.7) ηX : ker(ηg ) −→ ker(ηg ).
Calculemos la matriz de ηX en la base Θ e que acabamos de construir.
Para cada i, 1 ≤ i ≤ r, consideremos un vector vi,k ∈ Θ
e i ⊆ Θ,
e con mi − ti + 1 ≤ k ≤ mi . Nótese
que vi,k ∈ Vi y que Θ
e i ⊆ Θi . Conforme a la Igualdad (5.4.6), la matriz de ηX en la base Θi es
dada mediante J(ζi , mi ). Por tanto, se tiene:
• Si mi − ti + 1 ≤ k ≤ mi − 1, la imagen de vi,k verifica:
ηX (vi,k ) = ζi vi,k + vi,k+1 .
• Si k = mi , la imagen de vi,k verifica:
ηX (vi,k ) = ζi vi,k .
Esta dos identidades se verifican observando simplemente la forma de J(ζi , mi ) en la base Θi
de Vi .
Por tanto, la matriz de ηX restringida a ker(ηg ) ∩ Vi en la base θei tiene la forma:

J(ζi , ti ) si ti < mi
MΘ (η
ei X ) = J(ζ i , min{t i , mi } =
J(ζi , mi ) si ti ≥ mi
Finalmente, la matriz de ηX en la base Θ e de ker(ηg ) toma la forma:
 
J(ζ1 , min{t1 , m1 }) · · · 0
MΘ .. .. ..
e (ηX ) =  .
 
. . .
0 · · · J(ζr , min{tr , mr })
Por tanto, el polinomo caracterı́stico de MΘ
e (ηX ) satisface
r
Y
χM e (ηX ) (T ) :=
Θ
(X − ζi )min{ti ,mi } = gcd(f, g),
i=1
poque ti = ordζi (g) mientras que mi = ordζi (f ).

Ahora bien, todo el esfuerzp hecho en la prueba ha consistido en hallar la base Θ
e de ker(ηg ) en
la que el enodomorfismo ηX toma forma de suma diagonal de bloques de Jordan. Pero esto se
hace para demostrar que el polinomio caracterı́stico del endomorfismo siguiente:
ker
ηX := ηX |ker(ηg ) : ker(ηg ) −→ ker(ηg ),
satisface
χηker = gcd(f, g).
X
Pero el polinomio caracterı́stico no depende de la base de ker(ηg ) elegida. Y como ker(ηg ) es un

subespacio de K[X]/(f ), entonces podemos hallar cualquier base de ker(ηg ), hallar la matriz
de ηX en esa base (porque ker(ηg ) es invariante por ηX ) y hallar el polinomio caracterı́stico
de turno que es independiente de la base elegida. Esto prueba la correctitud del algoritmo
introducido.

Problema 211 (Funciones polinomiales y cuerpos finitos). Sea K un cuerpo y consider-
emos el anillo K[K] de las aplicaciones polinomiales K−definibles sobre K. Sea I(K) ⊆ K[X]
el ideal formado por todos los polinomios p ∈ K[X] que se anulan idénticamente sobre K. Para
cada punto ζ ∈ K sea mζ el ideal de todos los polinomios que se anulan sobre ζ. Se pide:
i) Probar que K es un cuerpo finito si y soamente si I(K) 6= (0).
ii) Probar que K es algebraicamente cerrado si y sólo si se verifica:
 
[
K[X] \  mζ  = ∅
ζ∈K
iii) Probar que si K tiene, al menos, n elementos distintos α1 , . . . , αn ∈ K, para todo

m ∈ N, m ≥ n − 1 el ideal intersección n := ∩ni=1 mαi verifica que n ∩ K[X]m es un
espacio vectorial de dimensión m − n + 1.
iv) Concluir si K tiene, al menos, n elementos distintos α1 , . . . , αn ∈ K, entonces
las soluciones de un problema de interpolación con datos (b1 , . . . , bn ), punto α =
(α1 , . . . , αn ) ∈ K n , y grado m ≥ n − 1 es una variedad afı́n lineal de dimensión
m − n + 1.
Problema 212. Sean f1 , . . . , fr ∈ K[X] polinomios univariados y consideremos el K[X]−módulo
r
Y
M := K[X]/(fi ).
i=1
Sea a := AnnK[X] (M ) := {h ∈ K[X] : h ∗ m = 0, ∀m ∈ M }. Se pide:

i) Probar que el mı́nimo común múltiplo de f1 , . . . fr está en a. Concluir que el producto
de todos ellos está también en a.
ii) Discutir si a es el ideal generado por el mı́nimo común múltiplo de f1 , . . . , fr .
Problema 213. Hállense los polinomios mı́nimos y caracterı́stico de los siguientes endomor-
fismos sin calcular ni un sólo determinante, ni ningún valor propio:
i)
 
2 3 0
M1 :=  1 −2 3 .
−1 2 4
ii)
√ 
2 1
√ 0
M2 :=  0 − 2 √1 .

0 0 2
Problema 214. Hállese el máximo común divisor de los polinomios siguientes usando el álgebra
lineal de dimensión mı́nima:
i) gcd(f, g), donde f := X 8 − 1, g = X 2 + X + 1.
ii) gcd(f, g), donde f := X 2 − 1, g = X 7 + X + 1.
Problema 215 (Matrices diagonalizables: separabilidad). Pruébese la equivalencia sigu-
iente para un cuerpo K cualquiera y un endomorfismo M ∈ Mn (K) con polinomio mı́nimo
m(X) ∈ K[X].
• El ideal generador por m en K[X] (el Anulador de la matriz M , (m) = AnnK[X] (M ))

es un ideal radical (i.e. el anillo cociente K[X]/AnnK[X] (M ) no tiene elementos
nilpotentes.
• El endomorfismo M es diagonalizable sobre alguna clausura algebraica K de K, es
decir, existen matrices P ∈ GL(n, K) y valores ζ1 , . . . , ζn ∈ K, tales que
 
ζ1 0 · · · 0
 0 ζ2 · · · 0 
P M P −1 =  . . .
 
 .. ..
. .. 
0 0 ··· ζn
Problema 216 (Discriminante de un polinomio). Sea K un cuerpo primo. Sea f ∈ K[X]

un polinomio mónico y sea f 0 ∈ K[X] la derivada de f con respecto a la vaiable X. Supongamos
que f 0 6= 0. Consideremos la matriz
DX (f, f 0 ) := f 0 (C(f )).
Se pide:
i) Probar que del determinante
DiscX (f ) := det (f 0 (C(f ))) ∈ K,
es un polinomio en los coeficientes de f . Se le denomina el discriminante del polinomio

f . Halla una cota para
Qrsu grado.
ii) Prueba que si f := i=1 (X − αi )si es una factorización de f en alguna clausura
algebraica de K, entonces
s
Y
DiscX (f ) := f 0 (αi )si .
i=1
iii) Halla el valor DiscX (f ) cuando f = X 2 + bX + c. Idem con los polinomios mónicos
genérios de grados 3 y 4.
iv) Concluye que f no posee factores múltiples en K[X] si y solamente si DiscX (f ) = 0.
v) Conluye que la matrix compañera C(f ) es diagonalizable si y solamente si DiscX (f ) 6=
0.
vi) Diseña un algoritmo que realice la siguiente tarea:
Dada una matrix A ∈ Mn (K), decide si A es diagonalizable sobre alguna clausura
algebraica de K.
Problema 217 (Ecuaciones diferenciales homogéneas con coeficientes constantes).

Definamos el siguiente conjunto:
C ω (R, C) := {f : R −→ C : f es analı́tica}.
Probar que C ω (R, C) es un anillo conmutativo con unidad. Denotemos este anillo por R :=
C ω (R, C) y sean Mn (C) y Mn (R) respectivamente, las matrices n × n con coordenadas en C y
R. Para una matriz A ∈ Mn (C), consideraremos sistemas de ecuaciones diferenciales lineales
homogéneos coeficientes constantes con condición inicial de la forma siguiente:

A · X(t) = Ẋ(t),
(5.4.8)
X(0) = v,
donde
   0   
x1 (t) x1 (t) v1
X(t) :=  ...  , Ẋ(t) :=  ...  , v =  ..  ∈ Cn .
    
. 
xn (t) x0n (t) vn
Dada una caja de Jordan J(λ, m) ∈ Mm (C), definamos la matriz
 
1 0 0 ··· 0

 t 1 0 ··· 0 

t2
eJ(λ,m)t λt 
:= e 

2! t 1 ··· 0 
.
.. .. .. .. .. 

 . . . . . 

tm−1 tm−2 tmi −3
(m−1)! (m−2)! (m−3)! ··· 1
Se pide:
i) Probar que eJ(λ,m)t ∈ Mm (C ω (R, C)).
ii) Probar que una solución en C ω (R, C)n de la ecuación diferencial dada por la Ecuación
(5.4.8), tomando A = J(λ, m) es la dada mediante:
   
x1 (t) v1
 ..  J(λ,m)t  .. 
 . =e  . .
xn (t) vn
iii) Sean A, B ∈ Mn (C) dos matrices complejas semejantes. Sea P ∈ GL(n, C) tal que
P AP −1 = B.
Probar que las soluciones de la Ecuación Diferencial (5.4.8) están en biyección con
las soluciones de la siguiente Ecuación Diferencial:

B · Y (t) = Ẏ (t),
(5.4.9)
X(0) = w,
donde w = P −1 v ∈ Cn . ( Pista: Probar que la relación Y 7−→ X = P −1 Y define la
biyección entre las soluciones).
iv) Dada la matriz A ∈ Mn (C) suma diagonal de cajas de Jordan siguiente:
 
J(λ1 , m1 ) 0 ··· 0
 0 J(λ2 , m2 ) · · · 0 
A :=  .
 
.. . .. .
..
 . 
0 0 ··· J(λr , mr )
Probar que una solución de la Ecuación Diferencial (5.4.8) para esta matriz A viene
dada mediante:
   J(λ ,m )t  
x1 (t) e 1 1 ··· 0 v1
 ..  At .
. . . .
.   .. 
X(t) =  .  = e v :=   . .

. . .
J(λr ,mr )t
xn (t) 0 ··· e vn
v) Dar una expresión general de la solución de la Ecuación Diferencial (5.4.8) usando la
forma canónica de Jordan de la matriz A y la matriz de paso P ∈ GL(, n, C).
Problema 218. Sea f ∈ C{X − ζ} una serie de Taylor de una función analı́tica compleja
(función holomorfa). Sea J(ζ, m) un bloque de Jordan de valor propio ζ y orden m. Prueba
que
rank(f (J(ζ, m)) = max{0, m − ordζ (f )}.
5.4.3.1. El algoritmo de Csanky-Leverrier-Fadeev-Souriau. En esta subsección
vamos a presentar un algoritmo eficiente para el cálculo del determinante de una matriz conocido
como el algoritmo de simultáneamente debido a los siguientes autores:
• L. Csanky (cf. [Csa, 1976]).
• V.N. Faddeeva (En el texto de V. N. Fadeeva : V. N. Fadeeva, “Computational Methods
of Linear Algebra” (versión española V.N. Fadeeva, Métodos de Cálculo de Algebra
Lineal. Paraninfo, 1972.) se le asigna la autorı́a de la recuperación del método de Le
Verrier a D. K. Fadeev en su trabajo (en ruso) : D.K. Fadeev, I.S. Sominskii, Sbornik
zadach po vysshei algebry ( Colección de Problemas en Álgebra Superior). Moscú,
1949. La versión bien paralelizable es descrita en [Fad, 77].
• U. Le Verrier (Aunque sus principales actividaes cientı́ficas estuvieron ligadas a la As-

tronomı́a, incluso como precursor de la Teorı́a de la Relatividad de Einstein-Poincaré,
aquı́ nos referimos al algoritmo de Urbain Le Verrier (1811-1877) profesor de la École
Polytechnique, para el cálculo del polinomio caracterı́stico de una matriz. Se trata del
trabajo de 1840 [LeV, 1840].
• J.M. Souriau (cf. [Sou, 1965]).
Se usan las técnicas descritas en el problema 113 y en la Subsección de Problemas relativas a
las Sumas de Newton y su relación con las funciones simétricas Elementales (Subsección 2.3.4.2
Problema 219 (Csanky-Leverrier-Fadeev-Souriau). Sea R un dominio de integridad y
n ∈ N de tal modo que {1, 2, . . . , n} ⊆ R× son uidades. Prueba que el siguiente algoritmo cal-
cula el polinomio caracterı́stico de una matriz M ∈ Mn (R), realizando O(n4 log2 n) operaciones
aritméticas elementales en R:
Algoritmo 5.4.13 (Cálculo del Polinomio caracterı́stico via sumas de Newton).
Input: Una matriz A ∈ Mn (R), donde R es un dominio tal que {1, 2, . . . , n} ⊆ R× .
for i = 0 to n, eval Ni := T r(Ai )

% Obsérvese que se calculan las sumas de Newton de los valores propios de M en
una clausura algebraica del cuerpo de fracciones de R, aunque no los sepamos calcular.
Solve la recurrencia lineal:

 P
k−1
 σk = k1

i=0 (−1) i+1
σ k−i N i , 2≤k≤n
(5.4.10) σ1 = N1 ,

σ0 = 1,

Output: σ0 , σ1 , . . . , σn .
End
Problema 220. Al principio del Capı́tulo aparece una frase que I. Newton escribió en respuesta
a su competidor R. Hooke. Sin embargo, la frase “like dwarfs standing on the shoulders of
giants” no es originaria de Newton. Busca su origen y explica su significado. ¿Pensaba Newton
que él era bajito de estatura?, ¿Crees que la sociedad actual conoce el sentido y significado de
esa frase?.
Cuestión 1. Se proponen varias tareas:
• Localiza el siguiente texto de A. Grothendieck “Allons-nous continuer la recherche
scientifique ? ”.
• Tradúcelo, haya su fuente, dale un contexto. Especialmente, averigua quién fue A.
Grothendieck e interpreta lo que quiere decir con el discurso completo.
• Traduce la expresión “C’est un con”, en el contexto del que habla Grotendieck. Explica
por qué él la considera detestable y expresa algún argmento por el que esa expresión y
todas sus traduciones a cada uno de los idiomas actuales o futuros, deberı́an prohibirse,
explusarse del mundo Matemático y, en general, del mundo cientı́fico.
• Explica si existe un abuso de semejantes descalificaciones en Twiter sobre cualquier
aspecto de la vida o en el contexto educativo sobre los alumnos. ¿Crees que deberı́a
mantenerse o exluirse?, ¿Es un debate nuevo o viejo?.
• Busca en la Biblioteca de la UC algún otro texto de A. Grothendieck distinto de su
tesis y sus primeros trabajos (o sea, busca algún EGA o SGA, que alguna hay). Trata
de leerlo y resume su contenido, desde tu punto de vista.
• Responde, desde tu perspectiva: ¿Son las Matemáticas un hecho individual o social?.
“...Pour illustrer ce point, j’aimerais donner ici un exemple très concret. Je suis allé, il y a
deux semaines, faire un tour en Bretagne. J’ai eu l’occasion, entre autres, de passer à Nantes
où j’ai vu des amis, où j’ai parlé dans une Maison de Jeunes et de la Culture (MJC) sur le
genre de problèmes que nous abordons aujourd’hui. J’y étais le lundi. Comme les collègues
de l’Université de Nantes étaient avertis de ma venue, ils avaient demandé in extremis que je
vienne, le lendemain après-midi, pour faire une causerie sur des sujets mathématiques avec eux.
Or il s’est trouvé que, le jour même de ma venue, un des mathématiciens de Nantes, M. Moli-
naro, s’est suicidé. Donc, à cause de cet incident malheureux, la causerie mathématique qui
était prévue a été annulée. Au lieu de ceci, j’ai alors contacté un certain nombre de collègues
pour demander s’il était possible que l’on se réunisse pour parler un peu de la vie mathématique
à l’intérieur du département de mathématiques à l’Université et pour parler également un peu
de ce suicide. Il y a eu une séance extrêmement révélatrice du malaise général, cette après-midi
là à Nantes, où manifestement tout le monde présent -avec une exception je dirais- sentait bien
clairement que ce suicide était lié de très près au genre de choses que, précisément, on discutait
la veille au soir à la MJC.
En fait, je donnerai peut-être un ou deux détails. Il s’est trouvé que Molinaro avait deux
thésards auxquels il faisait faire des thèses de troisième cycle - je crois que ce n’était pas des
thèses d’état. Or, ces thèses furent considérées comme n’étant pas de valeur scientifique suff-
isante. Elles furent jugées très sévèrement par Dieudonné qui est un bon collègue à moi et avec
lequel j’ai écrit un gros traité de géométrie algébrique. Je le connais donc très bien, c’est un
homme qui a un jugement scientifique très sûr, qui est très exigeant sur la qualité d’un travail
scientifique. Ainsi, alors que ces thèses étaient discutées par la Commission pour l’inscription
sur la liste d’aptitude aux fonctions de l’Enseignement Supérieur, il les a saqués et l’inscription
a été refusée. Ceci, bien entendu, a été ressenti comme une sorte d’affront personnel par Moli-
naro qui avait déjà eu des difficultés auparavant et il s’est suicidé sur ces circonstances. En fait,
j’ai eu un ami mathématicien, qui s’appelait Terenhôfel qui s’est également suicidé. Je connais
un certain nombre de mathématiciens - je parle surtout ici de mathématiciens puisque c’est le
milieu que j’ai le mieux connu -qui sont devenus fous.
Je ne pense pas que cela soit une chose propre aux mathématiques. Je pense que le genre,
disons, d’atmosphère qui prévaut dans le monde scientifique, qu’il soit mathématique ou non,
une sorte d’atmosphère à l’air extrêmement raréfié, et la pression qui s’exerce sur les chercheurs
sont pour beaucoup dans l’évolution de ces cas malheureux.
Ceci concernant le plaisir que nous prenons à faire de la recherche scientifique. Je crois qu’il
peut y avoir plaisir, mais je suis arrivé à la conclusion que le plaisir des uns, le plaisir des gens
haut placés, le plaisir des brillants, se fait aux dépends d’une répression véritable vis-à-vis du
scientifique moyen....
Mais, d’autre part, quand je parle d’une vie qui est digne d’être vécue, il ne s’agit pas seulement
de ma vie à moi, il s’agit de la vie de tous. Et je me rends compte que l’épanouissement que j’ai
pu réaliser dans une direction très limitée se faisait au dépends des possibilités d’épanouissement
d’autres personnes. Si certaines personnes se sont trouvées sous une pression psy-
chologique si forte qu’elles en sont parfois venues au suicide, c’est bien à cause
d’un consensus dominant qui faisait que la valeur de la personne était jugée, par
exemple, d’après sa virtuosité technique à démontrer des théorèmes, c’est-à- dire
à effectuer des opérations excessivement spécialisées - alors que, précisément, tout
le reste de lapersonne était complètement laissée dans l’ombre. C’est une chose que
j’ai expérimenté maintes fois. Quand on parle d’une certaine personne et que je demande “Qui
est-ce ?”, on me répond “C’est un con”, En voulant dire par là, entre mathématiciens, que
c’est un type qui soit démontre des théorèmes qui ne sont pas très intéressants, soit démontre
des théorèmes qui sont faux, ou bien ne démontre pas de théorèmes du tout.
Donc, là, j’ai défini un peu négativement ce que j’entends par une vie qui soit digne d’être
vécue. Je pense que, pour tout le monde, il y a possibilité d’épanouissement sans
que nous soyons jugés par les autres, par des critères aussi étroits, aussi étriqués.
En fait, je pense que cette échelle de valeurs a un effet directement mutilant sur
les possibilités d’épanouissement. Enfin, c’est un des aspects, je ne prétends pas répondre
ici à la question soulevée qui est très vaste ; mais dans l’optique où nous nous plaçons ici, en
partant de la pratique scientifique, c’est ce que je vois de plus immédiat à répondre....”
CAPı́TULO 6
Factorización de elementos e ideales: Las ideas de Gauss,

Lasker y Noether.
(“...hac re copiose loqui superfluum foret.” (Gauss)
“Meine Methoden sind Arbeits- und
Auffassungsmethoden...” (Noether))
“...les charmes enchanteurs de cette sublime science ne se

décèlent dans toute leur beauté qu’à ceux qui ont le courage
de l’approfondir.”
(C.F. Gauss, 1807)
“Problema, numeros primos a compositis dignoscendi, hosque
in factores suos primos resolvendi, ad gravissima ac
utilissima totius arithmeticae pertinere, et geometrarum tum
veterum tum recentiorum industriam ac sagacitatem
occupavisse, tam notum est, ut de hac re copiose loqui
superfluum foret. . . . [P]raetereaque scientiae dignitas
requirere videtur, ut omnia subsidia ad solutionem
problematis tam elegantis ac celebris sedulo excolantur”.
(C.F. Gauss, Disquisitiones Arithmeticae, 1801)
“Meine Methoden sind Arbeits- und Auffassungsmethoden,

und daher anonym überall eingedrungen.”
Emmy Noether, 1931.
(Texto de una carta de Noether a Hasse de 1931. Traducido
libremente como “Mis métodos son métodos de trabajo
([Arbeitssung Methoden]) y métodos conceptuales
([Auffassung Methoden]), y han penetrado anónimamente
por todas partes”.
293
294 6. FACTORIZACIÓN: GAUSS, LASKER. NOETHER
Índice
6.2. Dominios de factorización única: Lema de Gauss 295
6.2.1. Dominios de factorización única 295
6.2.2. Máximo común divisor en dominios de factorización única 298
6.2.3. El Lema de Gauss 301
6.2.4.1. Ley de Reciprocidad Cuadrática. 307
Sı́mbolo de Legendre. 307
La Construcción de Einsenstein 308
Una Reflexión sobre la Construcción de Einsenstein 310
El Lema de Einsenstein (1859) 310
6.2.4.2. (Otro) Lema de Gauss 311
6.2.4.3. Ley de Reciprocidad Cuadrática de Jacobi 312
Sı́mbolo de Jacobi. 312
Ley de Reciprocidad Cuadrática para el sı́mbolo de Jacobi 313
6.2.4.4. El test de R. Solovay y V. Strassen 313
6.3. El Teorema de Lasker-Noether (Existencia): “factorizando”
ideales en anillos noetherianos 314
6.3.1. Radical de un Ideal 315
6.3.2. Ideales Primarios 318
6.3.3. Descomposición Primaria en anillos noetherianos: Teorema de Lasker-
Noether 323
6.3.4. Unicidad (Primer Teorema): descomposición primaria, asociados e ideales
primos minimales de un anillo noetheriano 325
6.3.4.1. Unas palabras sobre los ideales primos minimales en Spec(R), con
R noetheriano. 328
6.3.5. Ejercicios y Problemas de la Sección 6.3 330
6.3.5.1. Cociente de Ideales 330
6.3.5.2. El Teorema de Lasker-Noether para módulos noetherianos 330
6.3.5.3. Anillos y módulos de Artin 333
6.1. Introducción
Ya vimos en la Sección 3.3 la noción de anillo noetheriano y cómo esa noción permite concluir
que un caso particular (los DIP’s) admiten factorización de sus elementos. Vimos el Teorema
de la Base de Hilbert en la Sección ?? que muchos anillos no principles son noetherianos (como
Z[X], K[X1 , X2 , X3 ] y otros). Más aún hay anillos que no son dominios y sı́ son noetherianos
(simplemente por paso al cociente con un ideal que no sea primo). Pero nos queda la pregunta
de si es posible alguna forma de factorización de todo tipo de ideales que, en algún sentido,
generaliza los ideales de C.F. Gauss sobre factorización y dominios de factorización única. De
eso nos ocupamos en lo que sigue del Capı́tulo. .
El primer resultado destacable de los anillos noetherianos no fue el de generalizar simplemente
la noción de Hilbert sino el demostrar que, dentro del contexto noetheriano se podı́a extender
la idea de factorizar elementos (como en el Capı́tulo precdente) a la idea de “factorizar” ideales,
aunque no sean principales. Ese es el conocido como Teorema de Lasker-Noether. Dado que los
elementos de un anillo de polinomios K[X1 , . . . , Xn ] se pueden expresar como producto único
de elementos primos, la pregunta natural era extender el concepto a ideales de K[X1 , . . . , Xn ] y
descomponerlos mediante ideales primos y sus potencias. No funcionó la cosa como se esperaba
y hubo que introducir los ideales primarios (que no siempre son potencias de primos).
Fue el alumno de D. Hilbert (y famoso jugador de ajedrez, a quien le interesaban más los tableros
que las matemáticas) E. Lasker, en su trabajo [Lasker, 1905] de 1905, quien demostró que se
podı́an descomponer ideales (en anillos de polinomios y anillos de series de potencias formales)
como intersección finita de ideales “irreducibles”. Pero fue, sin embargo, E. Noether quien lo
generalizó a todo anillo y módulo verificando las condiciones de cadena ascendente numerables
en su trabajo de [Noether, 1921]. Ası́ los anillos neotherianos y el pensamiento noetheri-
ano se transformó en métodos de trabajo y métodos concenptuales (“Methoden...Arbeits- und
6.2. DOMINIOS DE FACTORIZACIÓN ÚNICA: LEMA DE GAUSS 295
Auffassungsmethoden...”) según sus propias palabras. Hemos preferido seguir precisamente el

pensamiento de E. Noether por su elegancia e intensidad, lo que nos lleva a usar una noción
técnica espuria como ideal o submódulo irreducibles(i.e. artificial e innecesaria ’a posteriori’)
en honor de la promotora de la Teorı́a de Anillos en el primer tercio del siglo XIX.
Daremos el Teorema de Existencia de Lasker-Noether en la Sección 6.3. Debe señalarse que:
• La descomposición de ideales cualesquiera sobre anillos noetherianos (incluido el anillo
de polinomios K[X1 , . . . , Xn ] se hace a través de ideales primarios que no siempre son
irreducibles (noción artificiosa de conveniencia) ni primos, ni potencias de primos
(como sı́ sucedı́a con los dominios de factorización única o los ideales principales en
anillos noetherianos).
• La descomposición como intersección de ideales primarios no es única (como en el caso
de factorización única del pensamiento gaussiano), pero admite una cierta unicidad.
Aquı́ daremos un Primer Teorema de Unicidad (ver la Sección 6.3.4) de la descom-
posición primaria en el que se caracterizan los ideales primos asociados. Resultados
de unicidad (también incompleta) más detallados se verán más adelante en el texto.
El caso de la descomposición primaria de módulos sobre anillos noetherianos lo dejaremos para
la Subsección de problemas 6.3.5.2.
6.2. Dominios de factorización única: Lema de Gauss

Trataremos de introducir aquı́ el Lema de Gauss, uno de los resultados clásicos y centrales en
la historia del Álgebra.
6.2.1. Dominios de factorización única.
Definición 73. Dos elementos irreducibles p, q ∈ R en un dominio de integridad R se dicen
co-primos si no son asociados, es decir, si p 6∼ q.
Observación 6.2.1. Nótese que dos irreducibles p y q en un dominio R son co-primos si y

solamente si p - q y q - q.
Definición 74 (Dominios de Factorización Única). Un dominio de integridad R se de-

nomina dominio de factorización única si se verifican las siguientes propiedades:
i) Existencia de Factorización: Para cada elemento x ∈ R \ {0} existen u ∈ R× , un
conjunto finito S := {pi ∈ R ; i ∈ I} ⊆ R de elementos irreducibles, co-primos dos a
dos, y números naturales positivos {αi : i ∈ I} ⊆ N, tales que
Y
x=u pαi .
i
i∈I
Es decir, todo elemento no nulo de R es producto finito (eventualmente vacı́o) de

unidades y elementos irreducibles de R. A la lista formada por la unidad u, los primos
en S y los exponentes αi , se le denomina factorización de x.
ii) Unicidad de la Factorización: Para cada elemento x ∈ R, x 6= 0, dadas dos
factorizaciones: Y Y β
x=u pα
i =v
i
qj j ,
i∈I i∈J
×
donde u, v ∈ R son unidades, I y J son conjuntos finitos, αi , βj ∈ N son números
naturales no nulos y {pi : i ∈ I}, {qj : j ∈ J} son dos conjuntos de elementos
irreducibles y co-primos dos a dos, entonces,
• Los cardinales de I y J coinciden (i.e. ](I) = ](J)).
• Existe una biyección f : I −→ J, tal que
pi ∼ qf (i) , αi = βf (i) , ∀i ∈ I.
Es decir, la factorización es única salvo unidades de R y permutación entre los ı́ndices.
Observación 6.2.2. Obsérvese que, a partir de la Definición anterior, si R es dominio de

factorización única, un elemento u ∈ R que no posea divisores primos es necesariamente una
unidad de R.
Proposición 6.2.3. En dominios de factorización única, un elemento x ∈ R es primo si y

solamente si es irreducible.
Demostración. Esto es válido tanto para elementos nulos como no nulos por ser dominio
de integridad. Como todo primo es irreducible en dominios de integridad, sólo falta probar que
todo elemento irreducible p ∈ R no nulo es primo. Para ello, supongamos a, b ∈ R tales que
p | ab, siendo p irreducible. Entonces, existe h ∈ R tal que ph = ab.
Supongamos tres factorizaciones en irreducibles y unidades (una de a, otra de b y otra de h)
dadas mediante: Y Y β Y θ
a=u pα
i , b=v
i
qj j , h = ω hkk ,
i∈I j∈J k∈T
con las hipótesis habituales. Por tanto, tenemos dos factorizaciones de ab, Una que sale de
reordenar el producto siguiente:
β
Y Y
(6.2.1) ab = uv pα
i
i
qj j ,
i∈I j∈J
y otra que sale de reordenar el producto ph:

!
Y
(6.2.2) ab = ph = ω p hθkk .
k∈T
En todo caso, p aparece con exponente positivo en la factorización de ab = ph, descrita en la

Identidad (6.2.2). Por la unicidad de las factorizaciones en R (que es DFU), los irreducibles que
aparecen en ambas factorizaciones son los mismos salvo permutación o unidad. Luego p tiene
que aparecer con exponente positivo en la factorización de ab descrita en la Identidad (6.2.1).
Por tanto, se tiene que verificar alguna de las propiedades siguientes, luego su disyunción:
[∃i ∈ I, p ∼ pi ] ∨ [∃j ∈ J, p ∼ qj ].
Pero, en este caso, se tiene:
• Si p ∼ pi tendremos que p | a y
• si p ∼ qj , entonces p | b.
Por tanto, concluimos que
[p | a] ∨ [p | b].
con lo que habremos probado la primalidad de p.
Proposición 6.2.4. Sea R un dominio de integridad. Son equivalentes:

i) Todo elemento es producto finito de unidades y elementos primos.
ii) El anillo R es un dominio de factorización única.
Demostración. Por la Proposición 6.2.3 precedente se tiene inmediatamente la impli-
cación ii) =⇒ i). por tanto, nos concentramos en probar que i) =⇒ ii):
Supongamos que R es un dominio que satisface que todo elemento es producto finito de primos
y unidades. Ya satisface la condición de existencia de factorización porque en dominios de
integridad todo primo es irreducible. Nos queda por ver la Unicidad de la factorización.
Sea, pues, x ∈ R un elemento no nulo con dos factorizaciones:
Y Y β
x=u pα
i =v
i
qj j ,
i∈I i∈J
donde u, v ∈ R× son unidades, I y J son conjuntos finitos, αi , βj ∈ N son números naturales

no nulos y {pi : i ∈ I}, {qj : j ∈ J} son dos conjuntos de elementos primos y co-primos
dos a dos (es decir, ∀i, j ∈ I, i 6= j, pi 6∼ pj y ∀r, s ∈ J, r 6= s, qr 6∼ qs ). Tenemos los casos
siguientes:
• Si x ∈ R× , es decir, si x es unidad, entonces tanto I como J tienen que ser el conjunto
vacı́o. Si no fuera vacı́o alguno de ellos, entonces x no puede ser unidad. En ese caso
la unicidad de la factorización se verifica de manera obvia.
• Si x ∈ R \ (R× ∪ {0}), entonces ni I ni J son conjuntos vacı́os.
Nos ocupamos de este segundo caso. Para cada i ∈ I tenemos que, obviamente,
Y β
pi | x = v qj j .
i∈J
Como pi es primo, debe darse:

[pi | v] ∨ [∃j ∈ J, pi | qj ].
La primera opción no puede darse porque v ∈ R× es unidad, luego se tiene que dar la segunda,
es decir,
∃j ∈ J, pi | qj .
Pero como qj es primo, entonces, es irreducible, con lo que necesariamente, si pi | qj entonces,
pi ∼ qj . Probemos que sólo puede haber un j ∈ J tal que pi | qj .
Si existieran j1 , j2 ∈ J tales que pi | qj1 y pi | qj2 , por ser qj1 y qj2 irreducibles, entonces pi ∼ qj1
y pi ∼ qj2 . Por tanto, qj1 ∼ qj2 y necesariamente j1 = j2 .
Para cada i ∈ I, designemos por σ(i) = j ∈ J al único valor j ∈ J tal que pi | qj (o,
equivalentemente, al único j ∈ J tal que pi ∼ qj . Esto significa que la siguiente es un aplicación:
σ: I 7−→ J
i 7−→ σ(i).
Además, esta aplicación ha de ser inyectiva. Dados i1 , i2 ∈ I tales que σ(i1 ) = σ(i2 ) = j ∈ J.
Entonces tenemos pi1 ∼ qj y pi2 ∼ qj , luego pi1 ∼ pi2 y tendremos que, necesariamente, i1 = 22
y σ es una aplicación inyectiva.
Los mismos argumentos nos permitirán construir una aplicación
τ : J −→ I,
donde τ (j) = i si y solamente si qj ∼ qi . Es claro que τ es inyectiva y es fácil probar que
τ ◦ σ = IdI , σ ◦ τ = IdJ .
Para concluir la unicidad sólo falta concluir que αi = βσ(i) , ∀i ∈ I. Para ello, baste con recordar
que N es totalmente ordenado, con lo que o bien αi ≥ βσ(i) o αi ≤ βσ(i) . Supongamos el primer
caso, esto es, supongamos que αi ≤ βσ(i) . Entonces, tendrı́amos:
   
Y α β −α Y β
x = pα
i
i 
u αi
pk k  = qσ(i) σ(i)
qσ(i)
i
(u−1 v) qj j  .
k∈I\{i} j∈J\{σ(i)}
Además, como pi ∼ qσ(j) , existe ω ∈ R× una unidad tal que

pi = ωqσ(i) .
Nos queda,
   
Y βσ(i) −αi Y β
pα
i
i 
u pα k
= pα
i qσ(i)
i (ω αi u−1 v) qj j  .
k
k∈I\{i} j∈J\{σ(i)}
Sacando “factor común” (R es un dominio), tendremos:

    
Y α β −α Y β
αi 
pi u σ(i)
pk k  − qσ(i)
i
(ω αi u−1 v) qj j  = 0.
k∈I\{i} j∈J\{σ(i)}
Como hemos supuesto que x 6= 0, entonces pi 6= 0 y, dado que R es dominio, tendremos:

    
Y α βσ(i) −αi Y β
u pk k  − qσ(i) (ω αi u−1 v) qj j  = 0,
k∈I\{i} j∈J\{σ(i)}
es decir  
Y β −αi Y β
u pα σ(i)
(ω αi u−1 v) qj j  .
k = qσ(i)
k
k∈I\{i} j∈J\{σ(i)}
Ahora si βσ(i) > αi , tendrı́amos βσ(i) − αi ≥ 1 y, por tanto,

Y α
qσ(i) | u pk k .
k∈I\{i}
Siendo qσ(i) primo, debe ocurrir que ∃k ∈ I, k 6= i tal que qσ(i) | pk , luego qσ(i) ∼ pk y, sabiendo
que qσ(i) ∼ pi , concluirı́amos pi ∼ pk , con k 6= i, lo que es contradictorio con las hipótesis
que satisfacen las dos factorizaciones. Por tanto βσ(i) ≥ αi y βσ(i) 6> αi . Lo cual implica
necesariamente que βσ(i) = αi y tenemos la unicidad de la factorización en R.
Corolario 6.2.5. Todo dominio euclı́deo (resp. todo dominio de ideales principales) es do-
minio de factorización única.
Demostración. Obvio por los Teoremas 3.4.10 (caso de dominios euclı́deos) y Teorema
3.3.10 (caso de dominios de ideales principales). En ambos Teoremas se prueba la existencia
de factorización en irreducibles. De otro lado, en el Teorema 3.2.14 hemos probado que en los
dominios de ideales principales las nociones de primo e irreducible equivalen. Por tanto, se
tienen las hipótesis de la Proposición previa y tenemos probada la afirmación del Corolario.
6.2.2. Máximo común divisor en dominios de factorización única.

Proposición 6.2.6. Sea R un dominio de factorización única y sea F ⊆ R un conjunto de
elementos de R tal que F \ {0} =
6 ∅. El siguiente conjunto es un conjunto finito:
Vprin (F) := {p ∈ Spec(R) : F ⊆ p, p es principal}.
Supongamos Vprin (F) = {p1 , . . . , pm } de tal modo que pi = (pi ), 1 ≤ i ≤ m, con pi ∈ R es un
elemento primo. Entonces:
i) Si x ∈ R es un elemento que divide a todos los elementos de F, entonces existen
α1 , . . . , αm ∈ N y u ∈ R× tales que
x = upα αm
1 · · · pm .
1
ii) Definamos para cada k ∈ {1, . . . , m} la siguiente correspondencia:

ordpk : F \ {0} −→ N
f 7−→ max{n ∈ N : pnk | f }.
Entonces, ordpk es aplicación.
iii) Finalmente, definamos
ok := min{ordpk (a) : a ∈ F \ {0}},
y definamos el elemento h ∈ R dado mediante:
(6.2.3) h := po11 · · · pomm ∈ R,
Se verifican las siguientes propiedades:
(a) El elemento h ∈ R divide a todos los elementos de F, es decir,
∀a ∈ F, h | a.
(b) Dado x ∈ R un elemento que divide a todos los elementos de F, entonces x | h.
iv) Todo elemento x ∈ R que satisface las propiedades (a) y (b) anteriores está asociado
a h.
Al elemento h definido por la identidad (6.2.3) del item iii) anterior se le denomina máximo
común divisor de la familia F. Nótese que h es único salvo asociados y lo denotaremos mediante
:
gcdDFU (F).
En el caso, F = {a1 , . . . , as }, lo denotaremos mediante
gcdDFU (a1 , . . . , as ).
Demostración. Por simplicidad de las notaciones de la prueba, supongamos F := {ai :

i ∈ I}. En primer lugar, sea ai0 ∈ F \ {0} ⊆ R un elemento no nulo. Como R es dominio de
factorización única, podemos suponer:
ai0 = pβ1 1 · · · pβnn ,
con βi ≥ 1, pi primo, y, para cada i, j, pi y pj no son asociados si i 6= j. Esto siginifca que si
defino pi = (pi ) ⊆ R el ideal que genera pi , entonces pi ∈ Spec(R) y
{p1 , . . . , pn } = {p ∈ Spec(R) : ai0 ∈ p, p es principal}.
Obviamente,
Vprin (F) ⊆ {p1 , . . . , pn },
y es un conjunto finito. Supongamos que, como en el enunciado, se tiene m ≤ n tal que
Vprin (F) = {p1 , . . . , pm }.
Para probar la propiedad i), sea x ∈ R un elemento, de tal modo que x | ai para cada i ∈ I.
Consideremos p un divisor primo de x, entonces el ideal que genera p = (p) ∈ Vprin (F) porque
p divide a todos los elementos de F. En particular, podemos suponer que
x = upα αm
1 · · · pm ,
1
con u ∈ R y αi ∈ N (posiblemente 0). De hecho, podemos suponer los exponentes αi con la

propiedad de que pi - u.
Supongamos ahora que existe q ∈ R un divisor primo de u. Como q divide a u, entonces q
divide a x y tendremos que el ideal primo que genera q = (q) ∈ Vprin (F). Pero por construcción,
hemos visto que q 6= pi , con lo que q 6∈ Vprin (F). En conclusión, u no posee factores primos con
lo que, necesariamente, u ∈ R× .
La propiedad ii) es inmediata por la unicidad en la factorización en dominios de factorización
única.
Para la propiedad iii), tiene sentido considerar el mı́nimo de las clases de elementos enteros
no negativos considerada y, por tanto, h está bien definido. Para probar las propiedades (a)
y (b), obsérvese que como los exponentes ok ∈ N son mı́nimos de los órdenes ordpk (a), para
a ∈ F \ {0}, tenemos ok ≤ ordpk (a) para cada a ∈ F \ {0} y dado ai ∈ F, tendremos que
ordp1 (ai ) ordpk (ai )
ai = bp1 · · · pm ,
para algún b ∈ R y, por tanto, tendremos la identidad siguiente:
ordp (ai )−ok

ord (a )−o
ai = bp1 p1 i 1 · · · pm k h.
Como ordpk (ai ) − ok ≥ 0, concluiremos que

ordp (ai )−ok

ord (a )−o
bp1 p1 i 1 · · · pm k ∈ R,
lo que nos permite concluir que h | ai y, por tanto h | a, ∀a ∈ F.

Para la propiedad (b) de iii), sea x ∈ R un elemento que divide a todos los elementos de F.
Entonces, por la propiedad i), tendremos que x = upα αm
1 · · · pm , con u ∈ R
1 ×
y αi ∈ N. Por
tanto,
pα
k | ai , ∀i ∈ I.
k
Con ello concluimos que αk ≤ ordpk (a) para cada a ∈ F \ {0} y, por tanto, αk ≤ ok para cada
k, 1 ≤ k ≤ m. Entonces, es claro que x | h.
Finalmente, es fácil verificar la propiedad iv). Si y ∈ R verifica (a) entonces, y | h (por verificar
h la propiedad (b). De otro lado, si y ∈ R, verifica (b), entonces h | y, con lo que h e y estarán
asociados y termina la prueba del enunciado.
Observación 6.2.7. Si R es un dominio de factorización única, la anterior Proposición recoge,

obviamente, la usual manera de presentar el máximo común divisor en cursos pre-universitarios.
Proposición 6.2.8. Sea R un dominio de factorización única y sea F = {ai , : i ∈ I} ⊆ R

un conjunto de elementos que contiene algún elemento no nulo. Supongamos que el ideal a
generado por F es un ideal principal en R, esto es,
a = (F) = (h),
con h ∈ R. Entonces,
a = (gcdDFU (F)) ,
y, en particular, h ∼ gcdDFU (F).
Demostración. Usamos la Proposición precedente. Si (h) = (F), entonces h | ai , ∀i ∈ I.
Entonces, h | gcdDFU (F) y tenemos el contenido
a ⊇ (gcdDFU (F)) ,
De otro lado, (h) = (F) implica que existe J ⊆ I finito y existe {λj j ∈ J} tales que
X
h= λj aj .
j∈J
Por la Proposición precedente, (item iii) ) tenemos que

gcdDFU (F) | aj , ∀j ∈ I.
Entonces,  
X
gcdDFU (F) |  λj aj  = h,
j∈J
y tenemos el contenido:
a ⊆ (gcdDFU (F)) .
El hecho de que (h) = (gcdDFU (F)) implica que ambos generadores de un mismo ideal principal
son asociados, esto es,
h ∼ gcdDFU (F),
y el enunciado queda probado.
Observación 6.2.9. A partir de esta proposición tenemos que, en el caso de que un conjunto
F genera un ideal principal, su generador es el DFU-máximo común divisor. Esto hace que no
se distinga entre las dos denominaciones y se diga simplemente “máximo común divisor” (y se
denote gcd(F)) al máximo común divisor de F y se suprime la referencia al prefijo DFU (y al
sub-ı́ndice DFU) a partir de este momento.
Observación 6.2.10. De otro lado, con las mismas notaciones, se tiene:

Si R es un dominio de factorización única, el ideal a = (F) ⊆ R es principal si y solamente si
gdc(F) ∈ (F).
En particular, tampoco se verifica la identidad de Bézout con el máximo común divisor si el
ideal generado no es principal.
A modo de ejemplos concretos, baste tomar:
• En Z[X], que no es DIP, :
gcd(2, X) = 1, pero 1 6∈ (2, X) 6= (1) = Z[X].
• En K[X1 , X2 ], que no es DIP, :
gcd(X1 , X2 ) = 1, pero 1 6∈ (X1 , X2 ) 6= (1) = K[X1 , X2 ].
Observación 6.2.11. El máximo común divisor verifica las propiedades siguientes (de obvia
verificación):
i) Dados {ai : i ∈ I} un conjunto de elementos de un DFU R no todos nulos, entonces,
gcd(ai : i ∈ I) = 1 ⇐⇒ ¬ (∃p ∈ R, (p ∈ R es primo) ∧ (p | ai , ∀i ∈ I)) .
ii) Si R es un dominio de ideales principales, el máximo común divisor es el generador

del ideal que generan los elementos de estudio. Esto es, si R es dominio de ideales
principales,
(gcd(ai : i ∈ I)) = (ai : i ∈ I).
iii) Si (R, φ) es un dominio euclı́deo el máximo común divisor verifica que
φ(gcd(ai : i ∈ I)) = max{φ(a) : a | ai , ∀i ∈ I}.
6.2.3. El Lema de Gauss.

Definición 75 (Contenido y parte primitiva de un polinomio). Sea R un dominio
de factorización única y sea f ∈ R[X] \ {0} un polinomio univariado con coeficientes en R.
Supongamos que
f = ad X d + ad−1 X d−1 + · · · + a1 X + a0 .
Llamaremos
i) Contenido de f y lo denotaremos por cont(f ) al máximo común divisor de sus coefi-
cientes, esto es, al elemento de R dado mediante:
cont(f ) = gcd(ad , ad−1 , . . . , a1 , ao ) ∈ R.
ii) Un polinomio se dice primitivo si su contenido es una unidad de R.
iii) Parte primitiva de f y lo denotaremos por pp(f ) al resultado de dividir f por su
contenido, esto es, para cada i, 0 ≤ i ≤ d existe bi ∈ R tal que ai = bi cont(f ),
llamamos parte primitiva al polinomio en R[X] dado mediante:
pp(f ) := bd X d + bd−1 X d−1 + · · · + b1 X + b0 ∈ R[X].
Observación 6.2.12. En la anterior definición, tanto el contenido como la parte primitiva están
definidos salvo unidades en R. En lo que respecta al contenido, si escribimos cont(f ) = a ∈ R,
se verifica que cont(f ) = b, para cualquier b ∈ R con a ∼ b.
En cuanto a la parte primitiva, hemos visto que las unidades de R[X] son exactamente las
unidades de R (i.e. (R[X])× = R× ). Por tanto, cuando escribimos pp(f ) = g, estamos, en
realidad, usando igualdad salvo unidades en R y queremos decir que pp(f ) = g para cualquier
g ∼ f . Usaremos indistintamente la notación = y ∼ al referirnos a contenido y parte primitiva
de un polinomio, sabiendo que son “igualdades salvo unidades en R”.
Obviamente también, la parte primitiva de un polinomio es un polinomio primitivo.
Lema 6.2.13. Sea R un dominio de factorización única, sean {a1 , . . . , am } ⊆ R tales que
gcd({a1 , . . . , am }) = 1.
Sea a ∈ R \ {0} un elemento adicional. Entonces,
gcd({(aa1 ), . . . , (aam )}) ∼ a.
Demostración. Es un Lema técnico menor, que haremos. Para empezar es claro que
a | (aai ) para cada i, 1 ≤ i ≤ m. Por tanto,
a | gcd({(aa1 ), . . . , (aam )}).
Por tanto, existirá b ∈ R tal que ab = gcd({(aa1 ), . . . , (aam )}). En particular, existirán
α1 , . . . , αn ∈ R tales que αi ab = aai para cada i, 1 ≤ i ≤ m. Como estamos en un dominio de
integridad, tenemos que
a(αi b − ai ) = 0 =⇒ αi b = ai , ∀i, 1 ≤ i ≤ m.
En particular, b | ai para cada i, 1 ≤ i ≤ m. Pero como gcd({a1 , . . . , am }) = 1, concluiremos
que b ∈ R× y el resultado se sigue.
Este resultado, obviamente implica el siguiente Lema:

Lema 6.2.14. Sea R un dominio de factorización única y sea f ∈ R[X] un polinomio primitivo.
Sea a ∈ R una constante no nula. Entonces,
cont(af ) ∼ a, pp(af ) ∼ f.
Lema 6.2.15. Sea R un dominio de factorización única, si q(X) ∈ R[X] \ {0} es irreducible
entonces o bien q ∈ R y q irreducible en R o bien q ∈ R[X] \ R es un polinomio no constante
y, en ese caso, es un polinomio primitivo.
Demostración. De la descomposición q = cont(q)pp(q) deducimos que o bien cont(q) ∈
R× y q es primitivo o bien cont(q) 6∈ R× , en cuyo caso pp(f ) es una unidad en R[X] y, por
tanto, es una constante y q ∈ R× . En este segundo caso, q ∼ cont(q) en R y, necesariamente,
q es irreducible en R.
Lema 6.2.16 (Gauss). Si R es un dominio de factorización única, el producto de polinomios

primitivos es primitivo.
Demostración. Sea p ∈ R un elemento primo y sea p = (p) ∈ Spec(R) el ideal primo que
genera. Tenemos entonces el dominio de integridad R/p[X].. Podemos definir un epimorfismo
de anillos del modo siguiente:
· : R[X] −→ R/p[X]
Pd i
Pd i
f := i=0 ai X 7−→ f := i= (ai + p)X .
Si f es un polinomio primitivo, para cualquier p ∈ R primo, f 6= 0. En otro caso, eistirı́a un

elemento primo p ∈ R que divide a todos los coeficientes de f y, por tamto, p | cont(f ) 6∈ R× ,
contradiciendo el hecho de ser primitivo.
Supongamos ahora dos polinomios primitivos f, g ∈ R[X]. Como ambos son primitivos, para
cualquier elemento primo f 6= 0 y g 6= 0. Consideremos el polinomio producto f g ∈ R[X] y su
imagen por el epimorfismo precedente f g. Por ser morfismo de anillos se tendrá:
f g = f g.
Por ser R/p[X] un dominio de integridad, tendremos que f 6= 0 y g 6= 0, implicará que f g =
f g 6= 0. En particular, existirá un coeficiente de f g que no es divisible por p. En suma, no hay
ningún elemento primo (o irreducible) de R que divida simultáneamente a todos los coeficientes
de f g, luego su contenido es unidad cont(f g) ∈ R× y concluimos que f g es un polinomio
primitivo.
Observación 6.2.17. Nótese que hemos probado implı́citamente que si p es un elemento primo
de R, entonces p es primo en R[X].
Corolario 6.2.18. Dados dos polinomios univariados f, g ∈ R[X] no nulos, siendo R un

dominio de factorización única, entonces, se tiene:
pp(f g) ∼ pp(f )pp(g), cont(f g) ∼ cont(f )cont(g).
El mismo resultado se extiende de modo obvio a productos finitos de polinomios en R[X].
Demostración. Suponganos que tenemos:
a = cont(f ) ∈ R, f1 = pp(f ), b = cont(g) ∈ R, g1 = pp(g).
Entonces, por el resultado precedente, f1 g1 ∈ R[X] es un polinomio primitivo. Además, tenemos
f g = (ab)(f1 g1 ), con a 6= 0, b 6= 0
Luego por el Lema 6.2.14, concluimos que
ab = cont(f g), f1 g1 = pp(f ),
como afirma el enunciado.
Corolario 6.2.19. Todo divisor en R[X] de un polinomio primitivo es primitivo.

Demostración. Si g | f y f ∈ R[X] es primitivo, entonces existe h ∈ R[X] tal que f = gh.
Por tanto, tenemos:
cont(f ) = 1 = cont(g)cont(h),
y, por tanto, los contenidos de g y h son unidades lo que significa que g y h han de ser
primitivos.
Lema 6.2.20. Sea R un dominio de ideales principales, K su cuerpo de fracciones y f ∈ R[X]

un polinomio univariado primitivo. Entonces, las siguientes propiedades son equivalentes:
i) f es primo en R[X]
ii) f es irreducible en R[X]
iii) f es irreducible en K[X]
iv) f es primo en K[X]
Demostración. Hagamos la demostración de las diversas implicaciones:
• i) =⇒ ii): Es cierta en todo dominio de integridad.
• iii) ⇐⇒ iv): Es obvio porque K[X] es un dominio de ideales principales.
• ii) =⇒ iii): Supogamos ahora que f es primitivo e irreducible en R[X]. Supongamos
que f = gh en K[X]. En este caso, existen a, b ∈ R \ {0} dos elementos no nulos tales
que
ag ∈ R[X], bh ∈ R[X].
Por tanto, tendremos la siguiente igualdad en R[X]:
(ab)f = (ag)(bh).
Sean a1 = cont(ag), g1 = pp(ag), b1 = cont(bh), h1 = pp(bh), luego
(ab)f = (ag)(bh) = (a1 b1 )(g1 h1 ).
Tendremos, por el Lema 6.2.14:
pp((ab)f ) ∼ f,
Mientras que por el Corolario 6.2.18
f = pp((ab)f ) = pp((ag)(bh)) = pp(ag)pp(bh) = g1 h1 .
Como f es irreducible en R[X], tendremos f | g1 o f | h1 en R[X]. Por tanto,
f | (ag) ∨ f | (bh), en R[X].
Como a 6= 0 y b 6= 0 en R, entonces son unidades en K, con lo que concluimos:
f | g ∨ f | h, en K[X].
Lo que implica que f es primo en K[X] y, por tanto, irreducible.
• iii) =⇒ ii): Supongamos que f es irreducible en K[X]. Y supongamos que f se puede
descomponer en producto f = gh con g, h ∈ R[X]. Por el Corolario 6.2.19, tanto
g como h han de ser poliomios pritimivos. De otro lado, la igualdad f = gh se da
también en K[X]. En consecuencia, por ser f irreducible en K[X], tiene que darse
f ∼ g o f ∼ h en K[X]. Supongamos que f ∼ g en K[X]. Entonces, deg(f ) = deg(g)
y existe λ ∈ K \ {0} tal que λg = f . Como K es el cuerpo de fracciones de R, existirá
b ∈ R tal que bλ ∈ R, con lo que tenemos la igualdad en R[X]:
(bλ)f = bg.
Por el Lema 6.2.14, como f y g con ambos primitivos, concluiremos:
cont((bλ)f ) ∼ (bλ), pp((bλ)f ) ∼ f, cont(bg) ∼ b, pp(bg) ∼ g,
y,en particular, f y g difieren en una unidad de R y, por tanto, f | g.
• ii) =⇒ i):En el caso de que deg(f ) ≤ 0, f serı́a una constante en R y ya hemos visto que
en los dominios de factorización única primo e irreducible son dos nociones coincidentes
(ver Proposición 6.2.3). Supongamos entonces que deg(f ) ≥ 1. Obsérvese, en primer
lugar, que si f es irreducible, entonces, f es primitivo. Por tanto, f ∈ R[X] es primitivo
e irreducible en R[X] y, por tanto, es irreducible en K[X], luego es un elemento primo
de K[X].
Supongamos, entonces, g, h ∈ R[X] tales que f | gh en R[X]. Como f es primo en
K[X], o bien f | g en K[X] o bien f | h en K[X]. Sin pérdida de la generalidad,
supongamos que f | g en K[X]. Entonces, existirá k ∈ K[X] tal que g = kf en K[X].
Como los coeficientes de k están en K y K es el cuerpo de fracciones de R, existirá
b ∈ R tal que bk ∈ R[X], por lo que concluiremos que se da la siguiente igualdad en
R[X].
(bk)f = bg.
Supongamos g1 := pp(g) y, por el Corolario 6.2.18, tendremos que

g1 ∼ pp((bk))pp(f ) ∼ pp(bk)f,
porque f es primitivo. Por tanto f divide a g1 en R[X] y, por tanto, f | g en R[X],
con lo que habremos concluido que si f | gh en R[X] entonces o bien f | g o bien f | h
en R[X] y f es necesariamente primo.

Corolario 6.2.21. Con las notaciones anteriores, sea f ∈ K[X] un polinomio no nulo. En-
tonces, existe a ∈ R \ {0} tal que af ∈ R[X]. Además, si f es irreducible en K[X], la parte
primitiva pp(af ) ∈ R[X] es irreducible en R[X] y en K[X].
Demostración. Es lo que se ha probado en el resultado precedente.
Teorema 6.2.22 (Lema de Gauss). Si R es un dominio de factorización única, también es

dominio de factorización única el anillo de polinomios R[X1 , . . . , Xn ], para cualquier n ∈ N.
Demostración. En primer lugar observemos que basta con probar la afirmación siguiente:
Afirmación. Si R es dominio de factorización única, entonces el anillo R[X], de polinomios
en una variable con coeficientes en R, también es dominio de factorización única.
Si tenemos probada la afirmación anterior, entonces podemos conluir el teorema por inducción
en n. Ası́, si n = 1, la Afirmación nos garantiza que R[X1 ] es un dominio de factorización única.
Y si n > 1, nótese que
R[X1 , . . . , Xn ] = R[X1 , . . . , Xn−1 ][Xn ].
Como, por hipótesis inductiva, R[X1 , . . . , Xn−1 ] es dominio de factorización única, entonces,
también lo es R[X1 , . . . , Xn−1 ][Xn ] por la Afirmación y, por tanto, también lo será R[X1 , . . . , Xn ].
Por tanto, nos centraremos solamente en probar la afirmación indicada.
Demostración de la Afirmación. Para probar la Afirmación anterior, recordando la Proposición

6.2.4 bastará con demostrar que todo elemento de R[X] es producto finito de elementos primos
y unidades de R[X]. Denotemos por K := qf (R) el cuerpo de fracciones de R. Sea f ∈ R[X]
un polinomio cualquiera no nulo. Descompongamos
f = cont(f )pp(f ).
Sea f1 = pp(f ) ∈ R[X]. Como K[X] es un dominio de ideales principales, entonces es dominio
de factorización única, f1 se descompone en factores primos en K[X], es decir,
m
Y
f1 ; = qj (X)αj ,
j=1
con qj (X) ∈ K[X] irreducible para cada j, 1 ≤ j ≤ m. Para cada uno de tales subı́ndices j,
existirán constantes aj ∈ R no nulas, tales que aj qj ∈ R[X]. Por ejemplo, usando el producto de
los denominadores de los coeficientes de qj . Escribamos, Fj := pp(aj qj ) para cada j, 1 ≤ j ≤ m
y tenemos:
 
m m m m
α α
Y Y Y Y
( aj j )f1 = (aj qj (X))αj =  cont(aj qj )αj  Fj j .
j=1 j=1 j=1 j=1
Usando el Corolario 6.2.18, como f1 es primitivo en R[X] tenemos que :

     
m m m m m
α α α α
Y Y Y Y Y
f1 ∼ pp  aj j  f1  ∼ pp  cont(aj qj )αj  Fj j  ∼ pp( Fj j ) ∼ Fj j .
j=1 j=1 j=1 j=1 j=1
Además, como Fj difiere en una unidad de qj , tendremos que Fj es primitivo, irreducible y

primo en K[X]. Por el Lema 6.2.20, Fj es irreducible en R[X] y, por tanto, es primo en R[X].
Luego f1 es un producto finito de elementos primos en R[X].
De otro lado, es claro que si p ∈ R es un elemento primo, entonces p es primo en R[X]. En

particular, como R es dominio de factorización única, una factorización del contenido
Yn
cont(f ) = pβkk ,
k=1
es una descomposición de cont(f ) como producto finito de elementos primos de R[X].
En conclusión, f = cont(f )pp(f ) puede ser descompuesto como producto finito de elementos
primos de R[X] y, por la Proposición 6.2.4, R[X] es un dominio de factorización única.
Observación 6.2.23 (No todos los DFU’s son DIP). Por el Lema de Gauss precedente,
todo anillo de polinomios sobre un cuerpo K[X1 , . . . , Xn ] es dominio de factoirización única.
Pero para n ≥ 2, K[X1 , . . . , Xn ] no es dominio de ideales principales (ver iv) en Ejemplo 3.2.1).
Corolario 6.2.24. Si R es un dominio de factorización única, K su cuerpo de fracciones y

f ∈ R[X] \ {0}. La factorización de f en irreducibles viene dada por:
n m
α
Y Y
f= pβkk Fj j ,
k=1 j=1
donde
Qn
i) cont(f ) = k=1 pβkk es una factorización del contenido de f en producto de irreducibles
de R, Q
m α
ii) pp(f ) = j=1 Fj j es una factorización de pp(f ) como producto de polinomios primi-
tivos e irreducibles en R[X] (y, por tanto, irreducibles en K[X]).
Demostración. Es lo visto en la demostración del Lema de Gauss precedente.

Problema 221. Prueba que la parte primitiva de un polinomio es un polinomio primitivo.
Problema 222. Demuestra la afirmación (i) de la Observación 6.2.11.
Problema 223. Demuestra la afirmación (ii) de la Observación 6.2.11
Problema 224. Demuestra la afirmación (iii) de la Observación 6.2.11
Problema 225. Demuestra la afirmación y los ejemplos descritos en la Observación 6.2.10
Problema 226. Prueba que si R es un dominio de factorización única, entonces es ı́ntegramente
cerrado en su cuerpo de fracciones. Es decir, prueba que si R es dominio de factorización única,
si K = qf (R) es el cuerpo de fracciones de R y si ζ ∈ K es tal que existe un polinomio mónico
f ∈ R[X] tal que f (ζ) = 0, entonces ζ ∈ R. Explica este resultado en el contexto de la mal
llamada “regla de Ruffini” aprendida en los cursos de Bachillerato.
Problema 227. Definir contenido, parte primitiva y serie primitiva para series de potencias
formales σ ∈ R[[X]], donde R es un dominio de factorización única.
Prueba que si σ, τ ∈ R[[X]] son dos series primitivas, entonces su producto στ ∈ R[[X]] también
es primitiva. (Pista: seguir la prueba del Lema 6.2.16).
Problema 228. Prueba que si K es un cuerpo, el anillo de series de potencias formales K[[X]]
con coeficientes en K es un dominio de ideales principales. (Pista: Prueba que es un anillo con
un único ideal maximal).
Problema 229. Prueba que si R es un DFU y p ∈ R es irreducible, entonces p es irreducible
en R[X] y en R[[X]].
Problema 230. Prueba que si R es un dominio de ideales principales, entonces, el anillo de
series de potencias formales R[[X]] en una sola variable es un dominio de factorización única.
Problema 231. Prueba que si R es un dominio de factorización única, A ∈ Mn (R) una matriz
cuadrada con coordenadas en R, el anulador a := AnnR[X] (A) ⊆ R[X] es un ideal principal en
R[X]. Se dice que R es un dominio normal (o un dominio ı́ntegramente cerrado en su cuerpo
de fracciones).
Problema 232. Sea R un anillo cualquiera, no necesariamente un dominio de factorización

única. Generalicemos la noción de polinomio primitivo del modo siguiente: Un polinomio
f = a0 + a1 X + · · · + an X n ∈ R[X] se dice sub-primitivo si el ideal a := (a0 , . . . , an ) ⊆ R
que generan sus coeficientes satisface a = (1). Probar que dados dos polinomios f, g ∈ R[X] su
producto f g es un polinomio sub-primitivo si y solamente si f y g son sub-primitivos. ( Hint:
Para cada ideal maximal m de R, considérese el conjunto me = mR[X] la extensión de m a
R[X]. Es sencillo verificar que R[X]/me ∼ = (R/m)[X] que es un dominio de ideales principales
porque R/m es un cuerpo. Nótese que si f ∈ R[X], entonces f es sub-primitivo si y solamente
si la clase de f módulo me (es decir, el elemento f + me ∈ R[X]/me ) es no nulo para cualquier
maximal m de R. La razón es porque siempre hay un coeficiente de f que no está en el maximal
m de R. Para concluir la prueba, dados f, g ∈ R[X], supongamos que f g es sub-primtivo.
Entonces, para cualquier ideal maximal m de R, la clase f g + me 6= 0 en (R/m)[X]. Como
f g + me = (f + me )(g + me ) 6= 0 y (R/m)[X] es un dominio de integridad, entonces habremos
conlcuido que f + me 6= y g + me 6= 0 en (R/m)[X] para cualquier maimal m de R. por tanto,
tanto f como g son subprimitivos en R[X]. El recı́proco se demuestra por aun argumento
similar.)
Problema 233. Probad que el Lema de Gauss (Lema 6.2.16) puede demostrarse por un ar-
gumento idéntico al del problema anterior. Es decir, suponiendo que R es un dominio de
factorización única, repetir el argumento del problema anterior, reemplazando los ideales max-
imales m por los ideales primos p que son principales, es decir, por los ideales primos p de R
que están generados por un elemento irreducible.
Problema 234. Consideremos el anillo R := Z[X] de polinomios en una variable con coefi-
cientes en Z. Se pide:
i) Probar que las unidades en Z[X] satisfacen Z[x]× := Z× = {+1, −1}.
ii) Probar que el ideal n := (2, X + 1) ⊆ Z[X] es un ideal maximal propio que, además,
no es principal.
iii) Probar que el ideal m := (X, X 2 + 2) ⊆ Z[X] coincide con el ideal (2, X) y es maximal
en Z[X]. ( Hint: si 1 = a(X)X + b(X)(X 2 + 2), evaluando en X = 0 concluirı́amos
que 1 | 2 en Z).
iv) Probar que el polinomio X 2 − X + 4 ∈ Z[X] es un elemento irreducible.
v) Considerar la siguiente matriz A ∈ Ms (Z[X]):

2 X
A := .
X + 1 X2 + 2
Pruébese que det(A) := X 2 − X + 4.
vi) Pruébese que si P ∈ G(n, Z[X]) es una matriz inversible tal que

a(X) b(X)
P := .
c(X) d(X)
y existen p(X), q(X), h(X) ∈ Z[X] tales que

p(X) h(X)
PA = ,
0 q(X)
entonces p ∈ n y q ∈ m.
Problema 235. Con las notaciones del problema precedente, se pide:
i) Conclúyase que, si existe una matriz P ∈ GL(n, Z[X]) verificando las propiedades
precedentes, entonces o bien p ∈ Z× o bien q ∈ Z× . ( Hint: Si existiera tal matriz P ,
entonces,
p(X) · q(X) = det(P A) = ± det(A) = ±(X 2 − X + 4).
Como X 2 −X +4 es irreducible, entonces, o bien p(X) o bien q(X) han de ser unidades
en Z[X]× ).
ii) Conclúyase que la matriz A no puede ser equivalente a una matriz triangular superior
en M2 (Z[X]) haciendo solamente operaciones por filas inversibles ( Hint: Porque ni n
ni m pueden contener unidades de Z[X]).
iii) Haz una reflexión sobre la corrección de la prueba de Proofwiki (Prueba del caso
de anillos, llamada Proof 1) en la página https: // proofwiki. org/ wiki/ Square_
Matrix_ is_ Row_ Equivalent_ to_ Triangular_ Matrix . Reflexiona, por tanto, si el
enunciado que ahı́ se cita es cierto o falso y sobre el oscuro significado de ”Row Equiv-
alent” usado en ese texto.
iv) Reflexiona sobre la corrección de la prueba de la propiedad det(AB) = det(A) det(B)
que se exhibe en Proofwiki (también como Proof 1) en la página https: // proofwiki.
org/ wiki/ Determinant_ of_ Matrix_ Product .
6.2.4.1. Ley de Reciprocidad Cuadrática. Los problemas que siguen son una sencilla
descomposición de la prueba de la Ley de Reciprocidad Cuadrática de Gauss (cf. [Gauss, 1801]),
siguiendo la demostración de G. Einsenstein en [Eins,1859].
Sı́mbolo de Legendre. Sea p ∈ N un número primo impar y sea m ∈ N un entero positivo.
Se define el sı́mbolo de Legendre mediante la siguiente igualdad:

m p−1
:= m 2 mod p.
p
Es decir, es el resto módulo p de m(p−1)/2 . El sı́mbolo de Legendre aparece como tal en su obra
de 1789 (cf. [Legendre, 1789]).
Definición 76 (Residuos Cuadráticos). Sea p ∈ N un número primo y sea m ∈ Z un
número entero. Decimos que m es un residuo cuadrático módulo p si la ecuación siguiente
porsee solución en Fp :
X 2 − m = 0.
Nótese que m es un residuo cuadrático módulo p si y solamente si el polinomio X 2 − m ∈ Fp [X]
es reducible (lo que se puede decidir algorı́tmicamente usando, por ejemplo, el Algoritmo de
Berlekamp descrito en la serie de problemas expuestos en la Subsección 3.6.5.2
Problema 236 (Euler). Con las notaciones precedentes, pruébese la siguiente propiedad debida
a Euler:
“Sea p ∈ N un número primo impar. En número de residuos cuadráticos módulo p en F× p es
p−1
exactamente 2 .” ( Hint: Purébese que el conjunto de residuos cuadráticos módulo p es
2
p−1
{12 , 22 , 32 , . . . , }.)
2
Problema 237 (Criterio de Euler). Purébese la siguiente propiedad conocida como Criterio
de Euler (cf. [Euler, 1750]):
“ Con las notaciones precedentes, sea p ∈ N un número primo impar y sea m ∈ Z un entero,
entonces se tiene:

 1, si p - m y m es residuo cuadrático módulo p
m
= -1, si p - m y m no es residuo cuadrático módulo p
p
0, si p | m.

( Hint: Úsese el Teorema Pequeño de Fermat (ver Problema 151), obsérvese que
p−1 p−1
X −1 − 1 = (X 2 − 1)(X 2 + 1) = 0 en Fp [X],
y úsese el problema precedente.)
Problema 238. Realı́cense las tareas siguientes:

i) Probar que el sı́mbolo de Legendre m p es cı́clico de orden p.
ii) Probar que el sı́mbolo de Legendre es una función multiplicativa:

mn m n
= .
p p p
iii) Hallar los siguientes valores del sı́mbolo de Legendre:
• 2
m 1, si p - m.
=
p 0, si p | m.
•

−1 1, si p ≡ 1 mod 4.
=
p -1, si p ≡ 3 mod 4.
La Construcción de Einsenstein. Consideremos p ∈ N un primo impar y q ∈ N un
entero positivo impar tales que p no divide a q (i.e. p - q). Consideremos los intervalos abiertos
(0, p), (0, q) ⊆ R y definamos la región
R := (0, p) × (0, q) ⊆ R2 .
Y consideremos el conjunto de los puntos en R con coordenadas enteras:
Λ := Z2 ∩ R.
La siguiente imagen muestra los conjuntos R y Λ para p = 7 y q = 9, por ejemplo.
(p, q)
(0, q)
× ×
× ×
R (p, 0)
En el rectángulo R consideremos la diagonal D ⊆ R, es decir

q
D := {(x, y) ∈ R2 : y = x}.
p
Como p - 1, la diagonal D no contiene ningún punto de Λ. La figura siguiente muestra un
dibujo de la construcción.
(p, q)
(0, q)
× ×
× ×
R (p, 0)
Ahora consideremos dos nuevas rectas:

• La recta paralela al eje vertical pasando por (p/2, 0).
• La recta paralela al eje horizontal pasando por (0, q/2).
Ninguna de las dos contiene a ningún punto de Λ porque tanto p como q son impares. Consid-
eremos la imagen resultante con los puntos:
A := (0, 0), X := (p/2, 0), Y := (p/2, p/2), B := (p, 0), C := (p, q), Z := (p/2, q), W := (0, q/2).
C
(0, q) Z
× × ×
Y
W× ×
× × ×
A X B
4
Problema 239. Con la construcción precedente, sea ABC el triángulo descrito por los vértices
A := (0, 0), B := (p, 0), C := (p, q) dentro de la región precedente. Para cada u ∈ {1, . . . , p − 1}
sea Lu la recta paralela al eje vertical pasando por el punto (u, 0). Pruébese que
4

uq
] Lu ∩ Λ ∩ ABC ≤ b c,
p
donde b·c significa parte entera.
Con las misma notaciones precedentes dada Ω ⊆ Λ una región acotada (como Ω := R ∩ Λ
anterior), denotaremos mediante:
Ω1 := {(x, y) ∈ Ω : x 6∈ 2Z},
y
Ω2 := {(x, y) ∈ Ω : x ∈ 2Z}.
Problema 240. Con la construcción y las notaciones precedentes, pruébense las siguientes
igualdades:
i) Para cada Ω ⊆ Λ, acotadapor una región finita,
](Ω) = ](Ω1 ) + ](Ω2 ).
ii) Con las notaciones precedentes:
p−1
4
X
uq
] Λ ∩ ABC = b c,
u=1
p
donde b·c significa parte entera.

iii) Con las mismas notaciones:
4
X uq
] Λ ∩ ABC = b c.
2 p
u∈2Z∩{1,...,p−1}
iv) Retomando los puntos X := (p/2, 0), Y := (p/2, p/2), se tiene:

4
X uq
] Λ ∩ AXY = b c.
2 p−1
p
u∈2Z∩{1,..., 2 }
Una Reflexión sobre la Construcción de Einsenstein. Consideremos la siguiente re-

flexión
ϕ: R2 −→ R2
(x, y) 7−→ (p − x, q − y).
Problema 241. Pruébense las siguientes propiedades de ϕ:
i) ϕ2 = ϕ ◦ ϕ = IdR2 .
ii) Con las notaciones de los puntos sobre la construcción de Einsenstein, se tiene:
4 4
4 4
ϕ CY Z = AXY 1 , ϕ CY Z = AXY 2 .
2 1
Conclúyase que
p−1
4
X 2 4
4

uq
] Λ ∩ AXY = b c=] Λ ∩ AXY +] Λ ∩ CY Z .
u=1
p 2 2
Problema 242. Con las notaciones precedentes, considérese la región BXY C determinada por
los puntos B := (p, 0), X := (p/2, 0), Y := (p/2, q/2) y C := (p, q). Pruébese que
4

] Λ ∩ BXY C 2 = ] Λ ∩ CY Z mod 2.
2
Es decir, pruébese:
4

(−1)
]((Λ∩BXY C )
2
) = (−1)] Λ∩CY Z
2 .
Problema 243. Usando las notaciones y resultados precedentes, pruébese:
P p−1
b uq c b uq c 2 b uq c
P Y
(−1) u∈2Z∩{1,...,p−1} p = (−1) p = (−1) u=1 p .
u∈2Z∩{1,...,p−1}
El Lema de Einsenstein (1859). Se trata de resolver un problema un poco más difı́cil,

usando todos los elementos gráficos y los resultados precedentes. Es un Problema Opcional.
Problema 244 (Lema de Einsenstein, Opcional). Pruébese Sea p ∈ N un número primo
impar y sea m ∈ N un número impar no divisible por p (i.e. p - m). Entonces,
P p−1

m P
b uq c 2 b uq c
= (−1) u∈2Z∩{1,...,p−1} p = (−1) u=1 p .
p
( Hint: Para cada u ∈ {1, . . . , p − 1}, sea r(u) el resto de la división de um por p. Como p - m,
r(u) ∈ {1, . . . , p − 1}, y se tiene
um um r(u)
=b c+ .
p p p
Consideremos las cantidades
(−1)r(u) r(u) mod p ∈ 2§ ∩ {1, . . . , p − 1}.
Hay que probar que estos restos son números pares en 2Z ∩ {1, . . . , p − 1}. Además, si u 6= v
con u, v ∈ 2Z ∩ {1, . . . , p − 1}, entonces, hay que probar que
(−1)r(u) r(u) 6= (−1)r(v) r(v) mod p.
Esto permite definir una biyección
f: 2Z ∩ {1, . . . , p − 1} −→ 2Z ∩ {1, . . . , p − 1}
u 7−→ (−1)r(u) r(u) mod p.
Por tanto, se prueba que
Y Y Y
(−1)r(u) r(u) = u mod p = (−1)r(u) um mod p.
u∈2Z∩{1,...,p−1} u∈2Z∩{1,...,p−1} 2Z∩{1,...,p−1}
Identificando el primer y el tercer término de esta igualdad, concluir que

 
Y p−1
1= (−1)r(u)  m 2 ,
u∈2Z∩{1,...,p−1}
porque ](2Z ∩ {1, . . . , p − 1}) = p−1

2 . A prtir de este punto, basta con demostrar que

m P um
= (−1) u∈2Z∩{1,...,p−1} b p c mod p.)
p
Problema 245 (Ley de Reciprocidad Cuadrática, Gauss). Pruébese que dados p, q ∈ N
dos números primos impares, entonces,

p p p−1 q−1
= (−1)( 2 )( 2 ) .
p q
( Hint: Usar la construcción y el Lema de Einsenstein para concluir que
4

p ] Λ∩AXY
= (−1) .
q
Girando la figura y reflejándola (manteniendo los nombres), el Lema de Einsenstein implica
4

q ] Λ∩AW Y
= (−1) .
p
Mutiplicar ambas expresiones y calcular lo que sale.)
6.2.4.2. (Otro) Lema de Gauss. El Lema de Einsenstein se inspiró, sobre todo, en un
Lema de Gauss que pasamos a mostrar como problema a continuación.
Problema 246 ((Otro) Lema de Gauss, Opcional). Prébese el siguiente resultado:
Sea p ∈ N un número primo impar y mıN un entero positivo no divisible por p (i.e. p - m).
Consideremos el siguiente conjunto:
p−1
S := {um : 1 ≤ u ≤ }.
2
y definamos el conjunto siguiente:
S 0 := {x mod p : x ∈ S} ⊆ {1, . . . , p − 1}.
Sea n := ] ({r ∈ S 0 : p/2 ≤ r}), entonces,

m
= (−1)n mod p.
p
( Hint: Sigue las mismas pautas que el Lema de Einsenstein. De hecho, Einsenstein se inspiró
en esta visión de Gauss y, por lo que a nosotros respecta, puede usarse el Lema de Einsenstein
para esta prueba. Comienza considerando:
 p−1 
2
Y p−1 Y
Z := x=m 2  u mod p.
inS u=1
Define para cada x ∈ {1, . . . , p − 1} la función:

si 1 ≤ x ≤ p−1

x,
|x| := p+1
2
p-x, si 2 ≤ x ≤ p − 1.
Pruébese que:
p−1
2
Y
n
(−1) |um| = Z mod p.
u=1
Purub́ese, además, que la siguiente es una biyección:

{1, . . . , p−1
2 } −→ {1, . . . , p−1
2 }
u 7−→ |um mod p|.
Q p−1
Conclúyase que Z := 2
u=1 u y finalı́cese el Lema probando:
p−1 p−1
2 2
Y p−1 Y
n
(−1) u=m 2 u mod p.)
u=1 u=1
Problema 247. Pruébese el siguiente cálculo de residuos cuadráticos de 2 módulo un primo

p ∈ N impar:
i) Si p = 3 mod 8, entonces 2 no posee raı́ces cuadradas módulo p, i.e.

2
= −1 mod p.
p
ii) Si p = 7 mod 8 o si p = 1 mod 8, entonces:

2
= 1 mod p.
p
iii) Si p = 5 mod 8, entonces:

2
= −1 mod p.
p
6.2.4.3. Ley de Reciprocidad Cuadrática de Jacobi. Trataremos de establecer la
Ley de Reciprocidad Cuadrática para el sı́mbolo de Jacobi, como paso previo a un algoritmo
de tipo Monte Carlo para decidir si un entero es primo o compuesto.
Sı́mbolo de Jacobi. En su trabajo de 1837 (cf. [Jacobi, 1837]), C.G. Jacobi generaliza
el sı́mbolo de Legendre del modo siguiente:
Sean m, n ∈ N y supongamos que n es impar. Definimos el sı́mbolo de Jacobi mediante:
m α1 α2 αk
m m m
:= ··· ,
n p1 p2 pk
donde n factoriza en primos (impares) del modo siguiente:
αk
n = pα1 α2
1 p2 · · · pk .
Problema 248. Pruébense las siguientes propiedades del sı́mbolo de Jacobi:

i) Es multiplicativo con respecto al “numerador”, i.e. con n ∈ N impar se tiene:
m m m m
1 2 1 2
= .
n n n
ii) Es mutiplicativo con respecto al “denominador”, i.e. con n1 y n2 impares se tiene:

m m m
= .
n1 n2 n1 n2
iii) El sı́mbolo de Jacobi depende solamente del resto rem(m, n) de la división de m por n
es decir:
m rem(m, n)
= .
n n
Problema 249. Pruébense las siguientes propiedades:
i) Sea n ∈ N un entero impar y supongamos n = p1 · · · pr una factorización de n como
producto de primos impares posiblemente repetidos. Entones,
r
n − 1 X pi − 1
− =0 mod 2.
2 i=1
2
ii) Dados m, n ∈ N dos enteros positivos impares y supuestas dadas dos factorizaciones
en primos (impares) posiblemente repeidtos:
n := p1 · · · pr , m := q1 · · · qs .
Entonces,
r
! s

n−1 m−1 X pi − 1 X qj − 1 
× =  mod 2.
2 2 i=1
2 j=1
2
Ley de Reciprocidad Cuadrática para el sı́mbolo de Jacobi. Finalmente, extendamos

el sı́mbolo de Jacobi para cualesquier número entero del modo obvio. Se tiene
Problema 250 (Ley de Reciprocidad Cuadrática (Jacobi)). Pruébese el siguiente resul-
tado :
Dados m, n ∈ N dos enteros positivos impares y coprimos, entonces
m n m−1 n−1
= (−1) 2 2 .
n m
Adicionalmente, siendo n ∈ N impar, se tiene:

−1 n−1 2 n2 −1
= (−1) 2 , = (−1) 8 .
n n
Problema 251. Diseña un algoritmo para el cálculo del sı́mbolo de Jacobi de dos enteros posi-
tivos m, n ∈ N sin conocer la factorización de ninguno de ellos. ¿Es un algoritmo que realiza un
número de operaciones polinomial exponencial en el tamaño de los números involucrados?( Hint:
Combina la Ley de Reciprocidad cuadrática, con el uso del resto en el numerador).
6.2.4.4. El test de R. Solovay y V. Strassen. En esta serie de problemas mostraremos
el test de Solovay y Strassen (cf. [SoStr, 1977]), citado en el cuerpo del Capı́tulo y que usa
intensamente la Ley de Reciprocidad Cuadrática extendida por C.G. Jacobi.
Problema 252. Sea p ∈ N un número primo impar. Pruébese:
i) El polinomio X p−1 − 1 factoriza completamente en Fp [X]:
p−1
Y
p−1
X −1= (X − i).
i=1
Además todas sus raı́ces son distintas.
ii) Si, además n | (p − 1) entonces también el polinomio X n − 1 se escinde completamente
en Fp [X] y todas sus raı́ces on distintas.
×
iii) Sea g1 , g2 ∈ (Z/pZ) dos elementos del grupo de las unidades tales que gcd(g1 , g2 ) = 1.
×
Entonces el orden del producto g1 g2 en el grupo (Z/pZ) es el producto de los órdenes
de los elementos g1 y g2 .
×
iv) El grupo (Z/pZ) es un grupo cı́clico de orden (p − 1). Es decir, existen raı́ces (p −
1)−ésimas primitivas de la unidad y cada una de ellas es un generador del grupo
×
cı́clico (Z/pZ) .
Problema 253. Pruébese las siguientes propiedades:
×
Sea p ∈ N un número primo impar y g ∈ (Z/pZ) un elemento generador del grupo multiplica-
tivo de las unidades. Entonces,
i) Los residuos cuadráticos en Fp son de la forma:
{g r : 0 ≤ r ≤ p − 2, r ∈ 2Z}.
ii) Los elementos que no son residuos cuadráticos en Fp son de la forma:
{g r : 0 ≤ r ≤ p − 2, r ∈ 2Z + 1}.
Concluir que si p ∈ N es un número primo impar, entonces hay elementos en Fp que no son
residuos cuadráticos.
Problema 254. Pruébese la siguiente propiedad:
×
Sea p ∈ N un número primo impar. Entonces el grupo multiplicaivo de las unidades Z/p2 Z
es un grupo cı́clico de orden p(p − 1). Conclúyase que existe al menos un generador.
Dfinamos la siguiente noción:
Definición 77 (Testigo de Euler). Sea n ∈ N un número compuesto impar y a ∈ Z/nZ un
elemento no nulo con gcd(a, n) = 1. Diremos que a es un testigo de Euler para n si
n−1
a
a 2 6= mod n,
n
donde na es el sı́mbolo de jacobi.

Problema 255. Pruébese que si n ∈ N es un número compuesto impar, entonces hay al menos
×
un testigo de Euler en (Z/nZ) .( Hint: Distinguir los casos en los que n posee un factor múltiple
(∃p ∈ N, p2 | n) y el aso en el que todos sus factores primos tienen multiplicidad 1).
También introducimos la noción siguiente:
Definición 78 (Mentiroso de Euler). Sea n ∈ N un número impar y a ∈ Z/nZ un elemento

no nulo con gcd(a, n) = 1. Diremos que a es un mentiroso de Euler para n si
n−1
a
a 2 = mod n,
n
donde na es el sı́mbolo de jacobi.

Problema 256. Pruébese que si n ∈ N es un número impar, el número de testigos de Euler es

×
mayor que el número de mentirosos de Euler en (Z/nZ) .
Consideremos el siguiente Algoritmo
Algoritmo 6.2.25 (Test de Composición de Solovay-Strassen).
Input: n ∈ N, con n ≥ 3 y k ∈ N
guess randomly a1 , . . . , ak ∈ {2, . . . , n − 1}
for i := 1 to k, compute:
a
i
xi :=
n
n−1
if xi = 0 o xi 6= ai 2 mod p, para algún i Output Compuesto
else Output: Probablemente Primo
fi
end
Problema 257. Pruébense las siguientes propiedades:

i) Si el algoritmo responde Compuesto, el número n es un número compuesto.
ii) Si el algoritmo responde Probablemente Primo, el número n es primo con proba-
bilidad mayor que
1
1− k.
2
iii) El número de operaciones aritméticas realizadas es polinomial en el número de dı́gitos
de n (O(log2 (n))) y en k. Además, los enteros más grandes involucrados son de talla
acotada por O(log2 (n))
Este tipo de algoritmo con control de la probabilidad de error se llaman algoritmos de tipo
MonteCarlo (y, al ejecutarse en tiempo polinomial se denotan como la clase RP (random
polynomial time)) En este caso, es un test de Composición y no un test de primalidad (dado
que la seguridad en la respuesta está del lado de los número compuestos). Una manera alter-
nativa de presentarlo consiste en decir que Primes está en co-RP.
6.3. El Teorema de Lasker-Noether (Existencia): “factorizando” ideales en anillos

noetherianos
El primer enunciado esencial sobre anillos noetherianos es el Teorema de la Base de Hilbert
(Basissatz) (cf. [Hilbert, 1890]). Hemos visto, en la Sección ?? el Teorema de la base de
Hilbert (que ya anunciamos anunciamos en la Subsección de Problemas 3.4.4.2 y, más partic-
ularmente, en el Problema 135). El alumno también puede revisar los aspectos sobre anillos y
módulos noetherianos salpicados a lo largo del curso.
6.3. LASKER-NOETHER (EXISTENCIA) 315
6.3.1. Radical de un Ideal. Recordemos (Problema 53) que un elemento f en un anillo

R se denomina nilpotente si una potencia positiva suya se anula en el anillo R, es decir, si existe
n ∈ N, n ≥ 1, tal que f n = 0 en R.
Definición 79. Sea a un ideal de un anillo R. El radical de a en R es el conjunto de los
elementos cuyas clases f + a son elementos nilpotentes en el anillo cociente R/a. Es decir, el
conjunto dado por la siguiente igualdad:
√
a := {f ∈ R : ∃n ∈ N, f n ∈ a}.
√
Un ideal a se llama radical si coincide con sup radical, i.e. si a = a. Aquellos anillos sin
elementos nilpotentes no culos (i.e. tales que (0) = (0)) se les denomina anillos reducidos.
También pueden caracterizarse los elementos del radical del modo siguiente: Dado un elemento
f ∈ R y el ideal a consideremos el endormorfismo de R−módulos siguiente:
ηf : R/a −→ R/a
x + a 7−→ f x + a.
√
Entonces, un elemento f ∈ R está en a si y solamente si el endomorfismo ηf anterior es
nilpotente, es decir, si y solamente si existe n ∈ N, n ≥ 1 tal que ηfn = 0. En otras palabras, se
tiene:
Lema 6.3.1. Sea R un anillo, a ⊆ R un ideal y R/a el anillo cociente de R por a. Sea (0 + a)
el ideal cero del anillo cociente R/a. Se tiene:
√ p
a = {f ∈ R : f + a ∈ (0 + a)}.
En otras palabras, si π : R −→ R/a es la proyección canónica sobre el anillo cociente, entonces,
√ p p
a = π −1 ( (0 + a) = ( (0 + a))c ,
donde la contracción del ideal se refiere a la contracción con respecto al morfismo π (ver
Proposición 1.4.9, ı́tem v)).
Demostración. Es mera reconstrucción de las frases que preceden a este enunciado.
Proposición 6.3.2. Sea R un anillo. Se tiene:

• El conjunto de todos p los elementos nilpotentes de un anillo R es un ideal de R. En
particular,√el radical (0) del ideal (0) de R es un ideal de R.
• El radical a de un ideal a de R es un ideal de √ R que contiene al ideal a.
• Para cualquier ideal a de R, anillo cociente R/ a no tiene elementos nilpotentes no
nulos.
Diremos que un anillo es reducido si no posee elementos nilpotentes no nulos o, equivalente-
mente, si (0) es un ideal radical.
p ón. Basta con probar el resultado i). Aplicando i) al anillo cociente, obten-
Demostraci
dremos que (0 + a) es un ideal en R/a. Por el Lema precedente, el radical de un ideal a es la
contracción de un ideal de R/a. Por el ı́tem√v) de la Proposición 1.4.9, toda contracción de un
ideal es también un ideal y concluimos que a es ideal de R.
Para probar i), basta con probar que la suma y el producto de elementos nilpotentes es nilpo-
tente. Para ello, sean x, y ∈ R tales que xm = 0 e y n = 0, con n, m ∈ N, n, m ≥ 1 y z ∈ R.
Entonces, Tendremos que
(zy)m = 0,
y
n+m
X
(x + y)n+m = cn+m,k xk y n+m−k = 0,
i=0
donde cn+m,k es o bien el número combinatorio n+m

k o 0 dependiendo de la estructura de
grupo abeliano de R. √
Para√probar iii) nótese que los elementos nilpotentes de√R/ a son, precisamente,
√ los elementos
n
f + a tales que existe n ∈ N, n ≥ 1, verificando (f √ + a) = 0 en R/ a. Esto es equivalente
a decir que existe n ∈ N, n ≥ 1, verificando f n ∈ a. Pero esta condición significa que existe
√
m ∈ N, m ≥ 1 tal que (f n )m ∈ a y esto implica f nm ∈ a, con nm ∈ N, nm ≥ 1. Luego f ∈ a
como se pretende.
Proposición 6.3.3 (Propiedades inmediatas del radical). Sea a, b dos ideales de un anillo
R. Se tiene:
p√ √
i) √ a =√ a, √
√
ii) √ab = a ∩ b = a ∩ b,
iii) a = R siq y solamente si a = R,
√ √ √
iv) a + b = a + b,
√
v) Si p ∈ Spec(R), pn = p, para todo n > 0.
Demostración. Siendo de fácil demostración que dejamos como Problema 258.
Ejemplo 6.3.4 (Radicales de ideales principales en DFU’s). Sea p ∈ R un elemento

primo, es decir, un elemento tal que el ideal principal (p) (o también pR) que genera es un
ideal primo de R. Denotemos por p = (p). Por la Proposición 2.2.19, sabemos que el producto
de los generadores de dos ideales genera el ideal producto, por lo que un generador de pn es
exactamente el conjunto {pn } . Dicho de otra manera, sabemos que pn = (pn ). Entonces, el
radical de un ideal (pn ) generado por una potencia de un elemento primo (p) ∈ Spec(R) es
precisamente el ideal primo. Esto es,
p
(pn ) = (p).
Supongamos que R es un DFU y sea a = (a) un ideal principal en R. Sabemos que a factoriza
en R como producto finito de eleentos primos dos a dos no asociados, esto es,
a = pα αr
1 · · · pr ,
1
donde p : i ∈ R es primo, αi ∈ N, αi ≥ 1 y dados i, j ∈ [r], con i 6= j, entonces pi y pj no

son asociados como elementos de R. Entonces, en términos de ideales, esa igualdad se expresa
mediante
a = pα αr
1 · · · pr ,
1
donde cada ideal primo pi = (pi ). Aplicando la elemental Proposición precedente, concluimos
que:
r q r
√ q \ \
a = pα 1
1
· · · pαr
r = pαi
i = pi = p1 · · · pr .
i=1 i=1
La última igual se tiene porque cada pi es principal y primo en un DFU. En conclusión, si
a = (a), tenemos que
√
a = (p1 · · · pr ).
Obviamente, el mismo resultado se tiene si, además de ser DFU, el anillo R es DIP.
Ejemplo 6.3.5. En el ejemplo precdente hemos preludiado alguna de las ideas que subyace al
Teorema de Lasker-Noether aunque, como veremos, es sólo un idea sesgada e incompleta. Es
decir, supongamos que a es un ideal cualquiera en un anillo cualquiera (no necesriadamente
DFU, ni tampoco a es principal). Supongamos que a es una producto de potencias de primos,
i.e.
a = pα αr
1 · · · pr ,
1
Entonces,
√
a = p1 ∩ · · · ∩ pr .
Los mismo sucede para las intersecciones de potencias de ideales primos por la Proposición
elemental precdente. Como veremos, no todos los ideales son producto (ni siquiera intersección)
de potencias de ideales primos. Esta especia de generalización de las ideas de Gauss falla ya
para anillos noetherianos y propiciará el Teorema de Lasker-Noether.
Ejemplo 6.3.6. Sea (X, T ) un espacio topológico y sea C (X) el anillo de las funciones continuas
a valores reales sobre X. Es obvio observar que C (X) no posee elementos nilpotentes no nulos
(incluso si poseyera divisores de cro no nulos, como en el caso en que X no sea conexo). Por
tanto, C (C) es un ejemplo natural de anillo reducido.
Más aún, sea F ⊆ X un subconjunto cualquiera. Definamos IC (F ) como el siguiente conjunto:
IC (F ) := {f ∈ C (X) : f ≡ 0}.

F
Es sencillo observar que IC (F ) es un ideal en C (X) (si dos funciones se anulan en F , su suma
también se anulará, etc.). Es sencillo observar también que si f sin C (X) es tal que una potencia
suya f n se aula en F , entonces, por ser R un cuerpo, f debe anularse en F . Es decir, se tiene
p
IC (X) = IC (X),
y concluimos que IC (F ) es un ideal radical en C (X). Será un ejemplo inspirador que, a su vez,
nos llevará al Nullstellensatz que veremos en Capı́tulos posteriores.
Proposición 6.3.7. Sea f : R −→ T es un morfismo de anillos y b ( T es un ideal propio de

T . Entonces, se tiene: √ c √
b = bc .
√ c √
Demostración. Supongamos que x ∈ b . Entonces, f (x) ∈ b por cuanto existirá
n∈√ N tal que f (xn ) = (f (x))n ∈ b. En particular, f (xn ) ∈ b implca que xn ∈ bc y, por tanto,
x ∈ bc . √
Para el otro contenido supongamos x ∈ R tal que x ∈ bc . Entonces existirá n ∈ N tal
√ √ c
que xn ∈ bc . Por tanto, f (xn ) = (f (x))n ∈ b. Luego f (x) ∈ b y, por tanto, x ∈ b ,
concluyendo la veracidad de las dos inclusiones.
Proposición 6.3.8. Si a es un ideal de un anillo R, su radical es la intersección de todos los

primos que le contienen, es decir,
√ \
a = {p : p ⊇ a, p ∈ Spec(R)},
donde Spec(R) es el conjunto de todos los ideales primos de R.
Demostración. Por tradición notacional, escribamos
V (a) := {p ∈ Spec(R) : p ⊇ a},
y denotemos, por simplicidad de la notación, mediante b al siguiente ideal de R:
\
b := p.
p∈V (a)
√
Supongamos que p ∈ V (a). Si f ∈ a, entonces, existe n ∈ N, n ≥ 1, tal que f n ∈ a. Pero como
a ⊆ p, entonces f n ∈ p, n ≥ 1. Supongamos que n0 ∈ N es el mı́nimo de los números naturales
tales que n0 ≥ 1 y f n0 ∈ p. El número n0 existe porque N es un conjunto bien ordenado y, por
hipótesis, existe n ≥ 1 tal que f n ∈ p. Si n0 = 1 ya hemos terminado. Supongamos n0 ≥ 2.
Como p es un ideal primo, tendremos que
f n0 = f · f n0 −1 ∈ p =⇒ f ∈ p ∨ f n0 −1 ∈ p.
Como
√ n0 es mı́nimo, no es posible que f n0 −1 ∈ p, por cuanto f ∈ p. Por tanto, hemos probado
a ⊆ b, tal como ha sido definido anteriormente.
Para el otro contenido, usaremos el Lema de Zorn y la Proposición precedente. Bastará con
que p \
(0) = p.
p∈Spec(R)
Haremos una prueba similar a la del Teorema 4.2.8. Supongamos que f no es nilpotente y
probemos que debe existir un ideal primo p ∈ Spec(R) tal que f 6∈ p. Para empezar, como f no
es nilpotente, entonces f 6= 0. Consideremos el siguiente conjunto de todas las potencias de f :
Sf := {f n : n ∈ N}.
Ahora consideremos el siguiente conjunto formado por ideales de R:

If (R) := {b ⊆ R : Sf ∩ b = ∅, b ideal de R}.
Este conjunto es no vacı́o, dado que, como f 6= 0 y f no es nilpotente, entonces (0) ∈ If (R).
Como en el Teorema 4.2.8, cambiando 1 por el conjunto Sf en aquella demostración, es claro
que toda cadena de elementos de (If (R), ⊆) posee cota superior. Por tanto, aplicando el Lema
de Zorn, existe algún elemento maximal m ∈ If (R). Veamos que m es necesariamente un ideal
primo de R.
Supongamos que no lo fuera y que existen p, q ∈ R tales que p 6∈ m y q 6∈ m de tal modo que
pq ∈ m. Tenemos los siguientes contenidos estrictos de ideales de R.
m ( m + (p), m ( m + (q).
Como m es un elemento maximal en If (R) ninguno de esos dos ideales estrictamente mayores
que m está en If (R), es decir,
m + (p) 6∈ If (R), m + (q) 6∈ If (R).
Por tanto,
(m + (p)) ∩ Sf 6= ∅, (m + (q)) ∩ Sf 6= ∅.
Por tanto, existen n, m ∈ N tales que n ≥ 1, m ≥ 1 tales que
f n ∈ m + (p), f m ∈ m + (q).
Por tanto, existen m1 , m2 ∈ m y λ1 , λ2 ∈ R tales que:
f n = m1 + λ1 p, f m = m2 + λ2 q.
Por tanto,
f n+m = f n f m = m1 m2 + (λ1 p)m2 + (λ2 q)m1 + λ1 λ2 (pq).
Como m1 , m2 ∈ m, entonces m1 m2 + (λ1 p)m2 + (λ2 q)m1 ∈ m y como pq ∈ m, entonces
λ1 λ2 (pq) ∈ m. Por tanto, hemos probado que
f n+m ∈ m,
en contradicción con el hecho m ∈ If (R).
Concluimos ası́ que m ∈ If (R) y m ∈ Spec(R). Pero eso es imposible dado que f está en todos
los primos de R y m ∈ Spec(R) lo que contradice el hecho de que f 6∈ m. Concluimos ası́ que
si f no es nilpotente, existirı́a un primo en Spec(R) al que f no podrı́a pertenecer y tenemos
probada la segunda inclusión del enunciado.
Observación 6.3.9. De hecho, la prueba se simplifica notablemente si f ∈ R no es un elemento

nilpotente, tiene sentido considerar la localización Rf y argumentar con el Teorema 4.2.8: Como
los ideales primos de Rf son las localizaciones de los primos de R que no contienen a f y
MaxSpec(Rf ) 6= ∅, entonces hay un primo p de R tal que f 6∈ p. Pero necesitarı́amos llegar a
los aspectos de localización que, por razones estructurales, hemos pospuesto hasta el Capı́tulo
??.
6.3.2. Ideales Primarios. Ya hemos sugerido que no todo ideal propio de un anillo, ni
siquiera cuando es noetheriano, va a ser una intersección (o producto) de potencias de ideales
primos. En otras palabras, las potencias de ideales primos no van a bastar para “factorizar”
ideales que no sea principales. Sugre ası́ la noción que reemplaza a la noción de “potencia de
ideal primo” que será la noción de ideal primario de Lasker y Noether.
Haremos el estudio con la perspectiva de poder extender los resultados para R−módulos noethe-
rianos (de tal modo que sea sencillo generalizar a módulos nuestro discurso para anillos). Pero
nos restringiremos al caso de anillos y dejaremos para los Problemas el caso de R−módulos.
Para empezar retomamos nuestras homotecias. Sea M un R−módulo. Para cada elemento
a ∈ R, denotaremos por ηa,M en endomorfismo de R−módulos definido, de nuevo del modo
siguiente
ηa,M : M −→ M
m 7−→ am.
que denominamos la homotecia de razón a sobre M . La generalización de lo que sigue pasa por
considerar esta homotecia como elemento fundamentador. En la Sección, nos restringiremos
al caso del R−módulo M := R/q y de la homotecia ηa,R/q , dejando el caso general para los
problemas. Por garantizar que esta homytecia, en este caso, queda definida con precisión,
observamos que viene dada por la siguiente expresión:
ηa,R/q : R/q −→ R/q
x + q 7−→ ax + q.
En ocasiones, cuando no haya posibilidad de confusión, escribiremos simplemente ηa , pero hay
que ser cuidadoso con estanotación en muchos casos.
Recordemos también la noción de endomorfimso nilpotente de un R−módulo M como el en-
domorfismo φ : M −→ M tal que existe n ∈ N, n ≥ 1, verificando φn ≡ 0, donde φn es la
composición de φ consigo mismo n veces.
Lema 6.3.10. Sea R un anillo, M un R−módulo, las homotecias verifican las siguientes propiedades:
i) Si a = 0 es el elemento nulo del anillo, η0,M ≡ 0 es el endomorfismo nulo de M .
ii) Si a = 1 es el elemento unidad para el producto del anillo, entonces η1,M = IdM es el
endomorfismo identidad sobre M .
iii) Dados a1 , a2 ∈ R dos elementos, se verifican las siguientes identidades:
ηa1 +a2 ,M = ηa1 ,M + ηa2 ,M , ηa1 a2 ,M = ηa1 ,M ◦ ηa2 ,M = ηa2 ,M ◦ ηa1 ,M ,
donde ◦ significa composición de aplicaciones
En otras palabras, el siguiente es un morfismo de anillos con unidad (aunque el segundo anillo
no sea conmutativo):
H : (R, +, ·) −→ (HomR (M, M ), +, ◦)
a 7−→ ηa,M .
Demostración. Es un sencillo ejercicio de comprobación.
Obviamente, el resultado se mantiene cuando M = R/q es el R−módulo cociente de R ‘por un

ideal propio. En particular, obseravmos que si a ∈ R y el enformismo ηa,R/q es nilpotente es
porque existe un entero positiovo n ∈ N, n ≥ 1, tal que

ηa,R/q = ηan ,R/q ≡ 0,
es el enodmorfismo idénticamente nulo. Esto conduce a la siguiente observación en forma de
Corolario:
Corolario 6.3.11. Si R es un anillo, q es un ideal propio de R y a ∈ R, entonces son
equivalentes:
i) El endomorfismo ηa,R/q es nilpotente.
√
ii) a ∈ q.
Demostración. Sencillo ejercicio a partir de la Proposición precdente.
Definición 80 (Ideal primario). Sea R un anillo y sea q ( R un ideal propio de R. Decimos

que es un ideal primario si para cada a ∈ R, el endomorfismo ηa,R/q es inyectivo o nilpotente.
Proposición 6.3.12. Si q es un ideal primario de anillo R, entonces el siguiente conjunto:

p := {a ∈ R : ηa,R/q no es inyectiva},
√
es un ideal primo de R. En particular, p = q ∈ Spec(R) es el radical de q y el radical de un
ideal primario es un ideal primo. Diremos que el ideal q es p−primario.
Demostración. Como q es primario, un elemento a ∈ R está en p si y solamente si a + q
√
es nilpotente en R/q o, equivalentemente, ηa,R/q no es inyectivo si y solamente si a ∈ q.
√
Con ello concluimos que p = q y p es un ideal de R. Veamos, además, que p es un ideal
primo de R. Para ello, consideremos a, b ∈ R son tales que ab ∈ p. Y también recordamos que
ηab,R/q = ηb,R/q ◦ ηa,R/q = ηa,R/q ◦ ηb,R/q , donde ◦ es la composición de endomorfismos. Pero
si ηa,R/q y ηb,R/q fueran inyectivas, también lo serı́a su composición ηab,R/q . Por tanto, o bien
ηa,R/q o bien ηb,R/q es no inyectiva. Luego, o bien a ∈ p o bien b ∈ p y habremos probado que
p es un ideal primo de R.
Proposición 6.3.13. Un ideal propio q ( R es primario si y sólo sı́verifica la siguiente

propiedad involucrando cuantificadores:
√
∀x, y ∈ R, xy ∈ q ∧ x 6∈ q =⇒ y ∈ q.
Demostración. Supongamos que q es primario y sean x, y ∈ R tales que xy ∈ q y x 6∈ q.
Observamos que
ηy,R/q (x + q) = xy + q = 0 + q.
Por tanto, x + q 6= 0 + q es un elemento del núcleo de ηy,R/q . Como q es primario y ηy,R/q no
√
es inyectiva, entonces es nilpotente y, por el Corolario precedente, concluimos que y ∈ q.
Recı́procamente, supongamos que se verifica la propiedad expresada con cuantificadores del
enunciado. Consideremos a ∈ R un elemento cualquier y la homtecia ηa,R/q que define. Si la
homotecia ηa,R/q es inyectiva no hay nada que probar. Supongamos, por tanto, que la homotecia
ηa,R/q no es inyectiva. Existirá b ∈ R tal que b + q es no nulo en R/q y está en el núcleo de
ηa,R/q . Es decir b 6∈ q y se tiene:
ηa,R/q (b + q) = ab + q = 0 + q.
En otras palabras, tenemos que ab ∈ q y b 6∈ q, por tanto, usando la propiedad asumida
√
concluimos que a ∈ q. Pero, como ya se indicón anteriormente, esto es equivalente a decir
que ηa,R/q es un endomorfismo nilpotente cuando no es inyectivo. En suma q es primario.
Corolario 6.3.14. Sea f :−→ T un morfismo de anillos y sea q ⊆ T un ideal primario de

T . Entonces, la contracción qc := f −1 (q) ⊆ R es un ideal primario. Más aún, si q es un ideal
p−primario de T , con p ∈ Spec(T ), entonces qc es pc −primario, donde pc ∈ Spec(R) es la
contracción a R del ideal primo p ∈ Spec(T ).
Demostración. En primer lugar, por la Proposición 6.3.7 precedente, sabemos que
√ c √
pc = ( q) = qc .
Por tanto, si qc es primario, ha de ser pc −primario. De otro lado, sea a ∈ R un elemento
cualquiera y consideremos el morfismo de R−módulos
ηa := ηa,R/qc : R/qc −→ R/qc
x + qc 7−→ ax + qc .
Si ηa es nilpotente, entonces existe n ∈ N tal que ηan = 0 lo que
√ implicarı́a an (1+qc ) = an +qc =
c c c
0 + q . En otras palabras, si ηa es nilpotente, entonces a ∈ q = p .
Por reducción al absurdo, supongamos que ηa no es nilpotente, a 6∈ pc y ηa no es inyectivo.
Entonces, existe x ∈ R \ qc tal que ηa (x + qc ) = 0 + qc . Es decir, tendrı́amos que ax ∈ qc y,
por tanto, f (a)f (x) = f (ax) ∈ q. Pero, entonces,el siguiente morfismo de T −módulos no serı́a
inyectivo:
ηf (a) := ηf (a),T /q : T /q −→ T /q
y + q 7−→ f (a)y + q.
Este morfismo es no inyectivo porque x 6∈ qc implica y = f (x) 6∈ q, luego f (x) + q 6= 0 + q es
un elemento no nulo en T /q. Pero ηf (a) (f (x) + q) = 0 + q. Por tanto, ηf (a) no es inyectivo
√
y, como q es primario, entonces ηf (a) es nilpotente, lo que impñlica que f (a) ∈ q = p. Por
tanto, f (a) ∈ p lo que implica a ∈ pc contradiciendo nuestras hipótesis. En conclusión, para
cada a ∈ R o bien ηa es nilpotente o bien es inyectivo y, por tanto, qc es un ideal primario de
R.
Los siguientes ejemplos sirven para mostrar que los ideales primarios tratan de generalizar
los conceptos de potencia de un ideal primo en un dominio de ideales principales. Pero la
generalización no consiste de manera obvia en pensar en potencias de ideales primos.
Proposición 6.3.15. Sea q ( R un ideal propio de un anillo R y supongamos que su radical es

√
un ideal maximal de R, es decir, supongamos que q = m ∈ MaxSpec(R) es un ideal maximal.
Entonces, q es m−primario.
Demostración. Consideremos, en primer lugar, el anillo cociente R/q. Consideremos

cualquier submóudlo de R/q como R−módulo que no son otra cosa que los ideales de R/q.
Consdieremos el espectro primo de ese anillo cociente Spec(R/q). Sabemos que los primos del
anillo R/q son de la forma p/q donde p ∈ Spec(R) es un ideal primo en R que, ademásn contiene
al ideal q. Por las propiedaes del radical sabemos que
√ √
m = q ⊂ p = p.
Como m es maximal y p es un ideal propio, concluimos que el espectro primo y el espectro
maximal de R/q son iguales y satisfacen:
Spec(R/q) = MaxSpec(R/q) = {m/q}.
En otras palabras, R/q es lo que llamaremos un anillo local, es decir, que posee un único ideal
√
maximal
p (terminologı́a que retomaremos más adelante). Además, como q = m, entonces
(0 + q) = m/q es una igualdad de ideales en R/q. Por tanto, los elementos a + q ∈ R/q son
de dos tipos:
×
• Si a+q 6∈ m/q, entonces a+q no están en ningı́n ideal de R/q. Por tanto a+q ∈ (R/q)
es una unidad en R/q.
• Si a + q ∈ m/q, entonces a + q ha de ser un elemento nilpotente en R/q.
Ahora bien, si a + q es unidad en R/q y si tomo un elemento b + q ∈ R/q en el núcleo de ηa,R/q ,
se tendrá:
0 + q = ηa,R/q (b + q) = ab + q = (a + q)(b + q).
Pero como a + q es unidad en R/q, posee un inverso (a + q)−1 ∈ R/q y, multiplicando por él la
anterior igualdad obtenemos
0 + q = (a + q)−1 (0 + q) = (a + q)−1 (a + q)(b + q) = (b + q),
lo que implica que ηa,R/q es inyectiva.
De otro lado, si ηa,R/q no es unidad es porque a + q es un elemento nilpotente en R/q. Pero,
entonces, existe un entero positivo n ∈ N, n ≥ 1, tal que (a + q)n = an + q = 0 + q. Ası́, dado
b + q ∈ R/q un elemento cualquiera, tenemos que
n
ηa,R/q (b + q) = ηan ,R/q (b + q) = an b + q = (an + q)(b + q) = (0 + q)(b + q) = 0 + q.
n
En conclusión, ηa,R/q ≡ 0 es el endomorfismo nulo y, por tanto ηa,R/q es nilpotente.
Juntando los dos casos concluimos que q es un ideal primario. Más aún, los elementos a ∈ R
tales que ηa,R/q no es inyectivo son exactamente aquellos tales que a ∈ m, por tanto q es un
ideal m−primario.
Ejemplo 6.3.16 (Ideales primarios principales en DIP’s y DFU’s). Los ideales primarios
en dominios de ideales principales son las potencias de ideales primos. Ası́ el ideal 8Z es un
ideal (2)−primario, pero el ideal (12) no es primario.
Del mismo modo, si R es un DFU y si q = (q) es un ideal principal. Este ideal (q) es primario
si y solamente si q es una potencia de un elemento primo.
Ejemplos má intrigantes para la intuición son los siguientes:

Ejemplo 6.3.17 (No todo primario es potencia de un primo). Sin embargo, no es
necesario que un ideal sea potencia de ideal primo para ser primario. Consideremos el ideal
a := (X, Y 2 ) en el anillo de polinomios en dos variables R := k[X, Y ]. Es un ideal primario:
su radical es el ideal maximal m = (X, Y )) y, por tanto, es un ideal m−primario. Pero no es
el ideal m porque Y 6∈ a (luego a 6= m. Pero, además, X ∈ a no es un elemento de cualquier
potencia mr con r ≥ 2. Luego a no es potencia de m. Además, m es el único primo que contiene
a a por lo que no puede existir ningún otro primo p ∈ Spec(K[X, Y ]) tal que q = pn para algún
n
n ∈ N. El caso n = 0 es obvio porque a ( √K[X,√Y n] es un ideal propio. En otro caso, si a = p ,
con n ≥ 1 y p ∈ Spec(R), entonces m = a = p = p y ya hemos visto que a no es potencia
de m. Por tanto, a es primario pero no es potencia de ningún primo.
Ejemplo 6.3.18 (No toda potencia de primo es primario). Consideramos ahora el ideal
a := (XY − Z 2 ) ⊆ Q[X, Y, Z] y sea R el anillo cociente:
R := Q[X, Y, Z]/a.
Sea p = (X + a, Z + a) = (X, Z)/a ⊆ R el ideal generado por las clases de X y Z con respecto
al ideal a. Tenemos que p es un ideal primo de R. Esto se ve fácilmente, dado que

(6.3.1) R/p ∼= (R/a) /((X, Z)/a) ∼ = Q[X, Y, Z]/(X, Z) ∼ = Q[Y ].
Consideremos ahora el ideal q := p2 en R y veamos que este ideal no es primario. En primer

lugar observemos que
p2 = (X 2 + a, XZ + a, Z 2 + a).
Pero Z 2 + a = XY + a. Por tanto, XY + a ∈ q. Entonces, X + q es un elemento del núcleo de
ηY,R/q . Además, X + q 6= 0 + q. Veamos esta última afirmación:
Si X + q = 0 + q tendrı́amos que X está en el ideal b de Q[X, Y, Z] dado mediante:
b := (X 2 , XZ, Z 2 , XY − Z 2 ) = (X 2 , XZ, XY, Z 2 ).
Pero eso no es posible: Tendrı́amos una descripción:
X = p1 (X, Y, Z)X 2 + p2 (X, Y, Z)XZ + p3 (X, Y, Z)XY + p4 (X, Y, Z)Z 2 .
Tomando X = 0, concluirı́amos
0 = p4 (0, Y, Z)Z 2 ,
luego, como Q[X, Y, Z] es un DFU, concluimos que X | p4 (X, Y, Z), es decir p4 (X, Y, X) =
Xq4 (X, Y, Z). Ası́, la anterior igualdad se convierte en:
X = p1 (X, Y, Z)X 2 + p2 (X, Y, Z)XZ + p3 (X, Y, Z)XY + q4 (X, Y, Z)XZ 2 ,
y , sacado factor común a X, se convierte en:
X = (p1 (X, Y, Z)X + p2 (X, Y, Z)Z + p3 (X, Y, Z)Y + q4 (X, Y, Z)Z 2 )X.
Por ser Q[X, Y, Z] un dominio de integridad, concluirı́amos que
1 = (p1 (X, Y, Z)X + p2 (X, Y, Z)Z + p3 (X, Y, Z)Y + q4 (X, Y, Z)Z 2 ),
1 ∈ (X, Y, Z) ⊆ Q[X, Y, Z].
Pero ya hemos visto que los ideales de la forma (X, Y, Z) son ideales maximales en Q[X, Y, Z]
y, por tanto, no pueden contener al elemento unidad de ese anillo.
En conclusión la homotecia ηY,R/q no es inyectiva porque contiene a un elemento no nulo en
su núcleo. Entonces, necesariamente se habrı́a de tener Y + a ∈ p, lo cual es imposible por el
isomorfismos descrito en la Identidad (6.3.1)
Ejemplo 6.3.19 (No todo ideal con radical primo es primario). Si bien el radical de
un ideal primario es un ideal primo, no es necesariamente cierto que todo ideal cuyo radical
2
√ el ideal a := (XY, Y ) ⊆
es primo sea un ideal radical. El ejemplo clásico pasa por considerar
R := Q[X, Y ]. Observamos que el radical del ideal a satisface a = (Y ), que es un ideal
primo en Q[X, Y ]. Pero, el ideal a no es primario: la homotecua ηX,R/a no es inyectiva porque
√
ηX,R/a (Y + a) = 0, y tampoco es nilpotente porque X 6∈ a.
Proposición 6.3.20. Sean q1 , . . . , qs ideales p−primarios de un anillo R (es decir, ideales

primarios con respecto al mismo ideal primo de R). Entonces, la intersección siguiente
q = q1 ∩ · · · ∩ qs
es un ideal p−primario.
Demostración. Sea a ∈ p. Para cada i, 1 ≤ i ≤ s y consideremos la homotecia:

ηa,R/qi : R/qi −→ R/qi .
Por ser qi un ideal p−primario, entonces esta homtecia es nilpotente. Por tanto, para cada i,
1 ≤ i ≤ s, existe ni ∈ N, ni ≥ 1 tal que
ni
ηa,R/q i
≡ 0.
Tomando el elemento 1 + qi , tendremos que
ni
ηa,R/qi
(1 + qi ) = ani + qi = 0.
Considerando n0 ; = max{n1 , . . . , ns }, tendremos que an0 ∈ qi para cada i, 1 ≤ i ≤ s y la

homotecia ηa,R/q será nilpotente.
De otro lado, veamos que si a 6∈ p, entonces ηa,R/q es necesariamente inyectiva. Pues si no lo
fuera es porque existe b ∈ R, b 6∈ q tales que ηa,R/q (b + q) = ab + q = 0. Es decir, si ηa,R/q no
fuera inyectiva, entonces, existe b ∈ R tal que b 6∈ q y ab ∈ q. Pero b 6∈ q implica que existe i,
1 ≤ i ≤ s, tal que b 6∈ qi . Por tanto, tendrı́amos que existe b ∈ R tal que b 6∈ qi y ab ∈ q ⊆ qi .
Es decir ηa,R/qi no es inyectiva contradiciendo el hecho de que a 6∈ p y que qi es p−primario.
6.3.3. Descomposición Primaria en anillos noetherianos: Teorema de Lasker-

Noether.
Definición 81 (Descomposición Primaria de Ideales). Sea a un ideal de un anillo R.
Una descomposición primaria de a es una descripción de a como intersección finita:
a := q1 ∩ . . . ∩ qs ,
donde cada qi es un ideal primario de R. Tenemos la lista finita de ideales primos {p1 , . . . , ps } ⊆
Spec(R) de tal modo que para cada i, 1 ≤ i ≤ s, el ideal qi es pi −primario. Decimos que la
descomposición primaria anterior es reducida (o, también, irredundante) si pi 6= pj , para cada
i 6= j y q no se puede presentar como intersección de un subconjunto propio de {q1 , . . . , qs }.
Proposición 6.3.21. Sea a un ideal propio de un anillo R. Dada una presentación de a como
intersección finita de ideales primarios:
(6.3.2) a := q1 ∩ · · · ∩ qt ,
entonces esta descomposición puede refinarse a una descomposición primaria irredundante y,
en particular, a posee una descomposición primaria irredudante.
Demostración. El refinamiento se hará en dos fases:
i) Fase 1: Agrupar los primarios con el mismo radical:En primer lugar, supongamos
que cada qi es pi −primario, con pi ∈ Spec(R). Salvo reordenación de los subı́ndices,
podremos encontrar r ≤ t tal que se tenga:
{p1 , . . . , pt } = {p1 , . . . , pr },
con pi 6= pj para cada i 6= j, 1 ≤ i, j ≤ r. En otras palabras, identificamos los
elementos distintos del conjunto {p1 , . . . , pt }. Seguidamente, agrupamos los ideales
primarios de la Identidad 6.3.2 que tengan el mismo radical. Es decir, para cada j,
1 ≤ j ≤ r, definamos:
\ \ √
rj := {qi : qi es pj −primario} = {qi : qi = pi }.
Por la Proposición 6.3.20 precedente, cada rj es pj −primario, para 1 ≤ j ≤ r. Además,

tenemos que
a := r1 ∩ · · · ∩ rr ,
es una descomposición primaria en la que cada rj es pj −primario y pi 6= pk , para cada
i 6= k, con 1 ≤ i, k ≤ r.
ii) Fase 2: Minimizando el conjunto de primarios que intervienen: Consdieremos el sigu-

iente conjunto:
I := {s : ∃S ⊆ {1, . . . , r}, ](S) = s, a = ∩j∈S rj }.
Sea s0 = min I y sea S0 ⊆ {1, . . . , r} tal que ](S0 ) = s0 y se satisface:
\
(6.3.3) a= rj .
j∈S0
Como s0 es mı́nimo, no podemos eliminar ninguno de los primarios de esa intersección

sin perder la igualdad entre a y esa intersección.
En conclusión la descomposición exhibida en la Identidad 6.3.3 es una descomposición primaria
irredudante de a porque no hay dos primos asociados iguales ni tampoco se puede eliminar
ningún primario sin perder la igualdad con a.
Definición 82 (Ideal Irreducible). Un ideal propio q de un anillo R se llama reducible si

existen a1 , a2 dos ideales propios de R tales que
q = a1 ∩ a2 ,
con q ( ai ( R, 1 ≤ i ≤ 2.
Un ideal propio q de R se llama ideal irreducible si no es reducible.
Proposición 6.3.22. Si R es un anillo noetheriano, todo ideal irreducible es primario.

Demostración. Supongamos que q ( R es un ideal irreducible en R. Recordemos que
los ideales de R/q son los submódulos como R/q−módulo y como R−módulo. Consideremos
a ∈ R y sea ηa,R/q : R/q −→ R/q la homtecia definida por a sobre R/q. Consideremos la
secuencia de submódulos de R/q dada por los núcleos de las potencias de este endomorfismo
r
Kr := ker(ηa,R/q ). Claramente tenemos que se trata de ideales de R/q y se verifica:
(0) = K0 ⊆ K1 ⊆ K2 ⊆ · · · ⊆ Kr ⊆ · · · .
Como R es noetheriano, también lo es R/q y, por tanto, esa cadena se estabiliza. Es decir,
existe n ∈ N, n ≥ 1, tal que Kr = Kn , para cada r ≥ n.
n
Definamos φ := ηa,R/q : R/q −→ R/q. Tenemos la siguiente afirmación:
Afirmación. Se verifica:
(6.3.4) ker(φ) ∩ Im(φ) = (0).
Demostración de la Afirmación. Es claro que si b + q ∈ Im(φ) ∩ ker(φ), entonces, b + q =
φ(b0 + q) = ηa,R/q
n
(b0 + q) y 0 + q = φ(b + q) = ηa,R/q
n 2n
(b + q) = ηa,R/q (b0 + q). Por tanto,
b0 + q ∈ ker(ηa,R/q
2n n
) = K2n = Kn = ker(ηa,R/q ).
Por tanto, b + q = φ(b0 + q) = ηa,R/q
n
(b0 + q) = 0 + q y habremos probado la afirmación.
Sea ahora π : R −→ R/q la proyección canónica y consideremos los ideales de R dados mediante:
a1 := π −1 (ker(φ)), a2 := π −1 (Im(φ)).
Claramente, tenemos los casos siguientes:
• a1 = q ( R. En ese caso, tenemos que ker(φ) = a1 /q = (0 + q) Por tanto, ker(φ) =
n n
(0 + q). Pero φ = ηa,R/q . Por tanto, ηa,R/q es inyectiva para n ∈ N, n ≥ 1.
Pero este endomorfismo es la composición consigo mismo de un mismo endomorfismo:
n
ηa,R/q = ηa,R/q ◦ · · · ◦ ηa,R/q .
Luego, si la composición de un endomorfismo consigo mismo varias veces es inyectivo,
el endomorfismo en cuestión debe ser inyectivo también y ηa,R/a es inyectivo.
• a2 = q ( R. En ese caso Im(φ) = a2 /q = (0 + q). Por tanto, φ es el endomorfismo
indénticamente nulo de R/q como R−módulo. Pero eso significa que
n
φ = ηa,R/q ≡ 0.
O, dicho de otra manera, el endomorfismo ηa,R/q es nilpotente.
Habremos concluido ası́ que q es un ideal primario.
Teorema 6.3.23 (Teorema (Existencial) de Lasker-Noether). Si R es un anillo noethe-

riano, todo ideal propio posee una descomposición primaria irredundante.
Demostración. Por la Proposición 6.3.21 basta con demostrar que todo ideal propio es
intersección finita de ideales primarios. Pero, por la Proposición 6.3.22 precedente, basta con
demostrar que todo ideal propio de R es intersección de ideales irreducibles. Para probar
esto último, razonemos por reducción al absurdo (tı́pico argumento noetheriano que ya hemos
encontrado varias veces) y consideremos el conjunto:
F := {q ( R : a es ideal y no es intersección finita de ideales irreducibles de a}.
Supongamos, por reducción al abusrdo que F 6= ∅. Entonces, por el Teorema 3.3.2, F posee
elemento maximal para la inclusión. Sea a ∈ F ese elemento maximal. Dicho elemento es un
ideal propio de R (porque la definición de F , formado por ideales propios). Además, a no puede
ser un ideal irreducible porque, entonces, serı́a intersección fnita de irreducibles, contradiciendo
la hipótesis a ∈ F . Pero, entonces, será reducible y existirán a1 ( R, a2 ( R dos ideales
propios tales que a ( ai , 1 ≤ i ≤ 2 y
a = a1 ∩ a2 .
Por la maximalidad de a en F , es claro que a1 6∈ F y a2 6∈ F . Pero como ambos son ideales
propios de R lo único que les falla es la segunda propiedad ue define F : ambos son intersección
finita de irreducibles. Consideremos ahora, dos descomposiciones de a1 y a2 como intersección
finita de irreducibles:
a1 = q1 ∩ · · · ∩ qs , a2 = qs+1 ∩ · · · ∩ qt .
Entonces, a será también intersección finita de irreducibles:
a = a1 ∩ a2 = q1 ∩ · · · ∩ qs ∩ qs+1 ∩ · · · ∩ qt .
Lo que contradice el hecho de que a ∈ F . Por tanto, F = ∅ y el Teorema queda demostrado.
6.3.4. Unicidad (Primer Teorema): descomposición primaria, asociados e ide-

ales primos minimales de un anillo noetheriano.
Definición 83. Sea M un R−módulo. Un ideal primo p ∈ Spec(R) se denomina asociado a M
es el anulador de algún elemento de x ∈ M (cf. Definición 71). Es decir, si existe x ∈ M \ {0}
no nulo, tal que:
p = AnnR (x) := {a ∈ R : ax = 0}.
Denotaremos por AssR (M ) el conjunto de los ideales primos asociados a M . Si M = R,
escribiremos Ass(R) para los ideales primos asociados a R como md́ulo sobre sı́ mismo.
Observación 6.3.24. Otra manera de interpretar los ideales primos asociados a un R−módulo
M viene dada por la formulación siguiente :
Un ideal primo p ∈ Spec(R) es asociado a M si y solamente si existe un monomorfismo de
R−módulos:
ϕ : R/p −→ M.
El elemento ϕ(1R + p) = x verifica p = Ann({x}). La clase de ideales primos asociados a un
R−módulo es especialmente importante por determinar sus divisores de cero.
Definición 84 (Divisor de cero de un R−módulo). Dado un R−módulo M y un elemento

no nulo a ∈ R, diremos que a es un divisor de cero de M , si existe m ∈ M , m 6= 0, tal que
am = 0.
Nótese que, en el caso de anillos, son los divisores de cero del anillo.
Ejemplo 6.3.25. Por tomar un ejemplo clásico, retomemos la Teorı́a del Endomorfismo in-
troducida en el Ejemplo 2.2.4. Consideramos un K−espacio vectorial de dimensión finita V
y un endormorfismo como K−espacio vectorial ϕ : V −→ V . Esto inducı́a una estructura de
K[X]−módulo sobre V dada mediante:
· : K[X] × V −→ V
(p, v) 7−→ p(ϕ)(v),
donde el endomorfismo p(ϕ) se define en el citado ejemplo. Ahora, dado un elemento v ∈ V , su
anulador será:
AnnK[X] (v) := {p ∈ K[X] : p(ϕ)(v) = 0}.
Como K[X] es un dominio de ideales principales el ideal AnnK[X] (v) = (q(X)) es un ideal
principal. Sugenerador es el polinomio mı́nimo de ϕ en v (que hemos denotado mediante µv en
el Problema 165). Este ideal es asociado a V como K[X]−módulo si y solamente si µv es un
elemento primo.
Lema 6.3.26. Sea R un anillo noetheriano y q un ideal p−primario de R. Entonces, existe

n ∈ N tal que pn ⊆ q.
Demostración. Es inmediato (véase el Problema 259).
Teorema 6.3.27 (Primer teorema de unicidad de la descomposición primeria re-

ducida en anillos noetherianos). Sea R un anillo noetheriano y sea
(0) = q1 ∩ · · · ∩ qr
una descomposición primaria irredudante del ideal (0) de R, donde cada qi es pi −primario.
Entonces,
Ass(R) = {p1 , . . . , pr }.
En particular, Ass(R) es un conjunto finito y los ideales primos que aparecen en una descom-
posición primaria irredundante del ideal (0) están unı́vocamente determinados por el anillo y
son independientes de la descomposición primaria elegida.
Demostración. Probemos las dos inclusiones:
• ⊆ : Consideremos p ∈ Ass(M ) y supongamos x ∈ M , x 6= 0, tal que p = AnnR ({x}).
Salvo reordenación de los ı́ndices de la descomposición primaria, existirá un cierto
ı́ndice j ≥ 1 tal que :
(6.3.5) x 6∈ q1 ∪ · · · ∪ qj , x ∈ qj+1 ∩ · · · ∩ qr .
Sea ni ∈ N tal que pni i ⊆ qi . Tendremos que :
j
Y j
Y
pni i x = {λx : λ ∈ pni i } ⊆ (q1 ∩ · · · ∩ qj ) ∩ qj+1 ∩ · · · ∩ qr = (0).
i=1 i=1
Qj Qj
Por tanto el ideal i=1 pni i está contenido en el anulador de x (i.e. ni
i=1 pi ⊆ p =
AnnR (x)). Tomando radicales, como en el ı́tem ii) de la Proposición 6.3.3, tendremos:
v
u j j q j
√ uY \ \
p = p ⊇ t pni = i pni = p. i i
i=1 i=1 i=1
Por el ı́tem iv) de la Proposición 4.2.12, dado que p es un ideal primo, existirá un
cierto k, 1 ≤ k ≤ j, tal que pk ⊆ p. Fijemos ese k, con 1 ≤ k ≤ j.
Por otro lado, a partir de la Identidad (6.3.5), como k ≤ j, se tiene que x 6∈ qk o,
equivalentemente, x + qk 6= 0. Para cada a ∈ p = AnnR (x), tendremos que ax = 0 en
R y, por tanto, la homotecia ηa,R/qk : R/qk −→ R/qk no es inyectiva:
ηa,R/qk (x + qk ) = 0 + qk .
Por tanto, por ser qk un ideal pk −primario, los elementos a ∈ R tales que la homotecia
ηa,R/qk no es inyectiva están en el ideal pk . En conclusión, para cada a ∈ p, concluimos
que a ∈ pk y tenemos p = pk .
Combinando ambas inclusiones, concluimos que si p ∈ Ass(R), entonces existe k ∈
{1, . . . , r} tal que p = pk y tenemos probada la primera inclusión de las dos afirmadas
en el enunciado del Teorema.
• ⊇ :Para el otro contenido, probemos que cada i, 1 ≤ i ≤ r, pi ∈ Ass(M ). Supongamos,
sin pérdida de la generalidad, i = 1 y considremos x ∈ q2 ∩ · · · ∩ qr tal que x 6∈ q1 .
Tal elemento x ∈ R ha de existir porque la descomposición primaria del enunciado
es irredundante. Puesto que q1 es p1 −primario, existirá n ∈ N tal que pn1 ⊆ q1 . Por
tanto, pn1 x ⊆ q1 . Consideremos el conjunto:
B := {m ∈ N : m ≥ 1, pm
1 x ⊆ q1 }.
Hemos visto que ese es un conjunto no vacı́o de enteros positivos, ası́ que debe tener
algún mı́nimo. Supongamos que n es el mı́nimo de A. Existirá, entonces, un elemento
y ∈ pn−1
1 x tal que y 6∈ q1 . En particular y 6= 0 en R y p1 y ⊆ pn1 x ⊆ q1 . Por lo tanto,
p1 ⊆ AnnR ({y}). De otro lado, si a ∈ R es un elemento tal que ay = 0, la homotecia
ηa,R/q1 : R/q1 −→ R/q1 no es inyectiva (porque y 6∈ q1 y ay = 0). Por la Proposición
6.3.12, dado que q1 es p1 −primario, concluimos que a ∈ p1 . Habremos probado que
AnnR ({y}) ⊆ p1 ⊆ AnnR ({y}) y concluimos la igualdad que pretendı́amos. Por tanto,
concluimos que:
p1 = AnnR ({y}) ∈ Ass(R).
Los ideales primos dados como radical de los primarios que aparecen en una descomposición
primaria irredundante de (0), están determinados de maneraúnica como la clase Ass(R). La
unicida de tales primos se sigue dela definición de Ass(R), cuyos elementos nada tienen que ver,
a priori, con la descomposición primaria irredundante considerada.
Corolario 6.3.28 (Primer teorema de unicidad para Lasker-Noether para cocientes

de anillos). Sea R un anillo noetheriano, a un ideal propio y consideremos una descomposición
primaria irredudante de a :
a = q1 ∩ · · · ∩ qr ,
donde qi es pi −primario. Entonces,
Ass(R/a) = {p1 , . . . , pr }
En particular, los ideales asociados a una descomposición primaria irredundante de un ideal
están determinados de manera única por el cociente R/a y son independientes de la descom-
posición primaria irredudante elegida.
Demostración. Basta con reproducir los mismos argumentos del Teorema precedente
usando las clases módulo a de elementos de R para argumentar.
La siguiente propiedad muestra la relación entre los divisores de cero de un anillo noetheriano
y los primos asociados:
Proposición 6.3.29. Sea R un anillo noetheriano, a ( R un ideal propio. Entonces, el conjunto
de los divisores de cero de R/a como R−módulo es dado por la siguiente igualdad:
[
p.
p∈Ass(R)
En particular, los divisores de cero de un anillo R es la unión de los ideales primos en Ass(R).
Demostración. Hagamos la prueba para el caso a = (0) y dejemos el caso general como
ejercicio para el lector.
Tomemos una descomposición primaria irredundante del ideal (0) de R :
(0) = q1 ∩ · · · ∩ qr
donde cada qi es pi −primario.
Sin pérdida de la generalidad, consideremos el ideal primo p1 . Por el teorema precedente, como
p1 es un ideal primo en Ass(R), existe x ∈ R tal que p1 = AnnR (x). Pero x 6= 0 puesto que si
x = 0, entonces AnnR ({0}) = R y p1 es primo y, por tanto, propio en R. Pero esto significa
que para cada λ ∈ p1 existe x 6= 0 en R tal que λx = 0, con lo cual λ es un divisor de cero
en R y tenemos que todos los elementos de p1 son divisores de cero en R. Cambiando 1 por
cualquier i en este argumento, concluimos que la siguiente unión está formada por divisores de
cero de R: [
p = p1 ∪ · · · ∪ pr .
p∈Ass(R)
Recı́procamente, consideremos a ∈ R un divisor de cero en R. Entonces, existe x ∈ R, x 6= 0

tal que ax = 0. Pero como x 6= 0, dada la descomposición primaria irredudante del ideal (0)
elegida, ha de existir i tal que x 6∈ qi . Supongamos, sin pérdida de la generalidad, que i = 1.
Entonces, observamoes que
ηa,R/q1 (x + q1 ) = ax + q1 .
Ergo, la homotecia ηa,R/q1 no es inyectiva. Por la proposición 6.3.12, si ηa,R/q1 no es inyectiva,
√
entonces a ∈ q1 = p1 . Por tanto, todo divisor de cero de R debe estar en la unión
[
p1 ∪ · · · ∪ pr = p.
p∈Ass(R)
Y hemos concluido la prueba del resultado.
Observación 6.3.30. Obsérvese que si R es un anillo noetheriano y a es un ideal radical de R,

existirá una descomposición primaria irredudante de a donde todos los primarios son primos :
Tomemos una descomposición primaria irredundante del ideal a = q1 ∩ · · · ∩ qr , donde qi es
√
un ideal pi −primario. Entonces, q = p1 ∩ · · · ∩ pr y ésta es una descomposición primaria
irredundante de a.
6.3.4.1. Unas palabras sobre los ideales primos minimales en Spec(R), con R
noetheriano. Consideremos R un anillo noetheriano a ( R un ideal propio, consideremos
una descomposición primaria irredudante
a = q1 ∩ · · · ∩ qr ,
donde cada qi es un ideal pi −primario. Consideremos el conjunto
V (a) = {p ∈ Spec(R) : p ⊇ a}.
Consideremos ahora la relación de inclusión sobre V (a). Esto define una estructura de grafo
orientado sobre V (a) donde las aristas orientadas E ⊆ V (a) × V (a) vienen dadas por los pares
(p, n) ∈ V (a)2 tales que p ⊆ n. Como V (a) está identificado con el espectro primo Spec(R/a),
en realidad estamos hablando de la estructura de grafo del espectro de ese anillo cociente.
Supongamos ası́ p ∈ V (a) y tenemos que
p ⊇ a = q1 ∩ · · · ∩ qr .
Tomando radicales a ambos lados tenemos que
√ √ √ √ √
p = p ⊇ a = q1 ∩ · · · ∩ qr = q1 ∩ · · · ∩ qr = p1 ∩ · · · ∩ pr .
Retomemos ahora el ı́tem iii) de la Proposición 4.2.12. Si p no contuviera a ninguno de los
ideales primos p1 , . . . , pr es porque para cada i, 1 ≤ i ≤ r, existirá xi ∈ pi \ p. Pero, entonces,
r
Y r
Y
xi ∈ pi ⊆ p1 ∩ · · · ∩ pr ⊆ p.
i=1 i=1
Esto estarı́a en contradicción con la condición “p es un ideal primo de R”. Hemos probado ası́
la siguiente propiedad:
Proposición 6.3.31. Sea R un anillo noetheriano, a ( R un ideal propio de R. Entonces, el
grafo Spec(R/a) orientado mediante la inclusión posee solamente un número finito de elemen-
tos minimales. Más aún, los ideales minimales de Spec(R/a) están entre los ideales primos
asociados Ass(R/a).
La afirmación es, en particular, cierta para Spec(R) y sus ideales primos minimales. En este
caso, los ideales primos minimales de un anillo noetheriano están formados por algunos de los
divisores de cero del anillo.
Demostración. La hemos dado justo antes del enunciado.
A los ideales primos minimales sobre a se les denomina componentes aisladas del ideal a.
Existen ideales a propios en anillos noetherianos R y descomposiciones primarias como en (??)
en las que no todos los ideales primos de la colección {p1 , . . . , pr } son minimales entre los primos
que contienen a a. En el Problema 260 se muestra un ejemplo sencillo de un ideal que posee
primos asociados que no son minmales. A los ideales primos asociados que no son minimales
sobre a se les denomina primos inmersos o componentes inmersas sobre el ideal a.
Un de los (pocos) casos en los que podemos garantizar que no tenemos componentes inmersas
es el siguiente:
Proposición 6.3.32 (Los ideales radicales no poseen componentes √ inmersas). Si R es
un anillo noetheriano y a ( R es un ideal propio y radical (i.e. a = a. Entonces los primos
asociados de Ass(R/a) son todos primos aislados (i.e. primos minimales sobre el ideal a).
El resultado es, en particular, cierto para los anillos reducidos (i.e. sin elementos nilpotentes
no nulos) y, en ese caso, los ideales primos asociados son los primos minimales del anillo y,
además, los divisores de cero de anillo son la unión de los primos minimales del anillo.
√
Demostración. Supongamos que a = a y consideremos una descomposición primaria
irredudante del ideal a:
a = q1 ∩ · · · ∩ qr ,
donde qi es pi −primario y, por el Teorema de Unicidad,
√
Ass(R/a) = Ass(R/ a) = {p1 , . . . , pr }.
Como a es un ideal radical también tenemos una descomposición primaria de a dada mediante
los ideales primos asociados:
√ √ √ √
a = a = q1 ∩ · · · ∩ qr = q1 ∩ · · · ∩ qr = p1 ∩ · · · ∩ pr .
Si esta descomposición primaria no fuera irredudante, entonces podrı́amos refinarla y existirı́a
un subconjunto S ( {1, . . . , r} tal que una descomposición primaria irredudante de a se tendrı́a
con la forma: \
a= pi .
i∈S
Pero, por el Teorema de Unicidad precedente concluirı́amos que los ideales primos asociados
del anillo cociente R/a satisfarı́an la siguiente propiedad imposible:
Ass(R/a) = {pi : i ∈ S} ( {p1 , . . . , pr } = Ass(R/a).
Por tanto, la siguiente es una descomposición primaria irredundante del ideal radical a:
(6.3.6) a = p1 ∩ · · · ∩ pr .
Los ideales primarios que aparecen en la descomposición son ciertamente ideales primos y,
además, no se puede refinar esta descomposición sin añadir elementos que no están en a. Es
decir, para cada S ( {1, . . . , r}, se tiene que:
\
a( pi .
i∈S
Por tanto si existiera alguna componente inmersa sobre a es porque existen i, j, 1 ≤ i, j ≤ r

tales que pi ⊆ pj . En ese caso podrı́amos eliminar pj de la intersección y tendrı́amos:
 
\ \
a = p1 ∩ · · · ∩ pr =  pk  ∩ pj = pk ,
k6=j k6=j
lo cual no es posible por ser la descomposición descrita en la Identidad (6.3.6) una descom-
posición irredudante. En particular, como los ideales primos minimales sobre a están entre
{p1 , . . . , pr } y no hay relación de inclusión posible entre dos distintos de ellos, todos los primos
de {p1 , . . . , pr } son ideales minimales sobre el ideal a.
En el caso a = (0) y radical (i.e. R no posee elementos nilpotentes) es un caso particular de lo
anterior.

6.3.5. Ejercicios y Problemas de la Sección 6.3.

Problema 258. Prueba la Proposición 6.3.3
Problema 259. √ Sea
n R un anillo noetheriano y a ( R un ideal propio. Pruébese que existe
n ∈ N tal que a ⊆ a.
Problema 260. Sea K un cuerpo y R = K[X, Y, Z] el anillo noetheriano de los polinomios en
tres variables con coeficientes en K . Considera el ideal m := (X, Y, Z) ( K[X, Y, Z]. Se pide:
i) Prueba que el ideal m ∈ MaxSpec(R).
ii) Considera los siguientes ideales en K[X, Y, Z]:
p1 := (X, Y ), p2 := (X, Z).
Prueba que ambos ideales son ideales primos en K[X, Y, Z].
iii) Pruébese que a = p1 ∩ p2 ∩ m2 es un descomposición primaria irredudante del ideal a.
iv) Halla las componentes inmersas y las componentes aisladas del ideal a en la descom-
posición anterior.
6.3.5.1. Cociente de Ideales.
Definición 85 (Cociente de Ideales). Dados a, b dos ideales de un anillo R, su ideal cociente
está definido mediante:
(a : b) := {x ∈ R : xb ⊆ a}.
Al ideal cociente ((0) : b) se le denomina anulador del ideal b y se denota por Ann(b).
En particular si D son los divisores de cero de un anillo R, tendremos
[
D= Ann((x)).
x6=0
Problema 261 (Propiedades Elementales del Cociente de Ideales). Pruébense las sigu-
ientes propiedades:
Sea a, b, c ideales de un anillo R. Se tiene:
i) a ⊆ (a : b),
ii) (a : b)b ⊆ a,
iii) ((a : b) : c) = (a : bc) = ((a : c) : b),
i : b) = ∩i (ai : b),
iv) (∩i aP
v) (a : i bi ) = ∩i (a : ai ).
6.3.5.2. El Teorema de Lasker-Noether para módulos noetherianos. La sigu-
iente ser de problemas extiende a los R−módulos noetherianos el Teorema de Lasker-Noether
que acabmos de ver para anillos. Están estructurados de manera incremental y acumulativa,
de modo que cada problema suele depender de problemas precedentes. Para el material sobre
módulos noetherianos, véase la Sección ??.
Comencemos deiniendo el equivalente para submódulos de la noción de ideal primario:
Definición 86 (Submódulos e ideales primarios). Sea M un R−módulo. Un submódulo
N de M se denomina primario si N 6= M y para cada a ∈ R, la homotecia ηa,M/N es o bien
inyectiva o bien nilpotente.
Problema 262. Pruébese lo siguiente:
Si N es un submódulo primario de un R−módulo M , entonces el conjunto:
p := {a ∈ R : ηa,M/N no es inyectiva},
es un ideal primo de R. Diremos que el submódulo N es p−primario.( Hint: Se trata de repetir
la prueba, adaptándola a este contexto, de la Proposición 6.3.12).
Problema 263. Pruébese lo siguiente:
Sean N1 , . . . , Ns submódulos p−primarios de un R−módulo M (es decir, primarios con respecto
al mismo ideal primo de R). Entonces, la intersección
N = N1 ∩ · · · ∩ Ns
es un submódulo p−primario.( Hint:Adaptar al contexto de módulos la demostración de la
Proposición 6.3.20).
Retomando la descomposición primatia de ideales, nos planteamos aquı́ la descomposición pri-

maria de submódulos del modo siguiente:
Definición 87 (Descomposición Primaria de R−módulos). Sea M un R−módulo y N
un submódulo de M . Una descomposición primaria de N es una descripción de N como
intersección finita:
N := N1 ∩ . . . ∩ Ns ,
donde cada Ni es un sumódulo pi −primario de M , con pi ∈ Spec(R). Decimos que la de-
scomposición primaria anterior es reducida (o, también, irredundante) si pi 6= pj , para cada
i 6= j y N no se puede presentar como intersección de un subconjunto propio de la familia
{N1 , . . . , Ns }.
Problema 264. Pruébese la propiedad siguiente:

Dado un R−módulo M y un submódulo N , dada una presentación de N como intersección
finita de submódulos primarios:
(6.3.7) N := N1 ∩ · · · ∩ Nt ,
entonces esta descomposición puede refinarse a una descomposición primaria irredundante.
( Hint: Adaptar a este contexto la prueba de la Proposición 6.3.21)
De modo anólogo al caso de anillos se define la noción (inútil por lo demás, salvo como argucia
para razonar) de submódulo irreducible:
Definición 88 (Submódulo Irreducible). Un submódulo propio N de un R−módulo M se
llama reducible si existen N1 , N2 dos submódulos propios de M tales que
N = N1 ∩ N2 ,
con N ( Ni ( M , 1 ≤ i ≤ 2.
Un submódulo propio N de M se llama irreducible si no es reducible.
Problema 265. Pruébese la siguiente afirmación:

Si M es un R−módulo noetheriano, todo submódulo irreducible es primario.( Hint: De nuevo,
se trata de adaptar el argumento de la Proposición 6.3.22 al contexto de R−módulos).
Finalmente llegamos al enunciado de Lasker-Noether para R−módulos:
Problema 266 (Teorema de Lasker-Noether para R−módulos). Pruébese el Teorema
de Lasker-Noether para R−módulos noetherianos, es decir, pruébese:
Si M es un R−módulo noetheriano, entonces todo submódulo propio posee una descomposición
primaria (de submódulos) irredundante.
( Hint: Se trata de argumentar en la forma de E. Noether, como en el Teorema 6.3.23. En
esencia se trata de probar que todo submódulo de M es intersección finita de R−módulos ir-
reducibles y luego agruparlos y refinar esa intersección usando los resultados de los Problemas
precedentes. Para probar esa afirmación basta con aplicar la forma noetheriano de argumentar
considerando la clase:
F := {N ( M : N es submódulo y no es intersección finita de submódulos irreducibles de M }.
y concluir que este conjunto es vacı́o.)
Finalmente nos ocupamos de un resultado de unicidad similar al caso de anillos. Para ello
revisemos las nociones de anulador de un elemento AnnR (m), con m ∈ M y M y R−módulo,
ası́ como la noción de primo associado p ∈ AssR (M ). Ambas nociones son descritas en la
Definición 83. Igualmente recordemos la definición de divisor de cero de un R−módulo descrita
en la Definición 84.
Problema 267 (Primer Teorema de Unicidad para R−módulos noetherianos). . Se
pide probar la siguiente propiedad:
Sea R un anillo noetheriano y M un R−módulo finitamente generado. Sea
h0i = N1 ∩ · · · ∩ Nr
una descomposición primaria irredudante del submódulo h0i de M , donde cada Ni es pi −primario.
Entonces,
AssR (M ) = {p1 , . . . , pr }.
En particular, los ideales primos asociados a una descomposición primaria irredudante del
submódulo h0i de M son únicos e independientes de la descomposición primaria irredundante
elegida. De otro lado, el número de los ideales primos asociados a un R−módulo finitamente
generado sobre un anillo noetheriano es finito y están determinados por una descomposición
primaria irredundante del submódulo h0i de M .
Problema 268. Prueba el siguiente resulatdo:

El conjunto de los divisores de cero de un R−módulo finitamente generado sobre un anillo R
noetheriano dado por:
[
p
p∈Ass(M )
Problema 269. Se pide probar los siguientes resultados:

i) El Corolario 6.3.28
ii) El siguiente resultado que extiende a R−módulos el Corolario 6.3.28:
Sea R un anillo noetheriano y M un R−módulo finitamente generado. Sea N un
submódulo de N y tomemos una descomposición primaria irredudante de N :
N = N1 ∩ · · · ∩ Nr
donde Ni es pi −primario. Entonces,
AssR (M/N ) = {p1 , . . . , pr }.
En particular, los ideales primos aociados a una descomposición primaria irredudante

de un submódulo N de M son únicos e independientes de la descomposición primaria
irredundante elegida. Más aún, el cardinal de los ideales primos asociados al cociente
M/N es finito y están determinados de manera unı́voca por los ideales primos asoci-
ados a una descomposición primeria irredundante de N .
Problema 270. Sea R un anillo y R[X] el anillo de polinomios en una variable con coeficientes
en R. Para cada ideal a de R, denotemos por a[X] (o por a ⊗R R[X]) el conjunto de los
elementos en R[X] tales que todos sus coeficientes están en el ideal a. Se pide probar las
siguientes afirmaciones:
i) El conjunto a[X] es un ideal de R[X] y es precisamente la extensión de a a R[X] para
la inclusión ι : R ,−→ R[X], i.e. ae = a[X].
ii) Si p ∈ Spec(R) es un ideal primo, entonces su extensión p[X] ∈ Spec(R[X]) es también
un ideal primo.
iii) Si q ⊆ R es un ideal p−primario en R[X], entonces q[X] es un ideal p[X]−primario
en R[X].
iv) SI a ⊆ R es un ideal y tenemos una descomposición primaria irreduidante de a dada
mediante:
\m
a= qi ,
i=1
donde cara ideal qi es un ideal pi −primario, entonces la siguiente es una descom-

posición primaria irredudante de a[X]:
m
\
a[X] = (qi [X]) ,
i=1
donde cada qi [X] es un ideal pi [X]−primario.

v) Si p es un ideal primo minimal sobre a en R, entonces, p[X] es un ideal primo minimal
sobre a[X].
6.3.5.3. Anillos y módulos de Artin.

Problema 271 (Módulos artinianos). Pruébese la asiguiente afirmación: Sea R un anillo
y M un R−módulo. Asumiendo el Axioma de Elección Dependiente, las siguientes propiedades
son equivalentes:
i) Condición de cadena Numerable Descendente para submódulos: Toda una
cadena numerable descendente de submódulos de M se establiza. Es decir, dada una
cadea numerable descendente:
N0 ⊇ N1 ⊇ · · · ⊇ Nn ⊇ · · · ,
Existe m ∈ N tal que Nn = Nm para cada m ≥ n.
ii) Todo conjunto no vacı́o de submódulos posee elemento minimal.
Los R−módulos que satisfacen cualquiera de estas dos propiedades se denominan R−módulos
artinianos . SI M = R deciemos que R es un anillo artiniano..
Obsérvese que Z no es anillo artininao, pero los anillos cociente Z/nZ son anillos artinianos y
Z−módulos artinianos.
Problema 272. Pruébese la siguiente afirmación:
Dada una sucesión exacta corta de R−módulos:
f g
0 M0 M M 00 0
entonces, M es artiniano si y solamente si M 0 y M 00 son artinianos.
Conclúyanse las siguientes propiedades:
i) La condición artiniana es hereditaria, esto es, si M es un R−módulo artiniano también
lo es todo submódulo suyo.
ii) Si M es un R−módulo artiniano y N es un submóduo, también es artiniano M/N .
iii) si R es una anillo artiniano y a es un ideal propio de R, entonces R/a es un anillo
artiniano.
iv) Un anillo es artiniano si y solamente si existe un ideal a de R tal que a es artiniano
como R−módulo y R/a es un anillo artiniano.
v) Módulos finitamente generados sobre anillos R artinianos son R−módulos artinianos.
Problema 273. Pruébese que si un anillo R es anillo de Artin, entonces Spec(R) = MaxSpec(R),
es decir, que todo ideal primo es maximal. ( Hint: Tómese un ideal primo p ∈ Spec(R) y un ele-
mento x ∈ R tal que x + p 6= 0 + p en el anillo cociente R/p. Considérese la cadena descendente
de ideales:
(x + p) ⊇ (x2 + p) ⊇ · · · ⊇ (xn + p) ⊇ · · · ,
y pruébese que x ha de ser unidad en R.)
Problema 274. Pruébese que si R es un anillo de Artin se verifican las siguientes propiedades:
i) Si q es un ideal primario, entonces existe un único ideal maximal m ∈ MaxSpec(R)
tal que q es m−primario y existe un número natural n ∈ N, n ≥ 1 tal que
mn ⊆ q.
ii) Probar que si el ideal (0) de R admite una descomposición primaria, entonces (0) es
un producto de ideales maximales de R.
iii) El espectro maximal de un anillo de Artin es un conjunto finito ( Hint: Considerar
todas las intersecciones finitas de ideales maximales de R y elegir un elemento mnimial
usando una argumentación de tipo noetheriano).
iv) Si R es un anillo noetheriano y Spec(R) = MaxSpec(R), entonces es un anillo artini-
ano.
CAPı́TULO 7
Rudimentos de Geometrı́a Algebraica: La Topologı́a de

Zariski
(La découverte est le privilège de l’enfant.)
“La découverte est le privilège de l’enfant. C’est du petit

enfant que je veux parler, l’enfant qui n’a pas peur encore de
se tromper, d’avoir l’air idiot, de ne pas faire sérieux, de ne
pas faire comme tout le monde. Il n’a pas peur non plus que
les choses qu’il regarde aient le mauvais goût d’être
différentes de ce qu’il attend d’elles, de ce qu’elles devraient
être, ou plutôt : de ce qu’il est bien entendu qu’elles sont. Il
ignore les consensus muets et sans failles qui font partie de
l’air que nous respirons – celui de tous les gens censés et bien
connus comme tels. Dieu sait s’il y en a eu, des gens censés
et bien connus comme tels, depuis la nuit des âges ! ”
Alexandre Grothendieck,
“Récoltes et Semailles (Réflexions et témoignage sur un
passé de mathématicien)”, 1983-1986, 127-128.
Índice
7.1.1. Geometrı́a Diferencial: objetos dados “explı́citamente” ( por parametrizaciones
locales o globales) con buenos rangos en los Jacobianos: 336
7.1.2. Geometrı́a Algebraica, Analı́tica, Diofántica etc.: Objetos geométricos
dados implı́citamente por sus ecuaciones globales (o locales): 338
7.2. Geometrı́a y soluciones: La(s) topologı́a(s) de Zariski 339
7.2.1. Variedades o conjuntos de ceros (o de soluciones): Topologı́a(s) de Zariski 340
7.2.1.1. Algunos Ejemplos de Topologı́as de Zariski 344
7.2.2. Ideal de un objeto geométrico, primos, maximales y variedades. 346
7.2.2.1. Ideales Primos e Irreducibles 348
7.2.2.2. Ideales maximales y puntos 349
7.2.2.3. Nullstellensätze y y Variantes: ¿Diccionario Álgebra–
Geometrı́a?. 350
7.3. Rudimentos de Geometrı́a Algebraica: Variedades algebraicas
K−definibles 350
7.3.1. Funciones polinomiales K−definibles. 351
7.3.2. Variedades algebraicas afines y K−definibles. 352
7.3.3. Primos, maximales y variedades algebraicas afines. 355
7.3.4. Otras consecuencias de la argumentación noetheriana 357
7.3.4.1. Proyección y contracción de ideales 362
7.4. Variedades algebraicas en el espacio proyectivo: Ideales
homogéneos 362
7.1. Introducción
Se trata simplemente de empezar a conocer los términos más elementales como conjunto al-
gebraico, variedad algebraica sobre un cuerpo algebraicamente cerrado (K−definible, en algún
335
336 7. GEOMETRÍA ALGEBRAICA: TOPOLOGÍA DE ZARISKI
caso), ideal asociado, componentes irreducibles y/o la topologı́a de Zariski definida por un anillo
de funciones o en el espectro de un anillo.
Aunque la terminologı́a, especialmente la Tolopogı́a, no es propia del siglo XIX, sı́ que es cierto
que hay una gran lista de geómetras del siglo XIX que se ocuparon de estudiar de estos objetos
geométricos, sin disponer de herramientas notacionales o culturales como las que que están a
uestra disposición en este siglo XXI. Sólo por citar algunos de los gigantes de ese sigloi XIX,
aunque sus nombres no salgan en el texto de manera distinguida, y algunos alcanzaron su cénit
a comienzos del siglo XX, pongamos unos nombres cuya historia puede encontrarse fácilmente
en la red:
• E. Bézout, E. Laguerre, A. Cayley, F. Klein,...
• La escuela italiana: L. Cremona, E. D’Ovidio, C. Segre, G. Castelnouvo, F. Enriques,
E. Bertini, P. Del Pezzo, G. Fano, G. Veronese y un larguı́simo etcétera.
• H. Baker, M. Noether (padre de E. Noether), H. Schubert, E. Kähler, C. É. Picard,...
• D. Hilbert, L. Kronecker, E. Netto, F.S. Macaulay, D. König,...
• Y, desde la Teorı́a de Números como elemento influyente en el Álgebra Conmutativa,
R. Dedekind, E. Kummer, etc....
Muchos de estos autores continuaron trabajando en el primer tercio del siglo XX, cuando la
influencia de D. Hilbert y E. Noether impregna los desarrollos que ya exhibimos en el Capı́tulo
precedente. Casi todos ellos han tenido un homenaje en la terminologı́a de la Geometrı́a Al-
gebraica moderna: Bézout Inequality, Cayley form, Klein surfaces, Cremona transform, Segre
variety and Segre embbeding, del Pezzo varieties, Castlenouvo regularity, Bertini theorem, Fano
varieties, Max Noether resolution of singularities, Schubert calculus, Kähler manifold, Picard
group, Macaulay elimination, Dedekind rings, etc. Todos ellos son términos que deberı́an entrar
en un curso estándard de Geometrı́a Albebraica. Desgraciadamente, las limitaciones de tiempo
impiden llegar hasta algunos de ellos. En todo caso, todos ellos se ocuparon de un modo u otro
de los objetos geométricos cuya terminologı́a se incia en este Capı́tulo.
Como esta mera introducción genera ciertas dificultades en su lectura, abriremos un paréntesis
diáctico sobre objetos geométricos dados explı́cita o implı́ticamente.
7.1.1. Geometrı́a Diferencial: objetos dados “explı́citamente” ( por parametriza-

ciones locales o globales) con buenos rangos en los Jacobianos: Un objeto geométrico
es dado explı́citamente cuando sus puntos son dados por parametrizaciones locales o globales.
Una parametrización es simplemente una aplicación ϕ : P −→ X, donde P es el conjunto
de parámetros, normalmente elegido por su simplicidad geométrica, y X es el espacio ambi-
ente donde nuestro objeto está incluido. El objeto geométrico dado por la parametrización ϕ
serı́a la imagen de ϕ, es decir ϕ(P ). En un sentido “confundido”, se considera que si un ob-
jeto geométrico es dado explı́citamente se considera ‘‘resuelto’’: esto es una simplificación
errónea que debe descartarse, pero que ayuda a entender la diferencia entre la Geometrı́a de
los siglos XVIII y anteriores y la Tesis de B. Riemann. Veamos algunos ejemplos sencillos de
parametrizaciones y objetos geométricos dados explı́citamente:
i) Rectas “escolares” o variedades afines lineales: Era uno de los propósitos
de los estudios pre-universitarios, donde se describı́an las rectas (por ejemplo, en R3 )
mediante una parametrización donde el espacio de parámetros es un cuerpo (R, por
ejemplo) y la parametrización se basa en uno de sus puntos p = (p1 , p2 , p3 ) ∈ R3 y un
vector director v = (v1 , v2 , v3 ) ∈ R3 y toma la forma siguiente:
ϕ: R 7−→ R3
t 7−→ (p1 + tv1 , p2 + tv2 , p3 + tv3 ).
La recta es ϕ(R). Estos mismos objetos geométricos se recuperan en los estudios
elementales de las variedades afines lineales, donde los objetos geométricos son los que
admiten una parametrización desde algún espacio afı́n de la forma K m , a través de
un punto P ∈ K n (con n ≥ m) y un subespacio vectorial W ⊆ K n :
ϕ: Km 7 →
− Kn P
m
(t1 , . . . , tm ) 7−→ (p1 , . . . , pn ) + i=1 ti vi ,
donde W es el subespacio con base {v1 , . . . , vm }. La variedad afı́n lineal es ϕ(K m ).
ii) Esferas, curvas, superficies y variedades diferenciables: Son el paradigma

de las variedades diferenciables tal y como las intuyeron Riemann o Gauss. Pode-
mos considerar la esfera unidad S 1 ⊆ R2 mediante diversas parametrizaciones. Por
ejemplo, la más habitual y completa:
ϕ1 : R 7 →
− C = R2
it
t 7−→ e := (cos(t), sin(t)).
Aunque, a veces, se pueden considerar parametrizaciones parciales como la siguiente

ϕ2 : R 7−→ R2
2
t 7−→ ( 1−t 2t
1+t2 , 1+t2 ).
En este caso, el objeto geométrico “completo” no serı́a todo S 1 porque ϕ2 (R) =

S 1 \ {(0, −1)}, pero se podrı́a interpretar como que el objeto geométrico es la clausura
de la imagen. La otra interpretación consiste en intercambiar los roles de (0, 1) y
(0, −1) y obtener una segunda parametrización, pero esta vez del abierto en la esfera
S 1 \ {(0, 1)}. Esto conduce de manera casi natural a las parametrizaciones locales
compatibles y a la idea de carta.
En general en teorı́a global, se consideran parametrizaciones globales: Es decir todo
el objeto geométrico viene dado por una sola arametrización. Ası́ pensaban los
matemáticos del XVIII hasta que Gauss y, sobre todo, Riemann cambiaron las re-
glas del juego. Ası́, una curva parametrizada globalmente es el un objeto geométrico
dado or una parametrización desde un intervalo:
ϕ: (−1, 1) −7 → Rn
t 7−→ (ϕ1 (t), . . . , ϕn (t)),
La “curva” es ϕ((−1, 1)) y, para tener buenas propiedades se suponen las condiciones
del Teorema de la Función Inversa o el Teorema del Rango constante: El gradiente
∇t ϕ de la parametrización es no nulo en todos los puntos t del conjunto (−1, 1) de
parámetros. Esta condición sobre el gradiente permite concluir que, alrededor de todo
punto de la curva P ∈ ϕ((−1, 1)), hay un entorno UP en la curva que es difeormorfo
a un subintervalo abierto de conjunto de parámetros (−1, 1). Del mismo modo sucede
si tenemos una parametrización de la forma ϕ : (−1, 1)2 −→ Rn y tenemos buenas
condiciones sobre el rango de la matriz jacobiana de ϕ. En este caso tenemos una
superficie porque tendrá “dimensión” 2, aunque aún no tegamos clara la noción de
dimensión que llegará más adelante en este texto.
B. Riemann reflexionó sobre esta idea y propuso que lo relevante (y poco esperable) no
era la existencia de parametrizaciones globales sino la existencia de parametrizaciones
locales: introdujo ası́ las variedades diferenciables. Una variedad diferenciable de
dimensión n, por ejemplo, es un espacio topológico M tal que para cada punto x ∈
M , existe un entorno abierto Ux ⊆ M y un abierto entorno abierto V0 del origen
0 ∈ Rn de tal modo que V0 y Ux son difeomorfos. Esta definición grosera requiere
de algunas precisiones que omitimos por no ser este el curso apropiado. Pero la idea
de Riemann es la parametrización en la cercanı́a de cada punto dentro de la variedad
(lo que se llamarán parametrizaciones locales). Estos son los objetos de estudio de la
Geometrı́a Diferencial. Un dibujo ilustrativo (sin entrar en el asunto esencial de
la compatibilidad de la carta) podrı́a ser el siguiente:
iii) Leminiscatas: Son los objetos geométricos con forma de “ocho tumbado” o sı́mbolo
del infinito que atrajeron a los matemáticos del pasado. Por ejemplo, la Lemniscata
de Gerono: que viene dada por la parametrización siguiente:
ϕ: R 7−→ R2
t 7−→ (cos(t), cos(t) sin(t)),
Un dibujo serı́a el siguiente:
Este objeto geométrico posee casi todas las propiedades de las curvas del ejemplo
precedente: es dada por una parametrización, la parametrización es global (toda la
curva es imagen), pero ya no es una curva diferenciable: es imposible encontrar un
difeomorfismo (ni siquiera un homeomorfismo) entre un entorno del origen (0, 0) ∈
ϕ(R) en la curva ϕ(R) y un intervalo abierto de 0 ∈ R. La razón puede verse del modo
siguiente: eligiendo un entorno suficientemente pqequeño del origen (0, 0) ∈ ϕ(R) en
la curva (por ejemplo, la intersección de la curva con la bola en R2 centrada en (0, 0)
de radio 1/4), eliminando el origen (0, 0) de ese entorno nos quedan 4 componentes
conexas. Y no hay ningún intervalo abierto de R tal que eliminando un punto nos
salgan más de 2 componentes conexas. Surge ası́ una pregunta obvia: ¿Qué clase de
objetos son éstos?.
7.1.2. Geometrı́a Algebraica, Analı́tica, Diofántica etc.: Objetos geométricos

dados implı́citamente por sus ecuaciones globales (o locales): A diferencia de la Ge-
ometrı́a y Toplogı́a Diferenciales, donde los objetos son dados por parametrizaciones explı́citas
(locales o globales), se pueden considerar las Geometrı́as donde los objetos son dados por ecua-
ciones implı́icas: Son los objetos de “puntos” en algún espacio (normalmente un espacio
topológico) que satisfacen ciertas ecuaciones. Esas formas de geometrı́a son las que se dis-
cuten en este Capı́tulo. El primer ejemplo a considerar es la anterior Lemniscata de Gerono.
Tenı́amos una descripción como la imagen por una aplicación analı́tica:
ϕ: R 7−→ R2
t 7−→ (cos(t), cos(t) sin(t)),
Siendo la Lemniscata el conjunto L := ϕ(R), podemos también darla como el conjunto de
puntos que satisfacen una cierta ecuación:
L := {(x, y) ∈ R2 : x4 − x2 + y 2 = 0}.
Ya hemos visto que no es una curva local o globalmente parametrizable mediante una función
que tenga un buen gradiente. No es, por tanto, una subvariedad en el sentido de Riemann,
presenta puntos especialmente malos (llamados singularidades) y se puede entender como el
conjunto de los ceros de la ecuación polinomial indicada. De ese modo surgen diversas formas
de Geometrı́a, algunas de las cuales se definen groseramente como sigue:
i) Geometrı́a Algebraica: Inicialmente es la Geometrı́a de los objetos definidos
por ecuaciones polinomiales (es decir por polinomios en K[X1 , . . . , Xn ], usualmente
suponiendo que K es un cuerpo algebriacamente cerrado) y las soluciones pueden
estar en un espación afı́n sobre un cuerpo algebraicamente cerrado An (K) = An (K)
(se llamará Geometrı́a Algebraica Afı́n), o en un espacio projectivo sobre un cuerpo
algebraicamente cerrado Pn (K) (Geometrı́a Algebraica Proyectiva). Por extensión, la
Geometrı́a Algebraica admite también estructuras en las que, localmente, los objetos
geométricos son ceros en un espectro primo Spec(R) de un anillo, susualmente neothe-
riano, y las ecuaciones son elementos del anillo (ver Problema 296, por ejemplo). A
partir de Grothendieck, estas geometrı́as se llamarán también Geometrı́a Algebraica
de Esquemas Afines. Pero esa terminologı́a nos obligarı́a a ir mucho más allá del curso.
ii) Geometrı́a Analı́tica: Se trata de objetos geométricos M ⊆ An (K), donde K = R
o K = C (y, en ocasiones, K es un cuerpo valuado completo, como el cuerpo de los
números p−ádicos, pero se sale de nuestro contexto). Un subconjunto M ⊆ An (K)
se llama variedad analı́tica, si para cara punto p ∈ M , existe un entorno abierto
U ⊆ An (K) (para la topologı́a usual) y existe un familia finita de funciones analı́ticas
f1 , . . . , fs ∈ C ω (U ) (u holomorfas- analı́ticas complejas- en H (U ), si K = C) de tal
modo que
U ∩ M := {z ∈ U : f1 (z) = · · · = fs (z))0}.
Al darse en un entorno de cada punto, hablamos de ser soluciones de ecuaciones
analı́ticas localmente definidas. Un ejemplo simple de variedad anaı́tica que no es
algebraica serı́a la siguiente:
{x ∈ R : sin(x) = 0}.
Es una variedad analı́tica porque está dada por una ecuación analı́tica, no es algebraica
porque al corarla con la recta {x = 0} tiene una cantidad infinita (numerable) de ceros.
iii) Geometrı́a Diofántica o Puntos Raciones de Variedades Algebraicas: Es
similar a la Geometrı́a Algebraica, pero aquı́ las soluciones no tienen coordenadas en
un cuerpo sino en un anillo de enteros. Es decir, se considera R = Z o√bien R un anillo
√
de enteros algebraicos (como los ejemplos R := Z[ m] o R := Z[ 1+2 m ] descritos en
los ejemplos). Se consideran polinomios f1 , . . . , fs ∈ R[X1 , . . . , Xn ] y se estudian sus
soluciones en Rn :
{(x1 , . . . , xn ) ∈ Rn : f1 (x1 , . . . , xn ) = 0, . . . , fs (x1 , . . . , xn ) = 0}.
EL objetivo es estudiar estos tipos de objetos. Est conduce a diverso problemas de
gran relevancia histórica:
• El Problema X de Hilbert (ver Problema 189) que fue el origen de la noción
de algoritmo, gracias a Gödel, Church y Turing, y, por tanto, de la informática
tal y como la conocemos.
• Las Variedades Abelianas Son variedades algebraicas Z−definibles (i.e. las
ecuaciones tienen coeficientes en Z) y que poseen una estructura de grupo abeliano
(como las curvas elı́pticas, por ejemplo). Ver https://en.wikipedia.org/wiki/
Abelian_variety Están muy ligadas a la Conjetura de Birch y Swinnerton-Dyer

(ver lo que se discute en el Ejemplo 7.3.8).
• Los puntos Fq −racionales: Se trata de los puntos de una variedad algebraica
dada por ecuaciones con coeficientes en un cuerpo finito Fq y se buscan sus
asolucione stambién en ese mismo cuerpo finito Fq . Es el trasunto de la Conjetura
de Cook (ver lo que se discute en el Ejemplo 7.3.8). También es un asunto
fuertemente ligado a aspectos propios de la Combinatoria a través del método
conocido como “The Polynomial Method” (cf. [Tao, 14], [Dvr, 09], [Al, 1999],
[?]).
El Capı́tulo pretende ser una introducción a la terminologı́a de estas Geometrı́as de los objetos
definidos implı́citamente por ecuaciones de diversas clases. Se trata de la Topologı́a de
Zariski y supondremos las condiciones de:
• Un espacio topolǵico (XT ) que es donde viven las soluciones
• Un anillo de funciones A[X] sobre X, usualmente se suponen continuas, que valen
para todos los casos descritos (algebraicas, analı́ticas, etc...)
• Los conjuntos de soluciones que, en realidad, dependen de un ideal a ⊆ A[X]:
VA[X] (a) := {x ∈ X : f (x) = 0, ∀f ∈ a}.
Dejaremos para el Capı́tulo 8 la disquisición de la caracterización de cuáles de esos ideales son
los mejor ligados a la geometrı́a de los objetos dados por ecuaciones.
7.2. Geometrı́a y soluciones: La(s) topologı́a(s) de Zariski

Esta sección mostraremos ejemplos que provienen de la Geometrı́a, entendida como estudio de
los objetos dados como soluciones (locales o globales) de sistemas de ecuaciones definidas en un
conjunto. Comencemos con unas nociones básicas.
7.2.1. Variedades o conjuntos de ceros (o de soluciones): Topologı́a(s) de Zariski.

Antes de comenzar, una pequeña cuestión termonológica. Existe un formalismo del lenguaje
matemático que usa el término “conjunto de ceros” (zero-set en inglés, por ejemplo) o “conjunto
de soluciones” para designar los conjuntos de soluciones de ciertas ecuaciones. Estos autores
reservan el término “variedad” para los conjuntos de ceros “irreduibles”. Sin embargo, otra
cierta tradición, surgida especialmente la tradición francesa, prefiere usar el término “variedad”
(variété en francés, varietät en alemán o variety en inglés) para designar cualquier conjunto de
ceros de sistemas de ecuaciones y añadir el adjetivo “irreducible” para designar a las variedades
irreducibles. En el caso de estas notas me adhiero a este uso.
Adicionalmente, el lector debe poner un poco de cuidado sobre el uso del término “variedad”
en español (como, por lo demás, en todas las lenguas latinas. En español, como en las demás
lenguas latinas, el término matemátov “variedad” (variété, varietà en italiano) se usa en dos
ámbitos distintos para referirse a dos objetos disntos (aunque con algunas relaciones. En Ge-
ometrı́a Diferencial, se usa el término variedad diferenciable, mientras que en topologı́a se usa
el término variedad topológica para referirse a objetos geométricos y topológicos que no tienen
por qué ser conjuntos de ceros globales de ninguna función de ninguna clase. Una variedad
topológica (resp. diferenciable) es un espacio topológico tal que cada punto posee un entorno
homeomorfo (resp. difeomorfo) a un abierto de un espacio afı́ real. El término original, in-
troducido por B. Riemann, fué Mannigfaltigkeit (que podrı́amos traducir por aculumación,
colección o apilamiento de diversos o múltiples). En inglés se usa el término manifold para
distinguirlo del término variety. Ciertamente, hay objetos que son, simultáneamente, “variété”
y “Mannigfaltigkeit”: el caso paradigmático de las esferas S n−1 , que pertenecen a ambos mun-
dos. Pero, en general, la relación entre ambos mundos es menos fluida por la existencia de
singularidades (como la descrita en la Lemniscata de Gerono). Las páginas que siguen no ha-
cen referencia a las Mannigfaltigkeiten sino a las variétés en el sentido de conjuntos de ceros
comunes a varias ecuaciones.
Definición 89. Sea X un conjunto no vacı́o, sea R un anillo y sea A[X] ⊆ RX una R−álgebra
(cf. iv) en Definición 23), que es subanillo del conjunto de aplicaciones de X en R. Introduci-
mos las siguientes nociones:
7.2. LA(S) TOPOLOGÍA(S) DE ZARISKI 341
i) Variedad (o conjunto de ceros) de una función (hiper-superficie): Sea f ∈

A[X] una función, definimos la variedad (o conjunto de ceros) en X asociado a f
como el subconjunto VX (f ) ⊆ X dado por la igualdad siguiente:
VX (f ) := {x ∈ X : f (x) = 0}.
ii) Variedad (o conjunto de ceros) asociada a un conjunto de funciones: Sea
F ⊆ A[X] un conjunto de funciones en A[X], definimos la variedad (o conjunto
de ceros) en X asociado a F como el subconjunto VX (F) ⊆ X dado por la igualdad
siguiente:
\
VX (F) := {x ∈ X : f (x) = 0, ∀f ∈ F} = VX (f ).
f ∈F
En el caso de que F = {f1 , . . . , fs } sea un conjunto finito, escribiremos

VX (f1 , . . . , fs ) := {x ∈ X : f1 (0) =, . . . , fs (x) = 0}.
iii) Variedad (o conjunto de ceros) asociada a un ideal: Sea a ⊆ A[X] un ideal de
A[X], definimos la variedad en X asociada al ideal a (o conjunto de ceros de a) como
el subconjunto VX (a) ⊆ X dado por la igualdad siguiente:
\
VX (a) := {x ∈ X : f (x) = 0, ∀f ∈ a} = VX (f ).
f ∈a
Observación 7.2.1 (Terminologı́a hiper-superficie). En la anterior definición hemos usado

el término hiper-superficie para describir la variedad de ceros en X dada por una sola ecuación
f ∈ A[X]. Sin embargo, el lector puede tener la intuición de que el término “hiper” usado
significa que el objeto tiene “dimensión n − 1”, donde n es la dimensión del espacio ambiente
X, sea cual sea la idea de dimensión que intuimos. Esto no será ası́, por ejemplo, en el caso
de que R = K sea un cuerpo que no es algebraicamente cerrado y A[X] ⊆ K X . Como se
observa en el Problema 276, si K no es algebraicamente cerrado y A[X] es noetheriano, toda
subvariedad A[X]−definible de X se puede expresar con una sola ecuación. Sólo en el caso de
cuerpos algebraicamente cerrados, podremos (gracias al Teorema del Ideal Principal de Krull y
al Teorema de los Ceros de Hilbert) identificar hiper-superficies con conjuntos cuya dimensión
es n − 1 donde n es la dimensión del espacio ambiente. Pero, por ahora, preservaremos esta
terminologı́a.
Observación 7.2.2. Por lo indicado en la discusión terminológica inicial, insistiremos en usar

la expresión “variedad”, aunque, en ocasiones, usemos la expresión “conjunto de ceros”. Es
claro que VX (0) = X, luego X es una variedad (definida por el 0 ∈ A[X]). Por eso, en muchas
ocasiones, se dice que VX (F) es un subvariedad de X. Al conjunto de todos las posibles
suvariedades de X definidos por subconjuntos del anillo A[X] se les denomina subvariedades
A[X]−definibles. Según los casos, cuando los anillos tienen semántica propia, las subvariedades
A[X]−definibles tienen nombres especı́ficos. Veremos ejemplos más adelante
Proposición 7.2.3. Sea X un conjunto no vacı́o, sea R un anillo y sea A[X] una R−álgebra
que es subanillo de RX . Sea F ⊆ A[X] un conjunto y a ⊆ A[X] el ideal que F genera en A[X].
Entonces,
VX (F) = VX (a).
Más aún, el variedad VX (a) coincide con la variedad VX (G) asociada a cualquier conjunto de
generadores G de a como ideal en A[X]. Es, por tanto, independiente del conjunto generador
elegido. En particular, toda variedad A[X]−definibles de X es una variedad asociada a un ideal
de A[X].
Adicionalmente, si A[X] es un anillo noetheriano, toda variedad A[X]−definible es una inter-
sección finita de hipersuperficies, es decir, dado a ⊆ A[X] un ideal, si A[X] es noetheriano,
existe una familia finita f1 , . . . , fs ∈ A[X] tales que
VX (a) = VX (f1 ) ∩ · · · ∩ VX (fs ) = VX (f1 , . . . , fs ).
Demostración. Es claro que si F := {fi : i ∈ I} genera el ideal a en A[X], F ⊆ a y,

entonces, teniendo más ecuaciones en a que en F se tiene la inclusión siguiente:
\ \
VX (a) = VX (f ) ⊆ VX (f ) = VX (F).
f ∈a f ∈F
Para el otro contenido, sea x ∈ VX (F) y sea f ∈ a un elemento cualquiera. Recordando la

definición de generadores de un ideal (Definición 32), si f ∈ a = (F) existen J ⊆ I un conjunto
finito, y existen {gj : j ∈ J} ⊆ A[X] tales que:
X
f := gj fj .
j∈J
Como la suma de la parte derecha de la igualdad es finita, podemos concluir que

X X
f (x) = gj (x)fj (x) = gj (x) · 0 = 0.
j∈J j∈J
Por tanto, f (x) = 0 para cualquier f ∈ a, luego x ∈ VX (a) y habremos probado VX (F) ⊆ VX (a)
concluyendo la primera afirmación del enunciado.
Obviamente, si tuviéramos otro conjunto G de generadores del ideal a, aplicxando esta misma
afirmación tendrı́amos:
VX (G) = VX (a) = VX (F),
y la variedad no depende del sistema generador de a elegido.
En lo que concierne al caso noetheriano, es claro que, por definición de anillo noetheriano, todo
ideal a de A[X] posee un sistema generador finito y, por lo que acabamos de probar, VX (a) será
el conjunto de ceros comunes a ese sistem generador finito de elementos del ideal a.
Proposición 7.2.4 (Propiedades generales). Sea X un conjunto no vacı́o, sea R un anillo

y sea A[X] una R−álgebra que es subanillo de RX . Se tiene:
i) Si a ⊆ b son dos ideales del anillo A[X], entonces VX (b) ⊆ VX (a).
ii) ∅ = VX ((1)), donde (1) es el ideal generado por 1 en A[X] (es decir, el propio A[X]
como ideal dentro de sı́ mismo).
iii) X = VX ((0)), donde (0) = {0} es el ideal de A[X] formado solamente por el 0 ∈ A[X].
iv) La intersección de una familia cualquiera {V (ai ) : i ∈ I} de variedades A[X]−definibles
P
es también una variedad A[X]−definible. De hecho, si b es el ideal suma i∈I ai en
A[X] se tiene
\ X
VX (ai ) = VX (b) = VX ( ai ).
i∈I i∈I
v) Si R es un dominio de integridad, dados f, g ∈ A[X], entonces VX (f g) = VX (f ) ∪
Vx (g).
vi) Si R es dominio de integridad, la unión finita de subconjuntos de ceros A[X]−definibles
de X es también un subconjunto de ceros A[X]−definible. De hecho, en este caso,
dados a, b dos ideales de A[X], entonces si c es el ideal producto ab en A[X] se tiene
VX (a) ∪ VX (b) = V (c) = VX (ab).
vii) Para cada ideal a ⊆ A[X], si R es un anillo reducido (i.e. sin elementos nilpotentes)
se tiene que:
√
VX (a) = VX ( a),
√
donde a es el radical del ideal a introducido en la Subsección 6.3.1.
Demostración. Hagamos un repaso a las distintas afirmaciones:
i) Supongamos a ⊆ b, entonces es claro que hay más ecuaciones en b que en a por cuanto,
hay menos ceros en común. Es decir, se tiene:
\ \
VX (a) = VX (f ) ⊇ VX (f ) = VX (b).
f ∈a f ∈b
ii) Es obvio.
iii) Es obvio.
P S
iv) Recuérdese (Definición 35) que i∈I ai es el ideal generado por i∈I ai . Obsérvese,
además, que
[ [
VX ( ai ) := {x ∈ X : f (x) = 0, ∀f ∈ ai } ⊆ VX (ai ), ∀i ∈ I.
i∈I i∈I
P
Luego, como aj ⊆ i∈I ai , para cada j ∈ I, aplicando la afirmación i) concluimos
[ X \
(7.2.1) VX ( ai ) = VX ( ai ) ⊆ VX (ai ).
i∈I i∈I i∈I
T P
Para el otro contenido,
S sea x ∈P i∈I VX (ai ) y sea f ∈ i∈I ai dos elementos cua-
lesquiera. Como i∈I ai genera i∈I ai , existirá J ⊆ I un conjunto finito y para cada
(j) (j) (j) (j)
j ∈ J, existirán elementos {f1 , . . . , fkj } ⊆ aj y elementos {g1 , . . . , gkj } ⊆ A en
número finito y elementos tales que:
 
kj
(j) (j)
X X
f=  gi fi  .
j∈J i=1
Ahora, como la suma de la izquierda es una suma finita podemos escribir:

 
kj
(j) (j)
X X
f (x) =  gi (x)fi (x) .
j∈J i=1
Pero como x ∈ VX (ai ) para todo i ∈ I, también se tiene x ∈ VX (aj ) para todo j ∈ J.
(j) (j)
Como {f1 , . . . , fkj } ⊆ aj , para cada j ∈ J, entonces concluimos:
(j)
fi (x) = 0, ∀j ∈ J, ∀i, 1 ≤ i ≤ kj .
Por tanto, la igualdad precedente se puede escribir como:
   
kj kj
(j) (j) (j)
X X X X
f (x) =  gi (x)fi (x) =  gi (x) · 0 = 0,
j∈J i=1 j∈J i=1
donde hemos podido igualar

T a cero por ser suma finita. Hemos
P concluido que f (x) = 0
para cualesquiera x ∈ i∈I VX (ai ) y para cualquier f ∈ i∈I ai , por tanto,
\ X
VX (ai ) ⊆ VX ( ai ),
i∈I i∈I
lo cual nuto a la inclusión descrita en la ecuación 7.2.1 termina la demostración de
esta afirmación.
v) Sea f, g ∈ A[X], si x ∈ VX (f ) entonces f (x) = 0, luego f g(x) = f (x)g(x) = 0 y, por
tanto, x ∈ VX (f g). Haciendo lo mismo con los elementos de VX (g) concluiremos
VX (f ) ∪ VX (g) ⊆ VX (f g).
De otro lado, si x ∈ VX (f g), entonces f g(x) = f (x)g(x) = 0. Como R es un dominio
de integridad, y f (x), g(x) ∈ R, entonces tiene que darse f (x) = 0 o g(x) = 0. En
conclusión, si x ∈ VX (f g), entonces x ∈ VX (f ) o VX (g) y habremos probado:
VX (f ) ∪ VX (g) ⊇ VX (f g),
lo que con la inclusión anterior demuestra la afirmación buscada.
vi) Aplicando inducción, la afirmación sobre la unión finita se sigue inmediatamente si
somos capaces de demostrar que la unión de dos variedades A[X]−definibles es también
una variedad A[X]−definible. Consideremos, entonces, este caso y sean a, b dos ideales
de A[X] y sea c es el ideal producto ab en A[X]. Hemos visto que
c = ab ⊆ a ∩ b,
Luego, c ⊆ a y c ⊆ b, lo cual implica
VX (a) ⊆ VX (c) = VX (ab), VX (b) ⊆ VX (c) = VX (ab),
con lo que concluimos:
(7.2.2) VX (a) ∪ VX (b) ⊆ VX (c) = VX (ab).
Para la otra inclusión, necesitamos la hipótesis de que R es un dominio de integridad.

Recordemos que el ideal producto c es el ideal generado por el conjunto siguiente:
F := {f g : f ∈ a, g ∈ b}.
Como los ceros comunes de un ideal son los ceros comunes a uno cualquiera de los
sistemas generadores, concluimos que:
\ \
VX (c) = VX (f g) = VX (f g).
f g∈F f ∈a,g∈b
Como R es un dominio de integridad, para cada x ∈ X, si f (x)g(x) = 0, entonces, o

bien f (x) = 0 o bien g(x) = 0, de donde deducimos que dados f, g ∈ A[X] cualesquiera,
se tiene: VX (f g) = VX (f ) ∪ VX (g). Por consiguiente, se tiene:
\
VX (c) = (VX (f ) ∪ VX (g)) .
f ∈a,g∈b
Aplicando la distributiva de conjuntos concluiremos:

   
\ \
VX (c) =  VX (f ) ∪  VX (g) = VX (a) ∪ VX (b).
f ∈a g∈b
vii) Una de las inclusiones es obvia por√i). Para la otra, sI R no posee elementos nilpo-
tentes, dado f ∈ A[X] tal que f ∈ a, existe
√ n ≥ 1, n ∈ N, tal que f n ∈ a. Por tanto
si x ∈ X es tal que x ∈ VA[X] (a) y f ∈ a, entonces f n (x) = 0 entonces f (x) = 0 y
√
x ∈ VA[X] ( a).

Corolario 7.2.5 (Topologı́a de Zariski). Con las notaciones precedentes, dado un conjunto
X, un dominio de integridad R y una R−álgebra A[X] que es subanillos de RX , el conjunto de
los subconjuntos de ceros A[X]−definibles
{VX (a) : a es un ideal de A[X]},
define una única topologı́a en X en la que dicho conjunto es la clase de cerrados. A esa topologı́a
se la denomina topologı́a de Zariski sobre X dada por el anillo A[X] y la denotaremos mediante
TZ (A[X]). Discutiremos diversos ejemplos en las páginas que siguen.
Demostración. Basta observar la proposición precedente, y las propiedades allı́ probadas,
para concluir que existe una única topologı́a en X para la cual los cerrados son los subconjuntos
del conjunto de las variedades A[X]−definibles.
Esto nos permite introducir el lenguaje de la topologı́a en nuestro contexto y podemos usar los
términos siguientes:
Definición 90. Sea X un conjunto y A[X] ⊆ RX una clase de funciones, con R dominio de
integridad.
i) Llamaremos cerrados (A[X]−definible) para la topologı́a de Zariski a las variedades
A[X]−definibles.
ii) Llamaremos abierto (A[X]−definible) en la topologı́a de Zariski a los complementarios
de las veriadades A[X]−definibles. Es decir, son abiertos aquellos subconjuntos O ⊆ X
tales que existe un ideal a ⊆ A[X] de tal modo que:
[
O= {x ∈ X : f (x) 6= 0} = X \ VX (a).
f ∈a
Podremos escoger cualquier conjunto F ⊆ A[X], igualmente.

iii) Llamaremos abierto distinguido (A[X]−definible) en la topologı́a de Zariski de X a
los abiertos de la forma:
OX (f ) := {x ∈ X : f (x) 6= 0},
donde f ∈ A[X]. Es decir, a los complementarios de una hipersuperficie definida por
un elemento f ∈ A[X].
iv) Llamaremos localmente cerrado (A[X]−definible) en la topologı́a de Zariski de X a los

subconjuntos que sean intersección de un abierto y un cerrado en dicha topologı́a.
v) Llamaremos constructible A[X]−definible en la topologı́a de Zariski de X a cualquier
unión finita de localmente cerrados.
vi) Llamaremos clausura (A[X]−definible) de un subconjunto cualquier Y ⊆ X en la
topologı́a de Zariski de X al menor cerrado A[X]−definible en esa topologı́a que con-
z
tiene a Y . Lo denotaremos mediante Y .
Observación 7.2.6. Obviamente resulta incómodo y oneroso repetir una y otra vez el término
A[X]−definble. Por ello, evitaremos esa insistencia cuando la R−álgebra A[X] sea clara por
el contexto. Especificaremos el detalle del objeto en los casos en los que la R−álgebra sea
determinante para alguna propiedad en cuestión. Ası́ que hablaremos de cerrados, abiertos,
localmente cerrados en X para la topologı́a de Zariski, etc.
7.2.1.1. Algunos Ejemplos de Topologı́as de Zariski.
Ejemplo 7.2.7 (Ceros de funciones continuas a valores reales). Sea (X, T ) un espacio
topolológico sea R = R el cuerpo de los números reales y A[X] = C (X) (o también denotado,
en ocasiones como C 0 (X)) el anillo de las funciones contı́nuas de X en R. Podemos definir
conjuntos como:
VX (f ) := {x ∈ X : f (x) = 0} := f −1 ({0}).
El conjunto VX (f ) es, obviamente, un cerrado en X y resulta fácil observar algunas identidades
elementales como las siguientes:
VX (f ) ∪ VX (g) := VX (f.g), VX (f ) ∩ VX (g) := VX (f 2 + g 2 ).
Sobre los reales se da un patologı́a especial y es que intersecciónes finitas de hipersuperficies
definidas por una sola ecuación son también hipersuperficies definidas por una sola ecuación.
Esto no necesariamente ocurre para una colección infinita de ecuaciones dadas por funciones
continuas a valores reales definidas sobre un espacio topológico.
En todo caso, observamos que la topologı́a T dada inicialmente es “a priori” más fina que
la topologı́a de Zariski TZ (C (X)) definida sobre X por las funciones continuas, es decir,
TZ (C (X)) ⊆ T . Observemos también (en virtud del Teorema de Banach-Stone-Čech-Gel’fand-
Kolmogorov) que si X es compacto, ambas topologı́as coinciden.
Ejemplo 7.2.8 (Funciones diferenciables sobre abiertos de Rn ). Podemos suponer que

X ⊆ Rn es un abierto en Rn , que el anillo R = R es el cuerpo de los números reales y que
nuesto anillo A[X] tiene en cuenta condiciones de diferenciablidad de algunas funciones. Por
ejemplo,
A ∈ {C ω (X) ⊆ C ∞ (X) ⊆ C k (X) ⊆ C 1 (X)},
todos ellos subanillos de C (X). De nuevo la topologı́a de Zariski definida por A es una topologı́a
hecha de cerrados de X para la topologı́a usual en X inducida por la de Rn . El siguiente
resultado suele ser atribuido a Withney:
Teorema 7.2.9 (Withney). Dado cualquier subconjunto cerrado F ⊆ Rn , existe una función
f ∈ C ∞ (Rn ) tal que
F = VRn (f ).
No haremos la prueba que corresponde a otro curso (bien de Análisis o de Topologı́a Diferencial).
En todo caso, este resultado permite concluir
Corolario 7.2.10. Si X es un abierto de Rn y A[X] es un anillo en la familia
{C k (X) : 0 ≤ k ≤ ∞}.
Entonces, la topologı́a de Zariski sobre X definida por A es la topologı́a usual, es decir,
TZ (A[X]) = Tu .
Demostración. El Teorema atribuido a Withney nos garantiza que todo cerrado en X es
una subconjunto de ceros C ∞ (X)−definible . Por tanto es también B−definible para todo los
anillos B que contienen a C ∞ (X) como subanillo y, además, son cerrados para las respectivas
topologı́as de Zariski.
Ejemplo 7.2.11 (Subvariedades diferenciables definidas localmente). No insistiré, por

haberlo hecho con anterioridad, en la cuestión terminológica. El uso de la palabra variedad no
debe confunir al lector entre su interpretación en Geometrı́a Diferencial y su uso en este nuestro
contexto.
Una notación clásica, para empezar: Dadas dos variedades diferencibles M y una función
f : M −→ N , para cada punto a ∈ M denotaremos por Ta f la función tangente alrededor del
punto a. Es decir,
Ta f : Ta M −→ Tf (a) N.
Se tiene la siguiente caracterización clásica de las subvariedades de una variedad:
Teorema 7.2.12 (Caracterización de subvariedades diferenciables como variedades

localmente lisas). Sea M una variedad de dimensión m y N un subconjunto. Entonces, N
es subvariedad de M si y solamente si para cada punto a ∈ N existe un entorno abierto U de
a en M y existen funciones f1 , . . . , fm−n ∈ C ∞ (U ) tales que
• N ∩ U = VU (f1 , · · · , fm−n ).
• Dada la aplicación f := (f1 , . . . , fm−n ) : M −→ Rm−n , la aplicación tangente asociada
Ta f : Ta M −→ T0 Rm−n es suprayectiva (submersión), donde 0 ∈ Rn−m es el origen
de coordenadas.
Aunque no lo demostraremos, la prueba se basa en el Teorema del Rango Constante. En esen-

cia, lo que dice este enunciado es que si bien las variedades no tiene por qué ser dadas como
conjunto de soluciones de niguna familia de ecuaciones, las subvariedades, en cambio, sı́ pueden
interpretarse como aquellos subconjuntos de una variedad M que, localmente, son cerrados para
la topologı́a de Zariski. Se dice que son, localmente, y cerrados lisos de la topologı́a de Zariski
dada por el anillo de funciones C ∞ (M ).
Ejemplo 7.2.13 (Ceros de una función a valores complejos). A partir de una función
continua f ∈ C (X, C) podemos definir el conjunto de sus ceros comunes en X:
VX (f ) := {x ∈ X : f (x) = 0} := f −1 ({0}).
El conjunto VX (f ) es, de nuevo, cerrado en X y resulta fácil observar algunas identidades

elementales como VX (f ) ∪ VX (g) := VX (f.g).
Ejemplo 7.2.14 (Las Variedades C-analı́ticas de Cartan). Se consideran esencialmente

dos casos:
• A = C ω (X, R), con X ⊆ Rn abierto, es decir el anillo de funciones analı́ticas a valores
reales,
• A = H (X), con X ⊆ Cn un abierto, es decir el anillo de funciones holomorfas (i.e.
analı́ticas complejas) definidas en X.
En este caso, la topologı́a de Zariski TZ (A) está formada sólo por una parte de los cerrados de
la topologı́a usual en X (tanto en el caso real como en el complejo). De hecho, se puede probar
el siguiente resultado en Geometrı́a Analı́tica:
Proposición 7.2.15. Sea K = R ∨ C, sea X ⊆ An (K) un abierto conexo y sea a un ideal en

H (X) (si K = C) o ideal en C ω (X) (si K = R). Entonces, VX (a) ⊆ X es o bien coincidente
con X o bien es un conjunto de interior vacı́o y de medida (de Lebesgue) nula. En particular,
todos los cerrados F ⊆ X propios de la topologı́a de Zariski son conjuntos de interior vacı́o y
medida de Lebesgue nula.
La demostración no la daremos aquı́ porque exige una fuerte introducción previa en variable
compleja y funciones analı́ticas reales que no se corresponde al curso pero, en todo caso, ilustra
la distinción entre la toopologı́a de Zariski y la topologı́a usual.
7.2.2. Ideal de un objeto geométrico, primos, maximales y variedades.

Definición 91 (Ideal de funciones que se anulan en un subconjunto). Con las nota-
ciones precedentes, sean X un conjunto, R un dominio de integridad, A[X] una R−álgebra que
es subanillo de RX . Consideremos F ⊆ X, definimos el ideal de funciones que se anulan en el
subconjunto F (y lo denotaremos mediante IA[X] (F )) como el ideal en A[X] dado por:
IA[X] (F ) := {f ∈ A[X] : f (x) = 0, ∀x ∈ F }.
Observación 7.2.16. Es obvio que IA[X] (F ) es un ideal de A[X]. Obviamente en cada caso
hemos de especificar el anillo sobre el que trabajamos. Los ideales respectivos son distintos,
obviamente, aún cuando estemos en el caso de subanillos como, por ejemplo, en el caso de la
siguiente cadena de sub–anillos:
R[X1 , . . . , Xn ] ⊆ C ω (X) ⊆ C ∞ (X) ⊆ C (X),
tendremos ası́ la cadena de los “respectivos” ideales;
IR[X1 ,...,Xn ] (F ) ⊆ IC ω (X) (F ) ⊆ IC ∞ (X) (F ) ⊆ IC (X) (F ),
que no coincidirán. Como notación, una vez hemos fijado el contexto de una R−álgebra A[X]
sobre la que estamos trabajando, escribiremos simplemente I(F ). en lugar de IA[x] (F ), en-
tendiéndose la R−álgebra A[X] por el contexto. Sólo lo especificaremos cuando pueda haber
confusión y el contexto no sea claro.
Proposición 7.2.17. Con las anteriores notaciones, sean X el conjunto, R dominio de integri-
dad, fijemos una R−álgebra A[X] que es subanillo de RX . Escribamos I(F ) := IA[X] (F ) para
cualquier subconjunto F ⊆ X. Se verifican las propiedades siguientes:
i) Si F ⊆ G son dos subconjuntos de X, I(G) ⊆ I(F ).
ii) I(∅) = A[X], (0) = I(X). p
iii) LosS ideales I(F
T ) son ideales radicales (i.e. I(F ) = I(F )).
iv) I(Ti∈I Fi ) = Pi∈I I(Fi ).
v) I( i∈I Fi ) ⊇ i∈I I(Fi ).
vi) Además, la clausura en la topologı́a de Zariski sobre X definida por A[X] de cualquier
subconjunto viene dada mediante:
z
F = V (I(F )).
Además,
z
I(F ) = I(F ).
Demostración. La primera afirmación es evidente desde la Definición. La segunda también.
La afirmación iii) es consecuencia de ser R un dominio de integridad (el resultado también serı́a
cierto si hubiéramos asumido quep R un anillo reducido, i.e. sin elementos nilpotentes no nulos,
ver Definición 79). Ası́, si f ∈ I(F ), entonces existe n ∈ N, n ≥ 1, tal que f n ∈ I(F ). Por
tanto, f (x)n = 0 para cada x ∈ F . Como R es un anillo reducido, el único elementos nilpotentes
es el 0 ∈ R. Como f (x) ∈ R, claramente se tiene que f (x)n = 0 =⇒ f (x) = 0 y esto es cierto
para todo x ∈ F . Por tanto f ∈ I(F ) y concluimos que I(FS ) es un ideal radical. S
Para la afirmación iv), aplicando i) observamos que Fj ⊆ i∈I Fi y, por tanto, I( i∈I Fi ) ⊆
I(Fj ) para cada j ∈ I, con lo que se obtiene el contenido
[ \
I( Fi ) ⊆ I(Fi ).
i∈I i∈I
T
Para el otro contenido usamos la definición directamente.SSi f ∈ i∈I I(Fi ), entonces, f se
anula en todos los Fi ’s y, por tanto, se anula en la unión i∈I Fi . Y el otro contenido queda
demostrado.
La propiedad v) sólo establece el contenido (la igualdad es incierta) y es consecuencia inmediata
de la propiedad i): Como ∩i∈I Fi ⊆ Fj para cada j ∈ I, entonces, I(Fj ) ⊆ I(∩i∈I Fi ) para cada
j ∈ I. Por tanto, la suma también está incluida y tendremos
X \
I(Fi ) ⊆ I( I(Fi ).
i∈I i∈I
La propiedad iv), aún siendo sencilla, tiene algún interés en su prueba. Recordemos la topologı́a
de Zariski, descrita en la Proposición 7.2.5 anterior. Escribamos I(F ) en lugar de IA[X] (F )
por descaragr un poco la notación. En particular, VX (I(F )) es cerrado en esa topologı́a y,
z
claramente, F ⊆ VX (I(F )). Por tanto, tenemos un primer contenido F ⊆ VX (I(F )). De otro
z
lado, por la propia definición de la topologı́a de Zariski, como F es cerrado, debe existir un
ideal a en A[X] tal que:
z
(7.2.3) F ⊆ F = VX (a) ⊆ VX (I(F )).

Como F ⊆ VX (a), para cada f ∈ a, f F ≡ 0. Pero, entonces, para cada f ∈ a, tenemos
que f ∈ I(F ) y habremos probado que a ⊆ I(F ). Finalmente, usando la primera de las
afirmaciones de la Proposición 7.2.4 anterior, concluiremos VX (I(F )) ⊆ VX (a), por cuanto
z
F = VX (a) = VX (I(F )). La última afirmación se sigue elementalmente de esta. Si f ∈ A[X]
z
se anula en un conjunto F , entonces f ∈ I(F ), con lo que f se anula también en V (I(F )) = F .
z
Obviamente, si f se anula en la clausura F , se anulará también en F y habremos terminado
la prueba del enunciado.
Observación 7.2.18. En estos apuntes hemos decidido presentar las variedades algebraicas
a través de una R−álgebra de funciones sobre X, es decir, hemos escrito, por simplicidad,
A[X] ⊆ RX . Pero no siempre va a ser ası́. En ocasiones, se consideran R−álgebras A[X]
cuyos elementos definen funciones, pero no de manera unı́voca. En esos casos, algunas de la
igualdades predecentes se pierden. Por ejemplo, consideremos R = Fq el cuerpo finito de q
elementos, supongamos X = F2q como conjunto no vacı́o y supongamos que consideramos la
R−álgebra A[X] = Fq [X1 , X2 ]. Los polinomios en A[X] definen funciones sobre X y se tiene
(0) ⊆ IA[X] (X), pero no se tiene la igualdad porque, obviamente,
(0) ( a ⊆ IA[X] (X),
con lo que la propiedad ii) de la proposición precedente no se da.
Corolario 7.2.19. Con las notaciones anteriores, para cualquier subconjunto C ⊆ X, se tiene
que C es cerrado Zariski para la topologı́a definida por A[X] si y solamente si
C = VX (IA[X] (C)).
Más aún, se verificarán las propiedades siguientes para cerrados F y G en la topologı́a de
Zariski:
F ⊆ G ⇐⇒ IA[X] (G) ⊆ IA[X] (F ).
7.2.2.1. Ideales Primos e Irreducibles.

Definición 92 (Variedad irreducible). Con las notaciones precedentes, un cerrado A[X]−
definible en X se denomina reducible si existen dos cerrados Zariski A[X]−definibles W1 , W2 ⊆
X tales que
Wi ( V, i ∈ {1, 2},
y
V = W1 ∪ W2 .
Si no es reducible, diremos que V es un irreducible.
Proposición 7.2.20. Con las notaciones precedentes, si R es un dominio de integridad y

A[X] ⊆ RX , y V ⊆ X una variedad A[X]−definible, son equivalentes:
i) V es irreducible,
ii) IA[X] (V ) ∈ Spec(A[X]).
Demostración. Supongamos que V es irreducible. Sea I(V ) = IA[X] (V ) ⊆ A[X] el
ideal formado por las funciones f : X −→ R en A[X] que se anulan en V . Sean dados
f, g ∈ A[X] tales que f g ∈ I(V ). Supongamos que f 6∈ I(V ). Considero las siguientes variedades
A[X]−definibles:
W1 := V ∩ VX (f ), W2 := V ∩ VX (g).
Tenemos que V = W1 ∪ W2 y V es irreducible. Por tanto, como f 6∈ I(V ), entonces V 6= W1 .

Por tanto, V 6= W1 con lo que, necesariamente, V = W2 ⊆ VX (g). Esto último implica que
g ∈ I(V ) y tenemos que I(V ) ∈ Spec(A[X]).
Recı́procamente, supongamos que el ideal I(V ) es primo. Y supongamos que
[
V = W1 W2 ,
donde W1 y W2 son cerrados Zariski A[X]−definibles. Entonces, por el apartado iii) de la

Proposición 7.2.17 precedente, se tiene que
I(V ) = I(W1 ∪ W2 ) = I(W1 ) ∩ I(W2 ).
Pero el ideal p = I(V ) es un ideal primo, luego, por el ı́tem iii) de la Proposición 4.2.12, si un
ideal primo p contiene una intersección de ideales, debe contener a alguno de ellos. Concluimos
ası́ que:
I(V ) ⊇ I(W1 ) ∨ I(V ) ⊇ I(W2 ).
De otro lado, Wi ⊆ V , luego por el apartado i) de la Proposición 7.2.17 concluimos que
I(V ) ⊆ (Wi ), para cada i ∈ {1, 2}. Habremos probado ası́ que se da una de las dos condiciones
siguientes:
[I(W1 ) ⊇ I(V ) ⊇ I(W1 )] ∨ [I(W2 ) ⊇ I(V ) ⊇ I(W2 )].
I(V ) = I(W1 ) ∨ I(V ) = I(W2 ).
Finalmente, por la propiedad vi) de la Proposición 7.2.17 concluimos que V = W1 ∨ V = W2 y,
por tanto, V es irreducible.
Corolario 7.2.21. Con las notaciones y propiedades precedentes, los cerrados irreducibles para
la topologı́a de Zariski están contenidos en el conjunto:
{VX (p) : p ∈ Spec(A[X])}.
Demostración. Si V es cerrado irreducible en la topologı́a de Zariski, entonces p :=
I(V ) ∈ Spec(A[X]). Pero, como es cerrado
z
V = V = VX (I(V )) = VX (p),
lo que prueba el enunciado.
Observación 7.2.22. La pregunta natural pasa por intentar conocer qué ideales primos p
definen un irreducible y cuáles no. Es una pregunta de tipo Nullstellensatz.
7.2.2.2. Ideales maximales y puntos. Comencemos retomando el ejemplo discutido

(para cuerpos) en el ejemplo vi) de la lista de Ejemplos 4.2.1:
Proposición 7.2.23 (Ideales asociados a puntos). Con las mismas notaciones pecedentes,
R un dominio de integridad, A[X] una R−álgebra que es subanillo de RX y x ∈ X un punto
de X. Denotemos por mx ) al ideal mx := I({x}), es decir,
mx = IA[X] ({x}) := {f ∈ A[X] : f (x) = 0}.
Entonces,
i) El ideal mx ∈ Spec(A[X]) es un ideal primo. En particular, la clausura Zariski de un
z
punto cualquiera {x} es una variedad A[X]−definible irreducible.
ii) Si R es un cuerpo y A[X] es una R−álgebra, entonces el ideal mx ∈ MaxSpec(A[X])
es un ideal maximal.
iii) En general no es cierto que {x} sea un cerrado para la topologı́a de Zariski definida
por A[X] sobre X. Ni siquiera en el caso de que R sea un cuerpo.
Demostración. Consideremos el morfismo de anillos:

evx : A[X] −→ R
f 7−→ f (x).
Claramente se tiene que el núcleo de evx es precisamente el ideal mx . Por tanto, el 1er. Teorema
de Isomorfı́a nos identifica, mediante isomorfismo de anillos, con el anillo cociente
A[X]/mx ,
con un subanillo T de R. Como la condición de ser dominio de integridad es hereditaria para
subanillos, entonces T es dominio de integridad y también lo será A[X]/mx , lo que significa que
mx ∈ Spec(A[X]). Por la afirmación vi) Proposición 7.2.17, sabemos que
z
mx = IA[X] ({x}) = IA[X] ({x} )) ∈ Spec(A[X]).
z
Y por la Proposición 7.4.13 concluimos que {x} es una variedad irreducible.
Si R es cuerpo y A[X] es R−álgebra, R está identificado con un subcuerpo de A[X]. Podemos
suponer, simplemente, que R ⊆ A[X], definiendo las funciones constantes. Entonces, evx es
suprayectiva y el 1er. Teorema de Isomorfı́a identifica el anillo cociente con:
A[X]/mx ∼ = R,
con lo que mx es un ideal maximal.
Para la última afirmación, supongamos √ X = C, A[X] = Q[X1 ] el anillo de polinomios en
una variable. Considero el punto x = 2 ∈ C y considero mx ⊆ Q[X1 ]. Claramente m√2 =
√
((X12 − 2)) y VC (mx ) = {± 2}. En otras palabras, no se puede disociar√elementos algebraicos
de C usando solamente ecuaciones polnomiales con coeficientes en Q y { 2} no es cerrado para
la topologı́a de Zariski definida en C por Q[X1 ].
Observación 7.2.24. Del mismo modo que en el caso de ideales primos (ver Observación
7.2.22) y subvariedades irreducibles, nos podemos pregunta qué ideales maximales están aso-
ciados a los puntos de x y viceversa. De nuevo es una pregunta que será respondida por el
Nullstellensatz.
7.2.2.3. Nullstellensätze y y Variantes: ¿Diccionario Álgebra–Geometrı́a?.
En las observaciones 7.2.24 y 7.2.22 nos preguntamos por la identificación entre conjuntos de
ceros irreducibles y primos. De modo general, podemos retomar el Corolario 7.2.19 e interpre-
tarlo del modo siguiente:
Fijemos in conjunto X no vacı́o, un dominio de integridad R, una R−álgebra A[X] que sea
subanillo de RX . Definamos los conjuntos de cerrados en la topologı́a de Zariski en X
T c (X) := {F ⊆ X : F es cerrado Zariski en X},
y de ideales en A[X]:
IA[X] := {a ⊆ A[X] : a es un ideal de A[X]}.
Tenemos las transformaciones:
V : IA[X] −→ T c (X), I : T c (X) −→ IA[X]
a 7−→ VX (a), F 7−→ IA[X] (F ).
El Corolario 7.2.19 se traduce simplemente en:

V ◦ I |T c (X) = IdT c (X) .
En particular, I es inyectiva, V es suprayectiva, pero no queda claro quién es la imagen de
I o, dicho de otro modo, cómo podemos caracterizar qué ideales de A[X] están identificados
con los objetos geométricos. A las respuetas a estas preguntas se les conoce como Teoremas
de los Ceros o Nullstellensätze. En el Capı́tulo 8 daremos el enunciado y demostración
del Nullstellensatz de Hilbert-Kronecker. Este resultado considera un cuerpo K y su clausura
algebraica K, toma como espacio X un espacio afı́n de dimensión finita (pongamos de dimensión
n) sobre K, esto es en el caso X = An (K) = An (K) y considera como anillo de funciones al
anillo A[X] = K[X1 , . . . , Xn ]. Mostraremos, sin demostración, también otros ejemplos de
Nullstellensätze en otros ámbitos de funciones y espacios.
7.3. RUDIMENTOS DE GEOMETRÍA ALGEBRAICA 351
7.3. Rudimentos de Geometrı́a Algebraica: Variedades algebraicas K−definibles

Toda la disquisición previa sobre el uso de A[X]−definibles, remarcando la relevancia del anillo
A[X], tiene que ver, como se observa, con el contexto académico en el que se trabaja (bien sea
algebraico, anaı́tico, diferenciable, etc.). Pero también tiene su relevancia cuando se trabaja en
un contexto concreto y es, especialmente, significativo en el caso algebraico, que expondremos
a continuación.
Los métodos el tratamiento algorı́timico de objetos de la Geometrı́a Algebraica entroncan con el
sencillo problema de tratar de resolver un sistema de ecuaciones polinomiales como el siguiente:


 f1 (x1 , . . . , xn ) = 0
f2 (x1 , . . . , xn ) = 0

(7.3.1) .. ..


 . .
fs (x1 , . . . , xn ) = 0

Estos tratamientos algorı́tmicos suelen recibir el nombre de Métodos Efectivos en Geometrı́a

Algebraica (sobre todo en Europa), aunque también se usa el término Computational Algebraic
Geometry (sobre todo, en el contexto FoCM americano). En el siglo XIX eran más elegantes y
llamaban a esta parte de la Ciencia Teorı́a de la Eliminación.
Para poder analizar las soluciones de un sistema de ecuaciones como el descrito en la identidad
precedente (7.3.1) lo primero imprescindible es que algiien pueda “escribir” esas ecuaciones de
algún modo. Esto ya lo tratamos ligeramente cuando tratamos los lenguajes sobre alfebatos
finitos (ver la SUbsección 1.2.2). Algo que se puede escribir es algo que se puede expresar sobre
un alfabeto finito Σ y, por tanto, para estudiar las ecuaciones de (7.3.1), si los polinomios son
dados en forma “densa” (es decir, por sus coeficientes) necesito poder escribir los coeficientes
sobre algún alfabeto finito. En suma, los polinomios f1 , . . . , fs dados deben pertenecer a algún
anillo de la forma K[X1 , . . . , Xn ] donde K es un cuerpo expresable sobre un alfebato finito.
Los ejemplos más sencillos de tales cuerpos son los cuerpos primos ({Fp : p ∈ N p es primo} ∪
{Q}). Los cuerpos primos (y otros cuerpos que se construyen desde ellos) son, además cuerpos
computables (i.e. cuerpos expresables sobre un alfaeto finito, donde las operaciones naturales
{+, −, ×} y la igualdad {= 0} son funciones computables). En suma, las ecuaciones son dadas a
través de polinomios con coeficientes en un cuerpo computable que es, obviamente, numerable.
Por tanto, suponer que recibimos como Input del algoritmo unas ecuaciones en R[X1 , . . . , Xn ]
o en C[X1 , . . . , Xn ] es una suposición irracional sea cual sea el modelo de computación (digital
a la Turing o cuántica) con el que pretendamos desarrollar nuestro algoritmo.
Un aspecto distinto, desde esa misma perspectiva algorı́timica es dónde buscamos las soluciones
(x1 , . . . , xn ) del sistema (7.3.1). En el caso de ecuaciones polinomiales hay varias posibles
opciones y las siguientes son algunos de los ejemplos:
i) Geometrı́a Algebraica (Caso afı́n): El cuerpo de coeficientes es un cuerpo K, even-
tualmente, computable, pero las soluciones (x1 , . . . , xn ) ∈ An (K) son soluciones con
coordenadas en un cuerpo K que es la clausura algebraica del cuerpo K de coeficientes.
ii) Geometrı́a Algebraica Real: El cuerpo de coeficientes K es un cuerpo formalmente real
(ver el Problema ??). La socluciones se buscan en la calusura real de K o en un cuerpo
realmente cerrado que contenga a K. A modo de ejemplo, f1 , . . . , fs ∈ Q[X1 , . . . , Xn ]
y las soluciones (x1 , . . . , xn ) ∈ Rn .
iii) Geometrı́a Diofántica : Los polinomios dados son polinomios en Q[X1 , . . . , Xn ] (qui-
tando denominadores, que no afectan las podemos incluso suponer que f1 , . . . , fs ∈
Z[X1 , . . . , Xn ]) y las soluciones en (x1 , . . . , xn ) ∈ Zn . Este es el contexto del Problema
X de Hilbert (con respuesta negativa a la existencia de algoritmo debida a J. Robin-
son y Yu. Matjasievicz, ver [Matj, 1970] y sus referencias al trabajo de J. Robinson,
fundamentalmente). Obviamente relacionado con la Conjetura de Birch-Swynerton-
Dyers.
iv) La Conjetura de Cook: El cuerpo de los coeficientes es un cuerpo finito K = Fq , los
polinomios dados son polinomios f1 , . . . , fs ∈ Fq [X1 , . . . , Xn ] y las soluciones pretendi-
das son puntos Fq −racionales (i.e. (x1 , . . . , xn ) ∈ Fq ).
De ahı́ la pertinencia (a priori incómoda) de considerar variedades K−definibles en lo que sigue.
Observe el lector que, en apenas estos 4 ejemplos aparecen dos de los 6 Problemas del Millenium
(Clay Institute 1) sin olvidar que aparecen 3 de los problemas aún abiertos de la lista original
de 18 problemas de Steve Smale para las Matemáticas del siglo XXI ([Smale, 1998]), aunque,
en realidad, se hace referencia a 4 de ellos.
7.3.1. Funciones polinomiales K−definibles. Sea K un cuerpo y K un cuerpo alge-
braicamente cerrado que le contiene. Denotemos por An (K) = Kn el espacio afı́n n−dimensional
sobre K. Consideraremos el conjunto de las funciones polinomiales K−definibles sobre An (K),
que denotaremos mediante K[An (K)], definido del modo siguiente:
K[An (K)] := {f : An (K) −→ K : ∃F ∈ K[X1 , · · · , Xn ], f (x) = F (x), ∀x ∈ An (K)}.
Se trata obviamente de un anillo y una K−álgebra. En el caso K = K escribiremos simplemente
K[An ]. En el Problema 56, ya tratamos sobre este anillo. Consideramos el anillo de aplicaciones
Ap(An (K), K) y consideremos las proyecciones canónicas
πi : An (K) −→ K
(x1 , . . . , xn ) 7−→ xi .
n
Sea K[π1 , . . . , πn ] la menor sub-K−álgebra de KA (K) que verifica las dos propiedades siguientes:
• K ⊆ K[π1 , . . . , πn ],
• πi ∈ K[π1 , . . . , πn ], para cada i, 1 ≤ i ≤ n.
Nótese que, en las notaciones de la Proposición 1.4.7, K[π1 , . . . , πn ] es otra notación para la sub-
n
K−álgebra de KA (K) generada por {π1 , . . . , πn }, es decir, K[π1 , . . . , πn ] := K[{π1 , . . . , πn }].
Proposición 7.3.1. Con las anteriores notaciones, se tiene
i) Existe un epimorfismo de K−álgebras (i.e. es la identidad sobre el subcuerpo K)
Φ : K[X1 , . . . , Xn ] −→ K[An (K)] = K[π1 , . . . , πn ],
verificando Φ(Xi ) = πi , para cada i, 1 ≤ i ≤ n.
ii) Además, como K es un cuerpo de cardinal infinito, Φ es un isomorfismo de K−álgebras.
Demostración. La buena definición del morfismo Φ es obvia. Es claro que las proyec-
ciones πi = Φ(Xi ) ∈ Im(Φ). Esto prueba que K[An (K)] ⊇ K[π1 , . . . , πn ]. De otro lado,
supongamos f ∈ K[An (K)] existe un polinomio F ∈ K[X1 , . . . , Xn ] tal que f (x) = F (x) para
cada x ∈ An (K). Supongamos que
X
F := aµ X1µ1 · · · Xnµn .
|µ|≤d
Entonces, por ser Φ morfismo de anillos y ser la identidad sobre K, tendremos

X X
Φ(F ) = aµ Φ(X1 )µ1 · · · Φ(Xn )µn = aµ π1µ1 · · · πnµn .
|µ|≤d |µ|≤d
Entonces, Φ(F ) ∈ K[π1 , . . . , πn ] y, además, es fácil verificar que

Φ(F )(x) = F (x) = f (x), ∀x ∈ An (K).
Por tanto, ambas funciones (Φ(F ) y f ) coinciden en todos los puntos del dominio An (K), luego
han de ser iguales. Es decir, Φ(F ))f y Φ es un epimorfismo de anillos.
Para concluir la prueba de la Proposición, sólo nos queda verificar que Φ es inyectiva. Nótese
que los cuerpos algebraicamente cerrados tienen cardinal infinito (cf. Proposición 3.6.9), lo
que, en particular sucede para K. Recurrimos al Problema 58: mezclando inducción en el
número de variables e interpolación en el caso univariado (ver Problema 174) sobre cuerpos de
cardinal infinito, para cada F ∈ K[X1 , . . . , Xn ], si Φ(F )(x) = 0, ∀x ∈ An (K), entonces F = 0
en K[X1 , . . . , Xn ]. Como K[X1 , . . . , Xn ] ⊆ K[X1 , . . . , Xn ] esta propiedad también será cierta
para F ∈ K[X1 , . . . , Xn ] y concluimos que Φ es inyectiva.
Notación 7.3.2. Dado que Φ es monomorfismo, denotaremos por f indistintamente al poli-

nomio f ∈ K[X1 , . . . , Xn ] y a la función polinomial Φ(f ) ∈ K[An (K)]. Sin embargo, en cada
caso debemos tener muy en cuenta el significado del sı́mbolo para no argumentar inapropiada-
mente (algo más común de lo que parece).
1Véase https://www.claymath.org/millennium-problems
Observación 7.3.3. Nótese esta Proposición depende fuertemente de la condición K es un

n
cuerpo de cardinal infinito. Si hubiésemos considerado K K con K cuerpo finito, no es cierto
n
que K[X1 , . . . , Xn ] sea isomorfo al menor subanillo de K K que contiene a K y a las proyecciones
canónicas πi : K n −→ K.
Notación 7.3.4 (En Geometrı́a Algebraica, denotaremos igual polinomios y fun-

ciones polinomiales sobre An (K)). Una vez que nos queda clara la diferencia concep-
tual entre el polinomio f (i.e. elemento en el anillo K[X1 , . . . , Xn ]) y la función polinomial
Φ(f ) : An (K) −→ K (i.e. elemento en el anillo K[An (K)]), usaremos indistintamente f para
denotar tanto al polinomio f ∈ K[X1 , . . . , Xn ] como la función f := Φ(f ) ∈ K[An (K)] en este
contexto de la Geometrı́a Algebraica y mientras no haya confusión con este uso.
7.3.2. Variedades algebraicas afines y K−definibles. Las propiedades esenciales de-
scritas en la Subsección 7.2.2 se satisfacen también en el caso de tener K un cuerpo, K una
extensión algebraicamente cerrada, X = An (K) el espacio afı́n sobre K de dimensión n y
A[X] = K[An (K)] ∼ = K[X1 , . . . , Xn ]. Tendremos ası́ una topologı́a de Zariski y conjuntos cerra-
dos y abiertos asociados a K[An (K)]. Sin embargo, como hay una terminologı́a propia de esta
situación la introduciremos en las páginas que siguen.
Ası́, dado f ∈ K[X1 , . . . , Xn ], siguiendo el convenio notacional descrito en la Subsección prece-
dente, denotemos igualmente por f la función polinomial f : An (K) −→ K que define. Lla-
maremos hiper-superficie afı́n definida por f en An (K), que denotaremos por VAn (K) (f ). al
conjunto:
VAn (K) (f ) := {x ∈ An (K) : f (x) = 0} = f −1 ({0}).
En el caso en que los cuerpos K y K, ası́ como la dimensión n, estén bien definidos por el
contexto, para no cargar la notación escribiremos simplemente VA (f ) en lugar de VAn (K) (f ) y
diremos simplemente hiper-superficie afı́n definida por f .
Por la Proposición 7.2.3, el conjunto de ceros de un ideal a ⊆ K[X1 , . . . , Xn ] ∼ = K[An (K)]
coincide con el conjunto de ceros de un conjunto cualquiera de generadores del mismo ideal.
Ası́, definimos variedad algebraica afı́n K−definible a cualquier subconjunto V ⊆ An (K) tal
que existe un ideal a ⊆ K[X1 , . . . , Xn ] tal que
V = VAn (K) (a) := {x ∈ An (K) : f (x) = 0, ∀f ∈ a}.
En el caso en que los cuerpos K y K, ası́ como la dimensión n, estén bien definidos por el
contexto, para no cargar la notación escribiremos simplemente VA (a).
Por tradición, en el caso K = K hablaremos simplemente de variedades algebraicas afines VA (a),
siendo a un ideal de K[X1 , . . . , Xn ].
Por el Teorema de la Base de Hilbert (Basissatz) (ver Teorema ??) sabemos que K[X1 , . . . , Xn ]
es un anillo noetheriano, cuando K es un cuerpo. Pero los anillos noetherianos (ver Definición
59) se caracterizan por la propiedad de que todo ideal es finitamente generado. En particular,
concluimos la siguiente proposición:
Proposición 7.3.5. Toda variedad algebraica K−definible es la intersección finita de un número
finito de hiper-superficies K−definibles. Es decir, dado un ideal a ⊆ K[X1 , . . . , Xn ] y dados
f1 , . . . , fs ∈ K[X1 , . . . , Xn ] una familia finita de generadores (i.e. a = (f1 , . . . , fs )), tendremos
que
VAn (K) (a) = VAn (K) (f1 , . . . , fs ) = VAn (K) (f1 ) ∩ · · · VAn (K) (fs ).
Si K = K escribiremos simplemente VA (f1 , . . . , fs ).
Ejemplo 7.3.6 (Puntos K−racionales y puntos de variedades). En ocasiones, sin em-

bargo, no interesa analizar toda la variedad algebraica afı́n VK (f1 , . . . , fm ) sino simplemente los
llamados puntos K−racionales de una variedad K−definible que denotaremos mediante:
VK (a) := VAn (K) (a) ∩ An (K) = VAn (K) (a) ∩ K n .
Para mostrar un sencillo ejemplo, basta con tomar el caso n = 1 y recordar lo aprendido en
los cursos de Teorı́a de Galois (o, simplemente, lo descrito en el Ejemplo 3.6.12 anterior). Por
ejemplo, tomemos los caso K = Q y K = Q ( C su clausura algebraica, es decir, el subcuerpo
de C siguiente:
Q = {ζ ∈ C : ∃f ∈ Q[X], f (ζ) = 0},
o el caso K = R y K = C.
• En el caso K = Q y K := Q ⊆ C, dado un ideal a = (f ) ⊆ Q[X1 ], podemos considerar
los conjuntos siguientes:
VA (a) := VA1 (Q) (a) = VA1 (Q) (f ) = {ζ ∈ Q : f (ζ) = 0}.
mientras que
VQ (a) := VA (a) ∩ Q = {ζ ∈ Q : f (ζ) = 0}.
Tomemos como ejemplo el polinomio:
√ √
f := X14 + 1 = (X12 − 2X1 + 1)(X12 + 2X1 + 1),
y el ideal a que genera. Entonces, la variedad Q−posee cuatro puntos
√ 1±i √

−1 ± i
VA (a) = { 2 , 2 } ,
2 2
mientras que no hay ningún punto Q−racional, es decir,
VQ (a) = ∅.
• Si hubiéramos elegido K = R y K = C, con el mismo polinomio f := X14 + 1 y
denotemos por ae el ideal que define en R[X1 ], la variedad de los ceros complejos sigue
teniendo 4 puntos, pero admite una descomposicón en R−definibles:
√ √
VA1 (C) (ae ) = VA1 (C) (X12 − 2X1 + 1) ∪ VA1 (C) (X12 − 2X1 + 1),
porque el ideal ae 6∈ Spec(R[X1 ]). El conjunto de los puntos R−racionales sigue siendo
vacı́o:
VR (ae ) = ∅.
Ejemplo 7.3.7. Obviamente, los objetos de estudio de la Geometrı́a algebraica no son simple-
mente los casos de una variable n = 1 descritos anteriormente (ese serı́a el objeto de estudio
de la Teorı́a de Galois), sino el estudio de variedades dadas por ecuaciones polinomiales como
los siguientes. A pesar de mi escaso interés por los dibujos de estos objetos geométricos,
sino por otras propiedades, he incluido un par de ejemplos de imágenes (en general de difı́cil
tratamiento, para ilustrar estas variedades algebraicas. Nótese que las imágenes vertidas no
son todos los puntos en VAn (C) porque no podemos dibujarlos para n ≥ 2, sino solamente sus
puntos R−racionales, llamados puntos reales de la variedad :
• La Cardioide VA2 (C) (g) es una curva plana, dada por una ecuación de grado 4 (una
cuártica) cuyos puntos reales se ven en la imagen siguiente:
tomada de M. Lávička (A Note on the Rational Parameterization of Algebraic Curves

in Mathematica. Journal of Interdisciplinary Mathematics 12(2009).) y cuya ecuación,
en la que a es un parámetro, es dada por la identidad siguiente
g(X, Y ) := (X 2 + Y 2 )2 + 4aX(X 2 + Y 2 ) − 4a2 Y 2 .
• La quı́ntica de Togliatti, es una superficie de grado 5, con ecuación debida a D. van

Straten (A Quintic Hypersurface in P4 (C) with 130 Nodes. Topology 32 (1993), 857-
864) y cuyos puntos reales afines son los de la imagen siguiente
La imagen ha sido tomada de https://commons.wikimedia.org/w/index.php?curid=

46286583, y la ecuación de grado 5 viene dada por

f (X, Y, Z) := 64(X − 1) X 4 − 4X3 − 10X 2 Y 2 − 4X 2
+ 16X − 20XY 2 + 5Y 4 − 20Y 2 + 16 −
p √ p √ √ 2
−5 5 − 5 2Z − 5 − 5 4 X 2 + Y 2 + Z 2 + (1 + 3 5) .
Ejemplo 7.3.8 (Puntos racionales y Millenium Problems). Son especialmente significa-

tivos los casos siguientes de búsqueda de puntos K−racionales en problemas como los ya se
nalados:
i) Si K = Q, se trata del estudio de los puntos racionales x ∈ Qn que son ceros de un
ideal a ⊆ Q[X1 , . . . , Xn ]:
VQ (a) := {x ∈ Qn : : f (x) = 0, ∀f ∈ a}.
El problema entronca con el Problema X de Hilbert y, en el caso de que la variedad V( a)
tenga una estructura de gurpo abeliano, la pregunta sobre la existencia de solución
Q−racional es el problema abierto central de la Geometrı́a Diofántica.
ii) Si K = Fq es un cuerpo de Galois, con q = pm , p ∈ N primo no nulo, se trata de
buscar los ceros Fq −racionales de un ideal a ⊆ Fq [X1 , . . . , Xn ]:
VFq (a) := {x ∈ Fnq : f (x) = 0, ∀f ∈ a}.
Decidir algorı́tmicamente si VQ (a) o VFq (a) son conjuntos no vacı́os (para convenientes ideales:
caso de variedades abelianas si K = Q y caso cero-dimensional si K = Fq ) conducen al 33% de
los problemas abiertos entre los Problemas del Milenio del Instituto Clay: Swinnerton-Dyer-
Birch Conjecture y Cook’s Conjeture
Proposición 7.3.9 (Propiedades elementales de las variedades algebraicas afines).
Las variedades agebraicas afines K−definibles (y las variedades algebraicas afines en general)
satisfacen las mismas propiedades de la Proposición 7.2.4. Es decir, las mismas propiedades de
VX se verifican para VAn (K) (y para VA , si K = K). En particular, existe una única topologı́a
sobre An (K) cuyos cerrados son las variedades K−definibles y que se denomina topologı́a de
Zariski de los K−definibles en An (K). En el caso K = K se denomina simplemente la topologı́a
de Zariski en An (K).
Igualmente usaremos los términos cerrado Zariski, abierto Zariski, localmente cerrado Zariski
o clausura Zariski en las respectivas topologı́as de Zariski K−definibles en An (K).
Recordemos que los abiertos distinguidos son los complementarios de las hipersuperficies, es
decir, un abierto distinguido en An (K) dado por f ∈ K[X1 , . . . , Xn ] es un subconjunto OA (f )
dado mediante:
OAn (K) (f ) := {x ∈ An (K) : f (x) 6= 0}.
Corolario 7.3.10. Cada abierto en la topologı́a de Zariski de An (K) dada por los K−definibles
es unión finita de abiertos distinguidos de la forma
OA (f ) := OAn (K) (f ) := An (K) \ VAn (K) (f ) := {x ∈ An (K) : f (x) 6= 0}.
Demostración. Es obvio a partir del Basissatz. La Proposición 7.3.5 nos dice que la
variedad definida por un ideal es igual a la variedad de ceros comunes a cualquiera de sus
generadores. De ello se sigue que toda variedad algebraica K−definible es la interseción de un
número finito de hipersuperficies. Por tanto, sus complementarios son los abiertos Zariski y son
uniones finitas de abiertos en la clase {O(f ) : f ∈ K[X1 , . . . , Xn ]}.
7.3.3. Primos, maximales y variedades algebraicas afines.

Definición 93 (Ideal asociado a un variedad K−definible). Con las notaciones prece-
dentes, dado F ⊆ An (K), definimos IK (F ) como el ideal en K[X1 , . . . , Xn ] dado por:
IK (F ) := IK[X1 ,...,Xn ] (F ) := {f ∈ K[X1 , . . . , Xn ] : f (x) = 0, ∀x ∈ F }.
Cuando K = K escribiremos simplemente I(F ).
Se verificarán las mismas propiedades de la Proposición 7.2.17:

Proposición 7.3.11. Con las anteriores notaciones, se verifican las propiedades siguientes:
i) Si F ⊆ G son dos subconjuntos de An (K), IK (G) ⊆ IK (F ).
n
ii) IK (A
S (K)) = (0),
T IK (∅) = K[X1 , . . . , Xn ].
iii) IK ( i∈I Fi ) = i∈I IK (Fi ).
iv) Además, dado un subsonjunto F ⊆ An (K), su clausura en la topologı́a de Zariski sobre
An (K) definida por las variedades K−definibles viene dada mediante:
z
F = VA (IK (F )).
Demostración. Idéntica a la Demostración de la Proposición 7.2.17. Debe señalarse
que, en el punto ii) la igualdad IK (∅) = K[X1 , . . . , Xn ] es consecuencia del hecho de ser K
algebraicamente cerrado (y, por tanto, un cuerpo infinito) y de tener K ⊆ K (ver Problema
57).
Corolario 7.3.12. Con las notaciones anteriores, para cualquier subconjunto C ⊆ An (K), se
tiene que C es cerrado para la topologı́a de Zariski definida en An (K) por K[X1 , . . . , Xn ] si y
solamente si
C = VA (IK (C)).
Más aún, se verificarán las propiedades siguientes para cerrados F y G en la topologı́a de
Zariski:
F ⊆ G ⇐⇒ IK (G) ⊆ IK (F ).
Definición 94 (Variedad algebraica afı́n irreducible). Con las notaciones precedentes,

dada una variedad algebraica K−definible V ⊆ An (K), diremos que es reducible si se satisfacen
las condiciones de la Definición 92 anterior, para la topologı́a Zariski de los K−definibles en
An (K). Es decir, V es reducible si existen dos variedades K−definibles W1 , W2 tales que V 6=
Wi , para cada 1 ≤ i ≤ 2, tales que
V = W1 ∪ W2 .
Igualmente, llamaremos variedades algebraicas K−definibles irreducibles a las que no sean re-
ducibles.
Si K = K es algebraicamente cerrado, diremos simplemente que una variedad algebraica en
An (K) es reducible o irreducible si lo es como K−definible.
Ejemplo 7.3.13. Retomemos el Ejemplos 7.3.6, y observamos que si f := X14 + 1 se tiene:

• En el caso K = Q y K := Q ⊆ C, la variedad VA (X14 + 1) es irreducible como variedad
Q−definible y es reducible como variedad “a secas” (i.e. sobre Q.
• Si hubiéramos elegido K = R y K = C, con el mismo polinomio f := X14 + 1, la

variedad VA (f ) serı́a reducible como variedad R−definible:
√ √
VA1 (C) (ae ) = VA1 (C) (X12 − 2X1 + 1) ∪ VA1 (C) (X12 − 2X1 + 1) .
Los puntos x ∈ An (K) son variedades K−definibles irreducibles, mientras que un par de rectas
es reducible:
VA2 (C) ((X + Y − 1)(X − Y − 1)) = VA2 (C) (X + Y − 1) ∪ VA2 (C) (X + Y − 1).
Proposición 7.3.14. Con las notaciones precedentes, V ⊆ An (K) es cerrado irreducible K−definible
si y solamente si es cerrado e IK (V ) ∈ Spec(K[X1 , . . . , Xn ])
Demostración. Idéntica a la Demostración de la Proposición 7.2.20.
Proposición 7.3.15 (Ideales asociados a puntos afines). Con las mismas notaciones prece-
dentes, dado x ∈ An (K) un punto de An (K), Denotemos por mx al ideal IK ({x}), es decir,
mx = IK[X1 ,...,Xn ] ({x}) := {f ∈ K[X1 , . . . , Xn ] : f (x) = 0}.
Entonces,
z
i) El ideal mx ∈ Spec(K[X1 , . . . , Xn ]) es un ideal primo y la clausura Zariski {x} es
una variedad irreducible.
ii) Si K es la clausura algebraica de K, entonces, el ideal mx ∈ MaxSpec(K[X1 , . . . , Xn ])
es un ideal maximal. De hecho, si todas las coordenadas del punto x ∈ An (K) son
elementos algebraicos sobre K, entonces mx ∈ MaxSpec(K[X1 , . . . , Xn ]).
iii) En general no es cierto que {x} sea un cerrado para la topologı́a de Zariski de los
K−definibles (definida por K[X1 , . . . , Xn ] sobre An (K)).
iv) Si K = K o si ζ = (z1 , . . . , zn ) ∈ K n entonces, el ideal mζ viene dado mediante:
mζ = (X1 − z1 , . . . , Xn − zn ) ⊆ K[X1 , . . . , Xn ],
y está generado por una familia de n polinomios de grado 1. Más aún, si f ∈
K[X1 , . . . , Xn ], entonces
f + mζ = f (ζ) + mζ = f (z1 , . . . , zn ) + mζ ,
en el anillo K = K[X1 , . . . , Xn ]/mζ .
Demostración. La primera parte sigue las mismas pautas de la prueba de la Proposición
7.2.23. Consideremos el morfismo de anillos:
evx : K[X1 , . . . , Xn ] −→ K
f 7−→ f (x).
Es claro, por los mismos argumentos de entonces, que mx ∈ Spec(K[X1 , . . . , Xn ]).
Para la segunda de las afirmaciones, obsérvese que si K es la clausura algebraica de K y si
x = (x1 , . . . , xn ), entonces los elementos x1 , . . . , xn son algebraicos sobre K. De hecho se
observa que
K(x1 , . . . , xn ) := {f (x1 , . . . , xn ) : f ∈ K[X1 , . . . , Xn ]},
es el menor cuerpo que contiene a K y a los elementos algebraicos {x1 , . . . , xn } (ver Problema
280). De hecho, observamos que la imagen de evx es precisamente el cuerpo K(x1 , . . . , xn ):
Im(evx ) = K(x1 , . . . , xn ).
Por tanto,
K[X1 , . . . , Xn ]/mx ∼
= Im(evx ) = K(x1 , . . . , xn ),
es un cuerpo y mx ∈ MaxSpec(K[X1 , . . . , Xn ]). Lo mismo para la segunda afirmación, puesto
que sólo hemos usado que las coordenadas del punto x son elementos algebraicos sobre K.
La tercera afirmación del enunciado sigue el mismo caso del ejemplo mostrado en prueba de la
afirmación iii) de la Proposición 7.2.23.
La cuarta afrmación es un sencillo ejericio de inducción que dejamos al lector, aplicando la
división por el polinomio mónico Xi − ζi como en el Teorema 1.4.15 (de la División Euclı́dea
por un polinomio mónico).
7.3.4. Otras consecuencias de la argumentación noetheriana. La condición noethe-

riana es enriquecedora para elconocmiento de los cerrados de la topologı́a de Zariski en An (K):
Proposición 7.3.16. Con las notaciones de los Teoremas precedentes, se verifican las siguientes
dos propiedades:
i) Condición de Cadena Numerable Descendente (para cerrados):Toda ca-
dena descendente de cerrados para la topologı́a de Zariski de los K−definibles sobre
An (K) se estabiliza.
ii) Asumiendo el Axioma de Elección Dependiente,, todo conjunto no vacı́o de cerrados
Zariski posee elemento minimal para la inclusión.
Se dice que la topologı́a de Zariski en An (K) define un espacio topológico noetheriano por
satisfacer estas dos propiedades.
Demostración. Por simplicidad de la notación, escribamos I(W ) en lugar de IAn (K) (W )
para cada W ⊆ An (K). Para la afirmación i) consideremos una cadena descendente de cerrados
K− definibles en K[X1 , . . . , Xn ]:
V0 ⊇ V1 ⊇ V2 ⊇ · · · ⊇ Vm ⊇ · · · ,
y consideremos la correspondiente cadena de ideales de K[X1 , . . . , Xn ] conforme a la propiedad
i) de la Proposición 7.2.17 aplicada al caso A[X] = K[X1 , . . . , Xn ]:
IK (V0 ) ⊆ IK (V1 ) ⊆ IK (V2 ) ⊆ · · · ⊆ IK (Vm ) ⊆ · · · .
Por la condición de cadena ascendente numerable de ideales de K[X1 , . . . , Xn ], esta cadena se
estabiliza y existirán n0 ∈ N tal que IK (Vm ) = IK (Vn0 ) para cada n ≥ n0 . Pero por el Corolario
7.2.19, como todos los Vm son cerrados, se tendrá:
Vn0 = V (IK (Vn0 )) = V (IK (Vm )) = Vm , ∀m ≥ n0 .
Y la cadena se estabiliza a partir de n0 .
La afirmación ii) se sigue de modo similar al caso de ideales. Considerando un subconjunto
no vacı́o F de cerrados Zariski de X, si F no posee elemento minimal, entonces satisface la
hipótesis del Axioma de Elección Dependiente (cf. Axioma 3.3.1) para la relación R :=) (i.e.
la relación “contiene estrictamente”).
∀V ∈ F , ∃W ∈ F , V ) W.
En aplicación de ese axioma, existirá una cadena numerable tal que
V0 ) V1 ) V2 ) · · · ) Vm ) · · · .
Pero esto contradice la condición de cadena descendente para cerrados, probada en i).
Proposición 7.3.17 (Componentes irreducibles de un cerrado de Zariski). Con las

notaciones de los Teoremas precedentes, se verifican las siguientes propiedades:
i) Toda variedad K−definible (cerrado en la topologı́a de Zariski de An (K) definida por
las variedades K−definibles ) es unión finita de irreducibles.
ii) Dado V ⊆ An (K) un cerrado K−definible, existe una descomposición en cerrados
irreducibles K−definibles:
(7.3.2) V = V1 ∪ . . . ∪ Vs ,
tal que V no se puede escribir como unión de una subfamilia propia de {V1 , . . . , Vs }.
Tal descomposición se llama minimal o irredundante.
iii) Dada una descomposición irredudante de V como en (7.3.2) no hay relación de in-
clusión entre cualesquiera dos irredubles de tal descomposición. Es decir, no existe
i, j ∈ {1, . . . , s} tales que i 6= j y Vi ⊆ Vj .
iv) Las descomposiciones irredundantes de variedades K−definibles en irreducibles son
únicas salvo permutación de las variedades {V1 , . . . , Vs }.
A tales descomposiciones se las denomina descomposición en irreducibles de V y a los cerrados
irreducibles K-definibles (únicos para cada V ) que aparecen en ella se los denomina componentes
irreducibles de V .
Demostración. Tenemos un claro argumento del estilo noetheriano: Razonemos por re-
ducción al absurdo y supongamos que existen cerrados Zariski K−definibles en An (K) que no
son unión finita de irreducibles. Entonces, el siguiente conjunto es no vacı́o:
F := {V ⊆ An (K) : V no es unión finita de irreducibles K−definibles}.
Como F es no vacı́o, ha de poseer algún elemento minimal. Si V es un elemento minimal de F ,
entonces no puede ser irreducible. Si fuera irreducible, serı́ una unión finita de irreducibles y,
por tanto, no podrı́a estar en F . Si no es irreducible, entonces es reducible y existirán W1 , W2
cerrados Zariski tales que
• V = W1 ∪ W2 ,
• Wi ( V , i ∈ {1, 2}.
Ahora bien, de la segunda de estas afirmaciones, como cada Wi está estrictamente contenido
en un elemento minimal de F es claro que Wi 6∈ F para i ∈ {1, 2}. Por tanto, cada Wi es
una unión finita de irreduciles. Pero, si ası fuera, como V es unión de W1 y W2 , entonces
también V es unión finita de irreducibles lo que significarı́a que V 6∈ F . Por tanto F debe ser
necesariamente vacı́o y, por tanto, todo cerrado Zariski K−definible de An (K) ha de ser unión
finita de cerrads irreducibles K−definibles.
Ahora consideremos, para una variedad V fijada, el siguiente conjunto de números naturales:
N (V ) := {s ∈ N : existe una descomposición de V como unión de s irreducibles}.
Hemos visto que N (V ) es un conjunto no vacı́o de números naturales y, por tanto, debe poseer
un mı́nimo. Sea r := min(N (V )) ese mı́nimos y existirá una descomposición de V como unión
de r cerrados irreducibles
V = V1 ∪ · · · ∪ Vr ,
de tal modo que no existe ningún subconjunto propio S ( {1, . . . , r} tal que
[
V = Vi .
i∈S
De existir, el lector fácilmente inferirá que entonces r no puede ser el mı́nimo de N (V ). Clara-
mente, no es posible que haya inclusiones entre dos variedades irreducibles Vi y Vj en la de-
scomposición precedente. De tener Vi ⊆ Vj podrı́amos escribir
[
V = Vk ,
k∈{1,...,r}\{i}
y tendrı́amos que V es unión finita de una subfamilia propia de {V1 , . . . , Vr } contraviniendo ii).
Con esto quedan probadas las afirmaciones i) a iii).
En cuanto a la afirmación iv), supongamos que tenemos dos descomposiciónes irredudantes de
V ⊆ An (K) :
(7.3.3) V = V1 ∪ · · · ∪ Vr = W1 ∪ · · · ∪ Ws .
Tendremos que para cada i
Vi := (Vi ∩ W1 ) ∪ (Vi ∩ W2 ) ∪ · · · (Vi ∩ Ws ).
Por ser irreducible, existirá j tal que Vi = Vi ∩ Wj ⊆ Wj . Ahora bien tenemos también
Wj = (Wj ∩ V1 ) ∪ · · · ∪ (Wj ∩ Vr ).
De nuevo, por ser Wj irreucible, habrá de existir t tal que Wj ∩ Vt ⊆ Vt . Esto nos lleva a una
cadena de contenidos
Vi = Vi ∩ Wj ⊆ Wj = Wj ∩ Vt ⊆ Vt .
Pero como la descomposición es irredundante, entonces t = i, lo que implicará:
Vi = Vi ∩ Wj ⊆ Wj = Wj ∩ Vi ⊆ Vi .
Serán todo igualdades y esto nos permite definir una aplicación:
σ : {1, . . . , r} −→ {1, . . . , s}
i 7−→ σ(i), Vi = Wσ(j) .
Del mismo modo podemos argumentar partiendo desde los Wj ’s y construir una aplicación
τ : {1, . . . , s} −→ {1, . . . , r}
j 7−→ τ (j), Wj = Vτ (i) .
Es fácil verificar que σ y τ son respectivamente una inversa de la otra y, por tanto, ambas son
biyecciones, r = s y las dos descomposiciones de (7.3.3) son la misma salvo permutación.
Proposición 7.3.18. Con las notaciones precedentes, dado Y ⊆ An (K) un cerrado Zariski
K−definible de An (K) y dado un espacio recubridor de Y por abiertos Zariski de An (K): A :=
{Ai : i ∈ I}, entonces, A posee un subcubrimiento finito de Y . Es decir, con la topologı́a
inducida por la topologı́a de Zariski de los cerrados K−definibles de An (K), todo cerrado es
quasi-compacto.
Demostración. Veamos primero que X satisface la propiedad. Ası́ pues supongamos que
tenemos un recubrimiento de X por abiertos Zariski en la topologı́a de los K−definibles:
[
X= Ai .
i∈I
Consideremos la familia de cerrados dados por los complementarios de los abiertos Ai , es decir,
E := {Fi := An (K) \ Ai : i ∈ I}.
Y definamos el conjunto de las intersecciones finitas de los elementos de E :
\
F := { Fj : J ⊆ I, J es finito}.
j∈J
Obviamente F es no vacı́o y ha de poseer elemento minimal. Sea J ⊆ I un subconjunto finito

tal que la intersección
\
Fj ,
j∈J
es minimal en F . Tomemos, entonces, i ∈ I \ J y tendremos que

 
\ \ \
Fi  Fj  ⊆ Fj .
j∈J j∈J
Es claro que la primera de estas intersecciones también están en F , es decir,

 
\ \
Fi  Fj  ∈ F .
j∈J
Por tanto, como ∩j∈J Fj es minimal enF tendremos que

 
\ \ \
∀i ∈ I \ J, Fi  Fj  = Fj .
j∈J j∈J
Luego,
   
\ \ \ \ \
Fi =  Fi   Fj  = Fj .
i∈I i∈I\J j∈J j∈J
Finalmente, observamos que Fi := An (K) \ Ai y que An (K) =

S
i∈I Ai , luego
\ \
∅= Fi = Fj ,
i∈I j∈J
[ [
An (K) = Ai = Aj ,
i∈I j∈J
con lo que tenemos un subcubrimiento finito del original. Ahora procedemos del modo habitual
con compactos: dado Y ⊆ An (K) un cerrado Zariski K−definible y un recubrimiento de Y por
abiertos Zariski K−definible en An (K):
[
Y ⊆ Ai ,
i∈I
n
tenemos un cubrimiento por abiertos de A (K) dado mediante:
!
[ [
n
X = (A (K) \ Y ) Ai .
i∈I
n
Aplicando que A (K) satisface la existencia de un subcubrimiento finito, concluimos que Y
posee también un subcubrimiento finito, concluyendo el enunciado.
El Teorema de Lasker-Noether (Teorema 6.3.23) y nuestro estudio del radical de un ideal (Sub-
sección 6.3.1) nos permite hacer alguna observación especial sobre los ideales asociados a var-
iedades K−racionales.
Proposición 7.3.19. Con las notaciones precedentes:
i) Si a ⊆ K[X1 , . . . , Xn ] es un ideal, entonces,
√
VAn (K) (a) = VAn (K) ( a).
ii) Los ideales de la forma IK (V ) ⊆ K[X1 , . . . , Xn ] son ideales radicales. Es decir,
p
IK (V ) = IK (V ).
iii) Existe una descomposición primaria irredundante de cada ideal IK (V ) dada por ideales
primos. Esto es, para cada V ⊆ An (K) existe una familia finita de ideales primos
{p1 , . . . , ps } ⊆ Spec(K[X1 , . . . , Xn ]) tales que pi 6= pj , para cada i 6= j, la siguiente
descomposición es irredudante:
(7.3.4) IAn (K) (V ) = p1 ∩ · · · ∩ ps .
De hecho, esta descomposicón es única, salvo permutación de los ideales primos in-
volucrados. Los primos asociados del anillos cociente por el ideal vienen dados por:
Ass(K[X1 , . . . , Xn ]/IK (V )) = {p1 , . . . , ps } ⊆ Spec(K[X1 , . . . , Xn ]).
iv) Los ideales de la forma IK (V ) no poseen primos inmersos y todos sus ideales primos
asociados son minimales. Es decir, no hay relación de inclusión entre los ideales de
la familia {p1 , . . . , ps }.
v) De hecho, si disponemos de una descomposición de V en componentes irreducibles
V = V1 ∪ · · · ∪ Vs ,
se tendrá que pi = IK (Vi ) ∈ Spec(K[X1 , . . . , Xn ]).
Demostración. La afirmación i) se sigue de la última afirmación de la Proposición 7.2.4.
Como K es cuerpo y no posee elementos nilpotentes no nulos, el lector puede fácilmente concluir
que los ideales de funciones que se anulan en cerrados en la topologı́a de Zariski son radicales.
El resto de las propiedades se siguen del hecho de ser un ideal radical y de los resultados
relativos al Teorema de Lasker-Noether visto en las subsecciones 6.3.1, ??, 6.3.4 y, en especial,
las Proposiciones ?? y ??.
Observación 7.3.20 (Noetherianidad). Gran parte de las propiedades descritas en la an-

terior Proposición pueden hacerse sin necesidad de acudir al Teorema de Lasker-Noether. La
noetherianidad de la toplogı́a de Zariski de An (K) dada por los K−definibles, nos permite
concluir que para cualquier cerrado V ⊆ An (K) hay una descomposición irredundante en com-
ponentes irreducibles (Proposición 7.3.17). Consideremos tal descomposición irredundante (o
minimal) descrita en la Proposición 7.3.17:
(7.3.5) V := V1 ∪ · · · ∪ Vs .
Los cerrados Vi ’ son irreducibles, la descomposición es única(salvo permutación), no hay relación

de inclusión entre dos de ellos y V no puede obtenerse como unión de una subfamilia propia de
{V1 , . . . , Vs }. Por las propiedades del uso del operador IK tenemos que
(7.3.6) IK (V ) = IK (V1 ) ∩ · · · ∩ IK (Vs ).
Por la Proposición 7.3.14 sabemos que los ideales asociados a las variedades irreducibles son
ideales primos. Lugo tenemos una primera familia de ideales primos
{p1 , . . . , ps },
donde, para cada i, 1 ≤ i ≤ s, se tendrá.
pi = IK (Vi ).
Además, como cada Vi es cerrado para la topologı́a de Zariski se tiene:
Vi = VAn (K) (IK (Vi )).
Por tanto, para cada i, j, 1 ≤ i, j ≤ s, se tiene que pi 6= pj . Es decir los primos de esa familia
son todos distintos. Pero, además, no puede haber ningún subconjunto propio S ( {1, . . . , s}
tal que \
IK (V ) = pi .
i∈S
La razón es que eso supondrı́a la existencia de un ı́ndice j ∈ {1, . . . , s} \ S tal que
∩i∈S pi ⊆ pj .
Ahora bien, si una intersección de ideales están incluida en un ideal primo, alguno de ellos
debe estar incluido en ese ideal primo (recordar Proposición 4.2.12). Por tanto, si IK (V ) fuera
intersección de los primos indiciados por una subfamilia propia S ( {1, . . . , s}, deberı́an existir
i ∈ S y j ∈ {1, . . . , s} \ S tales que pi ⊆ pj . En ese caso,
Vj = VAn (K) (pj ) = VAn (K) (IK (Vj )) ⊆ VAn (K) (pi ) = VAn (K) (IK (Vi )) = Vi .
Concluirı́amos que hay relación de inclusión entre dos de las componentes irreducibles de V que
aparecen en la descomposición irredundante del idel IK (V ) (7.3.5), lo cual no es posible.
Por tanto, la descomposición descrita en la Identidad (7.3.6) es un descomposición primaria
irredudante, con todos los primarios siendo ideales primos y el resto se sigue con argumentos
que no necesitan de lo descrito en la Sección 6.3.
7.3.4.1. Proyección y contracción de ideales. Supongamos que K es un cuerpo
cualquiera, sea K su clausura algebraica. En la Proposición 1.4.9 de la Sección 1.4 introdujimos
la noción de contracción de un ideal
El siguiente resultado trata de expresar el significado geométrico de la contracción de ideales:
Proposición 7.3.21. Sea V ⊆ An+m (K) una variedad algebraica afı́n. Sea IK (V ) el ideal en
el anillo K[X1 , . . . , Xn , Y1 , . . . , Ym ] de los polinomios con coeficientes en K que se anulan en
V . Consideremos la proyección que “olvida” las últimas m coordenadas:
π: An+m (K) −→ An (K)
(x1 , . . . , xn , y1 , . . . , ym ) 7−→ (x1 , . . . , xn ).
Sea IK (V )c := IK (V ) ∩ K[X1 , . . . , Xn ] la contracción del ideal IK (V ). Entonces,
i) IK (π(V )) = IK (V )c .
z
ii) π(V ) = VA (IK (V )c ).
Demostración. Por la Proposición 7.3.11, es obvio que ii) se sigue de i). Para probar i)
veamos el doble contenido:
• Si f ∈ IK (V )c = IK (V ) ∩ K[X1 , . . . , Xn ] y si x ∈ π(V ), entonces es porque existe y ∈
Am tal que (x, y) ∈ V , pero como f ∈ IK (V ) f (x, y) = 0. Ahora bien, f no depende
de las variables {Y1 , . . . , Ym } (porque está en K[X1 , . . . , Xn ]) luego f (x, y) = f (x) = 0
y concluimos que f se anula en π(V ), es decir, f ∈ IK (π(V )).
• Para el otro contenido, si g ∈ IK (π(V )), entonces g ∈ K[X1 , . . . , Xn ] y para cada
x ∈ π(V ) se tiene g(x) = 0. Basta con ver que g ∈ IK (V ). Pero si (x, y) ∈ V ,
entonces, como g no depende de las variables {Y1 , . . . , Ym }, g(x, y) = g(x) y como
x ∈ π(V ) concluimos que g(x, y) = g(x) = 0 y g ∈ IK (V ).
7.4. VARIEDADES PROYECTIVAS E IDEALES HOMOGÉNEOS 363
Corolario 7.3.22. Con las notaciones de loa Proposición precedente, si V ⊆ An+m (K) es una
z
variedad algebraica K−definible e irreducible, entonces π(V ) es también irreducible.
Demostración. La prueba es inmediata por la proposición precedente y la Proposiciń
7.3.14, sabemos que IK (V ) es un ideal primo en K[X1 , . . . , Xn , Y1 , . . . , Ym ]. Por la Proposición
4.2.6, sabemos que la contracción de un ideal primo es también primo. Por tanto, IK (V )c es
z
un ideal primo en K[X1 , . . . , Xn ]. Por tanto, π(V ) es una variedad algebraica irreducible.
7.4. Variedades algebraicas en el espacio proyectivo: Ideales homogéneos

No podemos acabar sin citar un ejemplo más de variedades (en el sentido de conjuntos de ceros)
que son esenciales para entender la Geometrı́a: Las variedades algebraicas proyectivas.
Comencemos recordando el espacio proyectivo ya descrito en el Problema 19. Sea K un cuerpo
y K una extensión algebraicamente cerrada. Consideremos el espacio vectorial Kn+1 , el sub-
conjunto Kn+1 \ {0} y la relación de equivalencia sobre Kn+1 \ {0} dada mediante:
x ∼ y ⇐⇒ ∃λ ∈ K, x = λy.
Esta relación de equivalencia es el el resultado de la acción
de K× = K \ {0} sobre Kn+1 \ {0}
n+1
(cf. Problema 19). El conjunto cociente K \ {0} / ∼ se denomina espacio proyectivo de
dimensión n sobre K y se denota mediante Pn (K) 2. Nótese que se trata de la colección de
todos los subespacios vectoriales de dimensión 1 de Kn+1 vistos como objeto geométrico. La
condición “dimensión 1” es crucial, de ahı́ que se descarte el origen 0 ∈ Kn+1 en la definición
de la acción.
Puede que el lector no iniciado tenga alguna dificultad en entender por qué trabajar con espacios
proyectivos en lugar de los espacios afines introducidos en la sección precedente. Es posible que
las notas que siguen no le aclare completamente esas dudas pero, al menos, interaé explicar
cómo el espacio proyectivo “completa” al espacio afı́n añadiendo las direcciones que se ubicarán
en un hiperplano del “infinito” de gran utilidad y sentido clásico. Para más detalles, habrá que
avanzar en el texto y entender mejor la interacción entre la Geometrı́a Algebraica en el espacio
afı́n y en espacio proyectivo.
Para intentarlo, podemos considerar la proyección canónica
π : Kn+1 \ {0} −→ Pn (K).
A los puntos π(x0 , x1 , . . . , xn ) los representaremos mediante (x0 : x1 : · · · : xn ) al estilo de
la escuela “francesa”, aunque algunos autores prefieren la notación [x0 : · · · : xn ]. A las
“coordenadas” de esta presentación del punto proyectivo (x0 : · · · : xn ) ∈ Pn (K) se las denomina
coordenadas homogéneas del punto.
Consideremos ahora la siguiente transformación:
ϕ0 : An (K) −→ Pn (K)
(7.4.1)
(x1 , . . . , xn ) 7−→ (1 : x1 , . . . , xn ).
La primera observación es que esta aplicación está bien definida, justamente por la forma de
las coordenadas homogéneas. Pero, además, es inyectiva:
Dados x := (x1 , . . . , xn ), y := (y1 , . . . , yn ) ∈ An (K), si ϕ0 (x) = ϕ(y), entonces, existe λ ∈ K\{0}
tal que en Kn+1 se verifica:
λ(1, x1 , . . . , xn ) = (1, y1 , . . . , yn ).
Pero, entonces, λ = 1 (por la coordenada 0−ésima) y tendremos (1, x1 , . . . , xn ) = (1, y1 , . . . yn ).
Lo que hemos oobtenido es una inmersión del espacio afı́n An (K), identificádolo con un conjunto
de puntos proyectivos que se caracterzan de modo sencillo con la siguiente igualdad:
ϕ0 (An (K)) = {(x0 : · · · : xn ) ∈ Pn (K) : x0 6= 0}.
2Otras notaciones que se encuentran en la literatuyra son: KPn , Pn K, etc... Nosotros mantendremos la
propuesta Pn (K).
Nótese que si nos dan (x0 : · · · : xn ) ∈ Pn (K) con x0 6= 0 es inmediata comprobar que:
x1 xn
(x0 : · · · : xn ) = ϕ0 ( , . . . , ),
x0 x0
y es que la condición x0 6= 0 nos permite dar sentido a la anti-imagen del punto proyectivo a
partir de un punto afı́n. Como veremos después, la condición x0 6= 0 nos permitirá interpretar
ϕ0 (An (K)) como un abierto en ∓n (K) que algunos autores tienden a llamar los puntos a dis-
tancia finita, aunque esa idea de distancia finita sea un poco irreal en este contexto. En todo
caso, son puntos afines con respecto a la inmersión ϕ0 .
Obviamente, los puntos que no están en ϕ0 (An (K)) se caracterizan mediante las siguientes
igualdades:
(0)
H∞ := Pn (K) \ ϕ0 (An (K)) = {(x0 : · · · : xn ) ∈ Pn (K) : x0 = 0}.
En la presentación clásica de la geometrı́a afı́n, que el lector he recibido seguramente, los
puntos de An (K) se presentan mediante (1, x1 , . . . , xn ) mientras que las “direcciones” se suelen
representar mediante (0, v1 , . . . , vn ). Se hacı́a de tal modo que una recta afı́n, por ejemplo, se
representa mediante
r := {(1, x1 , . . . , xn ) + t(0, v1 , . . . , vn ) ∈ {1} × Kn : t ∈ K},
o también mediante
r := {1, x1 + tv1 , . . . , xn + tvn ) ∈ {1} × Kn : t ∈ K},
observando que la dirección (0, v1 , . . . , vn ) depende solamente del subespacio vectorial de di-
mensión 1, Kh(0, v1 , . . . , vn )i, generado por (0, v1 , . . . , vn ) ∈ {0} × Kn . Se distinguı́a entonces,
por razones de elegancia, entre el punto afı́n (1, x1 , . . . , xn ) y las direcciones (0, v1 , . . . , vn ). En
(0)
este sentido el hiperplano H∞ “recoge” todas las direcciones de rectas del espacio afı́n y, en un
sentido más estético que formal, las “pone en el infinito”. De ahı́ que ese espacio de direcciones
(0)
de rectas afines H∞ se llame hiperplano en el infinito.
En los casos K = R ∨ C, por ejemplo,la proyección canónica π : Kn+1 \ {0} −→ Pn (K) induce
una topologı́a cociente en Pn (K). La imagen del espacio afı́n ϕ0 (An (K)) será un abierto, es esos
(0)
casos, y el hiperplano en el infinito H∞ será un cerrado. Es sencillo verificar que, en ambos
casos, la imagen del espacio afı́n ϕ0 (An (K)) es denso para la topologı́a cociente en Pn (K) y,
en un cierto sentido en estos casos particulares, hay sucesiones (xm )m∈N de puntos afines (en
(0)
ϕ0 (An (K))) que tienden a las direcciones en H∞ cuando m 7→ ∞. En ese sentido, en los casos
K = R ∨ C, uno puede ver la asintótica y la convergencia “en el infinito” (o hacia puntos en el
infinito, que serı́a más correcto), como en el caso de las ası́ntotas que los alumnos recordraán
(0)
de sus cursos más elementales de Secundaria. En algún sentido es en H∞ donde viven las
ası́ntotas (verticales, horizontales u oblicuas), que se vuelven “alcanzables”.
Obviamente, la elección de la coordenada 0 en la definición de ϕ0 (en la Ecuación (7.4.1))
es una elección arbitraria. Igualmente podrı́amos haber elegido unicar el 1 en cualquier otra
coordenada distinta a la 0−ésima, dando lugar a las correspondentes inmersiones {ϕ0 , . . . , ϕn }.
Son inmersiones del espacio afı́n en el proyectivo Pn (K) que identifican An (K) con un “abierto”
para cada i, 0 ≤ i ≤ n:
ϕi (An (K)) = {(x0 : · · · : x0 ) ∈ Pn (K) : xi 6= 0}.
A su vez cada una de estas inmersiones define un hiperplano en el infinito
(i)
(7.4.2) H∞ := {(x0 : · · · : xn ) ∈ Pn (K) : xi = 0}.
Estas diversas inmersiones definen un cubrimiento de Pn (K) por una familia de n + 1 abiertos:
n
[
(7.4.3) Pn (K) = ϕi (An (K)) = ϕ0 (An (K)) ∪ · · · ∪ ϕ0 (An (K)),
i=0
que le confiere una instintiva naturaleza de vareidad topológica y deferenciable, término que
sólo tiene sentido natural cuando K = R ∨ C.
De todos modos, no era el propósito de estas primeras palabras el hacer una inmersión en
Geometrı́a Proyectiva sino, en todo caso, ilustrar el objeto antes de pasar a interpretar los
objetos llamados variedades algebracas proyectivas que haremos a continuación. Dejaremos

para más adelante otras discusiones al respecto.
Dado un subconjunto A ⊆ Pn (K) podemos considerar la imagen inversa por la proyección
canónica π. Es decir,
π −1 (A) := {(x0 , . . . , xn ) ∈ Kn+1 \ {0} : π(x0 , . . . , xn ) = (x0 : · · · : xn ) ∈ A}.
Por cuestiones estéticas, añadiremos el origen a esta imagen inversa y definimos:
Definición 95 (Conos proyectantes y Conos Afines). Llamaremos cono proyectante sobre
A ⊆ ¶n (K) al conjunto definido por la siguiente igualdad: cono proyectante
e := π −1 (A) ∪ {0} ⊆ Kn+1 .
A
∅ = {0}, donde 0 ∈ Kn+1 , es el cono proyectante sobre el conjunto vacı́o de

En particular, e
puntos proyectivos.
Llamaremos cono afı́n a todo subconjunto C ⊆ Kn+1 que verifica la siguiente propiedad cono
afı́n:
∀λ ∈ K, ∀x ∈ A,
e λx ∈ A.e
Diremos que un cono C ⊆ Kn+1 es propio si C ( Kn+1 .
Obviamente, los conos proyectantes sobre subconjuntos de ¶n (K) son conos afines en Kn+1 .
En ciertos casos, tenemos una presentación del espacio que le confiere una estructura de variedad
diferenciable real o compleja. Que resultará variedad de Riemann en el caso K = R y variedad
de Kähler en el caso K = C.
• En el caso real, podemos identificar isométricamente (como variedades de Riemann)
Pn (R) con el cociente S n /S 0 , entendiendo por S 0 := {±1} la versión multiplicatica del
grupo abeliano Z/2Z y la relación “ser puntos antipodales”. En esta caso, un punto
proyectivo representa dos puntos sobre S n .
• En el caso complejo, identificamos Pn (C) con el coenciente S 2n+1 /S 1 , donde S 2n+1
es la esfera unidad en Cn+1 con la métrica hermı́tica canónica y S 1 es visto como el
grupo de los números complejos de valor absoluto 1, actuando sobre S 2n+1 . En este
caso un punto en Pn (C) representa un gran cı́rculo (una geodésica) en S 2n+1 .
En nuestro contexto, estamos especialmente interesados en aquellos subconjuntos de espacio
proyectivo Pn (K) que puedan ser dados implı́citamente por ecuaciones. En eso nos ayudan los
polinomios homogéneos.
Dado f ∈ K[X0 , . . . , Xn ] y consideremos la función polinomial que define:
f : An+1 (K) −→ K.
Observamos que esta función no siempre es “trasladable” al espacio proyectivo. La “traslación”
de la idea necesita alguna reflexión adicional. Pero, si suponemos que f ∈ Hd (X0 , . . . , Xn ) es
un polinomio homogéneo de grado d (cf. Proposición 1.4.40). Entonces, para todo λ ∈ K× y
para todo x ∈ An+1 (K) \ {0} observamos que se tiene la igualdad siguiente:
f (λx) = λd f (x).
Por tanto, dados dos puntos x e y que definen el mismo punto proyectivo π(x) = π(y) ∈ Pn (K)
tenemos claramente que para todo f ∈ Hd (X0 , . . . , Xn ) se tiene
f (x) = 0 ⇐⇒ f (y) = 0.
Esto nos permite definir la noción de hiper-superficie proyectiva del modo siguiente:
Definición 96 (Hiper-superficie algebraica proyectiva). Como en Secciones precedentes,

des K un cuerpo y sea K su clausura algebraica. Dado un polinomio homogéneo f ∈ Hd (X0 , . . . , Xn ) ⊆
K[X1 , . . . , Xn ] se denomina hiper-superficie proyectiva de los ceros de f al subconjunto del es-
pacio proyectivo definido del modo siguiente:
VPn (K) (f ) := {(x0 : · · · : xn ) ∈ Pn (K) : f (x0 , . . . , xn ) = 0}.
Con las mismas notaciones, llamaremos abierto algebraico proyectivo distinguido definido por
f ∈ Hd (X0 , . . . , Xn ) ⊆ K[X1 , . . . , Xn ] al conjunto dado mediante la siguiente igualdad:
OPn (K) (f ) := {(x0 : · · · : xn ) ∈ Pn (K) : f (x0 , . . . , xn ) 6= 0} = Pn (K) \ VPn (K) (f ).
Usualmente, y cuando el espacio Pn (K) esté fijado por el contexto, escribiremos simplemente
VP (f ) y OP (f ).
Observación 7.4.1. Simplemente obsérvese que, entre las hiper-superficies algebraicas proyec-
(i)
tivas, se encuentran los hiperplanos del infinito H∞ , con 0 ≤ i ≤ n definidos en la Ecuación
(7.4.2). Dado que son dados por ecuaciones lineales se suele decir hiper-superficie lineal o,
simplemente, hiperplano proyectivo.
Por su parte, las imágenes del espacio afı́n ϕi (An (K)) ⊆ Pn (K) por la diversas inmersiones
destacadas anterior mente, son abiertos distinguidos en Pn (K):
ϕi (An (K)) = OPn (K) (Xi ), ∀i, 0 ≤ i ≤ n.
Ejemplo 7.4.2 (Formas cuadráticas y cuádricas proyectivas). A estas alturas de la for-

mación de un matemático, ya suele estar familiarizado con el término “forma cuadrática”. Una
forma cuadrática con coeficientes en un cuerpo K es una expresión del tupo siguiente:
X
q(X0 , . . . , Xn ) := ai,j Xi Xj ∈ K[X0 , . . . , Xn ].
0≤i,j≤n
La expresión “forma” viene del latı́n y ha sido el término clásico para designar a los polinomios
homogéneos. El término “forma cuadrática” hace referencia a un polinomio homogéneo de
grado 2 y, por tnto, como se puede fácilmente observar, q ∈ H2 (X0 , . . . , Xn ) es un polinomio
homogéneo de grado 2.
Por su parte, la hiper-superficie proyectiva definida por una forma cuadrática se suele denominar
“cuádrica proyectiva” y no es otra cosa que una variedad K−definible
VPn (K) (q), q ∈ H2 (X0 , . . . , Xn ).
Por razones de simplicidad (y por el Lema de Cancelación de Witt sobre cuerpos realmente cer-
rados) se suelen estudiar principalmente las cuádricas proyectivas reales, pero, en nuestro caso,
nos ocupamos de la variedad proyectiva sobre un cuerpo algebraicamente cerrado. Es sencillo
recordar que si la caracterı́stica del cuerpo es distinta de 2, salvo un cambio de coordenadas
definido por un polinomio P ∈ GL(n + 1, K), toda cuádrica es equivalente a una cuádrica de
la forma:
VPn (K) (q),
donde q tiene la forma:
X r
q(X0 , . . . , Xn ) = ai Xi2 ,
i=0
donde r ≤ n, ai ∈ K. En el caso K = K, la forma se puede refinar a una forma cuadrática q
del tipo
r
X
q(X0 , . . . , Xn ) = Xi2 ,
i=0
con r ≤ n.
Como en el caso afı́n no sólo tendremos hiper-superficies sino que tendremos toda una topologı́a
de Zariski en Pn (K), justificando el término “abierto distinguido” usado anteriormente. Pero
necesitaremos analizar un poco má el tipo de ideale que nos hacen funcionar en este caso.
Comencemos recordando la descomposición en suma directa del anillo de polinomios con coefi-
cientes en un cuerpo hecho en la Proposición 1.4.40:
(7.4.4) K[X0 , . . . , Xn ] = ⊕d∈N Hd (X0 , . . . , Xn ),
donde la suma directa descrita por el sı́mbolo ⊕ es suma directa como subespacios del K−espacio
vectorial K[X0 , . . . , Xn ]. Observemos que los subespacios Hd verifican la siguiente propiedad:
(7.4.5) Hd (X0 , . . . , Xn )Hk (X0 , . . . , Xn ) ⊆ Hd+k (X0 , . . . , Xn ),
con la operación producto de polinomios. O, equivalentemente,

∀f ∈ Hd (X0 , . . . , Xn ), ∀g ∈ Hk (X0 , . . . , Xn ) =⇒ f g ∈ Hd+k (X0 , . . . , Xn ).
La demostración es inmediata recordando la multiplicación de polinomios y que ni K[X0 , . . . , Xn ]
(ni K) poseen divisores de cero. Recuérdese la Proposición 1.4.40.
Dado un polinomio f ∈ K[X0 , . . . , Xn ] no nulo, existe una familia finita única de polinomios
homogéneos tal que
f = f0 + f1 + · · · + fd , fi ∈ Hi (X0 , . . . , Xn ), fd 6= 0.
Esto es consecuencia inmediata de la descomposición de K[X0 , . . . , Xn ] como suma directa de
subespacios. A cada polinomio homogéneo fi ∈ Hi (X0 , . . . , Xn ) que aparece en esa descripción
de f como suma de homogéneos se le denomina componente homogénea de f grado i.
Proposición 7.4.3. Sea K un cuerpo R := K[X0 , . . . , X] el anillo de polinomios en n+1

variables con coeficientes en K. Sea a ⊆ K[X0 , . . . , Xn ]. Las siguientes propiedades son equiv-
alentes:
i) El ideal a está generado por una familia finita de polinomios homogéneos.
ii) El ideal a está generado por una familia cualquier H de polinomios nomogéneos, es
decir,
[
H⊆ Hd (X0 , . . . , Xn ),
d∈N
y a = (H).
iii) El ideal a satisface
a = ⊕d∈N (a ∩ Hd (X0 , . . . , Xn )) ,
donde ⊕ representa suma directa de subespacios vectoriales del K−espacio vectorial
K[X0 , . . . , Xn ].
iv) Dado f ∈ a y dada la descomposición de f en componentes homogéneas
f = f0 + · · · + fd , fi ∈ Hi (X0 , . . . , Xn ),
entonces fi ∈ a.
Demostración. Probemos las distintas implicaciones:
• i) =⇒ ii): Obviamente.
• ii) =⇒ iii): Supongamos que a = (H) está generado por una familia de polinomios
H := {fi : i ∈ I},
de tal modo que cada fi es homogéneo de grado di , es decir,
fi ∈ Hdi (X0 , . . . , Xn ), ∀i ∈ I.
Consideremos los subespacios vectoriales contenidos en el ideal a:
ad := a ∩ Hd (X0 , . . . , Xn ).
Consideremos el subespacio suma de los subespacios ad , que es suma directa por serlo la
descomposición original de K[X0 , . . . , Xn ] (Identidad (7.4.4)). Es decir, consideramos:
M X
ad = ad ,
d∈N d∈N
donde la suma es como subespacios vectoriales del K−espacio vectorial K[X0 , . . . , Xn ].

Como a es ideal en K[X0 , . . . , Xn ] también es subpespacio vectorial y como ad ⊆ a,
obviamente se tiene: M X
ad = ad ⊆ a.
d∈N d∈N
Por otro lado, consideremos g ∈ a. Entonces, existirá J ⊆ I un subconjunto finito, y
una familia cualquiera de polinomios {gj : j ∈ J} de tal modo que:
X
g= gj fj .
j∈J
Descompongamos cada gj es sus componentes homogéneas, conforme a la suma directa

descrita en la Ecuación (7.4.4), podemos descomponer cada uno de los polinomios gi
es sus componentes homogéneas:
gj := gj,0 + gj,1 + · · · + gj,tj , ∀j ∈ J, gj,tj 6= 0,
donde gj,k ∈ Hk (X0 , . . . , Xn ). Por la inclusión descrita en la Identidad (7.4.5), ten-
dremos que para cada j ∈ J y para cada k ∈ {0, . . . , tj } se tiene:
gj,k fj ∈ Hdj +k (X0 , . . . , Xn ).
Pero, como a es un ideal y fj ∈ a, también se tiene que gk,j fj ∈ a. En otras palabras
tenemos:
gj,k fj ∈ a ∩ Hdj +k (X0 , . . . , Xn ) = adj +k , ∀j ∈ J, ∀k ∈ {0, . . . , tj }.
Finalmente, observemos que
tj
X XX
g= gj fj = gj,k fj .
j∈J j∈J k=0
Como J es un conjunto finito, concluimos que g es una suma finita de elementos en

varios subespacios de la forma ar , es decir,
[ X
g ∈ Kh ad i = ad = ⊕d∈N ad .
d∈N d∈N
Lo que significa que
a ⊆ ⊕d∈N ad .
Como ya habı́amos probado el otro contenido, tendremos probada la afirmación iii) a
partir de ii).
• iii) =⇒ iv): Es esencialmente obvio y está implı́cito en la descomposición de a como
suma directa de subespacios vectoriales. Supongamos, con las notaciones de la prueba
de la impicación precedente, que tenemos
a = ⊕d∈N ad .
Y supongamos que f ∈ a un elemento no nulo. Tendremos una descomposición de f
como suma de elementos de esta suma directa:
f = g0 + · · · + gt ,
donde gi ∈ ai y gt 6= 0. Entonces deg(f ) = deg(gt ) = t. De otro lado, tenemos su
descomposición a través de sus componentes homogéneas
f = f0 + · · · + ft ,
con ft 6= 0, donde ya hemos usado que f tiene grado t. Pero, entonces, tenemos la
siguiente identidad:
0 = (g0 − f0 ) + (g1 − f1 ) + · · · + (gt − ft ),
válida en la suma directa de K−espacios vectoriales ⊕d∈N Hs (X0 , . . . , Xn ) y con la
propiedad gi − fi ∈ Hi (X0 , . . . , Xn ). Entonces,
fi = gi , ∀i ∈ {0, . . . , t},
y concluimos que fi ∈ ai ⊆ a para comoponente homogénea de grado i de f , como
buscábamos.
• iv) =⇒ i): Supongamos que se verifica iv). Por el Basissatz de Hilbert (Teorema ??),
a es un ideal finitamente generado. Supongamos que G := {g1 , . . . , gr } generan el ideal
a. Es decir,
a = (g1 , . . . , gr ).
Por la descomposición descrita en la Ecuación (7.4.4) podemos descomponer cada uno
de los polinomios gi es sus componentes homogéneas:
gi := gi,0 + gi,1 + · · · + gi,di , 1 ≤ i ≤ r.
Por la propiedad iv) dado que cada gi ∈ a, concluimos que
{gi,j : 1 ≤ i ≤ r, 0 ≤ j ≤ di } ⊆ a.
Entonces, el ideal que generan estas componentes homogéneas también estarán con-
tenido en el ideal a. Es decir,
b := ({gi,j : 1 ≤ i ≤ r, 0 ≤ j ≤ di }) ⊆ a.
Pero, obviamente, cada uno de los gi ’s está en el ideal b porque cada gi es suma de
elementos de b. Es decir,
{g1 , . . . , gr } ⊆ b := ({gi,j : 1 ≤ i ≤ r, 0 ≤ j ≤ di }) ⊆ a.
Entonces, el ideal que generan los gi ’s también estará contenido en b y habremos
concluido:
a = (g1 , . . . , gr ) ⊆ b := ({gi,j : 1 ≤ i ≤ r, 0 ≤ j ≤ di }) ⊆ a.
Por tanto, a = b y a está generado por la familia finita siguiente que está formada
solamente por polinomios homogéneos:
{gi,j : 1 ≤ i ≤ r, 0 ≤ j ≤ di }.
Y tenemos probado i).

Definición 97 (Ideal Homogéneo). Llamaremos ideal homogéneo (o graduado) en el anillo

de polinomios K[X0 , . . . , Xn ] a todo ideal propio a ( K[X0 , . . . , Xn ] generado por una fa-
milia finita de polinomios homogénos (o, equivalentemente, que satisface una cualquiera de las
propiedades descritas en la Proposición 7.4.3 precedente).
Observación 7.4.4. Como se observa, excluimos de entre los ideales homogéneos al ideal
K[X0 , . . . , Xn ] y nos restringimos solamente a ideales propios. No es un restricción significativa,
pero facilita la coherencia de lo que sigue.
Definición 98 (Variedad algebraica proyectiva K−definible). Llamaremos variedad al-

gebraica projectiva K−definible en Pn (K) a la intersección de cualquier familia (finita o infinita)
de hiper-superficies algebraicas proyectivas. Esto es, a cualquier subconjunto V ⊆ Pn (K) tal que
existe un conjunto cualquier de polinomios homogéneos H ⊆ K[X0 , . . . , Xn ] tal que
\
V = VPn (K) (f ) = VPn (K) (H).
f ∈H
Cnuando no haya confusión sobre el cuerpo K o la dimensión n del espacio proyectivo sobre el
que se trabaja, escribiremos simplemente VP (H).
Definición 99 (Variedad proyectiva de los ceros de un ideal homogéneo). Con las

notaciones precedentes, sea K un cuerpo, K su clasura Zariski y sea a ( K[X0 , . . . , Xn ] un
ideal homogéneo. Consideremos H(a) el conjunto de todos los polinomios homogéneos de a. Es
decir, consideramos [
H(a) = ad ,
d∈N
donde, como en la Proposición precedente, ad := a ∩ Hd (X0 , . . . , Xn ). Llamamos variedad
algebraica proyectiva definida por el ideal a a la variedad algebraica proyectiva siguiente:
\
VPn (K) (a) = VPn (K) (H(a)) = VPn (K) (a).
f ∈H(a)
Obsérvese que H(a), mencionado en la Definición 99, es una familia de polinomios homogéneos,
no necesariamente finita, que generan a como ideal. De hecho, se tiene que
!
\ [ [
H(a) = a Hd (X0 , . . . , Xn ) = ad ,
d∈N d∈N
y el apartado iii) de la citada Proposición implica que H(a) genera a como K−espacio vectorial
y, por ende, como ideal de K[X0 , . . . , Xn ].
Proposición 7.4.5 (Variedades proyectivas e ideales homogéneos). Sea a ⊆ K[X0 , . . . , Xn ]

un ideal homogéneo. Y sea H y G dos conjuntos de generadores de a formados por elementos
homogéneos. Entonces, se tiene:
VPn (K) (G) = VPn (K) (H).
Por tanto, la variedad proyectiva de los ceros del ideal a satisface:
VPn (K) (a) = VPn (K) (H),
donde H está formado únicamente de polinomios homogéneos y a = (H).
En particular, toda variedad algebraica proyectiva es intersección de una familia finita de hiper-
supercies proyectivas.
Demostración. Supongamos a = (F) = (H) dos sistemas de generadores del ideal
a. Dado f ∈ F, entonces exiten g1 , . . . , gs ∈ H y polinomios cualesquiera h1 , . . . , hs ∈
K[X0 , . . . , Xn ] tales que
f = h1 g1 + · · · + hs gs .
Consideremos un punto proyectivo
x = (x0 : · · · : xn ) ∈ VPn (K) (H) ⊆ Pn (K).
Entonces, los polinomios g1 , . . . , gs ∈ H se anulan en cualquier punto afı́n asociado (y0 , · · · , yn ) ∈
Kn+1 \ {0} tal que π(y0 , . . . , yn ) = (x0 : · · · : xn ) ∈ Pn (K). Por tanto,
f (y0 , . . . , yn ) = h1 (y0 , . . . , yn ) · 0 + · · · + hs (y0 , . . . , yn ) · 0 = 0.
Como f es homogéneo tiene sentido considerar VPn (K) (f ) y habremos probado que
VPn (K) (H) ⊆ VPn (K) (f ), ∀f ∈ F,
o, equivalentemente, hemos probado que
VPn (K) (H) ⊆ VPn (K) (F).
El otro contenido se sigue análogamente.
La segunda afirmación se sigue del hecho de que el conjunto H(a) ⊆ a, mencionado en la
Definición 99, genera el ideal a.
Obviamente, esto da sentido a considerar los conjuntos VPn (K) (a) y, por la afirmación del ı́tem
i) de la Proposición 7.4.3 precedente, el ideal a posee un sistema generador finito y, por tanto,
VPn (K) (a) es una intersección finita de hipersuperficies.
Observación 7.4.6. Obsérvese que hemos probado que si a ⊆ K[X0 , . . . , Xn ] es un ideal

homogéneo, x ∈ VPn (K) es un punto proyectivo e y ∈ Kn+1 \{0} es un punto afı́n tal que π(y) = x,
entonces, para cualquier polinomio f ∈ a se tiene que f (y) = 0 porque sus componentes
homogéneas se anulan todas en y. Esto no funciona igual para ideales cualesquiera.
Proposición 7.4.7 (Conos proyectantes). Sea a ( K[X0 , . . . , Xn ] un ideal homogéneo. Se

tiene:
i) Se verifica
a ⊆ (X0 , . . . , Xn ).
Además VPn (K) (X0 , . . . , Xn ) = ∅.
ii) Sea a ( K[X0 , . . . , Xn ] un ideal homogéneo y sea V = VPn (K) (a) la variedad proyectiva
definida por a. Sea Ve = π −1 (V ) ∪ {0} ⊆ Kn+1 el cono proyectante sobre V , entonces
Ve = VA (a).
Es decir los conos proyectantes sobre variedades algebraicas proyectivas son variedades
algebraicas afines.
iii) Sea C ⊆ Kn+1 una variedad algebraica afı́n K−definible. Si C es un cono afı́n propio,
entonces IK (C) es un ideal homogéneo. Además, si W = VPn (K) (IK (V )) ⊆ Pn (K) es
la variedad proyectiva asociada a ese ideal homogéneo, entonces el cono C verifica:
W
f = C.
En conclusión, tenemos una biyección entre los conos afines propios V ⊆ Kn+1 que son
variedades algebraicas K−definibles y las variedades algebraicas proyectivas K−definibles en
Pn (K).
Demostración. La afirmación i) es inmediata. Nótese que si a es homogéneo y es propio
(i.e. si a 6= K[X0 , . . . , Xn ]) está generado por una familia de polinomios homogéneos. Pero no
contiene a ningún polinmio homogéneo no nulo de grado 0 por ser ideal propio. Por tanto a está
generado por polinomios homogéneos de grado al menos 1. A su vez, los polinomios homogéneos
de grado al menos 1 son combinaciones lineales, con coeficientes en K, de monomios de grado
al menos 1. Y los monomios de grado al menos 1 son divisibles por alguna de las variables en
el conjunto {X0 , . . . , Xn } lo que conduce a la afirmación, para un ideal heomogéneo a:
a 6= K[X0 , . . . , Xn ] =⇒ a ⊆ (X0 , . . . , Xn ).
La afirmación sobre el vacı́o como variedad algebraica proyectiva es obvia.
Para la afirmación ii), es claro que si V = VPn (K) (a) y si x ∈ Ve \ {0} , entonces f (x) = 0 para
todo f ∈ a homogéneo. Pero como los ceros afines de un ideal coinciden con los ceros afines de
cualquiera de sus sistemas de generadores (cf. Proposición 7.2.3 Proposición 7.3.5), y a es un
ideal homogéneo, entonces entonces x ∈ VA (a). Además, como a es un ideal homogéneo y es
propio, a ⊆ (X0 , . . . , Xn ) y, por tanto, 0 ∈ VA (a). En suma, tenemos
Ve = π −1 (V ) ∪ {0} ⊆ VA (a).
En cuanto al recı́proco, si x ∈ VA (a) y x 6= 0, supongamos que las coordenadas afines de x
vienen dadas por x = (x0 , . . . , xn ) ∈ Kn+1 \ {0}. Sea π(x) = (x0 : · · · : xn ) ∈ Pn (K) el punto
proyectivo asociado. Como f (x0 , . . . , xn ) = 0 para cada f ∈ a, entonces f (x0 , . . . , xn ) = 0
para cualquier polinomio homogéneo en a por lo que (x0 : · · · : xn ) ∈ VPn (K) (a). Por tanto
x ∈ π −1 (V ). Como a es homogéneo propio, 0 ∈ VA (a) y habremos probado que
VA (a) ⊆ Ve = π −1 (V ) ∪ {0}.
Y tenemos la igualdad.
La afirmación iii) es la que requiere de un poco más de reflexión. Supongamos que V es un
cono afı́n propio con respecto a K (i.e. λx ∈ V, ∀λ ∈ K, ∀x ∈ V ) y sea IK (V ) el ideal asociado
en K[X0 , . . . , Xn ]. Sea f ∈ IK (V ). Consideremos la descomposición de f en sus componentes
homogéneas:
f = f0 + f1 + · · · + fd ,
donde fi es homogéneo de grado i y fd 6= 0. Consideremos ahora un punto x ∈ V cualquiera.
Por ser V un cono, tendremos también que λx ∈ V para cada λ ∈ K. Como f ∈ IK (V ) se tiene
que f (x) = 0, pero también f (λx) = 0. Pero observemos que
0 = f (λx) = f0 (x) + λf1 (x) + · · · + λd fd (x).
Es decir, si consideramos el polinomio en una variable:
F = fd (x)T d + fd−1 (x)T d−1 + · · · + f1 (x)T + f0 (x) ∈ K[T ],
tenemos que F es un polinomio que se anula en todos los puntos de K que es un cuerpo infinito.
Entonces F ≡ 0 es el polinomio idénticamente nulo o, equivalentemente, todos sus coeficientes
son nulos. Es decir, f0 (x) = 0, . . . , fd (x) = 0. Hemos probado que:
∀x ∈ V, ∀f ∈ IK (V ) =⇒ f0 (x) = f1 (x) = · · · = fd (x) = 0.
Dicho de otra manera, si f ∈ IK (V ), entonces sus componentes homogéneas f0 , . . . , fd ∈ IK (V )
y, por nuestra caracterización de los ideales homogéneos, el ideal IK (V ) es un ideal homogéneo.

Observación 7.4.8 (El ideal m0 en el caso proyectivo). El ideal (X0 , X1 , . . . , Xn ) ⊆

K[X0 , . . . , Xn ] es un ideal homogéneo, que ya hemos detectado con anterioridad, dado que
se trata del ideal maximal m0 := IK ({0}) = (X0 , . . . , Xn ), donde 0 ∈ Kn+1 es el “origen” en
Kn+1 . Obsérvese que {0} es un cono con la terminologı́a usada anteriormente y que es el cono
proyectante asociado al vacı́o e ∅ = {0}, de donde surge el uso que damos a este ideal en el caso
proyectivo.
Proposición 7.4.9 (Propiedades elementales de ideales homogéneos). Se tiene las sigu-

ientes propiedades:
i) Si {ai : i ∈ I} es una familia cualquiera de ideales homogéneos, entonces
X
ai ,
i∈I
es un ideal homogéneo.
ii) Si a y b son ideales homogéneos, también son homogéneos los ideales ab y a ∩ b son
homogéneos. Más generalmente, dada una familia cualquiera de ideales homogéneos
{ai : i ∈ I}, la intersección ∩i∈I ai también es un idael homogéneo.
√
iii) Si a es un ideal homogéneo, también es homogéneo su radical: a.
Demostración. Hagamos cada afirmación por su lado.
• Afirmación i): El ideal suma está generado por la unión de los ideales. Pero, a
su ves, cada ideal ai está generado por una familia Hi de polinomios homogéneos
(i.e. ai = (Hi ) para cada i ∈ I). Es un sencillo ejercicio probar que el ideal suma
está generado por la unión de conjuntos de generadores de los ideales que se están
sumando. Es decir,
! !
X [ [
ai = ai = Hi .
i∈I i∈I i∈I
Por tanto, el ideal suma está generado por un conjunto cualquiera de polinomios
homogéneos y será un ideal homogéneo.
• Afirmación ii): Para el caso del ideal a ∩ b, si f ∈ a ∩ b, por ser a y b homogéneos,
las componentes homogéneas de f están en tanto en a como en b y, por tanto, las
componente homogéneas de f están en a ∩ b y el ideal a ∩ b es homogéneo por la
afirmación iv) de la Proposición 7.4.3.
Para el ideal producto ab, nótese que si H es un sistema generador del ideal a y G es un
sistema generador del ideal b entonces, el siguiente conjunto es un sistema generador
del ideal ab:
HG := {f g : f ∈ a, g ∈ b}.
Si, por ser a y b homogéneos, suponemos que los polinomios en H y en G son todos
homogéneos, por la inclusión descrita en la Identidad (7.4.5), el producto de dos
polinomios homogéneos es un polinomio homogéneo. En suma, los elementos de HC
son todos polinomios homogéneos y como
ab = (HG) ,
el ideal producto ab será un ideal homogéneo.
Para el caso de una familia cualquiera de ideales homogéneos {ai : i ∈ I} la prueba
de que su intersección es un ideal homogéneo sigue as mismas pautas que el caso de
la intersección de 2. Lo dejamos como reflexión para el lector.
• Afirmación iii): Supongamos que a es un ideal propio (en el caso impropio no hay
nada que probar). Consideremos el siguiente conjunto:
√ √
A := {t ∈ N : ∃f ∈ a, f = f0 + · · · ft , ft 6= 0, fi ∈ Hi , ft 6∈ a}.
√
Es decir, A es el conjunto de los grados de polinomios en a cuya colponente ho-
mogénea de mayor grado no está en a. Supongamos, razonando por reducción √ al
absurdo, que A 6= ∅ y sea d := min(A ). Entonces, existe un polinomio f ∈ a tal
que deg(f ) = d y dada la descomposición de f en componentes homogéneas
f = f0 + · · · + fd ,
√
con fi ∈ Hi (X0 , . . . , Xn ), fd 6= 0. Ahora, como f ∈ a existe una potencia m ∈ N,
m ≥ 1, tal que f m ∈ a. Ahora bien, tenemos que
X d
Y
f m = (f0 + · · · + fd )m = aµ fiµi ,
|µ|=m i=0
donde los coeficientes aµ ∈ K dependen de la caracterı́stica del cuerpo K. Ahoera los

sumandos de esa expresión son polinomios homogéneos y, además, el grado de cada
sumando, si aµ 6= 0, viene dado por
d
Y d
X d
X
deg(aµ fiµi ) = µi deg(fi ) = iµi .
i=0 i=0 i=0
El mx́imo de estos grados, dado que |µ| = µ0 + · · · + = m se alcanza en el témino
µ = (0, . . . , 0, m) ∈ Nd+1 , es decir,
d
X
iµi ≤ md.
i=0
Esto nos permite concluir que la componente homogénea de mayor grado de f m es
precisamente fdm . Como a es homogéneo, y√como f m ∈ a, concluimos que fdm ∈ a
y, por tanto, concluimos también que fd ∈ a. Pero eso contradice √ el hecho de ser
d = min(A ) y, por tanto, A = ∅. La conclusión es que si f ∈ a entonces la
componente de mayor grado de f es un elemento√de a.
Para concluir el argumento, consideremos f ∈ a un polinomio no √ nulo de grado
mı́nimo tal que alguna de sus componentes homogéneas no está en a. Supongamos
que deg(f ) = d y que sus componentes homogéneas son dadas por la siguiente igualdad:
f = f0 + · · · + fd .
√ √
Por lo que acabamos de probar, fd ∈ a pero, como a es un ideal,
√ √ entonces f − fd ∈
a. Además, la componente homogénea
√ de f que no está en a debe ser de grado
menor estricto√que d (porque fd ∈ a). Entonces, el siguiente polinomio √ tiene grado
d − 1, está en a y alguna de sus componentes homogéneas no está en a:
f − fd = f0 + f1 + · · · + fd−1 .
Entonces, necesiariamente (porque d era el mı́nimo de los grados de polinomios no
nulos), se ha de√tener f −fd = 0, f = fd y f no posee ninguna
√ componente homogénea
que no esté en a. En√ conclusión, para cada polinomio f ∈ a todas sus componentes
√
homogéneas están en a y, por la propiedad iv) de la Proposición 7.4.3, el ideal a
es un ideal homogéneo.

En la siguiente proposición escribiremos VP (a) en lugar de VPn (K) (a), asumiendo que el espacio
ambiente proyectivo Pn (K) está fijado.
Proposición 7.4.10 (Topologı́a de Zariski en Pn (K)). Sea K un cuerpo, K su clausura
algebraica, sea K[X0 , . . . , Xn ] el anillo de polinomios en n + 1 variables con coeficientes en K
y supongamos que trabajamos en el espacio proyectivo Pn (K). Se tiene:
i) Si a ⊆ b son dos ideales homogéneos del anillo K[X0 , . . . , Xn ], entonces VP (b) ⊆ VP (a).
ii) ∅ = VP ((X0 , . . . , Xn )) y Pn (K) = VP ((0)).
iii) La intersección de una familia cualquiera de variedades algebraicas proyectivas K−definibes
es una variedad algebraica proyectiva K−definible. Es decir, dada una familia {VP (ai ) :
i ∈ I}, donde ai es un ideal homogéneo, entonces
\ X
VP (ai ) = VP ( ai ),
i∈I i∈I
que es una variedad proyectiva K−definible por el apartado i) de la Proposición prece-

dente.
iv) La unión finita de variedades algebraicas proyectivas K−definibles es una variedad
algebraica proyectiva K−definible. De hecho, dados dos ideales homogéneos a, b en
K[X0 , . . . , Xn ], se tiene que
VP (a) ∪ VP (b) = VP (ab),
donde ab es un ideal homogéneo por la propiedad ii) de la Proposición precedente.
v) Para cada ideal a ⊆ K[X0 , . . . , Xn ] homogéneo, se tiene que
√
VP (a) = VP ( a).
(P)
En particular, existe una única topologı́a Tz en el espacio proyectivo Pn (K) cuyos cerrados
son las variedadees algebraicas proyectivas K−definibles. Es decir, los cerrados de Pn (K) son
la familia:
{VP (a) : a es un ideal homogéneo}.
Demostración. La prueba de las propiedades i) a v) es similar a la hecha para la
Proposición 7.2.4 poniendo cuidado en el hecho de que nuestros ideales son homogéneos (y,
por tanto, usando la homogeneidad de los generadores de los ideales implicados). La conclusión
sobre la topologı́a de Zariski es inmediata a partir de las propiedades i) a v).
Igual que en el caso del espacio afı́n, podemos definir la noción de ideal asociadoa a un subcon-
junto del espacio proyectivo.
Definición 100 (Ideal asociado a un subconjunto de Pn (K)). Sea F ⊆ Pn (K) un sub-
(P)
conjunto del espacio proyectivo. Definiremos el ideal asociado a F como el ideal IK (F ) ⊆
K[X0 , . . . , Xn ] generado por todos los polinomios hompogéneos f ∈ K[X0 , . . . , Xn ] que se anu-
lan en el cono proyectante Fe sobre F . Es decir,
(P)
IK (V ) := {f ∈ K[X0 , . . . , Xn ] : f es homogéneo y f Fe ≡ 0} .
(P)
Nótese que IK (F ) es un ideal homogéneo en K[X0 , . . . , Xn ] por estar generado por elementos
homogéneos. Más aún, obsérvese la diferencia con la definición de IK (F ) dado que hemos
consideramo el “ideal generado por” los polinomios homogéneos que se anulan en Fe ⊆ Kn+1 . A
(P)
posteriori, todos los polinomios de IK se anulan en todos los puntos afines del cono proyectante
Fe sobre F .
Proposición 7.4.11 (Clausura en la topologı́a de Zariski en Pn (K)). Con las notaciones

precedentes,sea F ⊆ Pn (K) un subconjunto del espacio proyectivo. Sea Fe = π −1 (F ) ∪ {0} ⊆
Kn+1 el cono proyectante sobre F . Entonces, se tiene
(P)
IK (F ) = IK (Fe).
En particular, se tiene que:
(P)
∅) = IK ({0}) = m0 = (X0 , . . . , Xn ).
IK (∅) = IK (e
Además, se tiene:
(P) z
VP (IK (F )) = F ,
z
donde F es la clausura de F en la topologı́a de Zariski en Pn (K).
Demostración. Para la primera propiedad, nótese simplemente que si Ve es un cono, por
la propiedad iii) de la Proposición 7.4.7 sabemos que IK (Fe) es un ideal homogéneo. Entonces,
IK (Fe) está generado por los ideales homogńeos que se anulan en Fe y, por tanto, se da la
igualdad:
(P)
IK (F ) = IK (Fe).
(P)
La afirmación sobre IK (∅) es obvia a partir de nuestra definiciones y la Proposición 7.3.15.
Para la tercera afirmación, basta con seguir la argumentación del ı́tem iv) de la Proposición
7.3.11 precedente, poniendo cuidado con la consideraciones de ideales y polinomios homogéneos.

(cones)
Observación 7.4.12. Nótese que, por lo anterior, existe una única topologı́a Tz en Kn+1 \
n+1
{0} cuyos cerrados son dados por la intersección de K \ {0} con los conos proyectantes sobre
variedades algebraicas proyectivas K−definibles. Además, la proyección canónica
π : (Kn+1 \ {0}, Tz(cones) ) −→ (Pn (K), Tz(P) ),
es continua. Más aún, con estas topologı́as π es una aplicación cerrada e induce una biyección
(cones)
entre los cerrados de Tz y los de TzP .
También será continua la proyección canónica entre la topologı́a inducida en Kn+1 \ {0} por la
topologı́a de Zariski Tz en Kn+1 :
π : (Kn+1 \ {0}, Tz n+1 ) −→ (Pn (K), Tz(P) ),

K \{0}
la razón es que los conos proyectantes sobre variedades algebraicas proyectivas K−definibles
son variedades algebraicas K−definibles afines. Pero debemos notar que la topologı́a de Zariski
en Kn+1 es estrictamente más fina (i.e. posee estrictamente más abiertos y cerrados) que la
(cones)
topologı́a Tz . Esta última es meramente instrumental y sirve solamente para intuir cómo
es la topoplogı́a de Zariski en Pn (K). Para estudiar más en profundidad la relación entre las
topologı́as de Zariski en espacios afines y proyctivos esperamos a desarrollos posteriores.
Dado que tenemos una topologı́a podemos hablar de cerrados irreducibles como en la Definición
92:
Definición 101 (Variedad algebraica proyectiva irreducible). Con las notaciones prece-
dentes, una variedad algebraica proyectiva K−definible V ⊆ Pn (K) se denomina reducible si
existen dos variedades algebraicas proyectivas K−definibles W1 , W2 ⊆ Pn (K) tales que
Wi ( V, i ∈ {1, 2},
y
V = W1 ∪ W2 .
Si V no es reducible, diremos que V es irreducible.
De nuevo, tenemos la conexión con los ideales primos, aunque, en este caso, debe ser homogéneo.
Proposición 7.4.13. Con las notaciones precedentes, V ⊆ Pn (K) una variedad algebraica
proyectiva K−definible, son equivalentes:
i) V es irreducible,
(P) (P)
ii) IK (V ) ∈ Spec(K[X0 , . . . , Xn ]), i.e. IK (V ) es un ideal primo y homogéneo.
Demostración. Esencialmente, es la prueba de la Proposición 7.2.20, poniendo cuidado
con los polinomios e ideales homogéneos y los puntos proyectivos.
(P)
Ası́, si el ideal IK ∈ Spec(K[X0 , . . . , Xn ]) es un ideal primo, y si tenemos una descomposición
V = W1 ∪ W2 en dos subvariedades algebraicas proyectivas, tenemos la misma relación entre
los conos proyectantes Ve = Wf1 ∪ W f1 ) ∩
f2 . Entonces, los ideales afines verifican IK (Ve ) = IK (W
IK (W2 ). Como en el caso afı́n, por la Proposición 4.2.12, se tiene que dar
f
IK (Ve ) ⊇ IK (W
f1 ) ∨ IK (Ve ) ⊇ IK (W
f2 ).
Todos ellos son ideales homogéneos y se tendrá, alternando las inclusiones
VP (IK (Ve )) ⊆ VP (IK (W
f1 )) ∨ VP (IK (Ve )) ⊆ VP (IK (W
f2 )).
(P) fi ) = I (P) (Wi ), para cada i ∈ {1, 2} y usando la
Pero sabemos que IK (Ve ) = IK (V ), IK (W K
Proposición 7.4.11, siendo V , W1 y W2 cerrados en Pn (K), concluimos
V = VP (IK (Ve )) ⊆ W1 = VP (IK (W
f1 )) ∨ V = VP (IK (Ve )) ⊆ W2 VP (IK (W
f2 )),
lo que nos permite concluir que V es irreducible.
Recı́procamente, supongamos que V es irreducible, escribamos, para simplificar la lectura,
(P)
i = IK (V ). Sea f ∈ K[X0 , . . . , Xn ] un polinomio tal que f 6∈ i. Supogamos que deg(f ) = d y
consideremos sus componentes homogéneas:
f = f0 + f1 + · · · + fd , fi ∈ Hi (X0 , . . . , Xn ), fd 6= 0.
Como i es homogéneo debe existir una componente homogénea de f que no está en ese ideal.
Es decir, existe t, con
P0 ≤ t ≤ d tal que ft 6∈ i y fj ∈ i para t + 1 ≤ j ≤ d. Consideremos el
d
polinomio f 0 := f − 0
j=t+1 fj . Obviamente f 6∈ i porque ft 6 i y el ideal i es homogéneo.
Consideremos los siguientes dos conjuntos siguiente conjunto:
F (f ) := {g ∈ K[X0 , . . . , Xn ] : gf ∈ i, g 6∈ i},
y
F (f 0 ) := {g ∈ K[X0 , . . . , Xn ] : gf 0 ∈ i, g 6∈ i}.
P
d
Observemos que F (f ) = F (f 0 ). Dado g ∈ F (f ), tenemos que g 6∈ i y, además, g j=t+1 fj ∈
P P
d d
i, porque j=t+1 fj ∈ i. Por tanto, gf 0 = gf − g j=t+1 fj ∈ i, luego g ∈ F (f 0 ). El
P
d
recı́proco es análogo: si g 6∈ i y gf 0 ∈ i, entonces f g = gf 0 + g j=t+1 fj ∈ i.
Para concluir nuestro argumento, veamos que F (f 0 ) = ∅.
Supongamos que F (f 0 1) no es vacı́o, entonces el siguiente conjunto posee mı́nimo:
F := {deg(g) : g ∈ F (f 0 )}.
Sea r = min(F ) el mı́nimo. De momento, no es posible que r = −1 porque si r = −1, entonces
0 ∈ F , pero 0 6∈ F dado que 0 ∈ p para cualquier ideal p primo. Por tanto, r ≥ 0. Sea g ∈ F
tal que deg(g) = r = min(F ). Escribamos las coordenadas homogéneas de g:
g = g0 + g1 + · · · + gr , gj ∈ Hj (X0 , . . . , Xn ), gr 6= 0.
Tenemos que g 6∈ i, pero tenemos también la expansión en componentes homogéneas de f 0 g:
 
t+r
X X
f 0g =  fi gj  .
k=0 i+j=k
La componente homogénea de mayor grado de f 0 g es, precisamente ft gr . Como f 0 g ∈ i y el

ideal es homogéneo, concluimos que ft gr ∈ i. Consideremos la descomposición de V como unión
de dos cerrado irreducibles:
V = V ∩ VP (ft ) ∪ V ∩ VP (gr ).
(P)
Pero V 6= V ∩ VP (ft ) porque ft 6∈ i = IK (V ). Por tanto, concluimos que
V = V ∩ VP (gr ),
(P)
o, equivalentemente, gr ∈ i = IK (V ). Consideremos, finalmente, el polinomio g 0 = g − gr .
Claramente deg(g ) ≤ r − 1. Además, como g 6∈ i y gr ∈ i, entonces g 0 6∈ i. Más aún, como
0
gr ∈ i, entonces
f 0 g 0 = f g − f gr ∈ i.
Por tanto, g 0 ∈ F (f 0 ), lo que contradice la minimalidad de r = min(F ). Por tanto, la única
opción es que F (f ) = F (f 0 ) = ∅. Es decir, que si f g ∈ i y f 6∈ i, concluimos que g ∈ i y el
ideal i es primo.

Corolario 7.4.14. Con las notaciones y propiedades precedentes, los cerrados irreducibles para
la topologı́a de Zariski en Pn (K) están contenidos en el conjunto siguiente:
{VPn (K) (p) : p ∈ Spec(K[X0 , . . . , Xn ]), p homogéneo}.
La discusión de cuántos de los ideales primos homogéneos determinan una variedad algebraica
proyectiva queda para el estudio del Nullstellensatz proyectivo ulterior.
De nuevo, por estar en un contexto noetheriano (ver ı́tem iv) de la Proposición 7.4.3, tenemos
las buenas cualidades de la topologı́a de Zariski en Pn (K):
Corolario 7.4.15. Cada abierto en la topologı́a de Zariski de Pn (K) dada por los K−definibles
es unión finita de abiertos distinguidos de la forma
OP (f ) := OPn (K) (f ) := Pn (K) \ VP (f ) := {x ∈ Pn (K) : f (x) 6= 0},
donde f ∈ K[X0 , . . . , Xn ] es un polinomio homogéneo.
Y se presevran las concidiones de cadena:
Proposición 7.4.16. Con las notaciones de los Teoremas precedentes se tiene:
i) Condición de Cadena Numerable Descendente (para cerrados):Toda ca-
dena descendente de cerrados para la topologı́a de Zariski en Pn (K) definida por las
variedades algebraicas proyectivas se estabiliza.
ii) Asumiendo el Axioma de Elección Dependiente, todo conjunto no vacı́o de variedades
algebraicas proyectivas K−definibles posee elemento minimal para la inclusión.
Se dice que la topologı́a de Zariski en Pn (K) define un espacio topológico noetheriano por
satisfacer estas dos propiedades.
Demostración. La prueba sigue, esencialmente, los mismos argumentos que la demostración
de la Proposición 7.3.16.
Proposición 7.4.17 (Componentes irreducibles de una variedad algebraica proyec-

tiva). Con las notaciones de los Teoremas precedentes, se verifican las siguientes propiedades:
i) Toda variedad algebraica proyectiva K−definible es unión finita de variedades alge-
braicas proyectivas irreducibles.
ii) Dado V ⊆ Pn (K) un variedad algebraica proyectiva K−definible, existe una descom-
posición en variedades algebraicas poryectivas irreducibles y K−definibles:
(7.4.6) V = V1 ∪ . . . ∪ Vs ,
tal que V no se puede escribir como unión de una subfamilia propia de {V1 , . . . , Vs }
(o, equivalentemente, que dados i, j con i 6= j, no hay relación de contenido entre Vi y
Vj ). Tal descomposición se llama minimal o irredundante.
iii) Dada una descomposición irredundante de V como en (7.4.6) no hay relación de in-
clusión entre cualesquiera dos irredubles de tal descomposición. Es decir, no existe
i, j ∈ {1, . . . , s} tales que i 6= j y Vi ⊆ Vj .
iv) Las descomposiciones irredundantes de variedades K−definibles en irreducibles son
únicas salvo permutación de las variedades {V1 , . . . , Vs }.
Dada una variedad algebraica proyectiva K−definible V ⊆ Pn (K), los cerrados irreducibles
K-definibles (únicos para cada V ) que aparecen en una descomposición irredundante de V en
irreducibles se denominan componentes irreducibles de V .
Demostración. Similar a la demostración de la Proposición 7.3.17.
El resto de las propiedades de la argumentación noetheriana se siguen de manera natural como

en el caso de las variedades afines:
Proposición 7.4.18. Con las notaciones precedentes, dado V ⊆ Pn (K) un cerrado Zariski
K−definible de Pn (K) y dado un espacio recubridor de V por abiertos Zariski de Pn (K) A :=
{Ai : i ∈ I}, entonces, A posee un subcubrimiento finito de Y . Es decir, la topologı́a de
Zariski de los K−definibles sobre Pn (K) es quasi-compacta.
Proposición 7.4.19. Con las notaciones precedentes, sea V ⊆ Pn (K) una variedad algebraica
proyectiva K−definible. Se tiene:
(P)
i) El ideal IK (V ) ⊆ K[X1 , . . . , Xn ] es un ideal radical.
(P)
ii) Existe una descomposición primaria irredundante de cada ideal IK (V ) dada por ide-
ales primos y homogéneos. Esto es, para cada V ⊆ An (K) existe una familia finita
de ideales primos {p1 , . . . , ps } ⊆ Spec(K[X0 , . . . , Xn ]), que son, además ideales ho-
mogéneos, tales que pi 6= pj , para cada i 6= j, y la siguiente descomposición es irredu-
dante:
(7.4.7) IPn (K) (V ) = p1 ∩ · · · ∩ ps .
De hecho, esta descomposicón es única, salvo permutación de los ideales primos in-
volucrados.
(P)
iii) Los ideales de la forma IK (V ) no poseen componentes inmersas y todos sus ideales
primos asociados son minimales.
iv) De hecho, si disponemos de una descomposición de V en componentes irreducibles en
Pn (K),
V = V1 ∪ · · · ∪ Vs ,
se tendrá que pi = IK (Vi ) ∈ Spec(K[X0 , . . . , Xn ]).
Demostración. La prueba es un punto más delicada que la prueba de la Prosición 7.4.19,
pero se sigue con esencialmente los mismos pasos.
Observación 7.4.20 (Los ideales de los puntos proyectivo). Dado un punto proyectivo
(P)
z = (z0 : · · · : zn ) ∈ Pn (K), el ideal asociado IK ({z}) es un ideal homogéneo. Consideremos la
recta afı́n r ⊆ Kn+1 determinada como el cono proyectante sobre el punto z: r = {z}. g Se trata,
n+1
obviamente, del subespacio generado por z en K , i.e.
r = Khzi = {z}.
g
Por tanto, los ideales satisfacen:

(P)
IK ({z}) = IK (Khzi) ⊆ K[X0 , . . . , Xn ].
(P)
Y como las rectas son variedades afines irreducibles, entonces IK ({z}) ∈ Spec(K[X0 , . . . , Xn ]).
Pero ya no será un ideal maximal. Obviamente estará contenido en m0 y, por tanto, no será
maximal, pero se le puede caracterizar mediante la siguiente igualdad.
(P)
IK (x) := {zi Xj − zj Xi : {i, j} ⊆ {0, 1, . . . , n}} = IK (Khzi).
Retomando el cubrimiento de Pn (K) por las imágenes de los espacios afines descrito en la
Identidad (7.4.3) y, tras observar que las imágenes de los espacios afines son abiertos distinguidos
(cf. Observación 7.4.1), tenemos un cubrimiento abierto de Pn (K) por un número finito de
abiertos distinguidos:
n
[
Pn (K) = OP (Xi ).
i=0
Ahora, dado un punto z = (z0 : · · · : zn ) ∈ Pn (K) existe alguno de esos abiertos distinguidos en
el que se encuentra. Supongamos que z ∈ OP (Xi ) entonces se puede probar (y es un sencillo
ejercicio de verificación que
(P)
IK ({z}) = (zk Xi − zi Xk : k ∈ {0, . . . , n}, k 6= i}.
Y concluimos que los ideales asociados a puntos proyectivos están generados por n polinomios
homogéneos de grado 1. En particular, los puntos “afines” embebidos en el proyectos a través
de la usual homogeneización (i.e los puntos z = (z0 : · · · : zn ) ∈ ϕ0 (An (K))) tienen ideales
dados por:
(P)
IK ({(1 : z1 : · · · : zn )}) = (X1 − z1 X0 , . . . , Xn − zn X0 ) ,
que “recuerdan” al ideal mz := (X1 − z1 , . . . , Xn − zn ) homogeneizando los polinomios que le
generan. Volveremos sobre esta idea más adelante.
Observación 7.4.21 (Cuidado con las “funciones” polinomiales y el proyectivo). Dada

una variedad algebraica K−definible V ⊆ An (K), y dado un polinomio f ∈ K[X1 , . . . , Xn ] uno
pude definir de manera natural una función (llamada función polinomial) sobre V mediante f :
f: V −→ K
x 7−→ f (x)
Se escribe K[V ] para designar la K−álgebra de las funciones polinomiales sobre V y veremos
de su relevanzia (de hecho, una equivalencia natural) entre las variedades algebraicas afines y
este tipo de K−álgebras.
Sin embargo, tal cosa no pude hacerse con variedades algebraicas proyectivas. Dada V ⊆ Pn (K)
una variedad algebraica proyectiva, y dado un polinomio f ∈ K[X0 , . . . , Xn ] no tiene sentido
definir una “función” polinomial sobre V ni siquiera si f es homogéneo: no está claro quién
serı́a f (x0 : · · · : xn ) ∈ K. Por eso se considera la siguiente construcción:
Sean f, g ∈ Hd ⊆ K[X0 , . . . , Xn ] dos polinomios homogéneos del mismo grado y sean x, y ∈
Kn+1 dos representantes del mismo punto proyectivo ζ = (x0 : x1 : · · · : xn ) ∈ Pn (K). Sea
OP (g) := VPn (K) (g)c ⊆ Pn (K) el complementario de VPn (K) (g) en Pn (K). Entonces, podemos
definir la función:
f /g : D(g) ⊆ Pn (K) −→ K,
ζ 7−→ fg(ζ)
(ζ)
.
Esta función está bien definida y no depende sino del punto proyectivo ζ y no de sus represen-
tantes. Se denomina función regular (o función racional) K−definible sobre Pn (K). Obérvese
una interpretación aviesa de la función anterior como:
(f : g) : D(g) ⊆ Pn (K) −→ P1 (K),
ζ 7−→ (f (ζ) : g(ζ)).
Y VPn (K) (f ) ∩ D(g) son los puntos de D(g) que “se van al infinito” mediante (f : g).

Problema 275. Prueba que si K es un cuerpo, son equivalentes:
i) Existe una hipersuperficie VK (f ) que no posee puntos K−racionales (i.e. que VK (f ) ∩
K n = ∅).
ii) K no es algebraicamente cerrado.
Problema 276. Consideremos X un conjunto no vacı́o, R = K un cuerpo y A[X] ⊆ K X una
K−álgebra de funciones definidas sobre X. Supongamos que A[X] es noetheriano. Pruébese
que si el cuerpo K no es algebraicamente cerrado, entonces toda variedad A[X]−definible es
una hiper-superficie en el sentido del ı́tem i) de la Definición 89.
Problema 277. Verifica lo que se afirma en la Proposición 7.3.9.
Problema 278. Sea X un conjunto no vacı́o, R un dominio de integraidad, A[X] ⊆ RX una
R−álgebra de funciones sobre X. Supongamos que A[X] es noetheriano. Elabora una propuesta
de enunciados similares a las propiedades i) y ii) de la Proposición 7.3.16 para variedades
A[X]−definibles. Concluye que, si A[X] es noetheriano, toda variedad A[X]−definible admite
descomposción única irredudante como unión finita de variedades A[X]−definibles irreducibles
(i.e. se verifica para el caso general un resultado similar a la Proposición 7.3.17).
Problema 279. Enuncia una condición de cadena ascendente numerable para abiertos de un
espacio topológico. Prueba que los abiertos K−definible de la topologı́a de Zariski de An (K)
satisfacen esa condición de cadena ascendente.
Problema 280. Sea K un cuerpo y sea K su clausura algebraica. Sea x = (x1 , . . . , xn ) ∈
An (K). Sea K(x1 , . . . , xn ) el menor subcuerpo de K qu contiene a K a los elementos {x1 , . . . , xn }.
Pruébese:
i) Para cada i, 1 ≤ i ≤ r, existe fi ∈ K[T ] un polinomio univariado tal que
xi f (xi ) = 1.
ii) Se tiene la siguiente igualdad
K(x1 , . . . , xn ) = {f (x1 , . . . , xn ) : f ∈ K[X1 , . . . , Xn ].
iii) Analiza qué sucede si no todas las coordenadas de x son algebraicas sobre K.
Problema 281. Sea R un dominio de integridad, X 6= ∅ un conjunto no vacı́o, A[X] ⊆
RX una R−álgebra que sea, además, noetheriano como anillo. Prueba que las variedades
A[X]−definibles en X y los ideales de A[X] asociados a ellas verifican propiedades análogas
a las descritas en la Proposición 7.3.19.Dicho de otra manera, es la condición noetheriana la
clave de esa Proposición.
Problema 282 (Espacio topológico noetheriano). Admitiendo el Axioma de lección De-
pendiente, pruébese que para un espacio topológico (X, T ) las siguiente propiedades son equiv-
alentes:
i) (X, T ) verifica la condición de cadena descendente numerable para cerrados, es decir,
dada una cadena descendente de cerrados de (X, T ):
V0 ⊇ V1 ⊇ V2 ⊇ · · · ⊇ Vn ⊇ · · · ,
existe n0 ∈ N tal que Vn = Vn0 para todo n ≥ n0 .
ii)
iii) (X, T ) verifica la condición de cadena ascendente numerable para abiertos, es decir,
dada una cadena ascendente numerable de abiertos de (X, T ):
A0 ⊆ A1 ⊆ A2 ⊆ · · · ⊆ An ⊆ · · · ,
existe n0 ∈ N tal que An = An0 para todo n ≥ n0 .
iv) Toda familia no vacı́a de cerrados de (X, T ) posee elemento minimal.
v) Toda familia no vacı́a de abiertos de (X, T ) posee elemento maximal.
vi) Todo abierto de (X, T ) es quasi-compacto.
Los espacios topológicos (X, T ) que posee una, luego todas, las propiedades equivalentes ante-
riores, se denominan espacios topológidos noetherianos. Obsérvese que todos los ejemplos de
topologı́as de Zariski anteriores son espacios topológicos noetherianos.
Problema 283 (Existencia de descomposición en irreducibles). Sea (X, T ) un espacio

topológico. Un cerrado C ⊆ X se dice reducible si existen W1 , W2 ⊆ X dos cerrados tales que:
[
C := W1 W2 , Wi ( C, W2 ( C.
Un cerrado se dice irreducible si no es reducible. Pruébese que en un espacio topológico noethe-
riano todo cerrado es unión finita de irreducibles. Conclúyase que para cada cerrado V ⊆ X,
existe una descomposición minimal irredundante como unión finita de cerrados irreducibles y
que esta descomposición minimal es única salvo permutación. A estos irreducibles que aparecen
en la descomposición minimal de un cerrado V de un espacio topológico noetheriano (X, T ) se
les denomina componentes irreducibles de V .
Problema 284. Estudia la veracidad de la siguiente propiedad:
Existe una biyección entre los conos en Kn+1 con respecto a escalares en K que son variedades
algebraicas K−definibles y las variedades algebraicas K−definibles en Pn (K). ¿El cardinal del
cuerpo K juega algún papel?.
Problema 285. Prueba la Proposición 7.4.10 precedente.
Problema 290. Prueba la siguiente propiedad de los abiertos en variedades irreducibles:
Sea U ∈ An (K) un abierto Zariski y sea V ⊆ An (K) ua variedad algebraica irreducible, ambos
K−definibles. Supongamos que U ∩ V 6= ∅. Prueba que U ∩ V es denso en V para la tologı́a de
Zariski de los K−definibles, esto es, prueba que
z
U ∩ V = V.
Problema 291. Prueba el mismo resultado anterior para variedades algebraicas proyectivas
K−definibles u abiertos Zariski en ¶n (K). Calcula la clausura Zariski de las imágenes del
espacio afı́n An (K) mediante las distintas indetificaciones descritas en el Capı́tulo. Es decir,
z
calcula ϕ0 (An (K)) en ¶n (K).
CAPı́TULO 8
Una Prueba Elemental de Nullstellensatz de Hilbert.

(...el vacı́o...inútil y perfecto.)
Cuando ya no nos queda nada,

el vacı́o de no quedar podrı́a ser al cabo
inútil y perfecto.
Joé Ángel Valente, 1979.
381
382 8. NULLSTELLENSATZ
Índice
8.1. Introducción. 382
8.1.1. Unas palabras sobre la Conjetura de Cook (P 6= NP). 384
8.2. Una demostración elemental del Nullstellensatz de Hilbert: Parte
I 386
especialización de la resultante 386
8.2.2. La prueba de la Parte I del Nullstellensazt de Hilbert-Kronecker 391
8.3. Un cambio de coordenadas útil 391
8.4. Tests de (no) nulidad para polinomios. 393
8.4.1. El Test de Schwartz-Zippel-DeMillo-Lipton. 395
8.4.2. Cuestores (Opcional, resumen de sólo lectura) 397
8.4.3. Witness Theorem. 397
8.4.4. Tests de (no) nulidad para números enteros dados por esquemas de
evaluación. 399
8.5. Una demostración elemental del Nullstellensatz de Hilbert: Parte
II 401
8.5.1. Nullstellensatz de Hilbert-Kronecker: Parte II 401
8.5.2. Nullstellensatz de Hilbert: Cuerpos finitos 402
8.5.2.1. Un recordatorio sobre Cuerpos Finitos. 403
8.5.3. Nullstellensatz: Identidad de Bézout 404
8.5.4. Nullstellensatz: Maximales 404
8.5.5. Nullstellensatz: Rabinowitsch y el radical de un ideal 406
8.5.6. Nullstellensatz e ideales primos. 408
8.5.7. Nullstellensatz y Geometrı́a Algebraica en Pn (K) 408
existenciales (sólo enunciados). 410
8.6. Nullstellensatz y equivalencia natural: El lenguaje de las categorı́as 414
8.6.1. El lenguaje de las categorı́as. 414
8.6.2. Categorı́as 414
8.6.3. Functores y equivalencias naturales 416
8.6.4. La categorı́a de las variedades algebraicas afines y los morfimos regulares. 418
8.6.5. La Categorı́a de las K−álgebras reducidas finitamente generadas. 419
8.6.6. Nullstellensatz como Equivalencia Natural 421
8.7. Variaciones del Nullstellensatz en otros contextos (Cultura
General) 421
Stone- 421
8.7.2. Variación de un segundo tema clásico: El Lema de Urysohn y el Teorema
de Extensión de Tietze. 422
8.7.3. Variación de un tercer tema clásico: Extensión de funciones en Variedades
Diferenciables 422
8.8. Ejericios y Problemas sobre el Nullstellensatz 423
8.8.1. La topologı́a de Zariski en el espectro de un anillo. 424
8.9. Meta-matemática: La Teorı́a de Primer Orden sobre los Complejos
admite Eliminación de Cuantificadores (Opcional, no se imparte
en esta forma). 426
8.9.1. Teorı́a de Primer Orden sobre cuerpos algebraicamente cerrados 426
8.1. Introducción.
El Nullstellensatz (o Teorema de los Ceros) es el punto de partida de la algebrización de la Geo-
metrı́a de los conjuntos definidos implı́citamente y, muy especialmente, de las conexiones entre el
Álgebra Conmutativa y la Geometrı́a Algebraica. El resultado tiene dos padres antagónicos en el
final del siglo XIX : D. Hilbert y L. Kronecker. El primero en observar un Nullstellensatz fue E.
Netto en 1885 (cf. [Netto, 1885]), quien probó una presentación del resultado, introduciendo
el radical, “ à la Rabinowitsch” ([Rainich, 1929]), aunque sólo para curvas. Este resultado
de Netto disparó la prueba posterior del Nullstellensatz general, que puede encontrarse en el
8.1. INTRODUCCIÓN. 383
trabajo de D. Hilbert (cf. el famoso [Hilbert, 1890]). Antes de ellos, en 1882, L. Kronecker
(cf [Kronecker, 1882]) demuestra un resultado similar, aunque en un contexto y con una
interpretación distintas que hacen más difı́cil identificarlo. Aquı́ nos conformaremos con dar
una demostración que minimiza los requisitos de Álgebra Conmutativa para poder seguirla.
La prueba que mostramos tiene dos bases sencillas de enunciar:
i) Que la resultante se especializa bien cuando uno de los polinomios involucrados es
mónico (cf. la Sección 3.6 y la Subsección 4.7.3).
ii) Que si K es un cuerpo con muchos elementos (por ejemplo, un cuerpo infinito) y si
f ∈ K[X1 , . . . , Xn ] es un polinomio no nulo, existe un cambio lineal de coordenadas
en el espacio ambiente que transforma nuestro polinomio en un polinomio mónico.
Para la propiedad ii) nos conformaremos con demostrar el Test de Schwartz-Zippel-DeMillo-
Lipton, aunque brevemente discutiremos otros métodos más sofisticados, y de mayor significado.
Haremos una sucinta revisión con la sola intención de ofrecer al lector la posibilidad de am-
pliar conocimientos sobre el tema. A ellos dedicaremos las secciones 8.3 y 8.4. Más adelante,
cuando dispongamos de las herramientas matemáticas requeridas, haremos una discusión más
promenorizada con pruebas. El lector puede también acudir a [Pardo, 95] para entender más
el contexto.
Uno de los problemas clásicos del uso de la resultante en la formulación de Sylvester (i.e. tal
y como se vió en la Sección 3.6) es que no es estable por especialización en el caso general.
De ahı́ que el tratamiento de la proyección de conjuntos dados como soluciones de polinomios
multivariados no se reduzca de modo inmediato al caso univariado y al uso de la matriz de
Sylvester (en palabras más técnicas, la proyección de un algebriaco no siempre es algebraico, ni
siquiera en el caso de “olvidar” sólo una coordenada). Pero la resultante sı́ se comporta bien bajo
especialización cuando uno de los polinomios involucrados es mónico. Este resultado es un mic-
mac pseudo-combinatorio, usando la noción original de Sylvester, pero es casi evidente desde C.
Jordan. El conocimiento de la forma canónica de Jordan no sólo es útil para entender ecuaciones
diferenciales homogéneas con coeficientes constantes (cf. Sección 5.4) sino que también permite
interpretar la resultante de modo muy conveniente cuando uno de los polinomios involucrados
es mónico:
ResX (f, g) := det (g(C(f ))) ∈ R,
donde f ∈ R[X] es un polinomio mónico, C(f ) es la compañera de f y f, g ∈ R[X]. Es la
presentación hecha en la Subsección 4.7.3. Por eso dedicamos un tiempo importante a recordar
esta forma de ver la resultante y a demostrar su estabilidad por especialización en la Subsección
8.2.1.
Armados con esas herramientas, una vez probado que la resultante está en la contracción
del ideal, observamos que está muy relacionada con la proyección de la intersección de hiper-
superficies (cf. Subsección 7.3.4.1). Con esto, el Nullstellensatz se vuelve inmediato: se trata de
un mero argumento inductivo que combina i), ii) y las propiedades de la resultante univariada.
Esta es la forma de la revisión en [Arr, 2006] y también la forma clásica del pensamiento
de L. Kronecker en [Kronecker, 1882], aunque no tanto la forma original de D. Hilbert. De
hecho, nuestra aproximación simplemente usa implı́citamente la Normalización de Noether (cf.
[Noether, 1926]) y las extensiones enteras de anillos sin explictar ninguna de las nociones.
Una vez probado el Nullstellensatz nos queda la tarea de dar versiones equivalentes del mismo
cuando K es un cuerpo algebraicamente cerrado: la identificación entre el espectro maximal
de K[X1 , . . . , Xn ] y los puntos del espacio afı́n An (K) (en Subsección 8.5.4), la identificación
entre ideales radicales y conjuntos algebraicos afines (el famoso “truco” de Rabonowitsch en la
Subsección 8.5.5), la identificación completa entre variedades algebraicas irreducibles e ideales
primos en K[X1 , . . . , Xn ] o la equivalencia natural entre las K−álgebras reducidas finitamente
generadas (i.e. sin elementos nilpotentes) y la categorı́a de conjuntos algebraicos y morfismos
regulares (cf. Sección 8.6).
La Sección 8.9 está dedicada a resumir cómo el Nullstellensatz se relaciona con la eliminación
de bloques de cuantificadores existenciales (∃) y tiene un estilo más cultural que preciso. En
el mismo tono cultural se escribe la Sección 8.7, donde se muestra, muy sucintamente, cómo
el Nullstellensatz influye el estudio de otros anillos. Destacamos el Teorema de Banach-Stone-
Čech-Gel’fand-Kolmogorov (cf. Teorema 8.7.1) que afirma que si C (X) es el anillo de funciones
continuas a valores reales sobre un espacio topológico compacto X, entonces X es homeomorfo al

espectro maximal MaxSpec(C (X)) con la toplogı́a de Zariski, exactamente como sucede entre
Kn y MaxSpec(K[X1 , . . . , Xn ]), cuando K es un cuerpo algebraicamente cerrado. También
dejamos entrever cómo el Nullstellensatz influye en el caso de los anillos C ∞ (M ), cuando M es
una variedad diferenciable paracompacta, en las Subsecciones 8.7.2 y 8.7.3.
La pregunta que nos preguntamos en este Capı́tulo es la siguiente:
Problema Clásico 8.1.1 (Eliminar un bloque de cuantificadores existenciales). Sea
K un cuerpo, K su clausura algebraica, y sean dados f1 , . . . , fs ∈ K[X1 , . . . , Xn ]. Hállese una
expresión sintáctica sin cuantificadores (si existiera) que sea equivalente a la siguiente propiedad:
∃x1 ∈ K, ∃x2 ∈ K, . . . , ∃xn ∈ K f1 (x1 , . . . , xn ) = · · · = f (x1 , . . . , xn ) = 0.
La fórmula cuantificada también se puede resumir, en términos de nuestro lenguaje de varieda-

des, del modo siguiente:
Problema Clásico 8.1.2 (Decidir la vacuidad de una variedad). Sea K un cuerpo,
K su clausura algebraica, y sea a ⊆ K[X1 , . . . , Xn ], un ideal dado por una familia finita de
generadores a = (f1 , . . . , fs ). Hallar una expresión sintáctica sin cuantificadores (si existiera)
que sea equivalente a la siguiente propiedad:
VA (a) 6= ∅.
Ya habı́amos aproximado livianamente el asunto de eliminar bloques de cuantificadores existen-

ciales cuando hicimos una primera observación sobre las proyecciones de variedades algebraicas
en la Proposición 7.3.21. En aquél lugar consideramos la siguiente situación:
Con las mismas notaciones para K y K, sea π : An+m (K) −→ An (K) la proyección que
“olvida” las m últimas coordenadas. Sea V ⊆ An+m (K) una variedad algebraica K−definible.
Como en los ejemplos anteriores, podemos suponer, gracias al Basissatz, que V es dado por
un sistema de ecuaciones polinomiales finito. Es decir, suponemos que existen f1 , . . . , fs ∈
K[X1 , . . . , Xn , Y1 , . . . , Ym ] tales que:
V := VA (f1 , . . . , fs ).
En la Proposición 7.3.21 nos preguntábamos por el aspecto de la proyección π(V ) ⊆ An (K)
y analizábamos, con un argumento muy elemental, qué aspecto tendrı́a su clausura Zariski
z
π(V ) ⊆ An (K). Por ahora, sólo quiero insistir en la formulación sintáctica del acto de proyectar
que, en el sentido precedente, consiste en eliminar un bloque de cuantificadores existenciales.
Es obvio verificar esta idea porque:
π(V ) := {x ∈ An (K) : ∃y1 ∈ K, . . . , ∃ym ∈ K, fi (x, y1 , . . . , ym ) = 0, 1 ≤ i ≤ s}.
En este sentido, proyectar también remite a los dos problemas precedentes y ası́ fue interpre-
tado, incluso, por el propio D. Hilbert cuando pide a su alumna G. Hermann que trabaje el
Nullstellensatz Efectivo (cf. [Hermann, 1926]).
En el fondo, todo lo que se demuestra (y muestra) en el Capı́tulo subyace la esencia misma del
Nullstellensatz. Los objetos de la Geometrı́a dados por ecuaciones implı́citas, son las interpreta-
ciones semánticas (significado) de la ecuación que los describen. Por su parte, las ecuaciones,
especialmente en el caso polinomial, son meros objetos sintácticos que se pueden manipular,
incluso desconociendo su componente semática. El Nullstellensatz establece un camino, una
equivalencia natural, para pasar del universo sintáctico al universo semántico y recı́procamente,
lo que lo hace una clave esencial en el pensamiento matemático tras K. Gödel y A. Tarski. Pero
eso será otra historia.
8.1.1. Unas palabras sobre la Conjetura de Cook (P 6= NP).

Uno de los ejemplos más claros en los que el Nullstellensatz se observa como un medio para
trazar el paso desde la sintaxis a la semántica es el Problema del Milenio, uno de los 6 aún
abiertos, conocido como la Conjetura de Cook. Por la relevancia que la comunidad matemática
ha conferido al problema, merece la pena destacarlo aquı́. No podemos hacer una presentación
completa dado que necesitarı́amos una introducción cuidadosa a los modelos de computación
y, muy especialmente, a la obra de A.M. Turing. En su famoso trabajo [?], el autor define
un modelo abstracto de “máquina“ que resulta equivalente al modelo de función recursiva de
8.1. INTRODUCCIÓN. 385
K. Gödel ([Gödel, 31], [Gödel, 65]) (y al λ−calculus de A. Church en [Church, 36]). Lo

que persiguen estos autores en el primer tercio del siglo XX (sin olvidar al menos reconocido
E. Post en [Post, 36]) es una definición del concepto de algoritmo. Este ha sido un concepto
manoseado y manipulado sin definición por los matemáticos a partir de la traducción al latı́ de
la obra del matemático uzbeko Muhammad ibn Mūsā al-Khwārizmı̄: [al-Khwārizmı̄, 820]1.
La idea inicial de estos autores era probar la existencia de problemas que no admiten resolución
por medidos algorı́tmicos (indecidibilidad ).
Al mismo tiempo, y de modo casi inconsciente, la noción de algoritmo inspiró a varios ingenieros
electrónicos que crearon los primeros ordenadores digitales (entre otros, el secreto Colossus, que
se construyó bajo la dirección del propio A. Turing en Bletchley Park). Con el tiempo, el modelo
de Turing se convierte en el modelo estándard sobre el que se construyen las arquitecturas
de los ordenadores digitales, los lenguajes de programación y, en suma, toda la revolución
digital que incluye, entre otros, la telecomunicación digital. Aunque el modelo original de listas
(reflejado, por ejemplo, en el lenguaje Lisp) se ha ido refinando estructuralmente con diversas
arquitecturas de ordenadores, el modelo subyace a todo ordenador digital y, a partir de la
propuesta de Cobham y Edmonds, se convierte en el modelo (o patrón de medida) desde el que
se mide el tiempo de ejecución de un programa (independientemente de la máquina/ordenador
concreto que lo ejecuta). Si de medir el tiempo de un algoritmo/programa/porcedimiento se
trata, hay algoritmos y problemas cuya ejecución requiere una cantidad de tiempo inasumible.
Hay otros que se ejecutan en una cantidad de tiempo razonable: serán los problemas tratables y
el tiempo estará controlado por una función polinomial en el tamaño de representación del input
(los datos dados al programa a fin de que ejecute sus instrucciones sobre ellos). Usualmente, la
clase de problemas tratables suele designarse mediante la clase P.
En su trabajo [Cook, 1971], S. Cook crea una profunda alteración en el pensamiento de la
clasificación de los problemas por su tiempo de ejecución. Su principal contribución consiste en
establecer una teorı́a de reducción de unos problemas a otros, que le permite distinguir ciertos
problemas como problemas que condensan en sı́ mismos toda la Frontera de lo Intratable. Él
inicia este estudio mostrando ejemplos de ese tipo de problemas (como el que hoy conocemos
como el problema SAT y variantes). En principio, [Cook, 1971] no fue considerado como una
gran contribución cientı́fica. Cook suele contar que su tesis, defendida en Harvard, no impresionó
a los colegas y tuvo que ir a buscar empleo a Canadá (Universidad de Toronto), acabando por
tomar la cuidadanı́a canadiense. Sin embargo, al poco tiempo, aparecen autores como R. Karp
([Krp, 1972]) que añade una veintena de problemas adicionales a la lista de Cook. Karp
introduce la notación NP para esa Frontera de lo Intratable y la terminologı́a Problemas NP-
completos para referirse a esos problemas que condensan en sı́ mismos toda la frontera. No
pasará mucho tiempo hasta que M.R. Garey, D.S. Johnson publiquen en [GaJo, 1979] una
lista con más de 300 problemas NP-completos provenientes de los ámbitos más diversos.
Los problemas NP-completos son fáciles de enunciar y tiene formas diversas. Aquı́ hemos
elegido uno de ellos, simplemente por mostrar el tipo de problemas de los que se trata:
Problema Clásico 8.1.3 (3COLOR). Sea dado un grafo finito (no necesiariamente orien-
tado) G := ([n], E), donde [n] = {1, . . . , n} es un conjunto de vértices y E ⊆ 2[n] es un conjunto
de aristas dadas como subconjuntos X ⊆ [n] de cardinal 2. Sean dados tres colores {A, R, N }.
Decidir si el grado G se puede colorear de tal modo que dos vértices adyacentes (i.e. vértices
con una arista que los une) no tengan el mismo color.
El problema 3COLOR es uno de los muchos cientos de problemas NP−completos.
La primera consideración que hacemos es que los tres colores son mero artificio. Bien podemos
sustituir los tres colores por las tres raı́ces en C de la ecuación X 3 − 1. Es decir supongamos
que los tres colores son
2πi 4πi
(8.1.1) {1, e 3 ,e 3 },
2
o si se prefiere {1, ω, ω } en el anillo de los enteros de Einsenstein (cf. Ejemplo 1.4.19). Intro-
duzcamos ahora una serie de variables {X1 , . . . , Xn }, tantas variables como nodos V = [n] del
1La obra se publica en Bagdad en torno al año 820, y llegaré al atrasado mundo occidental en el siglo XI con
el tı́tulo “Liber Algebrae et Almucabola”. Se trata de una compilación de los algoritmos de la matemática clásica
(griega, fundamentalmente) con contribuciones relativas a la resolución de ecuaciones polinomiales univariadas.
Por eso se considera el origen del Álgebra. Se deformará el nombre del autor, dando lugar al término algoritmo.
grafo G del Problema recién enunciado. Introduzcamos una serie de n polinomios f1 , . . . , fn ∈

Q[X1 , . . . , Xn ] definidos mediante:
fi (X1 , . . . , Xn ) = Xi3 − 1.
Para cada arista {i, j} ∈ E del grado F introduzcamos una serie adicional de ](E) polinomios
gi,j := Xi2 + Xi Xj + Xj2 ∈ Q[X1 , . . . , Xn ].
Observemos la siguiente indentidad
Xi3 − Xj3 2πi 4πi
gi,j (Xi , Xj ) = = (Xi − e 3 Xj )(Xi − e 3 Xj ).
Xi − Xj
Observamos la siguiente propiedad inmediata:
Dados xi ∈ C, xj ∈ C dos raı́ces cúbicas de la unidad (i.e.x3i − 1 = 0, x3j − 1 = 0), entonces
gi,j (xi , xj ) = 0 ⇐⇒ xi 6= xj .
Ea decir, si tomamos dos raı́ces cúbicas de la unidad, el polinomio gi,j se anula en ellas si y
solamente si son distintas. Por tanto, identificando los colores con la familia descrita en la
Igualdad (8.1.1), el problema de la 3-colorabilidad de un grafo es exactamente el siguiente:
Problema Clásico 8.1.4 (3COLOR como instancia del Nullstellensatz). Dado un grafo
F := ([n], E) y dado el ideal a ⊆ Q[X1 , . . . , Xn ] generado por la familia de polinomios
{f1 , . . . , fn } ∪ {gi,j : {i, j} ∈ E},
decidir si
VA (a) = ∅.
De hecho, todos los problemas NP−completos se pueden reescribir como el problema de Sa-
tisfactibilidad de ecuaciones polinomiales sobre cuerpos finitos (cf. [Pardo, 95], por ejemplo).
Es decir, todos los problemas NP−completos son instancias particulares de la siguiente forma
del Nullstellensatz:
Problema Clásico 8.1.5 (Satisfactibilidad sobre cuerpos finitos). Sea Fq un cuerpo
finito y sea Fq su clausura algebraica. Decidir algorı́tmicamente si dados polinomios f1 , . . . , fs ∈
Fq [X1 , . . . , Xn ] se verifica:
∃x1 ∈ Fq , . . . , ∃x1 ∈ Fq , f1 (x1 , . . . , xn ) = · · · = fs (x1 , . . . , xn ) = 0, xq1 − x1 = · · · = xqn − xn = 0.
Fijado el cuerpo Fq , este problema es también NP−completo y condensa en sı́ mismo toda la
Frontera de lo Intratable.
De hecho, se puede dar una forma incluso más refinada del Nullstellensatz que recoge todos los
problemas NP−completos, aunque no es un problema en la clase NP, hasta donde se conoce
actualmente:
Problema Clásico 8.1.6 (Nullstellensatz sobre variedades cero-dimensionales). Sea
K un cuerpo primo, sea K su clausura algebraica y sean dados f1 , . . . , fs , g ∈ K[X1 , . . . , Xn ]
una lista de polinomios. Supongamos que la variedad siguiente es un conjunto finito (se dice
cero-dimensional):
VA (f1 , . . . , fs ) = {x ∈ An (K) : f1 (x) = · · · = fs (x) = 0}.
Decidir si
∃ζ ∈ VA (f1 , . . . , fs ), g(ζ) = 0.
Todos estos ejemplos muestran que el Nullstellensatz, y su desarrollo algorı́tmico eficiente,
representan 1/6 de los principales problemas de la Matemática para el siglo XXI (Mille-
nium Problems). Por tanto, esta propuesta original de Hilbert ([Hilbert, 1890]) y Kronecker
([Kronecker, 1882]) están no sólo de actualidad sino que representan un problema central en
las matemáticas actuales. En lo que sigue nos ocuparemos simplemente en aportar una de-
mostración muy elemental del Teorema de Hilbert-Kronecker y su significado en la interacción
entre Sintaxis y Semática en la Geometrı́a Algebraica.
8.2. NULLSTELLENSATZ: PARTE I 387
8.2. Una demostración elemental del Nullstellensatz de Hilbert: Parte I

Los contenidos de esta sección están inspirados en en [Arr, 2006] y también la forma clásica
del pensamiento de L. Kronecker en [Kronecker, 1882], aunque no tanto la forma original de
D. Hilbert.
especialización de la resultante.
Comenzamos con un recordatorio y un resumen de las Proposiciones 4.7.2 y 4.7.3 de las Subsec-
ciones 4.7.2 y 4.7.3. También puede ser útil recordar la relación de la forma canónica de Jordan
de un endomorfismo con la resultante, aspecto que se desarrolla en las Subsecciones 5.4.1 y
5.4.2 El lector puede acudir a estos lugares en busca de detalles sobre las demostraciones:
Proposición 8.2.1 (Recordatorio). Sea R un anillo y sea f ∈ R[X]mon un polinomio mónico
univariado en R[X]). Se tiene:
i) La R−álgebra cociente:
A := R[X]/(f ),
es un R−módulo libre de rango igual a d := degX (f ), el grado de f con respecto a la
variable X. Una base como R−módulo libre (la base monomial) viene dada por:
B := {1 + (f ), X + (f ), X 2 + (f ), . . . , X d−1 + (f )}.
ii) Para cada g ∈ R[X], un polinomio no necesariamente mónico, consideremos el en-
domorfismo siguiente (que llamaremos homotecia de multiplicación por g ∈ R[X])
:
ηg : R[X]/(f ) −→ R[X]/(f )
h + (f ) 7−→ gh + (f ),
Entonces, se tiene:
(a) La matriz de ηg en la base monomial B descrita en el ı́tem precedente es la matriz
g(C(f )), donde C(f ) es la matriz compañera de f , es decir,
−u−1 a0
 
0 0 0 ···
1 0 0 · · · −u−1 a1 
−u−1 a2 
 
0 1 0 · · ·
C(f ) = 0 0 1 · · · −u−1 a3  ∈ Md (R),
 
 
 .. .. . . . .. .
.. 
. . . 
−1
0 0 0 · · · −u ad−1
donde f = uX d + ad−1 X d−1 + · · · + a1 X + a0 .
(b) Para cada polinomio g ∈ R[X], la clase g + (f ) satisface un polinomio mónico
con coeficientes en R (ecuación de dependencia entera). De hecho, dados los
anuladores:
AnnR[T ] (ηg ) := {p ∈ R[T ] : p(ηg ) = 0 ∈ EndR (A)},
y
AnnR[T ] (g + (f )) := {p ∈ R[T ] : p(g + (f )) = 0 + (f ) ∈ R[X]/(f )},
se tiene:
AnnR[T ] (ηg ) = AnnR[T ] (g + (f )).
En particular, si χg (T ) ∈ R[T ] es el polinomio caracterı́stico del endomorfismo
ηg , definido sobre un R−módulo libre, entonces χg (g + (f )) = 0 en R[X]/(f ).
(c) El determinante ResX (f, g) := det(g(C(f ))) ∈ R está en el ideal generado por
(f, g) en R[X] (y se denomina la resultante de f y g con respecto a la variable
X). Es decir, existen h1 , h2 ∈ R[X] tales que:
ResX (f, g) = h1 f + h2 g ∈ R[X].
De hecho, tenemos que ResX (f, g) ∈ (g, f )c está en la contracción del ideal
(f, g) ⊆ R[X] al anillo R.
(d) El endomorfismo ηg es un isomorfismo de R−módulos libres si y solamente si
ResX (f, g) ∈ R× es una unidad de R. Más aún, se tiene la equivalencia entre:
• 1 ∈ (f, g),
• ResX (f, g) ∈ R× .
Demostración. La mayorı́a de las propiedades descritas estaban ya probadas en las las
Proposiciones 4.7.2 y 4.7.3. Si acaso, un pequeño inciso sobre la equivalencia entre:
• 1 ∈ (f, g),
• ResX (f, g) ∈ R× .
Es claro que si ResX (f, g) ∈ R× , entonces 1 ∈ (f, g)c ⊆ (f, g) con lo que tenemos una de las
implicaciones. En cuanto a la otra implicación, supongamos que 1 ∈ (f, g) en R[X]. Entonces,
existirán polinomios h1 , h2 ∈ R[X] tales que
1 = h1 f + h1 .g.
Por las propiedades de las homotecias, tenemos que
Id = η1 = ηh1 ◦ ηf + ηh2 ◦ ηg = ηh1 ◦ 0 + ηh2 ◦ ηg = ηh2 ◦ ηg ,
A
por lo que concluimos que ηg−1 existe y coincide con ηh2 . Por tanto, ηg es un isomorfismo de
R−módulos libres y ResX (f, g) = det(g(C(f ))) ∈ R× .
Lema 8.2.2 (Especialización de la resultante). Como en la Proposición precedente, sea R

anillo, f ∈ R[X]mon un polinomio mónico, g ∈ R[X] un polinomio cualquiera. Sea p ∈ Spec(R)
un ideal primo de R. Supongamos:
f = uX d + ad−1 X d−1 + · · · + a1 X + a0 , g = bm X m + · · · + b0 ,
donde u ∈ R× es una unidad en R. Denotemos por f y g los polinomios en R/p[X] obtenidos
tomando módulo p los coeficientes de f y g respectivamente. Es decir,
f = (u + p)X d + (ad−1 + p)X d−1 + · · · + (a1 + p))X + (a0 + p) ∈ R/p[X],
g = (bm + p))X m + · · · + (b0 + p) ∈ R/p[X].

Obsérvese que f ∈ R/p[X]mon sigue siendo un polinomio mónico porque u 6∈ p. Denotemos
por ResX (f, g) ∈ R la resultante de f y g tal y como se define en el Lema precedente. Y sea
ResX (f , g) ∈ R/p la resultante de f y g como polinomios en R/p[X]. entonces, se tiene:
ResX (f, g) + p = ResX (f , g), en R/p.

Demostración. Se trata de verificar las identidades de manera sencilla. Nótese que esta-
mos trabajando en dos módulos distintos:
• El R−módulo libre de rango d:
R[X]/(f ).
• El R/p−módulo libre de rango d:
(R/p)[X]/(f ) ∼
= R/p ⊗R R[X]/(f ),
donde ya destacamos la presencia de la extensión de escalares, aunque aún no hallamos
hablado de ello. No es inapropiado empezar a encontrar el producto tensorial ⊗R ,
aunque sólo sea como notación en un caso muy particular.
En ambos casos tenemos las matrices compañeras:
−u−1 a0
 
0 0 0 ···
−u−1 a1 
 
1 0 0 ··· α1,1 α1,2 ··· α1,d
−u−1 a2 
 
0 1 0 ··· α2,1 α2,2 ··· α2,d 
C(f ) = 0 0 1 −u−1 a3  :=  . ..  ∈ Md (R),
   
··· .. ..
   .. . . . 
 .. .. . . .. .. 
. . . . .  αd,1 αd,2 ··· αd,d
0 0 0 · · · −u−1 ad−1
y
−u−1 a0 + p
 
0 0 0 ···
1 + p 0 0 ··· −u−1 a1 + p
−u−1 a2 + p
 
 0 1 + p 0 ··· 
C(f ) =  0 −u−1 a3 + p ∈ Md (R/p),
 
 0 1+p ··· 
 .. .. .. .. .. 
 . . . . . 
−1
0 0 0 ··· −u ad−1 + p
luego
 
α1,1 + p α1,2 + p ··· α1,d + p
α2,1 + p α2,2 + p ··· α2,d + p
C(f ) =   ∈ Md (R/p).
 
.. .. .. ..
 . . . . 
αd,1 + p αd,2 + p · · · αd,d + p
Ahora, consideremos
 i  
α1,1 α1,2 ··· α1,d γ1,1 γ1,2 ··· γ1,d
m
X α2,1 α2,2 ··· α2,d  γ2,1 γ2,2 ··· γ2,d 
g(C(f )) := bi  . ..  =  .. ..  ∈ Md (R),
   
.. .. .. ..
i=
 .. . . .   . . . . 
αd,1 αd,2 ··· αd,d γd,1 γd,2 ··· γd,d
donde γi,j ∈ R se otienen mediante operaciones polinomiales (i.e. involucrando operaciones

{+, .×}) en las coordenadas αk,` (y, por tanto, de los coeficientes de f en R y u−1 ∈ R). Por
su parte
 i
α1,1 + p α1,2 + p ··· α1,d + p
m
X α2,1 + p α2,2 + p ··· α2,d + p
g(C(f )) := (bi + p)   ∈ Md (R/p),
 
.. .. .. ..
i=0
 . . . . 
αd,1 + p αd,2 + p ··· αd,d + p
Denotemos
 
δ1,1 δ1,2 ··· δ1,d
δ2,1 δ2,2 ··· δ2,d 
g(C(f )) =  . ..  ∈ Md (R/p),
 
.. ..
 .. . . . 
δd,1 δd,2 ··· δd,d
donde δi,j ∈ R/p se obtiene mediante funciones polinomiales en las coordenadas αk,` + p de
C(f ) y los coeficientes de g. Como las operaciones del anillo cociente se definen a partir de
las operaciones de cualesquiera de los representantes de la clase módulo p, podemos fácilmente
concluir que:
∀ i, j, 1 ≤ i, j ≤ d, γi,j + p = δi,j .
Seguidamente, las respectivas resultantes son determinantes, por cuanto concluimos:
 
γ1,1 γ1,2 · · · γ1,d
γ2,1 γ2,2 · · · γ2,d 
ResX (f, g) + p := det  . ..  + p ∈ R/p,
 
. .. . .
 . . . . 
γd,1 γd,2 ··· γd,d
Lo cual es equivalente a:
 
γ1,1 + p γ1,2 + p ··· γ1,d + p
γ2,1 + p γ2,2 + p ··· γ2,d + p
ResX (f, g) + p = det   ∈ R/p.
 
.. .. .. ..
 . . . . 
γd,1 + p γd,2 + p ··· γd,d + p
Luego
 
δ1,1 δ1,2 ··· δ1,d
δ2,1 δ2,2 ··· δ2,d 
ResX (f, g) + p = det  . ..  = ResX (f , g) ∈ R/p,
 
.. ..
 .. . . . 
δd,1 δd,2 ··· δd,d
como se afirma en el enunciado.
Corolario 8.2.3. Como en el resto de la sección, se K un cuerpo, K su clausura algebraica

y consideremos el anillo R := K[X1 , . . . , Xn−1 ]. Sean f ∈ K[X1 , . . . , Xn ] = R[Xn ]mon un
polinomio mónico con respecto a la variagle Xn y sea g ∈ K[X1 , . . . , Xn ] = R[Xn ] un polinomio
multivariado cualquiera. Sea ζ = (z1 , . . . , zn−1 ) ∈ An−1 (K) un punto cualquiera. Consideremos
h(X1 , . . . , Xn−1 ) := ResXn (f, g) ∈ K[X1 , . . . , Xn−1 ],
definido como en las proposiciones precedentes.
De otro lado, consideremos
fe(Xn ) := f (z1 , . . . , zn−1 , Xn ) ∈ K[Xn ]mon ,
ge(Xn ) := g(z1 , . . . , zn−1 , Xn ) ∈ K[Xn ].
Sea ResXn (f , ge) ∈ K la resultante de fe, ge ∈ K[Xn ]. Entonces,
e
ResXn (f, g)(ζ) := h(z1 , . . . , zn−1 ) = ResXn (fe, ge).

Demostración. Para empezar observemos que podemos suponer que K = K sin pérdida
de la generalidad. La razón es la siguiente:
Si f ∈ R[X]mon también se tiene f ∈ K[X1 , . . . , Xn ] y es mónico con respecto a la variable Xn .
Definiendo R e := K[X1 , . . . , Xn−1 ] claramente se tiene f ∈ R[X e n ]mon . Por supuesto, también
g ∈ R[Xn ]. Observemos, además, que si consideramos la extensión del ideal (f ) de R[Xn ] al
e
anillo R[X
e n ] sigue siendo el ideal principal generado por f , el cocciente R[X e n ]/(f )e sigue siendo
un R−módulo
e libre de rango igual a d := degXn (f ) y tenemos la misma base monomial, módulo
el ideal extendido:
B := {1 + (f )e , Xn + (f )e , . . . , X d−1 + (f )e }.
Por lo visto antes, la matriz del tensor de multiplicación por Xn en la nueva R−álgebra e y
e e
R−módulo
e (ηg
Xn : R[X
e n ]/(f ) −→ R[X
e n ]/(f ) ) sigue siendo la matriz compañera C(f ) de f .
Por tanto, sus coordenadas siguen estando en R. Ahora el tensor ηeg sigue teniendo por matriz
en la base monomial B anterior a la matriz g(C(f )) ∈ Md (R), con coordenadas en R. En
consecuencia, el determinante de esa matriz sigue siendo un elemento en R, es decir,
ResXn (f, g) = det(g(C(f ))) = h(X1 , . . . , Xn−1 ) ∈ R = K[X1 , . . . , Xn−1 ].
En otras palabras, pasando del cuerpo K a su clausura algebraica K, la resultante de f y g no
varı́a porque f, g ∈ K[X1 , . . . , Xn ] y ResXn (f, g) sigue siendo un polinomio en K[X1 , . . . , Xn−1 ]
aunque sea la resultante de f y g como elementos de K[X1 , . . . , Xn ].
Supongamos, entonces, que K = K es un cuerpo algebraicamente cerrado. Apliquemos el Lema
precedente, usando como ideal primo de R (i.e. en Spec(K[X1 , . . . , Xn−1 ])) el ideal maximal
(discutido en la Proposición 7.3.15):
mζ := IK ({ζ}) ∈ MaxSpec(K[X1 , . . . , Xn−1 ]).
Como K = K es algebraicamente cerrado, esa misma Proposición nos dice que si ζ = (z1 , . . . , zn−1 ),
entonces mζ tiene la forma siguiente:
mζ = (X1 − z1 , . . . , Xn−1 − zn−1 ) ⊆ K[X1 , . . . , Xn−1 ].
Consideremos f , g ∈ R/mζ [Xn ] = K[Xn ], tomando clases módulo mζ , que son, precisamente, los
polinomios fe, ge respectivamente definidos en el enunciado de este Corolario. Baste recordar la
Proposición 7.3.15 en la que se observa que tomar clases módulo mζ es lo mismo que evaluar en ζ
porque, al cabo, mζ es simplemente el núcleo de la función evaluación evζ : K[X1 , . . . , Xn−1 ] −→
K. Usando el lema precedente, se sigue la afirmación de modo obvio.
El siguiente Corolario pretende redondear la comprensión de la proyección (i.e. eliminación de

cuantificadores existenciales) en un caso particular, que refuerza lo descrito en la Proposición
7.3.21.
Corolario 8.2.4. Sea K un cuerpo y sea K cu clausura algebraica. Sean f, g ∈ K[X1 , . . . , Xn ]

y supongamos que f es mónico con respecto a la variable Xn . Sea π : An (K) −→ An−1 (K) la
proyección que “olvida” la coordenada n−ésima. Entonces, se tiene:
VAn−1 (K) (ResXn (f, g)) = π(VAn (K) (f, g)).
En particular, bajo estas hipótesis, π(VAn (K) (f, g)) ⊆ An−1 (K) es una variedad algebraica
K−definible.
Demostración. Sin ánimo de confundir escribamos VA para denotar variedades, dejando

que el contexto permita entender ci estamos en An (K) o en An−1 (K).
Ya hemos recordado en el ı́tem ii), (b) de la Proposición 8.2.1 precedente, que ResXn (f, g) ∈
(f, g)c = (f, g) ∩ K[X1 , . . . , Xn−1 ]. Por la Proposición 7.3.21, es claro que ResXn (f, g) se anula
en π(VA (f, g)) y π(VA (f, g)) ⊆ VA (ResXn (f, g)).
Se trata, por tanto, de probar el otro contenido. Supongamos que x = (x1 , . . . , xn−1 ) ∈ An−1 (K)
es un punto tal que ResXn (f, g)(x) = 0. Como f es mónico, el siguiente polinomio univariado
es un polinomio no nulo en K[Xn ]mon (es decir, es también mónico con respecto a la variable
Xn ):
fx := f (x1 , . . . , xn−1 , Xn ) ∈ K[Xn ]mon .
Consideremos también el polinomio gx := g(x1 , . . . , xn−1 , Xn ) ∈ K[Xn ]. Como fx es un poli-
nomio no nulo y K es algebraicamente cerrado, ha de existir ζ ∈ K tal que fx (ζ) = 0. Con-
sideremos todas las raı́ces de fx en K que, como K es algebraicamente cerrado, nos permite
descomponer fx en factores de grado 1 de la forma siguiente:
d
Y
fx := (X − ζi ),
i=1
donde d := deg(fx ) = degXn (f ) y los ceros ζi aparecen repetidos con su multiplicidad. Ahora,
por la capacidad de especialización de la resultante en K[X1 , . . . , Xn−1 ][Xn ], cuando uno de los
polinomios es mónico, tendremos que:
ResXn (fx , gx ) = ResXn (f, g)(x).
Pero, además, hemos visto en la Proposición 5.4.6 que, gracias al pensamiento de C. Jordan, la
resultante, en el caso de que uno de los polinomios sea mónico, consiste en evaluar el segundo
polinomio en los ceros de primero repetidos con su multiplicidad. Es decir,
d
Y d
Y
ResXn (fx , gx ) = gx (ζi ) = g(x, ζi ).
i=1 i=1
Por lo anterior, como ResXn (f, g)(x) = 0 concluimos que ha de existir i, 1 ≤ i ≤ d tal que
g(x, ζi ) = 0. Pero eso significa que el punto (x, ζi ) ∈ An (K) verifica
f (x, ζi ) = g(x, ζi ) = 0.
En otras palabras, (x, ζi ) ∈ VA (f, g) y, en particular, x = π(x, ζi ) ∈ π(VA (f, g)), lo que concluye
la prueba del otro contenido y del enunciado.
Observación 8.2.5. El anterior resultado, en realidad, prueba el poder de tener las variables
en posición de Noether o, dicho de otro modo, estar ante una extensión entera de anillos. Pero
ese asunto lo trataremos en detalle más adelante.
8.2.2. La prueba de la Parte I del Nullstellensazt de Hilbert-Kronecker.

Lema 8.2.6. Si K es un cuerpo y K es su clausura algebraica, para un ideal a ⊆ K[X1 ] son
equivalentes VA1 (K) (a) = ∅ y 1 ∈ a.
Demostración. Es obvio por la propia definición de clausura algebraica y no necesita de
mayores aclaraciones.
De nuevo, jugando con las proyecciones, observamos que la propiedad de tener un elemento
a ∩ K[X1 , . . . , Xn−1 ][Xn ]mon facilita determinar las proyecciones (al menos en una variable) de
los ceros afines de a:
Lema 8.2.7 (cf. [Arr, 2006]). Sea K un cuerpo, sea K su clausura algebraica. Sea n ∈ N un
entero con n > 1. Sea a ⊆ K[X1 , . . . , Xn ] un ideal propio y sea ac = a ∩ K[X1 , . . . , Xn−1 ] su
contracción. Supongamos que existe f ∈ a un polinomio mónico con respecto a la variable Xn .
Sea π : An (K) −→ An−1 (K) la proyección que “olvida” la coordenada n−ésima. Entonces, se
tiene:
i) π(VAn (K) (a)) = VAn−1 (K) (ac ),
ii) VAn (K) (a) 6= ∅ si y solamente si VAn−1 (K) (ac ) 6= ∅.
Demostración. Supongamos K = K es algebraicamente cerrado y probemos la afirmación
i). Notemos que si a es un ideal propio en K[X1 , . . . , Xn ], también su contracción ac es propio
porque no puede darse 1 ∈ ac . De nuevos escribiremos de forma simplificada VA , dejando al
lector interpretar si se trata de An (K), An−1 (K) o A( K).
z
Por la Proposición 7.3.21, sabemos que VA (ac ) = π(VA (a)) ⊃ π(VA (a).
Recı́procamente, supongamos que x ∈ VA (ac ). Ahora consideremos el siguiente conjunto de
polinomios univariados:
ax := {g(x, Xn ) : g ∈ a}.
Es obvio que ax es un ideal en K[Xn ]. Por tanto, es un ideal principal y posee un generador
hx (Xn ) := h(x, Xn ) donde h ∈ a. También tendremos un polinomio f ∈ a que es mónico con
respecto a la variable Xn . Consideremos ahora la resultante:
ResXn (f, h) ∈ ac ⊆ K[X1 , . . . , Xn−1 ].
Tenemos que ResXn (f, g)(x) = 0 y, por los mismos argumentos que en el Corolario 8.2.4 prece-
dente, existirá ζ ∈ K tal que
f (x, ζ) = 0, h(x, ζ) = 0.
Ahora sea g ∈ a tenemos que hx | gx (con las notaciones precedentes) porque gx ∈ ax . Por
tanto, gx se ha de anular en todas las raı́ces de hx , pero como hx (ζ) = 0, concluimos que
gx (ζ) = g(x, ζ) = 0 para todo g ∈ a. Por tanto, (x, ζ) ∈ VA (a) y x = π(x, ζ) ∈ π(VA (a)).
Nótese que, en los argumentos precedentes, el papel del cuerpo de coeficientes es nulo: lo único
que usamos es la existencia de raı́ces en la clausura algebraica del cuerpo de coeficientes, luego el
argumento sigue siendo válido para un ideal a en K[X1 , . . . , Xn ] siempre que VA (a) = VAn (K) (a),
VA (ac ) = VAn−1 (K) (ac ) y la proyección sea entre los respectivos espacios afines de dimensiones
n y n − 1 sobre K.
La propiedad ii) se sigue obviamente de la propiedad i) dado que un subconjunto X ⊆ An (K)
es no vacı́o si y solamente si su proyección π(X) es no vacı́a.
8.3. Un cambio de coordenadas útil

Hemos visto la utilidad de disponer de polinomios mónicos en un ideal de un anillo de poli-
nomios. Veamos cómo podemos hacer un cambio lineal de coordenadas del espacio ambiente
para lograr esa situación. Como antes, sea K un cuerpo y sea K la clausura algebraica de K.
Consideremos (t1 , . . . , tn−1 , 1) ∈ An (K). Consideremos el siguiente cambio de variables:


 Y1 = X1 − t1 Xn ,
Y2 = X2 − t2 Xn ,




(8.3.1) ..
 .
Y = Xn−1 − tn−1 Xn ,

 n−1



Yn = Xn .
8.3. UN CAMBIO DE COORDENADAS ÚTIL 393
Consideremos el isomorfismo de K−álgebras dado por este cambio de coordenadas:

ϕ : K[X1 , . . . , Xn ] −→ K[Y1 , . . . , Yn ]
(8.3.2)
f 7−→ f (Y1 + t1 Yn , . . . , Yn−1 + tn−1 Yn , Yn ).
Lema 8.3.1. Se verifican las siguientes propiedades:
i) Si a ⊆ K[X1 , . . . , Xn ] es un ideal propio, entonces ϕ(a) es un ideal propio. Y
recı́procamente.
ii) Consideremos la matriz triangular P ∈ Mn (K) dada mediante:
   
Y1 X1
 ..   .. 
 .  = P  . ,
Yn Xn
es decir, la matriz
 
1 0 ··· 0 −t1
0 1
 ··· 0 −t2 

P :=  ... .. ..
.
 
 . . 
0 0 ··· 1 −tn−1 
0 0 ··· 0 1
La matriz inversa de la matriz P es dada mediante:
 
1 0 ··· 0 t1
0
 1 ··· 0 t2 
P −1 :=  ... .. ..  .

 . . 

0 0 · · · 1 tn−1 
0 0 ··· 0 1
iii) El isomorfismo ϕ : K[X1 , . . . , Xn ] −→ K[Y1 , . . . , Yn ] de la Identidad (8.3.2) precedente
satisface:
∀f ∈ K[X1 , . . . , Xn ], ϕ(f ) = (f ◦ P −1 )(Y1 , . . . , Yn ).
iv) Consideramos el automorfismo de K−espacios vectoriales dado por P :
P : Kn −→ 
n
 K  
x1 y1 x1
 ..   ..   . 
 .  7−→  .  := P  ..  .
xn yn xn
Este isomorfismo induce un automorfismo del espacio afı́n An (K) en sı́ mismo que
satisface lo siguiente:
Para cada ideal a de K[X1 , . . . , Xn ], se tiene:
VA ((ϕ(a)) = P (VA (a)).
En particular, VA (a) 6= ∅ si y solamente si VA (ϕ(a)) 6= ∅.
Demostración. Son todos ejercicios elementales.
Observación 8.3.2 (Construcción a partir de las componentes homogéneas).

Consideremos el anillo K[X1 , . . . , Xn ] y su descomposición dada como suma directa de subes-
pacios vectoriales, determinados por los polinomios homogéneos de grado fijado (recuérdese la
Proposición 1.4.40):
K[X1 , . . . , Xn ] = ⊕n∈N Hd (X1 , . . . , Xn ).
consideremos un polinomio no nulo cualquiera f ∈ K[X1 , . . . , Xn ] \ {0}. Podemos descomponer
f en sus componentes homogéas. Es decir, podemos escribir :
f := fd (X1 , . . . , Xn ) + · · · + f0 (X1 , . . . , Xn ),
donde fi ∈ Hi (X1 , . . . , Xn ) es un polinomio homogéneo de grado i, con fd 6= 0. En particular,

tenemos X µ1
fi (X1 , . . . , Xn ) := a(i) µn
µ X1 · · · Xn ,
|µ|=i
n (i)
donde µ = (µ1 , . . . , µn ) ∈ N , |µ| = µ1 + · · · + µn ∈ N, aµ ∈ K. Supongamos que deg(f ) = d
y, por tanto, que fd 6= 0.
Sea ϕ : K[X1 , . . . , Xn ] −→ K[Y1 , . . . , Yn ] el isomorfismo de K−álgebras descrito en la Sección
precedente. Por ser ϕ, de hecho, una aplicación lineal entre K−espacios vectoriales, ϕ respe-
ta las componentes homogéneas de los polinomios y tendremos que si g = ϕ(f ) admite una
descomposición en componentes homogéneas del tipo:
g := gd (X1 , . . . , Xn ) + · · · + g0 (X1 , . . . , Xn ),
donde gi = ϕ(fi ). En otras palabras, tenemos que
gi (Y1 , . . . , Yn ) = fi (Y1 + t1 Yn , . . . , Yn−1 + tn−1 Yn , Yn ), ∀i, 0 ≤ i ≤ d.
En particular, tendremos la siguiente igualdad:
X
gi (Y1 , . . . , Yn ) := a(i)
µ (Y1 + t1 Yn )
µ1
· · · (Yn−1 + tn−1 Yn )µn−1 Ynµn .
|µ|=d
Lema 8.3.3. Sean f y g como en la Observación precedente, entonces, existe un polinomio

h ∈ K[Y1 , . . . , Yn ] tal que
g = fd (t1 , . . . , tn−1 , 1)Ynd + h,
y el grado de h con respecto a la variable Yn es menor estricto que d.
En particular, si f (t1 , . . . , tn−1 , 1) 6= 0, entonces g ∈ K[Y1 , . . . , Yn−1 ][Yn ]mon es un polinomio
mónico con respecto a la variable Yn salvo unidades en K.
Demostración. Obvio por mera reescrittura.
8.4. Tests de (no) nulidad para polinomios.

En el diseño de algoritmos que manipulan polinomios multivariados, no siempre se manejan los
polinomios como un vector de coeficientes. La mayor dificultad surge cuando se hace Geometrı́a
Algebraica Computacional (o, más clásicamente, Teorı́a de la Eliminación). Los polinomios
que son generados por la Teorı́a de la Eliminación, de manera completamente natural y por
razones semánticas, tienen un crecimiento exponencial de su grado tras la eliminación de un
bloque de cuantificadores existenciales (Nullstellensatz o Conjetura de Cook). Si el grado crece
2
exponencialmente, el número de coeficientes crece hasta cantidades del tipo dO(n ) donde n es
el número de variables y d es el grado de los polinomios de inicio (Input). Una referencia en la
que se expone esta fenomenologı́a, ası́ como algunos antecedentes sobre el tema es [Pardo, 95].
Por esa razón, en ocasiones se ha utlizado con éxito la codificación (representación, forma de
escribir) de polinomios no ya como sucesiones (es decir, a partir de la definición de polinomio,
dados como una lista de sus coeficientes en R[X1 , . . . , Xn ]), sino mediante programas que los
evalúan. En este sentido se hace un cierto salto incompleto de la sintaxis a la semántica
porque nos acercamos más a su carácter de funciones polinomiales. Estos programas pueden
ser mucho más cortos (tamaño de su código) que la mera lista de sus coeficientes (véase, por
ejemplo, la secuencia de trabajos del concepto TERA-Kronecker, desarrollados en los años
90 en [GHMP, 97a], [GHHMMP, 97b], [HMPS, 2000]). No entraremos por ahora en la
definición de esos programas conocidos usualmente como esquemas de evaluación y, en tiempos
más recientes, simplemente como redes neuronales con functión de activación polinomial.
Cuando dos polinomios f, g son dados por programas (de cualquier tipo) es elemental diseñar
programas que evaluan los polinomios f + g, f − g, f g. No queda tan claro, sin embargo, si un
polinomio f dado por un programa es o no el polinomio nulo. Escamoteadas entre decenas de
operaciones del programa puede estar oculto el hecho de que, a partir de un cierto momento,
sólo estamos ante ininteligibles operaciones del tipo 0 + 0, f − f o 0g. Obviamente, un proceso
de interpolación (i.e. cálculo de coeficientes) nos sacarı́a de dudas. Pero, incluso si interpolar
fuera simple computacionalmente, la mera exposición de la lista de coeficientes nos lleva de
nuevo a escribir el polinomio en forma “densa” (i.e. por sus coeficientes) y eso es muy caro en
8.4. TESTS DE (NO) NULIDAD PARA POLINOMIOS. 395
términos computacionales cuando se trata de polinomios de Teorı́a de Eliminación (como los

citados en el párrafo precedente).
En otras palabras, la alternativa natural a evitar la codificación densa de polinomios pasa por:
Desarrollar Tests de Nulidad para Esquemas de evaluación. Se trata de algoritmos
que evalúan los códigos dados (los programas que definen a esas funciones polinomiales) en un
número finito ( a ser posible en un número pequeño) de puntos. Con los valores de esas “pocas”
evaluaciones, tratamos de decidir si ambos esquemas de evaluación evalúan la misma función.
En esta Sección nos ocuparemos de estos Tests de Nulidad que pertenecen a tres tipos funda-
mentalmente :
i) Los Tests de Schwartz-Zippel-DeMillo-Lipton. Se trata de seleccionar un conjunto
fijo y, para cada polinomio, hay muchos puntos en los que un polinomio no nulo de
cierto grado no se anula. El conjunto de puntos de test es excesivamente grande: de
tamaño (2d + 1)n , donde d es una cota del grado del polinomio no nulo a testar y n
es el número de variables involucradas. Es por tanto, un test que necesita un número
exponencial de evaluaciones para para garantizar con seguridad (determinı́sticamente)
que nuestro polinomio es no nulo. Pero, afortuadamente, la probabilidad de dar con
un punto donde no se anula el polinomio dado es alta, con lo que se convierte en un
test probabilista que asume un conjunto. Fueron introducidos en los trabajos de J.T.
Schwartz en [Schw, 1980], por R. Zippel en [Zip, 1990]y por R.A. DeMillo y R.J.
Lipton en [DeMLi, 1978], por lo que, en ocasiones, se suele denominar el Test de
Schwartz-Zippel-DeMillo-Lipton.
ii) Los Cuestores o Correct Test Sequences. Se trata de un principio opuesto al descrito
en el caso precedente. Aquı́, se buscan conjuntos cortos garantistas y válidos para
clases de polinomio. Es decir, se considera un subconjunto C ⊆ K[X1 , . . . , Xn ] de
polinomios que satisface alguna propiedad geométrica en un espacio afı́n AL (K) de
dimensiń finita sobre K. Se busca una lista “pequeña” Q = {x1 , . . . , xM } ⊆ An (K)
de puntos que sea garantista para polinomios en el conjunto C dado. Es decir, que se
satisfaga:
∀f ∈ C, f (x1 ) = · · · = f (xM ) = 0 =⇒ f ≡ 0.
Tales conjuntos Q se denominan conjuntos cuestores o correct test sequences. En

términos de Aprendizaje Computacional se denominan universal teaching sequences.
Lo relevante del asunto es que existen “muchos” conjuntos de longitud M lineal en
la dimensión de C y que, además, son muy densos en conjuntos del estilo del test
precedente. Desafortunadamente, no existe un método determinista para detectar
tales conjuntos cuestores. La probabilidad se traslada a usar test probabilı́sticos para
hallar conjuntos cuestores para C y, una vez hallados, usarlos sistemáticamente para
cualquier polinomio en la clase C. Fue introducido en el trabajo de J. Heintz y C.P.
Schnorr (cf. [HeSc, 82]) y analizados en profundidad en [?]. La versión que aquı́ se
incluye es la versión, bastante refinada, de [KrPa, 1996]. Sin embargo, no disponemos
aún de las herramientas matemáticas requeridas para abordarla con detalle.
iii) Witness Theorem. Se trata de observar que, en ocasiones, uno puede encontrar con-
juntos cuestores formados por un sólo punto donde un polinomio no nulo no se anula.
Esto ya aparece implı́citamente ya en la obra de L. Kronecker y se conoce como Es-
quema de Kronecker. En el caso de polinomios con coeficientes en Z el resultado
aparece recogido, y atribuido a Kronecker, en el trabajo [HeSc, 82]. Posteriormente,
S. Smale en [BCSS, 1996] redescubre el esquema de Kronecker para polinomios
con coeficientes en un cuerpo de números y lo denomina “Witness Theorem” (véase
también [BCSS, 1998]). Sin embargo, las estimaciones de Smale y sus colaboradores
eran muy groseras. Las estimaciones se mejoran en el trabajo [CHMP, 2001].
Haremos la demostración del Test de Schwartz-Zippel-DeMillo-Lipton y dejaremos los otros re-
sultados, mucho más técnicos, para el momento en que se disponga de herramientas matemáticas
suficientes para poder interpretarlos y trabajarlos. No obstante, nos parecı́a que limitarse al
Test de Schwartz-Zippel-DeMillo-Lipton era una manera de borrar el amplio contexto del prob-
lema. Por eso es opcional (y sólo como guı́a de posibles lecturas futuras del actual lector) el
material correspondiente a los Cuestores y al Witness Theorem. Adicionalmente, por su sen-

cillez, hemos incluido una idelogı́a similar para los Tests de Nulidad de Números dados por
programas siguiendo el trabajo de [IM, 1983], que también se presenta como lectura opcional.
8.4.1. El Test de Schwartz-Zippel-DeMillo-Lipton. La clave del Test de Schwartz-

Zippel-DeMillo-Lipton es el siguiente enunciado :
Lema 8.4.1. Sea f ∈ K[X1 , . . . , Xn ] un polinomio no nulo. Definamos recursivamente los
siguientes polinomios :
• Para i = 1, consideremos:
Q1 := f ∈ K[X1 , . . . , Xn ], d1 := degX1 (Q1 ),
y definamos Q2 ∈ K[X2 , . . . , Xn ] como el coeficiente de X1d1 en Q1 .
• Para 2 ≤ i ≤ n − 1 definamos recursivamente :
di := degXi Qi ,
y sea Qi+1 ∈ K[Xi+1 , . . . , Xn ] el coeficiente de Xidi in Qi .
• Para i = n, definamos dn := degXn (Qn ), donde Qn ∈ K[Xn ].
Consideremos para cada i, 1 ≤ i ≤ n, Q
un subconjunto finito Ii ⊆ K.
n
Entonces, el número de ceros de f in i=1 Ii := I1 × · · · × In verifica:
n
!
Y d1 dn
] VA (f ) ∩ Ii ≤ ](I1 × · · · × In ) + ··· + .
i=1
](I1 ) ](In )
Demostración. La prueba se sigue por inducción en n. En el caso n = 1 es obvio que un

polinomio univariado de grado d1 con coeficientes en un cuerpo no posee más de d1 ceros en el
cuerpo. La razón última es la interpolación de polinomios que se discute en los Problemas 174
y 175 y, al cabo, el hecho de que K[X1 ] es un dominio de factorización única.
Consideremos ahora el caso n > 1. Consideremos el polinomio Q2 ∈ K[X2 , . . . , Xn ] que es
el coeficiente director de f con respecto a la variable X1 . Por construcción, la secuencia de
polinomios Q2 , . . . , Qn y de grados d2 , . . . , dn es la misma comenzando por Q2 o comenzando
por f . Por tanto, podemos aplicar Qn la hipótesis inductiva a Q2 y tenemos que el número de
elementos de x = (x2 , . . . , xn ) ∈ i=2 Ii en los que Q2 no se anula es de cardinal mayor que:
n n n
! n n
!
Y Y X di Y X di
](Ii ) − ](Ii ) = ](Ii ) 1 − .
i=2 i=2 i=2
](Ii ) i=2 i=2
](Ii )
Qn
Para cada uno de los x = (x2 , . . . , xn ) ∈ i=2 Ii en los que Q2 (x) 6= 0, el polinomio f toma la
forma:
f (X1 , x2 , . . . , xn ) = Q2 (x)Y1d1 + h(X1 ),
donde h es un polinomio de grado a lo sumo d1 − 1. En consecuencia, este polinomio univariado
no se puede anular en, al menos, ](I1 ) − d1 elementos de I1 . Y esto para cada x con esas
condiciones.
Qn Por tanto, f no se anula en, al menos, el siguiente número de elementos de
i=1 Ii : !
n n
Y X di
P := (](I1 ) − d1 ) ](Ii ) 1 − .
i=2 i=2
](Ii )
Desarrollando este producto obtenemos
n n
! n n
!
Y X di Y X di
P := ](I1 ) ](Ii ) 1 − − d1 ](Ii ) 1 − .
i=2 i=2
](I i) i=2 i=2
](I i)
Luego
n n n
! n n n
!
Y Y X di d1 Y d1 Y X di
P := ](Ii ) − ](Ii ) − ](Ii ) + ](Ii ) .
i=1 i=1 i=2
](I i) ](I1 ) i=1 ](I1 ) i=1 i=2
](I i)
Por tanto,
n n
! n n n
!
Y X di d1 Y Y X di
P ≥ ](Ii ) 1 − − ](Ii ) = ](Ii ) 1 − ,
i=1 i=2
](Ii ) ](I1 ) i=1 i=1 i=1
](Ii )
y se sigue el enunciado previsto.
Tenemos la siguiente aplicación inmediata:
Corolario 8.4.2. Con las notaciones previas, sea I un subconjunto finito de K and F ∈
K[X1 , . . . , Xn ] un polinomio de grado d. La probabilidad de que una elección aletaoria de un
punto x ∈ I n sea un cero de F es, a lo sumo :
d
](I)
En particular, si ](I) ≥ 2d + 1,la probabilidad de que una elección aletoria en I n de un valor
no nulo de F es, al menos, 1/2.
Demostración. Basta con usar el Lema precedente con I = I1 = · · · = In .
Esto genera el siguiente algoritmo probabilista polinomial (RP o MonteCarlo) para detectar
polinomios no nulos.
Input : El código de un programa G en n variables, que evalúa un polinomio de grado d.

guess ad random
x = (x1 , . . . , xn ) ∈ {−d, . . . , 0, 1, . . . , d}n .
Eval G en x.
if G(x) 6= 0, Output : “Es un polinomio no nulo”,
else Output : “Probablemente sea nulo”,
fi
end
El error del algoritmo se produce si G es un polinomio no nulo, pero el algoritmo devuelve la

expresión “Probablemente sea nulo”. Esto se produce si una elección aleatoria (distribución
uniforme) de un punto x ∈ {−d, . . . , 0, 1, . . . , d}n es tal que G(x) devuelve 0, porque el polinomio
que evalúa G se anula en ese especı́fico punto x. Pero la probabilidad de que eso ocurre está
acotada por
d d 1
= < .
](I) 2d + 1 2
Para disminuir la probabilidad de error, basta con hacer un número alto (digamos k) elecciones
aleatorias independientes de puntos en I n . En ese caso, asumiendo k elecciones independientes,
la probabilidad de error caerı́a a una cantidad acotada por:
1
.
2k
Observación 8.4.3 (Las dificultades en el caso de que el cuerpo K sea finito). Nótese,
sin embargo, que hay un problema implı́cito en la propuesta. Si K fuera un cierpo finito,
pongamos de q elementos, y f ∈ K[X1 , . . . , Xn ] fuera un polinomio de grado d, con d > q, no
podrı́amos encontrar ningún subconjunto I ⊆ K tal que ](I) ≥ 2d + 1. La única salida para
utilizar este tipo de algoritmos consiste en ampliar el cuerpo finito K buscando una extensión
algebraica finita L de K para obviar la dificultad. Daremos algunas pistas en las páginas que
siguen.
En todo caso si el cuerpo K posee suficientes elementos, y f ∈ K[X1 , . . . , Xn ] \ {0} es un

polinomio no nulo es seguro (aunque no sea obvio cómo hallarlo) que hay algún punto x ∈ K n
fuera de la hiper-superficie VA (f ). Es lo que se aclara en el siguiente resultado:
Corolario 8.4.4. Con las anteriores notaciones, si existe un subconjunto I de K de, al menos,
2d + 1 elementos, entonces para todo polinomio no nulo f ∈ K[X1 , . . . , Xn ] \ {0} de grado a
lo sumo d existe (t1 , . . . , tn ) ∈ K n tal que f (t1 , . . . , tn ) 6= 0 (o, equivalentemente, (t1 , . . . , tn ) 6∈
VAn (K) (f )).
Demostración. Consecuencia inmediata del resultado precedente.
Nótese que, aunque muy lejanamente, esto nos acerca a la pregunta de saber cuántos puntos
K−racionales hay en una hipersuperficie VA (f ) y, en general, en una variedad VA (a).
8.4.2. Cuestores (Opcional, resumen de sólo lectura).

Definición 102. Dado un subconjunto (no necesariamente finito) F ⊂ K[X1 , . . . , Xn ] (que
contiene al polinomio nulo) Diremos que un conjunto finito Q ⊂ An (K) es un questor (o una
“Correct Test Sequence”) para F si y sólo si para todo F ∈ F se tiene :
P |Q = 0 =⇒ P ≡ 0 .
El resultado depende fuertemente de la desigualdad de Bézoutque analizaremos posteriormente.
El primer resultado significativo es el siguiente :
Lema 8.4.5 ([KrPa, 1996]). Sea W(L, `, n) el conjunto de todos los polinomios en K[X1 , . . . , Xn ]
que se pueden evaluar mediante un esquema de evaluación de talla L y profundidad `. Sea
W (L, `, n) la clausura Zariski de ese conjunto. Entonces, se verifica
deg W (L, `, n) ≤ (2`+1 − 2)2L(L−(n+1)) .

Teorema 8.4.6 (Existencia de Conjuntos Cuestores). Sea K un cuerpo y sean n, `, L ∈ N,
L ≥ n + 1. Sean
u := (2`+1 − 2) (2` + 1)2 and t := 6 (`L)2 .
Supongamos que la caracterı́stica de K es mayor que u o que la caracterı́stica de K es cero.
t
Entonces, el conjunto {1, . . . , u}n ⊂ K n contiene al menos unt (1 − u− 6 ) conjuntos cuestores
de longitud t para W (L, `, n). En particular, contiene al menos uno.
Observe el lector que un elección aleatoria de un subconjunto cualquiera de t elementos del
conjunto {1, . . . , u}n ⊂ K n es un conjunto cuestor para W (L, `, n) con probabilidad mayor que
t
(1 − u− 6 ) > 1/2.
Por tanto, el algoritmo del Tests de Schwartz-Zippel-DeMillo-Lipton se transforma en un algo-
ritmo RP mediante el siguiente esquema :
Input : El código de un esquema de evaluación bien paralelizable G en n variables, que evalúa

un polinomio de grado d. Supongamos que G es de talla L y profundidad `.
Compute u y t (como en el Teorema anterior)
guess indeterministically Q ⊆ {1, . . . , u}n de cardinal t.
Eval G en x para cada x ∈ Q.
if G(x) 6= 0, para algún x Output : “Es un polinomio no nulo”,
else Output : “Probablemente sea nulo”,
fi
end
En este caso, la probabilidad de no cometer errores es, al menos

t
(1 − u− 6 ).
8.4.3. Witness Theorem. Comencemos fijando la terminologı́a con la siguiente Definición :

Definición 103. Un testigo (Witness) para un polinomio F ∈ K[X1 , . . . , Xn ] es un punto
ω ∈ K n tal que si F (ω) = 0 implica P = 0.
En otras palabras, un testigo es un punto ω ∈ K n fuera del conjunto de puntos K−racionales
de la hipersuprficie VA (F ) (si hubiera alguno). La manera de obtenerlo de modo explı́cito es el
siguiente Teorema
Teorema 8.4.7 (Witness Theorem). Sea K un cuerpo de números, F ∈ K[X1 , . . . , Xn ] un poli-

nomio no nulo evaluable por un esquema de evaluación Γ de talla L, profundidad ` y parámetros
en F ⊆ K. Sea ω0 ∈ K tal que se verifica la siguiente desigualdad :
ht(ω0 ) ≥ max{log 2, ht(F)}.
Sea N ∈ N un número natural tal que se verifica la siguiente desigualdad :
log N > log(` + 1) + (` + 2)(log 2) (log log(4L)) .
Definamos recursivamente la siguiente secuencia de números algebraicos (conocida como Es-
quema de Kronecker) :
ω1 = ω0N ,
y para cada i, 2 ≤ i ≤ n, definamos
N
ωi = ωi−1 .
n
Entonces, el punto ω := (ω1 , . . . , ωn ) ∈ K es un testigo para F (i.e. F (ω) 6= 0).
La demostración se sigue por un argumento inductivo, que usa fuertemente una Generalización
de la Desigualdad de Liouville, descrito en [CHMP, 2001].
Corolario 8.4.8. Sea F ∈ K[X1 , . . . , Xn ]un polinomio no nulo evaluable por un esquema de
evaluación de talla L, profundidad ` y parámetros en F := {x1 , . . . , xr } ⊆ K. Sea ω−1 ∈ K tal
que
ht(ω−1 ) := max{log 2, ht(x1 ), . . . , ht(xr )}.
2
2L
Definamos ω0 ∈ K como ω0 := ω−1 . Sea N ∈ N un número natural tal que
log N > log(` + 1) + (` + 2)(log 2) (log log(4L)) .
Definamos recursivamente la siguiente secuencia de números algebraicos (Esquema de Kro-
necker) :
ω1 = ω0N ,
N
y para cada i, 2 ≤ i ≤ n, definamos ωi = ωi−1 . Entonces, el punto ω := (ω1 , . . . , ωn ) ∈ K n es
un Testigo para F (i.e. F (ω) 6= 0).
Observación 8.4.9.
i) El resultado nos da, codificado como un esquema de evaluación, un punto en el que no

se anula el polinomio dado. Sin embargo, el tal Testigo es un punto que, en expansión
binaria, resulta excesivo para poder manejarlo del modo adecuado. Por ello, el uso
de métodos tipo Witness Theorem exigen poner un especial cuidado con el tamaño
de los resultados intermedios o, en su defecto, usar Tests Probabilistas para números
dados por esquemas de evaluación como los que se introducen en la Subsección 8.4.4
siguiente.
ii) El Caso Denso . Para la mayorı́a (genéricamente) de los polinomios F ∈ K[X1 , . . . , Xn ]
de grado d, el esquema de evaluación óptimo tiene talla

d+n
L= ,
n
y profundidad ` = log d + O(1). Los parámetros en este caso genérico son los co-
eficientes de F . El Teorema 8.4.7 anterior dice que existe una pequeña constante
universal c2 > 1, tal que la cota que debe verificar N es simplemente la cota sigu-
iente :
log N > c2 n log2 d.
iii) El caso Ralo (Sparse/Fewnomials). Supongamos que nuestro polinomio F ∈
K[X1 , . . . , Xn ] tiene pocos términos no nulos. Supongamos que F tiene grado a lo
sumo d y que a lo sumo M de sus términos tienen coeficientes no nulos. Entre estos
polinomios, el esquema de evaluación óptimo que los evalúa tiene talla del orden
L = c3 M d (donde c3 > 0 es una constante universal), y profundidad log2 d + O(1).
Entonces, el Teorema 8.4.7 anterior dice que existe una pequeña constante c3 > 1, tal
que la condición para definir N en el esquema de Kronecker es la siguiente :
log N > c3 log d (log log d + log log M ) .
8.4.4. Tests de (no) nulidad para números enteros dados por esquemas de eva-
luación. Del mismo modo que los esquemas de evaluación pueden ser la buena estructura de
datos para codificar polinomios que aparecen en Teorı́a de la Elminación, la misma estructura
de datos se aplica a la representación de números enteros y racionales que aparecen como
resultados de eliminación. Del mismo modo que ocurre con los polinomios, los esquemas de
evaluación de números son muy adecuados para realizar operaciones aritméticas entre números
codificados mediante esquemas. Sin embargo, los Tests de Igualdad (o Tests de Nulidad) son
problemáticos. En este sentido, la operación correspondiente a la evaluación de un polinomio
es la operación de evaluar un esquema de evaluación módulo una constante dada. La buena
capacidad de adaptación de los esquemas de evaluación para estas propiedades hace que los
Tests de Nulidad para esquemas de evaluación representando números pasen por los cálculos
modulares.
Los algoritmos esenciales en esta Sección vienen de los trabajos de O.H. Ibarra, S. Moran
([IM, 1983]) y del trabajo de A. Schönhage (cf. [Schö, 1979]).
Comencemos recordando el Teorema de (Densidad) de los Números primos (visto en el párrafo
5.3.2.1 precedente). Como en aquel párrafo, definamos la función π : N −→ N dada por
π(n) := ]({p ∈ N : 2 ≤ p ≤ n, p es un número primo},
es decir el cardinal de los números primos no nulos menores que n.
Recordemos el Teorema (de Densidad) de los Números Primos (cf. Teorema ??) y la estimación
de [Rosser, 1941] allı́ descrita:
Teorema 8.4.10 ([Rosser, 1941]). Con las anteriores notaciones, para n ≥ 55,
n n
≤ π(n) ≤ ,
ln(n) + 2 ln(n) − 4
donde ln se refiere al logaritmo neperiano.
Comencemos con una vertsión existencial:

Lema 8.4.11 (Ibarra-Moran). Existe una constante c ∈ R universal, tal que para cualquier
n
número natural n ∈ N tal que 22n ≥ c y para cada N ∈ N tal que 1 ≤| N |≤ 2n2 se verifica :
Dado el conjunto P(22n ) de todos los números primos menores que 22n . Entonces, existe un
primo p ∈ P(22n ) tal que N no es divisible por p.
Demostración. Usaeemos la estimación de Rosser (cf [Rosser, 1941]) antes citada. Eli-
jamos c = 55 cada n ∈ N tal que 22n ≥ 55,
22n 22n
](P(22n )) = π(22n ) ≥ ≥ .
ln(22n ) + 2 2n + 2
De otro lado, sean p1 , . . . , ps los divisores primos de N . Como p1 ≥ 2 se tiene :
n
p1 · · · ps ≤ N ≤ 2n2 .
Tomando logaritmos, se tendrá:
s
X
log2 (pi ) ≤ log2 (N ) ≤ n2n .
i=1
Como pi ≥ 2, entonces log2 (pi ) ≥ 1 y, por tanto, concluimos

s ≤ log2 (N ) ≤ 2n2n .
Finalmente, observemos que
22n 2n 2n − 4n(n + 1)

− 2n2n = 2n − 2n = 2n > 1.
2n + 2 2n + 2 2n + 2
para n ≥ 10. Tomando n ≥ 55, la hipótesis de [Rosser, 1941], se tiene el resultado.
Podemos dar una versión más probabilı́stica del mismo resultado. Para ello, consideremos
el conjunto A (22n ) := {2, . . . , 22n }. Consideremos la distribución uniforme sobre A (22n ) y
escribamos
](A) ](A)
Probunif [A] := = 2n ,
](A (22n )) 2 −1
para denotar la probabilidad (con respecto a la distribución uniforme) de cualquier subconjunto

A ⊆ A (22n ).
Lema 8.4.12 ([IM, 1983]). Sea N un número natural no nulo tal que
n
|N | ≤ 22n2 .
Existe una constante universal d > 0, d ∈ R, tal que para n ≥ d, la probabilidad para m ∈
A (22n ) de de la propiedad de N = 0 mod m satisface
1
Probunif [m ∈ A (22n ) : N = 0 mod m] ≤ 1 − .
4n
Demostración. Consideremos el siguiente conjunto:
A1 (N ) := {m ∈ P(22n ) : N 6= 0 mod m}.
Y consideremos el subconjunto
A2 (N ) := {p ∈ P(22n ) : N 6= 0 mod p},
donde, como en la demostración precdente, P(22n ) son los números primos menores que 22n .
Como A2 (N ) ⊆ A1 (N ), tenemos
Probunif [A1 (N )] ≥ Probunif [A2 (N )].
Usando los mismos argumentos que en la prueba precedente, tenemos que
22n
](A2 (N )) ≥ − 2n2n ,
2n + 2
por lo que podemos escribir:
22n
](A2 (N )) ](A2 (N )) 2n+2 − 2n2n 1 2n 1
Probunif [A2 (N )] = 2n ≥ ≥ = − ≥ ,
2 −1 22n 22n 2n + 2 2n 4n
para n ≥ 12, por ejemplo. Por tanto,
1
Probunif [A1 (N )] ≥ Probunif [A2 (N )] ≥
,
4n
y, por tanto, tomando d = 55, concluimos que para n ≥ d se tiene:
1
Probunif [m ∈ A (22n ) : N = 0 mod m] = 1 − Probunif [A1 (N )] ≤ 1 − .
4n

Consideremos ahora el mismo conjunto A (22n ) y hagamos su producto cartesiano 4kn veces
con k ∈ N. es decir,
A (22n )4kn := {(m1 , . . . , m2kn ) ∈ N4kn : mi ∈ A (22n )}.
Consideremos en esta conjunto la distribución uniforme que, en este caso, es la misma que la
distribución producto. entonces, tenemos:
Teorema 8.4.13 ([IM, 1983]). Sea k ∈ N un entero positivo. Sea N un número natural no
nulo tal que
n
|N | ≤ 22n2 .
Existe una constante universal f > 0, f ∈ R, tal que para n ≥ f , la probabilidad de que una
lista aleatoriamente elegido (m1 , . . . , m4kn ) ∈ A (22n )4kn satisfaga:
N =0 mod mi , ∀i, 1 ≤ i ≤ 4kn,
está acotada por e−k , donde e es el número de Neper. Es decir,
1 1
Probunif [(m1 , . . . , m4kn ) ∈ A (22n )4kn : N = 0 mod mi , ∀i, 1 ≤ i ≤ 4kn] ≤ < k.
ek 2
Demostración. Es mera consecuencia de los lemas precedentes. Escribamos

A1 (N ) := {(m1 , . . . , m4kn ) ∈ A (22n )4kn : N = 0 mod mi , ∀i, 1 ≤ i ≤ 4kn},
y tendremos que:
4kn
1 k 1 1
Probunif [A1 (N )] ≤ 1− ≤ e−1 = k
≤ k.
4n e 2

Para concluir el test de Ibarra-Moran, considérese N ∈ Z un número entero que se evalúa me-
diante un programa que usa sólo operaciones en {+, −, ×} y constante en {−1, 0, +1}. Supong-
amos que L es el número total de operaciones realizables por el programa (también llamada
talla del esquema de evaluación). Entonces,
L
0 ≤ |N | ≤ 22 .
Tiene sentido, entonces, diseñar el siguiente programa probabilista para detectar si N 6= 0:
Input : Γ el código de un esquema de evaluación de talla L evaluando un número entero.

Gess randomly un conjunto DL de 4L2 números enteros en el conjunto {1, . . . , 22L },
if Γ 6= 0modm, para algún m ∈ DL , Output : “El número es no nulo”.
else Output :“El número es probablemente nulo”.
fi
end
La probabilidad de error en este algoritmo es del orden

L
1 4L2 1 4L L 1
(1 − ) = (1 − ) < e−1 < L ,
4L 4L 2
donde e es el número de Neper.
Con lo que concluimos:
Teorema 8.4.14 ([IM, 1983]). Existe un algoritmo probabilista que, en tiempo polinomial,
decide si un número natural N ∈ N, dado por un esquema de evaluación Γ, que usa solamente
operaciones en {+, −×} en Z y las constantes {−1, 0, +1}, satisface N = 0 o no. La probabilidad
de error del algoritmo es menor que
1
,
2L
donde L es la talla del esquema Γ.
Demostración. Es el algoritmo precedente.
8.5. Una demostración elemental del Nullstellensatz de Hilbert: Parte II

Estamos ya en condiciones de ofrecer demostraciones elementales de las distintas formas de
presentar el Nullstellensatz de Hilbert-Kronecker.
8.5.1. Nullstellensatz de Hilbert-Kronecker: Parte II.

Lema 8.5.1. Sea K un cuerpo de cardinal infinito y f ∈ K[X0 , . . . , Xn ] un polinomio homogéneo
no nulo. Entonces, para cada i, 0 ≤ i ≤ n el polinomio “afinizado” con respecto a la variable i:
fi (X0 , X1 , . . . , Xi−1 , Xi+1 , . . . , Xn ) := f (X0 , . . . , Xi−1 , 1, Xi+1 , . . . , Xn ),

es un polinomio no nulo.
8.5. NULLSTELLENSATZ, PARTE II 403
Demostración. Es un mero ejercicio de comprobación. Por ser autocontenidos hagamos

el caso i = 0. Supongamos dada la expansión monomial de f mediante:
X
f := aµ X0µ0 X1µ1 · · · Xnµn .
|µ|=d
Entonces, la expansión monomial de f0 será dada por:

X
f0 := aµ X1µ1 · · · Xnµn ∈ K[X1 , . . . , Xn ].
|µ|=d
Los coeficientes de f0 son los mismos coeficientes de f , aunque los términos difieren ahora por
ser términos en las variables {X1 , . . . , Xn }. Por tanto, si existe µ tal que aµ 6= 0 tendremos que
f 6= 0 si y solamente si f0 6= 0.
Teorema 8.5.2 (Hilbert-Kronecker’s Nullstellensatz). Sea K un cuerpo infinito, K su
clausura algebraica y a un ideal en un anillo K[X1 , . . . , Xn ]. Entonces, la variedad algebraica
V = VA (a) ⊆ An (K) verifica:
VA (a) = ∅ ⇐⇒ 1 ∈ a.
Demostración. Hay una implicación obvia: si 1 ∈ a, es decir a = K[X1 , . . . , Xn ], es obvio
que VA (a) = ∅.
Para la otra implicación haremos inducción en n, usando el Corolario 8.4.4 anterior. El caso
n = 1 es obvio.
Supongamos que el resultado es cierto para todo ideal propio en todo ideal de un anillo de
polinomios involucrando a los sumo n−1 variables (esto es, en todo anillo del tipo K[Y1 , . . . , Yr ],
con r ≤ n − 1).
Por hipótesis, a es un ideal propio en K[X1 , . . . , Xn ]. Como K es infinito, podemos encontrar
un elemento f ∈ a de grado d no nulo y un subconjunto I de K de cardinal 2d + 1. Siguiendo
la descomposición descrita en la Observación 8.3.2, sea fd (X1 , . . . , Xn ) su parte homogénea de
grado d y no nula. tendremos que fd (X1 , . . . , Xn−1 , 1) 6= 0. Por tanto, existe (t1 , . . . , tn−1 ) ∈
I n−1 , tal que
fd (t1 , . . . , tn−1 , 1) 6= 0.
Consideremos ahora el isomorfismo descrito en la Sección 8.3 (es decir, el isomorfismo de
K−álgebras dado la Ecuación (8.3.2)):
ϕ : K[X1 , . . . , Xn ] −→ K[Y1 , . . . , Yn ]
(8.5.1)
f 7−→ f (Y1 + t1 Yn , . . . , Yn−1 + tn−1 Yn , Yn ).
Entonces, por el apartado i) del Lema 8.3.1, como a es un ideal propio, también lo es el ideal
b := ϕ(a). Pero g := ϕ(f ) es, tras este cambio de variables un polinomio mónico con respecto
a la variable Yn y no nulo en b. Consideremos su contracción:
bc := b ∩ K[Y1 , . . . , Yn−1 ].
Como b es propio, también lo es bc . Por hipótesis inductiva VAn−1 (K) (bc ) 6= ∅. Por el Lema
8.2.7 VAn−1 (bc ) = π(VAn (b). Luego si VAn−1 (K) (bc ) 6= ∅, entonces VA (b) 6= ∅.
Finalemente, usando el apartado iii) del Lema 8.3.1, tendremos que VA (a) 6= ∅ es no vacı́o.
8.5.2. Nullstellensatz de Hilbert: Cuerpos finitos.
Teorema 8.5.3 (Hilbert’s Nullstellensatz: cuerpos finitos). Sea a un ideal en un anillo
K[X1 , . . . , Xn ], siendo K un cuerpo finito. Supongamos que a posee un elemento no nulo y no
unidad de grado d ≥ 1. Supongamos que el cardinal de K verifica: ](K) ≥ 2d + 1. Entonces, la
variedad algebraica V = VK (a) ⊆ An (K) verifica:
V = ∅ ⇐⇒ 1 ∈ a.
Demostración. El resultado se sigue de una demostración idéntica a la anterior. Nótese
que el punto crı́tico es que el número de elementos del cuerpo sea suficientemente grande.

Observación 8.5.4. En las utilizaciones algorı́tmicas del Nullstellensatz sobre cuerpos finitos,
si el cuerpo inicial K sobre el que se trabaja no tiene suficientemente elementos se suelen usar
extensiones finitas de K que tienen un cardinal suficientemente grande con respecto a los grados
de los polinomios involucrados. Una forma de entender estas construcciones son las siguientes.
8.5.2.1. Un recordatorio sobre Cuerpos Finitos. Unas palabras para recordar los
cuerpos finitos y cómo podemos extenderlos.
Teorema 8.5.5. Todo cuerpo finito F de cardinal pm y caracterı́stica p es el menor cuerpo que
contiene a Z/pZ y a todas las raı́ces de la ecuación
m
X p − X = 0.
De hecho, los elementos de F son justamente las raı́ces de esa ecuación.
Definición 104. Sea F un cuerpo finito de cardinal q = pm y sea n un número entero coprimo
con q. Llamaremos raı́z primitiva n−ésima de la unidad a todo elemento θ de F tal que las
siguientes sean las n raı́ces distintas de la unidad :
{1, θ, θ2 , . . . , θn−1 }.
En el caso en que n es coprimo con q las raı́ces n−ésimas primitivas de la unidad sobre F tienen
un comportamiento próximo al caso de caracterı́stica 0; aunque con matices y diferencias que
es necesario destacar.
Definición 105. Sea F un cuerpo finito de cardinal q = pm y sea n un número natural no
nulo coprimo con q. La siguiente función racional es un polinomio en F [X] llamado polinomio
ciclotómico de grado n :
Y µ(d)
fn (X) := X n/d − 1 ,
d|n
donde µ es la función de Möbius. La función de Möbius fue introducida como el discriminante
en Teorı́a de Números. Viene definida del modo siguiente : Sea n ∈ N un número natural.
Definimos µ(n), mediante :

 0 si n posee algún factor irreducible múltiple
µ(n) := (−1)r si n = p1 · · · pr con pi primo, gcd(pi , pj ) = 1
1 si n = 1

En suma, µ(n) = 0 si y solamente si posee factores irreducibles múltiples. Esto permite iden-
tificar las propiedades de la función de Möbius con las propiedades del discriminante de un
polinomio. Sin embargo, la función de Möbius no se sabe calcular sin conocer la factorización
(lo que hace de ella una función difı́cil de evaluar) y tiene propiedades muy significativas como
la famosa “Fórmula de Inversión de Möbius” (véase el texto de G. H. Hardy and E. M. Wright
[Hardy-Wright, 1938] para más información).
Obsérvese que el cálculo de polinomio √ ciclotómico fn puede hacerse fácilmente√a partir de la
factorización de n (en tiempo O( nlog22 n)) y de todos sus divisores (tiempo O( nlog22 n)).
Una raı́z n−ésima de la unidad sobre F es un elemento θ tal que θn = 1 y las potencias
{1, θ, θ2 , . . . , θn−1 } son todas las raı́ces n−ésimas de la unidad sobre F y son todos distintos.
Para calcularlas y poder trabajar con ellas, es necesario hacer uso del siguiente :
Lema 8.5.6. Sea F un cuerpo finito de cardinal q = pm y sea n un número natural no nulo
coprimo con q. Sea (Z/nZ)× el grupo multiplicativo de las clases de restos módulo n. Sea r
el orden de q como elemento de (Z/nZ)× . Entonces, el polinomio ciclotómico fn factoriza en
F [X] como un producto de ϕ(n)r polinomios irreducibles de grado r cada uno de ellos, siendo ϕ
la función de Euler (cf. Subsección de Problemas 3.6.5.3).
La función de Euler : Se define mediante φ(1) = 1 y para n ≥ 2 del modo siguiente :
ϕ(m) := ]{a ∈ N : 1 ≤ a ≤ m − 1, mcd(a, m) = 1}.
Se trata de probar que φ(m) coincide con el número de elementos del grupo de las unidades
en (Z/mZ)× . En particular, Z/mZ es un cuerpo si y solamente si ϕ(m) = m − 1. Otras
propiedades de la función de Euler :
i) La función de Euler es multiplicativa, esto es, si mcd(p, q) = 1, entonces ϕ(pq) =
ϕ(q)ϕ(q).
ii) Se tiene :
X
ϕ(m) = n
m|n
Las raı́ces primitivas n−ésimas de la unidad sobre F son las raı́ces de uno de esos factores.
Para detectar las raı́ces primitivas de la unidad, factoricemos fn usando uno cualquiera de
los algoritmos de factorización de polinomios univariados sobre cuerpos finitos. Por ejemplo, el
método descrito por E. Berlekamp (cf. también la serie de Problemas descritos en la Subsección
3.6.5.2) y que puede resumirse en el siguiente enunciado:
Teorema 8.5.7 ([Be, 1970]). Sea p ∈ N un número primo. Sea Fp el cuerpo primo de p
elementos. Entonces, existe una máquina de Turing M determinista tal que realiza la siguiente
tarea :
dado f ∈ Fp [T ] un polinomio mónico, sin factores múltiples y de grado d, M calcula los factores
irreducibles de f en Fp [T ]. El tiempo de cálculo de tal máquina de Turing es polinomial en p y
d, i.e.
pO(1) dO(1)
A partir de esa factorización, sea gn uno de esos factores y definamos el cuerpo
F 0 := F (θ) = F [Y ]/(gn (Y )).
Se tiene :
Lema 8.5.8. La clase de Y módulo gn (esto es, θ ∈ F 0 ) es una raı́z primitiva n−ésima de la
unidad sobre F .
Con ello tenemos una descripción de cualquier cuerpo.
8.5.3. Nullstellensatz: Identidad de Bézout.

Teorema 8.5.9 (Hilbert’s Nullstellensatz: Identidad de Bézout). Sea {f1 , . . . , fs } un
conjunto finito de elementos de K[X1 , . . . , Xn ] no todos nulos y ninugno unidad, siendo K un
cuerpo. Sea d el máximo de os grados de los polinomios f1 , . . . , fs .Sea V ⊆ An (K) la variedad
algebraica V = VK (f1 , . . . , fs ) ⊆ An (K) de los ceros comunes de estos polinomios. Supongamos
que el cardinal de K satisface: ](K) ≥ 2d + 1. En tonces son equivalente:
∃x ∈ An (K), f1 (x) = 0, . . . , fs (x) = 0,
y ∃g1 , . . . , gs ∈ K[X1 , . . . , Xn ], tales que:
1 = g1 f1 + dotsgs fs .
Demostración. Simplemente notar que si a es el ideal que generan los polinomios {f1 , . . . , fs },
el ideal es propio si y solamente si V (a) = V (f1 , . . . , fs ) 6= ∅. El resto es reescritura.

8.5.4. Nullstellensatz: Maximales. Esta versión del Nullstellensatz (totalmente equi-

valente a las anteriores) tiene sus reminiscencias en el Teorema del Resto, consecuencia inmedi-
ara de la división Euclı́dea. En España, por tradiciones incomprensibles, se suele llamar Teorema
de Ruffini al Teorema del Resto. En realidad, están confundiendo el “Método de Ruffini” (que sı́
es un método para dividir por (X − a)) y es debido a Ruffini (cf. [Ruff, 1804]). En cambio, en
el mundo anglosajón ese método de Ruffini es conocido como el “Horner’s method” y se basa en
un trabajo de Horner (cf. [Hor, 1819]). Una descripción de ese conocimiento puede verse en
[Caj, 1911]. Recientemente, en la permanente campaña de “reconocimiento” del saber chino
histórico, se ha descubierto que, en realidad, el “Método de Ruffini” era ya conocido por el
matemático chino Qin Jiushao (cf. [Jiushao, 1247]) en el siglo XIII. En todo caso, el método
es tan obvio que darle un nombre a una división euclı́adea tan sencilla carece de interés: es el
“método” que a cualquiera se le ocurre. Lo que sı́ es evidente es que es consecuencia inmediata
de la existencia de división euclı́dea y se remonta, cuando menos, al siglo III a. de C y a los
Elementos de Euclides.
Supondremos que K es un cuerpo inifnito y K su clausura algebraica.
Observación 8.5.10 (Ideales maximales asociados a puntos). En el Párrafo 7.2.2.2 in-
trodujimos los ideales asociados a puntos de la forma mx , donde x ∈ An (K), y estudiamos sus
propiedades más generales en la Proposición 7.2.23. Las propiedades especı́ficas del caso de
variedades afines fueron vistas en la Proposición 7.3.15. Retomemos aquellas notaciones:
Supongamos x := (x1 , . . . , xn ) ∈ An (K) un punto en el espacio afı́n. Tenemos el siguiente ideal

primo en K[X1 , . . . , Xn ]:
mx := {f ∈ K[X1 , . . . , Xn ] : f (x) = 0}.
Si K es, como en todo este Capı́tulo, la clausura algebraica de K, entoncs mx es un ideal

maximal (cf. Proposición 7.3.15) porque se tiene un isomorfismo de K−álgebras entre:
K[X1 , . . . , Xn ]/mζ ∼
= K(x1 , . . . , xn ).
Si, además, x1 , . . . , xn ∈ K o si K = K, se tiene la siguiente identidad:
mζ := (X1 − z1 , . . . , Xn − zn ).
Teorema 8.5.11 (Hilbert’s Nullstellensatz: maximales). Sea K un cuerpo infinito, K su

clausura algebraica. Entonces, se tiene:
MaxSpec(K[X1 , . . . , Xn ]) = {mζ : ζ ∈ An (K)}.
Demostración. Por los visto en la Proposición 7.3.15, ya tenemos la inclusión ⊇. Se

trata de ver la otra inclusión. Ası́ qu supongamos m ∈ MaxSpec(K[X1 , . . . , Xn ]) un ideal
maximal. Por ser maximal es propio, luego 1 6∈ m. Pero por el Nullstellensatz para cuerpos
infinitos (Teorema 8.5.2), VA (m) 6= ∅. Luego existe ζ ∈ An (K), tal qu ζ ∈ VA (m). Por la propia
definición de mζ , se tendrá m ⊆ mζ . Pero, como m es un ideal maximal y mζ es un ideal propio,
concluimos m = mζ y tenemos la inclusión ⊆ y probado el Teorema.
Teorema 8.5.12 (Hilbert’s Nullstellensatz: maximales, caso K = K). Sea K = K un

cuerpo algebraicamente cerrado. La siguiente es una biyección entre conjuntos no vacı́os:
m : An (K) −→ MaxSpec(K[X1 , . . . , Xn ])
(8.5.2)
ζ 7−→ mζ
Demostración. De hecho, se tiene la equivalencia entre las siguientes tres afirmaciones:

i) El cuerpo K es algebraicamente cerrado, esto es, K = K,
ii) La aplicación m anterior es una biyección entre K n y MaxSpec(K[X1 , . . . , Xn ]),
iii) Se verifica el Nullstellensatz de Hilbert en K[X1 , . . . , Xn ] en la forma siguiente:
Para cada ideal a de K[X1 , . . . , Xn ], existe ζ ∈ An (K) tal que f (ζ) = 0, ∀f ∈ a, si y
solamente si 1 6∈ a.
Probar que si no se verifica i), no se verifica iii) es evidente. Si un cuerpo no es algebraicamente
cerrado, siempre hay un polinomio univariado e irreducible que no posee raı́ces en K (el ejemplo
f = X 2 + 1 ∈ R[X] es clásico). Ese polinomio define un ideal propio a = (f ) (con 1 6∈ a) y no
posee ninguna solución en K 1 . Por tanto, iii)=⇒ i).
La implicación i) =⇒ iii) es simplemente el Teorema 8.5.2, dado que todo cuerpo algebraica-
mente cerrado es de cardinal infinito.
De otro lado, ii) =⇒ iii). La razón es obviamente la siguiente. En la equivalente de iii) sólo hay
una implicación, la otra es obvia. La implicación es la siguiente:
1 6∈ a, =⇒ ∃ζ ∈ An (K), f (ζ) = 0, ∀f ∈ a.
Pero si 1 6∈ a, entonces, hay un ideal maximal n de K[X1 , . . . , Xn ] que contiene al ideal a

(i.e.a ⊆ n). Pero, por ii), todos los tales maximales son de la forma n = mζ , con ζ ∈ An (K). En
conclusión, existe ζ ∈ An (K) tal que a ⊆ mζ . Esto es lo mismo que escribir f (ζ) = 0, ∀f ∈ a y
tendremos la implicación relevante de iii).
Finalmente, iii) =⇒ ii). Si n es un ideal maximal, entonces 1 6∈ n luego, por iii), existe ζ ∈ An (K)
tal que f (ζ) = 0, ∀f ∈ n. Esto es lo mismo que decir n ⊆ mζ . Como n es maximal, entonces
n = mζ y m es suprayectiva. La inyectividad se sigue del hecho de que dos puntos disntintos de
An (K) definen distintos maximales mζ1 6= mζ1 .
8.5.5. Nullstellensatz: Rabinowitsch y el radical de un ideal. El “Truco de Ra-

binowitsch” es el método descrito por George Yuri Rainich, bajo el pseudónimo de J. J. Ra-
binowitsch, en su trabajo de 1929 (cf. [Rainich, 1929]). El resultado es una identificación
entre los ideales radicales del anillo de polinomios y las variedades algebraicas. Es consecuencia
inmediata del Nullstellensatz y vamos a tratar de recuperarlo. Recordemos la Sección 6.3.1, en
el que se trataba la noción de radical de un ideal y se introdujeron los ideales radicales.
Además, ya habı́amos observado en el Capı́tulo 7 que los ideales IK (V ) de cualquier variedad
afı́n K−definible V ⊆ An (K) son ideales radicales y que, en un sentido quasi-recı́proco, para
cada ideal a ⊆ K[X1 , . . . , Xn ] consideremos la variedad K−definible en An (K) de los ceros
comunes a los elementos de a, definida del modo siguiente:
VAn (K) (a) := {x ∈ An (K) : f (x) = 0, ∀f ∈ a}.
Ası́, podemos considerar los siguientes conjuntos:
√
RadK (K[X1 , . . . , Xn ]) := {a ⊆ K[X1 , . . . , Xn ] : a es ideal, a = a}.
ClK (An (K)) := {VA (b) = VAn (K) (b) : b es ideal de K[X1 , . . . , Xn ]}.
Y tendremos bien definidas las siguientes dos aplicaciones:
VA : RadK (K[X1 , . . . , Xn ]) −→ ClK (An (K))
b 7−→ VA (b) = VAn (K) (b).
IK : ClK (An (K)) −→ RadK (K[X1 , . . . , Xn ])
V 7−→ IK (V ),
n
Es claro que se tiene que si V ⊆ A (K) es un cerrado Zariski en la topologı́a de los K−definibles,
por el ı́tem iv) de la Proposición 7.3.11, se tiene:
VA (IK (V )) = V.
Por tanto, concluimos que IK es un aplicación inyectiva y que VA es una aplicación suprayectiva.
En la versión de Rabinowitsch del Nullstellensatz (Teorema 8.5.13 siguiente) probaremos que
son ambas biyextivas, una inversa de la otra cuando K es un cuerpo infinito (lo que incuye el
caso en que K = K es algebraicamente cerrado).
La relevancia del radical de un ideal se observa en el famoso “truco de Rabinowistch”, que es
la siguiente versión del Nullstellensatz:
Teorema 8.5.13 (Nullstellensatz: Rabinowitsch trick). Sea K un cuerpo infinito, K su
clausura algebraica, cuerpo algebraicamente cerrado que le contiene y n ∈ N un número natural,
n ≥ 1. Consideremos los conjuntos RadK (K[X1 , . . . , Xn ]) y ClK (An (K)) anteriores y sean las
aplicaciones IK y VA definidas engtre ellos:
VA : RadK (K[X1 , . . . , Xn ]) −→ ClK (An (K))

b 7−→ VA (b) = VAn (K) (b).
IK : ClK (An (K)) −→ RadK (K[X1 , . . . , Xn ])
V 7−→ IK (V ).
Entonces, IK y VA son ambas biyectivas, una inversa de la otra.
Dicho de otra manera, para cada ideal a de K[X1 , . . . , Xn ] y cada cerrado K−definible V en
An (K) se verifica √
IK (VA (a)) = a, VA (IK (V )) = V.
Demostración. Sólo hay que probar que para cada ideal b de K[X1 , . . . , Xn ] se verifica
√
IK (VA (b)) = b.
Y, dado que tenemos que K[X1 , . . . , Xn ] es noetheriano, basta con que probemos que dado
un conjunto finito de elementos {f1 , . . . , fs } en K[X1 , . . . , Xn ], y dado un elemento adicional
f ∈ K[X1 , . . . , Xn ], si f se anula sobre VA (f1 , . . . , fs ), entonces, existen m ∈ N y existen
g1 , . . . , gs ∈ K[X1 , . . . , Xn ] verificando:
f m := g1 f1 + · · · + g2 f2 .
En realidad, técnicamente, el Truco de Rabinowitsch consiste en trabajar en la localización
K[X1 , . . . , Xn ]f , pero, hasta que no introduzacmos el lenguaje de las localizaciones, lo haremos
“auto-suficientemente”.
Para hacerlo de la manera clásica, introduzcamos una nueva variable Xn+1 y trabajemos en el
anillo de polinomios K[X1 , . . . , Xn , Xn+1 ]. En este anillo de polinomios, consideremos el ideal
b0 generado por los siguientes polinomios:
b0 := (f1 , . . . , fs , Xn+1 f − 1).
Dado que f se anula en todos los puntos en los que se anulan simultáneamente f1 , . . . , fs ,
entonces
VA (b0 ) ⊆ An+1 (K),
es el conjunto vacı́o. La razón es que si x = (x1 , . . . , xn , xn+1 ) ∈ An+1 (K) es un elemento en
VA (b0 ), entonces se tiene:
f1 (x1 , . . . , xn ) = 0, . . . , fs (x1 , . . . , xn ) = 0, xn+1 f (x1 , . . . , xn ) − 1 = 0.
Pero si f1 (x1 , . . . , xn ) = 0, . . . , fs (x1 , . . . , xn ) = 0, como f se anula en VA (f1 , . . . , fs ), entonces
se ha de tener f (x1 , . . . , xn ) = 0 y la imposible igualdad:
xn+1 0 − 1 = 0.
0
Ası́, VA (b ) = ∅ y, por el Nullstellensatz (Teorema 8.5.2 anterior), concluiremos que existen
g1 , . . . , gs , gs+1 en K[X1 , . . . , Xn+1 ] tales que la siguiente igualdad se da en K[X1 , . . . , Xn+1 ]:
1 = g1 f1 + · · · + g2 f2 + gs+1 (Xn+1 f − 1).
Consideremos K(X1 , . . . , Xn ) el cuerpo de fracciones de K[X1 , . . . , Xn ] introducido en el Párrafo
3.2.0.1. Reemplazamos la variable Xn+1 por f1 ∈ K(X1 , . . . , Xn ) en la expresión anterior, ob-
servando que f1 , . . . , fs no contienen esa variable, y obtendremos:
s
!
X 1 1 1
1 := gi (X1 , . . . , Xn , )fi (X1 , . . . , Xn ) + gs+1 (X1 , . . . , Xn , )( f − 1).
i=1
f f f
Es decir, obtenemos la siguiente igualdad (en el cuerpo K(X1 , . . . , Xn )):
s
!
X 1
(8.5.3) 1 := gi (X1 , . . . , Xn , )fi (X1 , . . . , Xn ) .
i=1
f
Sea D una cota superior de los grados de los gi ’s con respecto a la variable Xn+1 . Entonces, es
una mera comprobación el verificar que, para i, 1 ≤ i ≤ s, existe hi ∈ K[X1 , . . . , Xn ] tal que se
verifica la siguiente igualdad en K(X1 , . . . , Xn ):
1
hi (X1 , . . . , Xn ) = f D gi (X1 , . . . , Xn , ) ∈ K[X1 , . . . , Xn ].
f
Por tanto, multiplicando por f D a la identidad (8.5.3) obtendremos la siguiente igualdad entre
elementos de K[X1 , . . . , Xn ] que se satisface en K(X1 , . . . , Xn ):
s
!
X
D
f := hi (X1 , . . . , Xn )fi (X1 , . . . , Xn ) .
i=1
Esta identidad se satisface también en el subanillo K[X1 , . . . , Xn ] ⊆ K(X1 , . . . , Xn ) y, por

tanto, tenemos !
s
X
D
f := hi (X1 , . . . , Xn )fi (X1 , . . . , Xn ) ∈ b.
i=1
√
O, equivalentemente, f ∈ b, lo que permite concluir la afirmación buscada.
Observación 8.5.14. El Truco de Rabinowitsch, que no es sino una variante del Nullstellen-
satz, permite introducir un Diccionario Álgebra-Geometrı́a que permitirá traducir indistin-
tamente los objetos geométriocs a objetos descriptibles mediante polinomios y recı́procamente.
Éste es el principio de la Geometrı́a Algebraica y tendrá su influencia en el posterior desarrollo
de la Geometrı́a a lo largo de la segunda mitad del siglo XX y princpios del XXI. Por lo que
a nosotros respecta, nos quedaremos con que esa identificación existe y la usaremos cuando
convenga.
8.5.6. Nullstellensatz e ideales primos. Una de las consecuencias del Nullstellensatz

en la versión de Rabinowitsch es la siguiente indetificación entre las componentes irreducibles
y los ideales primos del anillo:
Corolario 8.5.15. Sea K un cuerpo infinito, K su clausura algebraica y Spec(K[X1 , . . . , Xn ]
el espectro primo del anillo K[X1 , . . . , Xn ]. Entonces la siguiente aplicación es una biyección:
IK : {V ⊆ An (K) : V es K−definible irreducible} −→ Spec(K[X1 , . . . , Xn ])
V 7−→ IK (V ).
La inversa de esta aplicación es la aplicación dada por:
VA : Spec(K[X1 , . . . , Xn ]) −→ {V ⊆ An (K) : V es K−definible irreducible}
p 7−→ VA (p).
Demostración. Lo dejamos como Problema 292.
8.5.7. Nullstellensatz y Geometrı́a Algebraica en Pn (K). Se trata de analizar el

efecto del Nullstellensatz en el tratamiento de las variedades algebraicas proyectivas discutidas
en la Sección 7.4. Comencemos indetificando el Nullstellensatz en su forma primitiva.
Teorema 8.5.16 (Nullstellensatz proyectivo). Sea K un cuerpo infinito, K su clausura
algebraica, Pn (K) el espacio proyectivo de dimensión n sobre K y sea a ( K[X0 , . . . , Xn ] un
ideal homogéneo. Entonces, son equivalentes:
i) VPn (K) (a) = ∅.
√
ii) a = (X0 , . . . , Xn ) = m0 .
Demostración. Como se indica √ en el ı́tem i) de la Proposición 7.4.7, VP ((X0 , . . . , X√
n )) =
∅. Como, además, VP (a) = VP ( a) (ver ı́tem v) de la Proposición 7.4.10), entonces si a =
(X0 , . . . , Xn ), concluimos que VP (a) = ∅. Lo que significa que hemos probado ii) =⇒ i).
Para la otra impplicación, supongamos VP (a) = ∅. Considero el ideal homogéneo asociado a
(P)
esta variedad IK (VP (a)) ⊆ K[X0 , . . . , Xn ]. Por la proposición 7.4.11 sabemos que ese ideal es
el ideal sobre el cono proyectante, es decir,
(P) ^
IK (VP (a)) = IK (V P (a)).
Como VP (a) = ∅, su cono proyectante satisface

^
V P (a) = ∅ = {0}.
e
Luego,
(P)
IK (VP (a)) = IK ({0}) = (X0 , . . . , Xn ).
Pero, además, por la Proposición 7.4.7, el cono proyectante satisface
^
{0} = VP (a) = VA (a).
Luego, por el Teorema 8.5.13 (Truco de Rabinowitsch) tenemos

√
IK (VA (a)) = a.
Por tanto, tenemos que
√
a = IK (VA (a) = IK ({0}) = (X0 , . . . , Xn ),
lo que concuye la prueba de que i) =⇒ ii) y la prueba del Teorema.
Corolario 8.5.17 (Ideales homogéneos radicales y variedades proyectivas). Sea K un

cuerpo infinito, K su clausura algebraica, Pn (K) el espacio proyectivo de dimensión n sobre K.
La siguiente es una biyección entre los ideales homogéneos radicals y las variedades algebraicas
proyectivas K−definibles. Es decir, consideremos los conjuntos
V arK (Pn (K)) := {V ⊆ Pn (K) : V algebraica K−definible},
y
(hom) √
RadK := {a ( K[X0 , . . . , Xn ] : a ideal homogéneo, a = a}.
Entonces, la siguiente es una biyección:

(P) (hom)
IK : V arK (Pn (K)) −→ RadK
(P)
V 7−→ IK (V ).
La aplicación inversa es la dada por:
(hom)
VP : RadK −→ V arK (Pn (K))
a 7−→ VP (a).
De hecho, se tiene
(P) √
IK (VP (a)) = a.
Demostración. Lo dejamos como Problema 293
Corolario 8.5.18 (Ideales primos homogéneos y variedades proyectivas irreducibles).

Sea K un cuerpo infinito, K su clausura algebraica, Pn (K) el espacio proyectivo de dimensión n
sobre K. La siguiente es una biyección entre los ideales primos homogéneos y las variedades al-
gebraicas proyectivas K−definibles e irreducibles. Es decir, consideremos el siguiente conjunto:
Proj(K[X0 , . . . , Xn ]) := {p ∈ Spec(K[X0 , . . . , Xn ]) : p ( m0 , p homogéneo},
denominado el espectro homogéneo del anillo K[X0 , . . . , Xn ] con la graduación habitual. Con-
sideremos también el conjunto:
IrredK (Pn (K)) := {V ⊆ Pn (K) : V 6= ∅ algebraica, K−definible e irreducible}.
(P)
IK : IrredK (Pn (K)) −→ Proj(K[X0 , . . . , Xn ])
(P)
V 7−→ IK (V ).
VP : Proj(K[X0 , . . . , Xn ]) −→ IrrK (Pn (K))
a 7−→ VP (a).
Corolario 8.5.19 (Puntos proyectivos y sus ideales, caso K = K). Supongamos K = K

un cuerpo algebraicamente cerrado y sea Pn (K) el espacio proyectivo de dimensión n sobre
K. La siguiente es una biyección entre los puntos proyectivos en Pn (K) y algunos ideales
(no maximales) de K[X0 , . . . , Xn ]. Consideremos x = (z0 : · · · , zn ) ∈ Pn (K) dado por sus
coordenadas homogéneas. Definamos el ideal en Proj(K[X0 , . . . , Xn ] siguiente:
m(P)
z := ({zj Xj − zj Xi : 0 ≤ i, j ≤ n}) ∈ Proj(K[X0 , . . . , Xn ]),
es decir, el ideal generado por los menores 2 × 2 de la matriz:

z0 z1 · · · zn
.
X0 X1 · · · Xn
La siguiente es una biyección:
(P) (P)
IK : Pn (K) −→ {mz ∈ Proj(K[X0 , . . . , Xn ]) : z ∈ Pn (K)}
(P)
z 7−→ IK ({z}).
(P)
VP : {mz : z ∈ Pn (K)} −→ Pn (K)
(P) (P)
mz 7−→ VP (mz ).

existenciales (sólo enunciados). Una de las estrategias antiguas más habituales para elimi-
nar un bloque de cuantificadores existenciales es el uso del llamado Nullstellensatz Efectivo. Fué
comenzado por la alumna de D. Hilbert G. Hermann en su trabajo de 1926 [Hermann, 1926].
Básicamente, este enunciado puedes darse como sigue:
Teorema 8.5.20 (Nullstellensatz Efectivo, [Hermann, 1926]). Existe una función D :
N3 −→ R+ que verifica las popiedades siguientes:
Sea {f1 , . . . , fs } un conjunto finito de elementos de K[X1 , . . . , Xn ]. Sea d el máximo de os
grados de los polinomios f1 , . . . , fs . Sea V ⊆ An (K) la variedad algebraica V = VK (f1 , . . . , fs ) ⊆
An (K) de los ceros comunes de estos polinomios. Supongamos que el cardinal de K satisface:
](K) ≥ 2d + 1. Entonces son equivalente:
∃x ∈ An (K), f1 (x) = 0, . . . , fs (x) = 0,
y ∃g1 , . . . , gs ∈ K[X1 , . . . , Xn ], tales que:
deg(gi ) ≤ D(d, n, s),
Y
1 = g1 f1 + dotsgs fs .
Además, D(d, n, s) puede elegirse satisfaciendo:
n
D(d, n, s) ≤ (sd)2 .
La demostración es más sutil que la descrita para el Nullstellensatz porque es constructiva:
se trata de dar descripciones de los polinomios que surgen en el Nullstellensatz en función de
los datos f1 , . . . , fs . Las cotas iniciales de G. Hermann fueron sucesivamente reducidas por la
colaboración de diversos autores y el paso de casi un centenar de años. Se pueden destacar las
siguientes:
n
i) D.W. Masser, G. Wüsholtz (cf. [MaWü, 1971]) : D(d, n, s) ≤ d2 s.
ii) D.W. Brownawell (cf. [Br, 1987]), L. Caniglia, A. Galligo, J. Heintz (cf. [CGH, 1988]),
J. Kollár (cf. [Kol, 1988]) :D(d, n, s) ≤ max{3, d}n .
iii) Otras variantes con distintos métodos de cálculo se puede obtener en [KrPa, 1996],
[HMPS, 2000], [KPS, 2001] y sus referencias.
Este procedimiento da, por ejemplo, un procedimiento para decidir si un sistema de ecuaciones
polinomiales posee una solución en una clausura algebraica sin conocer las soluciones ni calcu-
larlas. La idea de base es la siguiente.
Consideremos el anillo de polinomios K[X1 , . . . , Xn ] y, dentro de él, consideremos el subespacio
vectorial formado por todos los polinomios de grado acotado por una cierta cantidad T :
PTK (X1 , . . . , Xn ) := K[X1 , . . . , Xn ]T := {g ∈ K[X1 , . . . , Xn ] : deg(g) ≤ T }.
Es fácil probar que PTK (X1 , . . . , Xn ) es un subespacio vectorial de K[X1 , . . . , Xn ] como K−espacio
vectorial. También es sencillo probar, a partir de la definición de grado y de la definición de
K[X1 , . . . , Xn ] (verSubsección 1.4.2 ), que se trata de un espacio vectorial de dimensión finita
sobre K:
Una base es la base monomial formada por todos los monomios de grado a lo sumo T :
M (PTK ) := {X1µ1 · · · Xnµn : µ1 + · · · + µn ≤ T }.
A partir del Problema 1, es claro que M (PTK ) es un conjunto finito y su cardinal viene dado
por la cantidad N (T, n) siguiente: Es decir, tenemos

T +n
N (T, n) := dimK PT (X1 , . . . , Xn ) = ] M (PT ) =
K K

(8.5.4) .
n
Usando un orden monomial (cf. Definición 26 y los problemas de la Subsección 1.4.4.2), por
ejemplo el graduado lexicográfico (≤deglex ), podemos ordenar los elementos de la base M (PTK ).
Ordenar estos elementos es similar a ordenar sus exponentes. Escribamo µ0 al meno de tales
exponentes (resp. X µ0 el primero de esos monomios) y por µN (T,n)−1 al mayor de tales expo-
nentes (resp. X µN (T ,n)−1 al último de los monomios de la base M (PTK ) con respecto al orden
monomial fijado. Recud́ense tambiéon los Problemas 67 o Lema 1.4.28.
Fijada M (PTK ) como base ordenada, dado f ∈ K[X1 , . . . , Xn ] un polinomio de grado d, pode-
mos definir una aplicación lineal como sigue:
ηf : PTK (X1 , . . . , Xn ) −→ PTK+d (X1 , . . . , Xn )

g 7−→ fg
Es claro que es una aplicación lineal. Tomando las bases monomiales respectivas M (PTK ) y
M (PTK+d ) en los espacios vectoriales PTK (X1 , . . . , Xn ) y PTK+d (X1 , . . . , Xn ), existe una única
matriz Hf con coordenadas en el cuerpo K con N (T + d, n) filas y N (T, d) columnas que
representa a ηf en esas bases. Puede observarse que, jugando con el orden monomial prefijado,
las columnas de la matriz Hf vienen dadas por ceros y por los coeficientes de f en la base
monomial M (PTK ), ocupando los lugares oportunos. En un cierto sentido, esta matriz Hf
extiende al caso multivariado la matriz Sf introducida, para el caso univariado, en la Proposición
3.6.14 de la Subsección ??.
Lema 8.5.21. Con las notaciones precedentes, dado f ∈ K[X1 , . . . , Xn ] u polinomio de grado d
se tiene:
Para cada h ∈ PTn+d (X1 , . . . , Xn ), sea H la columna de sus coeficientes en la base M (PTK+d ),
orenada con respecto al orden monomial prefijado. Entonces, f divide a h si y solamente si el
siguiente sistema de ecuaciones lineales posee solución en K N (T,n) :
Hf · Z = H,
donde
 
Zµ0
 Zµ1 
Z :=  .. ,
 
 . 
ZµN (T ,n) −1
es el vector columna de los posibles coeficientes de un polinomio en PTK (X1 , . . . , Xn ) ordenados

por el orden monomial prejijado (como en la Definición 26, en los ).
Demostración. Es mera transcripción al lenguaje del Álgebra Lineal de las propiedades

que definen los distintos objetos.
Sea s ∈ N un número entero positivo. Consideremos ahora el espacio vectorial sobre K dado
por el producto cartesiano siguiente:
s
Y
P(T
K
) (X1 , . . . , Xn ) := PTK (X1 , . . . , Xn ) := {(g1 , . . . , gs ) ∈ K[X1 , . . . , Xn ]s : deg(gi ) ≤ T }.
i=1
Sobre él podemos considerar la base inducida, como espacio producto, por las respectivas bases
monomiales M (PTK ) en cada uno de los multiplicandos. Ciha base B(T s
) viene dada por la
siguiente igualdad:
s
[
B(T
s
{0}i−1 × M (PTK ) × {0}s−i .

) :=
i=1
Y el número de sus elementos es sN (T, n).

Consideremos ahora una lista de polinomios f1 , . . . , fs ∈ K[X1 , . . . , Xn ] de grados acotados por
d y consideremos la aplicación lineal siguiente:
Qs K K
η(f1 ,...,fs ) : i=1 PT (X1 , . . . , Xn ) −→ PT +d P(X 1 , . . . , Xn )
s
(g1 , . . . , gs ) 7−→ i=1 gi fi .
Lema 8.5.22. Con las notaciones precedentes, fijando las bases B(T
s
) y M (PK ) las bases mono-
T
miales respetivas en los espacios de entrada y salida de η(f1 ,...,fs ) existe una única matriz
(T )
H(f1 ,...,fs ) con coordenadas en K, con N (T + d, n) filas y sN (T, n) que representa la aplicación
lineal η(f1 ,...,fs ) . Más aún, consideremos el vector columna

 
1
0
 
1 := 0 ,
 
 .. 
.
0
correspondiente al elemento 1 ∈ PTK+d (X1 , . . . , Xn ) en la base ordenada por el orden monomial
seleccionado en PTK+d (X1 , . . . , Xn ). Entonces, son equivalentes:
i) Existen g1 , . . . , gs ∈ K[X1 , . . . , Xn ] polinomios de grado a lo sumo T tales que
1 = g1 f1 + · · · + gs fs .
ii) El siguiente sistema de ecuaciones lineales es compatible:
 (1) 
Z
H(f ,...,f ) ·  ...  = 1,
(T )  
1 s
Z(s)
donde para cada i, 1 ≤ i ≤ s, se tiene
(i)
 
Zµ0
(i)
Zµ1
 
(i)
 
Z := 
 .. ,
.

 
(i)
ZµN (T ,n) −1
es el vector columna de los posibles coeficientes de un polinomio en PTK (X1 , . . . , Xn ),
ordenados por el orden monomial prefijado.
Demostración. Es simplemente la transcipción de la linearidad de η(f1 ,...,fs ) al lenguaje
de matrices y vectores.
(T )
Nótese que la matriz de H(f1 ,...,fs ) de la aplicación lineal η(f1 ,...,fs ) tiene un apsecto como el
siguiente:
s
(T )
X
H(f1 ,...,fs ) := H
g fi ,
i=1
Qs
donde H
g fi es la matriz Hfi extendida mediante zeros al producto cartesiano i=1 PTK (X1 , . . . , Xn ).
A partir de aquı́, el procedimiento que podemos definir es el siguiente:
Algoritmo 8.5.23. Input: Una lista de polinomios f1 , . . . , fs ∈ K[X1 , . . . , Xn ] con coefi-

cientes en el cuerpo K.
Output: Una respuesta Sı́ o No a la fórmula de primer orden:

∃x1 ∈ K, · · · , ∃xn ∈ K, f1 (x1 , . . . , xn ) = 0, . . . , fs (x1 , . . . , xn ) = 0.
Procedimiento:
eval una cota de D(d, n, s), por ejemplo
T := max{3, n}n .
Siguiendo el Lema precedente:
eval las matrices: Hf1 , . . . , Hfs .
(T )
eval la matriz: H(f1 ,...,fs ) .
decide whether sl siguiente sistema de ecuaciones lineales es o no compatible:
 (1) 
Z
(T )  .. 
(8.5.5) H(f1 ,...,fs )  .  = 1,
Z(s)
Las notaciones son las del Lema precedente.

Output: if el sistema (8.5.5) es compatible, then ouput No
else output Sı́
end
Teorema 8.5.24. Sea K un cuerpo computable de ceracterı́stica distinta de 2 y sea K un cuerpo

algebraicamente cerrado que le contiene. Existe un algoritmo que realiza la tera siguiente:
Dados como inputs polinomios {f1 , . . . , fs } ∈ K[X1 , . . . , Xn ], el algoritmo decide si
∃x1 ∈ K, · · · , ∃xn ∈ K, f1 (x1 , . . . , xn ) = 0, . . . , fs (x1 , . . . , xn ) = 0.
El tiempo de ejecución del algoritmo está acotado por un procedimiento que realiza un número
de operaciones en K acotado por:
ω
max{3, d}n + d + n

2
O s ) ≤ O(sω max{3, d}ωn + dωn ),
n
donde ω ≤ 2.7.
Demostración. Se trata simplemente de decidir si el sistema de ecuaciones lineales (8.5.5)
es o no compatible. Para el caso de ceracterı́tica distinta de 2 podemos aplicar la cota de
Bronawell-Caniglia-Galligo-Heintz-Kollár y tendremos
D(d, n, s) ≤ max{3, d}n .
Ahora bien, el sistema de ecuaciones lineales (8.5.5) tiene:
• El número de variables involucradas es el número de variables en Z, es decir,
max{3, d}n + n

D(d, n, s) + n
s ≤s ,
n n
para el caso que nos ocupa es el número de coeficientes estudiado en la Parte 1 del
curso para una listra de s polinomios en n variables de grados acotados por D(d, n, s).
• El número de ecuaciones en el sistema de ecuaciones lineales (8.5.5) es el número
de coeficientes en n variables de un polinomo de grado acotado por D(d, n, s) + d ≤
max{3, d}n + d.
Finalmente, el exponente ω ≤ 2.7 es el exponente (menor estricto que 3) conocido desde los
trabajos de V. Strassen (cf. [Str, 1969]) tal que permite decidir si un sistema de n ecuaciones
lineales en m variables es compatible en tiempo O(max{n, m}ω ).
Corolario 8.5.25. Existe un algoritmo que permite realizar la tarea siguiente:

Dada una secuencia de polinomios f1 , . . . , fs , g1 , . . . , gt ∈ K[Y1 , . . . , Ym , X1 , . . . , Xn ], hallar una
fórmula libre de cuantificadores con coeficientes en K y en las variables {Y1 , . . . , Ym }
Ψ(Y1 , . . . , Ym ),
equivalente a la fórmula
(8.5.6)  
s t
!
^ ^ ^
∃X1 ∈ K, . . . , ∃Xn ∈ K,  (fj (Y1 , . . . , Ym , X1 , . . . , Xn ) = 0) (g` (Y1 , . . . , Ym , X1 , . . . , Xn ) 6= 0) .
j=1 `=1
En particular, la teorı́a de primer orden sobre cuerpos algebraicamente cerrados es decidible y

completa y admite algoritmos de eliminación de cuantificadores.
Demostración. La única idea es reescribir la fórmula (8.5.6) como una fórmula del tipo
del Nullstellensatz, usando el truco siguiente: añadamos una variable Z` para 1 ≤ ` ≤ t, de tal
modo que se observa que la fórmula siguiente:
(∃X1 ∈ K, . . . , ∃Xn ∈ K, g` (Y1 , . . . , Ym , X1 , . . . , Xn ) 6= 0) ,
es equivalente a la fórmula
(∃Z` ∈ K, ∃X1 ∈ K, . . . , ∃Xn ∈ K, Z` g` (Y1 , . . . , Ym , X1 , . . . , Xn ) − 1 = 0) .
Una vez puesta nuestra fórmula en la forma del Nullstellensatz del Teorema precedente, hacemos
crecer el cuerpo considerando L = K(Y1 , . . . , Ym ). Escribimos la correspondiente ecuación lineal
8.6. NULLSTELLENSATZ Y EQUIVALENCIA NATURAL: EL LENGUAJE DE LAS CATEGORÍAS 415
(8.5.5) cuya matriz tiene coordenadas en L. De hecho, las coordenadas están en K[Y1 , . . . , Ym ].
Ahora, el sistema es incompatible si y solamente si ciertos menores de la matriz de coeficientes
del sistema de ecuaciones lineales (8.5.5) son nulos o no. La fórmula Ψ(Y1 , . . . , Ym ) son combi-
naciones booleanas de condiciones de signo sobre los menores de esa matriz. Esos menores son
polinomios en K[Y1 , . . . , Ym ]2. En particular, acabamos de denostrar el Teorema Fundamental
de la Eliminación usando el Nullstellensatz y Álgebra Lineal Elemental. El resto se sigue de
modo obvio.
Observación 8.5.26 (Crı́ticas a este Procedimiento). Este procedimiento es el que subyace
a los intentos de mejorar los Nullstellensatz Efectivos que fueron moda a finales de los años 80 y
principios de los 90, pero que siguen siendo considerados resultados de élite en Matemáticas. Sin
embargo, el método no es óptimo porque la complejidad ni siquiera es simplemente exponencial:
2
está en O(dωn ). Veremos, si es posible a lo largo del curso, que se puede decidir en tiempo
O(d(ω+1)n ) con una complejidad que necesariamente están en Ω(dn ) (al menos para algoritmos
universales). Por tanto, no es recomendable usar este procedimiento por más que sea el más
accesible e inmediato de entender.
8.6. Nullstellensatz y equivalencia natural: El lenguaje de las categorı́as

8.6.1. El lenguaje de las categorı́as. El lenguaje de las categorı́as fue introducido
a mediados de de los años 40 por S. Eilenberg y S. MacLane (cf. [EiMc, 1945]) como un
intento de desarrollar un lenguaje común a diversas ramas de la Matemática y sus interac-
ciones, distinta de la Metamatemática impulsada por la Lógica. Una de las derivaciones del
lenguaje de las Categorı́as fue el desarrollo del Álgebra Homológica. El Álgebra Homlógica
fué introducida por H. Poincaré y D. Hilbert como un intento de interacción entre topologı́a
y álgebra, fundamentalmente, para disponer de grupos más “manejables” que los grupos de
homotopı́a. Posteriormente, el Álgebra Homológica evoluciona aprovechándose del lenguaje de
las categorı́as, hasta convertirse en una parte propia de la Matemática. Esta integración de las
dos ideologı́as se produce en el clásico de H. Cartan y S. Eilenberg [CaEi, 1956]. Un par de
textos clásicos, varias veces re-editados, que constituyen una Introducción a estos temas son
[Mc, 1975] o [HiSt, 1997].
Aquı́ hacemos un resumen acelerado del lenguaje, sin entrar en más detalles por falta de tiempo.
8.6.2. Categorı́as.
Definición 106 (Categorı́as). Una categorı́a es un par C := (Obj C , HomC ), donde:
i) Obj C es una clase formada por conjuntos, cuyos elementos X ∈ Obj C se denominan
objetos de la categorı́a C
ii) HomC es una aplicación que a cada dos objetos X, Y ∈ Obj C les asigna un conjunto
HomC (X, Y ) que se denomina morfismos de la categorı́a C entre los objetos X e Y .
Además, dados tres objetos X, Y, Z ∈ Obj C , existe una transformación:
◦: HomC (X, Y ) × HomC (Y, Z) −→ HomC (X, Z)
(f, g) 7−→ g ◦ f,
y que verifica las siguientes propiedades:
(a) Para cada objeto X ∈ Obj C existe un morfismo IdX ∈ HomC (X, X) tal que para
cada f ∈ HomC (X, Y ) y para cada g ∈ HomC (Z, Y ), se verifica:
f ◦ IdX = f, Idx ◦ g = g.
(b) Dados 4 objetos X, Y, Z, T ∈ Obj C y dados tres morfismos f ∈ HomC (X, Y ),
g ∈ HomC (Y, Z), h ∈ HomC (Z, T ), se tiene:
h ◦ (g ◦ f ) = (h ◦ g) ◦ f.
Ejemplo 8.6.1 (Ejemplos de Categorı́as). Los ejemplos usados en anteriormente sirven para
ilustrar la noción de categorı́as.
2Note el alumno que se trata de los menores que, rudimentariamente, le salı́an en los lejanos cursos
de secundaria en los que se discutı́a si un sistema de ecuaciones lineales con parámetros era compatbile
o no.
i) La Categorı́a de los Espacios Topológicos (E T ): Los objetos Obj E T son los

espacios topológicos, los morfismos HomE T (X, Y ) := C 0 (X, Y ) son las funciones con-
tinuas entre X e Y .
ii) La Categorı́a de los Espacios Vectoriales (E VK ) : Los objetos Obj E VK son
los espacios vectoriales sobre un cuerpo K fijado, los morfismos HomE VK (X, Y ) :=
HomK (X, Y ) son las aplicaciones K−lineales entre X e Y .
iii) La Categorı́a de las Variedades Diferenciables sobre R (M ): Los objetos Obj M
son las variedades diferenciables ( C ∞ , por ejemplo) y los morfismos HomM (X, Y ) :=
C ∞ (X, Y ) son las funciones infinitamente diferenciables entre X e Y .
iv) La Categorı́a de los Grupos (G ): Los objetos Obj G son los grupos, los morfismos
HomG (X, Y ) := Hom(X, Y ) son los morfismos de grupo entre X e Y .
v) La Categorı́a de los Módulos sobre un anillo (R−M od ): Los objetos Obj R−M od
son los R−módulos (R fijado), los morfismos HomR−M od (X, Y ) := HomR (X, Y ) son
los morfismos de R−módulo entre X e Y .
vi) La Categorı́a de los Anillos (R): Los objetos Obj R son los anillos conmutativos
con unidad, los morfismos HomR (X, Y ) := Hom(X, Y ) son los morfismos de anillo
entre X e Y .
vii) · · · et cetera.
El objetivo de la Teorı́a de categorı́as es detectar coincidencias entre diversas categorı́as teniendo

en cuenta solamente los comportamientos de objetos y morfismos. Comencemos, definiendo
algunos tipos elementales de morfismos. Ya vimos en la Definición 9, la forma general de ls
nociones de monomorfismo, epimorfismo e isomorfismo en la categorı́a de grupos. Reincidimos
aqu´o i con la noción general para cualquier categorı́a.
Definición 107 (Tipos elementales de Morfismos). Dados dos objetos X, Y en una cate-
gorı́a C y un morfismo f ∈ HomC (X, Y ), definiremos las condiciones para que f sea
i) Monomorfismo: Decimos que f es un monomorfismo en C si para todo otro objeto T
de C y cualesquiera dos morfismos α1 , α2 ∈ HomC (T, X), se tiene:
f ◦ α1 = f ◦ α1 =⇒ α1 = α2 .
Gráficamente, decimos que f es monomorfismo en la categorı́a C si para todo objeto

T de la categorı́a y cualesquiera dos morfismos α1 , α2 ∈ HomC (T, X), se verifica:
Si el siguiente diagrama es conmutativo:
T f ◦ α1
α1
f
IdT X Y
α2
T f ◦ α2
entonces, α1 = α2 .
ii) Epimorfismo: Decimos que f es un epimorfismo de grupos si para todo grupo (T, ?) y
cualesquiera dos morfismos α1 , α2 : (H, ⊥) −→ (T, ?), se tiene:
α1 ◦ f = α1 ◦ f =⇒ α1 = α2 .
También gráficamente, f es epimorfismo en la categorı́a C si para todo objeto T de la

categorı́a C y para cualesquiera dos morfismos α1 , α2 ∈ HomC (Y, T ), se verifica:
Si el siguiente diagrama es conmutativo:
α1 ◦ f T
α1
f
X Y IdT
α2
α2 ◦ f T
entonces α1 = α2 .
iii) Isomorfismo: Decimos que f es isomorfismo en la categorı́a C si existe un morfismo
g ∈ HomC (X, Y ) tal que:
g ◦ f = IdX , f ◦ g = IdX .
Ejemplos de monomorfismos, epimorfismos e isomorfismos en las distintas categorı́s son cono-

cidos. Si acaso, recordar que, en el caso de espacios topológicos, los isomorfismos se llaman
homeomorfismos, mientras que en el caso de variedades diferenciables o analı́ticas, se habla de
difeomorfismo y, por ejemplo, en el caso de espacios métricos, se tratan las isometrı́as. Son el
mismo concepto aunque en distintas categorı́as.
8.6.3. Functores y equivalencias naturales. Para poder identificar dos categorı́as, el

Álgebra Homológica acude a la noción de functor y de equivalencia natural (introducida por S.
Eilenberg).
Definición 108 (Functor Covariante). Sean C y D dos categorı́as, con objetos Obj C y
Obj D y morfismos HomC (X, Y ), HomD (X 0 , Y 0 ). Un functor covariante F entre las categorı́as
C y D es una transformación con dos ingredientes:
• Una aplicación F : Obj C −→ Obj D , y
• para cada par de objetos X, Y ∈ Obj C una aplicación (que denotaremos con las misma
letra):
F : HomC (X, Y ) −→ HomD (F (X), F (Y )),
verificando las siguientes propiedades:
i) Dados f ∈ HomC (X, Y ) y g ∈ HomC (Y, Z), se tiene:
F (g ◦ f ) := F (g) ◦ F (f ).
ii) Para cada objeto X ∈ Obj C , se tiene:
F (IdX ) = IdF (X) .
Definición 109 (Functor Contravariante). Sea C y D dos categorı́as, con objetos Obj C y
Oy D y morfismos HomC (X, Y ), HomD (X 0 , Y 0 ). Un functor covariante F entre las categorı́as
C y D es una transformación con dos ingredientes:
• Una aplicación F : Obj C −→ Obj D ,
• para cada par de objetos X, Y ∈ Obj C una aplicación (que denotaremos con las misma
letra):
F : HomC (X, Y ) −→ HomD (F (Y ), F (X)),
verificando las siguientes propiedades:
i) Dados f ∈ HomC (X, Y ) y g ∈ HomC (Y, Z), se tiene:
F (g ◦ f ) := F (f ) ◦ F (g).
ii) Para cada objeto X ∈ Oy C , se tiene:
F (IdX ) = IdF (X) .
Ejemplo 8.6.2 (Ejemplos de Functores). Los siguientes son ejemplos de Functores entre
distintas categorı́as, con diversos significados:
i) Consideremos las categorı́as E T de espacios topológicos y R de anillos. Consideremos

una transformación C 0 del tipo siguiente:
• A cada espacio topológico X ∈ Obj E T se le asocia el objeto C 0 (X) := HomE T (X, R) :=
C 0 (X, R) de las funciones continuas de X en R.
• A cada par de espacios topológicos X, Y y a cada morfismo f ∈ C 0 (X, Y ) (es
decir, función contı́nua de X a Y ), le asociamos el morfismo de anillos
C 0 (f ) : C 0 (Y, R) −→ C 0 (X, R),
h 7−→ h ◦ f.
Claramente se trata de un functor contra-variante de la categorı́a de espacios topológicos
en la categorı́a de anillos.
ii) Consideremos un functor de la categorı́a E VK en sı́ misma, que denotaremos por ∗ y
lo llamaremos el paso al espacio vectorial dual.
• A cada espacio vectorial X ∈ Oy EVK se le asocia el objeto X ∗ := HomK (X, K),
usualmente conocido como el espacio dual de X sobre K.
• A cada par de −espacios vectoriales sobre X, Y y a cada morfismo f ∈ HomK (X, Y )
(es decir, a cada aplicación K−lineal) le asociamos la aplicación K−lineal
f∗ : Y ∗ −→ X ∗,
h 7−→ h ◦ f.
Claramente es un functor contra-variante de la categorı́a de espacio vectoriales en sı́
misma.
iii) Consideremos ahora la categorı́a M de las variedades diferenciables y el functor C ∞
de M en la categorı́a R de anillos. Se define análogamente al caso del functor C 0 .
Esto es
• A cada variedad diferenciable X ∈ Obj M se le asocia el objeto C ∞ (X) :=
HomM (X, R) := C ∞ (X, R) de las funciones infinitamente diferenciables de X
en R.
• A cada par de variedades diferenciables X, Y y a cada morfismo f ∈ C ∞ (X, Y )
(es decir, función infinitamente diferebnciable de X a Y ), le asociamos el morfismo
de anillos
C ∞ (f ) : C ∞ (Y ) −→ C ∞ (X),
h 7−→ h ◦ f.
Claramente se trata de otro functor contra-variante.
Definición 110 (Equivalencia Natural entre Functores Covariantes). Sea C y D dos

categorı́as, con objetos Oy C y Obj D y morfismos HomC (X, Y ), HomD (X 0 , Y 0 ). Dos functores
covariantes F y G entre las categorı́as C y D se dicen naturalemente equivalentes si para cada
objeto X ∈ Obj C , existe un isomorfismo ϕX : F (X) −→ G(X) tal que dados X, Y ∈ Obj C y
dado un morfismo cualquiera f ∈ HomC (X, Y ) se verifica:
ϕY ◦ F (f ) = G(f ) ◦ ϕX .
Es decir, el siguiente diagrama es conmutativo:
ϕX
F (X) G(X)
F (f ) G(f )
F (Y ) G(Y )
ϕY
Definición 111 (Equivalencia Natural entre Functores Contravariantes). Se define de

manera análoga al caso covariante, teniendo en cuenta la condición de contravariantes.
Definición 112 (Equivalencia Natural entre Categorı́as). Dos categorı́as C y D se dicen

naturalmente equivalentes si existen functores (covariantes o contravariantes) F entre C y D y
G entre D y C tales que la composición G ◦ F es naturalmente equivalente a la identidad IdC
y F ◦ G es naturalemnte equivalente a la identidad IdD . A los functores F y G se les llama

equivalencias naturales entre las categorı́as C y D.
8.6.4. La categorı́a de las variedades algebraicas afines y los morfimos regulares.
Vamos a tratar de definir los conceptos más elementales relativos a la categorı́a formada por las
variedades algebraicas K−definibles y sus morfismos de transformación: los morfismos regulares
entre variedades o aplicaciones polinomiales. Ya en el Problema 56 iniciamos la senda de
las funciones polinomiales como interpretación semántica de los polinomios, ası́ que vamos a
retomarla.
Definición 113 (Función polinomial sobre una variedad). Sea K un cuerpo, K su
clausura algebraica y V ⊆ An (K) una variedad algebraica K−definible. Llamaremos función
polinomial K−definible sobre V a toda función ϕ : V −→ K tal que existe un polinomio
p ∈ K[X1 , . . . , Xn ] verificando ϕ = pV , es decir,
ϕ(x) = p(x), ∀x ∈ V.
Denotaremos por K[V ] al conjunto de todas las aplicaciones polinomiales definidas en V .
En el caso K = K diremos simplemente que ϕ es una función polinomial sobre V y denotaremos
por K[V ] al anillo correspondiente.
Proposición 8.6.3. Con las notaciones precedentes, el conjunto K[V ] es una K−álgebra con
las operaciones usuales de suma y producto de aplicaciones a valores en el cuerpo K. De hecho,
K[V ] es una K−álgebra finitamente generada (cf. Definición 34) y reducida (i.e. sin elementos
nilpotentes). Más aún, sea IK (V ) ⊆ K[X1 , . . . , Xn ] el ideal de los polinomios con coeficientes
en K que se anulan en V . Entonces, los siguientes anillos son isomorfos como K−álgebras:
∼ K[X1 , . . . , Xn ]/IK (V ).
K[V ] =
Demostración. Es claro que K[V ] es un subanillo de KV con las operaciones usuales.
Además, como K es cuerpo, el anillo KV no tiene elementos nilpotentes y tampoco los tendrá
el subanillo K[V ]. Por la propia definición de función polinomial, tenemos un epimorfismo de
anillos dado por la siguiente aplicación:
ρ : K[X1 , . . . , Xn ] −→ K[V
]
p 7−→ p V ,
donde la restricción es simplemente la función consistente en evaluar p es los puntos de V . Es
un epimorfismo de anillos y es un epimorfismo de K−álgebras (nótese que ρ(λ) es la función
constante λ definida en V ). Obviamente el núcleo es el ideal
ker(ρ) = IK (V ) := {p ∈ K[X1 , . . . , Xn ] : p(x) = 0, ∀x ∈ V },
ya estudiado anteriormente. Por el Primer Teorema de isomorfı́a concluiremos el isomorfismo
anunicado en la proposición.
Definición 114 (Morfismo Regular entre variedades algebraicas). Sea K un cuerpo,

K su clausura algebraica, V ⊆ An (K) y W ⊆ Am (K) dos variedades algebraicas K−definibles.
Una aplicaciı́on polinomial K−definible entre V (también llamado morfismo regular) y W es
una aplicación ψ : V −→ W tal que existen polinomios p1 , . . . , pm ∈ K[X1 , . . . , Xn ] tales que
∀x ∈ V, ψ(x) = (p1 (x), . . . , pm (x)) ∈ W.
En el caso K = K diremos simplemente aplicación polinomial o morfismo regular entre V y W .
Proposición 8.6.4 (La Categorı́a de las variedades algebraicas afines K−definibles).

Con las notaciones precedentes, la siguiente es una Categorı́a descrita a partir de un cuerpo K
y su clausura algebraica:
• Objetos: Son las vareidades algebraicas afines K−definibles V contenidas en un es-
pacio afı́n de dimensión finita An (K) sobre el cuerpo K.
• Morfismos Regulares: Los morfismos entre dos variedades algebraicas afines K−definibles
son las aplicaciones polinomiales entre ellas:
Reg(V, W ) := {ψ : V −→ W : ψ es aplicación polonomial}.
(A)
Denotaremos mediante VK esta categorı́a. Nótese que fijado el cuerpo K su clausura algebraica
K queda determinada de manera unı́voca, y las objetos son subconjuntos de espacios afines sobre
la clausura algebraica de K.
Demostración. Para probar esta Proposición basta con observar que IdV es ciertamente
una aplicación polinomial y que la composición de dos aplicaciones polinomiales es una apli-
cación polinomial. Esta segunda afirmación es de fácil verificación.
Definición 115 (Isomorfismo birregular). Un isomorfimo birregular K−definible entre dos

(A)
variedades algebraicas K−definibles V y W es un isomorfismo en la categorı́a VK . Es decir, un
isomorfismo birregular entre dos variedades K−definibles V y W es una aplicación polinomial
biyectiva ϕ : V −→ W tal que su inversa ϕ−1 : W −→ V es también aplicación polinomial.
En el caso K = K decimos simplemente isomorfismo birregular.
Definición 116 (Morfismo dominante). Un entre dos variedades algebraicas K−definibles

V y W , es una aplicación polinomial ϕ : V −→ W tal que la imagen de V es densa en la
z
topologı́a de Zariski de W , i.e. si ϕ(V ) = W .
En el caso K = K decimos simplemente morfismo dominante.
Proposición 8.6.5 (Morfismo de K−álgebras asociado a un morfismo regular de

variedades). Con las notaciones precedentes, sean V ⊆ An (K) y W ⊆ Am (K) dos variedades
algebraicas K−definibles y sea ϕ : V −→ W un morfismo regular. Definamos la siguiente
aplicación :
ϕ∗ : K[W ] −→ K[V ]
h 7−→ h ◦ ϕ.
Entonces:
i) ϕ∗ es un morfismo de K−álgebras reducidas finitamente generadas.
ii) ϕ∗ es monomorfismo si y solamente si ϕ es un morfismo dominante.
Demostración. La primera afirmación es de sencilla verificación y no necesita una de-
mostración mś significativa. Para la segunda, supongamos que ϕ es un morfismo dominante.
z
Esto significa simplemente que ϕ(V ) = W . Es decir, que dado cualquier polinomio p ∈
K[Y1 , . . . , Ym ] que se anula en ϕ(V ) se anula necesariamente en todo W y, por tanto será un
elemento de IK (W ). Es términos más formales, si p + IK (W ) ∈ ker(ϕ∗ ) es porque el polinomio
p ∈ K[Y1 , . . . , Ym ] satisface que p ◦ ϕ = 0 como aplicación sobre V , lo cual es equivalente a
que p se anule sobre ϕ(V ) y, por lo antedicho, es equivalente p ∈ IK (W ) o, equivalentemente,
p + IK (W ) = 0 en K[W ].
8.6.5. La Categorı́a de las K−álgebras reducidas finitamente generadas.

Definición 117 (La Categorı́a de las K−álgebras reducidas finitamente generadas).
Definimos la Categorı́a de las K−álgebras reducidas finitamente generadas a la categorı́a de-
terminada por los siguientes elementos:
i) Objetos: Los objetos son las K−álgebras reducidas finitamente generadas. Es decir,
los anillos R de la forma:
R = K[X1 , . . . , Xn ]/a,
donde a es un ideal radical (de ahı́ que R sea un anillo reducido).
ii) Morfismos: Los morfismos entre dos K−álgebras reducidas y fintamente generadas
R1
y R2 son simplemente los morfismos de anillos f : R1 −→ R2 , tales que f K = IdK .
Denotamermos por K − Ared a esta categorı́a.
Por lo discutido en este curso es claro que K − Ared es una categorı́a.

Lo expuesto en la subsección precedente, nos permite concluir de manera elemental lo siguiente:
Proposición 8.6.6. La siguiente transformación es un functor contravariante entre las cate-
(A)
gorı́as VK y K − Ared :
(A)
• A cada objeto V ⊆ An (K) de la categorı́a VK le asociamos la K−álgebra reducida
finitamente generada K[V ].
(A)
• A cada morfismo regular ϕ : V −→ W de la categorı́a VK le asociamos el morfismo
de K−álgebras finitamente generadas reducidas:
ϕ∗ : K[W ] −→ K[V ].
Demostración. Esencialmente tenemos que probar que Id∗V = IdK[V ] , lo cual es obvio, y
que dados dos morfismos regulares ϕ : V −→ W y ψ : W −→ Z entre variedades algebraicas
K−definibles, se tiene que los morfismos de K−álgebras satisfacen:
∗
(ψ ◦ ϕ) = ϕ∗ ◦ ψ ∗ .
Pero esa es una propiedad de fácil verificación a partir de las definiciones expuestas.
Proposición 8.6.7 (Morfismo regular inducido por un morfismo de K−álgebras). Con

las notaciones precedentes, sean R y S dos K−álgebras finitamente generadas y reducidas. Y
sea F : R −→ S un morfismo de K−álgebras. Se tiene:
i) Existen V ⊆ An (K) y W ⊆ Am (K) dos variedades algebraicas K−definibles tales que
R∼ = K[V ] = K[X1 , . . . , Xn ]/IK (V ), S ∼
= K[W ] = K[Y1 , . . . , Ym ]/IK (W ).
ii) Consideremos polinomios p1 , . . . , pm ∈ K[Y1 , . . . , Yn ] tales que
F (Xi + IK (V )) = pi ‘ + IK (W ), ∀i, 1 ≤ i ≤ n.
Entonces, el siguiente es un morfismo regular bien definido:
F∗ : W −→ V
y 7−→ (p1 (y), . . . , pn (y)).
iii) El siguiente es un functor contravariante de la categorı́a K − Ared en la categorı́a
(A)
VK :
• A los objetos R dados como K−álgebras reducidas finitamente generadas le aso-
ciamos una variedad algebraica afı́n K−definibe V tal que K[V ] ∼
= R.
• A los morfismos de K−álgebras reducidas F : R −→ S le asociamos el morfismo
regular F∗ : V −→ W descrito anteriormente.
Demostración. La propiedad i) se sigue de manera inmediata de la definición de K−álgebra
reducida finitamente generada y del Nullstellensatz en la versión del “truco” de Rabonowisch.
Hagámoslo para R. Por la definición de K−álgebra finitamente generada (cf. Definición 34) ha
de existir un ideal a propio en un anillo de polinomios K[X1 , . . . , Xn ] con coeficientes en K tal
que existe un isomorfismo de K−álgebras entre
R∼ = K[X1 , . . . , Xn ]/a.
Consideremos ahora V := VA (a). Como R s reducido como anillo, carece de elementos nilpo-
tentes y como el radical se transporta bien en su paso √ al cociente en anillos noetherianos, si R
es reducida entonces a es un ideal radical, esto es, a = a. Por el Nullstellensatz en la versión
de Rainich, tenemos que √
IK (V ) = IK (VA (a)) = a = a.
Por lo que concluimos que
R∼ = K[X1 , . . . , Xn ]/a ∼
= K[X1 , . . . , Xn ]/IK (V ) ∼
= K[V ].
Para probar la segunda propiedad es claro que F∗ : V −→ An (K) es una aplicación polinomial.
Por tanto, s’olo hemos de probar que para cada y ∈ W F∗ (y) ∈ V . Para ello, consideremos
un polinomio cualquiera f (X1 , . . . , Xn ) ∈ K[X1 , . . . , Xn ] que sea anule sobre V . Es decir,
f ∈ IK (V ) o, equivalentemente,
0 + IK (V ) = f + IK (V ) = f (X1 + IK (V ), . . . , Xn + IK (V )), en K[V ].
Pero, entonces, F (f + IK (V ) = 0. Es decir, 0 + IK (W ) = F (f + IK (V )), pero como F es
morfismo de K−álgebras las imágenes de productos y sumas se transforman en productos y
sumas y las constantes en K se transforman en constantes en K. Esto siginifica que
F (f + IK (V )) = f (F (X1 + IK (V )), . . . , F (Xn + IK (V ))) ,
es decir,
0 + IK (W )F (f + IK (V )) = f (p1 + IK (W ), . . . , pn + IK (W )) = f (p1 , . . . , pm ) + IK (W (.
Por tanto, f (p1 , . . . , pn )(y) = f (p1 (y), . . . , pn (y)) = 0 para cada y ∈ W o, equivalentemente,
F∗ (y) ∈ VA (f ), para cada f ∈ IK (V ). Es decir, F∗ (y) ∈ V y F∗ : W −→ V es una aplicación
polinomial bien definida.
La afirmación iii) es de mera verificación para el lector.
8.6.6. Nullstellensatz como Equivalencia Natural. Como consecuencia de los dos

functores contravariantes construidos tenemos la interpretación final del Nullstellensatz de
Hilbert-Kronecker buscada:
Teorema 8.6.8 (Nullstellensatz como Equivalencia Natural). Los dos functores (∗ ,∗ )
(A)
antes descritos definen una equivalencia natural entre las categorı́as VK y K − Ared .
Demostración. Se trata, esneicalmente, de probar que si F : R −→ S es un morfismo en-
tre dos K−álgebras reducidas finitamente generadas. Si R ∼ = K[V ], S ∼= K[W ] y consideramos
F∗ : W −→ V es la aplicación polinomial asociada entre V y W . Y si, de nuevo, consideramos
el morfismo de anillos (F∗ )∗ : K[W ] −→ K[V ], entonces, los isomorfismos de K−álgebras entre
R y K[V y S con K[W ] se comportan bien como equivalencias naturales.
8.7. Variaciones del Nullstellensatz en otros contextos (Cultura General)

El Nullstellensatz y su filosofı́a de identificar objetos (tı́picamente geométricos) con los anil-
los de funciones ha influenciado mucho del pensamiento geométrico a lo largo del siglo XX.
Aquı́ mostraremos tres ejemplos sencillos cuyos fundamentos hablan de objetos culturalemente
conocidos por los alumnos.

Stone-. Una variación clásica del Nullstellensatz es el famoso Teorema de Banach-Čech-Gel’fand-
Stone-Kolmogorov (y algún otro autor que, probablemente, descubirán un resultado análogo
por el camino. (Véase, por ejemplo, el trabajo reciente H.-L. Gau, J.-S. Jeang, N.-C. Wong,
An algebraic approach to the Banach-Stone Theorem for separating linear bijections. Tai. J. of
Math. 6 (2002) 399-403.). Una demostración del mismo pude consultarse en [GiJe, 1976]. No
inistiremos aquı́ en su historia, pero este resultado afirma lo siguiente:
Teorema 8.7.1 (Banach-Stone-Čech-Gel’fand-Kolmogorov). Si X es un espacio topológico
compacto, entonces X es homemorfo al espectro maximal de C (X).
Una versión equivalente en términos de equivalencia natural entre categorı́as (recuérdese la

Definición en 112) puede ser la siguiente:
Teorema 8.7.2 (Banach-Stone-Čech-Gel’fand-Kolmogorov). Si X, Y son dos espacios
topológicos compactos de Hausdorff y f : X −→ Y es una función continua tal que C 0 (f ) es
isomorfismo de R−álgebras entre C 0 (X) y C 0 (Y ), entonces f es un homeomorfismo.
En realidad el resultado en más completo y afirma lo siguiente:

Corolario 8.7.3. Sea E Tcompact la categorı́a de los espacios topológios compactos. Entonces,
existe una equivalencia natural entre E Tcompact y la subcategorı́a de anillos determinada por
las R−álgebras de la forma C (X, R), donde X es una espacio topológico compacto.
Dicho de otro modo, ambas categorı́as son equivalentes y lo mismo da estudiar los espacios
topológicos compactos o esta subclase de la categorı́a de anillos. Éste es el propósito de es-
tablecer equivalencias naturales: establecer conexiones entre teorı́as matemáticas que permitan
transferir en ambos sentidos información, resultados y, por ende, conocimiento.
8.7. VARIACIONES DEL NULLSTELLENSATZ EN OTROS CONTEXTOS (CULTURA GENERAL) 423
8.7.2. Variación de un segundo tema clásico: El Lema de Urysohn y el Teorema

de Extensión de Tietze.
Definición 118 (Espacio Topológico Normal). Un espacio topológico (X, T ) se dice nor-
mal si verifica la siguiente propiedad para sus cerrados: Dados dos cerrados F, G ∈ T c , disjun-
tos, existen dos abiertos A, B ∈ T tales que F ⊆ A, G ⊆ B y A ∩ B = ∅.
Ejemplo 8.7.4. Unos pocos ejemplos convencionales: espacios métricos, espacios compactos
de Hausdorff. Mientras que Cn es normal con la topologı́a usual y no lo es con la topologı́a de
Zariski.
Teorema 8.7.5 (Lema de Urysohn). Sea X un espacio topológico normal, dados F, G dos
cerrados en X, existe una función continua f ∈ C (X) tal que f (X) ⊆ [0, 1] y se tiene:

f = 0, f = 1.
F G
Este resultado es conocido como el primer resultado no trivial en Topologı́a. Se puede obvia-
mente probar que un espacio topológico es normal si y solamente si verifica la propiedad descrita
en el Lema de Urysohn. Una de sus consecuencias más famosas es el siguiente resultado:
Teorema 8.7.6 (Teorema de Extensión de Tietze-Urysohn). Sea F un cerrado en un
espacio topológico normal X. Entonces, para cada función continua f ∈ C (F ) existe una
función continua ϕ ∈ C (X) tal que
ϕF = f.
Una interpretación casi inmediata del Teorema de Tietze (en nuestro contexto) es la siguiente.
Consideremos X un espacio topológico y sea F ⊆ X un cerrado. Tenemos un morfismo de
anillos dado por la restricción:
ρ : C (X) −→ C (F ),

ϕ 7−→ ϕ . F
Claramente se trata de un morfismo de anillos y se tiene el siguiente enunciado equivalente del
Teorema de Tietze:
Teorema 8.7.7 (Teorema de Extensión de Tietze-Urysohn, versión 2). Con las anteri-
ores notaciones, si X es un espacio topológico normal, entonces ρ es un epimorfismo de anillos,
Ker(ρ) = I(F ) y se tiene el siguiente isomorfismo de anillos:
C (F ) =∼ C (X)/I(F ).
8.7.3. Variación de un tercer tema clásico: Extensión de funciones en Var-

iedades Diferenciables. Un recubrimiento abierto {Ui : i ∈ I} de un espacio topológico
(X, T ) es una familia de abiertos {Ui : i ∈ I} ⊆ T que “recubren” X, i.e.
[
X⊆ Ui .
i∈I
Un refinamiento de un cubrimiento abierto {Ui : i ∈ I} de un espacio topológico (X, T ) es

otro recubrimiento por abiertos {Vj : j ∈ J} tal que para cada j ∈ J, existe i ∈ I satisfaciendo
Vj ⊆ Ui .
Definición 119 (Espacio topológico paracompacto). Un espacio topológico paracompacto
es un espacio topológico (X, T ) tal que todo recubrimiento posee un refinamiento localmente
finito. Es decir, dado un recubrimiento por abiertos {Ui : i ∈ I} de X, existe un refinamiento
abierto {Vj : j ∈ J} tal que para cada x ∈ X, el refinamiento satisface:
] ({j ∈ J : x ∈ Vj ) < ∞.
Definición 120 (Partición de la Unidad). Sea X un espacio topológico, una partición de

la unidad es una familia de funciones continuas {ϕi : i ∈ I} ⊆ C (X) verificando:
• Para cada x ∈ X, el cardinal de los i ∈ I tales que ϕi (x) 6= 0 es finito.
• Para cada x ∈ X, X
ϕi (x) = 1.
i∈I
Se dice que una partición de la unidad {ϕi : i ∈ I} ⊆ C (X) está subordinada a un cubrimiento
abierto {Ui : i ∈ I} de X si supp(ϕi ) ⊆ Ui para cada i ∈ I 3.
Teorema 8.7.8. Si X es un espacio topológico paracompacto, entonces posee particiones de la

unidad y particiones de la unidad subordinadas a cubrimientos abiertos.
Las variedades diferenciables, cuando aparezcan en los ejemplos, se suponen siempre paracom-
pactas.
Teorema 8.7.9. Dada una variedad diferenciable (paracompacta) M y un cubrimiento abierto
de M , existe un subcubrimiento abierto localmente finito y una partición de la unidad {fi : i ∈
I} subordinada al subcubrimiento y tal que para cada i ∈ I, fi ∈ C ∞ (M ).
El Teorema 7.2.9 es consecuencia de la existencia de particiones de unidad en variedades para-
compactas.
Definición 121 (Funciones lisas en un cerrado). Sea F un cerrado en una variedad difer-
enciable M , una función continua f : F −→ R se dice que es C ∞ sobre F si para cada x ∈ F ,
existen un entorno abierto Ux de x en M y una función C ∞ , ϕx : Ux −→ R tal que

ϕx = f
Ux ∩F
. F ∩Ux
Se denota por C ∞ (F ) al anillo de las funciones lisas definidas sobre F .
Corolario 8.7.10. Con las anteriores notaciones, para cualquier cerrado F en X, la re-
stricción:
ρ : C ∞ (M ) −→ C ∞ (F )

ϕ 7−→ ϕ , F
es un epimorfismo de anillos. Más aún, el siguiente es un isomorfismo de anillos:
C ∞ (F ) ∼
= C ∞ (M )/I(F ).
8.8. Ejericios y Problemas sobre el Nullstellensatz

Problema 292. Prueba el Corolario 8.5.15. Es decir, prueba la afirmación siguiente:
Sea K un cuerpo infinito, K su clausura algebraica y Spec(K[X1 , . . . , Xn ] el espectro primo del
anillo K[X1 , . . . , Xn ]. Entonces la siguiente aplicación es una biyección:
IK : {V ⊆ An (K) : V es K−definible irreducible} −→ Spec(K[X1 , . . . , Xn ])
V 7−→ IK (V ).
La inversa de esta aplicación es la aplicación dada por:
VA : Spec(K[X1 , . . . , Xn ]) −→ {V ⊆ An (K) : V es K−definible irreducible}
p 7−→ VA (p).
Problema 293. Prueba el Corolario 8.5.17. Es decir, prueba la afirmación siguiente:
Sea K un cuerpo infinito, K su clausura algebraica, Pn (K) el espacio proyectivo de dimensión
n sobre K. La siguiente es una biyección entre los ideales homogéneos radicals y las variedades
algebraicas proyectivas K−definibles. Es decir, consideremos los conjuntos
V arK (Pn (K)) := {V ⊆ Pn (K) : V algebraica K−definible},
y
(hom) √
RadK := {a ( K[X0 , . . . , Xn ] : a ideal homogéneo, a = a}.
(P) (hom)
IK : V arK (Pn (K)) −→ RadK
(P)
V 7−→ IK (V ).
3Recuérdese que el soporte supp(f ) de una función es la clausura del conjunto de puntos donde la
función no se anula.
8.8. EJERICIOS Y PROBLEMAS SOBRE EL NULLSTELLENSATZ 425

(hom)
VP : RadK −→ V arK (Pn (K))
a 7−→ VP (a).
De hecho, se tiene
(P) √
IK (VP (a)) = a.
Problema 294 (Ideales primos homogéneos y variedades proyectivas irreducibles).
Prueba el Corolario 8.5.18. Es decir, prueba la afirmación siguiente:
Sea K un cuerpo infinito, K su clausura algebraica, Pn (K) el espacio proyectivo de dimensión n
sobre K. La siguiente es una biyección entre los ideales primos homogéneos y las variedades al-
gebraicas proyectivas K−definibles e irreducibles. Es decir, consideremos el siguiente conjunto:
Proj(K[X0 , . . . , Xn ]) := {p ∈ Spec(K[X0 , . . . , Xn ]) : p ( m0 , p homogéneo},
denominado el espectro homogéneo del anillo K[X0 , . . . , Xn ] con la graduación habitual. Con-
sideremos también el conjunto:
IrredK (Pn (K)) := {V ⊆ Pn (K) : V 6= ∅ algebraica, K−definible e irreducible}.
(P)
IK : IrredK (Pn (K)) −→ Proj(K[X0 , . . . , Xn ])
(P)
V 7−→ IK (V ).
VP : Proj(K[X0 , . . . , Xn ]) −→ IrrK (Pn (K))
a 7−→ VP (a).
Problema 295 (Puntos proyectivos y sus ideales, caso K = K). Prueba el Corolario
8.5.19. Es decir, prueba la afirmación siguiente:
Supongamos K = K un cuerpo algebraicamente cerrado y sea Pn (K) el espacio proyectivo de
dimensión n sobre K. La siguiente es una biyección entre los puntos proyectivos en Pn (K) y
algunos ideales (no maximales) de K[X0 , . . . , Xn ]. Consideremos x = (z0 : · · · , zn ) ∈ Pn (K)
dado por sus coordenadas homogéneas. Definamos el ideal en Proj(K[X0 , . . . , Xn ] siguiente:
m(P)
z := ({zj Xj − zj Xi : 0 ≤ i, j ≤ n}) ∈ Proj(K[X0 , . . . , Xn ]),
es decir, el ideal generado por los menores 2 × 2 de la matriz:

z0 z1 · · · zn
.
X0 X1 · · · Xn
La siguiente es una biyección:
(P) (P)
IK : Pn (K) −→ {mz ∈ Proj(K[X0 , . . . , Xn ]) : z ∈ Pn (K)}
(P)
z 7−→ IK ({z}).
(P)
VP : {mz : z ∈ Pn (K)} −→ Pn (K)
(P) (P)
mz 7−→ VP (mz ).
8.8.1. La topologı́a de Zariski en el espectro de un anillo. Haremos su pre-
sentación como un sencillo problema. Recuérdese la noción de espacio topológico noetheriano
introducido en el Problema 282. La idea de introducir una topologı́a de Zariski en Spec(R)
está fuertemente inspirada en el Nullstellensatz. Si, al cabo, las variedades algebraicas están
identificadas con los ideales radicales y los puntos con los maximales tendrı́a sentido introducir
una topologı́a de Zariski en MaxSpec(R) para cualquier anillo R. Sin embargo, MaxSpec(R)
se porta mal para morfismos entre anillos (la contracción de un ideal maximal no siempre es
maximal), con lo que nos vemos forzados a enriquecer a MaxSpec(R) con “puntos” que no se
ven: esos puntos son los elementos de Spec(R) y el siguiente problema resume cómo se comporta
la topologı́a de Zariski en Spec(R).
Problema 296 (La topologı́a de Zariski en Spec(R)). Comencemos con un aspecto nota-
cional: Sea R un anillo, p ∈ Spec(R) y f ∈ R. Denotemos mediante f (p) la clase f + p ∈ R/p.
Nótese que es una notación, aunque no debe entenderse f funcionalmente, pero nos permite
definir los siguientes conjuntos. Dado a un ideal de R, definamos
V (a) := {p ∈ Spec(R) : f (p) = 0 ∈ R/p}.
Del mismo modo, dado F ⊆ Spec(R) podemos definir
I(F ) := {f ∈ R : f (p) = 0, ∀p ∈ F }.
Probar las afirmaciones siguientes:
i) V (a) = {p ∈ Spec(R) : p ⊇ a}. En particular, pruébese que V (a) es biyectable con
Spec(R/a).T
ii) I(F ) := {p ∈ Spec(R) : p ⊇ (F )}, donde (F ) es el ideal geberado por F .
iii) Existe una única topologı́a en Spec(R) cuyos cerrados son los subconjuntos de la forma
V (a) (llamada topologı́ de Zariski en el espectro Spec(R)).
iv) Un subconjunto F ⊆ Spec(R) es cerrado si y solamente si V (I(F )) = F .
v) Definimos elemento nilpotente módulo un ideal a de R como un elemento f ∈ R tal
que el morfismo de R−módulos siguiente es nilpotente:
ηf : R/a −→ R/a
h + a 7−→ f h + a.
Pruébese que el conjunto de todos los√elementos nilpotentes con respecto a un ideal a
es un ideal de R. Denotaremos √ por a a ese ideal y lo denominaremos radical del
ideal a y lo denotaremos
√ por a. Diremos que un ideal a es radical si coincide con su
su radical (i.e. si a = a) √
vi) Pruébese que para cada ideal a de R, a = I(V (a)).
vii) Existe una biyección entre los ideales radicales de R y los cerrados de Spec(R) para la
topologı́a de Zariski.
viii) Dado un morfismo de anillos ϕ : R −→ T , la aplicación
Spec(ϕ) : Spec(T ) −→ Spec(R)
p 7−→ pc := ϕ−1 (p),
es una aplicación continua para las respectivas topologı́as de Zariski.
Problema 297 (Noetherianidad en Spec(R)). Con las notaciones del problema precedente,
consideremos R un anillo notheriano y sea Spec(R) su espectro primo con la topologı́a de Zariski.
Pruébese que se verifican las siguientes propiedades:
i) Todo cerrado para la topologı́a de Zariski de Spec(R) puede ser dado como la inter-
sección finita de cerrados de la forma
V (f ) := {p ∈ Spec(R) : f (p) = 0},
con f ∈ R.
ii) Todo abierto para la topologı́a de Zariski de Spec(R) puede ser dado como la unión
finita de abiertos de la forma
D(f ) := {p ∈ Spec(R) : f (p) 6= 0},
con f ∈ R.
iii) Los cerrados de Spec(R) verifican la Condición de Cadena Descendente para
Cerrados, i.e. toda cadena numerable descendente de cerrados de Spec(R):
V0 ⊇ V1 ⊇ V2 ⊇ · · · ⊇ Vn ⊇ · · · ,
se estabiliza.
iv) Los abiertos de Spec(R) verifican la Condición de Cadena Ascendente para
abiertos, i.e. toda cadena numerable ascendente de abiertos de Spec(R):
A0 ⊆ A1 ⊆ A2 ⊆ · · · ⊆ Vn ⊇ · · · ,
se estabiliza.
v) Bajo el Axioma de Elección Dependiente, toda familia no vacı́a de cerrados de Spec(R)
para la topologı́a de Zariski posee elemento minimal.
8.9. META-MATEMÁTICA DE PRIMER ORDEN SOBRE CUERPOS 427
vi) Bajo el Axioma de Elección Dependiente, toda familia no vacı́a de abiertos de Spec(R)
para la topologı́a de Zariski posee elemento minimal.
vii) Todo cerrado en Spec(R) para la topologı́a de Zariski es quasi-compacto.
viii) Todo abierto en Spec(R) para la topologı́a de Zariski es quasi-compacto.
8.9. Meta-matemática: La Teorı́a de Primer Orden sobre los Complejos admite

Eliminación de Cuantificadores (Opcional, no se imparte en esta forma).
8.9.1. Teorı́a de Primer Orden sobre cuerpos algebraicamente cerrados. La Meta-
matemaática, o la Lógica Formal, son términos que definen el campo que estidia, con métodos
matemáticos, la Matemática “per se”, como objeto de estudio. Para ello, no estudio las dis-
tintas ramas de la Matemática sino la Matemática y sus procedimientos deductivos. Esto se
hace a través del análisis de las Teorı́as Formales o Teorı́as Axiomáticas. En esas teorı́as,
expresiones involucrando uantificadores y expresiones elementales de una teroı́a vienen a ser
llamadas Lógica de Primer Orden o Teorı́a de Primer Orden. Una de las primeras de las que
se supo que era completa (es decir, Tautologı́a -también llamada Verdad- es equivalente a lo
demostrable, también llamado Teorema) y decidible (es decir, podemos decidir la verdad o
falsedad de una expresión mediante algoritmos) es la Teorı́a de Primer Orden de Cuerpos Alge-
braicamente Cerrados. Desde la tesis de K. Gödel sabemos que hay muchas Teorı́a incompletas
e indecidibles. Y la clave para probar ambas propiedades en el caso de cuerpos algebraicamente
cerrados es el Nullstellensatz. Lo que se hace es simplemente desmostrar que se pueden eliminar
bloques de cuantificadores (existenciales como ∃ o universales como ∀) y obtener fórmulas sin
ciantificadores de la misma teorı́a.
Analicemos un poco esa formulación, sin entrar en profundidad en los detalles. Por simplicidad
supongamos K = Q y K = C que, aunque no es la clausura algebraica de Q admite la misma
formulación.
Consideremos todas las expresiones que se pueden escribir usando los siguientes elementos y
sus combinaciones naturales (definen un lenguaje regular):
• Un conjunto numerable de variables {Xn : n ∈ N},
• Un conjunto de constantes {0, 1, −1},
˙ y la inversión sobre las constantes
• Operaciones usuales de la teorı́a de anillos ({+, −, })
−1
no nulas { }.
• Condiciones de signo {= 0}.
• Operadores booleanos {∨, ∧, ¬}.
• Cuantificadores que afectan a elementos de K: {∀, ∃}.
Unas pocas observaciones:
i) Las constantes son los objetos que puedo construir usando {−1, 0, 1} y las operaciones
elementales de cuerpo {+, −, }. ˙ Luego se trata de los número naturales Z.
ii) Si admito la inversión de constantes no nulas ({−1 }) tengo el cuerpo de los racionales
Q.
iii) Las funciones se obtienen mezclando constantes (en Q), variables y las operaciones de
anillo {+, −, }, ˙ son los polinomios en un número finito de variables Q[X0 , . . . , Xn ].
iv) Las fórmulas atómicas son, expresiones de la forma f (X0 , . . . , Xn ) = 0, con f ∈
Q[X0 , . . . , Xn ] un polinomio en un número finito de variables. Usualmente, de admiten
como fórmulas atómicas las negaciones de las anteriores, es decir, ¬(f (X0 , . . . , Xn ) =
0) o, equivalentemente, f (X0 , . . . , Xn ) 6= 0.
v) Se admiten coombinaciones booleanas de fórmulas atómicas. Se pede probar que todas
se pueden escribir como:
  !
n
_ ^k ^ ^ t
 (fi,j = 0) (gi,` 6= 0) .
i=1 j=1 `=1
Una de las primeras observaciones casi inmediatas es que se puede suponer que todas las
fórmulas son estudiables en forma pre-nexa, es decir, con los cuantifidaores por delante. Suponiendo
que fi,j , hi,j ∈ K[X0 , . . . , Xn ], una fórmula se primer orden en el lenguaje de cuerpos algebra-
caente cerrados en forma pre-nexa es una fórmula del tipo:
  !
_n k
^ ^ ^ t
Q1 Xi1 , . . . , Qr Xir ,  (fi,j = 0) (gi,` 6= 0) ,
i=1 j=1 `=1
donde Qi ∈ {∀, ∃} son cuantificadores. Si los cuantificadores son todos del tipo Qi ∈ {∃},
decimos que es una fórmula existencial o que sólo involucra un bloque de cuantificadores exis-
tenciales.
La Semántica de esas fórmulas consiste en interpretar (instanciar o sustituir variables por
constantes en un dominio) las fórmulas con subconjuntos de An (K), donde K es algebraicamente
cerrado:
i) Ası́, un átomo, f (X0 , . . . , Xn ) = 0 se iterpreta como el conjunto algebraico
V (f ) := {x = (x0 , . . . , xn ) ∈ Kn+1 : f (x) = 0}.
ii) Una fórmula del tipo:
 
k
^
 (fi,j (X0 , . . . , Xn ) = 0) ,
j=1
se interpreta con la variedad algebraica (también llamado cerrado en la topologı́a de

Zariski) VA (ai ) donde ai es el ideal generado por fi,1 , . . . , fi,m . Es decir, con
k
\
V (fi,1 , . . . , fi,m ) = {x ∈ Kn+1 : fi,j (x) = 0} = VA (ai ).
j=1
De hecho, el Teorema de la Base indica que todo V (a), para cualquier ideal a de
K[X0 , . . . , Xn ] se puede escribir mediante una fórmula de este tipo.
iii) Una negación de un átomo f (X0 , . . . , Xn ) 6= 0 se identifica con el complementario de
un conjunto algebraico dado por una sola ecuación:
V (f )c := {x = (x0 , . . . , xn ) ∈ Kn+1 : f (x) 6= 0}.
Son los abiertos de la base de la toplogı́a de Zariski.
iv) Las fórmulas del tipo:
t
!
^
(gi,` (X0 , . . . , Xn ) 6= 0) ,
`=1
también se interpretan como elementos de la base de abiertos de la topologı́a de Zariski

dado que:
t
! t
!
^ Y
n+1 n+1
{x ∈ K : (gi,` (x) 6= 0) } = {x ∈ K : (gi,` (x) 6= 0) }.
`=1 `=1
v) Las fórmulas del tipo:

r t
!
_ ^
(gi,` (X0 , . . . , Xn ) 6= 0) ,
i=1 `=1
también se interpretan como abiertos de la topologı́a de Zariski dados como uniones

finitas de intersecciones de abiertos de la base de la topologı́a de Zariski:
r t
!
[ \
n+1
{x ∈ K : (gi,` (x) 6= 0)} .
i=1 `=1
Por culpa de la condición noetheriana (Teorema de la Base de Hilbert) todos los

abiertos de la topologı́a de Zariski serán uniones finitas de abiertos de la base y, por
tanto, expresables mediante fórmulas de este tipo.
8.9. META-MATEMÁTICA DE PRIMER ORDEN SOBRE CUERPOS 429
vi) Las fórmulas del tipo:

  !
k
^ ^ t
^
 (fi,j = 0) (gi,` 6= 0)
j=1 `=1
se interpretan como conjuntos que son intersección de un abierto y un cerrado en la

topologı́a de Zariski.
  !
k
^ ^ ^ t
n+1
Si := {x ∈ K :  (fi,j = 0) (gi,` 6= 0) }.
j=1 `=1
Es decir, se tiene
  !
\k \ t
\
Si =  {x ∈ Kn+1 : fi,j = 0} {x ∈ Kn+1 : gi,` 6= 0}  .
j=1 `=1
Se llaman, obviamente, localmente cerrados en la topologı́a de Zariski.

vii) Las uniones finitas de localmente cerrados se denominan constructibles de la toplogı́a
de Zariski y, obviamente, son dados por fórmulas de la forma siguiente:
  !
_s ^k ^ ^ t
 (fi,j = 0) (gi,` 6= 0) ,
i=1 j=1 `=1
que son interpretadas como el conjunto:

  !
s
[ \k \ t
\
C :=  {x ∈ Kn+1 : fi,j = 0} {x ∈ Kn+1 : gi,` 6= 0}  ,
i=1 j=1 `=1
s t
!!
[ \ \
C := VA (fi,1 , . . . , fi,k ) {x ∈ Kn+1 : gi,` 6= 0} .
i=1 `=1
Teorema 8.9.1 (Teorema Fundamental de la Teorı́a de la Eliminación, versión Cheval-

ley). Sea C ⊆ Kn+1 un conjunto constructible y sea π : Kn+1 −→ Kr una proyección. Entonces,
π(C) ⊆ Kn+1 es también constructible.
En otras palabras, sea C ⊆ Kn+1 un conjunto constructible dado por una fórmula Φ(X0 , . . . , Xn )
sin cuantificadores. Sea π : Kn+1 −→ Kr la proyección dada mediante:
π: Kn+1 −→ Kr
(x0 , . . . , xn ) 7−→ (xn−r+1 , . . . , xn ).
La proyección π(C) es el conjunto dado por la fórmula
∃Xn−r+1 ∈ K, . . . , ∃Xn ∈ K, Φ(X0 , . . . , Xn ).
El Teorema afirma que existe una fórmula de primer orden libre de cuantificadores Ψ de la
forma
  !
n
_ k
^ t
^ ^
Ψ(X0 , . . . , Xn−r ) :=  (fi,j (X0 , . . . , Xn−r ) = 0) (gi,` (X0 , . . . , Xn−r ) 6= 0) ,
i=1 j=1 `=1
tal que
π(C) := {x ∈ Kn−r+1 : Ψ(x0 , . . . , xn−r )}.
Por tanto, toda fórmula con cuantificadores existencias es equivalente a una fórmula sin cuan-
tificadores (se dice libre de cuantificadores). Como los constructibles son cerrados por comple-
mentación y ∀ se interpreta mediante ¬ (∃¬(...)), podemos concluir.
Teorema 8.9.2. Toda fórmula de primer orden del lenguajde de cuerpos algebraicamente cer-
rados es semánticamente equivalente a una fórmula libre de cuantificadores. Luego la teorı́a es
completa. Además es decidible, es decir, existe un algoritmo que elimina los cuantificadores de
la fórmula cuantificada.
Glosario de Términos
abierto distinguido (Zariski), 344 cociente, anillo, 59

abierto distiniguido en Pn (K), 366 cociente, módulo, 85
acción a izquierda (de grupo), 27 coeficiente director (de un polinomio
acción a izquierda (de monoide), 27 univariado), 57
fiel, 32 complejo (de cadena) de R−módulos, 101
transitiva, 32 complejo (de co-cadena) de R−módulos,
alfabeto, 18 101
R−álgebra, 58 componente aislada, 329
finita, 88 componente homogénea de f grado i, 367
finitamente generada, 88 componentes inmersas, 329
algebraico, elemento, 162 componentes irreducibles de una variedad,
altura (logarı́tmica) de un número natural, 358
161 componentes irreducibles de una variedad
analı́tica, función , 70 proyectiva, 377
anillo, 54 conúcleo (morfismo de R−módulos), 86
cociente, 59 condición de cadena ascendente numerable
anillo de polinomios sobre un anillo no (CCA), 144
necesariamente conmutativo, 57 Conjetura de Cook, 384
principal, 88 conjunto de ceros de un conjunto de
reducido, 315 funciones, 341
producto de anillos, 258 conjunto minimal de generadores de un
anulador de un elemento, 204, 325 R−módulo, 88
anulador de una matriz, 131 cono afı́n, 365
aplicaciı́on polinomial K−definible, 419 cono proyectante, 365
aplicaciones polinomiales, 419 constructibles, 429
Artin, anillo de, 188 contenido de un polinomio, 301
artiniano, R−módulo, 333 contracción (de un ideal), 59
artiniano, anillo, 333 coordenadas homogéneas, 363
asociado, ideal primo, 325 coprimos, elementos, 295
automorfismo (de R−módulos), 84 coproducto de R−módulos, 82
automorfismo (de anillos), 59 cuádrica proyectiva, 366
cuerpo, 58
base (de un R−módulo), 94
algebraicamente cerrado, 165
base monomial, 96
cuerpo computable, 351
byte, 19
cuerpo de fracciones de un dominio, 142
cı́clica, forma canónica de un cuerpo de funciones racionales, 142
endomorfismo, 215, 248 cuerpo de Galois GFq , 106
caracterı́stica de un cuerpo, 60 (formalmente) real, 75
casi-anillo, 55 primo, 60
clausura algebraica, 167
clausura algebraica (de un cuerpo en otro), descomposición en irreducibles de una
165 variedad, 358
co-producto de módulos, 82 descomposición en valores singulares
cociente de ideales, 330 (SVD), 40
cociente de la división (euclı́dea) quo(f, g), descomposición en valores singulares
62 (SVD), caso complejo, 41
431
432 GLOSARIO DE TÉRMINOS
descomposición irredudante en irreducibles espectro maximal, 187

(de una variedad algebraica espectro primo, 187
proyectiva), 377 estabilizador de un punto, asociado a una
descomposición primaria, 323 acción), 32
descomposición primaria (submódulos), euclı́dea, función, 147
331 Euler, función, 179, 404
descomposición primaria irredundante Euler, mentiroso, 314
((submódulos), 331 Euler, testigo, 313
descomposición primaria reducida, 323 exponente monomial, 67
desigualdad triangular fuerte, 109, 110 extensión (de un ideal), 90
determinante, 112 extensiones finitas de cuerpos, 164
diagrama conmutativo, 99
diagrama de R−módulos, 99 , asociados a una matriz Mn (K),
difeomorfismo, 23 241
diofánticas homogéneas, ecuaciones factores invariantes, de A ∈ Mm×n (R), R
lineales, 208 DIP, 236
discriminante de un polinomio univariado , de un grupo abeliano finitamente
sobre un cuerpo, 288 generado, 237
divisor de cero, 61 , de un R−módulo finitamente
divisor de cero, en un módulo, 325 generado, R DIP, 241
divisores elementales de un grupo abeliano, Fibonacci, Sucesión, 159
270 filtración p−ádica, 108
divisores elementales de un módulo sobre fitración p−ádica, 109
un DIP, 269 fitración en R[[X]], 110
dominio, 61 fitración, orden en un cero, 109
de ideales principales, 139 forma cuadrática, 366
de integridad, 61 Frobenius, forma canónica de un
euclı́deo, 147 endomorfismo, 215, 248
de factorización única, 295 fución multi-lineal, 112
función booleana, 70
ecuaciones diferenciales lineales función continua, 72
homogéneas con coeficientes función diferenciable, 72
constantes, resolución, 289 función multi-lineal alternada, 113
ecuaciones diofanticas lineales, 185 función polinomial, 73
ecuaciones lineales diofánticas, 217 función polinomial K−definible sobre V ,
Einsenstein, enteros, 63 419
Elección Dependiente, Axioma, 143 función polinomial sobre V , 419
endomorfismo (de R−módulos), 84 funciones polinomiales K−definibles sobre
endomorfismo (de anillos), 59 An (K), 352
epimorfismo (de R−módulos), 84 funciones racionales, 142
epimorfismo (de anillos), 59 functor contravariante, 417
epimorfismo (de grupos), 23 functor covariante, 417
epimorfismo (en una categroı́a), 416
equivalencia natural, 419 Galois, Problema Inverso, 54
escalón (asociado a un exponente Gauss, enteros, 63
monomial), 77 generador (de un ideal), 87
escindida, s.e.c, 201 generador (de un subgrupo), 26
espacio afı́n n−dimensional sobre un generador (de un submódulo), 87
cuerpo An (K), 352 grado (de un polinomio univariado), 57
espacio afı́n sobre un cuerpo, 74 grado de un polinomio multivariado, 68
espacio proyectivo, 30 grado de una extensión de cuerpos, 164
espacio proyectivo n−dimensional Pn (K), grafo orientado, 99
38, 363 Gröbner, Base, 159
espacio proyectivo sobre un cuerpo, 38 grupo, 21
espacio vectorial dual, 418 abeliano, 21
espectro homogéneo de un anillo cı́clico finito, 21
(graduado), 410 cociente, 37
GLOSARIO DE TÉRMINOS 433
de Baer-Specker, 108 irreducibles, componentes de un cerrado en

de permutaciones sobre X, 21 un espacio topológico neotheriano, 380
ortogonal, 36 isomorfimo birregular K−definible, 420
simétrico, 42 isomorfismo (de R−módulos), 84
especial ortogonal SO(n), 53 isomorfismo (de anillos), 59
unitario, 31 isomorfismo birregular, 420
alternado, 115
, morfismo, 22 Jacobi-Legendre, sı́mbolo, 312
, automorfismo, 23 Jordan, caja, 275
, endomorfismo, 22 Jordan, forma canónica de un
, isomorfismo, 23 endomorfismo, 275, 277
k−ciclo, 44
Hilbert, Problema X, 254
hiper-superficie, 341 Legendre, sı́mbolo, 307
hiper-superficie afı́n definida por f en lenguaje, 18
An (K), 353 lexicográfico, orden, 19
hiper-superficie algebraica proyectiva, 365 libre, modulo, 94
hiperplano en el infinito, 364 lifting property, 197
hiperplano proyectivo, 366 local, anillo, 187
holomorfa, función , 71 localemente cerrado, 429
homeomorfismo, 23 localización de A en pZ, 110
homogéneo, ideal de polinomios, 369
homotecia, 28 Möbius, función, 404
homotecia (de multiplicación por máximo común divisor, 140
g ∈ R[X]: ηg ), 387 máximo común divisor en DFU’s, 298
homotecia asocial al elemento g, 242 métrica m−ádica en K[[X]], 111
homotecia de razón a sobre M , 318 módulo dual, 86
módulos de homologı́a, 101
ideal, 58 Matrices de Operaciones Elementales en
finitamente generado, 87 GL(2, R), 218
impropio, 58 Matrices de Operaciones Elementales en
ideal irreducible, 324 GL(n, R), 222
maximal, 187 matriz adjunta, 122
ideal maximal asociado a un punto, 349 compañera, 212, 242
primo, 187 hermitiana, 31
principal, 58 orlada, 225
propio, 58 ortogonal, 36
ideal radical, 315 unitaria, 31
radical, 426 simétrica, 31
ideal reducible, 324 transpuesta, 31, 115
, asociado a una variedad I(V ), 356 transpuesta conjugada, 31
, asociado a una K−variedad R−módulo, 80
IK (V ), 356 cociente, 85
, funciones que se anulan en F (i.e. finitamente generado, 87
IA[X] (F )), 347 libre, 94
, intersección, 86 libre de torsión, 204
ideales co-maximales, 258 proyectivo, 197
imagen (morfismo de R−módulos), 85 monoide, 17
inclusiones naturales en la suma directa, 85 monomio, 67
ı́ndice (de una permutación), 50 monomorfismo (de R−módulos), 84
intersección (de subgrupos), 26 monomorfismo (de anillos), 59
irreducible, elemento, 141 monomorfismo (de grupos), 23
irreducible, variedad algebraica, 356 monomorfismo (en una categorı́a), 416
irreducible, variedad algebraica biyectivo (de grupos), 23
K−definible, 356 morfismo de anillos, 58
irreducible, variedad algebraica proyectiva, (de R−módulos), 84
375 de monoides, 17
434 GLOSARIO DE TÉRMINOS
de semigrupos, 17 univariado, 56
morfismo docminante K−definible, 420 , mı́nimo de un endomorfismo, 212
morfismo dominante, 420 , multigrado (ord. monomial), 77
inyectivo (de grupos), 23 , término director, 77
morfismo regular, 419 polinomios multivariados, 67
suprayectivo (de grupos), 23 polinomios multivariados, anillo, 67
morfismos (de una categorı́a), 415 pre-orden (sobre un cuerpo), 75
morfismos frontera, 101 pre-orden propio (sobre un cuerpo), 75
morfismos regulares entre variedades, 419 primario, ideal, 319
multi-ı́ndice, 17 primario, submódulo, 330
, grado, 17 primitivo, polinomio, 301
multiplicar por un polinomio sobre K[X]d , primo, elemento, 141
acción, 169 primos inmersos, 329
producto (de ideales), 89
núcleo, (morfismo de R−módulos), 85 producto cartesiano de módulos, 107
número mı́nimo de generadores de un producto de módulos, 81
R−módulo, 88 producto semi-directo, grupos, 37
naturalemente equivalentes, functores proyecciones naturales del producto
covariantes, 418 cartesiano, 85
naturalmente equivalentes, functores proyectivo, módulo, 197
contravariantes, 418 pseudo-anillo, 55
Newton, sumas, 134, 135 [x0 : · · · : xn ], 363
nilpotente, 315 puntos K−racionales de una variedad, 353
nilpotente, elemento, 73
nilpotente, endomorfismo, 319 quasi-compacto, 360
no arquimqediano, valor absoluto, 110
noetheriano, anillo, 145 racional, forma canónica de un
noetheriano, espacio topológico, 379 endomorfismo, 215, 248
normal, espacio topológico, 423 racionales p−ádicos, 110
NP-completos, 385 radical de un ideal, 315√
Nullstellensatz Efectivo, 411 radical de un ideal ( a), 426
Nullstellensatz sobre vareidades rango de un R−módulo libre (caso finito),
cero-dimensionales, 386 97
rango de un R−módulo libre, 195
objetos (de una categorı́a), 415 reducible, variedad algebraica, 356
operación externa, 81 reducible, variedad algebraica
operaciones con matriz orlada, reglas, 225 K−definible, 356
órbita, 29 reducible, variedad algebraica proyectiva,
orden de una serie univariada en 0, 57 375
orden monomial, 66 reducido, anillo, 315
orden sobre un cuerpo, 75 relación de congruencia unitaria, matrices,
31
p−primario, ideal, 319 relación de congruencia, matrices, 31
p−primario, submódulo, 330 relación de equivalencia, matrices, 31
palabra, 18 relación de semejanza, matrices, 31
palabra vacı́a, 18 resto de la división (euclı́dea) rem(f, g), 62
paracompacto, espacio, 423 resultante univariada (“à la
parte primitiva de un polinomio (pp(f )), Sylvester-Bézout”), 172
301 resultante univariara (vı́a homotecias), 387
patición de la unidad, 423 retı́culo, 253
permanente de una matriz, 112 , paralelepı́pedo fundamental, 253
permutación, 42 , volumen, 253
caracterı́stico, 126 RSA, criptosistema, 180
polinomio eliminante en una variable, 173
polinomio homogéneo, 70 Sarrus, Regla determinantes 3 × 3, 121
polinomio mı́nimo en un vector, 211 Satisfactibilidad sobre cuerpos finitos, 386
polinomio univariado, 56 Schur, factorización compleja, 36
INDEX 435
Schur, factorización real, 36 término, 67

secret sharing, 268 , grado, 67
semi-local, anillo, 187 torsion, elemento, 204
semigrupo, 16 transposiciones (2−ciclos), 44
serie de potencias formales, 66 trascendente, elemento, 162
serie de potencias formales univariada, 56
serie, soporte, 67 unidades, de un anillo, 58
simétricas elementales, funciones, 113, 134
sistema dinámico, 32 valor absoluto p−ádico, 110
sistema generador (de un módulo), 87 valor absoluto p−ádico, 109
Smith, formal normal, 236 valor absoluto no arquimediano, 109
subanillo, 55 Vandermonde, matriz, 215
subanillo (sub-R1 −álgebra) generado por variedad algebraica afı́n, 353
R1 y F, 59 variedad algebraica afı́n K−definible, 353
subespacio ϕ−invariante, 106 variedad algebraica ceros ideal homogéneo,
subgrupo, 22 369
alternado An , 53 variedad algebraica proyectiva, 363
cı́clico, 26 variedad algebraica proyectiva
finitamente generado, 26 K−definible, 369
normal, 36 variedad asociada a una familia de
submódulo, 81 funciones, 341
submódulo irreducible, 331 variedad de los ceros de un ideal, 341
submódulo reducible, 331 variedad irreducible, 348
finitamente generado, 87 variedad reducible, 348
, producto por un ideal (aN ), 89 variedades C−analı́ticos, 346
, intersección, 86
, suma de submódulos, 88 Wishart, matriz, 263
sucesión exacta (de R−módulos), 102
sucesión exacta corta (de R−módulos), 102 Zariski, topologı́a, 344
suma (de ideales), 88 , topologı́a en An (K), 355
suma directa de módulos, 82 , abiertos, 344
suma directa módulos, 107 , cerrados, 344
z
Sylvester-Bézout, matriz, 170 , clausura en la topologı́a (Y ), 345
, constructibles, 345
talla (bit) de un número natural, 161 , topologı́a de los K−definibles en
tensor de multiplicación por X, 242 An (K), 355
Teorı́a de la Eliminación, 351 Zariski, topologı́a en Spec(R), 426
Teorema del Reemplazamiento, 88 , localmente cerrados, 345
Glosario de Teoremas y Resultados
1er. Teorema de Isomorfı́a, módulos, 91 Ecuaciones diferenciales homogéneas con

2do. Teorema de Isomorfı́a, módulos, 92 coeficientes constantes, resolución, 288
3er. Teorema de Isomorfı́a, módulos, 92 Ecuaciones Diofánticas lineales, Algoritmo
de Resolución, 231
Teorema del Resto (aka Ruffini), 165 Einsenstein, Lema (res. quad.), 310
Einsentein, construcción (res. quad.), 308
Agrawal-Kayal-Saxena, Test de Elección Dependiente, Axioma, 143
primalidad, 265 Elección, Axioma, 192
Artin-Schreier, Teorema, 76 Estructura de grupos abelianos finitamente
Avoidance Lemma, 212 generados, (Teorema 1), 207
Estructura de grupos abelianos finitamente
Bézout (con cotas) en Z, Identidad, 151 generados, (Teorema 2), 237
Bézout (con cotas) en K[X], Identidad, Estructura de grupos abelianos finitamente
151 generados, (Teorema 3), 270
Bézout (con cotas) en DE, Identidad, 149 Estructura de módulos finitamente
Bézout (sin cotas), Identidad, 140 generados sobre DIP, (Teorema 1), 207
Bézout, Identidad en el Nullstellensatz, 405 Estructura de módulos finitamente
Banach-Čech-Gelf’and- Kolmogorov-Stone, generados sobre DIP, (Teorema 2), 241
Teorema, 422 Estructura de módulos finitamente
Berlekamp, Algoritmo, 179 generados sobre DIP, (Teorema 3), 269
Bernstein, Teorema (Compatibilidad de Euclides, Algoritmo, 149
cardinales), 193 Euclides, Algoritmo, número de divisiones
Buena Ordenación, Principio, 193 en Z, 161
Euclides, división en R[X], 61
caracterización polinomio mı́nimo, Euler, Criterio, 307
Teorema, 212 Euler, Teorema sobre la suma de 4
Chino de los Restos, Teorema, 258 cuadrados, 35
contracción de primos y maximales, 190 Existencia de Dimensión, Axioma, 193
Csanky-Leverrier-Fadeev-Souriau, Factores invariantes de una matriz en
Algoritmo, 289 Mn (K) (Existencia), 241
Factorización en DE (Existencia), 151
DE =⇒ DIP, 148 Factorización en DIP (Existencia), 146
Dedekind, Teorema, 199 Fermat, Teorema “pequeño”, 180
Dedekind-Hasse, Criterio, 154 Forma de Frobenius (Existencia), 215
Densidad de los Números Primos, Frobenius, forma canónica (Existencia),
Teorema, 265 248
Descomposición en valores singulaes, Frucht, Teorema, 54
Teoremas de Existencia, 39
determinante, cálculo modular, 267 Gauss, Lema, 302
Diagonalización de Matrices, Algoritmo Gauss, Lema sobre R[X1 , . . . , Xn ], 304
para Mm×n (R), R DIP o DE, 230 Gauss, Reciprocidad Cuadrática, 307
Dickson, Lema, 158 Gauss, Reciprocidad Cuadrática, Teorema,
DIP 6=⇒ DE, 156 311
Dirichlet, Principio de las Cajas, 36 Gcd en DFU’s (Existencia), 298
dominios con factorización en elementos Gcd en DFU’s, caso ideales principales, 300
primos =⇒ DFU, 296 Gcd en dimensión mı́nima, Algoritmo, 281
437
438 INDEX
Gröbner, base, (Existencia), 158 Noether: Condición de Cadena Ascendente

Gram-Schmidt, Algoritmo, 262 numerable para anillos, 144
Gram-Scmidt, Teorema, 263
Operaciones elementales, matrices en
Hacer ceros en filas y columnas, Algoritmo GL(n, R), 220
para Mn×m (R), R DIP o DE, 228 Pell, Ecuación, caso m = 2, 177
Hacer ceros por filas o columnas, primo ⇔ irreducible, en DFU, 296
Algoritmo para Mn×m (R), R DIP o
DE, 226 Rango de R−módulos libres (Existencia),
Hadamard, Desigualdad, 263 194
Hamilton-Cayley, Teorema, 130, 250 resultante, estabilidad por especialización,
Hermann, Nullstellensatz Efectivo, 411 388
Hilbert, Basissatz en K[X1 , . . . , Xn ], 159
Hilbert-Kronecker Nullstellensatz, 403 Schreier, Teorema, 24
Hilbert-Kronecker Nullstellensatz, Schwartz-Zippel-DeMillo-Lipton,
coeficientes en cuerpos finitos, 403 Algoritmo probabilista, 395
Hilbert-Kronecker Nullstellensatz, Smith, forma normal (algoritmo), 234
equivalencia natural, 422 Smith, forma normal (Existencia), 236
Hilbert-Kronecker Nullstellensatz, Sobre un dominio, libre =⇒ libre de
maximales y puntos, 405 trosión, 204
Hilbert-Kronecker Nullstellensatz, Solovay-Strassen, test de “composición”,
Rabinowitsch trick, 407 313
Hironaka, división en K[X1 , . . . , Xn ], 77 no vacuidad de MaxSpec(R), teorema, 190
Hodges, sobre condición Strassen, multiplicación rápida de
Q noetheriana, 145 matrices, 132
HomR (⊕i∈I Mi , N ) ∼= i∈I HomR (Mi , N ),
Sun Tzu, problema, 261
96
Sylvester-Bézout y grado del gcd ,
determinación, 170
Interpolación (Existencia), 216
Sylvester-Bézout, proyección de dos
Isomorfı́a, grupos, 1er. Teorema, 37
hipersuperficies, 172
Sylvester-Bézout, resultante (caso K[X]),
Jacobi, Reciprocidad Cuadrática, 312, 313
172
Jordan, forma canónica (Existencia), 277
Sylvester-Bézout, resultante (caso R[X]),
172
Karatsuba-Ofman, algoritmo, 78 Sylvester-Bézout, Teorema de Eliminación
Univariada, 169
Lagrange, Interpolación, 216
Lagrange,Teorema sobre los 4 cuadrados Teorı́a de la Eliminación, Teorema
en Z, 36 Fundamental, 429
Lamé, Teorema, 160 Tietze-Urysohn, Teorema de Extensión,
Laplace, Fórmula Generalizada, 122 423
Laplace, Fórmula para el Determinante,
120 Unicidad de la descomposición primaria
Lasker- Noether para cocientes de anillos, reducida en noetherianos, 1er.
Teorema, 327 Teorema, 326
Lasker-Noether (paramódulos Unicidad de la Descomposición Primaria,
noetherianos), 331 1er. Teorema (módulos), 331
Lasker-Noether, Teorema, 325 Urysohn, Lema, 423
Libre de torsión 6⇒ libre si no DIP, Weil, Fórmula del Producto, 110
contraejemplos, 206 Winograd, multiplicación rápida de
Libre ⇔ libre de torsión sobre DIP, matrices, 133
Teorema, 205
Zariski, Existencia de la topologı́a, 344
Miller-Rabin, test de “composición”, 272 Zariski, topologı́as (ejemplos), 345
de Moivre-Binet, Fórmula, 159 Zorn, Axioma (o Lema), 190
Glosario de Sı́mbolos y Abreviaturas
A∗ , 31 EndR (M ), 84
At , 31 E(α), 77
ac , 59 An (K) = Kn , 352
ae , 90 An (K) = K n , 74
(a), 58
aR, 58 Fp , 60
aB, 90 Fq , 106
ab, 89 (F ), 87
aN , 89 hFi, 26
a + b, 88 RhFi, 87
a1 + · · · + am , 88
P m GFq , 106
i=1 ai , 88
gcdDFU , 298
An , 115
gcd(F ), 140
An , 53
gcd(a1 , . . . , am ), 140
AnnR (m), 204, 325
GL(n, R), 125
AnnR[X] (A), 131
[L : K], 164
AnnK (ζ), 162
Ap(S,
√ R), 65 Hd (X1 , . . . , Xn ), 70
a, 426 (i)
H∞ , 364
AssR (M ), 325 (0)
H∞ , 364
H(U ), 71
Bn , 70
ηg , 29
ηg , 387
C (X)(= C 0 (X)), 60
ηX , 242
C ω (U ), 70
HomR (M, M 0 ), 84
C k (U ), 1 ≤ k ≤ ∞, 72
cf., 7 i.e., 19
G/G1 , 37 IK (V ), 356
M/M 0 , 85 I(V ), 356
R/a, 59 IA[X] (F ), 347
(a : b), 330 I(F ), 347
Coker(f ), 86 mx , 349
C(f ), 212 (a1 , . . . , am ), 87
CCA, 144 Id , 21
X
cont(f
` ), 301 Im(f ), 85
i∈I M i , 107 λi , i ∈ I, 85
K(X1 , . . . , Xn ), 142 I(σ), 50
IrrK (ζ), 162
deg(f ) (multivariado), 68
deg(f ) (univariado), 57 Jord(M ), 277
det, 112
DFU, 295 K[X]d , 168
, 100 K[V ], 419
DiscX (f ), 288 K[V ], 419
DIP, 139 χ (X), 126
A
DE, 147 ker(f ), 85
439
440 GLOSARIO DE SÍMBOLOS Y ABREVIATURAS
p
K[An ], 352 (0), 315
K[An (K)], 352 rankR (M ) (caso finito), 97
rankR (M ), 195
λ,
18 rem(f, g), 62
m
p , 307 rem(a, b), 147
ZpZ , 110 ResX (f, g), 387
LT (f ), 77 Res(f, g), 172
ρf , 168
m
, 307 RS , 65
Qp n
RN , 66
i∈I Mi , 81
⊕i∈I Mi , 82 Σ∗ , 18
mx , 187, 349, 357 S (X), 21
µϕ , 212 Symn (K), 31
µv , 211 Sn , 42
0 (módulo nulo), 81 MaxSpec(R), 187
M ∗ , 86 Spec(R), 187
ϕ∗ , 420 SO(n), 53
StabG (x), 32
[n], 42
R1 [F], 59
P1m+ · · · + Nm , 88
N
2X , 16
i=1 Ni , 88 s.e.c,
µ(M ), 88 P 102
Pi∈I ai , 88
Oe(f ), 267 i∈I Ni , 88
O¶ (f ), 366 ⊕
Pi∈I Mi , 107
O(f ), 78 K , 75
Og (x), 29 SVD, 39, 40
OS (Y ), 29 SVD, matrices complejas, 41
≤deglex , 66 S (X), 29
≤lex , 66 Sylv(f, g), 171
≤revdeglex , 77 Sm+1 (f ), 169
ord0 (·), 57 T orR (M ), 204
O(n), 36
˙ 25
∪,
pp(f ), 301 U (n), 31
P roj(K[X0 , . . . , Xn ]), 410
Q
i∈I Mi , 107
VAn (K) (a), 353
πi , i ∈ I, 85 VAn (K) (f ), 353
Pn (K), 38 VX (F), 341
P(V ), 38 VX (a), 341
Pn−1 (K), 30 VA (f1 , . . . , fm ), 353
P(V ), 30 VAn (K) (f1 , . . . , fm ), 353
(x0 : x1 : · · · : xn ), 363 VX (f ), 341
VPn (K) (H), 369
Q, 60 VPn (K) (a), 369
quo(f, g), 62 VA (a), 353
qf (R), 142 VA (f ), 353
VP (f ), 365
⊕X R, 94
R[[X1 , . . . , Xn ]], 66 Y X , 16
R[[X]], 56 z
R[X1 , . . . , Xn ], 67 Y , 345
R[X], 56 √ 21
Z/nZ,
(R× , ·), 58 Z[√2]× , 178
Z[ m], 64
√p , 110
Q √
1+ m
a, 315 Z[ 2 ], 64
Bibliografı́a
[AKS, 04] M. Agrawal, N. Kayal, N. Saxena, PRIMES is in P. Annals of Math. 160 (2004), 781-793.
[AW, 2004] S. Alaça, K.S. Williams, “Introductory Algebaic Number Theory”. Cambridge Univ. Press, 2004.
[al-Khwārizmı̄, 820] Muhammad ibn Mūsā al-Khwārizmı̄, “al-Kitāb al-Mukhtas.ar fı̄ H . isāb al-Jabr wal-
Muqābalah”, Bagdad, 820.
[Al, 1999] N. Alon, Combinatorial Nullstellensatz. Combin. Probab. Comput. 8 (1999), 7-29.
[Arr, 2006] E. Arrondo, Another elementary proof of the Nullstellensatz. Amer. Math. Monthly 113 (2006),
169-171.
[AtMc, 1969] M.F. Atiyah, I.G. Macdonald, “Introduction to Commutative Algebra”, Addison-Wesley Pub-
lishing Co., 1969. [Edición en español por Ed. Reverté, 1980].
[AuBu, 1957] M. Auslander, D.A. Buchsbaum, Homological dimension in local rings.Trans. of the Amer.
Math. Soc. 85 (1957), 390–405.
[AuBu, 1959] M. Auslander, D.A. Buchsbaum, Unique factorization in regular local rings. Proc. of the Nat.
Acad. of Sci. of the USA 45 (1959), 733–734.
[Azu, 1951] G. Azumaya, On maximally central algebras, Nagoya Mathematical Journal 2 (1951), 119-150.
[BaSh, 1996] E. Bach, J. Shallit, “Algorithmic Number Theory. Vol 1 : Efficient Algorithms”, MIT Press,
1996.
[Baer, 1940] R. Baer, Abelian groups that are direct summands of every containing abelian group. Bulletin of
the Amer. Math. Soc. 46 (1940), 800-807.
[BS, 1988] D. Bayer, M. Stillman, On the complexity of computing syzygies. J. of Symb. Comput. 6 (1988),
135-147.
[BW, 1993] T. Becker, V. Weispfenning, “Groebner bases: a computational approach to commutative alge-
bra”. Grad. Texts in Maths. 141, Springer, 1993.
[Bls, 1984] A. Blass, Existence of Basis Implies the Axiom of Choice. Contemporary Mathematics 31 (1984)
31-33.
[Be, 1970] E.R. Berlekamp, Factoring Polynomials over Large Finite Fields. Mathematics of Computation 24,
(1970), 713-735.
[Berk, 1984] S.J. Berkowicz,On computing the determinant in small parallel time using a small number of
processors, Inf. Proc. Letters 18 (1984), 147-150.
[Be, 1970] E.R. Berlekamp, Factoring Polynomials over Large Finite Fields. Mathematics of Computation 24,
(1970), 713-735.
[Béz, 1764] E. Bézout, Recherches su le degré des équations résultants de l’évanouisement des inconnnues.
Histoires de l’Academie Royale des Sciences (1764), 288-338.
[Béz, 1779] É. Bézout, “Théorie générale des équations algébriques”. Paris, France: Ph.-D. Pierres, 1779.
[Bls, 1984] A. Blass, Existence of Basis Implies the Axiom of Choice. Contemporary Mathematics 31 (1984)
31-33.
[BCSS, 1996] L. Blum, F. Cucker, M. Shub, S. Smale,Algebraic settings for the problem P6=NP?. In “The
mathematics of numerical analysis (Park City, UT, 1995)”, Amer. Math. Soc., Providence, 1996, 125-144.
[BCSS, 1998] L. Blum, F. Cucker, M. Shub, and S. Smale, “Complexity and real computation”, Springer-
Verlag, New York, 1998.
[Bourbaki, 1967] N. Bourbaki, “Algébre Commutative, Éléments de mathématique, Fascicule XXVIII,
chapitres 1-7”, Hermann 1961-.
[BS, 02] M. Brin , G. Stuck, “Introduction to Dynamical Systems”. Cambridge Univ. Press, 2002.
[BL, 1972] Th. Bröcker, L. Ladner, “Differentiable germs and catastrophes”. Cambridge Univ. Press, 1972.
[Br, 1987] W. D. Brownawell, Bounds for the degree in the Nullstellensatz. Annals of Math. 126 (1987),
577-591.
[Buch, 1965] B. Buchberger, “Ein Algoritmus zum Auffinden der Basiselemente des Restklassenringes nach
einen nulldimensionallen Polynomideal”. Tesis Doctoral, Universidad Leopold-Franzens, Innsbruck, 1965.
[Buch, 1985] B. Buchberger, Gröbner Basis : An Algorithmic Method in Polynomial Ideal theory. In “Multi-
dimensional Systems Theory” , Mathematics and its Applications 6, Reidel, 1985, 184-232.
[Caj, 1911] F. Cajori, Horner’s method of approximation anticipated by Ruffini. Bull. Amer. Math. Soc.
17(1911), 409-414.
[CGH, 1988] L. Caniglia, A. Galligo and J. Heintz, Borne simplement exponentielle pour les degrés dans
le théorème des zéros sur un corps de caractéristique quelconque, C.R. Acad. Sci. Paris, t. 307, Série I
(1988), 255-258.
[CaEi, 1956] H. Cartan, S. Eilenberg, “Homological algebra. With an appendix by David A. Buchsbaum”.
Princeton Landmarks in Mathematics. Princeton University Press, Princeton, NJ, 1999 [Reedición del
original editado en Princeton en 1956].
441
442 BIBLIOGRAFÍA
[Cas, 59] J.S.W. Cassels, “An Introduction to the Geometry of Numbers”. Die Grund. Math. Wiss. 99,
Springer, 1959.
[CHMP, 2001] D. Castro, K. Hägele, J.E.Morais, L. M. Pardo, Kronecker’s and Newton’s approaches to
Solving : A first Comparison. J. of Complexity 17 (2001), 212-303.
[Cayley, 1858] A. Cayley, A Memoir on the Theory of Matrices. Phil. Trans. of the Royal Soc. of London 148
(1858), 17-37.
[Ch, 1957] N. Chomsky, “Syntactic Structures”. Mouton and Co., The Hague, 1957.
[ChMi, 1957] N. Chomsky, G. A. Miller, Finite state languages. Information and Control 1 (1957), 91-112.
[Ch, 1959a] N. Chomsky, On certain formal properties of grammars. Information and Control 2 (1959), 137-
167.
[Ch, 1959b] N. Chomsky, A note on phrase structure grammars. Information and Control 2 (1959), 393-395.
[Ch, 1962] N. Chomsky, Context-free grammarsand pushdown storage. Quarterly Progress Report No. 65. Re-
search Laboratory of Electronics, M. I. T., Cambridge, Mass., 1962.
[Ch, 1965] N. Chomsky, Three models for the description of language. IEEE Trans. on Information Theory 2
(1965), 113-124.
[Church, 36] A. Church, An unsolvable problem of elementary number theory. Am. J. Math. 58 (1936) 345-363.
[Coh, 1946] I.S. Cohen, On the structure and ideal theory of complete local rings. Transactions of the Amer.
Math. Soc. 59 (1946), 54–106.
[Cook, 1971] S. Cook, The complexity of theorem-proving procedures. In Proc. 3rd Ann. ACM SToC, ACM
Press, 1971, 151-158.
[CoLiOS, 1997] D. Cox, J. Little, D. O’Shea, “Ideals, Varieties, and Algorithms”, Springer, 1997 (1a. edición,
1992).
[CoLiOS, 1998] D. Cox, J. Little, D. O’Shea, “Using algebraic geometry”. Graduate Texts in Mathematics
185, Springer, 1998.
[Csa, 1976] L. Csanky, Fast Parallel Matrix Inversion Algorithm. SIAM J. on Comput. 5,4 (1976) 618-623.
[Dav, 49] M. Davis,Arithmetical problems and recursively enumerable predicates. The Journal of Symbolic Logic,
18 (1949), 33-41.
[Dem, 1984] M. Demazure, “Le monoı̈de de Mayr y Meyer”. Notes informelles de Calcul Formel, École Poly-
technique, 1984.
[DeMLi, 1978] R.A. DeMillo, R.J. Lipton, A probabilistic remark on algebraic program testing. Information
Processing Letters 7 (1978), 193–195.
[Dix, 1913] L.E. Dickson, Finiteness of the odd perfect and primitive abundant numbers with n distinct prime
factors. American Journal of Mathematics, 35 (1913), 413-422.
[Dvr, 09] Z. Dvir, On the size of Kakeya sets on finite fields. J. of the A.M.S. 22 (2009), 1093-1097.
[EiMc, 1945] S. Eilenberg, S. Mac Lane, General Theory of Natural Equivalence. Trans. of the Amer. Math.
Soc. 58 (1945), 231-294.
[Eins,1859] G. Einsenstein, Beweiss del allgemeinsten Reciprocitätgesetze zwischen reellen un komplexen
Zahlen. Verhandlungen der Königlich Pr. Akad. des Wissen. zu Berlin (1859), 189-198.
[Ei, 1995] D. Eisenbud, “Commutative algebra: with a view toward algebraic geometry”, Springer Verlag, 1995.
[Euler, 1750] L. Eulero, Theoremata circa Divisores Numerorum, Novi Commentarii academiae scientiarum
Petropolitanae 1 (1750), 20-48.
[Fad, 77] N. Fadeeva, D. K. Fadeev, Parallel Calculations in Linear Algebra. Kibernetika 6 (1977) 28-40.
[Frobenius, 1878] G. Frobenius, Über lineare Substutionen und bilineare Formen. J. Reine Angew. Math.
(Crelle) 84 (1878), 1–63.
[Fulton, 1984] W. Fulton, “Intersection theory”. New York-Heidelberg-Berlin Tokyo Springer, 1984.
[GaJo, 1979] M.R. Garey, D.S. Johnson, “Computers and Intractability: A Guide to the Theory of NP-
Completness”. W.H. Freeman, 1979.
[Gauss, 1801] C.F. Gauss, “Disquistiones Arithmeticae”. LIPSIAE in Commussionis apud Ger. Fleischer, 1801.
[Gen, 1976] E.R. Gentile, On the invariant factors. Rev. Un. Mat. Argentina 27 (1976), 240–243.
[GTZ, 1988] P. Gianni, B. Trager, G. Zacharias, Gröbner bases and primary decomposition of polynomial
ideals. J. Symbolic Comput. 6 (1988), 149-167.
[GiJe, 1976] L. Gillman and M. Jerison,“Rings of Continuous Functions”. Springer-Verlag, New York, 1976.
[GHMP, 97a] M. Giusti, J. Heintz, J.E. Morais, L. M. Pardo, Le rôle des structures des données dans les
problèmes d’élimination . Comptes Rendues Acad. Sci. Paris, Sér. I 325 (1997), 1223-1228.
[GHHMMP, 97b] M. Giusti, K. Hägele, J. Heintz, J.E. Morais, J.L. Montaña, L. M. Pardo, Lower bounds
for diophantine approximations. Journal of Pure and Applied Algebra 117 & 118 (1997), 277-317.
[GHMMP, 98] M. Giusti, J. Heintz, J.E. Morais, J. Morgenstern, L. M. Pardo, Straight-line programs in
geometric elimination theory. Journal of Pure and Applied Algebra 124 (1998), 101-146.
[Gödel, 31] K. Gödel, Über formal unentscheidbare Sätze der Principia Mathematica und verwandter Systeme,
I. Monatsh. Math. Phys. 38 (1931) 173-198.
[Gödel, 65] K. Gödel, On undecidable propositions of formal mathematical systems. In “The undecidable,
Basic Papers on Undecidable Propositions, Unsolvable Problemas and Computable Functions”, Raven
Press, Hewlett, NY (1965) 41-71.
[Goldman, 1951] O. Goldman, Hilbert rings and the Hilbert Nullstellensatz. Mathematische Zeitschrift 54
(1951), 136–140.
[HMPS, 2000] K. Hägele, J.E. Morais, M. Sombra, L. M. Pardo,The intrinsic complexity of the Arithmetic
Nullstellensatz. J. of Pure and App. Algebra vol. 146, (2000), 103-183.
BIBLIOGRAFÍA 443
[Hamilton, 1843] W.R. Hamilton, On Quaternions; or on a new System of Imaginaries in Algebra. Letter to
John T. Graves, dated October 17, 1843.
[Hamilton, 1853] W.R. Hamilton, “Lectures on Quaternions”. Hodges & Smith, Dublin, 1853.
[Hardy-Wright, 1938] G. H. Hardy, E. M. Wright, “An Introduction to the Theory of Numbers”. Oxford at
the Clarendon Press, 1938.
[HarvdH, 19] D. Harvey, J. Van Der Hoeven, Integer multiplication in time O(nlogn). (2019). hal-02070778.
[HHPS, 21] A. Hashemi, J. Heintz, L.M. Pardo, P. Solernó, On Bézout inequalities for non-homogeneous
polynomial ideals. J. of Symbolic Computation 106 (2021), 1-22.
[Heintz, 1983] J. Heintz, Fast quantifier elimination over algebraically closed fields. Theoret. Comp. Sci. 24
(1983), 239-277.
[HeSc, 82] J. Heintz, C.P. Schnorr, Testing Polynomials wich are easy to compute. In Logic and Algorith-
mic (an International Symposium in honour of Ernst Specker), Monographie n. 30 de l’Enseignement
Mathématique (1982), 237-254.
[Hen, 75] M. Henriksen, A simple characterization of commutative rings without maximal ideals. Amer. Math.
Monthly 82.5 (1975), 502-505.
[Hermann, 1926] G. Hermann, Die Frage der endlich vielen Schritte in der Theorie der Polynomideale. Math.
Ann. 95 (1926), 736-788.
[Hilbert, 1890] D. Hilbert, Über die Theorie der algebraischen Formen. Mathematische Annalen 36 (1890),
473-530.
[Hilbert, 1893] D. Hilbert, Über die vollen Invariantensysteme. Math. Annalen 42 (1893) 313-373.
[HiSt, 1997] P. Hilton, U. Stammbach, “A course in homological algebra. Second edition”. Graduate Texts in
Mathematics, 4. Springer-Verlag, New York, 1997.
[Hir, 1964a] H. Hironaka, Resoluction of Singularities of an Algebraic Variety over a Field of Characteristic
Zero I. Annals of Math. 79 (1964), 109-203.
[Hir, 1964b] , Resoluction of Singularities of an Algebraic Variety over a Field of Characteristic Zero
II. Annals of Math. 79 (1964), 205-326.
[HSD, 1974] M. W. Hirsch, S. Smale, R. L. Devaney, “Differential Equations, Dynamical Systems, and
Linear Algebra , 1st Ed.”. Academic Press, 1974.
[Hod, 1974] W. Hodges, Six impossible rings, J. Algebra 31 (1974), 218-244
[Hol, 1889] O. Hölder, Zurückführung einer beliebigen algebraischen Gleichung auf eine Kette von Gleichun-
gen. Math. Ann. 34 (1889), 26–56.
[Hor, 1819] W. G. Horner, A new method of solving numerical equations of all orders, by continuous approx-
imation. Philosophical Transactions (Royal Society of London), July 1819, 308-335.
[IM, 1983] O.H. Ibarra, S. Moran, Equivalence of Straight–Line Programs. J. of the ACM 30 (1983), 217-228.
[Jacobi, 1837] Carl Gustav Jacobi, Über die Kreisteilung und iher Anwendung auf die Zahlentheorie. Bericht
Akademi Wissen. Berlin (1837), 127-136.
[Jacobson, 1945] N. Jacobson,The radical and semi-simplicity for arbitrary rings. Amer. Journal of Math. 67
(1945), 300–320.
[Jen, 1899] J. Jensen,Sur un nouvel et important théorème de la théorie des fonctions. Acta Mathematica 22
(1899), 359–364.
[Jiushao, 1247] Qin Jiushao, “Shu Shu Jiu Zhang” (Tratado Matemático en Nueve Secciones), 1247.
[Jod, 1967] M.A. Jodeit, Uniqueness in the Division Algorithm. Amer. Math. Monthly 74 (1967), 835-836.
[Jordan, 1869] C. Jordan, “Théorème sur les équations algébriques”. C.R. Acad. Sci. Paris 68 (1869), 257–258.
[Jordan, 1870] C. Jordan, “Traité des substitutions et des équations algébriques”. Gauthier-Villars, Paris, 1870.
[KLL, 84] R. Kannan, A. K. Lenstra, L. Lovász, Polynomial factorization and non-randomness of bits of
algebraic and some transcendental numbers. In “Proceedings of the 16th Ann. ACM Symp. Theory of
Computing (STOC’84)”, Washington, D.C., 1984, 191-200.
[Kap, 1970] I. Kaplansky, “Commutative Rings”, Allyn and Bacon, 1970.
[Krp, 1972] R. Karp, Reducibility among combinatorial problems. In Complexity of Computer Computations,
(R.E. Miller & J.W. Hatcher, eds.), Plenum Press, 1972, 85-103.
[KO, 1962] A. Karatsuba, Yu. Ofman, Multiplication of Many-Digital Numbers by Automatic Computers.
Proceedings of the USSR Academy of Sciences. 145 (1962), 293–294. Traducción al inglés en Physics-
Doklady 7 (1963), 595–596.
[Knu, 1981] D.E. Knuth, “The Art of Computer Programming, vol. 2 Seminumerical Algorithms” Addison-
Wesley, 1981.
[KMH, 1988] H. Kobayashi, S. Moritsugu, R.W. Hogan, On Solving Systems of Algebraic Equations. In
“Proceedings ISSAC 88”, ACM, 1988, 139-149.
[Köning, 1903] J. Köning, “Einleitung in die allgemeine Theorie der Algebraischen Groessen”. Leipzig, 1903.
[Kol, 1988] J. Kollár, Sharp Effective Nullstllensatz. J. of A.M.S. 1 (1988), 963-975.
[Koz, 1992] D.C. Kozen, “The Design and Analysis of Algorithms”. Texts and Monographs in Computer Sci-
ence, Springer Verlag, 1992.
[KrPa, 1996] T. Krick, L.M. Pardo, A Computational Method for Diophantine Approximation. In Algorithms
in Algebraic Geometry and Applications, Proc. MEGA’94, Progress in Mathematics 143, Birkhäuser
Verlag, 1996, 193-254.
[KPS, 2001] T. Krick, L.M. Pardo, M. Sombra, Sharp Estimates for the Arithmetic Nullstellensatz. Duke
Math. Journal 109 (2001), 521-598.
[Kronecker, 1882] L. Kronecker, Grundzüge einer arithmetischen theorie de algebraischen grössen. J. reine
angew. Math. 92 (1882) 1-122.
444 BIBLIOGRAFÍA
[Ku, 1985] E. Kunz, “Introduction to Commutative Algebra and Algebraic Geometry”, Birkhäuser, 1985.
[Krull, 1928] W. Krull, “Primidealketten in allgemeinen Ringbereichten”. Sitzungs berichte der Heidelberger
Akademie der Wissenschaften, Mathematische-Naturwissenschaftliche Klasse 7 (1928).
[Krull, 1929] W. Krull, Die Idealtheorie in Ringen ohne Endlicheitsbedingungen. Mathematische Annalen 10
(1929), 729-744.
[Krull, 1935] , “Idealtheorie”. Springer, 1935.
[Krull, 1938] W. Krull, Dimensionstheorie in Stellenringen. J. Reine Angew. Math. 179 (1938), 204.
[Krull, 1951] W. Krull, Jacobsonsche Ringe, Hilbertscher Nullstellensatz, Dimensionstheorie. Mathematische
Zeitschrift, 54 (1951), 354–387.
[Laf, 1977] J.P. Lafon, “Algèbre commutative”, Hermann, 1977.
[Lan, 1905] E. Landau, Sur quelques Théorèmes de M. Petrovic relativs aux zéros des fonctions analytiques.
Bull Soc. Math. France 33 (1905), 251-261.
[Lm, 1844] G. Lamé, Note sur la limite du nombre des divisions dans la recherche du plus grand commun
diviseur entres deux nombres entiers. Comptes Rendus Acad. Sci. 19 (1844), 876-870.
[Lasker, 1905] E. Lasker, Zur Theorie der Moduln und Ideale, Math. Ann. 60 (1905), 19-116.
[Lau, 1962] H. Läuchli, Auswahlaxiom in der Algebra, Commentarii Mathematici Helvetici, 37 (1962-1963),
1-18.
[Laz, 1981] D. Lazard, Résolution des systèmes d’équations algébriques, Theor. Comp. Sci. 15 (1981), 77-110.
[Legendre, 1789] A.M. Legendre, “Essai sur la Théorie des Nombres”. Paris, 1789.
[Leh, 1933] D.H. Lehmer,Factorization of Certain Cyclotomic Functions. Ann. of Math. 34 (1933), 461-479.
[Lens, 1981] A. K. Lenstra, “Lattices and Factorization of Polynomials”. Report IW 190, 81. Amsterdam
Mathematisch Centrum, 1981.
[LLL, 1982] A.K. Lenstra, H. W. Lenstra, L. Lovász, Factoring Polynomials with Rational Coefficientes.
Math. Ann. 261 (1982), 515-534.
[Lind, 1970] C. Linderholm, A Group Epimorphism is Surjective. American Mathematical Monthly 77 (1970),
176–177.
[LeV, 1840] U. Le Verrier, Sur les variations séculaires des elements elliptiques des sept planètes principales.
Liouville J. Math. 5 (1840) 220-254.
[Macaulay, 1916] F.S. Macaulay, “The Algebraic Theory of Modular Systems”. Cambridge tracts in math. and
Math. Physics, Cambridge University Press, 1916.
[Mc, 1975] S. Mac Lane, “Homology. Reprint of the 1975 edition”. Classics in Mathematics. Springer-Verlag,
Berlin, 1995.
[Mah, 1962] K. Mahler, On Some Inequalities for Polynomials in Several Variables. J. London Math. Soc. 37
(1962), 341-344.
[MaWü, 1971] D. W. Masser and G. Wüstholz, Fields of large transcendence degree generated by values of
elliptic functions. Invent. Math. 72 (1971) 407-463.
[Matj, 1970] Juri. V. Matjasevich, Enumerable sets are Diophantine. Doklady Akademii Nauk SSSR (en ruso)
191 (1970), 279-282. (Traducción al inglés en Soviet Mathematics 11 (2) (1970) pp. 354-358).
[Mat, 1980] H. Matsumura,“Commutative Algebra (2nd. Edition)”, Benjamin/Cummings, 1980.
[Ma, 1989] H. Matsumura, “Commutative Ring Theory”. Cambridge Studies in advanced Math. 8, Cambridge
Univ. Press, 1989.
[Mayr, 1989] E. Mayr, Membership in Polynomial Ideals over Q Is Exponential Space Complete. In “Proc.
of the 6th Annual Symposium on Theoretical Aspects of Computer Science (STACS’89)”, ACM, 1989,
400-406.
[MM, 82] E. Mayr and A. Meyer, The complexity of the word problem for commutative semigroups. Advances
in Math. 46 (1982), 305-329.
[Mign, 1989] M. Mignotte, “Mathématiques pour le Calcul Formel”, Presses Univ. de France, 1989.
[Milr, 1976] G.L. Miller, Riemann’s hypothesis and tests for primality. J. Comput. Syst. Sci. 13 (1976), 300-
317.
[Mks, 10] H. Minkowski, “Geometrie der Zahlen”. Leipzig and Berlin: R. G. Teubner, 1910. Chelsea, 1953
(reprint).
[Mtz, 1949] T. Motzkin, The Euclidean algorithm. Bull. Amer. Math. Soc., 55 (1949), 1142-1146.
[Mul, 1986] K. Mulmuley, A Fast Parallel Algorithm to Compute the Rank of a Matrix over an Arbitrary
Field. In Proc. STOC 1986, 338-339.
[Nag, 1958] M. Nagata, A general theory of algebraic geometry over Dedekind domains. II. Separably generated
extensions and regular local rings. American J. of Math. 80 (1958), 382–420,
[Nag, 1975] M. Nagata,“Local Rings”, Robert E. Krieger, 1975.
[Nak, 1951] T. Nakayama, A remark on finitely generated modules, Nagoya Mathematical Journal 3 (1951),
139-140.
[Netto, 1885] E. Netto, Zur Theorie der Elimination. Acta math. 7 (1885), 101–104.
[NP, 21] V. Neiger, C. Pernet, Deterministic computation of the characteristic polynomial in the time of
matrix multiplication. J. of Complexity 67 (2021), 101572.
[Noether, 1921] E. Noether, Idealtheorie in Ringbereichen. Math. Annalen 83 (1921), 24-66.
[Noether, 1926] E, Noether, Der Endlichkeitsatz der Invarianten endlicher linearer Gruppen der Charakter-
istik p. In “Nachritten von der Gesellschaft der Wissenschaften zu Göttingen, aus dem Jahre 1926”, 1926,
28–35.
[Noether, 1927] E. Noether, Abstrakter Aufbau der Idealtheorie in algebraischen Zahl und Funktionenkörpern.
Math. Ann. , 96 (1927), 26-61.
BIBLIOGRAFÍA 445
[Or, 2013] Nuccio Ordine, “L’utilità dell’Inutile. Manifesto”. Bompiani, 2013.

[Os, 1973] A.M. Ostrowski, “Solutions of Equations in Euclidean and Banach Spaces”, Academic Press, 1973.
[Pardo, 95] L. M. Pardo, How lower and upper complexity bounds meet in elimination theory. In “Applied
Algebra, Algebraic Algorithms and Error-Correcting Codes” , G. Cohen, M. Giusti & T. Mora, eds.,
Lecture Notes in Computer Science 948 , Springer Verlag, 1995, 33-69.
[Post, 36] E. Post, Finite Combinatory processes-formulation I. J. Symbolic Logic 1 (1936), 103-105.
[Pr, 1975] V.R. Pratt, Every Prime has a succinct certificate. SIAM J. on Computing 4 (1975), 214-220.
[Qui, 1976] D. Quillen, Projective modules over polynomial rings. Inventiones Mathematicae 36 (1976),
167–171.
[Rabin, 1980] M.O. Rabin, Probabilistic algorithms for testing primality. J. Number Theory 12 (1980), 128-138.
[Rag et al., 1975] S. Raghavan, B. Singh, R. Sridharan, “Homological Methods in Commutative Algebra”,
Tata Institute for Fund. Res., Oxford University Press, 1975.
[Rainich, 1929] G. Y. Rainich (pseudonym J.L. Rabinowitsch), Zum Hilbertschen Nullstellensatz. Math. Ann.
102 (1929), 520
[Rees, 1956] D. Rees,Two classical theorems of ideal theory. Proc. Cambridge Philos. Soc. 52 (1956), 155-157.
[Re, 1995] M. Reid, “Undergraduate Commutative Algebra”, Cambridge University Press, 1995.
[Rha, 1962] T.S. Rhai, A characterization of polynomial domians over a field. Amer. Mathematical Monthly
69 (1962), 984-986.
[Rib, 1985] P. Ribenboim, Equivalent forms of Hensel’s Lemma. Expo. Math. 3 (1985), 3-24.
[RSA, 1978] R.L. Rivest, A. Shamir y L.A. Adleman, A method for obtaining digital signatures and public-key
cryptosystems. Communications ACM 21(1978), 120-126.
[Rob, 1950] J. Robinson, General recursive functions. Proc. of Amer. Math. Soc. 1 (1950), 703-718.
[Rob, 52] , Existential definability in arithmetic. Trans. of the Amer. Math. Soc. 72 (1952), 437-449.
[Ro, 1994] H.E. Rose,“A Course in Number Theory”.2nd. ed., Oxford Sci. Publications, 1994.
[Rosser, 1941] B. Rosser, Explicit Bounds for Some Functions of Prime Numbers. American Journal of Math-
ematics 63 (1941), 211-232.
[Ruff, 1804] P. Ruffini, Sopra la determinazione delle radici nelle equazioni numeriche di qualunque grado.
Memoria del Dottor Paolo Ruffini, pubblico professore di matematica sublime in Modena, uno dei quaranta
délia società italiana delle scienze ec. Coronata dalla società medesima. In Modena, MDOCCIV. Presso la
società tipografica. Con Approvazione, 1804.
[Schm, 1907] E. Schmidt, Zur Theorie der linearen und nichtlinearen Integralgleichungen. I Teil. Entwicklung
willkürlichen Funktionen nach System vorgeschriebener. Mathematische Annalen Vol. 63 (1907), 433-476.
[Schö, 1979] A. Schönhage, On the power of random access machines. In H. A. Maurer, ed., Proceedings of the
6th Colloquium on Automata, Languages and Programming, vol. 71 of LNCS, Springer, 1979, 520-529.
[Sche, 1928] O. Schreier, Ueber den Jordan–Hölderschen Satz. Abh. Math. Sem. Univ. Hamburg 6 (1928),
300–302.
[Schw, 1980] J.T. Schwartz, Fast Probabilistic Algorithms for Verification of Polynomial Identities. J. of the
ACM 27 (1980), 701-717.
[Ser, 1955] J. P. Serre, Sur la dimension homologique des anneaux et des modules noetheriens. Proc. Intern.
Symp. Alg. Number Theory, Tokyo, 1955, 175-190.
[Shf, 1974] I.R. Shafarevich, “Basic Algebraic Geometry”, Springer-Verlag, 1974.
[Shp, 2000] R.Y. Sharp, “Steps in commutative algebra”. Cambridge University Press, 1990, (2nd. Ed. 2000).
[Shu, 1987] M. Shub, “Global Stability of Dynamical Systems”. Springer, 1987.
[Smale, 1998] S. Smale, [ Mathematical Problems for the Next Century. Mathematical Intelligencer 20 (1998),
7–15.
[Smith, 1861] H.J.S. Smith, On systems of linear indeterminate equations and congruences. Phil. Trans. R.
Soc. Lond. 151 (1861) 293-326.
[SoStr, 1977] R. Solovay, V. Strassen, A fast Monte Carlo test for primality. SIAM J. on Comput. 6 (1977),
84-85.
[Sou, 1965] J.M. Souriau, “Calcul linéaire”. Tome I, II. Presses Universitaires de France, 1964-65.
[Str, 1969] V. Strassen,Gaussian Elimination is not optimal. Numer. Math. 13 (1969), 354-356.
[Sus, 1976] A.A. Suslin, Projective modules over polynomial rings are free. Doklady Akademii Nauk SSSR (in
Russian), 229 (1976), 1063–1066. Translated in Projective modules over polynomial rings are free. Soviet
Mathematics, 17 (1976) 1160–1164
[Syl, 1840] J. J. Sylvester, A method of determining by mere inspection the derivatives from two equations of
any degree. Philos. Magazine 16 (1840), 132–135.
[Syl, 1853] J.J. Sylvester, On a theory of the syzygetic relations of two rational integral functions, comprising
an application to the theory of Sturm’s functions, and that of the greatest algebraical common measure.
Philosophical Transactions of the Royal Society of London CXLIII (1853), 407-548.
[Tao, 14] T. Tao, Algebraic Combinatorial geometry: the polynomial method in arithmetic c ombinatorics,
incidence combinatorics, and number theory. EMS Surveys Math. Sci. 1 (2014), 1-46.
[Taylor, 1715] B. Taylor, “Methodus incrementorum directa et inversa”, 1715.
[Val, 1979] L.G. Valiant, The Complexity of Computing the Permanent. Theoretical Computer Science 8
(1979), 189–201.
[Vogel, 1984] W. Vogel, “Lectures on Bézout’s Theorem”. Tata Inst. for Fundamenta Research, Springer-
Verlag, 1984.
[vdW, 1930] Bartel Leendert van der Waerden, “Moderne Algebra. Teil I”. Die Grundlehren der mathe-
matischen Wissenschaften 33, Springer, 1930
446 BIBLIOGRAFÍA
[vdW, 1931] , “Moderne Algebra. Teil II”. Die Grundlehren der mathematischen Wissenschaften 34,
Springer, 1931.
[Wallis, 1656] J. Wallis, “Arithmetica infinitorum”, 1656.
[Weierstras, 1854] K. Weierstras, “Zur Theorie der Abelschen Functionen”. J. für Reine und Angew. Math.
(1854).
[Weirstrass, 1876] K. Weierstrass, “Zur Theorie der eindeutigen analytischen Functionen”. Berl. Abh. (1876),
11-60.
[Wls, 1973] J.C. Wilson, A Principal Ideal Ring that is not a Euclidean Ring. Mathematics Magazine, 46
(1973), 34-38.
[Yap, 1991] C. K. Yap, A New Lower Bound Construction for Commutative Thue Systems with Applications.
J. of Symb. Comput. 12 (1991) 1-27.
[ZarSam, 1960] O. Zariski, P. Samuel, “Commutative Algebra”, vols. I-II, Van Nostrand, Princeton,
1958,1960.
[Zer, 1904] E. Zermelo, Beweis, dass jede Menge wohlgeordnet werden kann. Mathematische Annalen 59
(1904), 514-516.
[Zip, 1990] R. Zippel, Interpolating Polynomials from their Values. J. Symbol. Comput. 9 (1990), 375-403.
[Zh, 13] Zhuangzi,“The Complete works of Zhuangzi (Translated by Burton Watson)”. Columbia Univ. Press,
2013.

2023-Alg Ctiva

Cargado por

Información del documento

Título original

Derechos de autor

Formatos disponibles

Compartir este documento

Compartir o incrustar documentos

Opciones para compartir

¿Le pareció útil este documento?

¿Este contenido es inapropiado?

Copyright:

Formatos disponibles

2023-Alg Ctiva

Cargado por

Copyright:

Formatos disponibles

Algunas Notas para un curso elemental de

“Álgebra Conmutativa”, Parte I.

Capı́tulo 0. Prólogo: Thinking outside the box 7

Part 1. Requisitos y Prerrequisitos al Álgebra Conmutativa:

Capı́tulo 1. Algunos Prerrequisitos de Álgebra

Capı́tulo 2.Módulos, Determinantes y Teorema de Hamilton-Cayley

Capı́tulo 3. Dominios de Ideales Principales. Anillos Noetherianos. Dominios Enclı́deos.

3.2. Dominios de ideales principales, propiedades elementales, elementos primos e

Capı́tulo 5. El Teorema Chino de los Restos (Opcional)

5.2. El anillo producto y el Teorema Chino de los Restos 258

Capı́tulo 6.Factorización de elementos e ideales: Las ideas de Gauss, Lasker y Noether.

Capı́tulo 7.Rudimentos de Geometrı́a Algebraica: La Topologı́a de Zariski

Capı́tulo 8.Una Prueba Elemental de Nullstellensatz de Hilbert.

8.4. Tests de (no) nulidad para polinomios. 393

Apéndice. Glosario de Sı́mbolos y Abreviaturas 437

Prólogo: Thinking outside the box

From [Zh, 13]:

From [BL, 1972]:

2D.Hilbert, Über die vollen Invariantensysteme. Mathematische Annalen 42 (1893), 313–373.

polinomiales. En la obra de Hilbert, la respuesta aparece como un resultado marginal, en el

Aclaración sobre la ortografı́a usada en este texto. En evitación de lecturas aviesas,

Requisitos y Prerrequisitos al Álgebra

Algunos Prerrequisitos de Álgebra

Está bien que se mida con la dura

1.1. Introducción: Prerrequisitos.

1.2. Semigrupo, monoide, grupo, acciones

Donde S × S = {(x, y) : x, y ∈ S} es el producto cartesiano de S consigo mismo y, además,

Propiedad Asociativa: (x ∗ y) ∗ z = x ∗ (y ∗ z), ∀x, y, z ∈ S.

A la aplicación ∗ se la denomina Operación Interna del semi-grupo. Un semigrupo (S, ∗) se

Existencia de Elemento Neutro: ∃e ∈ S, e ∗ x = x ∗ e = x, ∀x ∈ S.

Al elemento e, si existe, se le denomina Elemento Neutro del monoide.

Propiedad Conmutativa: ∀x, y ∈ S, x ∗ y = y ∗ x.

Proposición 1.2.1. Si (S, ∗) es un monoide, el elemento neutro es único y suele denotarse

Demostración. Sea e1 y e2 son dos elementos de S neutros en el sentido de la definición

Definición 2 (Morfismo de semi-grupos, monoides). Un morfismo de semigrupos entre

que verifica la siguiente propiedad:

Ejemplo 1.2.2 (El monoide de los exponentes monomiales). El conjunto (Nn , +) es un

Insistamos en la notación x1 · · · xn para expresar la palabra (x1 , . . . , xn ) ∈ Σn . Los “)”, “(” y

La operación esencial sobre Σ∗ es la concatenación (también llamada adjunción) de palabras:

1.2.2.2. Operaciones Elementales con Lenguajes. Vamos a considerar las siguientes

Observación 1.2.8. Obsérvese que L1 · L2 no es, en general, igual a L2 · L1 . Tampoco es

ii) Clausura positiva de un lenguaje: Dado un lenguaje L ⊆ Σ∗ definimos la clausura

Ejemplo 1.2.11 (Grupo Simétrico). Sea X un conjunto y consideremos el conjunto S (X)

Proposición 1.2.14. Si (G, ·) es un grupo, cada elemento x ∈ G posee un único elemento

• Iso-: Llamamos “isomorfismo”, cuando exista g : (H, ⊥) −→ (G, ∗) morfismo (de

Observación 1.2.17 (Isomorfismos en Topologı́a, llamados homeomorfismos). En Topologı́a

Observación 1.2.18 (Isomorfismo en Geometrı́a Diferencial, llamado difeomorfismo).

Definición 9 (Monomorfismo y Epimorfismo de grupos). Sea f : (G, ∗) −→ (H, ⊥) un

consideremos los siguientes dos morfismos:

Es obvio que es una biyección (nótese que σ −1 = σ, 3) que, en términos simplistas,

• Demostración del contenido L ⊆ {z ∈ H : φ(z) = ψ(z)}: Sea z ∈ L. Por definición

1.2.3.2. Generación de Subgrupos. El punto de partida es la siguiente

A partir de esta sencilla propiedad podemos definir las nociones siguientes:

ii) El ejemplo más tradicional de acción a izquierda de un grupo sobre un conjunto es el

donde 0X es el neutro del grupo abeliano (X, ∗) y −g es el opuesto de h ∈ X para la

Definición 12 (Órbitas). Sea (G, ·) un grupo, X un conjunto no vacı́o, ·G : G×X −→ X una

Para probarlo, supongamos que existen g1 , g2 ∈ S tales que:

v) La relación de semejanza de matrices. Sea K un cuerpo, Mn (K) el conjunto de las

ix) Sistemas Dinámicos. Consideramos un conjunto X = M dado como una variedad

Definición 13 (Acciones Transitivas y Fieles.). Una acción de un grupo (G, ·) sobre un

Definición 14 (Estabilizador de un elemento). Sea (G, ·) un grupo, X un conjunto no

Observación 1.2.30 (“Fidelizando” acciones a izquierda). Algunas acciones a izquierda

Ası́, podemos construir una nueva acción: