Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Luis M. Pardo
Índice
Capı́tulo 4. Ideales Primos y Maximales. Módulos Libres. Con una coda sobre la Forma
Normal de Smith
(Le temps retrouvé) 183
4.1. Introducción 184
4.1.1. Motivación: El ejemplo de las ecuaciones diofánticas lineales: Diagonalización,
forma normal de Smith y aplicaciones. 185
4.2. Ideales primos e ideales maximales. La noción de rango de un R−módulo libre. 187
4.2.1. Las nociones y primeras propiedades 187
4.2.2. La noción de rango de un R−módulo libre 192
4.2.3. Generación finita sobre anillos noetherianos es hereditaria 196
4.3. Proyectivos, libres y dominios de ideales principales 197
4.4. Libres y Libres de Torsión sobre dominios de ideales principales 204
4.4.1. Libres de Torsión sobre dominios de ideales principales 204
4.4.2. Libres de torsión sobre dominios euclı́deos (Opcional) 208
4.4.3. Ejercicios y problemas de las secciones 4.2 y 4.3 211
4.5. Diagonalización de Matrices sobre un DIP 217
4.5.1. Motivaciones 217
4.5.2. Matrices de operaciones elementales en GL(2, R) 218
4.5.3. Generalizando a matrices m × n: Operaciones elementales sobre DIP’s 220
4.5.4. Matrices elementales particulares 222
4.5.5. Orlar una matriz 225
4.5.6. “Algoritmo”: Hacer ceros por filas o columnas 226
4.5.7. Hacer ceros en filas y columnas 228
4.5.8. Diagonalización de una matriz sobre un DIP: “algoritmo” primario 230
4.5.9. Resolución de ecuaciones lineales diofánticas 231
4.6. Forma Normal de Smith 234
4.6.1. Estructura de grupos abelianos finitamente generados 237
4.7. Forma de Frobenius y Factores Invariantes de un endomorfismo sobre un espacio
vectorial de dimensión finita. 241
4.7.1. Factores invariantes de un endomorfismo 241
4.7.2. Forma de Frobenius de un endomorfismo: factores invariantes en K[X] 242
4.7.3. El álgebra R[X]/(f ), con f ∈ R[X]mon . 242
4.7.4. Ejercicios y problemas de la Sección 4.5 251
El Arte de la Matemática:
Índice
Aclaración sobre la ortografı́a usada en este texto 11
En el nuevo milenio, la expresión “ Think outside the box!” ha sido acuñada como referente
del pensamiento moderno. El origen de la expresión es discutido por mucha gente a lo largo del
siglo XX, especialmente del ámbito de la psicologı́a, el márketing, la finanzas o la tecnologı́a.
Sin embargo, nada hay menos moderno que el significado de esa expresión (cf.(cf.1 la cita a R.
Bacon que se encuentra al inicio del Capı́tulo 1: “...all novelty is but oblivion”). Al cabo, la
Humanidad lleva milenios pensando de manera diferente, enfrentándose de manera diferente a
problemas, para lograr un cierto progreso, no siempre estable o permanente. Desde luego no es
nuevo, ni novedoso el acto de pensar fuera del tarro.
Es en el ámbito del conocimiento humano, el ámbito de la Ciencia, donde el pensamiento fuera
de los cánones establecidos ha marcado la pauta para responder a los problemas y las preguntas
que las mentes más curiosas se han planteado. Muchos son los nombres que se me ocurre citar
(y podrı́a citar algunos de los más apreciados por mı́, sion citar amigos personales, como E.
Noether, D. Hilbert, J. Nash, A. Turing, S. Smale, R. Thom, K. Gödel y muchı́simos otros cuyo
pensamiento influyó en distintas épocas de mi carrera académica). Pero me voy a restringir al
caso de la asignatura que nos ocupa.
Pensar fuera de la caja que nos envuelve supone un esfuerzo enorme y un acto brutal de cre-
atividad. No es necesario que ese pensamiento esté desarrollado hasta el lı́mite técnico extremo
(para eso ya vendrán los “continuadores” - ya sean amigos o enemigos - que se encargarán de
llevar a término la tecnicalidad del asunto). Para pensar fuera de lo establecido basta con tener
la mente dispuesta a dar un “pas à côté”, ponerse en un lado, y mirar lo que existe desde la per-
spectiva desde la que nadie miró antes. Tras esa observación desde una perspectiva inesperada,
se trata de dar un primer paso y mostrar un nuevo camino. Es el trabajo del “pathfinder”, de
quien muestra un camino o un atajo, de nuevas rutas de pensamiento. En muchos casos, esos
pathfinders son maltratados por sus contemporáneos, en otros reciben en vida el premio a su
1
cf.: Abreviatura del imperativo cónfer del verbo latino conferre. De acuerdo al Diccionario Panhispánico
de dudas, se puede traducir por “compare [usted]” o “compara [tú]” , aunque, por costumbre o tradición, se
interpreta como una instrucción que “Remite a la consulta de un determinado texto o pasaje...”
7
8 0. PRÓLOGO
creatividad. Esto no es importante. Lo que sı́ es importante es que quienes logran pensar fuera
del tarro abren una vı́a a través de la cual el conocimiento humano (un constructo cooperativo
de la Humanidad) puede profundizar su comprensión de las cosas.
Lo que sı́ suele suceder es que, ante la sociedad que nos rodea, estos golpes de inmensa creativi-
dad parecen “dragones” y, por tanto, logros imaginarios, fantasiosos, hasta que no son aplicados.
Tampoco eso debe importar demasiado al matemático. La Matemática no es un constructo de
la mente humana creada para ser aplicada sino para profundizar en el conocimiento de aquellos
objetos que se resisten a ser comprendidos y que son susceptibles de ser estudiados con medios
meramente deductivos. De ahı́ que la enseñaza de la Matemática, por más que moleste a quienes
sólo buscan aplicaciones inmediatas, tenga ese matiz de “Manual para la caza de dragones”, de
guı́a para la comprensión de grandes golpes de creatividad en el arte de abstraer y deducir.
Para este humilde matemático, el problema más duro de comprender es el manejo y dominio del
sı́mbolo ∃. La “existencia” (o su hermano, la “universalidad” del sı́mbolo ∀) son los dos grandes
misterios de la Matemática. No en vano, cuatro de los problemas del Milenio llevan en su cuerpo
un ∃ sin piedad, imperturbable. Un ∃ subyace a la Conjetura de Cook y a la Conjetura de Birch
y Swynerton-Dyer. Un ∃ | (existe un único) subyace a la Conjetura sobre las ecuaciones de
Navier-Stokes, mientras un ∀ se encuentra inmerso en la Conjetura de Riemann.
Enfrentar el ∃ o el ∀ de manera única se ha mostrado imposible a lo largo de la historia. Y las
veces en que ha habido un cierto progreso significativo ha sido porque alguien miró de soslayo,
enfrentó el problema de otro modo y, a trancas y barrancas, dió lugar a una nueva forma de
pensamiento matemático. No todos son afortunados porque no todos lo lograron, pero la esencia
del matemático profesional consisten en, al menos, intentarlo. Los tecnicismos son aburridas
tareas colectivas, mientras que el encontrar un nuevo camino es un éxito de la formación y el
ingenio.
Cuando uno enfrenta la formación de un Grado en Matemáticas y hace referencia al Álgebra, dos
casos clásicos de pensamiento fuera del tarro vienen a la mente. Se trata de dos casos sencillos
de exponer, complicados de demostrar y que se produjeron a lo largo del siglo XIX y principios
del XX. El primero, conocido globalmente, es la respuesta a la pregunta de si ∃ solución por
radicales a una ecuación polinomial univariada. La respuesta a años de búsqueda positiva la dió,
en primer lugar, un jovencı́simo N. Abel (a la sazón tenı́a 26 años cuando muere en la pobreza)
mostrando una quı́ntica que no es resoluble por radicales. Es un contraejemplo muy brillante,
pero insuficiente para alimentar un nuevo camino. Será otro jovencı́simo Évariste Galois quien,
a sus 22 años escribe un testamento, la vı́spera del duelo en el que encontró la muerte, en el
que entremezcla de manera confusa sus asuntos personales con su nueva idea: entrelazar la
resolución de ecuaciones polinomiales con la familia de permutaciones de las raı́ces. Este sı́ fue
un pensamiento fuera de la caja que generó la Teorı́a de Grupos y la presencia de las acciones de
los grupos como paradigma de mecanismo para comprender muchos de los asuntos matemáticos
que resultaban de difı́cil penetración intelectual. No en vano, ya en 1872, Felix Klein defiende
en su programa de Erlangen que la Geometrı́a sólo es entendible si se interpreta a través del
grupo de las acciones permitidas. Por eso es común que la Teorı́a de Galois forme parte de la
formación básica de todo matemático. No se trata solo de que los tecnicismos que subyacen a
esas ideas sean de conocimiento común de cuantos ostentan el nombre de “matemático”, que
también. Se trata, ante todo, de que la formación del matemático contemple la comprensión
de cuanto acontece a un pensamiento fuera de la caja, como paradigma del necesario “pensar
distinto” que todo matemático debe llevar en su ADN deontológico.
El presente curso es, sin embargo, un curso de “Algebra Conmutativa”. Al alumno se le supone
el conocimiento previo del sofisticado salto que dió É. Galois y ahora se trata de enfrentar otro
∃ ligeramente distinto, algo más moderno. Se suele citar a D. Hilbert2, en su trabajo de 1893
sobre la Teorı́a de Invariantes, como el origen de ese otro punto de partida del pensamiento fuera
del tarro: el Nullstellensatz. Aunque un poco antes, en 1882, L. Kronecker 3 prueba el mismo
resultado en un contexto ligeramente distinto, por lo que es más difı́cil de detectar su presencia.
La pregunta es ahora sobre la existencia de soluciones en Cn de un sistema finito de ecuaciones
4E. Noether, Der Endlichkeitsatz der Invarianten endlicher linearer Gruppen der Charakteristik p,
Nachrichten von der Gesellschaft der Wissenschaften zu Göttingen (1926), 28–35
10 0. PRÓLOGO
de polinomios sobre cuerpos finitos, la División de Hironaka y las Bases de Gröbner, junto a
algoritmos como los tests de “composición” de Solovay-Strassen y Miller-Rabin o los algoritmos
de multiplicación “rápida de matrices de V. Strassen o S. Winograd, entre otros.
El problema, en la impartición de una asignatura como ésta, es doble: de una parte, el Grado
en la Universidad de Cantabria tiene 120 horas de docencia en Álgebra Lineal en la que no
se alcanzan objetivos mı́nimos imprescindibles y, de otra parte, el Álgebra Conmutativa es
una parte “descarnada” del conocimiento matemático. El primer problema es un problema
grave: No se puede admitir un graduado en Matemáticas sin unos conocimientos sólidos en
Álgebra Lineal. Por eso, el curso contiene, subrepticiamente en sus primeros capı́tulos, un curso
básico de Álgebra Lineal y Teorı́a del Endomorfismo (camuflado a la manera más elegante
de módulos sobre dominios de ideales principales), cuyos contenidos son, sorprendetemente,
desconocidos para los alumnos de último cuatrimestre de tercero de un Grado de Matemáticas.
Estos contenidos se presentan como aplicaciones de algunas de las propiedades de anillos y
módulos y, sobre todo, en el cuerpo de los problemas de los primeros Capı́tulos. Por eso, el
curso dedica sus buenas 280 páginas a aspectos tan elementales como la noción de determinante,
el teorema de Hamilton-Cayley, los dominios de ideales principales, los dominios euclı́deos, los
dominios de factorización única, los módulos finitamente generados sobre dominios de ideales
principales, La Forma Normal de Smith y su interacción con la Teorı́a del Endomorfismo (la
llamada Forma de Frobenius) o el histórico Teorema Chino de los Restos (que Jordan “tradujo”
en la llamada Forma Canóica de Jordan).
En honor a E. Noether, a su colaboración con Lasker y al desarrollo de las ideas de Hilbert (que
ella misma denomina “Meine Methoden sind Arbeits- und Auffassungsmethoden...”). Por eso
se intercala un Capı́tulo en el que no sólo se demuestra el Teoramde la Base de Hilbert como el
éxito de Lasker-Noether en “factorizar” ideales no principales, generalizando el sueño de Gauss.
Las contribuciones de E-Artin a estas ideas de Nother quedan para una segunda parte de este
manual para la caza de dragones.
En lo que respecta a la segunda dificultad, al tratarse de uno de los lenguajes de la Geometrı́a,
se vuelve lenguaje “per se” y pierde el acercamiento visual de algo más dibujable. Aprender
un lenguaje relevante pero descarnado es una tarea ardua como principio. Nada pasa o nada
parece pasar si no hay un poco de Geometrı́a a su lado. Pero el “poco” de Geometrı́a ya es
un mucho de formación que, ligada al conocimiento del lenguaje, entrelaza inexorablemente
ambas formaciones. Y esto no encaja en el universo fragmentario y burocrático, a la par que
superficial, de los Grados de Matemáticas de la decadente universidad española actual.
Como remate, la formación media de los graduados en matemáticas posee fuertes lagunas de
conocimiento “recordado” (o, si se prefiere, un exceso de “no recuerdo” o “ no lo he visto”), lo
que obliga a retomar ese mismo concocimiento desde sus mismos elementales orı́genes. Final-
mente, y como primer paso a la interacción entre Álgebra y Geometrı́a, dedicamos un Capı́tulo
a la terminologı́a básica de la llamada topologı́a de Zariski e introduciremos un demostración
muy elemental del Nullstellensatz de Hilbert-Kronecker. Daremos una demostración muy ele-
mental que usa implı́citamente la Normalización de Noeteher, pero sin desarrollarla aún, y la
resultante de dos polinomios univariados, uno de los cuales es mónico. Todo ello se presenta
aderezado de ejercicios y ejemplos bien conocidos, a la par que evidentes. Muchos ejemplos de
algoritmos, algunos de los cuales no suelen ser comúnmente conocidos, son descritos como prob-
lemas y, en ocasiones, como enunciados del texto. Con todo ello se ha configurado una Parte 1
de Prerrequisitos que, por casualidad, está formada por las muchas ideas que los gigantes que
nos precedieron dieron a la luz durante el siglo XIX y primeros años del siglo XX.
No será hasta la Parte ??, a jugar con un formalismo más actualizado del Álgebra Conmutativa
con la presencia de la escuela de Cartan y Eilenberg (muy influyentes a partir de mediados
sel sigloXX) y la conjugación del lenguaja del Álgebra Homológica con el lenguaje del Álgebra
Conmutativa. No obstante, mucho de esa futura Parte ?? seguirá estando inspirado por Hilbert,
Krull y Noether, aunque sólo aparezcan de modo fragmentario. Debo decir que mi visión sobre
este curso debe mucho a la escuela japonesa (Nakayama, Azumaya, Nagata, Matsumura), al
clásico texto de Atiyah y Macdonald, a “libruco” de S. Raghavan y co-autores, al texto de E.
Kunz, a los clásicos de Zariski y Samuel y, sin falsa humildad, a un poco de lectura y pen-
samiento de quien suscribe que siempre admiró la excelente arquitectura colectiva levantada
0. PRÓLOGO 11
en torno a estas ideas. Aunque están esbozadas otras partes más técnicas y recientes, con
contribuciones que pretenden mostrar mi lealtad a maestros y amigos, todo está inacabado por
la dificultad doble de encontrar tiempo y encontrar los textos/poemas que más se ajusten al
mensaje inmanente de cada Capı́tulo. Sueño con tener la disponibilidad en tiempo para trans-
feriri esos otros capı́tulos a este Latex interminable, aunque mi incapacidad como mecanógrafo
sea públicamente conocida e inhabilitante. Mientras tanto, lanzo al formato de Trabajos Fin
de Grado muchos de los capı́tulos que algún dı́a añadiré.
No debo dejar este Prólogo sin mostrar mi más sincero agradecimiento a cuantos alumnos
hicieron el esfuerzo de una lectura crı́tica de los textos. A pesar de que cada año son modificados,
a pesar de mis dilsexia y disgrafı́a con los tipos de imprenta (que plagan el texto de erratas), las
lecturas y comentarios de algunos pocos alumnos me han ayudado a ir mejorando cada parte,
cada año y a evitar groseras barbaridades. Gracias a ellos por sus lecturas,
Suerte al lector y suerte a los alumnos que traten de entenderlo. No es fácil porque no es trivial,
pero tampoco es tan profundo que nos pueda abrumar.
May 11, 2023.
5
5Este Prólogo hace referencia a un texto incompleto que contiene muchos Capı́tulos sin desarrollar. Quizá
algún dı́a tenga la paciencia de encontrar los poemas que reflejan los contenidos de los Capı́tulos inacabados.
Pero “hoy no es ese dı́a”.
6M. Letourneau, J. Wright Sharp, AMS Style Guide, Journals, October 2017, AMS, Providence, 2017
7D. E. Knuth, T. Larrabee, P. M. Roberts, Mathematical Writing, MAA, 1989
Part 1
Solomon saith,
ç There is no new thing upon the earth.
So that as Plato had an imagination,
That all knowledge was but remembrance;
so Solomon giveth his sentence:
That all novelty is but oblivion.
(R. Bacon)
15
16 1. PRE-ÁLGEBRA
Índice
1.1. Introducción: Prerrequisitos. 16
1.2. Semigrupo, monoide, grupo, acciones 16
1.2.1. Las nociones básicas 16
1.2.2. Un ejemplo: alfabeto, palabras, lenguajes 18
1.2.2.1. Operaciones Básicas con palabras. 20
1.2.2.2. Operaciones Elementales con Lenguajes. 20
1.2.3. Grupos 21
1.2.3.1. La terminologı́a usual con morfismos: Teorema de Schreier. 22
1.2.3.2. Generación de Subgrupos 26
1.2.4. Acciones de un grupo 27
1.2.5. Ejercicios y problemas de la Sección 1.2 35
1.2.5.1. Descomposición en Valores Singulares. 39
1.3. El paradigma de las acciones transitivas y fieles: Sn 42
1.3.1. Grupo simétrico Sn : Órbitas, ciclos, transposiciones. 42
1.3.2. Índice de una permutación 48
1.3.2.1. Índice por la naturaleza de la identidad. 48
1.3.2.2. Índice de una permutación por alteración del orden
(Alternativo). 50
1.3.3. Ejercicios y problemas la Sección 1.3 53
1.4. Anillos, ideales, morfismos de anillos 54
1.4.1. Propiedades generales 54
1.4.2. Anillos de polinomios y de series de potencias formales en varias variables 65
1.4.3. Otros ejemplos 70
1.4.4. Ejercicios y problemas de la Sección 1.4 71
1.4.4.1. Problemas sobre cuerpos ordenados o formalmente reales 75
1.4.4.2. Problemas sobre Órdenes Monomiales y división de Hironaka. 76
f: S −→ T
a 7−→ f (a),
f (x ∗ y) = f (x) ⊥ f (y).
Un morfismo entre dos monoides (M, ∗), (N, ·), con respectivos elementos neutros eM y eN , es
un morfismo de semi-grupos fM −→ N que verifica, además, la siguiente propiedad:
f (eM ) = eN .
+ : Nn × Nn −→ Nn ,
dada mediante:
(µ1 , . . . , µn ) + (θ1 , . . . , θn ) := (µ1 + θ1 , . . . , µ1 + θ1 ).
A los elementos µ ∈ Nn se les suele denominar multi-ı́ndices (o también exponente monomial ).
Más aún, la siguiente aplicación es un morfismo de monoides entre (Nn , +) y (N, +), llamada
grado: | · | : Nn −→ N, dada mediante
|(µ1 , . . . , µn )| = µ1 + · · · + µn .
A los elementos de Nn , en este contexto, se les suele llamar exponentes o exponentes monomiales.
18 1. PRE-ÁLGEBRA
1.2.2. Un ejemplo: alfabeto, palabras, lenguajes. Lo que sigue son unas notas rela-
tivas al ejemplo más simple de monoide, dentro del contexto de los Lenguajes Formales y de las
ideas de N. Chomsky (cf. [ChMi, 1957], [Ch, 1959a],[Ch, 1959b], [Ch, 1962], [Ch, 1965],
por ejemplo). La primera idea, que se remonta al Cı́rculo de Viena, es que en toda comunicación
no ambigua (o en toda computación), lo único susceptible de comunicarse (o comptar) viene
escrito sobre un alfabet finito. Ası́ que comenzamos con esta definición elemental.
Definición 3 (Alfabeto, Palabras, Lenguajes). Sea Σ un conjunto finito que llamaremos
alfabeto.
i) Una palabra de longitud n sobre el alfabeto Σ es una lista finita de sı́mbolos de Σ.
Podemos formalmente identificar las listas x = x1 · · · xn de sı́mbolos (xi ∈ Σ) con
los elementos del producto cartesiano Σn . Denotaremos por |x| = n la longitud de la
palabra x1 · · · xn .
ii) El conjunto de todas las palabras sobre el alfabeto Σ se denotará mediante Σ∗ y podemos
identificarlo con la unión disjunta
[˙ n
Σ∗ = Σ
n∈N
∗
iii) Los subconjuntos L de Σ se denominan lenguajes.
Veremos enseguida que todos los lenguajes son conjuntos numerables, pero el número de lengua-
jes (identificable con la clase de subconjuntos de N, P(N)) es no numerable.
Ejemplo 1.2.3. Como ejemplos de alfabetos y palabras podemos destacar los siguientes:
i) Alfabetos Unarios. Son alfabetos Σ := {a} formados por un único elemento. Por
ejemplo, Σ1 := {1}. Las palabras x ∈ Σ∗1 n sobre este alfabeto son listas de la forma:
(n
,
x= 11 · · · 1
y, obviamente, es una representación mediante “palotes” de los números naturales.
Es decir, definir N := Σ∗1 , para cualquier alfabeto unario. El elemento 0 ∈ N es la
longitud de (y, por ende, es) la palabra vacı́a λ.
ii) Alfabeto Binario: bits. Son todos los alfabetos Σ con dos elementos. Su objeto
habitual es el alfabeto Σ1 := {0, 1} cuyos elements se llaman bits. El conjunto de las
palabras en Σ∗2 de longitud n se puede identificar con el conjunto {0, 1}n .
iii) Alfabeto del español. Son los sı́mbolos comúnmente admitidos en la lengua española,
incluyeno el sı́mbolo de espacio o el sı́mbolo de punto final de párrafo. Ası́, con estas
dos inclusiones, un capı́tulo de “El Quijote” o un capı́tulo de “Tiempo de Silencio” o
un poema de “Poeta en Nueva York” son palabras sobre el alfabeto español.
iv) Alfabeto Cirı́lico (o alfabetos de otros idiomas europeos). Son los alfabetos
de cada una de las lenguas en vigor en cada uno de esos paı́ses. Ası́, un capı́tulo de
“El Idiota” o de “La Odisea” son, respectivamente, palabras sobre el alfabeto cirı́lico
o el griego clásico.
v) Otros alfabetos del Lenguaje Natural. Desde el alfabeto de los “Vedas”, hasta el
alfabeto árabe clásico de “Al-Quaran” o el alfabeto mandarı́n para la obra de Sun-Tzu
sobre “el Arte de la Guerra”...Son todos alfabetos generados por las distintas culturas
para comunicarse entre sı́ o para preservar información a lo largo del tiempo.
vi) ASCII (American Standard Code for Information Interchange): byte. Es
el alfabeto correspondiente al teclado estándard de un ordenador. Creado el 6 de
Octubre de 1960, quedó como un estándard de la codificación en ordenadores y aún
permanece como tal en las telecomunicaciones (salo por la masiva degeneración de los
emoticonos originales a través de sub-products como Whatsapp). Se trata del alfabeto
1.2. SEMIGRUPO, MONOIDE, GRUPO, ACCIONES 19
del teclado. Para “codificarlo” se usó el alfabeto de 8 bits (Σ28 := {0, 1}8 ). Por tanto,
la unidad de comunicación pasó a ser una lista de 8 bits que acabó denominándose
byte.
vii) El Lenguaje de la Vida. Sea Σlife = {A, C, G, T},representando las cuatro bases
que conforman el ADN, a saber: Adenina, Guanina, Citosina y Timina (reciente-
mente se suele añadir también U por Uracilo como sı́mbolo del “alfabeto de la vida”).
Las cadenas de ADN forman un lenguaje que contiene la información genética y esta
empaquetada de esta forma para su posible transmisión hereditaria. Curiosamente,
este lenguaje es casi universal y se aplica a todos los seres vivos.
Cada cadena de ADN guarda la codificación de varias proteı́nas. Dentro del ADN, cada
secuencia de tres bases de las mencionadas corresponden a un aminoácido concreto.
Esto se conoce como el código genético. Por ejemplo, la combinación AT G representa
el inicio de la secuencia y el final puede ser representada por T GA, T AG, T AA 1 . Debe
señalarse que no sólo son las cadenas sı́mbolos, sino la estructura de inter-conexiones,
representado a través de la hélice doble, lo que caracteriza el ADN individual.
En cambio, el ARN resulta más simple como lenguaje. El alfabeto cambia a ΣARN life =
{A, C, G, U} por adenina, guanina, citosina y uracilo y las cadenas de palabras son
suficientes. Lo que no obsta para que el lenguaje del ARN se salga de la clasificación
tradicional de lenguajes de Noam Chomsky. Esto ha sido aprovechado, por ejemplo,
en algunas de la vacunas para la COVID19 (Pfizer, Moderna, etc.).
Proposición 1.2.4. Con las notaciones anteriores, (Σ∗ , ·) es un monoide, donde λ es el ele-
mento neutro. La longitud define un morfismo de monoides entre (Σ∗ , ·) y el monoide (N, +).
El monoide Σ∗ es conmutativo si y solamente si el cardinal de Σ es uno. De hecho, la operación
suma + sobre N es siplemente la operación de adjunción, cuando identifamos N ∼= Σ∗1 .
Demostración. Ejercicio obvio.
Lema 1.2.5. Si Σ es un alfabeto finito, el conjunto Σ∗ es numerable, esto es, es biyectable con
el conjunto N de los números naturales.
Demostración. Para dar una prueba de este enunciado basta con fijar un buen orden en
Σ∗ . Un ejercicio razonable consiste en definir el buen orden basado en “lexicográfico + longitud”
length+lex que define la biyección. Recuérdese que el orden lexicográfico es el orden usual del
“diccionario”, i.e.i.e.2 basado en establecer un orden en el alfabeto Σ (en ocasiones lo llamarán
alfabético). Es decir, sea un orden total en Σ (que existe por ser Σ finito). Supongamos que
los elementos de Σ quedan ordenados mediante:
Σ := {α1 α2 · · · αr }.
Definimos para x = x1 . . . xn , y = y1 . . . ym ∈ Σ∗ la relación de orden siguiente:
o bien n = |x| < |y| = m,
∃k ≤ n = m, ∀i ≤ k − 1,
x ≤ y ⇐⇒ o bien |x| = |y| = n = m, xi = yi ,
xk yk
o bien x = y.
1El ADN siempre se ha considerado el “lenguaje de la vida” y parece que se cumple la máxima de Galileo:
“La Naturaleza es un libro escrito con el lenguaje de las matemáticas”.
2Abreviatura de la expresión latina id est, traducida al español por “esto es”.
20 1. PRE-ÁLGEBRA
Esta relación de orden es un buen orden en Σ∗ y permite una identificación (biyección) entre
Σ∗ y N, asociando a cada elemento de Σ∗ , el número de elementos menores que el:
λ 7−→ 0
α1 7−→ 1
α2 7−→ 2
···
α1 α1 7−→ r+1
α1 α2 7−→ r+2
···
Nótese que como consecuencia (Corolario) se tienen las propiedades siguientes:
Corolario 1.2.6 (Los lenguajes son conjuntos contables). Sea Σ un alfabeto finito y
L ⊆ Σ∗ un lenguaje. Entonces, L es un conjunto contable (i.e. es finito o numerable).
Más aún, el cardinal de los posibles lenguajes L ⊆ Σ∗ coincide con el número de subconjuntos
de N y, por tanto, verifica:
] (P(Σ∗ )) = ] (P(N)) = ] (R) = 2ℵ0 .
En particular, hay una cantidad infinita no numerable de lenguajes sobre un alfabeto finito.
1.2.2.1. Operaciones Básicas con palabras. Además de la concatenación de palabras,
podemos destacar las siguientes:
i) Potencia de Palabras. Se define recursivamente a partir de la concatenación. Ası́,
dada una palabra ω ∈ Σ∗ y un número natural n ∈ N, definimos la potencia ω n ,
mediante:
• Definimos ω 0 = λ,
• Para n ≥ 1, definimos
ω n := ω · ω n−1 .
ii) Reverso de una Palabra: Se trata de una biyección
R
: Σ∗ −→ Σ∗ ,
dada mediante:
• Si ω = λ, λR = λ,
• Si ω = x1 · · · xn ∈ Σ∗ , con xi ∈ Σ, definimos
ω R := xn xn−1 · · · x1 ∈ Σ∗ .
Ejemplo 1.2.7. Un lenguaje de cierta relevancia es el Palı́ndromo P ⊆ {0, 1}∗ y que viene
dado por la siguiente igualdad:
P := {ω ∈ {0, 1}∗ : ω R = ω}.
Proposición 1.2.9 (Distributivas). Con las anteriores notaciones, se tienen las siguientes
propiedades para lenguajes L1 , L2 y L3 contenidos en Σ∗ :
L1 · (L2 ∪ L3 ) = L1 · L2 ∪ L1 · L3 .
(L1 ∪ L2 ) · L3 = L1 · L3 ∪ L2 · L3 .
Otras operaciones importantes entre lenguajes, hacen referencia al cálculo de la clausura tran-
sitiva por la operación de adjunción :
i) Clausura transitiva o monoide generado por un lenguaje: Dado un lenguaje L ⊆ Σ∗
definimos el monoide L∗ que genera mediante la igualdad siguiente:
[
L∗ := Ln .
n∈N
1.2.3. Grupos.
Definición 5 (Grupo). Un grupo es un monoide (G, ∗) que verifica la siguiente propiedad
adicional:
Existencia de Inverso: ∀x ∈ G, ∃x0 ∈ G, x ∗ x0 = x0 ∗ x = eG ,
donde eG es el elemento neutro de (G, ∗). Para cada x ∈ G, todo elemento x0 tal que x0 ∗ x =
x0 ∗ x = eG se denomina inverso de x y se denota x−1 . Un grupo abeliano es un grupo cuyo
monoide subyacente es conmutativo.
Ejemplo 1.2.10. El conjunto (Zn , +) con la operación:
+ : Zn × Zn −→ Zn ,
dada mediante:
(µ1 , . . . , µn ) + (θ1 , . . . , θn ) := (µ1 + θ1 , . . . , µ1 + θ1 ),
es un grupo abeliano.
Notación 1.2.12 (Notación para Grupos Abelianos). Es habitual que los grupos abelianos
se representen mediante notación aditiva. Es decir, se suelen presentar mediante la forma
“(G, +) es un grupo abeliano”. El elemento neutro de un (G, +) se suele denotar mediante 0G
o, simplemente, 0, cuando no haya confusión. Para cada elemento g ∈ G de un grupo abeliano
(G, +) el inverso de g se denomina “el opuesto de g” y se suele denotar mediante −g.
Ejemplo 1.2.13 (Grupos cı́clicos finitos). Los grupos cı́clicos finitos son grupos abelianos,
isomorfos a las clases de restos de elementos en Z con respecto al subgrupo nZ = {nx : x ∈ Z}.
Denotaremos estos grupos cociente mediante Z/nZ o por Z/(n). Nunca mediante Zn que
corresponderá a otra construcción (véase el ı́tem iv) del Ejemplo ??). Será admisible usar Cn
para describir al grupo cı́clico de orden n.
22 1. PRE-ÁLGEBRA
Definición 7 (Morfismo de grupos). Un entre dos grupos (G, ∗), (H, ⊥)es un morfismo
entre los subyacentes monoides. Es decir, f : (G, ∗) −→ (H, ⊥) es morfismo de grupos si
f (eG ) = eH y
∀x, y ∈ G, f (x ∗ y) = f (x) ⊥ f (y).
Proposición 1.2.15. Sean (G, ∗) y (H, ⊥) dos grupos. Una aplicación f : G −→ H define un
morfismo de grupos f : (G, ∗) −→ (H, ⊥) si y solamente si se verifica la siguiente propiedad:
−1
∀x, y ∈ G, ϕ(x ∗ y −1 ) = ϕ(x) ⊥ (ϕ(y)) .
En particular, los morfismos de grupos transforman los inversos de los elementos del primer
grupo, en inversos de la imagen.
Demostración. Basta con ver que los morfismos de monoide entre grupos transforman
inversos en inversos. Supongamos ϕ : (G, ∗) −→ (H, ⊥) un morfismo de grupos y sea g ∈ G,
entonces,
−1
ϕ(g −1 ) = (ϕ(x)) .
Para verificarlo, baste con observar que
ϕ(g) ⊥ ϕ(g −1 ) = ϕ(g ∗ g −1 ) = ϕ(eG ) = eH ,
y
ϕ(g −1 ) ⊥ ϕ(g) = ϕ(g −1 ∗ g) = ϕ(eG ) = eH .
El recı́proco es también obvio y omitimos su prueba.
Proposición 1.2.16. Sea f : (G, ∗) −→ (H, ⊥) un morfismo de grupos. Sean S ⊆ G y T ⊆ H
dos subgrupos de G y H respectivamente. Entonces, también se tiene que f (S) es subgrupo de
H y f −1 (T ) es subgrupo de G.
Entre los subgrupos obtenidos como imagen y anti-imagen de subgrupos por morfismos de grupos,
son destacables el núcleo y la imagen, respectivamente definidos mediante:
ker(f ) := f −1 ({eH }) := {x ∈ G : f (x) = eH }.
Im(f ) := f (G).
Demostración. Queda como problema.
1.2.3.1. La terminologı́a usual con morfismos: Teorema de Schreier. En oca-
siones se encuentra la terminologı́a homomorfismo en lugar de morfismo que hemos usado en
la definición precedente. Nosotros usaremos, como en Teorı́a de Categorı́as el término mor-
fismo, seguido de la palabra que indica la categorı́a en la que estemos ocupados: Ası́, usaremos
sufijos para indicar “morfismo de monoides”, “morfismo de grupos”, “morfismos de espacios
vectoriales”, etcétera.
Pero, a la hora de clasificar o comprender los morfismos, son también importantes los prefijos.
Consideraremos algunos usuales. Ası́, sea
f : (G, ∗) −→ (H, ⊥),
un morfismo de alguna clase. Se pueden encontrar los términos:
• Endo-: Llamamos “endomorfismo” , cuando (G, ∗) = (H, ⊥).
1.2. SEMIGRUPO, MONOIDE, GRUPO, ACCIONES 23
Los términos usuals para entender este fenómeno son los términos de monomorfismo y epimor-
fismo que daremos a continuación.
Para mejor recordar estas nociones, consideremos los siguientes dos diagramas que reflejan la
condición de monomorfismo y epimorfismo:
• Con las anteriores notaciones, f es monomorfismo si para todo grupo (T, ?) y cua-
lesquiera dos morfismos α1 , α2 : (T, ?) −→ (G, ∗), si el siguiente diagrama es conmu-
tativo:
(T, ?) f ◦ α1
α1
f
Id (G, ∗) (H, ⊥)
T
α2
(T, ?) f ◦ α2
Es decir, si f ◦ α1 = f ◦ α2 , entonces, α1 = α2 .
• Con las anteriores notaciones, f es epimorfismo si para todo grupo (T, ?) y cualesquiera
dos morfismos α1 , α2 : (H, ⊥) −→ (T, ?), si el siguiente diagrama es conmutativo:
α1 ◦ f (T, ?)
α1
f
(G, ∗) (H, ⊥) Id
T
α2
α2 ◦ f (T, ?)
Es decir, si α1 ◦ f = α2 ◦ f , entonces α1 = α2 .
Ya hemos visto que, en general, monomorfismo y morfismo inyectivo (respectvamente, epimor-
fismo y morfismo suprayectivo o ismorfismo y morfismo biyevtivo) no siempre son sinónimos.
Esta equivalencia, usualmente ausmida en las presentaciones de los grupos, es un caso particular
de los morfismos de grupos. Es el resultado que introducimos a continuación. Aunque el resul-
tado sobre la caracterización de epimorfismos de grupos de atribuye a O. Schreier (1901-1929),
su forma actual de debe a C. Linderholm (cf. [Lind, 1970]) que es la presentación elegida en
estas páginas.
Teorema 1.2.19. Con las anteriores notaciones, sea f : (G, ∗) −→ (H, ⊥) un morfismo de
grupos.
i) El morfismo f es morfismo inyectivo si y solamente si
ker(f ) := {x ∈ G : f (x) = eH } = {eG }.
ii) El morfismo f es monomofismo (en la categorı́a de grupos) si y solamente si f es
morfismo inyectivo.
iii) (Teorema de Schreier) El morfismo f es epimorfismo (en la categorı́a de grupos)
si y solamente si f es un morfismo suprayectivo.
Demostración. Demostraremos cada ı́tem separadamente:
i) Es evidente que si f es inyectiva ker(f ) = {eG }. Recı́procamente, si ker(f ) = {eG },
supongamos que tenemos x, y ∈ G tales que f (x) = f (y). Entonces, xy −1 ∈ ker(f ) y,
por tanto, x = y con lo que tenemos la inyectividad.
ii) Si f es inyectiva, se verifica obviamente la propiedad indicada con lo que tenemos la
implicación ⇐=. Recı́procamente, supongamos que f es un monoformismo de gru-
pos. Consideremos ker(f ) con la operación inducida por la de (G, ∗) como grupo y
1.2. SEMIGRUPO, MONOIDE, GRUPO, ACCIONES 25
Demostración de la Afirmación.
3Aunque mantendremos la notación σ y σ −1 por razones didáctias: al alumno puede “recordarle” alguna
la semejanza con los subgrupos normales
26 1. PRE-ÁLGEBRA
Corolario 1.2.20. En la categorı́a de grupos, los isomorfismos de grupos son los morfismos
biyectivos y, por tanto, aquellos morfismos de grupos que son, a la vez, monomorfismos y
epimorfismos.
Demostración. Baste observar que los isomorfismos son precisamente aquellos morfismos
que son inyectivos y suprayectivos a la vez y usar el anterior Teorema.
La siguiente Proposición indica la relación entre los conjuntos de palabras Σ∗ y los grupos
finitamente generados, subyacente a las ideas de Thue y, finalmente, al Teorema de Novikov-
Boone.
Proposición 1.2.22. Sea (G, ∗) un grupo. Entonces, G es finitamente generado como grupo si
y solamente si existe un alfabeto finito Σ y un morfismo suprayectivo de monoides:
ψ : (Σ∗ , ·) −→ (G, ∗),
donde · es la operación de adjunción sobre Σ∗ .
Demostración. Es la clásica representación de los elementos de un grupo generado por
un subconjunto finito F = {γ1 , . . . , γm }. Los elementos g ∈ G vienen representados como
palabras
g = γi1 ∗ γi2 ∗ · · · ∗ γi` ,
con ik ∈ {1, . . . , γm }. Esta representación es simplemente la escritura informal de un morfismo
de monoides suprayectivo de la forma siguiente:
ψ: (F ∗ , ·) −→ (G, ∗)
γ i1 · · · · · γ i` 7−→ γi1 ∗ · · · ∗ γi` .
Dejamos los detalles al lector.
Observación 1.2.23. Nótese que el morfismo suprayectivo de monoides anterior no es, en gen-
eral, inyectivo. Aunque sı́ se puede inducir una relación de equivalencia ∼ sobre F ∗ que define
una estructura de grupo en el conjunto cociente F ∗ / ∼ a través de la adjunción de clases. Esto
permitirá identificar (G, ∗) con el cociente de (F ∗ / ∼, ·). Por tanto, los grupos finitamente
generados son los cocientes de conjuntos de palabras Σ∗ por relaciones de equivalencia espe-
ciales compatibles con la operación de adjunción de palabras. Entre ellos son especialmente
significativos los grupos finitamente generados y finitamente presentados que son los grupos en
los que la relación de equivalencia ∼ sobre Σ∗ está generada por una familia finita de reglas de
reescritura.
1.2.4. Acciones de un grupo.
Definición 11 (Acción de un monoide/grupo). Sea X un conjunto no vacı́o y (G, ∗) un
monoide. Una acción a izquierda del monoide G sobre X es una aplicación:
·G : G × X −→ X
(g, x) 7−→ g · x,
verificando
i) Dados cualesquiera g1 , g2 ∈ G y x ∈ X se tiene:
g1 ·G (g2 ·G x) = (g1 ∗ g2 ) ·G x.
ii) Si e ∈ G es el elemento neutro de G se tiene, para cada x ∈ X:
e · x = x.
Si (G, ∗) es un grupo diremos que es una acción a izquierda de un grupo sobre el conjunto X
En lo que respecta a esta Sección nos centraremos fundamentalmente en las acciones de grupo.
En Capı́tulos posteriores nos interesarán también las acciones de monoides.
Ejemplo 1.2.24 (Algunos ejemplos y comentarios sobre acciones de grupos). Unos
pocos comentarios preliminares:
i) La primera de las propiedades indicadas en la definición indica que se tiene una cierta
asociatividad entre la operación de grupo ∗ y la acción ·. Por eso se suelen denotar
con el mismo sı́mbolo (i.e. escribir (G, ·) para el grupo y ·G para la acción “externa”
del grupo sobre el conjunto X. Progresivamente iremos suprimiendo el sı́mbolo · de
las operaciones, siempre que no genere confusión alguna.
28 1. PRE-ÁLGEBRA
v) De modo más general, las acciones a izquierda y a derecha de un grupo están rela-
cionadas a través de la inversión en G de modo obvio. Si R : G × X −→ X es una
acción a derecha de un grupo G sobre un conjunto X, la siguiente es una acción a
izquierda:
R0 : G × X −→ X
(g, x) 7−→ R(g −1 , x).
Esto determina una biyección entre ambos tipos de acciones. En lo que queda nos
ocupamos sólo de acciones a izquierda.
vi) Consideremos el grupo simétrico sobre un conjunto X, (S (X), ◦) introducido en el
Ejemplo 1.2.11. De manera natural define una acción a izquierda sobre el conjunto X
mediante:
◦S : S (X) × X −→ X
(1.2.2)
(σ, x) 7−→ σ(x).
Proposición 1.2.25. Sea (G, ·) un grupo y sea X un conjunto no vacı́o y sea ∗G : G×X −→ X
una acción a izquierda. Se tiene:
i) Para cada g ∈ G, la siguiente es una biyección (y, por tanto, está en S (X))4
ηg : X −→ X
x 7−→ g · x.
ii) El siguiente es un morfismo de grupos:
H : G −→ S (X)
g 7−→ ηg .
iii) Las órbitas definen una relación de equivalencia sobre X. Ası́, dado S ⊆ G un sub-
grupo, la siguiente es una relación de equivalencia sobre X
x ∼S y ⇐⇒ y ∈ OS (x).
Más aún, las clases de equivalencia son las órbitas, es decir,
x ∼S y ⇐⇒ OS (x) = OS (y).
Al conjunto cociente de X por la órbitas definidas por S a través de la acción de G se le denota
mediante X/ ∼S .
Demostración. Las propiedades i) y ii) son obvias dado que son, precisamente, las usadas
−1
en la definición de acción a izquierda anterior y dado que ηg−1 = (ηg ) .
Para la propiedade iii), bastará con que probemos la siguiente propiedad:
\
OS (x) OS (y) 6= ∅ ⇐⇒ OS (x) = OS (y).
Pero esa propiedad se sigue si probamos la siguiente:
∀z ∈ X, z ∈ OS (x) ∩ OS (y) =⇒ y ∈ OS (x).
4Bastantes autores prefieren la notación L en lugar de η haciendo referencia a que la acción es “a
g g
izquierda” (left). En estas notas hemos preferido usar ηg porque la homotecia de multiplicación por un elemento
(del grupo o de cualquier otra etructura) tiene un papel esencial en el sustrato cultural del curso.
30 1. PRE-ÁLGEBRA
porque S subgrupo (i.e. g2−1 g1 ∈ S). Por tanto, y ∈ OS (x) y, consecuentemente, OS (y) ⊆
OS (x). El mismo argumento, “mutatis mutandi”, nos lleva a concluir que OS (x) ⊆ OS (y) y
ambas órbitas han de ser iguales.
Obviamente esto significa que la siguiente es una partición de X a través de las órbitas de la
acción de S sobre X:
{OS (xi ) : i ∈ I} = {OS (x) : x ∈ X},
En particular, tendremos la relación de equivalencia ∼S como se indica en el enunciado.
Ejemplo 1.2.26. Varios comentarios sobre la acción de grupo y las órbitas.
i) Obviamente se tiene la siguiente igualdad:
[
OS (N ) := OS (x).
x∈N
ii) Si tomamos la acción definida en el apartado ii) del Ejemplo 1.2.24 precedente:
η : K× × V ∗ −→ V∗
(λ, v) 7−→ ηλ (v) := λv,
el conjunto de las órbitas es una construcción geométrica básica conocida como , el
espacio tangente de V como K−espacio vectorial y se denota mediante P(V ). Es
la clase de los subespacios de dimensión uno como K−espacio vecorial. Nótese que,
obviamente depende del cuerpo K en consideración. En el caso V = K n se suele
denotar mediante Pn−1 (K), donde n − 1 hace referencia a la dimensión sobre K.
iii) Dada la acción de un grupo sobre sı́ mismo, las órbitas (por la acción a izquierda) de
un elemento σ ∈ G con respecto a un subgrupo S ⊆ G serán las clases a derecha, es
decir, se trata de:
OS (σ) := Sσ := {gσ : g ∈ S}.
En este caso, también se pueden considerar las órbitas a la derecha (interpretando la
acción a derecha):
(R)
OS (σ) := σS := {σg : g ∈ S}.
Esta es la notación más habitual para las clases módulo un subgrupo. En el caso de
subgrupos normales se estudia la relación entre ambos tipos de clases (ver Problema
11).
iv) Grupo de Automorfismos de una extensión de cuerpos. Los alumnos de este curso
han visto, mayoritariamente, un curso de Teorı́a de Galois por lo que, aunque no
veremos la noción de anillo y subanillo hasta dentro de algunas páginas, introducimos
aquı́ un ejemplo basado en extensiones de cuerpos y morfismos de cuerpos. Ası́,
consideremos (L, +, ·) un cuerpo y K ⊆ L un subconjunto que es subcuerpo (es decir,
(K, +) es subgrupo de (L, +) y (K × , ·) es subgrupo de (L× , ·), donde K × = K \ {0}
y L× = L \ {0}. Se dice que K ⊆ L es una extensión de cuerpos. Consideramos el
siguiente conjunto:
AutK (L) := {f : L −→ L : f es automorfismo de cuerpos y f = Id },
K K
donde automorfismo significa isomorfismo de anillos. Con la composición de aplica-
ciones (AutK (L) es un subgrupo del grupo de permutaciones (S (L), ◦). Y tenemos
inducida una acción a izquierda natural:
·: AutK (L) × L −→ L
(f, x) 7−→ f (x).
La ŕobita de un elemento x ∈ L se denomina los “elementos conjugados de x en L”.
Claramente se observa que si x ∈ L es algebraico sobre K, su órbita bajo esta acción
es finita, es decir, verifica:
] OAutK (L) (x) < ∞.
1.2. SEMIGRUPO, MONOIDE, GRUPO, ACCIONES 31
la acción de grupo:
·U (n) : U (n) × Hn (C) −→ Hn (C)
(P, A) 7−→ P AP ∗ .
Se trata de una acción de grupo que define una relación de equivalencia sobre Hn (C).
En este caso, el número de órbitas está identificado con Rn . En particular, sirve para
clasificar métricamente las formas sesqui-lineales y formas cuadráticas cobre C. 8
5Teóricamente, el curso de Álgebra Lineal I está dedicado a entender esta acción del grupo GL(n, K).
6Teóricamente, el Álgebra Lineal de Bachillerato está dedicado a entender esta acción de grupo.
7Teóricamente, el curso de Álgebra Lineal II está dedicado a entender esta acción de grupo.
8Teóricamente, el curso de Álgebra Lineal II está dedicado a entender esta acción de grupo.
32 1. PRE-ÁLGEBRA
Observación 1.2.27. La parte usualmente difı́cil cuando se trata de acciones de grupos sobre
conjuntos es la determinación de las órbitas y, en particular, la determinación de representantes
significativos (llamados “canónicos”) de cada una de las órbitas. Entre los ejemplos se pueden
ver varias acciones de grupo y se trata de determinar representantes canónicos de las órbitas,
para lo que los alumnos han sido adiestrados en diversas asignaturas precdentes a ésta.
Proposición 1.2.29. Sea (G, ·) un grupo y ·G : G×X −→ X una acción a izquierda de G sobre
el conjunto X no vacı́o. La acción es fiel si y solamente si el siguiente es un monomorfismo de
grupos:
H : G −→ S (X)
g 7−→ ηg .
En particular, G se identifica con un subgrupo del grupo simétrico S (X).
Demostración. Ya hemos visto que es morfismo. Justamente, por ser fiel si dos elementos
g1 , g2 ∈ G definen la misma transformación ηg1 y ηg2 , entonces g1 = g2 por la definición de fiel.
El recı́proco es igualmente obvio y mera reescritura comparada de las definiciones.
Proposición 1.2.31 (Estabilizador y cociente). Sea G×X −→ X una acción a izquierda del
grupo (G, ·) sobre el conjunto X no vacı́o. Entonces, para cada x ∈ X se tiene una biyección
entre la órbita OG (x) y el conjunto cociente G/ ∼S , donde S := StabG (x) es el subgrupo
estabilizador del punto x ∈ X 9. En particular, si el estabilizador S es un subgrupo normal,
entonces, las órbitas son biyectables al grupo cociente G/S.
Demostración. Baste con observar la siguiente aplicación suprayectiva:
ω : G −→ OG (x)
g 7−→ gx.
Obviamente, ω(g1 ) = ω(g2 ) si y solamente si g1 x = g2 x, lo cual implica g2−1 g1 x = x o, equiva-
lentemente, g2−1 g1 ∈ S := StabG (x). Por tanto, g1 y g2 definen la misma clase de equivalencia
mediante la relación
g1 ∼S g2 ⇐⇒ g2−1 g1 ∈ S = StabG (x).
Esto nos permite definir la siguiente correspondencia:
Ω : G/ ∼S −→ OG (x)
gS 7−→ gx.
Por construción, Ω es aplicación (i.e. está bien definida), es suprayectiva por definición y, como
hemos visto, debe ser inyectiva.
Z× es el grupo de las unidades del anillo (Z, +, ·) con la operación producto. En ese caso, es
sencillo ver que StabO(2) (e1 ) es un subgrupo normal y que
S1 ∼
= O(2)/O(1),
donde el ∼= no es solamente una biyección sino un isomorfismo de grupos. A las variedades
diferenciables que son cociente (salvo ∼S , no necesariamente como grupos) de dos grupos [de
Lie, topológicos, etc] se las denomina variedades homogéneas. Las esferas S n−1 son variedades
homogéas.
1.2.5. Ejercicios y problemas de la Sección 1.2.
Problema 1. Considérese el conjunto Nn y, sobre él, consideremos la estructura de monoide
definida mediante la suma coordenada a coordenada (Nn , +). Consideremos la aplicación grado
definida sobre Nn del modo siguiente:
| · | : Nn −→ N,
definida para cada µ := (µ1 , . . . , µn ) ∈ Nn , entonces
|µ| := µ1 + · · · + µn ∈ N.
A la aplicación | · | se la denomina grado total del multi-ı́ndice (o exponente monomial) µ. Se
pide:
i) Probad que, efectivamente, (Nn , +) es un monoide.
ii) Hay que probar que el par (2Z, ·), donde 2Z son los enteros pares y · es el producto.
Pruébese que se trata de un semi-grupo que no es monoide.
iii) Probad la siguiente igualdad para cada d ∈ N:
n d+n−1
]{µ ∈ N : |µ| = d} = .
n−1
Problema 2. Pruébese la Proposición 1.2.16 anterior.
Problema 3. Verifica que un morfismo de grupos f : (G, ∗) −→ (H, ⊥) es biyectivo si y
solamente si es isomorfismo, es decir, si y solamente si existe otro morfismo de grupos f 0 :
(H, ⊥) −→ (G, ∗) tal que:
f ◦ f 0 = IdH , f 0 ◦ f = IdG ,
donde ◦ denota composición de aplicaciones e IdG , IdH son, respectivamente, los morfismos
identidad. Concluir que un isomorfismo es un morfismo que es monomorfismo y epimorfismo
en el sentido de la Definición 9.
Problema 4. Sea (K, +, ·) un cuerpo y definamos la clase de las sumas finitas de cuadrados
en K como el conjunto:
X n
X
K := {x ∈ K : ∃n ∈ N, ∃x1 , . . . , xn ∈ K, x = x2i }.
i=1
Pruébense:
P
i) El par (P K , +) es un monoide conmutativo.
ii) El par ( K , ·) es un monoide conmutativo.
Problema 5 (Teorema de Euler sobre la suma de 4 cuadrados). Considera el conjunto
de números enteros que son suma de 4 cuadrados:
X
Z := {x ∈ Z : ∃a1 , a2 , a3 , a4 ∈ Z, x = a21 + a22 + a23 + a24 }.
4
P
Pruébese que ( 4 Z , ·) con el producto de enteros, es un monoide. ( Hint: Busca una prueba
del Teorema de Euler sobre la suma de cuatro cuadrados).
Problema 6. Sea p ∈ N un primo impar. Pruébese que las clases residuales en Z/pZ son todas
distintas:
{a2 + pZ : 0 ≤ a ≤ (p − 1)/2}.
( Hint: Usad el Teorema de Lagrange sobre el número de raı́ces de un polynomio f ∈ Z/pZ[X].)
36 1. PRE-ÁLGEBRA
Problema 12. Se debe probar que todo subgrupo de un grupo abeliano es un subgrupo normal.
Buscar un ejemplo de un grupo donde no se dé esta propiedad (Pista: Intentarlo con S3 y el
subgrupo H = {Id, (1 2)}).
Problema 13. Sea f : G −→ H un morfismo de grupos. Prueba que la imagen inversa de
todo subgrupo normal de H es subgrupo de G. Concluye que, en particular, el núcleo ker(f )
es un subgrupo normal de G. ¿Es también cierto que las imágenes de subgrupos normales son
subgrupos normales?. Razona la respuesta a esta pregunta ( Hint: reflexiona usando el problema
precedente).
Problema 14. Probad que todo grupo finito de cardinal menor o igual a 5 es un grupo abeliano.
¿Es eso cierto también para grupos de cardinal 6?.
Problema 15 (Grupo cociente). Sea (G, ∗) un grupo y G1 un subgrupo normal. Hay que
probar que la siguiente es una relación de equivalencia entre elementos de G:
a ∼G1 b ⇔ ab−1 ∈ G1 .
Consideremos el conjunto cociente de G por esa relación de equivalencia R/ ∼G1 . Probad que
para cada elemento x ∈ G, su clase de equivalencia con respecto a esa relación ∼G1 verifica:
[x]∼G ; = {y ∈ G : y ∼G1 x} = xG1 = G1 x.
1
donde bi es elpconjugado de bi ∈ C. Sea || · ||2 la norma inducida por ese producto hermı́tico
(i.e. ||v||s := hv, vi. Para cada A ∈ Mn×m (C), defı́nase la norma de A como operador lineal
mediante la identidad siguiente:
||Av||2
||A||2 := sup{ : v ∈ Cm , v 6= 0}.
||v||2
Se pide:
i) Pruébese la siguiente identidad:
||A||2 := sup{||Av||2 : v ∈ Cm , ||v||2 = 1}.
ii) Pruébese que la norma de una matriz como operador está bien definida ( Hint: Úsese
que toda función continua sobre un compacto tiene como imagen un compacto y el
hecho de que la esfera unidad compleja S 2m−1 := S 1 (C) := {v ∈ Cm : ||v||2 = 1} es
compacto).
iii) Pruébese que existe siempre v1 ∈ S 2m−1 ⊆ Cm tal que ||Av1 ||2 = ||A||2 . ( Hint: Úsese
el Teorema de Weierstrass y la compacidad de S m−1 ).
iv) Pruébese que si A∗ es la matriz transpuesta conjugada de A, entonces ||A∗ ||2 = ||A||2
( Hint: Tomad v1 el vector de la anterior afirmación. Usando las definiciones y la
desigualdad de Cauchy-Schwartz probar la siguiente cadena de desigualdades:
||A||22 = ||Av1 ||22 = |(v1∗ A∗ )(Av1 )| = |v1t ((A∗ A)v1 ))| ≤
||v1 ||||A∗ Av1 || ≤ ||A∗ ||2 ||Av1 || = ||A∗ ||2 ||A||2 .
v) Pruébese que para cada matriz A ∈ Mn×m (C) existen matrices unitarias U ∈ U (n) y
V ∈ U (n) tales que
∗ ||A||2 0
U AV = ,
0 A1
donde V ∗ es la transpuesta conjugada de V , A1 ∈ M(n−1)×(m−1) (C) y los ceros rep-
resentan, respectivamente matrices fila o columa de tamaño adecuado ( Hint:Úsese la
ortonormalización de Gram-Schmidt).
Problema 27 (Existencia de Descomposición en Valores Singulares (SVD) para
matrices complejas). Con las notaciones de problema precedente, consideremos el conjunto
Mn×m (C) de matrices n × m con coordenadas complejas y los grupos de matrices unitarias
U (n) y U (m). Consideremos el grupo producto G := U (n) × U (m) con la operación descrita
en el Problema 18 precedente. Definamos la siguiente aplicación :
L : G × Mn×m (C) −→ Mn×m (C)
((U, V ), A) 7−→ U AV ∗ ,
donde V ∗ es la transpuesta conjugada de V . Se pide:
i) Probar que es una acción a izquierda.
1.2. SEMIGRUPO, MONOIDE, GRUPO, ACCIONES 41
ii) Usando el Problema precedente, pruébese que para cada A ∈ Mn×m (C) la órbita de A
por la acción de G satisface que existe una matriz diagonal DA ∈ OG (A)de la forma
siguiente:
σ1 0 · · · 0
0 σ2 · · · 0
.. . 0r×(m−r)
DA := . . . . .. ,
0 0 · · · σr
0(n−r)×r 0(n−r)×(m−r)
donde
• Las matrices 0i×j son la matrices nulas de tamaño i × j,
• r = rank(A) es el rango de la matriz A,
• DA ∈ Mn×m (R) (i.e. las cantidades σi están en R) y se tiene
σ1 ≥ σ2 ≥ · · · ≥ σr ≥ 0.
• σ1 = ||A||2 .
iii) Discute la unicidad de los σi ’s en la diagonalización anterior.
A la sucesión σ1 ≥ σ2 ≥ σr se la denomina los valores singulares de la matriz A. y a la
descomposición DA := U AV ∗ se la denomina descomposición en valores singulares, singular
value decomposicition o, simplemente, SVD. Algunos autores, suelen llamar valores signulares
a la sucesión siguiente:
σ1 ≥ · · · σr ≥ σr+1 ≥ · · · ≥ σt ,
donde t := min{m, n} y σi = 0 para r +1 ≤ i ≤ m. Estos autores quieren simplemente enfatizar
el caso r < min{m, n} añadiendo 00 s como valores singulares. Usaremos ambos indistintamente.
Problema 28 (ODE’s y órbitas). Considera la ecuación diferencial con valor inicial sigu-
iente:
ẋ = f (x),
(1.2.3)
x(0) = x0
Donde x := (x1 (t), . . . , xn (t)) son las funciones que buscamos hallar, f : U ⊆ Rn −→ Rn , es una
función de clase C ∞ (U ), definida en un abierto U ⊆ Rn , x0 ∈ Rn y ẋ(t) := (x01 (t), . . . , x0n (t))
es el vertor de las derivadas con respecto a la variable t de las soluciones de la ecuación difer-
encial. Aplicando el Teorema de Existencia y Unicidad de solución (que sirve en nuestro caso),
denotemos por φt (x0 ) := x(t) una solución maximal de (1.2.3), definida para t ∈ Ix0 ⊆ R.
Definamos el conjunto
[
Ω := Ix0 × {x0 } ⊆ R × U.
x0 ∈U
10En General, los autores de EDO’s no se preopuan en exceso de disponer de todo el grupo (R, +), sino que
consideran (Ix0 , +), que no tiene necesariamente una estructura de grupo abeliano, e igualmente llaman ŕbitas
a los conjuntos que acabamos de definir.
42 1. PRE-ÁLGEBRA
11El diccionario de la RAE parece admitir como sinónimos “trasposición” y “transposición”, por lo que los
usaremos indistintamente.
1.3. EL PARADIGMA DE LAS ACCIONES TRANSITIVAS Y FIELES: Sn 43
Corolario 1.3.2. Con las notaciones de la Proposición anterior, dados x, y ∈ X, se tiene que
Oσ (x) ∩ Oσ (y) 6= ∅ ⇐⇒ Oσ (x) = Oσ (y).
En particular, las órbitas definen una relación de equivalencia sobre [n], cuyas clases de equiv-
alencia son precisamente las órbitas. Más aún, para cada x ∈ X y cada órbita Oσ (x) definida
por algún elemento σ ∈ S (X), se tiene que
σ(X \ Oσ (x)) ⊆ (X \ Oσ (x)).
Y la restricción de σ a X \ Oσ (x) es una permutación de X \ Oσ (x), i.e. σ |X\Oσ (x) ∈ S (X \
Oσ (x)).
Demostración. No es sino la traducción al caso de permutaciones de la Proposición 1.2.25
anterior. El resto de afirmaciones son obvias.
44 1. PRE-ÁLGEBRA
Observación 1.3.3 (Subconjuntos de [n] con un orden). Las órbitas definidas por una
permutación σ ∈ S (X) sobre un punto son subconjuntos de X con una relación de orden
inducida por la propia permutacón. Consideremos ası́ subconjuntos de un conjunto finito X
con un orden implı́cito. Para denotarlos consideraremos subconjuntos S ⊆]n] descritos mediante
la expresión:
S = {x1 < x2 < . . . < xs }.
Al conjunto ordenado O se le denomina órbita distinguido del ciclo τ . A los 2−ciclos se les
denomina transposiciones.
Notación 1.3.4 (Notación usual para los ciclos). Un ciclo σ : [n] −→ [n] lleva intrı́n-
secamente implı́cito una ordenación sobre los elementos de la órbita de un punto x. La órbita
fue definida como conjunto, pero el ciclo impone una ordenación. Por ello, se suele utilizar
la notación vectorial (x1 x2 · · · xk ) para describir un ciclo como en la definición precedente..
Ası́, por ejemplo, tomando I5 := {1, 2, 3, 4, 5}, el ciclo de orden 3 descrito mediante (4 3 1),
representa la permutación
1 2 3 4 5
.
4 2 1 3 5
Obsérvese que la identidad es el único ciclo de orden 1.
Observación 1.3.5 (Ciclos con órbitas distinguidas disjuntas conmutan entre sı́).
Supongamos dados dos ciclos τ1 y τ2 con órbitas distinguidas O1 y O2 respectivamente. Supong-
amos que O1 ∩ O2 = ∅. Entonces,
τ1 ◦ τ2 = τ2 ◦ τ1 .
Es una propiedad de sencilla verificación a partir de la definición de ciclo.
Proposición 1.3.6 (Órbitas y Ciclos). Sea X un conjunto finito y sea S (X) el grupo de las
permutaciones sobre X. Se tiene:
i) Dada una permutación σ ∈ S (X), y dado x ∈ X, sea O := Oσ (x) la órbita que
determinan σ y x, con el orden inducido por la permutación σ. Supongamos que la
órbita O es de cardinal p. Entonces, existe un único p−ciclo τO ∈ S (X) tal que:
τO O = σ, τO X\O = IdX\O .
i) Para la primera afirmación, si p ∈ N es el mı́nimo entero tal que σ p ∈ StabS (X) (x)
basta con observar que la órbita toma la forma:
Oσ (x) := {x1 := x := σ 0 (x), x2 = σ 1 (x1 ), . . . , xp = σ p−1 (x1 ) = σ(xp−1 )},
y, además, σ(xp ) = x1 . Como se ha observado anteriormente, el conjunto O := Oσ (x)
tiene un orden natural inducido por σ:
O := Oσ (x) := {x1 < x2 < . . . < xp }.
Definamos, con estas notaciones, τO como el ciclo siguiente:
τO := (x1 x2 x3 · · · xp ).
Claramente, tenemos las propiedades indicadas, dado que
• τO (xi ) = xi+1 = σ(xi ), para cada i, 1 ≤ i ≤ p − 1,
• τO (y) = y para todo y ∈ X \ O,
• τO (xp ) = x1 = x = σ(xp )).
Es claro también que τO es único dado que σ y x1 = x lo definen completamente.
ii) Para la segunda afirmación, basta con reproducir la definición de ciclo. Si σ ∈ S (X)
es un ciclo de orden p es porque existe x ∈ X tal que la órbita O := Oσ (x) tiene
cardinal p y verifica:
Oσ (x) = {x1 := x = σ 0 (x), σ 1 (x), . . . , σ t−1 (x)},
y σ p (x) = x. Adicionalmente, σ |X\O = Id. Por tanto τO satisface las propiedades
descritas en ii).
Observación 1.3.7. La anterior Proposición nos indica que existe una biyección entre las
órbitas (ordenadas y definidas por una permutación) y los ciclos que, además, transforma
cardinal de las órbitas en orden de ciclo.
Proposición 1.3.8. Dados X e Y dos conjuntos finitos del mismo cardinal, entonces, los re-
spectivos grupos de permutaciones (S (X), ◦) y (S (Y ), ◦) son isomorfos como grupos. Más aún,
el isomorfismo respeta ciclos, órbitas, órdenes de ciclos y longitud de las órbitas. Recı́procamente,
si estos grupos de permutaciones son isomorfos, entonces X e Y son biyectables y, por tanto,
tienen el mismo cardinal.
Demostración. Supongamos que existe f : X −→ Y una biyección entre los conjuntos
X e Y (o, lo que es lo mismo, que tienen el mismo cardinal). Entonces, podemos definir una
transformación:
f ∗ : S (X) −→ S (Y )
σ 7−→ f ◦ σ ◦ f −1 ,
donde f −1 : Y −→ X es la inversa de f (que existe por ser f biyección) y f ◦ σ ◦ f −1 : Y −→ Y
es la composición de estas tres aplicaciones, es decir,
f ◦ σ ◦ f −1 (y) = f (σ(f −1 (y))), ∀y ∈ Y.
Es claro que f ∗ es una biyección cuya inversa es la aplicación:
f∗ : S (Y ) −→ S (X)
τ 7−→ f −1 ◦ τ ◦ f.
Es decir, se verifica:
f ∗ ◦ f∗ = IdS (X) , f∗ ◦ f ∗ = IdS (Y ) .
Es claro también (mera verificación) que tanto f ∗ como f∗ son morfismos de grupo, con lo que
queda probado que S (X) y S (Y ) son isomorfos. En cuanto al hecho de que se preserven los
ciclos y las órbitas, simplemente se trata de verificar que si σ ∈ S (X) es un ciclo de orden k,
entonces f ∗ (σ) es un ciclo del mismo orden. Y lo mismo sucede para τ ∈ S (Y ) y f∗ (τ ). En
cuanto a las órbitas, se tiene la identidad siguiente:
f (Oσ (x)) = Of ∗ (σ) (f (x)),
46 1. PRE-ÁLGEBRA
para cada x ∈ X y para cada σ ∈ S (X). Basta con escribir las identidades respectivas y
comprobar. Lo mismo se puede hacer con las órbitas de todo elemento y ∈ Y y toda permutación
τ ∈ S (Y ). Para la última afirmación del enunciado. Recuérdese, antes de nada, que decir “
X es un conjunto finito de cardinal n ∈ N” es lo mismo que decir que existe una biyección
entre X e [n] para algún n ∈ N”. Por tanto, S (X) será isomorfo al grupo Sn de orden n!.
En particular, si dos grupos S (X) y S (Y ) son isomorfos, ambos tendrán el mismo cardinal
(por ser biyectivos) y dicho cardinal coincidirá con algún n!. Pero, entonces, necesariamente, los
cardinales de X y de Y han de ser iguales a n ∈ N y esto significa que X e Y son biyectables.
Teorema 1.3.9. Toda permutación sobre un conjunto finito es composición de un número finito
de ciclos con óribtas disntiguidad dos a dos disjuntas y de orden mayor o igual que 2. Es decir,
dada σ ∈ Sn una permutación, existe una presentación de σ como producto finito:
(1.3.2) σ = τO1 ◦ · · · ◦ τOr ,
de tal modo que:
i) Para cada i, 1 ≤ i ≤ r, ](Oi ) ≥ 2 (luego τOi es un ciclo de orden mayor o igual que
dos).
ii) Dados i, j ∈ [r] tales que i 6= j, entonces Oi ∩ Oj = ∅.
Más aún, la descomposición descrita en (1.3.2), con las condiciones i) y ii) es única, salvo
permutación de los ciclos que aparecen en ella.
Demostración. Supongamos X nuestro conjunto finito y sea σ ∈ S (X) una permutación
sobre un conjunto finito X. Por lo descrito en el apartado iii) de la Proposición 1.2.25, las
órbitas de σ sobre elementos de X definen una relación de equivalencia sobre X. En particular,
como X es finito, existe una partición de X de la forma siguiente:
X = O1 ∪˙ · · · ∪O
˙ s,
donde la unión es disjunta y cada Oi := Oσ (xi ) es la órbita de algún elemento xi ∈ X. Además,
conforme a la Proposición 1.3.1 esas órbitas tienen inducida una ordenación natural a partir de
σ. Esto nos permite considerar los conjuntos Oi ordenados mediante:
Oi = {xi < σ(xi ) < · · · < σ pi −1 (xi )}.
Aplicando la Proposición 1.3.6, podemos considerar los ciclos τOi allı́ descritos y que verifican:
• La permutación σ satisface:
σ Oi = τOi Oi ,
• El ciclo es la identidad fuera de su órbita:
τOi X\O = IdX .
i X\Oi
Como todos los elementos de X deben estar en alguna órbita, se tiene la Igualdad (1.3.3).
Seguidamente, podemos suponer, salvo ordenación de los ı́ndices, que existe r ≤ s tal que:
i) ](Oi ) ≥ 2, para cada i ∈ {1, . . . , r},
ii) ](Oj ) = 1, para cada j tal que r + 1 ≤ j ≤ s.
Consideremos el conjunto
A = O1 ∪˙ · · · ∪O
˙ r ⊆ X.
que es una unión disjunta de las órbitas de σ de cardinal mayor o igual que 2. Observemos que
para i ∈ {1, . . . , r}, se tiene:
(1.3.4) σ
X\A
= IdX
X\A
= τO
i X\A
= τO ◦ · · · τO
1 r
.
X\A
La razón tiene que ver con el cardinal de las órbitas de los elementos x 6∈ A. Si un elemento
x 6∈ A, entonces su órbita Oσ (x) debe ser una de las órbitas Or+1 , . . . , Os , que son órbitas
de cardinal 1. Entonces ](Oσ (x)) = 1 o, equivalentemente, Oσ (x) = {x}, lo que significa que
σ(x) = x.
De otro lado, para j ∈ {r + 1, . . . , s}, se tiene que
τOj A = IdX ,
A
porque A ∩ Oj = ∅ para j ∈ {r + 1, . . . , s}. Por tanto, concluimos que:
(1.3.5) σ A = τO1 ◦ · · · ◦ τOs A = τO1 ◦ · · · ◦ τOr A .
Juntando las igualdades (1.3.4) y (1.3.5), concluimos que
σ = τO1 ◦ · · · ◦ τOr .
Y tenemos probada la primera afirmación del enunciado relativa la existencia de tal descom-
posición.
Observación 1.3.10 (La representación por ciclos, aunque con cierta unicidad, no es
suficiente para expresar las permutaciones). A pesar de la unicidad mostrada en el antrior
resultado, no es satisfactorio para poder decir que disponemos de una buena representación
del grupo de las permutaciones Sn mediante las órbitas que definen. La dificultad de esta
representación de las permutaciones es que si bien hay n! permutaciones y hay menos ciclos que
permutaciones, el número de ciclos sigue siendo una cantidad esponencial en n y no resulta un
gran salto cualitativos representar permutaciones mediante un alfabeto de cardinal exponencial
en n. De ahı́ que se busque en un conjunto de menor cardinal para representar las permutaciones
y por eso se restringe la búsqueda a las transposiciones que exhibimos a continuación.
Observación 1.3.13. Dado el conjunto finito Σ := {(i, j) : i < j}. Es fácil verificar que Σ es
un conjunto cuyo cardinal satisface:
n−1
X n(n − 1)
](Σ) = r= .
r=1
2
El anterior resultado simplemente significa que tenemos un morfismo suprayectivo de monoides:
ϕ : (Σ∗ , ·) −→ (Sn , ·).
donde a cada par (i, j) se le asigna la transposición ϕ((i, j)) := (i j). Hemos reducido el número
de elementos de Sn con los que “representar” las permutaciones, pero, a cambio, hemos perdido
la unicidad que suponı́a disponer de la presentación mediante ciclos asociados a las órbitas.
Obviamente, se tiene que la identidad puede representarse de varias formas mediante producto
de transposiciones (si n ≥ 3):
Id = (1 2)(1 2) = (1 3)(1 3) = (2 3)(2 3).
[n]
Demostración. Razonaremos por inducción en r (la menos elegante de las formas de de-
mostración). Es claro que si r = 1, no puede existir una descomposición del tipo que se exhibe
en la Identidad (1.3.6). Pues si tal descomposición existiera, tendrı́amos Id[n] = σ1 , donde σ1
es una transposición de orden 2. Por tanto, tiene que haber un i ∈ {1, . . . , n} tal que σ1 (i) 6= i
(i.e. σ1 = (i j) con j 6= i). Pero esto es imposible si Id[n] = σ1 . El caso r = 2 siendo obvio,
analicemos el caso de cualquier r.
Supongamos, por hipótesis inductiva, que el enunciado es cierto para cualquier r < t y consid-
eremos una descomposición:
[n] := σ1 · · · σt ,
donde cada σi es una transposición de orden 2. Consideremos la última de las transposiciones σt
y debe existir un ı́ndice i ∈ {1, . . . , n} tal que σt (i) 6= i (es decir, suponemos que σt = (i j) para
algún j 6= i). Consideremos el subconjunto S(i) ⊆ {1, . . . , r} dado por los número naturales
m ∈ {1, . . . , t} tales que se verifican la siguiente propiedad:
Existen transposiciones ρm , ρm+1 , . . . , ρt tales que:
• Id[n] = σ1 σ2 · · · σm−1 ρm · · · ρt .
• Para cada ` con m + 1 ≤ ` ≤ t, ρ` (i) = i.
• ρm (i) 6= i.
Nótese que S(i) 6= ∅ porque t ∈ S(i):
simplemente obsérvese la descomposición Id[n] := σ1 · · · σt de la que hemos partido.
Ahora consideremos s = min S(i), el menor de esos elementos en S(i). Observamos que,
necesariamente, s ≥ 2. Porque si s = 1, entonces 1 ∈ S(i) y tendrı́amos una descomposición de
la identidad
Id = ρ1 ρ2 · · · ρt ,
[n]
donde ρ` (i) = i para ` ≥ 2, mientras que ρ1 (i) 6= i. Entonces, tendrı́amos la siguiente con-
tradicción:
i = Id[n] (i) = ρ1 ◦ ρ2 ◦ · · · ◦ ρt (i) = ρ1 (i) 6= i.
Dado que s ≥ 2, tenemos una presentación de Id[n] de la forma siguiente:
Id
[n]
= σ1 σ2 · · · σs−1 ρs · · · ρt .
Supongamos que ρs = (i j), con inot = j y consideremos las distintas posibilidades para el
producto σs−1 ρs :
• Supongamos σs−1 = (i k). En ese caso observamos que:
σs−1 ρs = (i k)(i j) = (i j)(j k),
con lo que tenemos la descomposición:
Id
[n]
= σ1 σ2 · · · σs−2 ρs (j k)ρs+1 · · · ρt .
I : Sn −→ Z× = {±1}
σ 7−→ (−1)m ,
donde σ admite una descomposición σ := ρ1 · · · ρm , donde ρ` son transposiciones de orden 2.
Nótese que la dificultad con esta correspondencia I consiste en probar que es una aplicación.
Es decir,
Teorema 1.3.15 (El ı́ndice es un morfismo de grupos). La correspondencia I es un
morfismo de grupos.
Demostración. Comencemos probando que I está bien definida. Esto es, comencemos
probando que, dado σ ∈ Sn , entonces dadas dos descomposiciones de σ como producto de
transposiciones
σ = ρ1 · · · ρm = τ1 · · · τs ,
entonces m = s mod 2. La razón es el Teorema 1.3.14 precedente. Estas dos descomposiciones
inducen una descomposición de la identidad en producto de m + s transposiciones (recuŕdese
que la inversa de una transposición es una transposición):
Id
[n]
= ρ1 · · · ρm τ1−1 · · · τs−1 ,
con lo que m + s ∈ 2N y m = s mod 2. En conclusión, (−1)m = (−1)s y, por tanto, I está
bien definida.
Es casi inmediato probar que, entonces, es morfismo de grupos dado que se comporta como la
adjunaicón de palabras, es decir, si tenemos
σ = ρ1 · · · ρm , τ = τ1 · · · τs ,
entonces,
I(στ ) = I(ρ1 · · · ρm τ1 · · · τs ) = (−1)m+s = I(σ)I(τ ).
En cuanto a la identidad, el Teorema precedente indica que I(Id[n] ) = 1.
donde
A+ (σ) := {(i, j) ∈ A : σ(i) < σ(j)}, A− (σ) := {(i, j) ∈ A : σ(i) > σ(j)}.
Los elementos de A− (σ) se llaman inversiones de la permutación σ. Denotaremos por
N+ (σ) := ](A+ (σ)), N− (σ) := ](A− (σ)),
y al número N− (σ) se le llama el número de inversiones de la permutación σ.
Observación 1.3.16. Las siguientes propiedades son obvias de verificar:
i) Si Id[n] ∈ Sn es la identidad, N− (Id[n] ) = 0.
ii) Para cualquier transposición σ ∈ Sn , se tiene N− (σ) = 1.
Definición 19 (Índice de una Permutación (alternativo)). Con las anteriores nota-
ciones, se llama ı́ndice de una permutación σ ∈ Sn al elemento del grupo multiplicativo
Z× := {+1, −1}, dado mediante:
N− (σ)
ι(σ) := (−1) ∈ Z× .
Teorema 1.3.17. El ı́ndice ι define un morfismo de grupos:
ι: (Sn , ◦) −→ (Z× , ·)
N (σ)
σ 7−→ ι(σ) := (−1) − ,
donde la operación · sobre Z× es la multiplicación. En otras palabras, se verifican las dos
propiedades siguientes:
i) ι(Id[n] ) = 1 ∈ Z× ,
ii) Para todo par de permutaciones σ, τ ∈ Sn , se tiene:
ι(σ ◦ τ ) = ι(σ) · ι(τ ).
Demostración. Nótese que se trata de probar simplemente que para todo par de per-
mutaciones σ, τ ∈ Sn , se tiene:
ι(σ ◦ τ ) = ι(σ) · ι(τ ).
Obsérvese, además, que esta propiedad es equivalente a probar que
N− (σ ◦ τ ) = N− (σ) + N− (τ ), mod 2.
Para ello, comencemos definiendo los conjuntos siguientes para una permutación σ fijada:
τ + (A+ (τ )) = {(τ (i), τ (j)) : (i, j) ∈ A+ (τ )},
τ − (A− (τ )) = {(τ (j), τ (i)) : (i, j) ∈ A− (τ )}.
Comencemos observando que
[
A = τ + (A+ (τ )) τ − (A− (τ )),
siendo ésta una unión disjunta. La razón es obvia, dado (i, j) ∈ A, han de existir i1 , j1 ∈ [n]
tales que i = τ (i1 ), j = τ (j1 ). Ahora se tiene:
• Si i1 < j1 , como (i, j) ∈ A (i.e. i < j), entonces (i1 , j1 ) ∈ A+ (τ ) y, por tanto,
(i, j) = (τ (i1 , τ (j1 )) ∈ τ + (A+ (τ )).
• Si i1 > j1 , como (i, j) ∈ A (i.e. i < j), entonces (j1 , i1 ) ∈ A− (τ ) y, por tanto,
(i, j) = (τ (j1 ), τ (i1 )) ∈ τ − (A− (τ )).
De otro lado, como τ es una biyección, es fácil concluir que los cardinales verifican:
N+ (τ ) = ](τ + (A+ (τ ))), N− (τ ) = ](τ − (A− (τ ))).
Ahora, consideremos los siguientes cuatro conjuntos disjuntos dos a dos y sus cardinales:
• El conjunto A++ (σ, τ ), de cardinal N++ (σ, τ ) = ](A++ (σ, τ )), dado mediante:
A++ (σ, τ ) := {(i, j) ∈ A+ (σ) : (i, j) ∈ τ + (A+ (τ ))}.
• El conjunto A+− (σ, τ ), de cardinal N+− (σ, τ ) = ](A+− (σ, τ )), dado mediante:
A+− (σ, τ ) := {(i, j) ∈ A+ (σ) : (i, j) ∈ τ − (A− (τ ))}.
• El conjunto A−+ (σ, τ ), de cardinal N−+ (σ, τ ) = ](A−+ (σ, τ )), dado mediante:
A−+ (σ, τ ) := {(i, j) ∈ A− (σ) : (i, j) ∈ τ + (A+ (τ ))}.
52 1. PRE-ÁLGEBRA
• El conjunto A−− (σ, τ ), de cardinal N−− (σ, τ ) = ](A−− (σ, τ )), dado mediante:
A−− (σ, τ ) := {(i, j) ∈ A− (σ) : (i, j) ∈ τ − (A− (τ ))}.
Las siguientes propiedades son de mera comprobación:
[
A+ (σ ◦ τ ) = A++ (σ, τ ) A−− (σ, τ ),
[
A− (σ ◦ τ ) = A+− (σ, τ ) A−+ (σ, τ ),
[
A+ (σ) = A++ (σ, τ ) A+− (σ, τ ),
A− (σ) ∼
[
= A−+ (σ, τ ) A−− (σ, τ ),
τ + (A+ (τ )) ∼
[
= A++ (σ, τ ) A−+ (σ, τ ),
τ − (A− (τ )) ∼
[
= A+− (σ, τ ) A−− (σ, τ ),
donde ∼= significa biyectables. Obsérvese, como pista esencial, que
A− (σ) = {(i, j) ∈ τ + (A+ (τ )) : σ(i) > σ(j)} ∪ {(i, j) ∈ τ − (A− (τ )) : σ(i) > σ(j)}.
Y que esta identidad induce la biyección señalada porque se tienen biyecciones siguientes:
ϕ : A−+ (σ, τ ) −→ {(i, j) ∈ τ + (A+ (τ )) : σ(i) > σ(j)}
(i1 , j1 ) 7−→ (τ (i1 ), τ (j1 )).
ψ: A−− (σ, τ ) −→ {(j, i) ∈ τ − (A− (τ )) : σ(i) > σj }
(i1 , j1 ) 7−→ (τ (j1 ), τ (i1 )).
Con estas identidades conjuntistas de fácil verificación, obtenemos (entre otras) las siguientes
relaciones entre los cardinales:
N− (σ) = N−+ (σ, τ ) + N−− (σ, τ ),
N− (τ ) = ](τ − (A− (τ )) = N+− (σ, τ ) + N−− (σ, τ ),
N− (σ ◦ τ ) = N+− (σ, τ ) + N−+ (σ, τ )
Sumando las dos primeras identidades obtenemos
N− (σ)+N− (τ ) = N−+ (σ, τ )+N−− (σ, τ )+N+− (σ, τ )+N−− (σ, τ ) = N−+ (σ, τ )+N−− (σ, τ )+2(N−− (σ, τ )).
Por tanto, tenemos
N− (σ) + N− (τ ) = N− (σ ◦ τ ) + 2(N−− (σ, τ )),
y esto último implica:
N− (σ◦τ ) N− (σ)+N− (τ )
ι(σ ◦ τ ) = (−1) = (−1) = ι(σ) · ι(τ ),
que es la identidad buscada.
Corolario 1.3.18. Sea σ ∈ Sn una permutación se tiene la siguiente igualdad entre las dos
nociones de ı́ndice antes definidas:
ι(σ) = I(σ).
Demostración. Es evidente, por ser ambas un morfismo de grupos y porque para cada
transposición τ , se tiene ι(τ ) = I(τ ) = −1. Es decir, dada una descomposición de σ mediante
transposiciones:
σ = τ1 · · · τm ,
tendremos que, por ser ι un morfismo de grupos se tendrá:
m
Y
ι(σ) = ι(τi ) = (−1)m = I(σ),
i=1
donde I(σ) es el ı́ndice definido en la sección precedente.
Corolario 1.3.19. Sea X un conjunto finito cualquiera, entonces dadas dos representaciones
de una permutación σ ∈ S (X) como composición de transposiciones en X:
σ = τ1 ◦ τ2 ◦ · · · ◦ τr = ρ1 ◦ ρ2 ◦ · · · ◦ ρm ,
se tiene que r = m mod 2.
1.3. EL PARADIGMA DE LAS ACCIONES TRANSITIVAS Y FIELES: Sn 53
Observación 1.3.20. Obsérvese que el ı́ndice ası́ definido tambiéon define un morfismo de
grupos:
I : (S (X), ◦) −→ (Z× , ·)
σ 7−→ I(σ).
• Casi-anillo: Es una terna (R, +, ·) en las que (R, +) es un grupo (no necesariamente
conmutativo), (R, ·) es un semi-grupo y se da la distributiva, pero solamente en una de
las direcciones. Por ejemplo, si (G, ∗) es un grupo definamos M (G) como el conjunto
de todas las aplicaciones de G en sı́ mismo. Sobre el conjunto M (G) podemos definir
la operación f ∗ g, entre dos elementos f, g ∈ M (G) de la manera obvia. Añadamos la
composición de aplicaciones ◦ y tendremos que (M (G), ∗, ◦) es un casi-anillo. Es una
noción que no carece de interés, pero es poco común su estudio.
• Pseudo-anillo (Anillo “sin unidad”): Es una terna (R, +, ·) en las que se da la
propiedad distributiva, (R, +) es un grupo abeliano y (R, ·) es un semi-grupo, pero
no necesariamente tiene unidad. Este caso es poco habitual. Un ejemplo podı́a ser
cualquier ideal propio, como los números enteros pares (2Z, +, ·). Pero no es una
noción demasiado interesante ni es comúnmente aceptado.
• Anillo : Es una terna (R, +, ·) en las que se da la propiedad distributiva, (R, +) es
un grupo abeliano y (R, ·) es un monoide. Este uso es el más habitual. Un ejemplo
podı́a ser el conjunto de los endomorfismos sobre un espacio vectorial o las matrices
cuadradas (Mn (K), +, ·). Es el más aceptado, salvo que se trate de un curso de
“Álgebra Conmutativa”, como es nuestro caso.
• Anillo Conmutativo (o, simplemente, anillo): que es el uso que daremos habitualmente
en este curso, aunque puedan aparecer anillos que no sean conmutativos con unidad,
en cuyo caso advertiremos al lector.
La definición de anillo (conmutativo con unidad) tiene sus precursores en D. Hilbert y A.
Fraenkel, pero es E. Noether, junto con E. Artin, quien estabiliza la noción actualmente acep-
tada en su trabajo [Noether, 1921]. Será la escuela de E. Noether, su seminario conjunto con
E. Artin y, especialmente, la obra de su colega W. Krull (cf. [Krull, 1929], [Krull, 1935]) o las
notas del seminario, recogidas y publicadas por su alumno B.-L. van der Waerden ([vdW, 1930,
vdW, 1931]), las que más influirán en la concepción del Álgebra Conmutativa moderna. Ob-
viamente, el conocimiento de estos aspectos ha evolucionado mucho en los últimos ochenta
años, ganando relevancia en Geometrı́a Algebraica y, en general, en Geometrı́a a partir de la
fundamentación de la Geometrı́a propuesta por A. Grothendieck en sus EGA’s y SGA’s. Un
cambio significativo del Álgebra Conmutativa se produce a mediados de los años 50 con la
intervención como herramiento del “ Álgebra Homológica” (introducida por Cartan y Elien-
berg en [CaEi, 1956]) y una serie de preguntas de J.P. Serre y el propio E. Artin, que
conducián a resultados tan significativos como el Teorema de Serre-Auslander-Buchsbaum
([AuBu, 1957, AuBu, 1959], [Ser, 1955]) o el Teorema de Quillen-Suslin (con direcciones
opuestas en cuanto al uso del Álgebra Homológica, [Qui, 1976], [Sus, 1976]). Pero ambos
aspectos no surgirán sino muy avanzado el curso y este curso es, por desgracia, una pre-
introducción al conocimiento de la “Teorı́a de Anillos”.
Ejemplo 1.4.3. Los ejemplos más elementales de anillos son obviamente los cuerpos, como
Q, R, C, o anillos que no son cuerpos como Z. Veremos, sin embargo, que hay muchos más
ejemplos. También son ejemplos de anillos los anillos de polinomios en una variable con coefi-
cientes en los anteriores anillos.
Para una definición formal de los anillos de polinomios, sea (R, +, ·) un anillo (conmutativo con
unidad) y consideremos los siguientes dos conjuntos de sucesiones de elementos de R:
(1.4.1) R[[X]] := RN := {(an )n∈N ∈ RN : an ∈ R, ∀n ∈ N}.
Definimos el subconjunto siguiente:
(1.4.2) R[X] := {(an )n∈N ∈ RN : ∃I ⊆ N, finito, an = 0, ∀n ∈ N \ I}.
Ahora definimos dos operaciones sobre estos dos conjuntos
+: R[[X]] × R[[X]] −→ R[[X]], ∗: R[[X]] × R[[X]] −→ R[[X]]
(an )n∈N , (bn )n∈N 7−→ (an + bn )n∈N . (an )n∈N , (bn )n∈N 7−→ (cn )n∈N ,
donde
X
(1.4.3) ck := ai bj , ∀k ∈ N.
i+j=k
aunque todas estas notaciones representan el mismo objeto, siempre que se tenga en cuanta la
operación ∗ que inspira a la convolución de funciones. Se suele usar la terminologı́a coeficiente
n−ésimo para referirse al elemento n−ésimo an de la sucesión. Una primera noción importante
para una serie de potencias formales σ ∈ R[[X]] es su soporte, que se define del modo siguiente:
supp(σ) := {n ∈ N : an 6= 0}.
Es un sencillo ejercicio de verificación el comprobar las siguientes propiedades del soporte para
σ, τ ∈ R[[X]]:
supp(σ + τ ) ⊆ supp(σ) ∪ supp(τ ),
supp(σ ∗ τ ) ⊆ supp(σ) · supp(τ ) = {ij : i ∈ supp(σ), j ∈ supp(τ )}.
En particular, si dos series σ, τ ∈ R[[X]] tienen soporte finito también lo tienen σ + τ y σ ∗ τ .
Esto facilita la introducción de la siguiente noción:
Las series en R[[X]] de soporte finito se llaman polinomios univariados. Denotamos por R[X]
el conjunto de todos esos polinomios univariados:
N
Rfin := {σ ∈ R[[X]] : supp(σ) es un conjunto finito}.
N
Por el comportamiento del soporte antes descrito, Rfin es cerrado para ambas operaciones:
+: N
Rfin × Rfin
N
−→ N
Rfin , ∗: N
Rfin × Rfin
N
−→ N
Rfin
(an )n∈N , (bn )n∈N 7−→ (an + bn )n∈N . (an )n∈N , (bn )n∈N 7−→ (cn )n∈N ,
donde los elementos ck están igualmente definidos mediante la convolución definida en la
Ecuación (1.4.3) anterior. De nuevo, la terna (Rfin N
, +, ∗) define un anillo conmutativo con
unidad, conocido como el anillo de polinomios univariados con coeficientes en R y que deno-
taremos simplemente mediante R[X]. En particular, R[X] es un subanillo de R[[X]]. Debemos
insistir en la idea de la relevancia de la operación convolución ∗ involucrada porque, en otro
caso, no estarı́amos hablando de anillo de polinomios sino de sucesiones nulas salvo un conjunto
finito (que suelen ser vistas como otra estructura usualmente). Usualmente, se usa el sı́mmbolo
más modesto · para representar la operación ∗, esperando que el lector sea capaz de recordar
1.4. ANILLOS, IDEALES, MORFISMOS DE ANILLOS 57
A[[X]] a ese anillo de series de potencias formales con coeficientes en A y sus elementos se
representan también mediante la forma:
∞
X
f ∈ A[[X]] =⇒ f = ak X k , ak = f (k),
k=0
k
y los “monomios” X se definen igualmente al caso de anillos conmutativos. De nuevo, podemos
considerar el conjunto de las sucesiones de elementos de A con soporte finito:
AN
fin := {f ∈ A
N
: supp(A) es finito}.
12Es recomendable que el lector acompase esta noción de “orden de una serie” con la noción de orden en
un cero de una función holomorfa, usada en los cursos estándar de Variable Compleja.
58 1. PRE-ÁLGEBRA
Idénticamente se prueba que el conjunto AN 0 es estable para las operaciones “suma” y “con-
volución” y se tiene un anillo (no necesariamente conmutativo) con unidad (AN fin , +, ∗). A este
anillo se le denota mediante A[X] y se le denomina anillo de polinomios con coeficientes en A.
Obviamente, los lementos f ∈ A[X] admiten una presentación en la forma:
d
X
f := ai X i ,
i=0
Ejemplo 1.4.5 (Enteros de Gauss). Un sencillo ejemplo de anillo es el anillo de los enteros
de Gauss Z[i], formado por los números complejos de la forma:
Z[i] := {a + bi : a, b ∈ Z},
donde i2 = −1.
Definición 23 (Ideales, morfismos, unidades). Dado un anillo (R, +, ·), llamaremos:
i) Ideal: a todo subgrupo (a, +) de (R, +) tal que se verifica:
∀a ∈ R, ∀b ∈ a, a · b ∈ a.
El ideal R se denominan ideal impropio de R. Los demás, incluyendo el ideal (0), se
denominan propios.
ii) Morfismo de anillos: Dados dos anillos (R, +, ·) y (T, +, ·), llamamos morfismo
entre los anillos R y T a todo morfismo de grupos f : (R, +) −→ (T, +) tal que
f : (R, ·) −→ (T, ·) es un morfismo de monoides, es decir, si verifica, además, las
propiedades:
• f (1R ) = 1T ,
• ∀a, b ∈ R, f (a · b) = f (a) · f (b).
iii) R−álgebra: Dado un morfismo de anillos f : R −→ T , decimos que T es una
R−álgebra. Esto incluye el caso de subanillos (i.e. R ⊆ T , cuando f es simplemente
la inclusión).
iv) Unidades en el anillo: A todos los elemenos a ∈ R tales que existe a0 ∈ R, con
aa0 = a0 a = 1R . Denotamos por R× al conjunto de las unidades del anillo R y forma
un grupo abeliano con la operación producto (R× , ·) llamado grupo de las unidades
del anillo R.
v) Cuerpo:Un anillo R se denomina cuerpo si R× = R \ {0}.
v) Un anillo es cuerpo si y solamente si los únicos ideales son (0) y el ideal impropio.
En particular, si K es un cuerpo y R es una K−álgebra, (i.e. existe f : K −→ R un
morfismo de anillos), entonces f es inyectivo (monomorfismo) y K se puede identificar
isomórfimcamente con un subcuerpo de R (i.e. un subanillo de R que, además, es
cuerpo con las operaciones inducidas por las de R).
Demostración. La mayorı́a de estas propiedades son evidentes y no necesitan de mayor
discusión.
Ejemplo 1.4.10. Consideremos (X, T ) un espacio topológico y consideremos C 0 (X) (en oca-
siones se escribe también C (X) y usaremos ambas notaciones indistintamente) el anillo formado
por las funciones continuas f :−→ R. Es decir,
C 0 (X) := {f : X −→ R : f es aplicación continua}.
Podemos dotar a C 0 (X) con dos operaciones de suma y producto mediante la suma y producto
de funciones continuas. Esto es, dadas f, g ∈ C 0 (X), definimos
f +g : X −→ R f ·g : X −→ R
x 7−→ f (x) + g(x), x 7−→ f (x) · g(x),
donde + y · son la suma y producto usuales en R. Es fácil ver que (C 0 (X), +, ·) es un anillo.
Consideremos ahora F ⊆ X un subconjunto cualquiera. Entonces podemos definir el conjunto
de las funciones continuas que se anulan en F :
I(X) := IC 0 (X) (F ) := {f ∈ C 0 (X) : f (x) = 0, ∀x ∈ F } = {f ∈ C 0 (X) : f F = 0}.
Observamos que I(F ) es un ideal en C 0 (X) y no es subanillo salvo que 1 ∈ I(F ), en cuyo caso
F = ∅.
En particular, la caracterı́stica de un cuerpo quedará definida por el tipo de Álgebra que es con
respecto a los cuerpo primos {Fp : p ∈ N, p 6= 0 primo} ∪ {Q}.
Ejemplo 1.4.13. Con las notaciones anteriores, R[X] es un subanillo de R[[X]] y existe un
monomorfismo de anillos entre R y R[X] que permite identificar R con un subanillo de R[X].
De hecho, tanto R[X] como R[[X]] son R−álgebras, lo cual es particularmente significativo en
Análisis Matemático cuando R = R o R = C.
Teorema 1.4.15 (División Euclı́dea en R[X] por un polinomio mónico). Sea R un anillo
y g ∈ R[X] un polinomio mónico (i.e. un polinomio cuyo coeficiente director es una unidad en
R× o, equivalentemente, g es de la forma:
g = uX d + ad−1 X d−1 + · · · + a1 X + a0 ,
con ai ∈ R y u ∈ R× ).
Entonces, existe división por g en R[X], es decir, para todo f ∈ R[X] existen q, r ∈ R[X] tales
que se verifican las dos propiedades siguientes:
i) f = qg + r,
ii) deg(r) ≤ deg(g) − 1.
Además, q y r son únicos con esa propiedad. Al elemento q lo llamamos el cociente de la
división (euclı́dea) de f por g y lo representamos mediante q := quo(f, g) y al elemento r lo
llamamos el resto de la división (euclı́dea) de f por g y lo representamos mediante rem(f, g).
Demostración. Probemos, en primer lugar, la existencia de q y r. Para ello, consideremos
el conjunto
I := {f − qg : q ∈ R[X]}.
Y consideremos el conjunto de sus grados:
deg(I ) := {n ∈ Z : ∃h ∈ I , n = deg(h)} ⊆ N ∪ {−1} ⊆ Z.
Observamos que deg(I ) es un subconjunto de Z inferiormente acotado (por −1) y, por tanto,
posee mı́nimo. Sea n0 := min (deg(I )) ese mı́nimo. Si n0 = −1, entonces 0 ∈ I (es el único
polinomio de grado −1) y se tiene la propiedad buscada tomando r = 0 y q ∈ R[X] tal que
f = qg, (que existe porque f − qg ∈ I ).
Supongamos que n0 ≥ 0 y que n0 ≤ deg(g) = d. Supongamos que g tiene la forma:
g = uX d + ad−1 X d−1 + · · · + a1 X + a0 ,
con ai ∈ R y u ∈ R× . Supongamos q ∈ R[X] tal que deg(f − qg) = n0 (que ha de existir porque
n0 ∈ deg(I ). Supongamos que
f − qg = bn0 X n0 + bn0 −1 X n0 −1 + · · · + b0 ,
con bi ∈ R. Como n0 ≥ d consideremos el polinomio:
q 0 := u−1 bn0 X n0 −d + q ∈ R[X].
Nótese que aquı́ usamos que u ∈ R× es unidad y, por tanto, posee inverso para el producto
(u−1 ). Entonces f − q 0 g ∈ I (por definición de I ) y observamos que
f −q 0 g = f −qg −u−1 bn0 X n0 −d g = (bn0 X n0 +· · ·+b0 )−bn0 X n0 −u−1 bn0 X n0 −d (g −uX n0 ) ∈ I .
Por tanto,
f − q 0 g = (bn0 −1 X n0 −1 + · · · + b0 ) − u−1 bn0 X n0 −d (g − uX d ) ∈ I .
Y, por tanto,
deg(f − g 0 q) ≤ max{n0 − 1, (n0 − d) + deg(g − uX d )} = max{n0 − 1, (n0 − d) + (d − 1)} = n0 − 1,
lo que contradice la minimalidad de n0 en I . Por tanto, si n0 ≥ 0, se ha de tener n0 6≥ deg(g)
(o, equivalentemente, n0 ≤ deg(g) − 1. Como n0 ≤ deg(g) − 1, ha de existir q ∈ R[X] tal que el
polinomio r = f − qg tiene grado n0 y, por tanto, se verifican las dos afirmaciones declaradas
en el enunciado.
Supongamos ahora que un polinomio admitiera dos descomposiciones del tipo indicado:
f = q1 g + r1 = q2 g + r2 ,
con deg(ri ) ≤ deg(g) − 1. Entonces tendremos:
q1 g + r1 = q2 g + r2 =⇒ (q1 − q2 )g = r1 − r2 .
Usando los grados tendremos que, como g es mónico con respecto a la variable
deg(q1 − q2 ) + deg(g) = deg(r1 − r2 ) ≤ max{deg(r1 ), deg(r2 )} ≤ deg(g) − 1.
Por tanto, necesariamente q1 = q2 y r1 = r2 y tendremos la unicidad.
1.4. ANILLOS, IDEALES, MORFISMOS DE ANILLOS 63
Observación 1.4.16. Nótese que la propiedad “el coeficiente director es una unidad en R”
es una condición necesaria. Por ejemplo, dividir X por 2X en Z[X] no es posible con las
condiciones de la División euclı́dea.
Corolario 1.4.17. Si K es un cuerpo, entonces K[X] admite división euclı́dea, esto es, se
verifica:
Dados f, g ∈ K[X], g 6= 0, existen q, r ∈ K[X] tales que se verifican las dos propiedades
siguientes:
i) f = qg + r,
ii) deg(r) ≤ deg(g) − 1.
Además, q y r son únicos con esa propiedad.
Demostración. Es obvio dado que todo polinomio no nulo en K[X] posee un coeficiente
director que es una unidad en K.
Utilicemos este Teorema para mostrar ejemplos de extensiones de Z.
Ejemplo 1.4.18 (Enteros de Gauss, de nuevo). Es fácil ver que se tiene la identificación
Z[i] := Z[X]/(X 2 + 1).
Por ello, y por el Teorema precedente, podemos entender los enteros de Gauss como los restos
de la división por el polinomio mónico X 2 + 1. Claramente, tenemos una identificación
Z[i] := {a + bX : a, b ∈ Z},
donde a + bX denota la clase a + bX + (X 2 + 1) en el anillo cociente Z[X]/(X 2 + 1).
Observación 1.4.20 (Operations matter!). En los dos ejemplos anteriores, hemos mostrado
los anillos Z[i] y Z[ω]. Para cada uno de ellos disponemos de una biyección:
ϕ : Z[i] −→ Z2 , ϕ(a + bi) = (a, b)
ψ : Z[ω] −→ Z2 , ψ(a + bω) = (a, b).
Cada una de ellas define una estructura de anillo en Z2 del modo siguiente.
• (Z2 , +, ∗1 ) siendo (Z2 , +) la estructura natural de grupo abeliano libre de rango 2 y
el producto viene dado por:
(a, b) ∗1 (c, d) := ϕ(ϕ−1 (a, b)ϕ−1 (c, d)) = (ac − db, ad + bc).
64 1. PRE-ÁLGEBRA
Observación 1.4.25 (Orden en (Nn , +) y Biyecciones con N). Podemos identificar Nn con
N de diversas formas. Cada biyección ϕ : Nn −→ N induce una relación de orden sobre Nn del
modo siguiente:
Dados µ, θ ∈ Nn , µ ≤ϕ θ si y solamente si ϕ(µ) ≤ ϕ(θ). Nos interesa no solamente una biyección
sino que, además, se comporte bien sobre la estrcuctura de monoide. En este sentido, en lugar
de tratar con biyecciones, interesan, sobre todo, los órdenes monomiales.
Definición 26 (Orden Monomial). Un orden monomial sobre (Nn , +) es una relación de
orden ≤ sobre Nn que verifica las siguientes propiedades:
i) Es un buen orden (i.e. todo subconjunto no vacı́o de Nn posee mı́nimo para ≤)
ii) ∀µ, θ, τ ∈ Nn , si µ ≤ τ , entonces µ + θ ≤ τ + θ.)
iii) El elemento 0 = (0, . . . , 0) ∈ Nn es el mı́nimo de (Nn , ≤).
Ejemplo 1.4.26 (Orden Lexicográfico). El orden lexicográfico ≤lex es el orden dado por la
regla siguiente:
Dados µ := (µ1 , . . . , µn ) ∈ Nn y ν := (ν1 , . . . , νn ) ∈ Nn , diremos que µ ≤lex ν si existe
k ∈ {0, . . . , n − 1} tal que se verifican las dos propiedades siguientes:
• µi = νi , para 1 ≤ i ≤ k. Obsérvese que si k = 0, esta condición es la condici—ón
vacı́a.
• µk+1 ≤ νk+1 .
Es claramente un ordem monomial en Nn .
Notación 1.4.32 (Monomios, términos, grado). Hay una notación estandarizada de estos
objetos. Supongamos dado un multi-ı́ndice µ := (µ1 , . . . , µn ) ∈ Nn . Se define el monomio
X µ := X1µ1 X2µ2 · · · Xnµn ∈ R[X1 , . . . , Xn ] como la transformación X µ : Nn −→ R, dada medi-
ante:
µ 1, si θ = µ,
X (θ) :=
0, en caso contrario.
Dado a ∈ R, se define el el término aX µ ∈ R[X1 , . . . , Xn ] como como la transformación
aX µ : Nn −→ R, dada mediante:
a, si θ = µ,
aX µ (θ) :=
0, en caso contrario.
Se dice que a 6= 0 es el coeficiente de aX µ , que µ es su exponente monomial (es decir, µ =
exp(aX µ )) y diremos que el grado del término es el grado del exponente monomial, esto es, el
número natural
deg(aX µ ) := |µ| = µ1 + µ2 + · · · + µn ∈ N.
como en el Ejemplo 1.2.2. En el caso a = 0 diremos que el grado del término es −1.
Lema 1.4.33. Con estas notaciones, R es un subanillo de R[X1 , . . . , Xn ], identificando R con
el conjunto de términos:
{λX (0) : λ ∈ R},
donde (0) = (0, . . . , 0) ∈ Nn es el elemento neutro de Nn como monoide. Escribiremos 1 en
lugar de X (0) y a ∈ R[[X1 , . . . , Xn ]] en lugar de aX (0) , para cada a ∈ R.
Demostración. Obvio.
68 1. PRE-ÁLGEBRA
n
Notación 1.4.34. Definamos, además, los siguientes elementos de RN : {X1 , . . . , Xn } dados
mediante las reglas siguientes:
1, si θ = (1, 0, 0, . . . , 0),
X1 : Nn −→ R, X1 (θ) :=
0, en caso contrario.
1, si θ = (0, 1, 0, . . . , 0),
X2 : Nn −→ R, X2 (θ) :=
0, en caso contrario.
..
.
1, si θ = (0, 0, 0, . . . , 1),
Xn : Nn −→ R, Xn (θ) :=
0, en caso contrario.
Se denominan las variables X1 , . . . , Xn . Podemos definir también las potencias de variables a
n
partir de la operación producto ∗ de RN :
Xi0 := 1, Xi1 := Xi , Xi2 := Xi ∗ Xi ,
Xit := Xit−1 ∗ Xi .
Lema 1.4.35. Con las anteriores notaciones, dado µ = (µ1 , . . . , µn ) ∈ Nn , y para cada a ∈ R
se tiene:
aX µ = a ∗ X1µ1 ∗ · · · ∗ Xnµn .
Demostración. Es un ejercicio obvio.
Proposición 1.4.37. Con las anteriores notaciones, para cada polinomio f ∈ R[X1 , . . . , Xn ] y
su soporte finito supp(f ) ⊆ Nn de y existen {aµ : µ ∈ supp(f )} ⊆ R \ {0} una cantidad finita
de elementos del anillo tales que:
X X
f := aµ X µ = aµ X1µ1 ∗ · · · ∗ Xnµn .
µ∈supp(f ) µ∈supp(f )
Observación 1.4.38. En el caso de series de potencias formales también se admite una repre-
sentación de la forma siguiente: Dada σ ∈ R[[X1 , . . . , Xn ]], escribiremos:
X X
σ := aµ X µ = aµ X µ ,
µ∈Nn µ∈supp(σ)
aunque, obviamente, se trata de una suma infinita y meramente simbólica. Sin embargo, será
posible generar una topologı́a (y una métrica) en algunos anillos de la forma R[[X1 , . . . , Xn ]]
(especialmente interesante en el caso de que R sea un cuerpo) para los que esa suma infinita es
un lı́mite, pero el asunto requiere varias discusiones ulteriores.
Veamos finalmente que Tρ0 = {(µ, ν)}. Es claro que el par (µ, ν) está en Tρ0 . Queda por ver el
otro contenido. Además, si (α, β) ∈ Tρ0 , entonces, α ∈ supp(f ) y β ∈ supp(g). Pero, como el
orden monomial escogido es un orden total, entonces,
α ≥ µ = min suppf (f ), β ≥ ν = min supp(g).
Concluyamos que si α > µ o β > ν, α ∈ supp(f ) y β ∈ supp(g), entonces, α + β > ρ y
(α, β) 6∈ Tρ0 . Supongamos, sin pérdida de la generalidad, que α > µ y que α + β = ρ. Nótese
que, en Nn , como subconjunto del grupo abeliano Zn , si µ + θ = α + θ, para algún θ ∈ Nn ,
entonces se debe tener µ = α. Por tanto, considerando el orden monomial, y su definición,
tendremos
µ < α =⇒ µ + ν < α + ν,
y
ν ≤ β =⇒ α + ν ≤ α + β.
En conclusión, tenemos
ρ = µ + ν < α + β,
y, por tanto, si µ < α , α ∈ supp(f ) y β ∈ supp(g), entonces y α + β 6= ρ y (α, β) 6∈ Tρ0 .
En suma, hemos probado que Tρ0 = {(µ, ν)} y, por ser R un dominio de integridad,
X
f ∗ g(ρ) := f (α)g(β) = f (µ)g(ν) 6= 0.
α+β=ρ
Podemos concluir:
Proposición 1.4.42. El conjunto de funciones booleanas Bn tiene una estructura natural de
anillo conmutativo con unidad, es biyectable al conjunto P({0, 1}n ) y tiene, por tanto, cardinal
dado por la siguiente identidad:
n
] (Bn ) = 22 .
Demostración. Es lo discutido en párrafos previos.
Ejemplo 1.4.43 (Funciones Holomorfas). Un ejemplo de dominio de integridad que se sale
del contexto de este curso es el siguiente:
• Sea U ⊆ Rn un abierto y consideramos el siguiente conjunto:
C ω (U ) := {f : U −→ R : f es analı́tica en U }.
Es un sencillo ejercicio de análisis, probar que C ω (U ) es un subanillo de (RU , +, ·) y,
por tanto, un anillo con las operaciones habituales de suma y producto de funciones.
Se llama el anillo de las funciones analı́ticas sobre U .
1.4. ANILLOS, IDEALES, MORFISMOS DE ANILLOS 71
también cierto en el caso de funciones analı́ticas reales definidas sobre abiertos U ⊆ R, es decir
C ω (U ) es dominio de integridad si y solamente si U es conexo. En cambio, el resultado no
es cierto para funciones diferenciables o para funciones continuas. Si tratamos con funciones
C ∞ (R) podemos encontrar dos funciones f+ y f− : R −→ R tales que ambas son infinitamente
diferenciables y verifican:
f+ (x) = 0, f− (x) = 1, si x ∈ (−∞, −1)
f+ (x) = 0, si x ∈ (−1, 0)
f − (x) = 0, si x ∈ (0, 1)
f+ (x) = 1, f− (x) = 0, si x ∈ (1, +∞)
14Buscar http://en.wikipedia.org/wiki/Zeros_and_poles.
72 1. PRE-ÁLGEBRA
tal que Φ(a) = a, ∀a ∈ R y Φ(Xi ) = πi V , para 1 ≤ i ≤ n.
Concluir que todo polinomio homogéneo f (cuyo grado no es divisible por la caracterı́stica del
cuerpo) está en el ideal homogéneo generado por sus derivadas parciales, i.e.
∂f ∂f ∂f
f∈ , ,..., .
∂X0 ∂X1 ∂Xn
Problema 61. Probad que si U = U1 ∪ U2 ⊆ X es un abierto en un espacio topológico (X, T )
con dos componentes conexas U1 , U2 disjuntas, entonces C (U ) no es dominio de integridad.
Problema 62. Sea K ⊆ E una extensión finita de cuerpos (es decir, E es un K−espacio
vectorial de dimensión finita sobre K). Para cada α ∈ E, se define la siguiente aplicación:
ηα : E −→ E
x 7−→ αx.
Se pide probar las siguientes propiedades:
i) La aplicación ηα es un endomorfismo de espacios vectoriales de E.
ii) Fijada una base ordenada B de E como espacio vectorial, existe una matriz Mα ∈
Mn (K) que es la matriz de ηα con respecto a esa base.
iii) Dados α, β ∈ E y λ ∈ K se tiene las siguientes propiedades:
ηαβ = ηα ◦ ηβ = ηβ ◦ ηα , ηα+β = ηα + ηβ = ηβ + ηα , ηλα = ληα ,
donde las operaciones entre elementos de E son las propias del cuerpo E y las opera-
ciones entre endomorfismos son las propias de EndK (E).
iv) Dados α, β ∈ E y λ ∈ K se tiene las siguientes propiedades entre matrices:
Mαβ = Mα Mβ = Mβ Mα , Mα+β = Mα + Mβ = Mβ + Mα , Mλα = λMα ,
donde las operaciones entre elementos de E son las propias del cuerpo E y las opera-
ciones entre matrices son las propias de Mn (E).
v) Si p ∈ K[X] es un polinomio tal que p(Mα ) = 0, entonces p(α) = 0.
vi) Concluir que todos los elementos de E son algebraicos sobre K.
1.4. ANILLOS, IDEALES, MORFISMOS DE ANILLOS 75
15Mejor dicho, disponemos del algoritmo de división (siempre que el divisor sea un polinomio mónico con
respecto a una de las variables), y de la noción de máximo común divisor (por el Lema de Gauss (cf. 6.2) pero
ni la una ni el otro tienen las buenas propiedades que tenı́an en el caso univariado.
1.4. ANILLOS, IDEALES, MORFISMOS DE ANILLOS 77
16No se trata de un orden obtenible mediante los anteriores y una permutación de las variables. Debe
señalarse que, a pesar de lo extraño de su definición, suele ser el orden que mejor se comporta en la ejecución del
algoritmo de cálculo de bases de Gröbner. No se sabe muy bien el porqué de este fenómeno con este particular
orden monomial.
78 1. PRE-ÁLGEBRA
Índice
2.1. Introducción 79
2.2. Módulos, submódulos, morfismos de módulos 80
2.2.1. Generalidades 80
2.2.2. Operaciones básicas con submódulos e ideales 86
2.2.3. Teoremas de isomorfı́a 91
2.2.4. Módulos libres y bases 94
2.2.5. Diagramas conmutativos, complejos y sucesiones exactas (Opcional) 99
2.2.6. Ejercicios y problemas de la Sección 2.2 103
2.2.6.1. Breve recordatorio de Teorı́a elemental del Endomorfismo (en
caso de no disponer de formación previa) 104
2.2.6.2. Futuro: Homologı́a Singular 111
2.2.6.3. Futuro: Homotopı́a 111
2.2.6.4. Futuro: Co-homologı́a de de Rahm 111
2.3. Determinante. Teorema de Hamilton-Cayley 111
2.3.1. Determinante: propiedades básicas. 112
2.3.2. La Fórmula de Laplace 116
2.3.3. Polinomios con coeficiente matricial y matrices con coordenadas
polinomiales. Teorema de Hamilton-Cayley 126
2.3.4. Ejercicios y problemas de la Sección 2.3 131
2.3.4.1. Complejidad Algebraica en unos ejemplos 132
2.3.4.2. Sumas de Newton y Funciones simétricas elementales. 134
2.1. Introducción
El Capı́tulo introduce los R−módulos (noción fundamental, junto con la noción de anillo,
del Álgebra Conmutativa). Si el ejemplo primario puede ser el ejemplo de los K−espacios
vectoriales, pronto se observa la diferencia entre disponer de escalares en un cuerpo o en un
anillo cualquiera, simplemente considerando los grupos abelianos (noción equivalente a la de
Z−módulo), donde aparece la torsión o los divisores de cero de manera natural. Nos dedicamos
a establecer la noción y a demostrar algunas propiedades muy elementales, con una fuerte carga
de notación y cuantos ejemplos sea posible a partir del acerbo cultural de la audiencia.
La siguiente notable diferencia entre R−módulos y K−espacios vectoriales es la dificultad de
poseer una base en los R−módulos que, de forma elemental, existe en el caso de los K−espacios
vectoriales finitamente generados gracias al Teorema del Reemplazamiento. Ante la posible
ausencia de bases, hacemos una primera presentación de los R−módulos que poseen bases:
módulos libres. Por falta de suficientes medios de lenguaje, dejamos para más adelante la
discusión de si la existencia de base en R−módulos libres comporta la existencia de algún tipo
79
80 2. MÓDULOS, DETERMINANTES, HAMILTON-CAYLEY
Nótese
Q que es esencial la propiedad ϕ(i) ∈ Mi , ∀i ∈ I. Definimos las operaciones sobre
i∈I Mi mediante el Qclásico procedimiento de “operar coordenada a coordenada”. Es
decir, dados ϕ, ψ ∈ i∈I Mi y dado a ∈ R, definimos las siguientes correspondencias:
S
ϕ + ψ : I −→ i∈I Mi
i 7−→ ϕ(i) + ψ(i).
S
a ·r ϕ : I −→ i∈I Mi
i 7−→ a ·R ϕ(i),
82 2. MÓDULOS, DETERMINANTES, HAMILTON-CAYLEY
donde {Rµ : µ ∈ Nn } son copias del anillo R (i.e. Rµ = R) repetidas tantas veces
como elementos µ ∈ Nn . Por tanto, R[[X1 , . . . , Xn ]] es identificable como R−módulos
n
con RN , pero no son identificables como anillos, como ya se indición en su lugar.
x) De modo análogo a la construcción precedente, podemos considerar un conjunto X
cuanlquiera y una familia {Rx : x ∈ X} de R−módulos, donde Rx = R es el propio
anillo. Podemos considerar la suma directa de estos módulos que denotaremos del
modo siguiente: M M
Rx = R.
x∈X X
Se trata de un R−módulo que tendrá una importancia relevante en la siguiente sección
del Capı́tulo. Nótese que en el caso X = Nn , el anillo R[X1 , . . . , Xn ] se puede idetificar
con: M
R[X1 , . . . , Xn ] := Rµ ,
µ∈Nn
n
donde, de nuevo, {Rµ : µ ∈ N } son copias del anillo R (i.e. Rµ = R). Una vez más,
no es posible identificar ambos conjuntos como anillos.
2.2. MÓDULOS, SUBMÓDULOS, MORFISMOS DE MÓDULOS 83
xiii) Los conjuntos de matrices Mn×m (R) tienen una estructura natural de R−módulo.
Simplemente, obsérvese que si escribimos [n] := {1, . . . , n} y [m] := {1, . . . , m}, las
matrices son simplemente el conjunto descrito por la igualdad siguiente:
Mn×m /R) = R[n]×[m] := {f : [n] × [m] −→ R : f es aplicación},
y su estructura se sigue de lo descrito para el producto cartesiano de R−módulos.
Ejemplo 2.2.3 (Grupos abelianos). Los grupos abelianos no son otra cosa que Z−módulos
(ambas nociones son equivalentes). Obviamente, todo Z−módulo es un grupo abeliano, ası́ que
se trata de ver el otro contenido. Para ello consideremos la siguiente notación para un grupo
abeliano (G, +):
Dado m ∈ N y g ∈ G, definamos:
• Si m = 0 ∈ N, definamos 0 · g = 0G ,
• Si m ≥ 1, definamos m · g = g + (m − 1) · g.
Para cada número entero n ∈ Z, definamos
• Si n ∈ N, definamos n · g ∈ G es el definido en el apartado anterior,
• Si n ≤ 0, definamos n · g = (−n) · (−g) (que está definido porque (−n) ∈ N).
Tenemos una aplicación:
·Z : Z × G −→ G
(n, g) 7−→ n · g.
84 2. MÓDULOS, DETERMINANTES, HAMILTON-CAYLEY
Ejemplo 2.2.4 (Teorı́a del endomorfismo). Sea V un espacio vectorial sobre un cuerpo K,
ϕ : V −→ V una aplicación lineal. Podemos definir una estructura de K[X]−módulo sobre
V que se conoce como Teorı́a del endomorfismo. Se define del modo siguiente: Definamos
recursivamente:
• ϕ0 = IdV (la identidad),
• ϕ1 = ϕ,
• Para n ≥ 2, ϕn := ϕ ◦ ϕn−1 , donde ◦ es la composición.
Dado p ∈ K[X], de la forma:
p := ao + a1 X + a2 X 2 + · · · an X n ,
definimos p(ϕ) : V −→ V mediante:
p(ϕ) := a0 IdV + a1 ϕ + a2 ϕ ◦ ϕ + · · · + an ϕn .
Finalmente, definimos
·K[X] : K[X] × V −→ V
(p(X), v) 7−→ p(ϕ)(v) ∈ V.
Se tiene que (V, +, ·K[X] ) es un K[X]−módulo. Los submódulos de V como K[X]−módulo serán
los subespacios vectoriales (como K−espacio vectorial) de V invariantes por ϕ (ver Problema
78).
Ejemplo 2.2.5. i) En el caso de espacios vectoriales, HomK (V, W ) son las aplicaciones
lineales.
ii) En el caso de grupos abelianos, HomZ (A, B) son los morfismos de grupos entre (A, +)
y (B, +).
iii) Consideremos una familia cualquieraQde R−módulos {Mi : i ∈ I}. Consideremos los
R−módulos producto y co-producto i∈I Mi y ⊕i∈I Mi . Los siguientes son morfismos
de R−módulos:
2.2. MÓDULOS, SUBMÓDULOS, MORFISMOS DE MÓDULOS 85
Observación 2.2.8. Obviamente esta Proposición nos da toda una colección adicional de
módulos a través de operaciones de cociente y tomar morfismos.
Nótese también la discrepancia aparente entre el ı́tem ii), (a) de esta Proposición 2.2.7 y el ı́tem
iii), (b) de la Proposición 1.4.9. Si a es un ideal de un anillo R y f : R −→ T es un morfismo de
anillos, entionces f (a) es un submódulo de T como R−módulo. Pero no hay discrepancia salvo
en apariencia porque para ser ideal de T debemos exigir que f (a) sea submódulo de T ¡como
T −módulo!.
Demostración. Bastará con hacerlo para submódulos porque, al cabo, los ideales de un
anillo R son sus submódulos como R−módulo. Para pobar la identidad basta con demostrar
primero que la expresión de la derecha define un submódulo de M . Esto es mera escritura
cuidadosa de la fórmula expresada. Una vez probado que es submódulo, se prueba que para
cualquier otro submódulo N de M que contenga a F, N debe contener todos los elementos
que aparecen en el conjunto de la derecha de la igualdad buscada. Como RhFi es el menor
submódulo que contiene a F la prueba se concluirá.
Notación 2.2.14 (Módulos, submódulos e ideales finitamente generados). Módulos
y submódulos finitamente generados serán aquellos generados por un conjunto finito de el-
ementos. Como ya indicamos, escribiremos Rm para denotar al submódulo generado por
{m}. En ocasiones escribiremos Rm1 + · · · + Rmr o Rhm1 , . . . , mr i para denotar al módulo
Rh{m1 , . . . , mr }i generado por el conjunto finito {m1 , . . . , mr }. Para ideales, sin embargo, es-
cribiremos (a1 , . . . , am ) para denotar el ideal generado por la familia {a1 , . . . , am }. Nótese que,
en el caso de un conjunto de generadores finito se tiene:
• (Para submódulos) dado m ∈ M , se tiene m ∈ Rhm1 , . . . , mr i si y solamente si existen
x1 , . . . , xr ∈ R tales que:
Xr
m= xi m i .
i=1
• (Para ideales) dado x ∈ R, se tiene x ∈ (a1 , . . . , ar ) si y solamente si existen x1 , . . . , xr ∈
R tales que:
Xr
x= xi ai .
i=1
Ejemplo 2.2.17. Los ideales (0) y (1) son principales. En particular, los cuerpos son anillos
principales. Pero no todos los anillos principales son dominios de integridad. Por ejemplo Z/6Z
es un anillo principal que no es dominio.
Afirmaciones análogas son obvias para ideales y módulos generados por familias cualesquiera,
teniendo en cuenta siempre que se trata de combinaciones lineales finitas.
90 2. MÓDULOS, DETERMINANTES, HAMILTON-CAYLEY
Ejemplo 2.2.20 (Producto no significa que todos los elementos sean productos). Es
importante señalar que, salvo en el caso obvio de anillos principales, los productos aN y ab
no suelen coincidir con los productos de los objetos implicados. Es decir, existen ejemplos de
anillos y módulos tales que:
aN 6= {λn : λ ∈ a, n ∈ N },
ab 6= {xy : x ∈ a, y ∈ b}.
Pongamos un ejemplo con un producto de ideales que cubre ambas afirmaciones. Consideremos
los ideales a = (2, X) y b = (3, X + 1) en el anillo no principal Z[X]. El ideal producto ab es el
generado por los productos de los generadores, con lo que tendremos:
ab = (6, 3X, 2(X + 1), X(X + 1)).
Ahora observamos que el polinomio X − 2 ∈ ab:
(X − 2) = 3X − 2(X + 1).
Sin embargo, no es posible presentar X − 2 como un producto p(X)q(X) con p(X) ∈ a y
q(X) ∈ b. Razonemos por reducción al absurdo. Supongamos (X − 2) = p(X)q(X). Como
Z[X] es un dominio de integridad, se tendrá que
deg(p) + deg(q) = 1, 0 ≤ deg(p) ≤ 1, 0 ≤ deg(q) ≤ 1.
Por tanto, uno de los dos es una constante (en Z) no nula y el otro es un polinomio de grado
1. Sin pérdida de la generalidad podemos suponer:
p(X) = a ∈ Z \ {0}, q(X) = cX + b ∈ Z[X].
Como X − 2 = p(X)q(X), concluiremos:
ac = 1, ab = −2.
Pero, entonces, a ∈ {±1} y, a ∈ a. Basta con observar que (2, X) es un ideal propio en Z[X],
para concluir que esto no es posible. Luego X − 2 no es un producto de un elemento de a y
otro de b.
c e
i) a ⊆ (ae ) , b ⊇ (bc ) .
c e e c
ii) ae = ((ae ) ) , bc = ((bc ) ) .
iii) Sea C es el conjunto de las contracciones a R de los ideales de B (i.e. C := {bc :
b ideal en B}). Sea E el conjunto de los ideales de B que son extensión de los ideales
de R (i.e.E := {ae : a ideal en R}). Las siguientes son aplicaciones biyectivas (una
inversa de la otra):
Φ : C −→ E
a 7−→ ae .
Φ−1 : E −→ C
b 7−→ bc .
Demostración. Véase el Problema 97.
Las extensiones y contracciones de ideales verifican algunas propiedades inmediatas más que
dejaremos como Problema y que resumimos a continuación:
Proposición 2.2.24. Sea f : R −→ B un morfismo de anillos. Sean a1 y a2 dos ideales del
anillo R. Se tiene:
e
i) (a1 + a2 ) = ae1 + ae2 .
e
ii) (a1 ∩ a2 ) ⊆ ae1 ∩ ae2 .
e
iii) (a1 a2 ) = ae1 ae2 .
Además, el contenido en la afirmación ii) es, en ocasiones, estricto.
Demostración. Se deja como Problema 98. Una pista para la afirmación última es la
siguiente. Considérense los anillos A = Q[Y, Z] y B := Q[X] y considérese el siguiente morfismo
de anillos:
ϕ: A −→ B
f (Y, Z) −→ f (X 2 , X 3 ).
Sean a1 = (Y ) y a2 = (Z). Entonces, compruébese que
a1 ∩ a2 = (Y Z),
lo que implicará que
e
(a1 ∩ a2 ) = (Y Z)e = (X 5 ),
mientras que
ae1 = (X 2 ), ae2 = (X 3 ),
y, por tanto,
ae1 ∩ ae2 = (X 3 ).
Demostración. Aunque las afirmaciones son evidentes, veamos en detalle las relaciones:
• En el caso de anillos. Sea a ( R un ideal propio del anillo R. Por ser ideal R/a
posee una estructura natural de anillo ya discutida anteriormente. Tenemos, además,
un epi–morfismo de anillos dado por la proyección canónica:
π : R −→ R/a
x 7−→ x + a.
Para un ideal b de R, uno puede observar que la imagen por π de b es dada por:
π(b) := {x + a : x ∈ b}.
Es fácil observar que π(b) = π(b + a) y que b + a es un ideal de R que contiene a a.
Por eso, si b es un ideal de R que contiene a a, entonces, π(b) es un ideal de R/a que
denotaremos mediante b/a.
De otro lado, para un ideal i de R/a, la anti–imagen por π es dada por
π −1 (i) = {x ∈ R : x + a ∈ i}.
Por lo visto anteriormente, π −1 (i) es ideal en R y dado que 0 + a ∈ i, uno concluye
que a ⊆ π −1 (i).
Con estas observaciones, es claro que la siguiente define una biyección entre ideales:
{b ⊆ R : b ⊇ a, b es ideal} −→ {i ⊆ R/a : i es ideal}
b 7−→ π(b) = b/a,
cuya inversa es dada por i 7−→ π −1 (i).
• En el caso de R−módulos. Se trata esencialmente del mismo tipo de argumento. Sea
N ⊆ M un submódulo del R−módulo M . El cociente M/N posee una estructura
natural de R−módulo anillo ya discutida. Tenemos, además, un epi–morfismo de
R−módulos dado por la proyección canónica:
π : M −→ M/N
x 7−→ x + N.
Para un Submódulo L de M , uno puede observar que la imagen por π de L es dada
por:
π(L) := {x + N : x ∈ L}.
Es fácil observar que π(L) = π(L + N ) y que L + N es un submódulo de M que
contiene a N . Por eso, si L es un submódulo de M que contiene a N , entonces, π(L)
es un submódulo de M/N que denotaremos mediante L/N .
De otro lado, para un submódulo K de M/N , la anti–imagen por π es dada por
π −1 (K) = {x ∈ M : x + N ∈ K}.
Por lo visto anteriormente, π −1 (K) es submódulo de M y dado que 0 + N ∈ K, uno
concluye que N ⊆ π −1 (K).
Con estas observaciones, es, de nuevo, claro que la siguiente define una biyección entre
submódulos:
{L submódulo de M : L ⊇ N } −→ {K submódulo de M/N }
L 7−→ π(L) = L/N,
cuya inversa es dada por K 7−→ π −1 (K).
Observación 2.2.31. La Teorı́a de Módulos serı́a una sencilla traslación (con pocas variaciones)
de muchas de las ideas del Álgebra Lineal (la parte más “lineal” de la Matemática, por ausencia
de “ramificaciones”). Afortunadamente, los módulos interesantes tienden a no ser libres y, quizá
por ello, son más interesantes (lo lineal tiende a ser trivial si se estudia del modo esperable).
Para ver que no todo módulo es libre baste con observar que un grupo abeliano finito no puede
ser Z−módulo libre porque, si lo fuera, su cardinal serı́a, al menos, numerable infinito y no finito.
Pero podemos hablar de bases como en los espacios vectoriales con la definición siguiente:
De otro lado, es fácil ver que la familia BX es una familia de elementos linealmente independi-
entes sobre R. Si tomamos J ⊆ X un conjunto finito y unos elementos {λx ∈ R : x ∈ J}, y si
suponemos X
ax ex = 0,
x∈J
entonces esa es una igualdad como funciones, por lo que
X 0, si y 6∈ J
0= ax ex (y) =
ax = ax ex (y) si y = x ∈ J.
x∈J
Con lo que tendremos la conclusión buscada y BX es base de ⊕X R.
Supongamos ahora que un R−módulo M posee una base B := {vi : i ∈ I} ⊆ M . Conluyamos
que, entonces, M es isomorfo a ⊕I R = ⊕B R y habremos probado que M es un R−módulo
libre. Nótese que ya hemos asumido que B e I son conjuntos biyectables y que, como tales
conjuntos biyectables ⊕I R y ⊕B R son isomorfos. De todos modos, es fácil definir la siguiente
correspondencia:
Φ : ⊕I R −→ P M
f 7−→ i∈I f (i)vi .
La primera dificultad es probar que se trata, efectivamente, de una aplicación. Para ello,
recordemos que f ∈ ⊕I R, luego es de soporte finito, por tanto,
X X
f (i)vi = f (i)vi ,
i∈I i∈supp(f )
que es una suma finita que, por tanto, es un elemento de M . Tendremos ası́ probado que se
trata de una correspondencia. Además, se observa que la suma finita sólo depende de f (de
supp(f ) y de los valores de f en supp(f )). Verificar que se trata de un morfismo de R−módulos
96 2. MÓDULOS, DETERMINANTES, HAMILTON-CAYLEY
donde supp(f ) ⊆ I es un conjunto finito. Pero, por ser B una familia libre de elemntos de M
y por la identidad que acabamos de escribir (que es una suma finita de múltiplos “escalares”
de los elementos de B, igualada a cero) concluiremos sin esfuerzo que f (j) = 0 para todo
j ∈ supp(f ), con lo que f debe ser la aplicación nula.
Proposición 2.2.38 (Propiedades básicas de los módulos libres). Se tienen las siguientes
propiedades:
i) Sean M y N dos R−módulos y supongamos que M es un R−módulo libre. Sea B =
{vi : i ∈ I} una base de M como R−módulo libre. Sea {ni : i ∈ I} una familia
cualquiera de elementos de N . Entonces, existe un único morfismo de R−módulos
f ∈ HomR (M, N ) tal que
f (vi ) = ni , ∀i ∈ I.
ii) Si M y N son dos R−módulos libres, fijadas unas bases B y B 0 en M y N , las
representaciones (coordenadas en R) en la base B 0 de las imágenes de los elemen-
tos de la base B determinan unı́vocamente los morfismos de R−módulos entre M y
N . En particular, si M y N son R−módulos libres con bases finitas, el R−módulo
HomR (M, N ) es también un R−módulo libre.
iii) Sumas directas de R−módulos libres son libres. Es decir, dada una familia {Mi : i ∈
I} una familia cualquiera de R−módulos libres (con I conjunto de cualquier cardinal),
entonces, el siguiente es un R−módulo libre:
⊕i∈I Mi .
iv) Producto cartesianos finitos de R−módulos libres es un R−módulo libre. Qr Es decir, si
{M1 , . . . , Mr } es una familia finita de R−módulos libres, el producto i=1 Mi es un
R−módulo libre.
Demostración. Las afirmaciones son esencialmente de mera verificación a partir de la
Proposición 2.2.36. Las proponemos como Problema.
Ejemplo 2.2.40 (Ejemplos de módulos libres de rango finito). Los siguientes son ejemplos
de R−módulos libres y no libres:
i) Un espacio vectorial V sobre un cuerpo K son módulos libres, al rango se le llama
dimensión y está determinado de forma unı́voca.
2Esta es una definición “provisional”: no hemos probado aún que dos bases de un R−módulo libre tengan
que tener el mismo cardinal. Lo haremos en el Capı́tulo siguiente (Subsección 4.2.2 y, en particular, en la
Definición 69) con poco esfuerzo adicional, pero nos permitimos usar esta terminologı́a por el momento.
98 2. MÓDULOS, DETERMINANTES, HAMILTON-CAYLEY
ii) Los anillos son módulos libres sobre sı́ mismos de rango acotado por 1.
iii) Los conjuntos de matrices Mn×m (R) tienen una estructura natural de R−módulo libre
de rango acotado por nm.
iv) Los polinomios homogéneos de grado fijado con coeficientes en R, i.e. el conjunto
Hd (X1 , . . . , Xn ) := {f ∈ R[X1 , . . . , Xn ] : deg(f ) = d} ∪ {0},
tendremos un R−módulo libre de rango acotado por
d+n−1
.
n−1
v) Los grupos abelianos finitos no son nunca Z−módulos libres. En particular, no son
Z−módulos libres los de la forma:
r
Y
G := (Z/pi Z) ,
i=1
con pi ∈ Z no nulos.
si y solamente si
a1,1 a1,2 ··· a1,m x1 y1
a2,1 a2,2 ··· a2,m
x2 y2
.. .. = .. .
.. ..
. . . . .
an,1 an,2 ··· an,m xm yn
2.2. MÓDULOS, SUBMÓDULOS, MORFISMOS DE MÓDULOS 99
Proposición 2.2.43 (Matrices y morfismos entre módulos libres de rango finito). Sean
M y N dos R−módulos libres con bases respectivas B y B 0 de respectivos cardinales m y n.
Entonces, existe un isomorfismo de R−módulos
MB,B0 : HomR (M, N ) −→ Mn×m (R).
Para cada f ∈ HomR (M, N ), la matriz MB,B0 (f ) = A ∈ Mn×m (R) se la denomina matriz de
f en las bases B y B 0 .
Demostración. Es casi obvio desde la observación precedente y lo dejamos como ejercicio.
Debe tenerse en cuenta que no hemos demostrado la unicidad del rango, aspecto éste que
dejaremos para el Capı́tulo siguiente.
π i
M/ ker(f ) Im(f )
fe
π2 π2
i
N1 N1 + N2
π1 π2
de tal modo que dn ◦ dn+1 = 0 (o, equivalentemente, Im(dn+1 ) ⊆ ker(dn )) para cada n ∈ Z. A
los elementos de Mn se les dnomina elementos de grado (o dimensión) n. A los morfismos dn
se les denomina morfismos frontera o diferenciales3. A los elementos de ker(dn ) ⊆ Mn se les
denomina ciclos de grado n y a los de Im(dn+1 ) ⊆ Mn se les denomina bordes (de grado n). A
los R−módulos cociente
Hi (C, R) := ker(di )/ Im(di+1 ),
se les denomina módulos de homologı́a del complejo C.
En ocasiones, módulos y morfismos aparecen con ı́ndices en sentido ascendente y en ese caso
hablamos de complejos de co-cadena. Por ahora, nos quedamos con la terminologı́a que será
recordada más adelante.
Definición 45 (Complejos (de co-cadena) de R−módulos). Se denomina complejo de
co-cadena de R−módulos a todo diagrama dado como una secuencia creciente (sub-indicada
por Z o N, según el caso) de módulos y morfismos:
n−2
c cn−1 cn cn+1 . . .
D : ... M n−1 Mn M n+1
de tal modo que cn ◦ cn−1 = 0 (o, equivalentemente, Im(cn−1 ) ⊆ ker(cn )). A los elementos de
M n se les denomina elementos del complejo de grado n. A los elementos de ker(cn ) ⊆ M n se les
denomina co-ciclos de grado n y a los elementos de Im(cn−1 ) ⊆ M n se les denomina co-bordes
de grado n. Al cociente de co-ciclos por co-bordes se le denomina grupo de co-homologı́a del
complejo:
H n (D, R) := ker(cn )/ Im(cn−1 ).
Ejemplo 2.2.47 (Dualidad). El elegir sentido decreciente (en términos de grado) o creciente es
un clásico convecionalismo (discutible salvo en las iterpretaciones más topológicas). Intentemos
explicar la razón del doble sentido (creciente/decreciente) y de las expresiones con prefijo “co-”
(co-cadena, co-ciclo, co-borde, co-homologı́a,...) mediante la dualización. Es decir, veamos que
se puede pasar de un complejo de cadena a un complejo de co-cadena mediante dualización,
lo que explicarı́a la principal deferencia y similitud de ambas nociones. Supongamos dado un
complejo de cadena:
dn+2 dn+1 dn dn−1
C : ... Mn+1 Mn Mn−1 Mn−2 ...
3La terminologı́a viene de la Topologı́a Algebraica y los morfismos frontera inducidos por triangulaciones,
ası́ como los términos ciclo, borde para representar, respectivamente ker(di ) e Im(di+1 ).
102 2. MÓDULOS, DETERMINANTES, HAMILTON-CAYLEY
dn
Mn Mn−1
h ◦ dn h
R
Por ello, podemos definir la siguiente aplicación:
d∗n := HomR (dn , R) : HomR (Mn−1 , R) −→ HomR (Mn , R)
h 7−→ h ◦ dn .
Es aplicación porque h ◦ dn es morfismo de R−módulos. Es sencillo, además, probar que d∗n es
∗
un morfismo de R−módulos entre los duales Mn−1 y Mn∗ (i.e. d∗n ∈ HomR (Mn−1∗
, Mn∗ )).
Sabemos que dn ◦ dn+1 = 0 para cada n ∈ Z porque C es un complejo de cadena. Consideremos
∗
ahora f ∈ Mn−1 , es decir un morfismo f : Mn−1 −→ R. Entonces, d∗n (h) = (h ◦ dn ) ∈
HomR (Mn , R) = Mn∗ . Podemos aplicar ahora d∗n+1 al elemento (h◦dn ) ∈ HomR (Mn , R) = Mn∗ .
Tendremos que d∗n+1 (f ◦ dn ) ∈ Mn+1
∗
y se tiene:
∗ ∗ ∗
dn+1 ◦ dn (h) = dn+1 (dn ◦ h) = h ◦ (dn ◦ dn+1 ) = h ◦ 0 = 0.
dn ◦ dn+1 = 0
dn+1 dn
Mn+1 Mn Mn−1
h ◦ dn ◦ dn+1 = 0 h ◦ dn h
R
Es decir,d∗n+1◦ = 0. Escribiendo, para ajustar los ı́ndices, cn−1 := d∗n , tenemos el siguiente
d∗n
complejo de co-cadena, dual del complejo de cadena C:
n−2
c ∗ cn−1 cn ∗ cn+1 . . .
C∗ : . . . Mn−1 Mn∗ Mn+1
En los que respeta a este Capı́tulo usaremos notación ascendente y lo llamaremos solamente
complejos.
Definición 46 (Sucesiones exactas de R−módulos). Las sucesiones exactas de R−módulos
son los complejos de R−módulos:
di−1 di di+1 di+2
C : ... Mi Mi+1 Mi+2 ...
que verifican:
Im(di+1 ) = ker(di ), ∀i.
Se llaman sucesiones exactas cortas a las sucesiones exactas de la forma:
f g
0 M0 M M 00 0
0 00
Donde 0 es el R−módulo nulo, y 0 −→ M , M −→ 0, son los morfismo obvios (y, por ello,
no se representan). A veces abreviamos el término escribiedndo simplemente s.e.c..
Entonces, el complejo de cadena C es una sucesión exacta si y solamente si todos los R−módulos
de homologı́a Hn (C, R) son el módulo 0. Análogamente, dado un complejo de co-cadena:
2.2. MÓDULOS, SUBMÓDULOS, MORFISMOS DE MÓDULOS 103
n−2
c cn−1 cn cn+1 . . .
D : ... M n−1 Mn M n+1
Entonces el complejo D es exacto si y solamente si los R−módulos de co-homologı́a H n (D, R)
son todos nulos.
entonces C es exacto si y solamente si para cada i, la sucesión exacta corta siguiente es exacta:
ki di
0 ker(di ) M ker(di+1 ) 0
vi) Dadas A, B ∈ Mn (K) dos matrices semejantes y sea P ∈ GL(n, K) tal que P AP −1 =
B, prueba que para cada polinomio h ∈ K[X] se tiene:
P h(A)P −1 = h(B).
Concluye que si dos matrices A y B son semejantes, se tiene:
AnnK[X] (A) = AnnK[X] (B),
y por tanto, dos matrices semejantes poseen el mismo polinomio mı́nimo.
vii) Recuérdese que un valor propio de una matriz A ∈ Mn (K) es una constante λ ∈ K
en el cuerpo tal que existe un vector no nulo v ∈ V \ {0} tal que Av = λv, donde v se
ha escrito como columna. Pruébese que si p ∈ K[X] es un polinomio, se verifica:
p(A)v = p(λ)v.
Conclúyase que si λ ∈ K es valor propio de A, entonces p(λ) = 0 para todo polinomio
p ∈ AnnK[X] (A). Es decir, pruébese que los valores propios de una matriz cuadrada
son la raı́ces de su polinomio mı́nimo y que, por el apartado precendente, el número
de valores propios distintos de una matriz cuadrada A ∈ Mn (K) en un cuerpo K no
puede exceder n2 .
Problema 76. Hágase el mismo análisis que en el problema precedente considerando el anillo
no conmutativo con unidad EndK (V ) en lugar de Mn (K). Conclúyase que el número de valores
propios distintos de un endomorfismo es finito. ( Hint: Usando la estructura de K[X]−módulo
de V descrita en el Ejemplo 2.2.4 precedente, obsérvese que para cada endomorfismo ϕ ∈
EndK (V ), cada polinomio p ∈ K[X] y cada base ordenada B de V , se tiene que:
MB (p(ϕ)) = p(MB (ϕ)).)
Problema 77. Sea R un anillo, a un ideal de R y M un R−módulo. Sea aM el submódulo
producto de a por M . Sea M/aM el R−módulo cociente. Probad que la siguiente correspon-
dencia:
·R/a : (R/a) × (M/aM ) −→ (M/aM )
(x + a, m + aM ) 7−→ xm + aM,
define una estructura de R/a−módulo sobre M/aM .
Problema 78 (Subespacios invariantes de un endomorfismo). Sea V un espacio vectorial
de dimensión finita sobre un cuerpo K y sea ϕ : V −→ V un endomorfismo. Consideremos la
estructura de K[X]−módulo inducida en V por el enfomorfismo ϕ: (V, +, ·K[X] ). Recuérdese
que un subespacio vectorial W de V se denomina ϕ−invariante sii ϕ(W ) ⊆ W . Pruébese que
son equivalentes para cada subespacio W de V :
i) El subespacio W es ϕ−invariante.
ii) W es un submódulo de V visto como K[X]−módulo.
Problema 79 (Cuerpos de Galois). Se denominan cuerpos de Galois a los cuerpos finitos
y para un cuerpo de cardinal q el cuerpo de Galois de cardinal q se denota mediante GFq o
simplemente mediante Fq . Se pide:
i) Pruébese que si un cuerpo K es finito tiene que tener caracterı́stica no nula y, por
tanto, existe un único primo p ∈ N no nulo tal que Fp ⊆ K.
ii) Pruébese que si un cuerpo K es finito de ceracterı́stica p, entonces la extensión de
cuepos Fp ⊆ K es finita (o, equivalentemente, pruébese que [K : Fp ] < +∞ o,
equivalentemente, K es un Fp − espacio vectorial de dimensión finita).
iii) Conclúyase que si K es un cuerpo finito, entonces existe un primo p ∈ N no nulo y
existe n ∈ N tal que su cardinal satisface ](K) = pn . Equivalentemente, conclúyase
que los únicos cuerpos de Galois posibles están son de la forma Fq con q = pn .
iv) Pruébese que no todos los cuerpos de caracterı́stica positiva son finitos ( Hint: Muestra
un ejemplo.)
v) Pruébese que para cualquier primo no nulo p ∈ N y para cualquier n ∈ N existe un
cuerpo de Galois Fpn ( Hint: Revisad los Apuntes de la asignatura “Teorı́a de Galois”
que precede a este curso.)
Problema 80. Consideremos el ideal a := 3Z del anillo Z y el Z−módulo M = Z6 . Probad
que el Z/3Z−módulo M/aM es el espacio vectorial sobre Z/3Z dado como (Z/3Z)6 .
2.2. MÓDULOS, SUBMÓDULOS, MORFISMOS DE MÓDULOS 107
Problema 83. Completa los detalles de la prueba de la Proposición 2.2.36. ( Hint: Puedes
ayudarte de las caracterizaciones de producto y co-producto de módulos descritas en los dos
problemas precedentes).
Problema 84. Probad la siguiente variante del algoritmo de la división de Euclides:
Dados a, b ∈ N dos enteros positivos no nulos, existe q, r ∈ Z tales que:
i) a = qb + r,
ii) 0 ≤ |r| ≤ b/2.
Problema 85 (Morfismos de anillos y estructuras de anillos como R−módulos). Se
trata de probar que para dos anillos R y B, los morfismos de anillos entre R y B y las estructuras
de R−módulo sobre B que satisfacen la ropiedad (2.2.2) están identificadas. Definamos los
siguientes conjuntos:
i) El conjunto de todos los morfismos de anillo entre R y B:
M orf (R, B) := {f : R −→ B : h es morfismo de anillos}.
ii) El conjunto de todas las posibles estructuras de R−módulo sobre B que satisfacen
(2.2.2):
R−M od(B) := {∗R : R×B −→ B : B es R−módulo con la operación ∗R y satisface (2.2.2)}.
Definamos la transformación:
Φ : M orf (R, B) −→ R − M od(R, B)
f 7−→ ∗f ,
donde ∗f es la operación definida por la Identidad (85) de la lista de ejemplos dada en Ejemplo
2.2.2. Pruébese que Φ es una biyección entre esos dos conjuntos y, por tanto, que morfismos
entre anillos R y B es lo mismo que considerar estruturas de R−módulo sobre B que se portan
bien con respecto al producto de B. Las notaciones M orf (R, B) y R − M od(B) no se volverán
a usar y sólo sirven para clarificar la noción de R−álgebra.
Pruébese, finalmente, que:
Una R−álgebra es un anillo (A, +, ·) que posee una estructura de R−módulo (A, +, ·R ) y que
satisface la Identidad (2.2.1)
108 2. MÓDULOS, DETERMINANTES, HAMILTON-CAYLEY
ii) Probad que en el espacio topológio (R, T ) las siguientes son aplicaciones continuas:
−: R×R −→ R
(a, b) 7−→ a + (−b).
×: R×R −→ R
(a, b) 7−→ a · b.
iii) Probad que la siguiente es una base de entornos de 0 ∈ R para la topologı́a T :
{pn : n ∈ N}.
Probad, asimismo, que la siguiente es una base de entornos de cualquier punto x ∈ R:
{x + pn : n ∈ N}.
iv) Supongamos que la filtración p−ádica verifica la siguiente propiedad:
\
(2.2.3) pn = (0).
n∈N
Pruébese que en Z, el ideal primo p verifica la propiedad (2.2.3) del Problema anterior. Exten-
damos esta métrica al cuerpo Q mediante:
| · |p : Q −→ R
x |x|p
y 7−→ | xy |p := |y|p .
4Por lo visto en problemas anteriores, basta con ver que ∩∞ mn = (0) en K[[X]]
n=0
2.3. DETERMINANTE. TEOREMA DE HAMILTON-CAYLEY 111
Proposición 2.3.2. Si una matriz M ∈ Mn (R) es tal que posee una fila idénticamente nula
(i.e. todas sus coordenadas en esa fila son 0 ∈ R), entonces
det(M ) = 0, Perm(M ) = 0.
Demostración. Obvio por la propia definición de ambas funciones. En cada término
de la suma aparece un producto de elementos. En cada uno de esos productos aparece una
coordenada de cada fila. Al haber un 0 en cada uno de los productos, todos los productos son
nulos y, en consecuencia, la suma de todos ellos es nula.
la función
f (m1 , . . . , mi−1 , ·, mi+1 , . . . , mn ) : Mi −→ T
v 7−→ f (m1 , . . . , mi−1 , v, mi+1 , . . . , mn ),
es un morfismo de R−módulos.
2.3. DETERMINANTE. TEOREMA DE HAMILTON-CAYLEY 113
Nótese que se llama simétrica cuando su valor no se modifica tras permutar las coordenadas,
mientras que se llama alternada cuando preserva su valor para las permutaciones del subgrupo
alternado An (ver la definición de An en Proposición 2.3.8) y multiplica su valor por (−1) (i.e.
“cambia de signo”) cuando no lo son.
vn
donde
v1
..
. ∈ Mn (R),
vn
es la matriz cuyas filas son los elementos v1 , . . . , vn ∈ Rn .
ii) El permanente Permn es una función multi-lineal simétrica.
iii) Las siguientes funciones son multi-lineales simétricas:
(n)
Sk : Rn −→ R,
donde
(n)
X Y
sk (α1 , . . . , αn ) := αi .
S⊂[n],](S)=k i∈S
Se las denomina funciones simétricas elementales .
Demostración. Probaremos solamente el caso del determinante, las otras afirmaciones se
siguen por un argumento similar (caso del permanente) o son conocidas (caso de las funciones
simétricas elementales). Es bastante sencillo verificar que es multi-lineal: en cada monomio sólo
aparece una variable por fila con lo que, sacándola como factor común, podemos verificar que
es multi-lineal. Esto se verá con más detalle tras la Fórmula de Laplace. Veamos solamente que
es alternada. Para ello, dada σ ∈ Sn una permutación, podemos definir una transformación
entre matrices de Mn (R) consistente en permutar filas. Es decir, dada la matriz
M := (ai,j )1≤i,j≤n ,
definimos la matriz
Mσ := (aσ(i),j )1≤i,j≤n ,
obtenida permutando las filas de M conforme a las reglas que indique σ. Ahora para cada
σ ∈ Sn , consideremos la siguiente biyección de Sn en sı́ mismo
φσ : S n −→ Sn
τ 7−→ τ ◦ σ −1 .
Obsérse que el ı́ndice satisface I(φσ (τ )) = I(σ)I(τ ). Para concluir escribamos la expresión del
determinante:
X Yn X n
Y
det(M ) := I(τ ) ai,τ (i) = I(φσ (ρ)) ai,φσ (ρ)(i) ,
τ ∈Sn i=1 ρ∈Sn i=1
114 2. MÓDULOS, DETERMINANTES, HAMILTON-CAYLEY
donde simplemete hemos usado que φσ es biyectiva. Ahora, reescribiendo el valor de φσ ten-
dremos
X n
Y X n
Y
I(σ)I(ρ) ai,(ρ◦σ−1 )(i) = I(σ) I(ρ) aσ(t),ρ(t) = I(σ) det(Mσ ),
ρ∈Sn i=1 ρ∈Sn i=t
−1
donde hemos cambiado t = σ (i) en cada producto, concluyendo ası́ la prueba del enunciado.
Para más información sobre las funciones simétricas elementales, véase la Subsección de prob-
lemas 2.3.4.2.
Corolario 2.3.4. Sea A ∈ Mn (R) una matriz, λ ∈ R un elemento del anillo y sea M (λ, i) ∈
Mn (R) la matriz obtenida multiplicando la fila i de M por λ. Entonces,
det(M (λ, i))) = λ det(M ).
Demostración. Es consecuencia inmediata del hecho de ser det multilineal.
Corolario 2.3.5. Sea A ∈ Mn (R) una matriz, sea ρ ∈ Si una permutación y denotemos
por Aρ ∈ Mn (R) la matriz obtenida de A permutando sus filas mediante ρ. Es decir, si
A := (ai,j )1≤i,j≤n , la matriz Aρ viene dada mediante la siguiente identidad:
Aρ := (aρ(i),j )1≤i,j≤n .
Entonces, se tiene
det(Aρ ) = I(ρ) det(A).
Demostración. Es consecuencia inmediata del hecho de ser det alternada.
Corolario 2.3.6. El valor del determinante “cambia de signo” si se permutan dos filas. Esto
es, si M 0 ∈ Mn (R) es una matriz obtenida de otra matriz M ∈ Mn (R) tras permutar dos filas,
entonces,
det(M 0 ) = (−1) det(M ).
Demostración. Obvio por la Proposición precedente, dado que intercambiar dos filas es
aplicar una transposición σ = (r s) que tiene ı́ndice (−1).
Observación 2.3.7. Una forma inmediata de aplicar los resultados precedentes podrı́a ser
también la siguiente reflexión:
Sea R un anillo y supongamos que satisface la siguiente propiedad:
“El número entero 2 ∈ Z no es anulador de ningún elemento de un anillo R como Z−módulo.”
Una forma de interpretar esta propiedad, de modo equivalente, consiste en afirmar que para
cada a ∈ R, si a + a = 0, entonces a = 0.
Con esta propiedad, sea M ∈ Mn (R) una matriz tal que posee dos filas iguales. Supongamos
que las filas idénticas en M son las filas i y j. Definamos M 0 la matriz obtenida al intercambiar
las filas i y j de M . por los resultados precedentes tendremos:
det(M 0 ) = I((i j)) det(M ) = − det(M ).
Pero, obviamente, M 0 = M con lo que tendremos que
det(M ) = − det(M ).
Y nuestra hipótesis sobre R implicará que det(M ) = 0.
Esta propiedad para matrices con coordeanadas en anillos que satisfacen la hipótesis sugerida es
cierta, también, sin la hipótesis sobre la caracterı́stica de R. Es lo que se indica en la siguiente
proposición.
Proposición 2.3.8. Consideremos el morfismo de grupos dado por el ı́ndice de las permuta-
ciones:
I : Sn −→ Z× .
Se verifica:
2.3. DETERMINANTE. TEOREMA DE HAMILTON-CAYLEY 115
vi) Si las filas 1 y 2 de una matriz A son iguales, para cada σ ∈ An se tiene que
n
Y n
Y
ai,σ(i) = ai,Φ(σ)(i) .
i=1 i=1
vii) Si una matriz A tiene dos filas iguales, entonces, su determinante verifica det(A) = 0.
Demostración. Se deja como Problema 101.
Corolario 2.3.9. Sea dada una matriz M ∈ Mn (R) cuya fila i−ésima es dada por el elemento
u ∈ Rn y cuya fila j−ésima es el elemento v ∈ Rn . Sea M 0 la matriz cuyas filas k−ésimas
coinciden con las filas de M para k 6= i y tal que la fila k−ésima de M 0 es u + λv. Entonces,
det(M 0 ) = det(M ).
Demostración. Basta con recordar que det es multi-lineal. Por tanto,
det(M 0 ) = det(M ) + λ det(M 00 ),
donde M 00 es una matriz idéntica a M en todas las filas distintas de la fila i−ésima. pero en
la fila i−ésima M 00 tiene al elemento v ∈ Rn . Por tanto, M 00 tiene dos filas iguales y, por la
Proposición precedente, det(M 00 ) = 0, con lo que concluimos que det(M 0 ) = det(M ).
Proposición 2.3.10. Para cada matriz A ∈ Mn (R), se tiene que det(A) = det(At ). Más aún,
sea τ ∈ Sn una permutación de [n] y sean A ∈ Mn (R) una matriz y sea Aτ la matriz obtenida
de A aplicando la permutación τ a las columnas de A. Es decir, Dada A := (ai,j )1≤ij≤n , se
define
Aτ = ar,τ (s) 1≤r,s≤s ∈ Mn (R),
Entonces,
det(Aτ ) = I(τ ) det(A).
Demostración. Para la primera afirmación, baste con notar que la siguiente es una
biyección sobre el grupo simétrico que preserva el ı́ndice:
−1
: Sn −→ Sn
σ 7−→ σ −1 ,
donde σ −1 es la inversa de σ.
Para la segunda apliquemos el argumento a las matrices transpuestas y el Corolario 2.3.5. Más
explı́citamente, observemos que si At es la transpuesta de A y (At )τ es la matriz obtenida desde
la transpuestas de A permutando sus filas conforme a τ , entonces,
(At )τ = (Aτ )t ,
116 2. MÓDULOS, DETERMINANTES, HAMILTON-CAYLEY
Notación 2.3.11. Sean i, j ∈ [n] y consideremos el conjunto de las permutaciones que trans-
forman i en j, es decir,
Sn (i, j) = {σ ∈ Sn : σ(i) = j}.
Nótese que Sn (n, n) = StabSn (n) es el estabilizador de n por la acción del grupo simétrico Sm
sobre el conjunto [n] := {1, . . . , n}. Estudiaremos estos conjuntos que definen una partición de
Sn como unión disjunta dada del modo siguiente para cada i ∈ [n]:
n
[
Sn = Sn (i, j).
j=1
Observamos que τi,n ∈ Sn (i, n) admite la siguiente descomposición como producto de trans-
posiciones:
τi,n = (n n − 1) ◦ (n − 1 n − 2) ◦ · · · ◦ (i + 2 i + 1) ◦ (i + 1 i).
En particular, el ı́ndice de τi,n satisface
n−i n+i
I(τi,n ) = (−1) = (−1) ,
porque n − i y n + i son equivalentes módulo 2Z. En cuanto a su inversa, observamos que
r, si 1 ≤ r ≤ i − 1
−1
τi,n (r) := r + 1, si i ≤ r ≤ n − 1
i, si r = n
Lema 2.3.12. Con las anteriores notaciones, la siguiente es una biyección para cualesquiera
ı́ndices i, j ∈ [n]:
φi,j : Sn (n, n) −→ Sn (i, j)
−1
σ 7−→ τj,n ◦ σ ◦ τi,n .
Más aún, para cada σ ∈ Sn (n, n) el ı́ndice de φi,j (σ) satisface:
2n−(i+j)
I(φi,j (σ)) = (−1) I(σ) = (−1)i+j I(σ).
Demostración. La igualdad entre los ı́ndices se sigue, obviamente, del valor de los ı́ndices
de τi,n y τj,n . Es decir, por ser morfismo de grupos, el ı́ndice satisface:
−1 2n−(i+j)
I(φi,j (σ)) = I(τj,n )I(σ)I(τi,n ) = I(τj,n )I(σ)I(τi,n ) = (−1) I(σ).
En cuanto al hecho de ser una biyección, baste con observar, en primer lugar, que para todo
σ ∈ Sn (n, n), φi,j (σ) ∈ Sn (i, j). Pero esto es claro, dado que:
−1 −1 −1
φi,j (σ)(i) = τj,n (σ(τi,n (i))) = τj,n (σ(n)) = τj,n (n) = j.
2.3. DETERMINANTE. TEOREMA DE HAMILTON-CAYLEY 117
Por tanto, φi,j es una aplicación que posee inversa y la inversa satisface φ−1
i,j = ψi,j y es, por
tanto, biyectiva.
Lema 2.3.13. Con las anteriores notaciones, la siguiente aplicación es una biyección:
Φ : Sn (n, n) −→ Sn−1
σ 7−→ σ |[n−1] ,
donde σ |[n−1] es la restricción de σ a [n − 1] = {1, 2, . . . , n − 1}. Además, Φ preserva los
ı́ndices, esto es, I(Φ(σ)) = I(σ), ∀σ ∈ Sn .
Demostración. Es obvio, pero incluimos el detalle de la prueba para ayudar al lector en
su convicción. Lo primero que hay que observar es que Φ está bien definida. Es decir, que la
restricción σ |[n−1] es un elemento de Sn−1 . Esto es obvio porque σ ∈ Sn (n, n). Por tanto,
para todo r ∈ [n − 1], σ(r) 6= n y, por tanto, σ(r) ∈ [n − 1], luego se tiene una aplicación
inyectiva:
σ |[n−1] : [n − 1] −→ [n − 1].
Por ser inyectiva y ser [n − 1] de cardinal finito, concluimos que σ |[n−1] es biyectiva y σ |[n−1] ∈
Sn−1 . Que la aplicación Φ es inyectiva se sigue obviamente de su definción. Es decir, dadas
σ, σ 0 ∈ Sn (n, n), si Φ(σ) = Φ(σ 0 ), entonces,
σ(r) = σ |[n−1] (r) = σ 0 |[n−1] (r) = σ 0 (r), ∀r ∈ [n − 1].
Como, además, σ(n) = n y σ 0 (n) = n (porque ambas están en Sn (n, n)), concluimos que σ = σ 0
y que Φ es inyectiva. No es difı́cil verificar que la siguiente aplicación es la inversa de Φ:
Φ−1 : Sn−1 −→ Sn (n, n)
σ 7−→ σ
e,
donde
σ(r), si 1 ≤ r ≤ n − 1,
σ
e(r) =
n, si r = n.
Para la relación entre los ı́ndices, obsérvese que si τ ∈ Sn−1 es una transposición, entonces
τe ∈ Sn es también una transposición. Además, si σ ∈ Sn−1 admite una descomposición como
composición de transposiciones:
σ = τ1 ◦ τ2 ◦ · · · ◦ τr ,
r
tenemos que I(σ) = (−1) , mientras que
e = τe1 ◦ τe2 ◦ · · · ◦ τer ,
σ
es también una descomposición de σ e como composición de transposiciones, por lo que I(e
σ) =
r
(−1) , y se tiene la afirmación buscada.
Lema 2.3.14. Sea R un anillo y sea A ∈ Mn (R) una matriz de la forma siguiente:
a1,1 a1,2 ··· a1,n−1 a1,n
a2,1
a2,2 ··· a2,n−1 a2,n
.. .. .
A := . .
an−1,1 an−1,2 · · · an−1,n−1 an−1,n
0 0 ··· 0 an,n
Entonces,
det(A) = an,n det(An,n ),
118 2. MÓDULOS, DETERMINANTES, HAMILTON-CAYLEY
Ahora bien, por la forma de nuestra matriz, an,σ(n) = 0 para cualquier σ ∈ Sn (n, j) cuando
j 6= n. Por tanto, la última igualdad tiene la forma:
X n−1
Y
det(A) = an,n I(σ) ak,σ(k) .
σ∈Sn (n,n) k=1
Ahora procedemos como en el Lema 2.3.13 y esta última identidad puede escribirse también
mediante:
X n−1
Y
det(A) = an,n I(σ) a .
k,σ (k)
σ∈Sn (n,n) k=1 [n−1]
Lema 2.3.15. Sea R un anillo y sea A ∈ Mn (R) una matriz de la forma siguiente:
a1,1 ··· a1,i−1 a1,i a1,i+1 ··· a1,n
a2,1
· · · a2,i−1 a2,i a2,i+1 ··· a2,n
A := ... .. .
.
an−1,1 · · · an−1,i−1 an−1,i an−1,i+1 · · · an−1,n
0 ··· 0 an,i 0 ··· 0
Entonces,
det(A) = (−1)n+i an,i det(An,i ),
donde An,i ∈ Mn−1 (R) es la submatriz de A obtenida suprimiendo la fila n−ésima y la columna
i−ésima, esto es:
a1,1 ··· a1,i−1 a1,i+1 ··· a1,n
a2,1 ··· a2,i−1 a2,i+1 ··· a2,n
An,i := . ∈ Mn−1 (R).
.
.. ..
an−1,1 ··· an−1,i−1 an−1,i+1 ··· an−1,n
2.3. DETERMINANTE. TEOREMA DE HAMILTON-CAYLEY 119
−1
Demostración. Para comenzar, consideremos la permutación τ := τi,n definida más ar-
riba. Esto es, la permutación τ : [n] −→ [n] dada mediante la siguiente formulación:
s, si 1 ≤ s ≤ i − 1
τ (s) := s + 1, si i ≤ s ≤ n − 1
i, si s = n
−1
Sabemos que I(τ ) = I(τn,i ) = I(τn,i ) = (−1)n+i . Consideremos la matriz Aτ obtenida de
nuestra matriz A permutando las columnas de A mediante la permutación τ . Es un mero
ejercicio de comprobación el verificar que:
a1,1 ··· a1,i−1 a1,i+1 ··· a1,n a1,i
a2,1
··· a2,i−1 a2,i+1 ··· a2,n a2,i
τ
.. .. .
A := ai,τ (j) 1≤i,j≤n = . .
an−1,1 · · · an−1,i−1 an−1,i+1 · · · an−1,n an−1,i
0 ··· 0 0 ··· 0 an,i
Seguidamente, observamos (es una mera verificación), que se tiene la siguiente igualdad:
(Aτ )n,n = An,i ,
donde (Aτ )n,n es la submatriz de Aτ obtenida suprimiendo la fila n y la columna n. Aplicando
el lema precedente tendremos que
det(Aτ ) = an,i det((Aτ )n,n ) = an,i det(An,i ).
Finalmente, aplicando la Proposición 2.3.10, obtenemos que
det(A) = I(τ ) det(Aτ ) = I(τ )an,i det(An,i ) = (−1)n+i an,i det(An,i ),
como se pretende.
Proposición 2.3.16 (Fórmula de Laplace para la última fila). Sea A := (ai,j )1≤i,j≤n ∈
Mn (R) una matriz con n filas y n columnas y coordenadas en el anillo R. Entonces, se tiene
n
X
det(A) := (−1)n+i an,i det(An,i ),
i=1
donde An,i ∈ Mn−1 (R) es la submatriz de A obtenida eliminando la fila n−ésima y la columna
i−ésima.
Demostración. Consideremos, para cada i, 1 ≤ i ≤ n, las siguientes matrices obtenidas
a partir de la matriz A:
a1,1 ··· a1,i−1 a1,i a1,i+1 ··· a1,n
a2,1
· · · a2,i−1 a2,i a2,i+1 ··· a2,n
.. ..
Ai := . .
.
an−1,1 · · · an−1,i−1 an−1,i an−1,i+1 ··· an−1,n
0 ··· 0 an,i 0 ··· 0
Observamos que si en cada matriz Ai suprimimos su n−ésima fila y su i−ésima columna re-
obtenemos la matriz An,i . Esto es,
(Ai )n,i = An,i .
Finalmente, recordamos que det es una función multi-lineal por lo que tendremos que
X n
det(A) = det(Ai ).
i=1
Aplicando los Lemas predentes, concluimos que
det(Ai ) := (−1)n+i an,i det (Ai )n,i = (−1)n+i an,i det (An,i ) .
Y tenemos la prueba definitiva:
n
X
det(A) = (−1)n+i an,i det (An,i ) .
i=1
120 2. MÓDULOS, DETERMINANTES, HAMILTON-CAYLEY
Teorema 2.3.17 (Fórmula de Laplace). Sea A = (ai,j )1≤i,j≤n ∈ Mn (R) una matriz cuadrada
con coordenadas en el anillo R. Entonces, para cada i, 1 ≤ i ≤ n, tenemos:
n
X i+j
det(A) := ai,j (−1) det(Ai,j ),
j=1
donde Ai,j ∈ Mn−1 (R) es la matriz obtenida suprimiendo las filas i y j de la matriz A.
Demostración. Comencemos considerando la permutación τ = τi,n ∈ Sn introducida
anteriormente. Es decir, τ : [n] −→ [n] definida mediante:
r, si 1 ≤ r ≤ i − 1
τ (r) = τi,n (r) := n, si r = i
r − 1, si i + 1 ≤ r ≤ n
Recordemos que el ı́ndice de esta permutación verifica I(τ ) = I(τi,n ) = (−1)n+i . Consideremos
nuestra matriz A := (ai,j )1≤i,j≤n ∈ Mn (R) y consideremos la matriz Aτ obtenida a partir de
la matriz A permutando sus filas conforme a la permutación τ , es decir,
Aτ := (aτ (i),j )1≤i,j≤n .
Observamos la siguiente identidad:
a1,1 a1,2 ··· a1,j ··· a1,n
.. ..
. .
ai−1,1
ai−1,2 ··· ai−1,j ··· ai−1,n
Aτ := ai+1,1 ai+1,2 ··· ai+1,j ··· ai+1,n
.
. ..
..
.
an,1 an,2 ··· an,j ··· an,n
ai,1 ai,2 ··· ai,j ··· ai,n
Ahora, es un ejercicio de simple comprobación el verificar que el resultado de suprimir la fila
n−ésima y la columna j−ésima de la matriz Aτ es una matriz en Mn−1 (R) coincidente con la
submatriz Ai,j de la matriz A original, esto es,
(Aτ )n,j = Ai,j .
Aplicando la Proposición 2.3.16 a la matriz Aτ obtenemos:
X n Xn
det(Aτ ) = (−1)n+j aτ (n),j det (Aτ )n,j = (−1)n+j ai,j det (Ai,j ) .
j=1 j=1
Luego
n
X
det(A) = (−1)2n+i+j ai,j det (Ai,j ) ,
j=1
lo que prueba el enunciado.
Observación 2.3.19 (La Fórmula de Laplace no es un buen método para el Cálculo del
Determinante de una matriz). Aunque parezca una fórmula que potencialmente pudiera
servir para el cálculo de un determinante de una matriz n × n, la regla de Laplace no es
un buen algoritmo sino una buena presentación teórica del determinante de una matriz que
sirve para disponer de resultados teóricos relevantes sobre el comportamiento del determinante.
La principal dificultad es que, aún desarrollando el determinante por una fila o columna, el
número de operaciones aritméticas requeridas para calcularlo sigue el mismo patrón que el
uso de la definición directa: hay que hacer n! = ](Sn ) multiplicaciones. Nótese que tener
que hacer n! multiplicaciones para el cálculo de un determinante hace virtualmente imposible
calcular el determinante de una matriz de tamaño 100 × 100 ni por el ordenador ordenador más
potentes y rápido del mundo (se necesitarı́an hacer unas 100100 = 10200 operaciones, lo que es
completamente intratable con la informática imaginable (son más operaciones que el número
estimado de partı́culas del universo5). Tomando como ejemplo, la clasificación Top500 de 2018,
uno de los ordenadores más rápido del mundo podrı́a ser aún el ordenador Summit, IBM Power
System AC922 ), capaz de realizar unas 201 · 1015 operaciones (bit) por segundo. El cálculo
del determinante de una matriz 100 × 100 por la Definición o por el método que se sigue de la
Fórmula de Laplace tardarı́a más de 10180 segundos en terminar sus cálculos, lo que equivale a
más de 10160 millones de años.
En el caso de cuerpos, variantes del método original de C.F. Gauss (sean numéricas o exactas)
muestran que se puede triangular una matriz sin cambiar el valor del determinante. Ni este
método de Gauss, ni sus variaciones inmediatas, funcionan de modo adecuado cuando se trata de
cualquier anillo como se muestra en los Problemas 234 y 235. Por esa razón se han desarrollado
algoritmos eficientes para el cálculo con matrices cuyas coordenadas están en un anillo, que
son, ademś, los más eficientes para el cálculo cuando las coordenadas están en un cuerpo (y
sin hacer ningún tipo de pivoteo). Nótese que el famoso polinomio caracterı́stico de una matriz
M ∈ Mn (K) con coordenadas en un cuerpo es un ejemplo de determinante de una matriz cuyas
coordenadas no viven en un cuerpo sino en un anillo (ver la Subsección 2.3.3 siguiente para
las propiedades y definición del polinomio caracterı́stico). Por eso se han desarrollado técnicas
mucho más eficientes para el cálculo exacto del determinante de una matriz con coordenadas
en un anillo. En este curso presentaremos el método de Csanky-Leverrier-Fadeev-Souraiu en
la Subsección 5.4.3.1. Otros algoritmos clásicos de fácil comprensión son los algoritmos como
el propuesto por S.J. Berkowicz en [Berk, 1984] (el caso de los anillos Z y Z[X1 , . . . , Xn ]
está estudiado con precisión en [KrPa, 1996], por ejemplo). Desde entonces, algoritmos muy
eficientes han sido desarrollados. Resulta destacable el algortimo de V. Neiger y C. Pernet en
[NP, 21] que muestran un algoritmo muy eficiente para el cálculo del polinomio caracterı́stico
de una matriz, aunque su exposición resultarı́a excesiva en un curso como este. Una buena
fuente a actividad, donde se exponen los mejores algoritmos en términos de complejidad y
eficacia es el colectivo LinAlg (https://linalg.org/). No entraremos con detalle en estos
aspectos porque no corresponde a un curso como éste, no especialmente orientado al Álgebra
Lineal.
5No es una medida totalmente aceptable ni definitiva, pero podemos destacar una vieja estimación del
famoso divulgador I. Asimov quien estimó (en base a supuestos más que discutibles) que el número de nucleones
y electrones del universo es de unos 2, 2 · 1079 , cantidad que habrı́a que multiplicar por 2 si contamos la materia
oscura. Pero son estimaciones de juego intelectual sin mucho valor
122 2. MÓDULOS, DETERMINANTES, HAMILTON-CAYLEY
Definición 52 (Matrix Adjunta de una dada). Sea A = (ai,j )1≤i,j≤n ∈ Mn (R). Se define
la matriz adjunta de A como la matriz
t
Adj(A) := ((ci,j )1≤i,j≤n ) ∈ Mn (R),
donde
i+j
ci,j = (−1) det(Ai,j ).
Teorema 2.3.21 (Fórmula de Laplace Generalizada). Con las anteriores notaciones, para
cada matriz A = (ai,j )1≤i,j≤n ∈ Mn (R), se tiene:
A · Adj(A) = Adj(A) · A = det(A)Idn ∈ Mn (R),
donde Idn es la matriz identidad n × n.
Demostración. Para probarlo, bastará con que escribamos las dos matrices:
a1,1 a1,2 a1,3 · · · a1,n
a2,1 a2,2 a2,3 · · · a2,n
A := a3,1 a3,2 a3,3 · · · a3,n .
.. .. .. .
..
. . .
an,1 an,2 an,3 ··· an,n
Por su parte, después de transponer, tenemos
(−1)1+1 det(A1,1 ) (−1)2+1 det(A2,1 ) (−1)n+1 det(An,1 )
···
(−1)1+2 det(A1,2 ) (−1)2+2 det(A2,2 ) ··· (−1)n+2 det(An,2 )
1+3
det(A1,3 ) (−1)2+3 det(A2,3 ) (−1)n+3 det(An,3 )
Adj(A) := (−1)
··· .
.. .. ..
. . .
(−1)1+n det(A1,n ) (−1)2+n det(A2,n ) · · · (−1)n+n det(An,n )
Al mutiplicar tendremos AAdj(A) = (di,j )1≤i,j≤n ∈ Mn (R), donde
n
X
di,j = ai,k (−1)k+j det(Aj,k ).
k=1
Ahora, si i = j, tenemos que
n
X
di,i = ai,k (−1)k+j det(Ai,k ) = det(A),
k=1
conforme a la Fórmula de Laplace. En el caso i 6= j, tendremos que
n
X
di,j = ai,k (−1)k+j det(Aj,k ),
k=1
está relacionado con el determinante de una matriz M obtenida del modo siguiente:
• La fila j−ésima de M es la fila i−ésima de A: (ai,1 , ai,2 , . . . , ai,n )
• Las restantes filas de M son las filas de A.
2.3. DETERMINANTE. TEOREMA DE HAMILTON-CAYLEY 123
Obviamente, las matrices Mj,k = Aj,k y, usando la Fórmula de Laplace, obtenemos que
n
X
di,j = ai,k (−1)k+j det(Aj,k ) = det(M ) = 0,
k=1
porque M posee dos filas iguales: la fila i−ésima y la fila j−ésima. Por tanto, se tiene el
resultado enunciado.
Corolario 2.3.22. Si A ∈ Mn (R) es una matriz tal que det(A) ∈ R× es una unidad de R,
entonces, A es una matriz inversible y, además,
A−1 = det(A)−1 Adj(A) ∈ Mn (R).
El siguiente resultado se expone con una prueba bruta. Una alternativa correcta pasarı́a por
probar la Fórmula de Cauchy-Binet, pero igualmente este resultado resulta incómodo en la
mayorı́a de sus pruebas. Ası́ que he optado por poner la prueba más directa, sin apoyos, a la
espera de disponer de una prueba elegante e igualmente elemental, válida sobre cualquier anillo.
Teorema 2.3.23 (Determinante del producto de matrices). Sean A, B ∈ Mn (R) dos
matrices, entonces
det(AB) = det(A) det(B).
Demostración. Supongamos que las matrices A y B vienen dadas por la igualdad si-
guiente:
A := (ai,j )1≤i,j≤n , B := (bi,j )1≤i,j≤n , AB := (ci,j )1≤i,j≤n ,
donde
n
X
ci,j := ai,k bk,j .
k=1
Con estas notaciones, tendremos:
n n n
!
X Y X Y X
det(AB) = I(σ) ci,σ(i) = I(σ) ai,ki bki ,σ(i) .
σ∈Sn i=1 σ∈Sn i=1 ki =1
Afirmación. Con estas notaciones, sea k := (k1 , . . . , kn ) ∈ [n]n . Se verifican las propiedades
siguientes.
i) Si existen i, r ∈ [n] tales que i 6= r y ki = kr , entonces det(Mk ) = 0.
ii) En caso contrario, (si ki 6= kr para cada i, r ∈ [n] con i 6= r) la aplicación k ∈ Sn es
una permutación.
124 2. MÓDULOS, DETERMINANTES, HAMILTON-CAYLEY
Obsérvese que la matriz Mk se obtiene de M gk (i, r) mediante dos pasos de la operación “multi-
plicar una fila por una columna”:
• Primero, multiplicando la fila i−ésima de M gk (i, r) por ai,k ,
i
• para multiplicar después la fila r−ésima de la matriz resultante por ar,kr .
Aplicando dos veces el Corolario 2.3.4, concluimos que
det(Mk ) = ai,ki ar,kr det Mgk (i, r) .
Ahora bien, si i < r y si ki = kr se tiene que bi = br y la matriz Mgk (i, r) tendrı́a dos filas
iguales. Aplicando la Proposición 2.3.8 concluiremos que det M
gk (i, r) = 0 y, por tanto, si k
no es inyectiva, concluimos det(Mk ) = 0 como se enuncia en la afirmación.
Más aún, el determinante de las matrices Mρ viene dado por la siguiente identidad:
X n
Y
det(Mρ ) = I(σ) ai,ρ(i) bρ(i),σ(i) .
σ∈Sn i=1
Qn
Sacando el factor común i=1 ai,ρ(i) de todos los sumandos, este determinante también concide
con la siguiente cantidad:
n
! n
!
Y X Y
(2.3.4) det(Mρ ) = ai,ρ(i) I(σ) bρ(i),σ(i) .
i=1 σ∈Sn i=1
2.3. DETERMINANTE. TEOREMA DE HAMILTON-CAYLEY 125
Ahora, sea Bρ la matriz obtenida permutando las filas de B conforme a una permutación
ρ ∈ Sn (como en el Corolario 2.3.5). Como el determinante es una forma multi-lineal alternada
tendremos: !
X Yn
det(Bρ ) = I(σ) bρ(i),σ(i) = I(ρ) det(B).
σ∈Sn i=1
En consecuencia, la Igualdad (2.3.4) se transforma en
n
! n
!
Y Y
(2.3.5) det(Mρ ) = ai,ρ(i) det(Bρ ) = I(ρ) det(B) ai,ρ(i) .
i=1 i=1
(2.3.6)
X n
Y X n
Y
det(AB) = I(ρ) det(B) ai,ρ(i) = det(B) I(ρ) ai,ρ(i) = det(B) det(A),
ρ∈Sn i=1 ρ∈Sr i=1
Luego
n−1
X
degX (det ((AX )1,j )) ≤ max{ degX (Ar,σ(r) ) : σ ∈ Sn−1 } ≤ n − 1.
r=1
Finalmente, χA (X) es la suma de un polinomio mónico de grado n con otro polinomio de grado
a lo sumo n − 1 y, en consecuencia, χA (X) es un polinomio mónico de grado n.
Comencemos con una sencilla operación del anillo de polinomios R[X] sobre el R−módulo
Mn (R) de las matrices cuadradas con coordenadas en R.
Proposición 2.3.27 (La operación de R[X] sobre Mn (R)). Sea R un anillo y R[X] el anillo
de polinomios en una variable con coeficientes en R. Entonces, podemos definir una aplicación
externa del grupo aditivo (R[X], +) sobre Mn (R) mediante:
·R[X] : R[X] × Mn (R) −→ MP
n (R)
m
(p(X), M ) 7−→ p(M ) := i=0 ai M i ,
Pm
siendo p(X) := i=0 ai X i ∈ R[X].
Esta operación respeta la operación suma del grupo (R[X], +) sobre Mn (R):
Vamos a extender esta operación externa a un anillo no conmutativo con unidad, formado
por las matrices con coeficientes en Mn (R). Recordemos que (Mn (R0 ), +, ·) es un anillo no
conmutativo con unidad para cualquier anillo R0 . Si R es un anillo, y R0 = R[X] es el anillo
de polinomios en una variable con coeficientes en R, entonces (Mn (R[X]), +, ·) también es un
anillo, en general no conmutativo, con unidad. Además, como Mn (R0 ) es un R0 −módulo libre,
también podemos concluir que Mn (R[X]) es un R[X]−módulo libre de rango n2 .
Además, como R ⊆ R[X], tenemos un subanillo Mn (R) ⊆ Mn (R[X]). Por tanto, dado p(X) ∈
R[X] y M (X) ∈ Mn (R[X]) tiene sentido considerar las matrices
p(X)M (X) ∈ Mn (R[X]).
Para ser más precisos, si M := (ai,j (X))1≤i,j≤n , estas matrices producto son, en realidad, el
producto de matrices
p(X) 0 ··· 0 a1,1 (X) a1,2 (X) . . . a1,n (X)
0 p(X) · · · 0 a2,1 (X) a2,2 (X) · · · a2,n (X)
p(X)M (X) = . .
. . . . .
.. .. .. .. .. ..
0 0 ··· p(X) an,1 (X) an,2 (X) · · · an,n (X)
Podemos escribir:
p(X) 0 ··· 0
0 p(X) ··· 0
(p(X)Idn ) = . ,
.. ..
.. . .
0 0 ··· p(X)
y, además, este tipo de matrices diagonales verifica:
p(X)M (X) = (p(X)Idn )M (X) = M (X)(p(X)Idn ).
128 2. MÓDULOS, DETERMINANTES, HAMILTON-CAYLEY
El lector puede acudir al Ejemplo 1.4.4 pra refrescar ideas. Como en el caso del anillo de
polinomios, esta igualdad es consecuencia de aplicar la operación convolución en Mn (R)[X].Es
decir,
m
! n
n+m
X X X X
Mi X i Nj X j = M i X i Nj X j .
M (X) · N (X) =
i=0 j=0 k=0 i+j=k
Por lo discutido anteriormente, las matrices Idn X i conmutan con cualquier matriz en Mn (R[X]),
con lo que tendremos que tal expresión se corresponde con las propiedades distributivas en
Mn (R[X]):
X n+m
X X
Mi X i Nj X j = Mi Nj X i+j ,
M (X) · N (X) =
i+j=k k=0 i+j=k
lo que da la identidad descrita en (2.3.8). Pero debe tenerse en cuenta que, en esta “con-
volución”, el orden de multiplicación (Mi Nj ) importa, salvo que todas las matrices Mi y Nj
conmuten entre sı́, lo que es un caso excepcional. Es decir, el orden en el que aparecen los
factores en la Identidad (2.3.8) es relevante.
2.3. DETERMINANTE. TEOREMA DE HAMILTON-CAYLEY 129
Proposición 2.3.30 (La operación de Mn (R[X]) sobre Mn (R)). Con las anteriores nota-
ciones, definamos la correspondencia siguiente:
·Mn (R[X]) Mn (R[X])
Pm × Mn (R) −→ MP
n (R)
m
(M := i=0 Mi X i , A) 7−→ M (A) := i=0 Mi Ai .
Se tiene:
i) La anterior correspondencia define una operación externa de Mn (R[X]) sobre Mn (R)
que respeta la suma. Es decir,
∀M, N ∈ Mn (R[X]), ∀A ∈ Mn (R), (M + N )(A) = M (A) + N (A).
ii) Dicha operación extiende la operación externa de R[X] sobre Mn (R) descrita en la
Proposición 2.3.27 anterior: Es decir, dado p(X) ∈ R[X], consideremos p(X)Idn ∈
Mn (R[X]) y sea A ∈ Mn (R), entonces
(p(X)Idn ) ·Mn (R[X]) A = p(A),
donde p(A) es el valor del polinomio p ∈ R[X] en la matriz A ∈ Mn (R) como en la
Proposición 2.3.27 anterior.
Demostración. Ejercicio de comprobación
Observación 2.3.31. En La Proposición 2.3.27 observamos que la operación de R[X] sobre
Mn (R) se “porta bien” con respecto a la operación producto en R[X]. En esta nueva operación
debemos ser más cuidadosos: se necesita un hipótesis adicional sobre ciertos elementos en
Mn (R) que conmutan para el producto de matrices. Es lo que se destaca en la siguiente
Proposición, que hemos decidido escribir separadamente.
Proposición 2.3.32. Sean M (X), N (X) ∈ Mn (R[X]) y A ∈ Mn (R). Sea H(X) ∈ Mn (R[X])
dado mediante M (X)N (X) = H(X) (producto en Mn (R[X])). Supongamos que:
m
X n
X
M (X) := Mi X i , N (X) := Nj X j ,
i=0 j=0
con Mi , Nj ∈ Mn (R). Supongamos también que A conmuta en Mn (R) con los coeficientes de
N . Es decir, supongamos que
ANj = Nj A, ∀j, 0 ≤ j ≤ n.
Entonces, se veirifica:
H(A) = M (A) · N (A),
donde · es el producto en Mn (R).
Demostración. Daremos una prueba por simplicidad y por su implicación en el Teorema
de Hamilton-Cayley. Tenemos:
m
X n
X
M (X) := Mi X i , N (X) := Nj X j .
i=0 j=0
Luego
m
X n
X
M (A) := Mi Ai , N (A) := Nj Aj .
i=0 j=0
Entonces,
m
! n
m+n
X X X X
M (A)N (A) = M i Ai Nj Aj = M i Ai Nj Aj .
i=0 j=0 k=0 i+j=k
130 2. MÓDULOS, DETERMINANTES, HAMILTON-CAYLEY
Corolario 2.3.34. Sea R un anillo conmutativo con unidad, A ∈ Mn (R) una matriz y sea
N ⊆ Mn (R) el submódulo (como R−módulo) generado por todas las potencias de la matriz A:
N := Rh{An : n ∈ N}i.
Entonces, N es un R−módulo finitamente generado.
Demostración. Usando el Teorema de la División Euclı́dea por polinomios mónicos (Teo-
rema 1.4.15), usando que el polinomio caracterı́stico χA (X) ∈ R[X] es mónico de grado n, es
fácil concluir que para cualquier polinomio q(X) ∈ R[X], existe un polinomio r(X) ∈ R[X] de
grado a lo sumo n − 1 tal que q(A) = r(A). Esto permite concluir que
N := Rh{A0 , A1 , . . . , An−1 }i,
y N será un R−módulo finitamente generado.
Por tanto, χA (λ) = 0 para cualquier valor propio λ ∈ L de A en L. Todo lo que resta por ver
es que el número de raı́ces de un polinomio no nulo en un cuerpo es finito. Para ello, baste con
revisar la resolución del Problema 57.
Más aún, supongamos que el polinomo caracterı́stico χA (X) tiene la forma siguiente:
χ (X) := X n + an−1 X n−1 + · · · + a1 X + a0 ∈ R[X].
A
Problema 106. Igualmente al caso del Problema anterior, explica las dificultades que ves en
la operación del grupo aditivo (Mn (R[X]), +) sobre Mn (R) (según las Proposiciones 2.3.30 y
2.3.32) para que Mn (R) fuera un Mn (R[X])−módulo.
Problema 107. Revisa todas las pruebas de la Sección sobre el determinante (Sección 2.3) y
detecta las erratas que encuentres.
vii) Concluye que el Teorema Espectral no es, en general, cierto en caracterı́stica posi-
tiva( Hint: Para un “recordatorio” del Teorema Espectral ver:
http: // en. wikipedia. org/ wiki/ Spectral_ theorem . )
s1 := (B − D)(G + H) ∈ R
s := (A + D)(E + H) ∈ R
2
s3 := (A − C)(E + F ) ∈ R
(2.3.10) s4 := H(A + B) ∈ R
s5 := A(F − H) ∈ R
s6 := D(G − E) ∈ R
s7 := E(C + D) ∈ R
F1 = 1
F2 = 0F1 + 1
F3 = 1F1 + 1F2 + 0
F4 = 0F1 + 1F2 + 1F3 + 0
..
.
Fn = 0F1 + · · · + 1Fn−2 + 1Fn−1 + 0
Se pide:
i) Probar que si tenemos una sucesión recurrente lineal {an }n∈N de elementos del anillo
R, como las anteriores, entonces existen matrices C ∈ Mn×n (R) y una matriz columna
B tales que
a1 a1
.. ..
. := C . + B.
an an
ii) Pruébese que si {an }n∈N es una sucesión recurente lineal de elementos del anillo R,
entonces existe una matriz triangular inferior D ∈ GL(n, R) cuyos elementos de la
diagonal principal son todos 1 y tales que
a1
.. −1
. = D B,
an
donde B es el del item anterior.
iii) Usando el Problema precedente, pruébese que para cada n ∈ N, y para cualquier anillo
R, se pueden calcular los n primeros términos de una sucesión recurrente lineal ha-
ciendo O(n3 log2 n) operaciones aritméticas y ninguna división.
2.3.4.2. Sumas de Newton y Funciones simétricas elementales. Vamos a hacer
una serie de problemas relativos al cálculo con sumas de Newton que, más adelante (cf. Sub-
sección 5.4.3.1), nos servirá para justificar algoritmos eficientes para calcular determinantes y
polinomios caracterı́sticos. Supongamos R un dominio de integridad, K = qf (R) su cuerpo
de francciones (cf. la descripción en el Párrafo 3.2.0.1 del Capı́tulo siguiente) y K la clausura
algebraica de K. Sea
f (T ) := T n + a1 T n−1 + a2 T n−2 + · · · + a0
un polinomio mónico con coeficientes en R. Podemos factorizarlo mediante :
n
Y
f (T ) := (T − αi )
i=1
donde las races αi ∈ K son repetidas con su multiplicidad. Vamos a definir dos tipos de
funciones simétricas de las raı́ces de f . Denotemos por [n] := {1, . . . , n} :
• Las funciones simétricas elementales (cf. Teorema 2.3.3): Son las dadas mediante :
(n)
X Y
sk (α1 , . . . , αn ) := αi .
S⊂[n],](S)=k i∈S
En otras palabras,
ak := (−1)k sk (α1 , . . . , αn )
• Las sumas de Newton : Son definidas del modo siguiente :
n
(n)
X
Nk (α1 , . . . , αn ) := αik
i=1
Estos dos grupos de funciones simétricas tienen una forma de relacionarse conocida a partir de
Newton que vamos a analizar como una serie de problemas.
2.3. DETERMINANTE. TEOREMA DE HAMILTON-CAYLEY 135
Definición 54. Sea {X1 , . . . , Xn } una lista de variables, sea [n] := {1, . . . , n} y sea R un
anillo.
i) Para cada k, 0 ≤ k ≤ n definiremos el polinomio :
(n)
X Y
σk (X1 , . . . , Xn ) := Xi ∈ R[X1 , . . . , Xn ].
S⊂[n],](S)=k i∈S
(n)
Los llamaremos funciones simétricas elementales. Nótese que σ0 =1
ii) Para cada k ∈ N, definiremos los polinomios :
n
(n)
X
Nk (X1 , . . . , Xn ) := Xik ∈ R[X1 , . . . , Xn ].
i=1
(n)
Los llamaremos sumas de Newton. Nótese que N0 = n.
iii) Definamos la siguiente colección de polinomios auxiliares : Para k ≥ 1, m ≥ 0 :
n
(n)
X X Y
F :=
(k,m)
Xi Xjm .
j=1 S⊂[n],](S)=k,j6∈S i∈S
Escribamos :
(n) (n)
F(0,m) := Nm (X1 , . . . , Xn ).
Problema 114. Con las notaciones anteriores, pruébense las siguientes propiedades
i) Para cada k, 1 ≤ k ≤ n, se tiene :
(n)
F(k,0) = (n − k)σk (X1 , . . . , Xn )
ii) Para cada k, 1 ≤ k ≤ n, se tiene :
(n) (n) (n) (n)
σk (X1 , . . . , Xn )Nm (X1 , . . . , Xn ) = F(k,m) + F(k−1,m+1) .
iii) Además,
(n) (n) (n)
σ 0 Nm = F(0,m) .
(n) (n) (n)
σ k N0 = nσk .
iv) Para cada k ≥ 1,
(n) (n)
F(k−1,1) = kσk .
Problema 115. Con las notaciones anteriores, pruébese que se verifian las siguientes identi-
dades:
k
(n) (n) (n)
X
(−1)i σk−i Ni = F(k,0) .
i=0
Problema 116 (Newton). Con las notaciones anteriores, sea R un anillo cualquiera y supong-
amos que {1, 2, . . . , n} ⊆ R× . Pruébese que :
i) Para todo k, 1 ≤ k ≤ n :
k
!
(n) 1 X i+1 (n) (n)
σk = (−1) σk−i Ni .
k i=1
un esquema de evaluación sobre R que realiza O(n3 log2 n) operaciones aritméticas y tal que, a
partir de los datos :
1
{ Ni (α1 , . . . , αn ) : 1 ≤ k ≤ n, 1 ≤ i ≤ k},
k
calcula los coeficientes del polinomio
n
Y
(X − αi ).
i=1
CAPı́TULO 3
137
138 3. DIVISIBILIDAD EN ANILLOS: DIP’S, NOETHER Y DE’S. ALGORITMOS
Índice
3.1. Introducción: DIP’s, Noetherianos y Dominios Euclı́deos. 138
3.2. Dominios de ideales principales, propiedades elementales,
elementos primos e irreducibles. 139
3.2.0.1. Construcción: Cuerpo de Cocientes (o cuerpo de fracciones) de
un Dominio de Integridad 142
3.3. Anillos noetherianos: aplicación del pensamiento noetheriano a la
factorización en dominios de ideales pincipales. 143
3.4. Dominios Euclı́deos 147
3.4.1. Dominios Euclı́deos: Elementos básicos 147
3.4.2. Existencia de factorización en primos en dominios euclı́deos (Opcional) 151
3.4.3. Existen dominios de ideales principales que no son dominios euclı́deos:
Dedekind-Hasse (Opcional) 152
3.4.4. Ejercicios y problemas de las secciones 3.2, 3.3 y 3.4 156
3.4.4.1. Problemas sobre el Lema de Dickson. 158
3.4.4.2. Basissatz de Hilbert en K[X1 , . . . , Xn ] 159
3.5. Sobre la eficiencia del Algoritmo de Euclides en Z 159
3.5.1. Divisiones del algoritmo de Euclides en Z 159
3.6. Eliminación univariada clásica: la Matriz de Sylvester 162
3.6.1. Extensiones algebraicas (Resumen Opcional) 162
3.6.2. Cuerpos algebraicamente cerrados (Resumen opcional) 165
3.6.3. La matriz de Sylvester y el máximo común divisor en K[X] 168
3.6.3.1. Mutiplicar por un polinomio. 168
3.6.3.2. La matriz de Sylvester-Bézout 169
3.6.3.3. Resultante de Sylvester-Bézout 172
3.6.4. Resultante de Sylvester-Bézout y Eliminación: cuando los coeficientes están
en un anillo 172
3.6.5. Ejercicios y problemas de la Sección 3.5 177
3.6.5.1. Ecuación de Pell en el caso m = 2. 177
3.6.5.2. El algoritmo de Berlekamp 179
3.6.5.3. Teorema Pequeño de Fermat y Función de Euler 179
3.6.5.4. El Sistema Criptográfico RSA 180
Ejemplo 3.2.1. A partir de los Teoremas 2.2.18 y 1.4.39 anteriores, se tienen los siguientes
ejemplos:
i) El anillo Z es un dominio de ideales principales.
ii) El anillo K[X] es un dominio de ideales principales, cuando K es un cuerpo.
iii) El anillo Z[X] es un dominio de integridad, pero no es un anillo principal.
iv) El anillo K[X, Y ], cuando K es un cuerpo, es dominio de integridad pero no es anillo
principal. Para verlo, baste con ver que el ideal m := (X, Y ) no es un ideal principal.
Para verlo, baste con ver que si fuera un ideal principal, entonces, las variables X e
Y poseerı́an un divisor común no unidad. Pero, nótese que m es un ideal propio de
K[X, Y ] porque:
m := {f ∈ K[X, Y ] : f (0, 0) = 0}.
Finalmente, las variables X e Y no pueden tener un divisor no unidad común en
K[X, Y ]. Dejamos como ejercicio, verificar esta última condición.
v) El anillo cociente Z/6Z es un anillo principal, pero no es dominio de integridad.
Notación 3.2.2. Utilizaremos la notación x | y para indicar y ∈ (x) y diremos que x divide a
y.
Definición 56. Se dice que dos elementos a, b ∈ R en un dominio de integridad R son asociados
si (a) = (b) o, equivalentemente, si difieren en una unidad de R, es decir si existe u ∈ R× tal
que a = ub. Se denotará mediante a ∼ b.
Proposición 3.2.5. En dominios de ideales principales, toda familia F posee máximo común
divisor.
Demostración. Obvio.
Observación 3.2.6. Obsérvese que la noción de máximo común divisor antes descrita sólo tiene
sentido en el caso de que el ideal generado por F sea principal. Eso está garantizado cuando
R es dominio de ideales principales, pero no está garantizado en otros anillos, ni siquiera en
dominios de integridad. Si se trata de un ideal (F ) no principal, los elementos de F podrı́an
no tener máximo común divisor en el sentido recedente. Volveremos a este caso en el caso de
dominios de factorización única (en la Sección 6.2 siguiente). De todos modos, tomemos el anillo
R = K[X, Y ] de polinomios en dos variables con coeficientes en un cuerpo y consideremos el ideal
m = (X, Y ). Podemos tener una noción de divisor común de grado máximo de los elementos
X e Y . Ese polinomio serı́a el polinomio 1 y sus asociados en K[X, Y ]. Pero, como ya hemos
discutido, (1) 6= m = (X, Y ) y los elementos {X, Y } no poseen máximo común divisor en el
sentido precedente.
Un resultado clásico (sin cotas) proveniente de la obra precursora de É. Bézout (cf. [Béz, 1779])
es el siguiente, que Bézout probó para polinomios univariados con coeficientes “complejos”.
Sobre el caso de los enteros, se conoce un antecedente parcial en la obra de Claude Gaspard
Bachet (sieur de Méziriac)“Problèmes plaisants & délectables qui se font par les nombres”,
Lyons, France: Pierre Rigaud & Associates, 1624,1 donde el caso Z aparece reflejado como
Proposition XVIII, páginas 18-33:
Teorema 3.2.7 (Identidad de Bézout (sin cotas)). Sea R un dominio de ideales principales
y sea a1 , . . . , an ∈ R un conjunto finito de elementos. Sea h su máximo común divisor .
Entonces, existen x1 , . . . , xn ∈ R tales que
h = x1 a1 + · · · + an xn .
Demostración. Es obvio porque h es el máximo común divisor si y solamente si (h) =
(a1 , . . . , an ), con lo que se tiene que dar la propiedad indicada.
1https://www.bsb-muenchen-digital.de// web/web1008/bsb10081407/images/index.html?digID=
~
bsb10081407&pimage=38&v=100&nav=0&l=de
3.2. DIP-ELEMENTOS PRIMOS E IRREDUCIBLES 141
Teorema 3.2.8 (Identidad de Bézout (caso infinito)). Sea R un dominio de ideales prin-
cipales y sea F = {ai : i ∈ I} un conjunto cualquiera de elementos de R. Sea h su máximo
común divisor. Entonces, existe un conjunto finito J ⊆ I y existen {xi : i ∈ I} ⊆ R tales que
X
h= xj aj .
j∈J
es un ideal de R. Por tanto, por la propiedad iii), a está generado por un conjunto
finito de elementos {a1 , . . . , ar }. Pero, como a es una unión, para cada i, 1 ≤ i ≤ r, ha
de existir k(i) tal que ai ∈ ak(i) . Definamos m := max{k(1), . . . , k(r)} y observamos
que
∀i, 1 ≤ i ≤ r, ai ∈ am ,
3.3. ANILLOS NOETHERIANOS: FACTORIZACIÓN EN D.I.P.’S 145
Corolario 3.3.4. Los anillos principales son anillos noetherianos. Los cocientes de anillos
noetherianos por cualquiera de sus ideales son noetherianos.
Demostración. La primera de las afirmaciones es obvia, mientras que la segunda se sigue
de lo probado en la Proposición 2.2.28. Si a ( R es un ideal propio de un anillo noetheriano y
si R/a es el anillo cociente, los ideales del cociente R/a son de la forma b/a, donde b es ideal
de R y b ⊇ a. Como R es noetheriano, b es finitamente generado como ideal de R. Ahora,
si {b1 , . . . , br } es un conjunto finito de generadores de b como ideal de R, entonces las clases
módulo a dadas por {b1 + a, . . . , br + a} son un conjunto finito de generadores de b/a como
ideal de R/a. Esta última afirmación es de mera verificación y no tiene dificultades. Lo que
nos permite concluir que todo ideal de R/a es finitamente generado.
Ejemplo 3.3.5 (Ni todo anillo noetheriano es principal, ni todo anillo noetheriano
es dominio). Como veremos más adelante, no todos los anillos noetherianos son principales:
por ejemplo, los anillos de polinomios K[X1 , . . . , Xn ] son dominios noetherianos que no son
principales para n ≥ 2, como ya hemos visto (cf. la Subsección (de Problemas) 3.4.4.2 y el
Problema 135). Obviamente, no todo anillo noetheriano es dominio, como lo prueban los dos
anillos noetherianos Z/6Z y Q[X]/(X 2 − 1).
Ejemplo 3.3.6 (Hay anillos que no son noetherianos). Consideremos el anillo C 0 (R) de
funciones continuas sobre R. Consideremos el conjunto n ∈ N de los números naturales y para
cada n ∈ N, definamos el siguiente ideal:
an := {f ∈ C 0 (R) : f (i) = 0, ∀i ∈ N, i ≥ n}.
Es evidente que tenemos la cadena ascendente numerable de ideales siguiente:
a0 ⊆ a1 ⊆ · · · ⊆ an ⊆ an+1 ⊆ · · ·
La siguiente es una función continua fn+1 ∈ an+1 \ an :
1, si x ≤ n,
fn+1 (x) := −x + (n + 1), si n ≤ x ≤ n + 1,
0, si x ≥ n + 1.
Es claro que fn+1 ∈ an+1 , pero fn+1 (n) = 1 6= 0, con lo que fn+1 6∈ an . Esta cadena de
ideales es, por tanto, numerable y estrictamente creciente. Luego, C 0 (R) no verifica la CCA.
Por tanto C 0 (R) no es un anillo noetheriano y podemos concluir, por ejemplo, que en C 0 (R)
existen ideales que no son finitamente generados. Similares resultados son fáciles de obtener
para todos los anillos de la forma C k (R) para 1 ≤ k ≤ ∞.
146 3. DIVISIBILIDAD EN ANILLOS: DIP’S, NOETHER Y DE’S. ALGORITMOS
Observación 3.3.8 (Ideales maximales). Nótese que los elementos maximales m a los que
hace referencia el anterior corolario, satisfacen las siguientes dos propiedades:
• m ( R es un ideal propio de R.
• m es maximal entre los ideales propios de R, es decir, dado a ( R un ideal propio de
R, si m ⊆ a, entonces m = a.
Este tipo de ideales se denominan ideales maximales de un anillo y volveremos sobre ellos en
la Sección 4.2 del Capı́tulo 4.
irreducibles de R. Del mismo modo concluimos que y ha de ser un producto finito de unidades
e irreducibles de R. Pero, como p = xy concluirı́amos que p es también un producto finito de
unidades e irreducibles de R, con lo que m 6∈ S, llegando a contradicción con la hipótesis m ∈ S.
Por tanto, no pueden existir x, y ∈ R tales que p = xy con p - x y p - y. Luego p es irreducible
no trivial.
Teorema 3.4.4. Sea R un dominio de integridad. Si R posee alguna función euclı́dea definida
en él, entonces R es un dominio de ideales principales.
Demostración. Recordemos que todo subconjunto de Z acotado inferiormente posee
mı́nimo. El caso del ideal nulo (0) es obvio: es un ideal principal. Sea a un ideal de R,
a 6= (0), y consideremos el conjunto:
Sa := {φ(a) : a ∈ a, a 6= 0}.
Como φ(a) ≥ φ(0), para todo a ∈ R, a 6= 0, el conjunto Sa es un subconjunto de Z acotado
inferiormente. Por tanto, posee un mı́nimo. Sea n := min(Sa ) el mı́nimo de Sa .
3.4. DOMINIOS EUCLÍDEOS 149
Sea a ∈ a un elemento no nulo tal que φ(a) = n (existe porque n es un mı́nimo). Es claro
que (a) ⊆ a. Veamos que se verifica el recı́proco de esta inclusión. Sea b ∈ a otro elemento
cualquiera. Hagamos la división euclı́dea
b = qa + r, φ(r) < φ(a) = n.
Nótese que r ∈ a porque r = b + (−q)a ∈ a. Por tanto, si r 6= 0, φ(r) ∈ Sa . Pero φ(a) = n =
min(Sa ), luego no es posible que φ(r) ∈ Sa y la única posibilidad es que r = 0. En ese caso
tendremos que b = qa, luego a | b o, equivalentemente, b ∈ (a), con lo que habremos probado
la igualdad entre los ideales (a) y a.
r0 := a, r1 := b.
Para i ≥ 2, si ri−1 6 0, definamos ri como cualquier elemento que satisface:
=
ri ∈ rem(ri−2 , ri−1 ),
(i.e. ri es un resto euclı́deo de la división de ri−2 por ri−1 ). Si ri− = 0, definamos ri = 0. Se
tiene:
i) Para cada n ∈ N, a = (rn , rn+1 ). Es decir, el ideal a es invariante durante el proceso.
ii) Existe n ∈ N, tal que rn = 0 y rm ≥ 0 para cada m ≥ n.
iii) Sea m ∈ N dado mediante
m := max{n ∈ N : rn 6= 0}.
Entonces, rm := gcd(a, b).
Demostración. Veamos cada airmación:
• La afirmación i) dice que el ideal a no es modificado a lo largo del proceso, con lo que
se convierte en un invariante del algoritmo. Hagamos la prueba por inducción en n.
El caso n = 0 es obvio dado que a = (a, b) = (r0 , r1 ).
Supongamos ahora que el resultado es cierto para el casi n, es decir, sunpogamos
que a = (rn , rn+1 ). Ahora observamos que rn+2 ∈ rem(rn , rn+1 ). Por tanto, existe
qn+2 ∈ R tal que rn = qn+2 rn+1 + rn+2 . Pero esto implica inmediatamente que
rn ∈ (rn+1 , rn+2 ), con lo cual concluimos a ⊆ (rn+1 , rn+2 ). Pero esa misma identidad
nos indica que rn+2 = rn + (−qn+2 )rn+1 , con lo que rn+2 ∈ (rn , rn+1 ) = a y, por
tanto, (rn+1 , rn+2 ) ⊆ a.
• La propiedad ii) es inmediata por lo siguiente: tenemos una cadena descendente de
elementos de Z:
φ(r0 ) ≥ φ(r1 ) > φ(r2 ) > φ(r3 ) > · · · > φ(rj ).
Además, esta cadena descendente está inferiormente acotada porque φ(a) ≥ φ(0), para
todo a 6= 0. Entonces, ha de existir un k tal que rk = 0, como afirma la propiedad ii).
• La propiedad iii) es consecuencia inmediata de las dos anteriores. Dada la definición
de rm (que está bien definido por causa de ii)), y aplicando i) tendremos que rm+1 = 0
y
(a, b) = a = (rm , rm+1 ) = (rm , 0) = (rm ),
y se sigue que rm es el máximo común divisor de a y b por nuestra definición de
máximo común divisor en dominios de ideales principales.
Teorema 3.4.6 (Identidad de Bézout con cotas). Sea (R, φ) un dominio euclı́deo. Sean
a, b ∈ R dos elementos no nulos, y sea h su máximo común divisor.
i) Supongamos que la función euclı́dea φ verifica las propiedades siguientes:
(a) ∀a, b ∈ R, φ(a + b) ≤ φ(a) + φ(b),
(b) ∀a, b ∈ R, φ(ab) ≤ φ(a)φ(b),
(c) ∀a, b ∈ R, φ(ab) = φ(a)φ(b), ∀a, b ∈ R, ab 6= 0.
150 3. DIVISIBILIDAD EN ANILLOS: DIP’S, NOETHER Y DE’S. ALGORITMOS
Los dos casos del Teorema anterior se corresponden con los casos básicos R = Z (caso (i)) y
R = K[X] (caso ii)). Nótese que el caso de K[X] hace pensar que el grado (deg) se comporta
como un logaritmo de un valor absoluto que, sin embargo, es el que aparece en el caso de Z.
Esto se expresa mediante los siguientes Corolarios:
Corolario 3.4.7 (Bézout con cotas en Z). Sean a, b ∈ Z dos enteros no nulos, y sea h su
máximo común divisor. Entonces, existen x, y ∈ R tales que
h = xa + yb,
con
|x| ≤ |b|, |y| ≤ |a|.
Demostración. Basta con observar que el valor absoluto | · | verifica las condiciones indi-
cadas en el Teorema anterior.
Corolario 3.4.8 (Bézout con cotas en K[X]). Sean f, g ∈ K[X] dos polinomios univariados
no nulos y no unidades (i.e. f, g 6∈ K), y sea h su máximo común divisor.
Entonces, existen α, β ∈ K[X] tales que
h = αf + βg,
con
deg(α) < deg(g), deg(β) < deg(f ).
Demostración. Simplemente recordar (K[X], deg) como dominio euclı́deo.
• p = xy
• x 6∈ R× , y 6∈ R× ,
• x 6∼ p, y 6∼ p.
Esto significa que los siguientes contenidos son estrictos:
(p) $ (x) $ R, (p) $ (y) $ R.
En particular, φ(p) > φ(x) y φ(p) > φ(y) como consecuencia de esos contenidos estrictos. Luego
φ(x) 6∈ Sa , φ(y) 6∈ Sa .
Además, se tiene
(a) ⊆ (x), (a) ⊆ (y).
Por tanto, de las dos condiciones que definen Sa , φ(x) no puede satisfacer la primera de esas
condiciones “x no es producto finito de irreducibles y unidades”. Luego x es producto finito de
unidades e irreducibles. Y lo mismo pasa con y. Es decir,
x = uq1 q2 · · · qn , y = vt1 t2 · · · tm ,
×
donde u, v ∈ R y {q1 , q2 , . . . , qn , t1 , t2 , . . . , tm } son irreducibles en R. Pero, entonces, como
p = xy concluimos:
p = (uv)q1 q2 · · · qn t1 t2 · · · tm ,
y habremos concluido que p es producto finito de irreducibles y unidades. Luego la única opción
es que Sa = ∅ y, por tanto, a debe ser un producto finito de unidades e irreducibles.
√
−19
con a, b ∈ Z ese elemento. Entonces, dado el elemento 2 ∈ Z[ 1+ 2 ], u debe dividir a alguna
de las tres cantidades siguientes:
1 = 2 − 1, 2 = 2 − 0, 3 := 2 + (−1).
Como los divisores laterales universales no son unidades, podemos descartar que u | 1 y nos
quedamos con las otras dos posibilidades.
Definamos la función
h √ i
Φ√−19 : Z 1+ 2−19 −→ Z+
√
2
y 2
1+ −19
7−→ x + 2 − −19y
x+y 2 .
2
Nótese que se trata de multiplicar por el conjugado complejo y, por tanto, da lugar al módulo.
Esto es
√ √ √
√
1 + −19 1 + −19 1 + −19
Φ −19 x + y = x+y x+y ,
2 2 2
donde · significa conjugado complejo. Por tanto, Φ√−19 calcula el valor absoluto (el módulo)
del número complejo al que se le aplica y, en particular, es un entero positivo. Más aún, nótese
que
√
y 2 −19y 2
1 + −19
= x2 + xy + 5y 2 ∈ Z,
Φ√−19 x + y = x + −
2 2 2
es un número entero siempre que x e y sean enteros. Usaremos esta función y supongamos que
u | 2 o u | 3.
• Supongamos la primera opción: u | 2. Entonces, han de existir x, y ∈ Z tales que
√ √ √
1 + −19 1 + −19 1 + −19
u x+y = a+b x+y = 2.
2 2 2
pero, entonces,
√ √
1 + −19 1 + −19
Φ√−19 a + b Φ√−19 x + y = Φ√−19 (2) = 4.
2 2
Por tanto, el siguiente número entero es un divisor entero positivo de 4:
√
1 + −19
√
Φ −19 a + b = a2 + ab + 5b2 .
2
Pero eso sólo es posible si b = 0 (porque si b es un entero no nulo, a2 +ab+5b2 ≥ 5 > 4).
En el caso b = 0, necesaiamente u = a ∈ {±2}. Pero, si u es un elemento de
ese conjunto, por ser divisor lateral universal, debe ser divisor de alguno de los tres
elementos siguientes:
√ √ √
1 + −19 1 + −19 1 + −19
− 1, , + 1,
2 2 2
lo que no es posible en ningún caso.
• Supongamos la segunda opción: u | 3. Entonces, han de existir enteros x, y ∈ Z tales
que se da la siguiente igualdad:
√ √
1 + −19 1 + −19
a+b x+y = 3.
2 2
De nuevo, usando Φ√−19 , tendremos que
a2 + ab + 5b2 x2 + xy + 5y 2 = 9.
x
0 < Φ(u − v) < 1.
y
Como y - x, tendremos que existen a, b, c ∈ Z enteros, con c > 0 y gcd(a, b, c) = 1 tales que
√
x a + b −19
= .
y c
Distingamos varios casos:
• Supongamos c ≥ 5. Como gcd(a, b, c) = 1, existen d, e, f ∈ Z tales que
ae + bd + cf = 1.
√
Elijamos u = d + e −19 y el producto u xy tiene la forma siguiente:
√ √
√
x a + b −19 (ad − 19be) + (ae + bd) −19
u = d + e −19 = .
y c c
Luego, como ae + bd = 1 − cf , tendremos
√
√
x (ad − 19be) −19
u = + − f −19.
y c c
Como (ad − 19be), c ∈ Z, podemos aplicar el algoritmo euclı́deo en Z (modificado con
la condición descrita en el Problema 84 y tendremos:
(ad − 19be) = qc + r,
con 0 ≤ |r| ≤ 2c . Por tanto, queda:
√
√
x r −19
u =q+ + − f −19.
y c c
Esto nos lleva a
√
√
x r + −19
u − (q − f −19) = .
y c
√
Poniendo v = (q − f −19), tendremos:
√
x r + −19
u −v = ,
y c
con lo que queda solemente por probar que si c > 5, se tiene
√
r + −19 (r2 + 19) r2 19 1 19
Φ( )= 2
≤ 2 + < + < 1.
c c c 36 4 36
En el caso c = 5, tendremos r ≤ 2 y, por tanto,
√
r + −19 r2 19 4 19
Φ( )≤ 2 + < + < 1.
c c 25 25 25
Quedan sólo los caso c = 2, 3, 4. Veámoslos separamente.
• Si c = 2. Como gcd(a, b, c) = gdc(a, b, 2) = 1, es claro que a y b tienen distinta paridad
(ni ambos son pares, ni ambos son impares, simultáneamente), luego a − b − 1 ∈ 2Z.
Elijamos v dado por:
√ √ √
(a − 1) + b −19 (a − b − 1) 1 + −19 1 + −19
v= = +b ∈Z .
2 2 2 2
Elijamos u = 1 y tenemos
x 1
Φ(u − v) = Φ( ) < 1.
y 2
156 3. DIVISIBILIDAD EN ANILLOS: DIP’S, NOETHER Y DE’S. ALGORITMOS
Problema 122. Con las notaciones habituales, hay que realizar las siguientes tareas:
• Prueba que el ideal (1 − 3i, 3 − i) es un ideal principal
√ en el anillo de Gauss Z[i].
• Prueba las siguientes
√ relaciones
√ entre ideales de Z[ −5]:
i) (2, 1 + √−5) = (2, 1 − √−5),
ii) (3, 1 + −5) 6= (3, 1 − −5),
3.4. DOMINIOS EUCLÍDEOS 157
√ √
iii) (2, 1 + √−5) 6= (3, 1 + √−5),
iv) (2, 1 + −5) 6= (3, 1 − −5).
Problema 123. Sea R un dominio de integridad. Sean a, b, c ∈ R tales que (a, c) = R. Prueba
que (a, bc) = (a, b).
√ √ √
Problema 124. Prueba que 17 − 3 3 y 83 + 47 3 son asociados en Z[ 3].
√ √
Problema 125. Expresar 2 + 8 −5 como producto de irreducibles √ en Z[ −5]. ¿Es posible
hallar más de una expresión?. Intentar lo mismo con 6. ¿Es Z[ −5] dominio de factorización
única?, ¿será un dominio de ideales principales?.
√ √
Problema
√ 126. Prueba que 10 no es primo en Z[ 10] y probar que sı́ es irreducible. Concluir
que Z[ 10] no es un dominio de ideales principales.
Problema 127. Sea r ∈ Z \ {−2, 0} un entero y consideremos el polinomio:
f (X) := X 3 + rX + 1.
Sea R el anillo cociente Z[X]/(f ). Prueba que R es un dominio de integridad. Sea θ := X + (f )
la clase definida por el elemento X ∈ Z[X]. Prueba que θ ∈ R× .
Problema 128. Sea m ∈ Z un entero sin factores primos múltiples. Definamos la función:
√
φm : Q[ √ m] −→ Q,
a + b m 7−→ |a2 − mb2 |.
Nótese que √ √ √
φm (a + b m) = |(a + b m)(a − b m)|.
Prueba que se verifican las siguientes propiedades:
√
i) φm (Z[ m] ⊆ N,
ii) φm (x) = 0√⇐⇒ x = 0,
iii) ∀x, y ∈ Z[ m], φm (xy) = φm √(x)φm (y),
iv) φm (xy) ≥ φm (x), ∀x, y ∈ Z[ m], y 6= 0.
√ √
Problema 129. Sea φm y Z[ m] como en el problema anterior. Prueba que (Z[ m], φm ) es
un dominio euclı́deo si y solamente si se verifica la siguiente propiedad:
√ √
∀x, y ∈ Q, ∃a, b ∈ Z, tales que φm (x + y m) − (a + b m) < 1
Problema
√ 130. Prueba que si m ∈ Z es un entero negativo sin factores múltiples, entonces
(Z[ m], φm ) es dominio euclı́deo si y solamente si m ∈ {−2, −1}.
Problema 131 (Divisor Lateral Universal). Sea R un dominio de integridad que no es
cuerpo. Un elemento u ∈ R que no está en R× ∪ {0} se denomina divisor lateral universal en
R si verifica:
∀x ∈ R, ∃z ∈ R× ∪ {0}, tal que u | x − z.
Se pide probar las afirmaciones siguientes :
i) Si (R, φ) es un dominio euclı́deo, entonces posee divisor lateral universal. (Pista:
Elegir un elemento u ∈ R que minimice {φ(x) : x ∈ R, x 6∈ R× ∪ {0}}).
m es un entero sin factores múltiples, tal que m = 2, 3 mod 4 y m < −2, entonces
ii) Si √
Z[ m] no posee divisores√laterales universales y, en consecuencia, no existe ninguna
función euclı́dea sobre Z[ m]. (Pista: si hubiera divisor universal lateral,√entonces
tiene que ser divisor de alguno de los elementos 2 − 1, 2 + 0, 2 + 1 en Z[ m]. Los
√ {±2,√±3}.√ Pero ninguno de esos 4 elementos
únicos divisores laterales posible serán
divide a ninguno de los elementos m − 1, m, m + 1.)
Problema 132. Demuestra que si K es un cuerpo, el anillo de series de potencias formales
en una variable K[[X]] verifica las siguientes propiedades:
i) Los ideales de K[[X]] no nulos son de la forma (X k ), con k ∈ N ( Hint: Usa el orden
en cero discutido en el Problema 93).
ii) Concluye que K[[X]] es un dominio de ideales principales y un anillo noetheriano.
iii) Prueba que su único ideal maximal es el ideal m = (X).
iv) Describe la factoriación en primos de cualquier elemento de K[[X]].
v) ¿Admite K[[X]] una función euclı́dea?.
158 3. DIVISIBILIDAD EN ANILLOS: DIP’S, NOETHER Y DE’S. ALGORITMOS
Como ϕ y ψ son ceros de X 2 − X − 1 también lo serán de estas ecuaciones, con lo que podemos
concluir:
(3.5.2) ϕn − ϕn−1 − ϕn−2 = 0, ψ n − ψ n−1 − ψ n−2 = 0.
Ahora bien, para n = 0 y para n = 1 la identidad 3.5.1 se satisface:
ϕ0 − ψ 0 1−1
0 = F0 = √ = √ ,
5 5
√
1+ 5
√
1− 5
√
5
√
ϕ1 − ψ 1 2 − 2 2 2 5
F1 = √ = √ = √ = √ = 1.
5 5 5 5
Para n ≥ 1 tendemos, aplicando la hipótesis inductiva:
ϕn−1 − ψ n−1 ϕn−2 − ψ n−2 ϕn−1 + ϕn−2 ψ n−1 + ψ n−2
Fn = Fn−1 + Fn−2 = √ + √ = √ − √ .
5 5 5 5
Usando las identidades de 3.5.2 concluimos:
ϕn−1 + ϕn−2 ψ n−1 + ψ n−2 ϕn ψn ϕn − ψ n
Fn = √ − √ =√ −√ = √ .
5 5 5 5 5
EL siguiente resultado es un histórico debido a G. Lamé (cf. [Lm, 1844]) y conocido desde
1844.
Teorema 3.5.3 (Lamé, 1844). Sean a > b > 0 dos números enteros positivos, supongamos
que el algoritmo de Euclides, aplicado a a y b realiza n divisiones. Entonces,
Fn+1 ≤ a, Fn ≤ b.
Demostración. Comencemos considerando la sucesión de divisiones realizadas por el al-
goritmo de Euclides:
r0 = a,
r1 = b,
r0 = q1 r1 + r2 , 0 ≤ r2 ≤ r1 − 1,
.. ..
(3.5.3) . .
r = qi−1 ri−1 + ri , 0 ≤ ri ≤ ri−1 − 1,
i−2
.. ..
. .
rn−1 = qn rn + rn+1 , rn+1 = 0.
En la que se hacen n divisiones. Podemos revisar esta secuencia de divisiones, para hacer alguna
observación.
Es claro que se tiene:
r0 > r1 > r2 > r3 > · · · > rn−1 > rn > rn+1 = 0.
Es una cadena estrictamente decreciente y, en particular, rn 6= 0 porque, en otro caso, habrı́amos
hecho n − 1 divisiones. Pero, además, por ser decreciente, qi 6= 0 para todo i. Y es que si qi = 0
para algún i, tendrı́amos:
ri−1 = 0ri + ri+1 = ri+1 , 0 ≤ ri+1 < ri < ri−1 ,
lo que nos llevarı́a a contradicción. En particular, tenemos qi ≥ 1 para todo i.
3.5. EFICIENCIA Y ALGORITMO DE EUCLIDES 161
Corolario 3.5.4. Dados dos números enteros a, b ∈ Z, el número de divisiones necesario para
hallar el máximo común divisor de ambos está acotado linealmente por el número de dı́gitos
necesarios para escribir ambos números. Es decir, el número n de divisiones está acotado por
max{logc (|a|), logc (|b|)} + logc ( ϕ5 )
n≤ .
logc (ϕ)
donde logc es el logaritmo en base c.
Demostración. Si se hacen n divisiones, tenemos que Fn+1 ≤ max{|a|, |b|}. Para n ≥ 0,
se tiene que
ϕn+1
an+1 := √ ≥ Fn+1 ≥ F1 = 1.
5
Como an+1 ≥ 1 se tiene:
ϕn+1 1 ϕn+1 1 1 1 1 ϕn+1 ϕn+1
Fn+1 = b √ + c ≥ √ − = an+1 − ≥ √ an+1 = √ √ = .
5 2 5 2 2 5 5 5 5
Tomando logaritmos tenemos
(n + 1) logc (ϕ) − logc (5) ≤ log(Fn+1 ) ≤ max{logc (|a|), logc (|b|)},
Concluimos
1
(n + 1) ≤ (max{logc (|a|), logc (|b|)} + logc (5)) .
logc (ϕ)
Y, por tanto, tenemos
max{logc (|a|), logc (|b|)} + logc (5)
n≤ − 1.
logc (ϕ)
162 3. DIVISIBILIDAD EN ANILLOS: DIP’S, NOETHER Y DE’S. ALGORITMOS
max{logc (|a|), logc (|b|)} + logc (5) − logc (ϕ) max{logc (|a|), logc (|b|)} + logc ( ϕ5 )
n≤ = .
logc (ϕ) logc (ϕ)
Si g(ζ) = 0, entonces g(X) ∈ AnnK (ζ) = (IrrK (ζ)). Como IrrK (ζ) es un polinomio no nulo
de grado d, entonces IrrK (ζ) | g(X) y, necesariamente, G(X) es el polinomio nulo, con lo que
sus coeficientes han de verificar b0 = b1 = · · · = bd−1 = 0 que es lo mismo que afirmar que la
familia B es una familia libre y, por tanto, conluimos que B es una base de K(ζ).
Lema 3.6.5. Sea K ⊆ L una extensión de cuerpos y sea V un L−espacio vectorial de dimensión
finita. Entonces, si [L : K] < ∞, V es también un K−espacio vectorial de dimensión finita
sobre K.
Demostración. Es un resultado obvio. Es claro que L es un K−espacio vectorial. Ahora,
supongamos los siguientes dos conjuntos:
• Una familia finita de vectores B := {v1 , . . . , vm } que forman una base de V como
L−espacio vectorial.
• Una familia finita de elementos de L: β := {λ1 , . . . , λn } que forman una base de L
como K−espacio vectorial.
3.6. ELIMINACIÓN UNIVARIADA CLÁSICA: LA MATRIZ DE SYLVESTER 165
Entonces, basta con probar que el conjunto siguiente es un sistema generador de V como
K−espacio vectorial:
β · B := {λi vj : 1 ≤ i ≤ n, 1 ≤ j ≤ m}.
Proposición 3.6.7 (Teorema del Resto (aka Ruffini)). Sea R un dominio de integridad,
f ∈ R[X] un polinomio y sea ζ ∈ R. El resto de la división de f por (X − ζ) (conforme a lo
descrito en el Teorema 1.4.15) es el resultado de eveluar el polinomio f en el punto ζ, es decir
el resto de esa división es f (ζ) ∈ R. En particular, son equivalentes:
i) f (ζ) = 0,
ii) (X − ζ) | f en R[X].
Más aún, si R = K es un cuerpo, son equivalentes
166 3. DIVISIBILIDAD EN ANILLOS: DIP’S, NOETHER Y DE’S. ALGORITMOS
Ejemplo 3.6.12. El “Teorema Fundamental del Álgebra” (un Teorema de Análisis) dice que
C es un cuerpo algebraicamente cerrado. Por tanto, los elementos irreducibles de C[X] son los
dados mediante: [
{0} {a(X − ζ) : a ∈ C \ {0}, ζ ∈ C}.
Por la relación entre R y C es fácil deducir que los elementos irreducibles de R[X] son los dados
por la siguiente colección:
[ [
{0} {a(X − ζ) : a ∈ R \ {0}, ζ ∈ R} {a((X − b)2 + c2 ) ; a, c ∈ R \ {0}, b ∈ R}.
Además, C es la clausura algebraica de R. En el caso de Q es claro que Q no es un cuerpo
algebraicamente cerrado porque X 2 + 1 no posee raı́ces en Q. Por ejemplo, el polinomio
√ √
X 4 + 1 = (X 2 − 2X + 1)(X 2 + 2X + 1),
muestra que los irreducibles en Q[X] no tiene por qué ser irreducibles en R[X]. También
puede probarse que Q[X] posee elementos irreducibles de grado tan grande como se quiera. La
clausura algebraica Q de Q son los elementos de C algebraicos sobre Q, es decir,
Q = {ζ ∈ C : ∃f ∈ Q[X], f (ζ) = 0}.
En el caso de cuerpos finitos, consideremos la clausura algebraicas Fq de cualquier cuerpo finito
Fq , de cardinal q := pn , p := caract(Fq ) su caracterı́stica, con p ∈ N primo no nulo. Veamos
que Fq tiene cardinal infinito por el sencillo argumento siguiente:
Consideremos N \ pZ los números naturales que no son múltiplos de p. Consideremos, para
cada n ∈ N \ pZ, el polinomio X n − 1. Este polinomio es libre de cuadrados (no posee factores
múltiples o, equivalentemente, sus raı́ces son simples o, si se prefiere, su discriminante es no
nulo): como nX n−1 6= 0, porque p - n, el máximo común divisor de fn := X n −1 y fn0 := nX n−1
en Fq [X] es 1. Esto significa que no tiene raı́ces múltiples. Por tanto fn tiene n raı́ces distintas
para cada n ∈ N \ pZ. Como N \ pZ es un conjunto no acotado, el siguiente conjunto tiene
cardinal infinito:
{ζ : ∃n ∈ N \ pZ, ζ n − 1 = 0}.
Y es un conjunto cuyos elementos deben estar en Fq porque en la clausura algebraica todo
polinomio se escinde completamente. Luego la clausura algebraica de Fq tiene cardinal infinito.
168 3. DIVISIBILIDAD EN ANILLOS: DIP’S, NOETHER Y DE’S. ALGORITMOS
∃ζ ∈ K, f (ζ) = g(ζ) = 0?
Obviamente, lo natural serı́a resolver las ecuaciones f (X) = 0 y g(X) = 0 (es decir, hallar
sus raı́ces en K) y compararlas. Pero esto no es eficiente: calcular un cuerpo donde viven las
raı́ces de un polinomio requiere clacular su clausura normal (como en Teorı́a de Galois) y ese
es un problema de gran complejidad. Sin embargo, en el siglo XIX (incluso en el XVIII con
Bézout) ya sabı́an cómo responder a esa pregunta a través del máximo común divisor. Se tiene
el siguiente resultado clásico:
Lema 3.6.13. Dados dos polinomios f, g ∈ K[X] no nulos, son equivalentes:
i) ∃ζ ∈ K, tal que f (ζ) = g(ζ) = 0.
ii) Existe un cuerpo L que extiende a K y existe un elemento ζ ∈ L algebraico sobre K
tal que g(ζ) = f (ζ) = 0.
iii) Si h es un máximo común divisor de f y g en K[X], entonces deg(h) ≥ 1.
Demostración. La equivalencia entre i) y ii) se sigue de la propia noción de clausura
algebraica. Queda , por tanto, le equivaencia entre i) y ii): Para la implicación i) =⇒ ii),
considérese que existe ζ ∈ K tal que f (ζ) = 0 y g(ζ) = 0. Consideremos el siguiente conjunto
a ⊆ k[X] dado mediante:
a := {p(X) ∈ K[X] : p(ζ) = 0}.
Es sencillo comprobar que a es un ideal de K[X]. Además, no es el ideal nulo (i.e. a 6= (0))
porque, como hemos indicado más arriba, todos los elementos de K son algebraicos sobre K.
Esto significa que, como ζ es algebraico sobre K, existe un polinomio no constante p ∈ K[X]
tal que p(ζ) = 0. Luego p ∈ a 6= (0) y, adicionalmente, a 6= (1), porque 1 no se anula en ζ. En
conclusión, a es un ideal propio de K[X] es un dominio de ideales principales, a = (h) es un
ideal principal no nulo y distinto del total. En términos de extensiones de cuerpos, el generador
h es el polinomio mı́nimo de ζ sobre K o, con otras notaciones, h = IrrK (ζ) ∈ K[X]. Como
f (ζ) = g(ζ) = 0, entonces, f, g ∈ a y, por tanto, h | f y h | g y h es no constante. Por tanto,
deg(gdc(f, g)) ≥ 1 y habremos terminado.
Para la implicación iii) =⇒ i), sea h = gcd(f, g) y supongamos deg(h) ≥ 1 (es decir, h no es
constante). Como K es un cuerpo algebraicamente cerrado, todo polinomio no constante posee,
al menos, una raı́z. Es decir, existe ζ ∈ K tal que h(ζ) = 0. Como h es el máximo común
divisor de f y g, h | f y h | g, obviamente se tiene f (ζ) = 0 y g(ζ) = 0 como indica la propiedad
(1).
dado mediante:
ρf (g) := f g.
Se tiene:
Proposición 3.6.14. La aplicación ρf : K[X]m −→ K[X]m+d es una aplicación lineal que,
en las respectivas bases monomiales ({1, X, X 2 , . . . , X m } para K[X]m y {1, X, X 2 , . . . , X d+m }
para K[X]d+m ), viene dada por la matriz Sm+1 (f ) ∈ M(d+m+1)×(m+1) (K) (i.e. m + d + 1 filas
y m + 1 columnas), dada mediante la expresión siguiente:
a0 0 ··· 0
a1 a0 ··· 0
.. .. ..
. .
.
. . .
ad ad−1 · · · ad−m
Sm+1 (f ) := .
0
ad · · · ad−m+1
0
0 · · · ad−m+2
. .. . ..
. .
. . . .
0 0 ··· ad
Demostración. Supongamos que las coordenadas de un polinomio g ∈ K[X]m en la base
monomial {1, X, X 2 , . . . , X m } son dadas mediante la lista (z0 , z1 , . . . , zm ). En otras palabras,
estamos diciendo que
g = z0 + z1 X + z2 X 2 + · · · + zm X m .
Ahora multiplicamos
f g := c0 + c1 X + c2 X 2 + · · · cm+d X m+d ,
donde X
ck := ai zj .
i+j=k
Escrita esta expresión en forma matricial (suponiendo d ≥ m por simplicidad de la expresión)
tendremos:
···
a0 0 0 c0
a1 a0 ··· 0 c1
.. .. . ..
. . .
.
. . . .
am
am−1 · · · a0 z0
cm
am+1
am ··· a1 z1 cm+1
.. .. .. .. z2 ..
. . . . = .
.. .
ad
ad−1 · · · ad−m .
cd
0
ad · · · ad−m+1 zm
cd+1
0
0 · · · ad−m+2
cd+2
. . . . .
.. .. .. .. ..
0 0 ··· ad cd+m
Ahora, aplicamos el mismo argumento usado en la Identidad de Bézout con cotas para K[X]
(Corolario 3.4.8). Tomamos p1 := rem(P1 , g), el resto de la división de P1 por g, supongamos
P1 = Q1 g + p1 , con deg(p1 ) ≤ deg(g) − 1 = n − 1 y escribimos
p := p1 f + (P2 + Q1 f )g.
Denotemos por p2 := (P2 + Q1 f ) y el mismo argumento uado en el Corolario 3.4.8 nos dará
deg(p2 ) ≤ deg(f ) − 1 = m − 1. Por tanto, tendremos:
p := p1 f + p2 g = φf,g (p1 , p2 ) ∈ Im(φf,g ),
lo que prueba el otro contenido y completa la prueba de iii).
La propiedad iv) es evidente a partir de la pa prueba del Teorema 3.4.4. COmo K[X] es un
dominio euclı́deo con deg, el máximo común divisor de dos polinomios no nulos f, g ∈ K[X] es
el polinomio no nulo de menor grado en el ideal (f, g). Por iii) los elementos de Im(φf,g ) son
los polinomios de grado menor o igual que m + n − 1 que están en el ideal (f, g). Por tanto, el
polinomio no nulo de menor grado en Im(φf,g ) tiene que ser necesariamente gcd(f, g).
Para la propiedad v) hagamos una pequeña construcción: Supongamos que h = gcd(f, g) es un
polinomio de grado k. Consideremos ahora la familia de polinomios en Im(φf,g ):
β := {h, Xh, X 2 h, . . . , X m+n−1−k h} ⊆ Im(φf,g ).
Todos los elementos de β son múltiplos del máximo común divisor de f u G, por tant, están en
el ideal (f, g). Como, además, es claro que el grado de todos los elementos de β está acotado
por m+n−1, la propiedad iii) nos dice que son elementos de Im(φf,g ). Más aún, los polinomios
de esta familia verifican deg(X i h) = i + k. Es decir, son todos polinomios de grado distinto y
sus grados van desde k (grado de h) hasta m + n − 1 (grado de X m+n−1−k h). Por tanto, si los
escribimos como vectores por sus coeficientes en la base monomial de K[X]m+n−1 observamos
que esas coordenadas determinan una matriz triangular. Es decir, los elementos de la colección
β son linealmente independientes sobre K. Como tenemos una familia de m + n − k polinomios
linealmente independientes sobre K en Im(φf,g ), concluimos
(3.6.1) dim(Im(φf,g )) + deg(h) = dim(Im(φf,g )) + k ≥ m + n.
De otro lado, consideremos la familia β 0 := {1, X, . . . , X k−1 } de elementos en K[X]m+n−1 .
Estos vectores son claramente linealmente independientes en K[X]m+n−1 y designemos por W ⊆
K[X]m+n−1 el K−subespacio vectorial que generan. Obviamente, dim(W ) = k. Observamos
que
(3.6.2) Im(φf,g ) ∩ W = (0).
Esto es consecuencia de iv): si hubiera un polinomio no nulo en W y en Im(φf,g ), serı́a un
polinomio de grado a lo sumo k − 1 en Im(Φf,g ) y eso no es posible porque el grado de h es k.
En conclusión, estamos en presencia de una suma directa de subespacios (i.e. W ⊕ Im(φf,g ) =
W + Im(φf,g )). Por el Tercer Teorema de Isomorfı́a, combinado con la noción de dimensión en
espacios vectoriales de dimensión finita, tendremos
dimK (W + Im(φf,g )) + dimK (W ∩ Im(φf,g )) = dim(W ) + dimK (Im(φf,g )) .
Por la Desigualdad (3.6.1) y la Igualdad (3.6.2) concluimos
dimK (W + Im(φf,g )) + 0 = k + dimK (Im(φf,g )) ≥ k + (m + n − k) = m + n.
Por tanto, W + Im(φf,g ) = K[X]m+n−1 y se tendrá:
m + n = dimK (W + Im(φf,g )) = k + dimK (Im(φf,g )) ,
que demuestra la afirmación v) del enunciado.
i) ResX (f, g) está en el ideal contracción a R del ideal (f, g) generado por f y g en
R[X]. Es decir, ResX (f, g) ∈ (f, g)c = (f, g) ∩ R. Se suele denomiar a ResX (f, g) el
elemento elminante del ideal (f, g) en R. Si, a su vez, R es un anillo de polinomios
con coeficientes en un cuerpo, se le denomina “polinomio eliminante en una variable”.
ii) Si ResX (f, g) ∈ R× es una unidad en R, entonces el ideal (f, g) = R[X].
iii) Si uno de los polinomios es mónico, entonces (f, g) ∩ R[X]m+n−1 = Im(Sf,g ). En este
caso, si R es dominio de integridad, (f, g) = R[X] si y solamente si ResX (f, g) ∈ R× .
Demostración. Los resultados son muy similares al caso K[X] (Teorema 3.6.16), con el
debido cuidado al tener coeficientes en un anillos R y no en un cuerpo.
i) Para este resultado recuérdese la Fórmula de Laplace Generalizada (Teorema ??) y
sea Adj(S) la matriz adjunta de la matriz de Sylvester SylvX (f, g) ∈ Mm+n (R).
Tendremos que
ResX (f, g)Idn+m = det (SylvX (f, g)) Idn+m = SylvX (f, g)Adj(S).
Supongamos que, descrita por columnas, la matriz adjunta toma la forma:
c1,1 c1,2 ··· c1,n+m
c2,1 c2,2 ··· c2,n+m
Adj(S) := . .
. . ..
.. .. .. .
cn+m,1 cn+m,2 · · · cn+m,n+m
Tendremos, en particular, que las primeras columnas verifican:
ResX (f, g) c1,1
0 c2,1
= SylvX (f, g) .. .
..
. .
0 cn+m,1
Consideremos ahora los dos polinomios siguientes:
h1 := c1,1 + c2,1 X + · · · + cm,1 X m−1 ∈ R[X]m−1 ,
o, equivalentemente,
ResXn (f, g) ∈ K× =⇒ ¬ [∃x ∈ Kn , f (x) = g(x)) = 0] .
Finalmente, supongamos que f y g son mónicos con respecto a la variable Xn , y si suponemos
que ResXn (f, g) 6∈ K× (es decir ResXn (f, g) es o bien el polinomio nulo o bien un polinomio no
constante). Como K es un cuerpo algebraicamente cerrado, entonces existe ζ 0 ∈ Kn−1 tal que
ResXn (f, g)(ζ) = 0. Por el enunciado del Problema 160, ha de existir un punto ζ 0 ∈ Kn−1 tal
que ResXn (f, g)(ζ 0 ) = 0. Como f y g son mónicos con respecto a Xn sabemos que πn (V1 ∩ V2 )
es el conjunto de ceros en Kn−1 de ResXn (f, g). En ese caso, V1 ∩ V2 6= ∅ (la proyección del
vacı́o es el vacı́o). Por tanto, hemos probado que, si f y g son mónicos con respecto a la variable
Xn , se tiene:
ResXn (f, g) 6∈ K× ⇐⇒ ∃ζ ∈ Kn , f (ζ) = g(ζ) = 0.
√ ×
v) En las condiciones
√ del item precedente, concluir que si λ ∈ Z[ 2] es una unidad y si
1 ≤ λ < 1 + 2, entonces λ = 1.
Problema 140 (Ecuación de Pell en el caso m = 2. Parte II). Con las notaciones del
problema precedente, se pide:
√ √
i) Probar que si λ ∈ Z[ 2], 1 < λ < 1 + 2 y si λσ(λ) = −1, entonces
√
−1 < σ(λ) < 1 − 2.
√ √
ii) Con las condiciones del item precedente, concluir que si λ ∈ Z[ 2], 1 < λ < 1 + 2 y
λσ(λ) = −1, entonces
λ + σ(λ)
0< < 1,
2
y, por tanto, este caso no es posible. √ √
iii) Concluir que no hay unidades
√ × λ ∈ Z[ 2]× tales que 1 < λ < 1 + 2.
iv) Probar que si λ ∈ Z[ 2] es una unidad tal que λ > 1, entonces, existe un único
número natural n ∈ N positivo tal que
√ n √ n+1
1+ 2 ≤λ< 1+ 2 .
√ m √ √
v) Probar que { 1 + 2 : m ∈ Z} ⊆ Z[ 2]× . Concluir que si λ ∈ Z[ 2]× es una
unidad tal que λ > 1 y si n es el exponente del item precedente, entonces
λ √
1 ≤ η := √ n < 1 + 2 ,
1+ 2
√
y, η ∈ Z[ 2]× . √
vi) Concluir que si λ√∈ Z[ 2]× es una unidad y si λ > 1, entonces, existe un único n ∈ N
n
tal que λ = 1 + 2 .
Problema 141 (Ecuación de Pell en el caso m = 2. Parte III). Con las notaciones del
problema precedente, se pide:
√
i) Probar que si λ ∈ Z[ 2]× es una unidad y si 0 √< λ < 1, entonces 1/λ es una unidad
que satisface 1/λ > 1. Concluir que si λ ∈ Z[ 2]× es una unidad y si 0 < λ < 1,
entonces existe n ∈ N positivo tal que
√ −n
λ= 1+ 2 .
√ √
ii) Probar que si λ ∈ Z[ 2]× es una unidad y si −1 < λ < 0, entonces −1/λ ∈ Z[ 2]× y
−1/λ > 1. Concluir que, en este caso, existe n ∈ Z tal que
√ n
η =− 1+ 2 .
√
iii) De modo análogo al item precedente, probar que si si λ ∈ Z[ 2]× es una unidad y si
λ < −1, entonces existe n ∈ Z tal que
√ n
η =− 1+ 2 .
√
iv) Concluir la siguiente igualdad que caracteriza las unidades de Z[ 2]× :
√ √ n
Z[ 2]× := {± 1 + 2 : n ∈ Z}.
Problema 150 (Teorema Pequeño de Fermat (versión débil)). Probar la siguiente afir-
mación:
Sea p ∈ N un número primo y n ∈ N un número natural, entonces
φ(pn ) = pn − pn−1 .
Probar, como consecuencia el teorema Pequeño de Fermat:
Dado n ∈ N un número primo, n ≥ 2. Entonces, para cada x ∈ Z/nZ \ {0}, se tiene :
xn−1 ≡ 1 mod n.
Verifica que esta propiedad no caracteriza a los números primos. Desgraciadamente hay más
números que los números primos verificando esta propiedad. Son los llamados números de
Carmichael. El más pequeño número de Carmichael conocido que no es primo es 561. Prueba
que no es primo y sı́ verifica la condición del Teorema Pequeño de Fermat. Busca información
adicional sobre los números de Carmichael en Wikipedia e incorpóralo al Problema.
Problema 151 (Teorema Pequeño de Fermat (versión fuerte)). Prueba el siguiente
enunciado usado por [Pr, 1975]:
Un número natural n ∈ N, n ≥ 2 es un número primo si y solamente si una cualquiera de las
siguienets condiciones son equivalentes :
i) (Z/nZ)× es un grupo cı́clico de orden n − 1,
ii) La ecuación X n−1 − 1 posee una raı́z primitiva en el anillo Z/nZ.
Problema 152. Prueba que la función de Euler satisface: φ(1) = 1 y para n ≥ 2 se tiene:
X
φ(m) = n
m|n
Problema 153 (La función de Euler es multiplicativa). Prueba que la función de Euler
es multiplicativa. Es decir, dados n, m ∈ N, n, m ≥ 2 dos números naturales coprimos (i.e.
gcd(m, n) = 1), entonces
φ(nm) = φ(n)φ(m).
Concluir que si p y q son dos primos no nulos y distintos en Z, entonces
φ(pq) = (p − 1)(q − 1).
Hint: usa el teormea de los Chinos sobre Z (visto en Introducción al Lenguaje Matemático) o
la versión más avanzada en Teorema 5.2.2.
3.6.5.4. El Sistema Criptográfico RSA. Lo que sigue es una serie de problemas que
explican el funcionamiento interno del sistema criptográfico RSA a través de una serie de sen-
cillos problemas (cf. [RSA, 1978]).
Problema 154 (RSA: Definición de Clave Pública). Se trata de suponer una red de
usuarios (tipo internet o cualquier red social) que ponen a disposición de todo el mundo una
clave pública. Si los mimebros de esa red son los elementos de un conjunto I, cada individuo
publicará una clave pública Ni que será visible para todo miembro de la red. El siguiente proceso
determina como un individuo i prepara su clave pública Ni := (n, e).
• El individuo i elige dos números primos grandes que ólo él conoce y que denotaremos
por p y q. Para ello usará distintos Tests de Primalidad disponibles en el mercado.
• El individuo prepara su clave pública n := pq, pero se reserva el coocimiento de p y
q. Adicionalmente, calcula la función de Euler φ(n) = (p − 1)(q − 1). Prueba que
existen primos p y q tales que p < q < 2p, para p suficentemente grande. Pruébese que
n y φ(n) son co-primos en este caso. El valor de la función de Euler φ(n) se oculta
provisionalmente para preparar las claves.
• Seguidamente el individuo halla un elemento e ∈ N tal que 1 < e < φ(n) y tal que
gcd(e, φ(n)) = 1. Pruébese que ese elemento e existe.
• Pruébese que, en el caso p < q < 2p, el resto e de la división de n por φ(n) puede ser
elegido para ese propósito. Pruébese que ese resto vale e = p + q − 1. Nótese que, sin
embargo, eligiendo e como ese resto, cualquier agente de la red pública descubrirá los
mensajes que se envı́en hacia el miembro que haya elegido e como clave.
3.6. ELIMINACIÓN UNIVARIADA CLÁSICA: LA MATRIZ DE SYLVESTER 181
El individuo i de clave (ni , ei ) quiere enviar un mensaje M cifrado y firmado al individuo j (de
clave (nj , ej )). Procede como sigue:
• Calcula la siguiente cntidad que sólo él conoce porque s’olo es conoce su clave privada
propia di :
C1 := M di mod ni .
• Calcula:
e
C2 := C1 j mod nj .
y lo hace público a toda la red.
El individuo j puede recuperar la información oroginal sin conocer la clave pribada di del emisor.
Además, puede estar seguro de que esa informaciń viene “firmada” por el individuo i. Procede
como sigue:
• El individuo j debe calcular:
d
C3 := C2 j mod nj ,
y lo puede conocer porque C2 es público y dj es su clave privada que sólo j conoce.
• Posteriormente el individuo j calcula:
C4 := C3ei mod ni .
Verifica que el individuo j puede calcular C4 y que se verifica:
M = C4 mod ni .
Explica por qué ese mensaje de i para j viene firmado por i con su clave digital (privada).
Problema 159. Un sistema de clave pública es seguro por la razón siguiente: En un sistema
basado en “libro de claves”, basta con que un miembro externo a un red {ci : i ∈ I} sobre el
libro de claves de uno de los miembros ci de la red para disponer de toda la información que
los miembros de la red están distribuyendo unos a otros. Es el fallo de sistemas tipo la famosa
máquina Enigma (busca en internet). En cambio en sistema de clave pública (tipo RSA) este
problema no se produce: si alguien roba la clave privada de un miembro, sólo podrá descrifrar
la información que emita el individuo robado, pero no podrá disponer de otra información
circulando en esa red y que no involucre al individuo robado. Explica la razón.
Problema 160. Sea K un cuerpo algebraicamente cerrado y sea p ∈ K[X1 , . . . , Xn ] un poli-
nomio no constante, es decir p 6∈ K× . Entonces, existe un punto ζ ∈ Kn tal que p(ζ) = 0.
( Hint: Por inducción en el número de variables).
CAPı́TULO 4
183
184 4. PRIMOS, MAXIMALES. MÓDULOS LIBRES. FORMA NORMAL DE SMITH
Índice
4.1. Introducción 184
4.1.1. Motivación: El ejemplo de las ecuaciones diofánticas lineales:
Diagonalización, forma normal de Smith y aplicaciones. 185
4.2. Ideales primos e ideales maximales. La noción de rango de un
R−módulo libre. 187
4.2.1. Las nociones y primeras propiedades 187
4.2.2. La noción de rango de un R−módulo libre 192
4.2.3. Generación finita sobre anillos noetherianos es hereditaria 196
4.3. Proyectivos, libres y dominios de ideales principales 197
4.4. Libres y Libres de Torsión sobre dominios de ideales principales 204
4.4.1. Libres de Torsión sobre dominios de ideales principales 204
4.4.2. Libres de torsión sobre dominios euclı́deos (Opcional) 208
4.4.3. Ejercicios y problemas de las secciones 4.2 y 4.3 211
4.4.3.1. Forma (Canónica Racional) de Frobenius de un endomorfismo 212
4.5. Diagonalización de Matrices sobre un DIP 217
4.5.1. Motivaciones 217
4.5.1.1. Ecuaciones diofánticas 217
4.5.2. Matrices de operaciones elementales en GL(2, R) 218
4.5.2.1. Tipo 1: Intercambio de Filas o columnas. 218
4.5.2.2. Tipo 2: Multiplicar a una fila (o columna) por una unidad del
anillo. 218
4.5.2.3. Tipo 3: Sumar a una fila (o columna) un múltiplio de otra fila
(o columna). 219
4.5.2.4. Tipo 4: Encontrar el máximo común divisor. 219
4.5.3. Generalizando a matrices m × n: Operaciones elementales sobre DIP’s 220
4.5.4. Matrices elementales particulares 222
4.5.5. Orlar una matriz 225
4.5.6. “Algoritmo”: Hacer ceros por filas o columnas 226
4.5.6.1. El Caso de Dominios de Ideales Principales. 226
4.5.6.2. El Caso de Dominios Euclı́deos. 226
4.5.7. Hacer ceros en filas y columnas 228
4.5.7.1. El caso de Dominios de Ideales Principales 228
4.5.7.2. El caso de dominios euclı́deos 230
4.5.8. Diagonalización de una matriz sobre un DIP: “algoritmo” primario 230
4.5.9. Resolución de ecuaciones lineales diofánticas 231
4.6. Forma Normal de Smith 234
4.6.1. Estructura de grupos abelianos finitamente generados 237
4.7. Forma de Frobenius y Factores Invariantes de un endomorfismo
sobre un espacio vectorial de dimensión finita. 241
4.7.1. Factores invariantes de un endomorfismo 241
4.7.2. Forma de Frobenius de un endomorfismo: factores invariantes en K[X] 242
4.7.3. El álgebra R[X]/(f ), con f ∈ R[X]mon . 242
4.7.3.1. La Estructura de K[X]−módulo que define un endomorfismo. 245
4.7.4. Ejercicios y problemas de la Sección 4.5 251
4.7.4.1. Ecuaciones Diferenciales Ordinarias Homogéneas 254
4.1. Introducción
Este Capı́tulo pretende, sobre todo establecer las claves de los módulos libres de rango finito y la
clasificación de los grupos abelianos finitamente generados. Pero los elementos que intervienen
en las demostraciones elegidas hacen conveniente explorar un espectro más amplio y más propio
del Álgebra Conmutativa. Ası́, comenzaremos revisando las nociones de ideal primo e ideal
maximal y los sustratos de los espacios Spec(R) y MaxSpec(R) donde forman un grafo orientado
no necesariamente finito. Nos facilitará poder definir la noción de rango de un R−módulo libre.
A esto dedicaremos la Sección 4.2.
Seguidamente retomamos las condiciones noetherianas, esta vez orientóndonos a los módulos
finitamente generados sobre anillos noetherianos. En realidad, este estudio es un artificio en
4.1. INTRODUCCIÓN 185
la medida en que lo que nos interesa es el caso de dominios de ideales principales. Pero la
demostración de que la propiedad de generación finita es hereditaria para dominios de ideales
principales o para anillos noetherianos es la misma, ası́ que hemos ptado por darle un poco
más de generalidad. En la Sección ?? estudiaremos con más detalle estos módulos y aquı́ nos
limitaremos a tratar esa condición hereditaria. En todo caso, sigue el pensamiento noetheriano
que, subrepticiamente, se esconde en estas notas.
También dedicaremos un esfuerzo a introducir los módulos proyectivos en la Sección 4.3. Aquı́,
nos interesa fundamentalmente el caso de módulos sobre dominios de ideales principales, noción
que es equivalente a la de módulo libre en el caso finitamente generado. No será equivalente en
el caso más general. Esta equivalencia no será cierta para el caso de anillos de coeficientes más
generales, de ahı́ un tratamiento más amplio en la Sección ??.
El uso de la terminologı́a de módulos proyectivos sobre dominios de ideales principales nos per-
mite una demostración más directa y elegante del Teorema de Dedekind, del que nos ocuparemos
en la Sección 4.3.
Disponiendo ya del Teorema de Dedekind, es sencillo probar que un módulo sobre un DIP
es libre y de rango finito si y solamente si es finitamente generado y libre de torsión (i.e. el
módulo no posee divisores de cero en el anillo). A eso dedicamos la Sección ??. De nuevo,
la equivalencia no será cierta para anillos más generales, exceptuando el caso del Teorema de
Quillen-Suslin.
Finalmente, debemos ocuparnos de la motivación de estos estudios, que será también, el punto
de partida del Tema.
(4.1.2) AX = 0t ,
186 4. PRIMOS, MAXIMALES. MÓDULOS LIBRES. FORMA NORMAL DE SMITH
En este sentido, los R[X]−módulos se encuentran con esta manera de descomponer las ecua-
ciones diferenciales lineales y, además, esta descomposición es algorı́tmicamente calculable en
tanto en cuanto los coeficientes de las matrices ivolucradas vvan en un cuerpo computable.
Ciertamente, los objetivos se podrı́an haber abordado con menos aparato teórico, pero el aparto
teórico tiene sus orı́genes en la comprensión de los fenómenos subyacentes al caso particular,
un fenómeno común en Matemáticas.
Ejemplo 4.2.1.
i) Un anillo R es dominio de integridad si y solamente si (0) ∈ Spec(R).
ii) Todo ideal maximal es obviamente primo (y tenemos MaxSpec(R) ⊆ Spec(R)), pero
el recı́proco no es cierto en general. Ası́, (0) ∈ Spec(Z) \ MaxSpec(Z) 6= ∅.
iii) Obviamente si K es un cuerpo Spec(K) = MaxSpec(K) = {(0)} y ambos espectros
están constituidos por un único elemento. En particular, los cuerpos son anillos locales.
iv) En un dominio de ideales principales, un ideal p = (p) es un ideal primo si y solamente
si el generador p es un elemento primo o, equivalentemente, irreducible.
v) En un dominio de ideales principales, los ideales maximales son los ideales primos no
nulos.
vi) Consideremos K un cuerpo, K[X1 , . . . , Xn ] el anillo de polinomios en n variables con
coeficientes en K. Consideremos x = (z1 , . . . , zn ) ∈ K n un punto en el espacio afı́n
n−dimensional sobre K y consideremos la siguiente función:
evx : K[X1 , . . . , Xn ] −→ K
p(X1 , . . . , Xn ) 7−→ p(x) := p(z1 , . . . , zn ).
Es sencillo observar que evx es un morfismo de anillos y que es un epimorfismo. El
núcleo de evx viene dado por la siguiente identidad:
K[X1 , . . . , Xn ]/mx ∼
= K.
De hecho, tenemos una identificación del espacio afı́n K n con una parte del espectro
maximal y del espectro primo, es decir,
Kn ∼
= {mx : ζ ∈ K n } ⊆ MaxSpec(K[X1 , . . . , Xn ]) ⊆ Spec(K[X1 , . . . , Xn ]).
Una aplicación recursiva de la división euclı́dea por un polinomio mónico (cf. Teo-
rema 1.4.15) prueba fácilmente que mx es el ideal generado por los polinomios {X1 −
z1 , . . . , Xn − zn }, donde x = (z1 , . . . , zn ). Es decir:
mx = (X1 − z1 , . . . , Xn − zn ).
188 4. PRIMOS, MAXIMALES. MÓDULOS LIBRES. FORMA NORMAL DE SMITH
vii) Una construcción análoca puede hacerse en cualquier anillo de funciones razonable
(R−álgebras o C−álgebras, por ejemplo). Ası́, consideremos el anillo C (C) de fun-
ciones continuas sobre un espacio topológico (X, T ). Consideremos x ∈ X un punto
cualquiera y definamos:
evx : C (X) −→ R
f 7−→ f (x).
De nuevo es un morfismo de anillos, de nuevo es epimorfismo porque es una R−álgebra
(y contiene a las constantes) y, de nuevo, tenemos un ideal maximal dado por el núcleo:
mx := ker(evx ) = {f ∈ C (X) : f (x) = 0}.
Con lo que tenemos una identificación:
X∼ = {mx : ζ ∈ X} ⊆ MaxSpec(C (X)) ⊆ Spec(C (X)).
Volveremos a estas ideas con el Nullstellensatz.
viii) El anillo de series de potencias formales K[[X]] es un anillo local cuyo único ideal
maximal m es el ideal generado por X, i.e. m = (X).
ix) Obviamente, y ya hemos visto ejemplos, los ideales primos y maximales no tienen por
qué ser principales. El ejemplo más inmediato, tras los anteriores, podrı́a ser el ideal
m := (3, X 2 + 1) en Z[X] que es un ideal maximal no principal, cuyo cociente es el
cuerpo de 3 elementos, i.e. Z[X]/m = F3 .
x) Los anillos para los cuales MaxSpec(R) = Spec(R) se denominan anillos de dimensión
cero y si verifican ciertas condiciones de cadena, los llamaremos anillos de Artin (pero
esto corresponde a capı́tulos más avanzados del curso).
xi) Los conjuntos Spec(R) y MaxSpec(R) son conjuntos parcialmente ordenados con re-
specto a la inclusión ⊆. Con esta ordenación tiene una estructura de grafo orientado.
La longitud del camino más largo en Spec(R) se denominará la dimensión de Krull de
R y tiene sentido cuando R es un anillo noetheriano.
Proposición 4.2.2. Las siguientes son caracterizaciones alternativas de ideales primos y ma-
ximales en un anillo R:
• Un ideal p ( R es primo si verifica:
∀x, y ∈ R, xy ∈ p =⇒ (x ∈ p) ∨ (y ∈ p).
• Un ideal m ( R es maximal si y solamente si es maximal en el conjunto de los ideales
propios a ( R, ordenados por la inclusión. Es decir m ( R es maximal si y solamente
si para cualquier ideal propio a ( R, se tiene
m ⊆ a =⇒ m = a.
Demostración. Para la primera de las afirmaciones obsérvese que xy ∈ p es equivalente
a
(x + p)(y + p) = 0, en R/p,
mientras que x ∈ p e y ∈ p son respectivamente equivalentes a
x + p = 0, y + p = 0, en R/p.
Con estas observaciones es clara la equivalencia entre las afirmaciones R/p es dominio de inte-
gridad y la descrita en la primera de las afirmaciones de esta proposición.
Para la segunda afirmación, supongamos que R/m es un cuerpo. Y sea a ( R un ideal propio
de R tal que m ⊆ a. Por la Proposición 2.2.28, el ideal a/m es un ideal del anillo cociente R/m.
Como R/m es un cuerpo y a 6= m, entonces necesariamente
a/m = (0 + m) ⊆ R/m,
con lo que concluiremos que a = m y tendremos la maximalidad de m entre los ideales propios
de Rcon la inclusión ⊆ como relación de orden.
Recı́procamente, si m es un elemento maximal entre los ideales propios de R, entonces el cociente
R/m sólo puede poseer dos ideales: R/m y (0 + m). Supongamos ahora un elemento f ∈ R tal
4.2. PRIMOS, MAXIMALES, RANGO 189
Observación 4.2.3. Obsérvese que hemos probado que un anillo R es cuerpo si y solamente si
{(0)} = MaxSpec(R) = Spec(R).
Nótese que (0) ∈ Spec(R) si y solamente si R es dominio de integridad y la equivalencia se sigue
de la prueba de la afirmación ii) anterior.
En el enunciado que sigue utilizaremos el Lema (o Axioma) de Zorn. En todo caso, para aquellos
anillos que interesan en este curso (los anillos noetherianos) el enunciado se puede probar sin
el Lema de Zorn, aunque con el Axioma de Elección Dependiente. Recuérdese que un conjunto
parcialmente ordenado (T, ≤) se denomina cadena si la relación de orden ≤ es una relación de
orden total. Dado un conjunto parcialmente ordenado (S, ≤) llamaremos cadena en (S, ≤) a
todo subconjunto T ⊆ S tal que con la relación de orden inducida por la de S, se tenga que
(T, ≤) es una cadena. El Axioma de Zorn se enuncia del modo siguiente:
Axioma 4.2.7 (Lema de Zorn). Sea (S, ≤) un conjunto parcialmente ordenado. Si, para toda
cadena T ⊆ S existe cota superior en (S, ≤), entonces, existe elemento maximal en (S, ≤).
Se tiene:
Teorema 4.2.8. Asumiendo el Lema de Zorn, todo anillo R posee al menos un ideal maximal
(i.e. MaxSpec(R) 6= ∅).
4.2. PRIMOS, MAXIMALES, RANGO 191
Corolario 4.2.10. Con las mismas hipótesis, si R es un anillo, sus unidades son los elementos
que no pertenecen a ningún ideal maximal. Es decir,
\ [
R× := (R \ m) = R \ m .
m∈MaxSpec(R) m∈MaxSpec(R)
Observación 4.2.11. Ejemplos triviales de anillos conmutativos sin uniddad que no tienen
ideales maximales propios pueden verse en [Hen, 75].
iii) Sean a1 , . . . , am ideales propios de R y sea p un ideal primo que contiene a la inter-
sección ∩mi=1 ai . Entonces, p ⊇ ai para algún i.
Demostración. El resultado está tomado de [AtMc, 1969] y [Rag et al., 1975] combi-
nados. Haremos la prueba de cada propiedad:
i) Supongamos que a ⊆ ∪si=0 bi . Razonemos por reducción al absurdo, si el resultado
fuera falso, entonces para cada i ∈ {0, . . . , s}, debe existir algún elemento xi ∈ a que
no es miembro de la unión ∪j6=i bj . Considero el elemento
x := x0 + x1 · · · xs .
Como todos los xi ’s son elementos de a, es claro que Qs x ∈ a. De otro lado, no es posible
que x ∈ b0 . Porque si x ∈ b0 , entonces x − x0 = i=1 xi ∈ b0 . Pero, por construcción
xi 6∈ ∪j6=i bj . Por tanto, xi 6∈ b0 lo cual contradice la primalidad de b0 .
ii) Usamos la propiedad i). Si a está, contenido en una unión finita de primos p1 , . . . , pn .
Consideremos J ⊆ {1, . . . , m} un sunconjunto de cardinal minimal tal que
a ⊆ ∪j∈J pj .
Pero si J tiene cardinal mayor o igual que 2, como todos ellos son primos, la propiedad
i) implicarı́a que J no es minimal. Por tanto, ](J) = 1 y tenemos la afirmación ii).
iii) De nuevo, por reducción al absurdo, supongamos que p no contiene a ningı́n ai . Esto
es ası́ porque, para cada i, existe xi ∈ ai \ p. Pero, entonces, el elemento
x = x1 · · · xm ∈ ∩m
i=1 ai ,
tenı́a 27 años, a partir de los semiarios impartidos por E. Noether y E. Artin, sigue conteniendo
una visión interesante del Álgebra Moderna, de los primeros fundamentos de la Geometrı́a Al-
gebraica, entendida como Teorı́a de la Eliminación clásica. Bajo su impulso se empezaron a
estudiar las interacciones entre estos axiomas adicionales a la Teorı́a de Conjuntos, que desem-
bocaron en el siguiente:
Teorema 4.2.17. Bajo los Axiomas de Zermelo-Fraenkel para Teorı́a de Conjuntos, los si-
guientes Axiomas son equivalentes (e independientes de ZF)
i) Axioma de Elección.
ii) Lema de Zorn
iii) Principio de Buena Ordenación: Todo conjunto X admite un buen orden.
iv) Compatibilidad de Cardinales (también llamado Teorema de Bernstein) Dados dos
conjuntos X e Y , existe o bien una biyección entre ellos o una biyección entre Y y un
subconjunto de X o, recı́procamente, una biyección entre X y un subconjunto de Y .
La prueba, desgracidamente, se sale de este curso, pero se pueden localizar fácilmente textos
con pruebas correctas en la red.
A partir de ahora asumiremos tanto el Axioma de Elección como el Lema de Zorn. Y añadiremos,
con prevención, el siguiente Axioma de la Dimensión de Espacios Vectoriales:
Axioma 4.2.18 (Existencia de dimensión en espacios vectoriales). Sea K un cuerpo, sea
V un espacio vectorial. Entonces,
i) V posee una base como espacio vectorial (equivalente al Lema de Zorn).
ii) Dadas β1 y β1 dos bases de V como K−espacio vectorial. Entonces β1 y β2 son
conjuntos biyectables (demostrable a partir del Lema del Ultrafiltro).
Al cardinal de cualquiera de sus bases, lo llamaremos dimensión de V sobre K.
• Prueba de i): Veamos, en primer lugar, que B/m es sistema generador del k(m)−espacio
vectorial M/mM .
Dado m+mM ∈ M/mM un elemento cualquiera, como m ∈ M , y B es sistema gener-
ador, sabemos que existe un conjunto finito J ⊆ I y un subconjunto {λi ∈ R : i ∈ J}
tal que X
m= λi mi .
i∈J
Tomando clases módulo mM , tendremos:
X
m + mM = (λi + m)(mi + mM ).
i∈J
Concluiremos que
i) Para cada i ∈ J ∩ T , λi = θi ∈ m. Luego λi + m = 0 + m, para todo i ∈ J ∩ T .
ii) Para cada i ∈ J \ T , λi = 0. Luego λi + m = 0 + m, para todo i ∈ J \ T .
iii) Para cada k ∈ T \ J, θk = 0.
Habremos concluido que λi + m = 0, para todo i ∈ J y, por tanto, B/m es un sistema
de vectores linealmente independientes en el k(m)− espacio vectorial M/mM .
• Prueba de ii): Se parece mucho a la prueba del apartado i). en primer lugar conside-
remos la siguiente aplicación, que es, por definición, suprayectiva:
Φ: B −→ B/m
m 7−→ m + mM.
Si no fuera inyectiva, existirı́an mi1 , m2 ∈ B, con i1 , i2 ∈ I tales que mi1 − mi2 ∈ mM .
Esto implica que tenemos una combinación lineal no trivial en M/mM .
(1 + m)(mi1 + mM ) + (−1 + m)(mi2 + mM ) = 0 + mM.
Pero como B/m es base, esta combinación lineal igualada a cero, con coeficientes en
k(m) no es posible, con lo que llegamos a contradicción.
Ejemplo 4.2.24. Sea K un cuerpo y sea f ∈ K[X] un polinomio no nulo. Entonces, el anillo
cociente K[X]/(f ) no es un K[X]−módulo libre. Simplemente porque todo K[X]−módulo libre
tiene que tener dimensión infinita como espacio vectorial sobre K, mientras que K[X]/(f ) es
un K−espacio vectorial finitamente generado.
En el caso µ(M ) = 1, tenemos que M está generado por un conjunto formado por un
único elemento. Esto es, tenemos M = Rha1 i. Ahora, consideramos el siguiente morfismo
de R−módulos:
π : R −→ M
x 7−→ xa.
Es evidente que π es suprayectiva (porque {a1 } genera M ). Sea a := ker(π) el núcleo de π
que es un submódulo de R (y, por tanto, un ideal de R). Por el Primer Teorema de Isomorfı́a
(ver la Subsección 2.2.2) tendremos un isomorfismo de R−módulos entre R/a y M . Por ese
isomorfismo, los submódulos de M son los submódulos de R/a que son los ideales de R/a. Por
la Proposición 2.2.28, los ideales de R/a) son los ideales de R que contienen a a. Como R es
un anillo noetheriano, sus ideales son finitamente generados (recuérdese el Teorema 3.3.2). Por
tanto, los ideales del cociente R/a también son finitamente generados y, en conclusión, cualquier
módulo isomorfo a un ideal de R/a es finitamente generador. En particular, los submódulos de
M son finitamente generados.
Considero el conjunto
β 0 := {c1 , . . . , cr } ∪ {b1 , . . . , bs },
Y probemos que
N = Rhβ 0 i,
con lo que habrı́amos probado que N es finitamente generado. Para ver esta igualdad, comence-
mos observando que c1 , . . . , cr ∈ N ∩ M1 ⊆ N y b1 , . . . , bs ∈ N , con lo cual β 0 ⊆ N y como
4.3. PROYECTIVOS, LIBRES Y DOMINIOS DE IDEALES PRINCIPALES 197
Rhβ 0 i es el menor submódulo que contiene a β 0 , tendremos una primera inclusión Rhβ 0 i ⊆ N .
Para la otra inclusión, consideremos m ∈ N un elemento cualquiera. Consideremos su imagen
π(m) = m + M1 ∈ π(N ) ⊆ M/M1 .
Entonces, existirán λ1 , . . . , λs ∈ R tales que
s
X
π(m) = m + M1 = λi (bi + M1 ),
i=1
o, equivalentemente,
s
X
m− λi bi ∈ M1 .
i=1
Como m ∈ N y b1 , . . . , bs ∈ N , se tiene, en realidad,
Xs
m− λi bi ∈ M1 ∩ N.
i=1
Por tanto, como M1 ∩ N = Rhc1 , . . . , cr i, existirán θ1 , . . . , θr ∈ R tales que
X s Xr
m− λ i bi = θi ci ,
i=1 i=1
y, por tanto,
s
X r
X
m= (−λi )bi + θi ci ∈ Rhβ 0 i,
i=1 i=1
con lo que habremos probado N ⊆ Rhβ 0 i y R es finitamente generado.
En particular, como los dominios de ideales principales son anillos noetherianos se tiene:
Proposición 4.2.28. Sea R un anillo dominio de ideales principales y M un R−módulo fini-
tamente generado. Entonces, todos los submódulos de M son finitamente generados.
N M 0
f
entonces existe h : P −→ N tal que el siguiente diagrama es conmutativo:
P
∃h g
N M 0
f
198 4. PRIMOS, MAXIMALES. MÓDULOS LIBRES. FORMA NORMAL DE SMITH
h
F M
h
F M
∃g π
Observación 4.3.4. De hecho, no se necesita la condición de finitud del rango, como uno puede
fácilmente verificar.
La siguiente es una prueba del Teorema de Dedekind para el caso de rango finito. La incluimpos
porque no depende del Axioma de Zorn.
4.3. PROYECTIVOS, LIBRES Y DOMINIOS DE IDEALES PRINCIPALES 199
En general, los módulos proyectivos no tienen por qué ser libres aunque dejaremos la discusión
para más adelante en el texto.
Corolario 4.3.6. Si R es un dominio de ideales principales y M es un R−módulo libre, son
equivalentes:
200 4. PRIMOS, MAXIMALES. MÓDULOS LIBRES. FORMA NORMAL DE SMITH
i) M es de rango finito,
ii) M es finitamente generado.
Además, en ese caso rankR (M ) = µ(M ), donde µ(M ) es el mı́nimo de los cardinales de los
sistemas generadores de M .
Demostración. La implicación i) =⇒ ii) se da obviamente: todo R−módulo libre de
rango finito es finitamente generado.
Para la otra, se trata de probar que el rango de un R−módulo libre finitamente generado
coincide con µ(M ). Para ello observemos que, por ser M finitamente generado, supongamos
µ(M ) = n y existe un sistema generador G := {m1 , . . . , mn } de M formado por n elementos.
Entonces, existe un epimorfismo de R−módulos π : Rn −→ M , donde π(ei ) = mi para cada i,
1 ≤ i ≤ n, siendo {e1 , . . . , en } la base “canónica” de Rn como R−módulo libre.
Por ser proyectivo, existe un morfismo g : M −→ Rn tal que π ◦ g = IdM . En particular, g es
monomorfismo y, por tanto, M y su imagen g(M ) ⊆ Rn son isomorfos como R−módulos. Como
g(M ) es submódulo de un R−módulo libre de rango finito, por el Teorema precedente, g(M )
es libre de rango finito y también lo será M . Además, rankR (M ) = rankR (g(M )) ≤ n = µ(M ).
Para probar la igualdad rankR (M ) = µ(M ). Nótese que si M es libre de rango finito, una
base de M es un sistema generador de M y, dado que µ(M ) es un mı́nimo, entonces tenemos
µ(M ) ≤ rankR (M ) y tenemos la igualdad buscada.
Observación 4.3.8. La condición de ser dominio de ideales principales es crucial para el Teo-
rema 4.3.5 anterior y para su Corolario. El ideal maximal m := (X, Y ) ∈ MaxSpec (K[X, Y ])
es un submódulo de un K[X, Y ]−módulo libre como es K[X, Y ]. Sin embargo, no puede
ser libre. Si fuera libre poseerı́a una base de cardinal menor que el rango de K[X, Y ] como
K[X, Y ]−módulo libre, que es de rango 1. Es decir si m fuera libre serı́a un ideal principal,
pero no lo es como ya hemos visto anteriormente. En cambio, la condición de ser finitamente
generado es superfua. El Teorema de Dedekind, que usa el Lema de Zorn, demuestra que todo
subgrupo de un grupo abeliano libre es un grupo abeliano libre. Dejamos la prueba como
problema.
Camuflada en la prueba del Teorema precedente hemos usado la prueba de la siguiente Proposición:
Proposición 4.3.9. Las siguientes propiedades son equivalentes para un R−módulo P :
i) P es un R−módulo proyectivo (i.e. satisface la lifting property).
ii) El R−módulo P es un sumando directo de un R−módulo libre. Es decir, existe un
R−módulo Q tal que F ∼ = P ⊕ Q es un R−módulo libre.
iii) Toda sucesión exacta corta como la siguiente:
4.3. PROYECTIVOS, LIBRES Y DOMINIOS DE IDEALES PRINCIPALES 201
f g
0 M0 M P 0,
es escindida. Esto es, existe una sucesión exacta corta de la forma:
λ π
0 M0 M0 ⊕ P P 0,
donde λ : M 0 ,−→ M 0 ⊕P es la inclusión canónica, y π : M 0 ⊕P −→ P es la proyección
canónica y existe un isomorfismo ψ : M −→ M 0 ⊕ P tal que es siguiente diagrama es
conmutativo:
f g
0 M0 M P 0
IdM 0 ψ IdP
λ π
0 M0 M0 ⊕ P P 0
IdM 0 ψ IdP
λ π
0 M0 M0 ⊕ P P 0
• iii) =⇒ ii) : El R−módulo P es siempre la imagen de un epimorfismo que parte de
una R−módulo libre o, equivalentemente, existe una sucsesión exacta corta como la
siguiente:
f g
0 K F P 0,
donde F es un R−módulo libre. Por iii) esa sucesión exacta corta es escindida y, en
particular, existe un isomorfismo ϕ = ψ −1 : K ⊕ P −→ F . Pero eso ya significa que
F = ϕ(K) ⊕ ϕ(P ), con lo que ϕ(P ) es un sumando directo de un R−ódulo libre (i.e.
F ) y P y ϕ(P ) son, obviamente, isomorfos.
• ii) =⇒ i): Supongamos que P es un sumando directo de un R−módulo libre F = Q⊗P
y consideremos un epimorfismo π : M −→ P . Entonces, tengo un epimorfismo de
Q ⊕ M en F dado mediante:
ψ : Q⊕M −→ Q⊕P =F
(q, m) 7−→ (q, π(m)).
Es claramente epimorfismo por serlo π y, como F es un R−módulo proyectivo, existe
un morfismo φ : F −→ Q ⊕ M tal que
ψ ◦ φ = IdF = IdQ⊕P .
Escribamos φ := (φ1 , φ2 ) y reescribamos φ como el morfismo
φ: Q⊕P −→ Q⊕M
(e, n) 7−→ (φ1 (e, n), φ2 (e, n)).
Componiendo con ψ observamos que para (0, n) ∈ {0} ⊕ P se tiene:
(0, n) = ψ(φ((0, n))) = ψ(φ1 (0, n), φ2 (0, n)) = (φ1 (0, n), π(φ2 (0, n))).
En particular, concluimos las dos igualdades siguientes para cada n ∈ P :
φ1 (0, n) = 0, π(π2 (0, n)) = n.
4.3. PROYECTIVOS, LIBRES Y DOMINIOS DE IDEALES PRINCIPALES 203
Definamos
Φ: P −→ M
n 7−→ φ2 (0, n).
Se trata de un morfismo de R−módulos y, por lo visto anteriormente,
M∼
= Rm / Im(ϕA ).
M∼
= Rm /K, K = ker(π).
M∼
= Coker(π),
M∼
= Coker(π) = Rm / Im(π),
resulta ser un cociente de dos R−módulos libres de rango finito. La otra implicación es evidente.
204 4. PRIMOS, MAXIMALES. MÓDULOS LIBRES. FORMA NORMAL DE SMITH
λλj = 0, λj 6= 0, ∀j ∈ J.
Λ: M −→ M
m 7−→ Λm.
206 4. PRIMOS, MAXIMALES. MÓDULOS LIBRES. FORMA NORMAL DE SMITH
porque λi ei ∈ F . Como Λ(M ) ⊆ F y F es libre de rango finito, por el Teorema 4.3.5 precedente,
Λ(M ) es un R−módulo libre y su rango verifica
rankR (Λ(M )) ≤ rankR (F ) = s.
Podemos reescribir el morfismo de R−módulos Λ por restricción del rango:
Λ: M −→ Λ(M )
m 7−→ Λm.
De momento tenemos un morfismo suprayectivo por obvias razones y, como M es libre de
torsión, entonces Λ debe ser un monomorfismo. Nótese de Λ 6= 0, luego Λm = 0 implica m = 0
en M por ser M libre de torsión.
En conclusión, M es isomorfo a un R−módulo libre de rango menor que s < m, con lo que
tiene un sistema generador con, a lo sumo, s elemetos (la imagen inversa de la base de Λ(M ))
que tiene, a lo sumo, s elementos). En suma, si s < m, habrı́amos llegado a contradicción con
la minimalidad de m entre los cardinales de los sistemas de generadres de M .
Ejemplo 4.4.8. Los siguientes ejemplos son también ejemplos donde los módulos lo son sobre
dominios euclı́deos.
i) Los Z−módulos libres de torsión y finitamente generados son los isomorfos a Zn . Todo
submódulo de Zn es libre y de rango finito. Pero el rango del submódulo no es siempre
estrictamente menor que el rango del módulo libre del que partı́amos. Por ejemplo,
3
(2Z) es un Z−módulo libre de rango 3 que es submódulo de Z3 que también es libre
de rango 3, pero no son iguales.
ii) Los K[X]−módulos libres de torsión y finitamente generados son los isormorfos a
K[X]n . Lo mismo se aplica a sus submódulos y al rango.
iii) En el Ejemplo de la Teorı́a del endomorfismo (ver 2.2.4), la estructura de K[X]−módulo
del espacio vectorial V , de dimensión finita sobre K, con respecto a un endomorfismo
ϕ : V −→ V no es la estructura de un K[X]−módulo libre. En particular no es libre
de torsión y todos los elementos v ∈ V poseen anulador no trivial. De hecho, el ideal
AnnK[X] (v) := {p ∈ K[X] : p ·K[X] v = p(ϕ)(v) = 0},
es un ideal principal en K[X] generado por un polinomio que se denomina polinomio
mı́nimo del endomorfismo ϕ con respecto al vector v.
Observación 4.4.9 (Contraejemplos). Las hipótesis del Teorema 4.4.5 precedente son in-
evitables.
4.4. LIBRES Y LIBRES DE TORSIÓN SOBRE DOMINIOS DE IDEALES PRINCIPALES 207
i) Sobre dominios de ideales principales, hay módulos libres de torsión que no son libres,
porque no son finitamente generados. A modo de ejemplo, Q es un Z−módulo libre de
torsión. Ahora bien, cualesquiera dos números racionales son linealmente dependientes
sobre Z (ver Problema 166). Por tanto, si Q es un Z−módulo libre, la base sólo puede
tener un elemento y Q serı́a libre de rango 1. Pero, entonces, todos los números
racionales tendrı́an el mismo denominador, lo que no es el caso.
ii) Sobre anillos que no son dominios de ideales principales, hay módulos libres de torsión
y finitamente generados que no son libres. El ejemplo más simple es el anillo K[X, Y ]
y el ideal m := (X, Y ). Se trata de un ideal de un dominio de integridad, ası́ que es
un módulo libre de torsión. Es claro, por su definición que es un ideal (y, por tanto,
un módulo) finitamente generado sobre K[X, Y ]. Sin embargo, no es libre. Si fuera
libre, entonces serı́a un ideal principal (ver Problema 167) y ya hemos indicado que m
no es un ideal principal en los Ejemplos 3.2.1.
Teorema 4.4.10. Sea R un dominio de ideales principales. Entonces, todo módulo finitamente
generado M , admite una descomposición de la forma:
M∼ = F (M ) ⊕ T orR (M ),
donde F (M ) ∼
= M/T orR (M ) es un R−módulo libre de rango finito.
Demostración. Para ello, consideremos el R−módulo cociente:
F (M ) := M/T orR (M ).
Por la Proposición 4.4.2, M/T orR (M ) es libre de torsión y finitamente generado y por el
Teorema 4.4.5 es un R−módulo libre. Consideremos la proyección canónica
π : M −→ M/T orR (M ) = F (M ).
Por el Lema 4.3.3, F (M ) es un R−módulo proyectivo. Tenemos la sucesión exacta corta:
i π
0 T orR (M ) M M/T orR (M ) 0,
Observación 4.4.13. Veremos más adelante que todo grupo abeliano finito es un producto
finito de grupos cı́clicos y por tanto, T orZ (G) es un producto finito de grupos cı́clicos de orden
finito.
Proposición 4.4.15. Sea (R, φ) un dominio euclı́deo y sea M un R−módulo finitamente gen-
erado. Sea β := {a1 , . . . , an } un sistema generador de M y sea Λ := (λ1 , . . . , λn ) ∈ Rn una
lista de elementos de R (tantos como elementos tiene el sistema generador). Supongamos que
gcd(λ1 , . . . , λn ) = (1).
Entonces, existe un sistema generador de M con el mismo cardinal que β
β 0 := {b1 , . . . , bn },
4.4. LIBRES Y LIBRES DE TORSIÓN SOBRE DOMINIOS DE IDEALES PRINCIPALES 209
Supongamos Φ(Λ) = φ(1) + (n − 1)φ(0). Como J(Λ) 6= ∅, podemos suponer, reordenando los
ı́ndices si fuera necesario que 1 ∈ J(Λ), es decir, λ1 6= 0. Entonces tenemos,
n
X
(φ(λ1 ) − φ(1)) + (φ(λi ) − φ(0)) = 0.
i=1
Como φ(λ1 ) − φ(1) ≥ 0 y φ(λi ) − φ(0) ≥ 0 para todo i, 2 ≤ i ≤ n, esta suma es una suma de
enteros positivos igualada a cero, por cuanto, tendrı́amos:
φ(λ1 ) − φ(1) = 0, φ(λ2 ) − φ(0) = 0, . . . , φ(λ2 ) − φ(0) = 0.
Por tanto λ1 ∈ R× y λi = 0, 2 ≤ i ≤ n. Pero, entonces, estarı́amos en el caso que ya hemos
visto que se verifica por defecto.
Supongamos ahora que Φ(Λ) = m > φ(1). Si alguno de los λi es unidad, ya habremos
terminado. Supongamos, entonces, que ninguno de los λi es unidad. Supongamos
Λ := (λ1 , . . . , λn ),
con la propiedad gcd(λ1 , . . . , λn ) = 1. Entonces, el conjunto J(Λ) no puede ser un conjunto de
cardinal 1. Porque si J(Λ) tuviera un sólo elemento, por ejemplo J(Λ) = {i}, tendrı́amos
gcd(λ1 , . . . , λn ) = gcd(0, . . . , 0, λi , 0, . . . , 0) = λi .
Como Φ(Λ) = m > φ(1) + (n − 1)φ(0), concluirı́amos que
Φ(Λ) = φ(λi ) + (n − 1)φ(0) = m > φ(1) + (n − 1)φ(0),
con lo que λi no serı́a unidad de R y, por tanto, gcd(λ1 , . . . , λn ) 6= 1, contradiciendo nuestras
hipótesis.
210 4. PRIMOS, MAXIMALES. MÓDULOS LIBRES. FORMA NORMAL DE SMITH
Dado que J(Λ) posee más de un elemento, podemos suponer que 1, 2 ∈ J y que φ(λ1 ) ≥ φ(λ2 ).
Además, como ninguno de los dos es unidad, se tiene:
φ(λ1 ) ≥ φ(λ2 ) > φ(1) ≥ 0.
Podemos aplicar divisón euclı́dea y tendremos que existen q, r ∈ R tales que
λ1 = qλ2 + r, φ(r) < φ(λ2 ) ≤ φ(λ1 ).
Ahora consideremos la lista
Λ1 := (r, λ2 , . . . , λn ) ∈ Rn .
Nótese que gcd(r, λ2 , . . . , λn ) = 1 porque se tiene la coincidencia de ideales:
a := (r, λ2 , . . . , λn ) = (λ1 , λ2 , . . . , λn ) = b.
Para verlo, es claro que b ⊆ a, dado que λ1 = qλ2 + r ∈ b. Pero también se tiene que a ⊆ b,
dado que r = λ1 − qλ2 ∈ b.
De otro lado, se tiene
n
X n
X
Φ(Λ1 ) = φ(r) + < φ(λ1 ) + φ(λi ) = Φ(Λ).
i=2 i=2
Teorema 4.4.16. Sea (R, φ) un dominio euclı́deo y M un R−módulo libre de torsión y finita-
mente generado. Entonces, todo sistema generador de M de cardinal minimal es base de M .
En particular, si (R, φ) es euclı́deo y M es finitamente generado, entonces,
M es libre de torsión ⇐⇒ M es libre
Demostración. La segunda afirmación es consecuencia de la primera. Si M es finita-
mente generador, existe un sistema generador de M de cardinal minimal y, por tanto, si M es
libre de torsión, entonces ese sistema generador es base de M como R−módulo, por cuanto M
es libre. Para la otra implicación véase la Proposición 4.4.3 anterior.
v) Con las mismas notaciones, para cada polinimio g ∈ K[X] definamos la siguiente
correspondencia:
ηg := K[X]/a −→ K[X]/a
h+a 7−→ gh + a.
Prueba que es un endomorfismo de espacios vectoriales (que se denomina homotecia
de razón g de K[X]/a y que es un endomorfismo de K[X]−módulos. Prueba que se
dan las siguientes propiedades:
ηg1 +g2 = ηg1 + ηg2 , ηg1 g2 = ηg2 ◦ ηg1 = ηg1 ◦ ηg2 , ∀g1 , g2 ∈ K[X].
η0 = 0, η1 = IdK[X]/a .
vi) Prueba que la matriz de ηg en la base β anterior es
g(C(f )) ∈ Mn (K),
donde C(f ) es la matriz compañera de f y g(C(f )) es el resultado de evaluar g en
X = C(f ) matricialmente.
Problema 169. Con las mismas notaciones, si v ∈ V es un vector y µv es un polinomio de
grado k, el siguiente subespacio vectorial de V es submódulo como K[X]−módulo:
W (v, ϕ) := Khv, ϕ(v), ϕ2 (v), . . . , ϕk−1 (v)i.
(Pista: probar que es invariante con respecto a ϕ) Se pide también:
i) La dimensión de W (v, ϕ) es k. (Pista: probar que {v, ϕ(v), ϕ2 (v), . . . , ϕk−1 (v)} son
linealmente independientes sobre K).
ii) Consideremos la restricción de ϕ al subespacio W (v, ϕ) (tiene sentido porque W (v, ϕ)
es subespacio invariante):
φ := ϕW (v,ϕ) : W (v, ϕ) −→ W (v, ϕ)
w 7−→ ϕ(w).
Prueba que existe una base β de W (v, ϕ) tal que la matriz de φ en esa base β es la
matriz compañera del polinomio mı́nimo de f en v. (Pista: usar
β := {v, ϕ(v), ϕ2 (v), . . . , ϕk−1 (v)}).
Problema 170. Con las notaciones de los problemas anteriores, sea ϕ : V −→ V un endo-
morfismo de un espacio vectorial V de dimensión n sobre un cuerpo K. Sea v ∈ V un vector
no nulo y sea µv el polinomio mı́nimo de ϕ en v. Supongamos que el grado de µv es k. Prueba
que se puede encontrar un subespacio V1 ⊆ V de dimensión n − k, tal que:
M
V = W (v, ϕ) V1 ,
y se satisface la siguiente propiedad: Existe una base {wk+1 , . . . , wn } de V1 tal que para todo i,
1 ≤ i ≤ n − k, existen ci ∈ K y hi ∈ V1 tales que
ϕ(wi ) = ci v + hi .
( Pista: Completa la base {v, ϕ(v), ϕ2 (v), . . . , ϕk−1 (v)} de W (v, ϕ) hasta obtener una base de
V : β0 := {v, ϕ(v), ϕ2 (v), . . . , ϕk−1 (v), uk+1 , . . . , un }. Denotemos por V0 el subespacio generado
por {uk+1 , . . . , un }. Para cada i, k + 1 ≤ i ≤ n, la imagen de ui a través de ϕ será de la forma:
k−1
X
ϕ(ui ) = c0 v + cj f j (v) + λui + hi ,
j=1
donde
• c0 , c1 , . . . , ck−1 , λ ∈ K,
• hi es un elemento del subespacio de V0 generado por los elementos que la base de V0
que no son ui . Es decir,
hi ∈ Kh{ut : t 6= i}.
214 4. PRIMOS, MAXIMALES. MÓDULOS LIBRES. FORMA NORMAL DE SMITH
Con estas notaciones, construye una solución (x0 , . . . , xk−2 ) ∈ K n−2 del siguiente sistema de
ecuaciones lineales:
Xk−2 + ck−1 = 0,
Xk−3 + c k−2 + λX k−2 = 0
.
..
Xt + ct+1 + λXt+1 = 0
..
.
X0 + c1 + λX1 = 0.
Es decir, prueba que este sistema es compatible y considera (x0 , . . . , xk−2 ) ∈ K n−1 una solución.
Define c00 := c0 + λx0 . Define:
k−2
X
wi := ui + xi f t (v).
t=0
ii) Probar que si f, g ∈ K[X] son dos soluciones del Problema de Interpolación, entonces,
f − g es una solución del Problema de Interpolación homogéneo:
A0 0
A1 0
V dMn×m (α1 , . . . , αn ) . = . .
.. ..
Am 0
Probar que el conjunto de soluciones de este Problema de Interpolación homogéneo es
la intersección n ∩ K[X]m , donde n es el ideal dado mediante: n := ∩ni=1 mαi .
4.5. DIAGONALIZACIÓN DE MATRICES SOBRE UN DIP 217
iii) Con las notaciones anteriores, probar que el conjunto de todas las soluciones del Prob-
lema de Interpolación inicial es dado mediante:
fLg + (n ∩ K[X]m ) = {fLg + h : h ∈ n ∩ K[X]m }.
Problema 176. Sea K un cuerpo cualquiera y p ∈ K[X] un polinomio de grado a lo sumo n.
Prueba que p no puede tener más de n raı́ces distintas en K. (Pista: recordar qué raı́ces son
las soluciones de la ecuación p(X) = 0. Prueba la afirmación usando el Problema precedente).
Problema 177. Sea K un cuerpo cualquiera y A ∈ Mn (K) una matriz cuadrada. Se pide:
i) Prueba que A no puede tener más de n valores propios distintos.
ii) Prueba que si A posee n valores propios distintos, entonces es diagonalizable.
iii) Prueba que el recı́proco de la afirmación anterior no es cierto.
( Hint: Aplicar interpolación al polinomio caracterı́stico (para la afirmación i). Para las otras
usar la forma cı́clica del endomorfismo.)
Problema 178. Lee el extracto de texto que aparece descrito al principio del Capı́tulo. La “es-
cena” descrita es un clásico, amplia y universalmente reconocible para cualquiera mı́nimamete
educado, sin necesidad de acudir a Wikipedia. Explica quién fue su autor, a qué obra pertenece,
qué papel juega la evocación y la decadencia en su contenido semántico y sintático. ¿Tiene la
obra de este autor, y en especial el tı́tulo de su obra, algo que ver con el contenido del Capı́tulo?.
4.5.1. Motivaciones.
4.5.1.1. Ecuaciones diofánticas. La forma normal de Smith nos permitirá analizar sis-
temas de ecuaciones lineales sobre un DIP y nos permitirá disponer de “algoritmos” en el caso
de que ese anillo sea un dominio euclı́deo. En esencia, sean dados
i) Una matriz A ∈ Mm×n (R) con m filas, n columnas y coordenadas en un dominio de
ideales principales R.
ii) Un elemento B ∈ Rm dado como columna.
iii) Una columna de variables X:
X1
X2
X := . .
..
Xn
el objetivo consiste en resolver el sistema de ecuaciones siguiente:
(4.5.1) AX = B.
Se trata de resolver y responder a las siguentes preguntas:
• ¿Es el sistema (4.5.1) compatible sobre Rn ?. Es decir, responde a la siguiente pregunta:
∃x := (x1 , . . . , xn ) ∈ Rn , Axt = B?,
donde xt significa traspuesta de x.
• Si el sistema (4.5.1) es compatible, hallar una solución particular x0 ∈ Rn de ese
sistema.
• Da una descripción completa del conjunto de todas las soluciones del sistema (4.5.1).
Para la tercera de las preguntas ya tenemos una resuesta parcial. Supongamos que x0 ∈ Rn
es una solución particular del sistema (4.5.1). Entonces, consideramos el conjunto K ⊆ Rn de
todas las soluciones del sistema homogéneo asociado al sistema (4.5.1) anterior. Es decir, el
sistema:
218 4. PRIMOS, MAXIMALES. MÓDULOS LIBRES. FORMA NORMAL DE SMITH
(4.5.2) AX = 0,
donde 0 es el vector columna formado solamente por ceros. Entonces se tiene:
Proposición 4.5.1. Con las anteriores notaciones, supongamos que existe x0 ∈ Rn una
solución particular de un sistema de ecuaciones del tipo (4.5.1) anterior y sea K ⊆ Rn el
conjunto de las solciones del sistema (4.5.2) homogéneo asociado. Entonces, el conjunto de
todas las soluciones del sistema (4.5.1) es dado por el conjunto:
x0 + K := {x0 + u : u ∈ K} ⊆ Rn .
Más aún, K es un submódulo libre de Rn de rango a lo sumo n. Una descripción completa de
las soluciones de un sistema (4.5.1) compatible vendrı́a dada por la siguiente información:
i) La solución particular x0 ∈ Rn ,
ii) Una base de K como R−módulo libre: β := {v1 , . . . , vn } ⊆ Rn .
El conjunto de todas las soluciones del sistema (4.5.1) en forma paramétrica vendrı́a dado por:
m
X
x0 + K := {x0 + ti vi : (t1 , . . . , tm ) ∈ Rm }.
i=1
4.5.2.2. Tipo 2: Multiplicar a una fila (o columna) por una unidad del anillo.
Lema 4.5.4 (Multiplicar a una fila (o columna) por una unidad del anillo). Sea u ∈ R×
una unidad en el anillo R. Consideremos la matriz
u 0
U := ∈ GL(2, R),
0 1
cuya inversa es la matriz:
u−1 0
U :=−1
∈ M2 (R),
0 1
cuyo determinante verifica det(P ) = u ∈ R∗.
Se verifican las propiedades siguientes:
i) Para cada matriz A ∈ M2×n (R), con 2 filas y n columnas, la matriz U A es la matriz
obtenida multiplicando la fila 1 de A por u.
4.5. DIAGONALIZACIÓN DE MATRICES SOBRE UN DIP 219
ii) Para cada matriz A ∈ Mm×2 (R), con m filas y 2 columnas, la matriz AU es la matriz
obtenida multiplicando la columna 1 de la matriz A por u.
Demostración. Obvio.
Entonces, se tiene:
h ··· ∗···
PA = ,
0 ··· ∗···
Es decir, en la columna primera hemos reemplazado los elementos {a, b} por su máximo
común divisor y 0.
iv) Con las mismas notaciones, supongamos que la matriz A es dada mediante:
a b
.. ..
. .
c d .
A :=
.. ..
. .
Entonces, se tiene:
h 0
.. ..
. .
∗ ∗ ,
AP =
.. ..
. .
Es decir, en la fila primera hemos reemplazado los elementos {a, b} por su máximo
común divisor y 0.
1 0
..
.
0 1
α β
Ei,j (P ) :=
.. .
.
σ τ
1 0
..
.
0 1
i) Las matrices Ei,j (P ) matrices inversibles en Mr (R) y sus inversas son Ei,j (P −1 ), es
decir Ei,j (P )Ei,j (P −1 ) = Idr .
ii) Para cada matriz A ∈ Mm×n (R), con m filas y n columnas, de la forma:
∗ ∗
..
.
∗ ∗
a c
A :=
.. ,
.
b d
∗ ∗
..
.
∗ ∗
∗ ∗
..
.
∗ ∗
αa + βb αc + βd
Ei,j (P )A :=
.. ,
.
σa + τ b σc + τ d
∗ ∗
..
.
∗ ∗
es decir,
• la fila i−ésima de Ei,j (P )A es la suma de la fila i−ésima de A multiplicada por
α más la fija j−ésima de A multiplicada por β,
• la fila j−ésima de Ei,j (P )A es la suma de la fila i−ésima de A multiplicada por
σ más la fija j−ésima de A multiplicada por τ ,
dejando sin modificar el resto de filas.
iii) Para cada matriz A ∈ Mm×n (R), con m filas y n columnas, como en el ejemplo
anterior, tomando r = n, la matriz AEi,j (P ) es la matriz de la forma:
222 4. PRIMOS, MAXIMALES. MÓDULOS LIBRES. FORMA NORMAL DE SMITH
∗ ∗
..
.
∗ ∗
αa + σc βa + τ c
AEi,j (P ) :=
.. ,
.
αb + σd βb + τ d
∗ ∗
..
.
∗ ∗
es decir,
• la columna i−ésima de AEi,j (P ) es la suma de la columna i−ésima de A multi-
plicada por α más la columna j−ésima de A multiplicada por σ,
• la columna j−ésima de AEi,j (P )A es la suma de la columna i−ésima de A mul-
tiplicada por β más la columna j−ésima de A multiplicada por τ ,
dejando sin modificar el resto de columnas.
A las matrices Ei,j (P ) anteriores se las denomina matrices elementales sobre un dominio de
ideales principales R.
Demostración. Ejercicio de mera comprobación.
4.5.4. Matrices elementales particulares. Sea R un dominio de ideales principales.
Consideraremos las siguientes clases de matrices elementales:
Corolario 4.5.8 (Intercambiar dos filas o dos columnas). Consideremos la matriz
0 1
P := ∈ M2 (R).
1 0
Sea r = m ∨ n, entonces, las matrices
Ei,j := Ei,j (P ),
verifican las propiedades siguientes:
i) Son matrices inversibles en Mr (R) y sus inversas son ellas mismas, es decir Ei,j
2
=
Idr .
ii) Para cada matriz A ∈ Mm×n (R), con m filas y n columnas, tomando r = m, la matriz
Ei,j A es la matriz obtenida intercambiando las filas i y j de la matriz A.
iii) Para cada matriz A ∈ Mm×n (R), con m filas y n columnas, tomando r = n, la matriz
AEi,j es la matriz obtenida intercambiando las columnas i y j de la matriz A.
Demostración. Basta con aplicar la Proposición 4.5.7.
Corolario 4.5.9 (Multiplicar una fila o columna por una unidad). Sea u ∈ R× una
unidad en el anillo R. Consideremos la matriz
u 0
P := ∈ M2 (R),
0 1
cuya inversa es la matriz:
u−1
0
P −1
:= ∈ M2 (R),
0 1
Sea r = m ∨ n, entonces, las matrices
Ti (u) := Ei,j (P ),
verifican las propiedades siguientes:
i) Son matrices inversibles en Mr (R) y sus inversas son dadas por la inversa de P , es
decir Ti (u)Ti (u−1 ) = Idr .
ii) Para cada matriz A ∈ Mm×n (R), con m filas y n columnas, tomando r = m, la matriz
Ti (u)A es la matriz obtenida multiplicando la fila i de A por u.
4.5. DIAGONALIZACIÓN DE MATRICES SOBRE UN DIP 223
iii) Para cada matriz A ∈ Mm×n (R), con m filas y n columnas, tomando r = n, la matriz
ATi (u) es la matriz obtenida multiplicando la columna i de la matriz A por u.
Corolario 4.5.10 (Sumar a una fila o columna un múltiplo de otra fila o columna).
Sea a ∈ R un elemento cualquiera en el anillo R. Consideremos la matriz
1 0
P := ∈ M2 (R),
a 1
cuya inversa es la matriz:
1 0
P −1
:= ∈ M2 (R),
−a 1
Sea r = m ∨ n, entonces, las matrices
Corolario 4.5.11 (Reemplazar dos elementos de una columna (o fila) por su máximo
común divisor). Sean a, b ∈ R dos elementos en un dominio de ideales principales y sea h su
máximo común divisor. Distingamos dos casos:
• Si a | b, definamos:
α β 1 0
P := = ,
−τ σ −q 1
donde b = qa.
• En otro caso, sean α, β ∈ R dos elementos que verifican la identidad de Bézout para
a y b. Es decir,
αa + βb = h.
Sean σ, τ ∈ R los elementos dados mediante:
a b
σ := , τ := .
h h
Y definamos la matriz P ∈ M2 (R) mediante:
α β
P := .
−τ σ
Se tiene:
i) La matriz P es una matriz inversible, con matriz inversa:
σ −β
P −1 := .
τ α
Por tanto, la matriz Ei,j (P ) asociada a esta operación elemental (en el sentido de la
Proposición 4.5.7 anterior) es inversible.
224 4. PRIMOS, MAXIMALES. MÓDULOS LIBRES. FORMA NORMAL DE SMITH
mientras que, por las reglas descritas, A es afectado por ambos tipos de operacioes:
s
! r
Y Y
B := Pi A Qj .
i=1 j=1
1De acuerdo con el Diccionario de la R.A.E. orlar significa “ Adornar un vestido u otra cosa con guarniciones
al canto. Poner la orla en el escudo.” Recuérdese que “orla” significa: “ Orilla de paños, telas, vestidos u otras
cosas, con algún adorno que la distingue. Adorno que se dibuja, pinta, graba o imprime en las orillas de una
hoja de papel, vitela o pergamino, en torno de lo escrito o impreso, o rodeando un retrato, viñeta, cifra, etc.”..
226 4. PRIMOS, MAXIMALES. MÓDULOS LIBRES. FORMA NORMAL DE SMITH
Obviamente, como GL(m, R) y GL(n, R) son grupos y las matrices Pi y Qj son inversibles,
S 0 ∈ GL(m, R) y T 0 ∈ GL(n, R). Además, obviamente, se tendrá:
!−1 s ! r −1
s
Y Y Y r
Y
(S 0 )−1 B(T 0 )−1 = S −1 Pi Pi A Qj Qj T −1 .
i=1 i=1 j=1 j=1
Proposición 4.5.13. Con las anteriores notationes, existe un número finito de operaciones
elementales por filas (i.e. multiplicar por matrices del tipo Ei,j (P )) que permiten transformar
Orl(A) en una matriz
S B
Orl := ,
0 T
tal que SAT = B, S y T son producto de matrices elementales Ei,j (P ) y B tiene la forma:
h ∗ ··· ∗
0 ∗ · · · ∗
B := . . ,
.. ..
. ..
0 ∗ ··· ∗
donde h = gcd(a1 , . . . , am ).
Un resultado idéntico se obtiene reemplazando filas por columnas en la descripción anterior.
Demostración. Usaremos la Proposición 4.5.7 y el Corolario 4.5.11. No pondremos las
operaciones en la matriz orlada para evitar repeticiones. A partir de esa Proposición es claro
que podemos multiplicar por una matriz de tipo E1,2 (P ) para obtener una nueva matriz con la
forma siguiente:
h1 ∗ · · · ∗
0 ∗ · · · ∗
E1,2 (P )A := a3 ∗ · · · ∗ ,
.. . .
. . ..
.
am ∗ ··· ∗
donde h1 = gcd(a1 , a2 ). Repitiendo el proceso (un humilde for i = 2 to m do) con a3 hasta
am , obtendremos el resultado apetecido.
Supongamos ahora (R, φ) un dominio euclı́deo y una matriz A ∈ Mm×n (R). Supongamos que
la matriz A tiene la forma:
a1 ∗ · · · ∗
a2 ∗ · · · ∗
A := . . ,
.. ..
. ..
am ∗ · · · ∗
Proposición 4.5.14. Supongamos que a1 6= 0 por simplicidad. Con las anteriores notationes,
existe un número finito de operaciones elementales por filas (i.e. multiplicar por matrices del
tipo Ei,j (P )), con los tipos 1 a 3, que permiten transformar Orl(A) en una matriz
S B
Orl := ,
0 T
tal que SAT = B, S y T son producto de matrices elementales Ei,j (P ) y B tiene la forma:
h ∗ ··· ∗
0 ∗ · · · ∗
B := . . ,
.. ..
. ..
0 ∗ ··· ∗
donde h = gcd(a1 , . . . , am ).
Un resultado idéntico se obtiene reemplazando filas por columnas en la descripción anterior.
Demostración. Usaremos fundamentalmente el Algoritmo de Euclides para el cálculo del
máximo común divisor (cf. Teorema 3.4.5). El proceso se descompone del modo siguiente. En
primer lugar, aplicamos el siguiente algoritmo (escribimos solamente el efecto sobre la matriz
A,aunque debe entenderse que las operaciones realizadas se extienden a la matriz orlada):
Supongamos como hipótesis que
φ(a1,1 ) = min{φ(ai,1 ) : 1 ≤ i ≤ m} > φ(0).
Esto nos lleva al algoritmo siguiente (de nuevo describo el algoritmo solamente sobre la matriz
de interés, asumiendo que el lector es consciente de la presencia de las matrices de cambio de
base)):
Obviamente, el procedimiento irá reemplazando el elemento que aparece en el lugar (1, 1) por un
elemento con menor valor de φ. Como en la Demostración del Algoritmo de Euclides (Teorema
3.4.5), al cabo de un número finito de pasos encontraremos una matriz de la forma deseada.
Proposición 4.5.17. Supongamos que, con estas notaciones, realizamos de manera alternativa
las operaciones hacer ceros por columna o hacer filas en la primera fila y primera columna.
Entonces, tras una número finito de aplcaciones de matrices Ei,j (P ) (por filas y por columnas)
obtendremos una nueva matriz de la forma:
h1,1 0 · · · 0
0 ∗ · · · ∗
A0 := . .. .
. . .
. . .
0 ∗ ··· ∗
Demostración. Usaremos el algoritmo hacer ceros por filas y hacer ceros por columnas y
la condición de Dominio de Ideales Principales y el subalgoritmo (por filas o columnas) descrito
en la Proposición 4.5.13. Tras aplicar este procedimiento, llegamos a una matriz de la forma:
h b1,2 ··· b1,n
0 ∗ ··· ∗
B := . .. .
.. ..
. .
0 ∗ ··· ∗
Ahora tocarı́a hacer ceros por columnas. Pero debemos observar que aplicamos las matrices
Ei,j (P ) por la derecha, donde P es del tipo 4. Esto significa que, trabajando una sola vez con
la primera y segunda columnas, la nueva matriz tendrá la forma:
4.5. DIAGONALIZACIÓN DE MATRICES SOBRE UN DIP 229
h0
0 c1,3 · · · c1,n
c2,1 ∗ ∗ ··· ∗
B 0 := . .. ,
.. ..
. .
cm,1 ∗ ∗ ··· ∗
donde la primera columna de B 0 se obtiene como combinación de las dos primeras columnas de
B. Es decir, 0
h h b1,2
c2,1 0 b2,2
.. = α .. + β .. ,
. . .
cm,1 0 bm,2
donde
h0 := gcd(h, b1,2 ), αh + βb1,2 = h0 .
En particular: ¡Hemos perdido la condición de que todas las coordenadas de la primera columna
sean nulas a partir de la segunda!.
Esto es lo que obliga a definir un algoritmo como el siguiente (de nuevo se describe usando
solamente la matriz sobre la que se trabaja prioritariamente, dejando las matrices de la orla a
la discrecionalidad del lector):
Llamemos hi al resultado escrito en el lugar (1, 1) de la matriz obtenida tras i pasos por el ciclo
while. Observamos que, en cada caso, hi | hi−1 puesto que hi el máximo común divisor de
hi−1 con elementos de la primera fila o la primera columna. Por tanto, tenemos una cadena de
ideales en R. Definamos ai = (hi ) ⊆ R el ideal generado por hi . Entonces, tenemos una cadena
ascendente de ideales de R:
a0 ⊆ a1 ⊆ · · · ⊆ an ⊆ · · · ⊆ R,
donde h0 = a1,1 . Ahora interviene la condición noetheriana de los dominios de ideales princi-
pales (cf. Teorema 3.3.2). Es decir, existe r ∈ N tal que at = ar , ∀t ≥ r. Es decir, la cadena se
estabiliza a partir del lugar r.
Supongamos, sin pérdida de la generalidad, que hr se obtuvo dentro del ciclo while después de
hacer ceros en la primera columna y tenemos una matriz de la forma:
hr k1,2 · · · k1,n
0 ∗ ··· ∗
Ar := . .. .
. . .
. . .
0 ∗ ··· ∗
La siguiente operación serı́a hacer ceros en la primera fila y poner, en lugar de hr a hr+1 que es
hr+1 = gcd(hr , k1,2 , . . . , k1,n ).
Pero, como ar = ar+1 , hr y hr+1 son elementos asociados de R, luego también podemos escribir
hr = gcd(hr , k1,2 , . . . , k1,n ).
230 4. PRIMOS, MAXIMALES. MÓDULOS LIBRES. FORMA NORMAL DE SMITH
Esto quiere decir que hr | k1,i para todo i, 2 ≤ i ≤ n. Por tanto, al realizar el proceso de hacer
ceros en la primera fila de la nueva matriz podemos, simplemente, restar a cada columna, la
k
primera columna multiplicada por h1,i r
∈ R y obtendremos una matriz de la forma deseada.
matrices regulares P y Q (como producto finito de las operaciones elementales realizadas) tales
que
a1 0 · · · 0
0 a2 · · · 0
0
P AQ = B = ... ..
.. ∈ Mm×n (R).
. .
0 0 ··· ar
0 0
Demostración. En realidad, todo es consecuencia del hecho de poder llegar a una matriz
de la forma:
h 0 ··· 0
0 ∗ · · · ∗
B := . .. .
.. .
0 ∗ ··· ∗
Esto se obtiene por el procedimiento de hacer ceros en primera fila y primera columna descrito
en la Proposición 4.5.17 que, a su vez se sigue de la condición notheriana. Seguidamente se
trata de hacer ceros en la primera fila y columna de la submatriz
∗ ··· ∗
B 0 := ... .. .
.
∗ ··· ∗
Xn
iii) B es un vector columna con coordenadas en Z:
b1
B := ... ∈ Zm .
bm
El objetivo del estudio de las ecuaciones lineales diofánticas es estudiar la existencia de solu-
ciones en Zn de ecuaciones del tipo descrito en la identidad (4.5.3) anterior. Es decir, estudiar:
x1 a1,1 · · · a1,n x1 b1
.. n .. . . .
. .. ..
∃ . ∈ Z , . . . . = . .
xn am,1 ··· am,n xn bm
El siguiente resultado no sólo caracteriza la existencia, sino que también caracteriza las solu-
ciones en caso de que existan.
232 4. PRIMOS, MAXIMALES. MÓDULOS LIBRES. FORMA NORMAL DE SMITH
B 0 := P B = ... ∈ Zm .
b0m
Entonces,
i) El sistema de ecuaciones es compatible sobre Zn (es decir posee soluciones en Zn ) si
y solamente si se verifican las siguientes propiedades:
(a) b0i = 0, para todo i, con r + 1 ≤ i ≤ m.
(b) dj | b0j , para todo j, con 1 ≤ j ≤ r.
ii) Si el sistema es compatible sobre Zn , entonces, una solución del sistema viene dada
por la siguiente identidad:
b0
1
d.1
.
.
x1 b0r
..
X0 := . = Q dr ∈ Zn ,
0
xn
.
..
0
n
iii) Si el sistema es compatible sobre Z , el conjunto de todas las soluciones del sistema
AX = B viene dado por el conjunto siguiente:
X0 + N := {X0 + z : z ∈ N },
donde N es el submódulo libre de Zn generado por las n − r últimas columnas de Q.
Demostración. Nótese que Q : Zn −→ Zn define un isomorfismo dado que Q es una
matriz inversible sobre Z. Esto significa que podemos considerar un “cambio de variables” del
modo siguiente:
Y1 X1
Y = ... = Q−1 X = Q−1 X := ...
Yn Xn
Y podemos considerar un nuevo sistema de ecuaciones lineales diofánticas lineales dado medi-
ante:
(AQ)Y = B.
Nótese que se tiene la obvia propiedad siguiente:
y1 x1 y1
.. n .. .. n
. ∈ Z satisface (AQ)Y = B ⇔ . = Q . ∈ Z satisface AX = B.
yn xn yn
Las condiciones de compatibilidad y los tipos de soluciones se preservan con la identificación
propuesta.
4.5. DIAGONALIZACIÓN DE MATRICES SOBRE UN DIP 233
(P AQ)Y = B 0 ,
d.1
.
.
b0r
dr ∈ Zn .
0
.
..
0
Pero como sabemos que las soluciones de esta ecuación están relacionadas con las soluciones de
la ecuación AX = B a través de Q tendremos que una solución particular del sistema AX = B
es la dada mediante:
b0
1
d.1
.
.
x1 b0r
.. n
. = Q dr ∈ Z ,
0
xn
.
..
0
y tenemos probada la afirmación ii) del enunciado. Para estudiar el conjunto de todas las
soluciones, baste con observar que se tiene la siguiente propiedad:
Dados x, z ∈ Zn soluciones del sistema AX = B, entonces x − z ∈ Zn es solución del sistema
AX = 0, donde 0 es el vector columna en Zm con coordenadas todas nulas. Por tanto, se
trata de estudiar cómo son todas las soluciones del sistema “homogéneo” AX = 0. De nuevos,
usando Q y P podemos observar que las soluciones de AX = 0 son dadas mediante QN , donde
N ⊆ Zn es el conjunto de las las soluciones del sistema homogéneo (AQ)Y = 0. Por ser P
inversible las soluciones de (AQ)Y = 0 con las solciones de (P AQ)Y = 0 y, de nuevo, son las
234 4. PRIMOS, MAXIMALES. MÓDULOS LIBRES. FORMA NORMAL DE SMITH
O, equivalentemente,
d1 Y1 = 0
d2 Y2
= 0
..
.
dr Yr = 0
Luego las soluciones del sistema (P AQ)Y = 0 son los elementos de N := {0}r × Zn−r ⊆ Zn .
Concluiremos ası́ que las soluciones del sistema “homogéneo” original son los elementos del
siguiente conjunto:
Q {0}r × Zn−r .
Algoritmo 4.6.1 (Cálculo de la Forma Normal de Smith de una matriz en Mm×n (R)).
d1 0 ··· 0
0 d2 ··· 0
.. .. 0
B :=
.. ∈ Mm×n (R),
. . .
0 0 ··· dr
0 0
de tal modo que di | di+1 , 1 ≤ i ≤ r − 1.
divisores de los menores de la matriz inicial, basta también con aplicar inducción. El caso k = 1
es claro. El paso inductivo se basa en que las matrices P y Q usadas para las transformaciones
son producto de matrices elementales de las descritas anteriormente y no modifican el máximo
común divisor de los menores. Omitimos el detalle.
Además, los elementos d1 , . . . , dr son únicos y se denominan factores invariantes del grupo G.
Demostración. Comencemos recordando que todo grupo abeliano finitamente generado
es el co-núcleo de un morfismo entre Z−módulos libres finitamente generados, es decir, existe
una matriz A ∈ Mm×n (Z) que define un morfismo de Z−módulos A : Zn −→ Zm , de tal modo
que G es isomorfo al cociente:
Zm / Im(A) ∼
= G.
Más correctamente, tenemos una sucesión exacta
Zn −→ Zm −→ G −→ 0.
Ahora bien, usando la forma normal de Smith de A podemos disponer de isomorfismos de los
Z−módulos (dados por las matrices P y Q que nos conducen a un diagrama conmutativo de
Z−módulos que tiene la forma siguiente:
A
Zn −→ Zm −→ G −→ 0
Q ↓ ↓ P ↓
Zn −→ Zm −→ G −→ 0
D
donde D es una matriz diagonal, que puedo suponer de la forma:
d1 0 · · · 0
0 d2 · · · 0
.. .. 0
D := . .. ∈ Mm×n (Z).
. .
0 0 · · · dr
0 0
La conclusión obvia es que G es también isomorfo al cociente siguiente como Z−módulo:
Zm / Im(D) ∼
= G.
Ahora bien, por ser D diagonal es obvio que el cociente tiene la forma:
r
!
∼ Z / Im(D) = ∼
Y
m
G= (Z/di Z) ⊕ Zn−r .
i=1
Afirmación. Sea M un grupo abeliano finito y supongamos que M admite dos descomposi-
ciones: ! !
r s
M∼ (Z/di Z) ∼
Y Y
= = (Z/gi Z) ,
i=1 i=1
de tal modo que ninguno de los di ’s ni ninguno de los gj ’s es unidad en Z y se satisface di | di+1
y gi | gi+1 . Entonces,
r = s.
Demostración de la Afirmación. Para empezar tenemos que el orden del grupo M satisface:
r
Y s
Y
] (M ) = di = gj .
i=1 j=1
Seguidamente, tenemos el Z/m−espacio vectorial M/mM que admite las siguientes dos repre-
sentaciones:
r r
M/mM ∼ ((Z/di Z) / (m/di Z)) ∼
Y Y
= = (Z/m) ,
i=1 i=1
y
s s
M/mM ∼ ((Z/gj Z) / (m/gj Z)) ∼
Y Y
= = (Z/m) ,
j=1 j=1
donde hemos usado el Segundo Teorema de Isomorfı́a. Pero, entonces, tenemos la siguiente
igualdad de dimensiones entre espacios vectoriales sobre Z/m:
dimZ/m (M/mM ) = r = s.
Con lo que hemos concluido que r = s.
Tenemos ası́ dos descomposiciones de la forma siguiente:
r
! r
∼ ∼
Y Y
(4.6.2) M = T orZ (G) = (Z/di Z) = (Z/gi Z) ,
i=1 j=1
De tal modo que ninguno de los di ’s ni ninguno de los gj ’s es unidad en Z y se satisface di | di+1
y gi | gi+1 .
Consideremos x ∈ Z y la siguiente homotecia
ηx : M −→ M
m 7−→ xm.
Es un morfismo de grupos abelianos que, obviamente, se interpreta sobre las dos descomposi-
ciones del modo obvio:
Qr Qr
ηx : ( i=1 (Z/di Z)) −→ ( i=1 (Z/di Z))
(h1 + (d1 ), . . . , hr + (dr )) 7−→ (xh1 + (d1 ), . . . , xhr + (dr )).
Q Q
r r
ηx : j=1 (Z/gi Z) −→ j=1 (Z/gi Z)
(h1 + (g1 ), . . . , hr + (gr )) 7−→ (xh1 + (g1 ), . . . , xhr + (gr )).
4.6. FORMA NORMAL DE SMITH 239
Dado que todos son enteros positivos, podemos suponer que existe t ≤ r tal que 1 ≤ t y di = d1 ,
para 1 ≤ i ≤ t y dj > d1 para t + 1 ≤ j ≤ r. Supongamos x = d1 y consideremos la homotecia
ηd1 precedente. Tenemos que, dado que d1 | di , por la primera forma se tiene:
r
Y
Im(ηd1 ) = (d1 Z/di Z) ,
i=1
porque dk+1 Z/di Z = 0 para 1 ≤ i ≤ k (porque di | dk+1 en esos casos). De otro lado, como
gi = di para 1 ≤ i ≤ k, la imagen tendrá también la forma siguiente:
r r
Im(ηdk+1 ) ∼
Y Y
= ((dk+1 Z + gj Z) /gj Z) = (pj Z/gj Z) ,
j=k+1 j=k+1
Coker(ηdk+1 ) ∼ Z/dk+1 Z ∼
Y Y Y Y
= Z/di Z × = Z/gi Z × Z/pj Z .
i=1 j=k+1 i=1 j=k+1
lo que implica
r
Y
dr−k
k+1 = gcd(dk+1 , gj ).
j=k+1
Usando el mismo argumento que en el caso d1 , concluiremos que dk+1 ≤ gk+1 y, en particular,
dk+1 = gk+1 .
Por tanto, di = gi para cada i, 1 ≤ i ≤ r y tenemos la unicidad buscada.
240 4. PRIMOS, MAXIMALES. MÓDULOS LIBRES. FORMA NORMAL DE SMITH
Corolario 4.6.4. Sea (G, +) y (G0 , +) dos grupos abelianos libres. Supongamos que G es sub-
grupo de G0 y que ambos tienen el mismo rango como Z−módulos: rankZ (G) = rankZ (G0 ) = n.
Sea B 0 := {u1 , . . . , un } una base cualquiera de G0 y sea B := {v1 , . . . , vn } una base cualquiera
de G. Sea A ∈ Mn (Z) la matriz cuyas columnas son las coordenadas de los vectores de la base
B de G en la base B 0 de G0 . Supongamos que det(A) 6= 0. Entonces, el grupo cociente G0 /G
es un grupo abeliano finito y su orden satisface:
] (G0 /G) = | det(A)|.
Demostración. Consideremos la Forma Normal de Smith de A y las matrices de la trans-
formación P, Q ∈ GL(n, Z) de tal modo que
f1 0 · · · 0
0 f2 · · · 0
(4.6.3) P AQ = N := . .. ,
.. ..
. .
0 0 · · · fn
donde f1 , . . . , fn son los factores invariantes. Nótese que son todos no nulos porque det(A) 6= 0.
De hecho, tenemos que la matriz A es la matriz del morfismo de Z−módulos que, en términos
de coordenadas, viene dado del modo siguiente:
0
A: G 7−→ G
x1
.. .
(x1 , . . . , xn ) 7−→ A .
xn
0
Obsérvese que se trata de la inclusión de G en G escrita en las coordenadas de las distintas
bases. Entonces, la Igualdad (4.6.3) se transforma en el siguiente diagrama conmutativo de
Z−módulos:
A
G G0
Q N
G G0
P
A partir de este diagrama, concluimos que los siguientes grupos abelianos son isomorfos:
G0 /G ∼
= G0 / Im(A) ∼
= G0 / Im(N ).
Ahora bien, como N es una matriz diagonal, es obvio que
n
G0 / Im(N ) ∼
Y
= Z/fi Z.
i=1
Argumentos similares a los del Teorema 4.6.3 se aplican a cualquier dominio de ideales prin-
cipales, dando lugar al Teorema General de Estuctura de R−módulos finitamente generados
sobre un DIP:
4.7. FORMA DE FROBENIUS Y FACTORES INVARIANTES 241
A los polinomios mónicos f1 , . . . , fr ∈ K[X] se les denomina factores invariantes del endomor-
fismo ϕ (o de la matriz M ).
Demostración. Como K[X] es un dominio de ideales principales, lo único que manifiesta
este enunciado es la existencia de factores invariantes de la matriz XIdn − M ∈ Mn (K[X]).
Lo único a observar, para tener la Igualdad (4.7.1), es que las unidades del anillo K[X] vienen
dadas por K[X]× = K \ {0}. Por la propiedad del producto de los determinantes, se ha de
tener:
Y r
det(P ) det (XIdn − M ) det(Q) = fi ,
i=1
Como el polinomio caracterı́stico es mónico y los polinomios fi ’s elegidos son también mónicos,
entonces det(P ) det(Q) = 1 y se tiene la igualdad buscada.
242 4. PRIMOS, MAXIMALES. MÓDULOS LIBRES. FORMA NORMAL DE SMITH
Proposición 4.7.3. Con las mismas notaciones que en la proposición precedente, daod f ∈
R[X]mon un polinomio mónico, y dada g ∈ R[X], definamos la resultante de f y g mediante:
ResX (f, g) := det(Mg ) = det(g(C(f )),
donde C(f ) es la matriz compañera de f . Se tiene:
i) Se verifica:
ResX (f, g) ∈ (f, g)c = (f, g) ∩ R.
ii) Se tiene ResX (f, g) ∈ R× si y solamente si 1 ∈ (f, g).
Demostración. Las afirmaciones una tras otra:
i) Recordemos el Problema 103 y sea XMg (X) ∈ R[X] el polinomio caracterı́stico de Mg .
Supongamos,
χMg (X) := X n + bn−1 X n−1 + · · · + b1 X + b0 ,
donde
b0 = (−1)n det(Mg ) = (−1)n Resx (f, g).
Ahora, por el aparatado v) de la Proposición precedente y por el Teorema de Hamilton-
Cayley, tendremos que
χMg (Mg ) = 0 =⇒ χMg (g) ∈ (f ).
Es decir, se tiene
g(g n−1 + bn−1 g n−2 + · · · + b1 ) + b0 ∈ (f ).
Luego b0 ∈ (f, g) y, por tanto, ResX (f, g) = (−1)n b0 ∈ (f, g).
244 4. PRIMOS, MAXIMALES. MÓDULOS LIBRES. FORMA NORMAL DE SMITH
ii) Por el ı́tem precedente, si ResX (f, g) ∈ R× es una unidad de R, entonces, 1 ∈ (f, g)c ⊆
(f, g). Recı́procamente, si 1 ∈ (f, g) en R[X], es porque g es una unidad en R[X]/(f ).
Es decir, porque existe h ∈ R[X] tal que
hg + (f ) = 1 + (f ).
En particular, se tiene la siguiente igual de homotecias:
ηh ◦ ηg = ηhg = η1 ,
lo que conlleva la igualdad matricial:
Mh Mg = Mhg = M1 = Idn ,
donde la última igualdad se sigue porque la homotecia η1 es la identidad como endo-
morfismo de R[X]/(f ). Como el determinante es un morfismo de grupos (cf. Teorema
2.3.23), tendremos que
det(Mh Mg ) det(Mh ) det(Mg ) = det(Mgh ) = det(Idn ) = 1.
Luego det(Mg ) ∈ R× y la resultante ResX (f, g) = det(Mg ) ∈ R× .
Lema 4.7.5. Sean f1 , . . . , fr ∈ K[X] una familia finita de polinomios mónicos, Sea
r
Y
V := K[X]/(fi (X)),
i=1
el espacio vectorial dado como el producto cartesiano de las K−álgebras cociente. Consideremos
el endomorfismo:
ηX : V −→ V
(h1 + (f1 ), . . . , hr + (fr )) 7−→ (Xh1 + (f1 ), . . . , Xhr + (fr )).
4.7. FORMA DE FROBENIUS Y FACTORES INVARIANTES 245
Entonces, existe una base de V en la que la matriz de ηX en esa base es de la forma suma
diagonal de las matrices compañeras de f1 , . . . , fr . Es decir, la matriz es la dada por:
C(f1 ) 0 0 0
0 C(f2 ) 0 0
M (ϕ) := .
.. .. .. ..
. . . .
0 0 0 C(fr )
Demostración. A partir de la Proposición precedente es obvio que toma esa forma
tomando para V la base del producto cartesiano de cada uno de los espacios vectoriales
K[X]/(fi ) según se describe en el apartado ii) de la Proposición precedente.
Observación 4.7.6. En el caso del Problema 173 se observa que cada fi es divisible por el
siguiente. En el enunciado que acabamos de dar la condición de divisibilidad no es necesaria.
Demostración. Ser sucesión exacta corta ((cf. Subsección 2.2.5 del Capı́tulo 2)) equivale
a las propiedades i) y ii) del enunciado. Probemos, por tanto, esas propiedades i) y ii). Para
la propiedad i) recordemos la noción de polinomio caracterı́stico de un endomorfismo. Es decir,
el polinomio descrito en la Definición 53 siguiente:
χM (X) := det(XIdn − M ) ∈ K[X].
o lo que es lo mismo:
n
X
(π ◦ ΦX )(ei ) = (ϕ − ai,i IdV )(vi ) + (−ak,i )vk .
k=1,k6=i
Pn
Ahora nótese que ϕ(ei ) = k=1 ak,i vk , lo que nos permite concluir que
n
X
(π ◦ ΦX )(ei ) = ϕ(ei ) − (−ak,i )vk = 0.
k=1
Ahora calculemos la forma normal de Smith de la matriz XIdn − M que tendrá la forma para
P, Q ∈ GL(n, K[X]):
Idn−r 0
f1 · · · 0
P (XIdn − m)Q := ,
0 . .
0 . 0
0 · · · fr
donde Idn−r es la matriz identidad con n−r filas y columnas, y f1 , . . . , fr ∈ K[X] son polinomios
mónicos verificando fi | fi+1 para cada i, 1 ≤ i ≤ r − 1. En particular, existe una unidad
u ∈ K[X]× = K \ {0} tal que:
Yr
χM (X) := u fi (X).
i=1
Por lo tanto, salvo las matrices P, Q ∈ GL(n, K[X]), el cociente de K[X]n por Im(ΦX ) es
isomorfo como K[X]−módulo a:
r
K[X]n / Im(ΦX ) ∼
Y
= (K[X]/(fi )) .
i=1
Esto significa que también son isomorfos como K−espacios vectoriales y, en particular, ten-
dremos que la dimensión como K−espacio vectorial satisface:
Xr
dimK (K[X]n / Im(ΦX )) = deg(fi ) = deg(χM (X)) = n.
i=1
En particular, el epimorfismo π
e de la Ecuación (4.7.5) es un epimorfismo entre dos espacios
vectoriales de la misma dimensión. Es, por tanto, un isomorfismo de K−espacios vectoriales y
de K[X]−módulos y queda probada la Igualdad (4.7.4) y el enunciado.
ηX ϕ
Qr θ
i=1 K[X]/(fi (X)) V
Para verificar que es un diagrama conmutativo basta con recordar (una vez más) la operación
·K[X] que ϕ induce sobre V . Ahora consideremos en la columna izquierda la base Θ de
Qr
i=1 K[X]/(fi (X)) en la que la matriz de ηX sea la suma diagonal de matrices compañeras de-
scrita en la identidad (4.7.6) anterior. Entonces, trasladando la base Θ a través del isomorfismo
θ a una base β := θ(Θ) de V tendremos una base de V en la que la matriz de ϕ es precisamente
la matriz M (ϕ) de la identidad (4.7.6) anterior. Y, por tanto, toda matriz admite forma de
Frobenius.
El lo que respecta al polinomio fr , retomemos la Proposición 4.7.2 precedente. Observa-
mos que el anulador de una matriz depende solamente de su clase de semejanza. Es decir,
si M, M 0 ∈ Mn (K) son dos matrices semejantes, entonces
AnnK[X] (M ) = {m ∈ K[X] : m(M ) = 0} = {m ∈ K[X] : m(M 0 ) = 0} = AnnK[X] (M 0 ).
Y el polinomio mı́nimo de una matriz es, precisamente, el generador de AnnK[X] (M ). Supong-
amos, como en el enunciado que la matriz M es semejante a la suma diagional de matrices
compañeras siguiente:
C(f1 ) 0 0 0
0 C(f2 ) 0 0
FM := . .. ,
. .
.. .. .. .
0 0 0 C(fr )
de la identidad (4.7.6) precedente, con fi | fi+1 . Consideremos un polinomio m ∈ K[X] y
tendremos:
m(C(f1 )) 0 0 0
0 m(C(f2 )) 0 0
m(FM ) = .
.. .. . .. .
..
. .
0 0 0 m(C(fr ))
Por tanto, m(FM ) = 0 si y solamente si
m(C(fi )) = 0, ∀i, 1 ≤ i ≤ r.
Pero el Corolario 4.7.4 nos indica que los polinomios mı́nimos de las matrices compañeras C)fi )
son precisamente los polinomios fi ∈ K[X]. Por tanto, concluimos que para cada polinomio
m ∈ K[X] se tiene:
m(M ) = 0 ⇔ m(FM ) = 0 ⇔ fi | m, ∀i, 1 ≤ i ≤ r.
Como fi | fi+1 para cada i se tiene:
fi | m, ∀i, 1 ≤ i ≤ r ⇐⇒ fr | m.
250 4. PRIMOS, MAXIMALES. MÓDULOS LIBRES. FORMA NORMAL DE SMITH
Φ
V K[X]/(f )
ϕ ηX
V K[X]/(f )
Φ
Observación 4.7.12. En otras palabras, el anterior corolario simplemente dice que una matriz
(o un endomorfismo) verifican que su polinomio mı́nimo y su polinomio caracterı́stico coinciden
si y solamente si la matriz (o el endomorfismo) es simplemente la matriz de la homotecia ηX
pero en una base equivocada.
ii)
4X1 + 2X2 + 6X3 = 0
X1 + 2X2 = 3
iii)
X1 + 2X2 + X3 + 2X4 = 3
X1 + X3 = 2
3X1 + 3X3 + 4X4 = 2
Problema 181. Prueba que para todo dominio de ideales principales R y para cada número
natural n ∈ N, los submódulos de rango r de Rn coinciden con los conjuntos de soluciones de
sistemas de ecuaciones homogéneos de la forma BX = 0, donde B ∈ M(n−r)×n (R) es una
matriz con n − r filas y n columnas de rango n − r.
Problema 182. Prueba que si M y N son dos R−módulos libres de rango finito, se tiene:
rankR (M ⊕ N ) = rankR (M × N ) = rankR (M ) + rankR (N ).
Prueba que si M es un submódulo de N con las anteriores condiciones, no es cierto que si
rankR (M ) = rankR (N ), entonces M = N .
Problema 183. Reflexionar sobre el significado del Teorema de Estructura para módulos fini-
tamente generados sobre DIP en el caso R = K[X] y M la estructura de K[X]−módulo definida
sobre un espacio vectorial finitamente generado V por un endomorfismo de K−espacios vecto-
riales f : V −→ V . ¿Tiene algo que ver con la forma de Frobenius del endomorfismo?.
Problema 184. Hallar la Forma Normal de Smith sobre Q[X] de la siguiente matriz:
X −2 −1 0 0
0
X −2 0 0
0 0 X −2 0
0 0 0 X −2
Problema 185. Hacer lo mismo que en el problema anterior para las siguientes matrices:
X −2 −1 0 0
0
X −2 0 0
0 0 X −2 −1
0 0 0 X −2
X −2 −1 0 0
0
X −2 −1 0
0 0 X −2 −1
0 0 0 X −2
X −2 −1 0 0
0
X −2 0 0
0 0 X −3 −1
0 0 0 X −3
X −2 0 0 0
0
X −2 0 0
0 0 X −3 0
0 0 0 X −3
Problema 186. Considerar el grupo abeliano libre Zn y varios subgrupos que se citan a contin-
uación. Hallar la estructura del subgrupo de los elementos de torsión del grupo cociente Zn /H.
Decidir, en cada caso, si el grupo cociente es completamente de torsión o si su descomposición
posee “parte libre de torsión” (i.e. decidie si T or(Zn /H) = Zn /H en cada caso.
i) Supongamos n = 2 y H1 es el subgrupo de Z2 generado por {(1, 2), (3, 4)}.
ii) Supongamos n = 2 y H2 es el subgrupo de Z2 generado por {(2, 3)}.
iii) Supongamos n = 3 y H3 es el subgrupo de Z2 generado por {(1, 1, 1), (2, 4, 6), (3, 7, 11)}.
4.7. FORMA DE FROBENIUS Y FACTORES INVARIANTES 253
Problema 189 (Hilbert’s Tenth Problem). Busca en Wikipedia información sobre el Prob-
lema X de Hilbert. Escribe su enunciado. Escribe también el enunciado del Teorema de
Matjasevich (cf. [Matj, 1970]), fuertemente basados en los trabajos de Julia Robinson (cf.
[Rob, 1950], [Rob, 52]), aunque algunos historiadores añaden el nombre de M. Davis (cf.
[Dav, 49]) y el nombre de Hilary W. Putnam. Dicho enunciado afirma que no existe algo-
ritmo que decida si una ecuación polinomial con coefcientes enteros posee una solcuión entera.
Usando este resultado, prueba el siguiente:
“ No existe ningún algoritmo que resuelva el siguiente problema:
Dada una familia de polinomios de grado a lo sumo 2, cada uno de los cuales sólo depende de, a
lo sumo, tres variables, f1 , . . . , fs ∈ Z[X1 , . . . , Xn ], decide si existe una solución x ∈ Zn común
a todos ellos”.
Concluye que, en lo concerniente a la decisión de la existencia de solcuiones diofánticas para
ecuaciones polinomiales de grado 2 o superior, no es posible obtener algoritmos. ( Hint: Prueba
que toda ecuación polinomial con coeficientes enteros, se puede escribir como varias ecuaciones
polinomiales de grado 2 con coeficientes enteros, cada una de las cuales involucra a lo sumo
tres variables).
4.7.4.1. Ecuaciones Diferenciales Ordinarias Homogéneas. En este bloque de prob-
lemas, consideraremos dos maneras de presentar ecuaciones diferenciales ordinarias homogéneas
con coeficientes constantes, para un valor inicial dado. De una parte, una sola ecuación difer-
encial de orden n y de la otra un sistema de ecuaciones diferenciales lineales con coeficientes
constantes.
i) Una sola ecuación diferencial de orden n: Esto es, se considera una ecuación diferencial
ordinaria lineal y homogénea con coeficientes constantes. Es decir, consideramos una
ecuación diferencial de la forma:
(4.7.8) a0 f + a1 f 0 + · · · + an−1 f (n−1) + f (n) = 0.
donde a0 , . . . , an−1 ∈ R. Con las condiciones iniciales en un punto x0 ∈ R dadas
mediante:
f (x0 ) = v0 , f 0 (x0 ) = v1 , . . . , f (n) (x0 ) = vm .
ii) Un sistema de ecuaciones diferenciales homogéneo con coeficientes constantes: En
este caso se trata de considerar una matriz A ∈ Mn (R), un vector (expresado como
columna) b ∈ Rn y una sucesicón de n funciones {X1 (t), . . . , Xn (t)} que son las
incógnitas a resolver. Denotaremos por Ẋ al vector de las derivadas de las funciones
y por X al vector de las funciones a encontrar. Es decir,
0
X1 (t) X1 (t)
X20 (t) X2 (t)
Ẋ := . , X := . .
.. ..
Xn0 (t) Xn (t)
Se considera el siguiente sistema de ecuaciones diferenciales lineales homogéneas con
coeficientes constantes:
(4.7.9) Ẋ = AX,
con la condición inicial
X(x0 ) = b ∈ Rn .
Problema 190. Pruébese los siguiente:
i) Las ecuaciones diferenciales ordinarias del tipo descrito en la ecuación (4.7.8) son un
caso particular de los sistema de ecuaciones del tipo descrito en la ecuación (4.7.9).
Hint: Introduce variables para las funciones, usando X1 := f, X1 := f 0 , . . . , Xn :=
f (n−1) , Xn+1 := f (n) . ¿Qué tipo de matriz aparece como matriz de coeficientes?.
ii) Toda ecuación dferencial lineal homogénea con coeficientes constantes del tipo descrito
en la ecuación (4.7.9) se puede transformar, salvo un cambio lineal de coordenadas,
P ∈ GL(n, R) en una suma diagonal de ecuaciones diferenciales lineales del tipo de-
scrito en (4.7.8). Hint: Úsese la forma de Frobenius de la matriz A de coeficientes.
4.7. FORMA DE FROBENIUS Y FACTORES INVARIANTES 255
Índice
5.1. Introducción 257
5.2. El anillo producto y el Teorema Chino de los Restos 258
5.3. El Teorema Chino de los Restos en el caso R = Z 260
5.3.1. En relación con el problema de Sun Tzu. 261
5.3.2. En computación: cálculo del determinante por algoritmos modulares. 262
5.3.2.1. La Búsqueda de un Buen Número Primo. 265
5.3.2.2. Tests de Primalidad. 265
5.3.2.3. Combinando el Teorema de Densidad y los Tests de Primalidad. 266
5.3.2.4. La Estrategia Final. 267
5.3.3. Secretos compartidos. 268
5.3.4. Grupos abelianos finitamente generados: estructura, divisores elementales. 269
5.3.5. Ejercicios y problemas de la Sección 5.3 271
5.3.5.1. El Test de G. Miller y M.O. Rabin 272
5.4. El Teorema Chino de los Restos en el caso R := K[X]: Forma de
Jordan. 275
5.4.1. La forma canónica de Jordan: divisores elementales en K[X]. 275
5.4.2. Teorı́a del endomorfismo y el máximo común divisor en K[X]. 278
Otra demostación (más explı́cita) de la correctitud del algoritmo. 283
5.4.3. Ejercicios y problemas de la Sección 5.4 287
5.4.3.1. El algoritmo de Csanky-Leverrier-Fadeev-Souriau. 289
5.1. Introducción
En esta Sección recordaremos el teorema Chino de los Restos y algunas de sus aplicaciones más
notables. Aunque se desconoce su origen preciso, las fuentes más clásicas apuntan al texto Sun
Zi suan-ching (traducido, malamente, como “Las Matemáticas Clásicas de Sun Zi”), publicado
en el tercer siglo antes de Cristo por Sun Tzu. Reaparece, con otros resultados interesantes
como el método de Newton, en 1274 en un texto de Qin Jiushao titulado Shushu Chiu-zhang.
El Problema que trata es el siguiente:
Problema Clásico 5.1.1. ¿Cuál es el número entero más pequeño tal que
f ≡ 2 mod 11, f ≡ 3 mod 5, f ≡ 2 mod 7?.
En todo caso, sigue este Capı́tulo formando parte del conjunto de requisitos aunque, aderezado
de forma conveniente, puede permitir revisar otros requisitos (fundamentalmente la Forma
Canónica de C. Jordan o la Clasificación de Grupos Abelianos finitamente generados) y algunas
aplicaciones de la misma. Como “novedad”, se expone un algoritmo de cálculo del máximo
común divisor en K[X], usando Álgebra Lineal en dimensión mı́nima (lo que es un preludio
257
258 5. TEOREMA CHINO DE LOS RESTOS
Comencemos considerando
Qn unos elementos especiales. Para cada i ∈ {1, . . . , n}, consideremos
el elemento ei ∈ i=1 (R/ai ) dado mediante:
n
Y
ei := (εi,1 + a1 , εi,2 + a2 , . . . , εi,n + an ) ∈ (R/ai ) ,
i=1
donde
1, si i = j
εi,j :=
0, en caso contrario
Nótese que ei es el elemento que “tiene un 0 en todos los lugares, excepto en el lugarQ i en el que
n
tiene un 1”. Consideremos ahora un elemento cualquiera ζ := (x1 +a1 , . . . , xn +an ) ∈ i=1 R/ai .
Se tiene la siguiente identidad:
n
X
(5.2.7) ζ := Φ(xi )ei .
i=1
Por tanto, probar que Φ es suprayectiva se reduce a probar que {e1 , . . . , en } ⊆ Im(Φ). Por
simplicidad de la expresión de la prueba, probemos que e1 ∈ Im(Φ) y, análogamente, se hará
para todos los otros elementos.
dado que a1 y ai son co-maximales para todo i 6= 1, 1 ≤ i ≤ n, podemos suponer que existen
xi ∈ a1 e yi ∈ ai tales que xi + yi = 1 en R. Definamos el elemento
n
Y n
Y
(5.2.8) z1 := yi = (1 − xi ).
i=2 i=2
En cuanto al núcleo de Φ, es claro que dicho núcleo coincide con ∩ni=1 ai . Sin embargo, el
enunciado dice algo más. Dice que, en el caso de que los ideales sean co-maximales dos a dos,
entonces la intersección y el producto coinciden, es decir
n
Y n
\
ai = ai .
i=1 i=1
Qn Tn
Hay un contenido claro por las definiciones de los propios ideales i=1 ai ⊆ i=1 ai , luego sólo
queda por probar el recı́proco. Hagamos la prueba por inducción. Comencemos en el caso
n = 2. En ese caso, por ser a1 y a2 co-maximales, tendremos a1 + a2 = R y han de existir
x1 ∈ a1 y x2 ∈ a2 tales que x1 + x2 = 1. Sea ahora x ∈ a1 ∩ a2 .
• Como x ∈ a2 (por estar en a1 ∩ a2 ) y x1 ∈ a1 , entonces xx1 ∈ a1 a2 ,
• Recı́procamente, como x ∈ a1 (por estar en a1 ∩ a2 ) y x2 ∈ a2 , entonces xx2 ∈ a1 a2 .
260 5. TEOREMA CHINO DE LOS RESTOS
lo que, juntado con la igualdad inmediatamente anterior, implica la afirmación descrita en ii).
La afirmación iii) del enunciado es evidente a partir del primer Teorema de Isomorfı́a y de las
afirmaciones i) y ii).
ii) El ideal intersección a := ∩ni=1 ai es el ideal generado por el mı́nimo común múltiplo
m := mcm(n1 , . . . , nr ).
Qr
iii) El ideal producto b := i=1 ai es el ideal (N ), generado por el producto
r
Y
N := ni .
i=1
• ni | m, para cada i, 1 ≤ i ≤ r.
• m es mı́nimo con esa propiedad.
Ahora nótese que la primera condición significa m ∈ (ni ) para cada i, 1 ≤ i ≤ r. Por tanto,
la primera condición significa m ∈ ∩ri=1 (ni ) y, por tanto, significa también (m) ⊆ ∩ri=1 ai . En
cuanto a la condición de minimalidad, recordemos el Teorema 2.2.18, en el cual se afirma que
el elemento no nulo de valor absoluto (resp. grado) mı́nimo en un ideal es el generador en
Z (resp. K[X]). Podemos ası́ concluir que si m es el mı́nimo con esa propiedad, entonces,
(m) = ∩ri=1 (ni ). Qr
De otro lado, por la definición del ideal producto, el ideal i=1 (ni ) es el ideal generado por los
productos de los generadores y, por tanto, el ideal generado por N .
La última de las afirmaciones es consecuencia inmediata del apartado ii) del Teorema Chino
de los Restos.
Qr Efectivamente, si ni es una familia cuyos elementos son dos a dos co-maximales,
los ideales i=1 (ni ) y ∩ri=1 (ni ) han de coincidir y, por tanto, sus generadores son iguales (salvo
unidad en Z) por lo que podemos concluir que
r
Y
mcm(n1 , . . . , nr ) = ni ,
i=1
como se pretendı́a.
• Para z3 : elijamos x001 , x002 , y100 , y200 tales que x001 , x002 ∈ (7), y100 ∈ (11), y200 ∈ (5) y
x001 + y100 = 1, x002 + y200 = 1.
Es decir, x001 = (−3)·7 = −21, x002 = (−2)7 = −14, y100 = 2·11 = 22, y200 = 3·5 = 15
y definamos z3 := y100 y200 = 15 · 22 = 330.
Para mayor simplicidad podemos hacerlos todos positivos, reduciendo módulo N y
eligiendo:
z1 = 210, z2 = 231, z3 = 330.
iii) Con estos tres elementos y la fórmula (5.2.7) podemos hallar, dados x1 , x2 , x3 un
número x ∈ Z tal que
x mod (11) = x1 mod (11), x mod (5) = x2 mod (5), x mod (7) = x3 mod (7).
De hecho, tenemos que el número x1 z1 + x2 z2 + x3 z3 verificará:
Φ(x1 z1 + x2 z2 + x3 z3 ) = Φ(x1 )Φ(z1 ) + Φ(x2 )Φ(z2 ) + Φ(x3 )Φ(z3 ),
lo que es una formulación equivalente.
iv) Con los datos del enunciado del texto de Sun Tzu, tendemos que
z := 2 · 210 + 3 · 231 + 2 · 330 mod 385 = 233,
satisface los requerimientos (si no se ha traspapelado algún error de cálculo por en
medio).
5.3.2. En computación: cálculo del determinante por algoritmos modulares.
Una de las aplicaciones más importantes del Teorema Chino de los Restos sobre Z son los
algoritmos modulares, usados en la programación de paquetes de software simbólico comerciales
como Maple, Mathematica y otros. Aquı́ ejemplificamos esta estrategia con el ejemplo del
cálculo del determinante de una matriz A ∈ Mn (Z) con coordenadas enteras. El asunto es el
siguiente:
En el algoritmo de Gauss clásico, aprendido en las asignaturas básicas de Álgebra Lineal, se
produce un fenómeno singular con la concatenación de elecciones de pivotes. Si supongo que
todas las coordenadas de la matriz A = (ai,j )1≤i,j≤n original, verifican |ai,j | ≤ H, tras haber
elegido k pivotes, el tamaño de los números enteros que aparecen en la matriz es del orden
k
H 2 . Esto significa, por ejemplo, que para matrices de tamaño 200 × 200 no existen suficientes
electrones en el Universo para almacenar los dı́gitos de uno de esos números enteros a razón de
un dı́gito por electrón. Ni que decir tiene de la imposibilidad de manejar matrices razonables
en la práctica con tamaños del orden 1000 × 1000.
La conclusión es que el método de Gauss, tal y como se enseña, no sirve. Surgen ası́ diversas
alternativas. Algunas hacen modificaciones del algoritmo de Gauss (con búsquedas de otros
pivotes y otras operaciones, reduciendo a cada paso), otros se centran en algoritmos bien par-
alelizables (que evitan el crecimiento de los resultados intermedios a través de estructurar las
operaciones a realizar mediante grafos bien paralelizables). Una vı́a más son los Algoritmos
Modulares que vamos a describir, basándonos en el TCR anterior.
Comencemos recordando los rudimentos del Teorema de Gram-Schmidt.
Observación 5.3.3. Aunque parece que el método de cálculo de bases ortogonales ya era
conocido por Laplace y habı́a sido usado por Cauchy en 1836, se asigna este método a Jorgen
P. Gram y Erhardt Schmidt. El trabajo de E. Schmidt donde introdujo formalmente su método
de ortogonalización es [Schm, 1907]. Los trabajos de Gram (un matemático “amateur” danés)
son más difı́ciles de rastrear para mı́ y no he sido capaz de saber con certeza dónde publicó sus
resultados.
Algoritmo 5.3.4 (Gram -Schmidt). Sea v1 , . . . , vn una base ordenada de Rn . Definamos la
secuencia de vectores v1∗ , . . . , vn∗ siguiente:
v1∗ := v1
hv2 ,v1∗ i
v2∗ := v2 − µ2,1 v1∗ , µ2,1 = hv1∗ ,v1∗ i
(5.3.2) ..
.
Pi−1 hvi ,vj∗ i
vi∗ := vi − j=1 µi,j vj∗ , µi,j := hvj∗ ,vj∗ i
5.3. EL TEOREMA CHINO DE LOS RESTOS EN EL CASO R = Z 263
con lo cual √
||vi ||2 ≤ nH,
y se sigue obviamente la desigualdad.
264 5. TEOREMA CHINO DE LOS RESTOS
Algoritmo 5.3.10.
Input: Una matriz M := (ai,j )1≤i,j≤n ∈ Mn (Z), tal que H := max{|ai,j | : 1 ≤ i, j ≤ n}.
Initialize: M := nn/2 H n + 1.
eval:
x := det(A) mod 2M ∈ Z/(2M )Z.
e ∈ Z.
Ouput: x
Este algoritmo usa número enteros cuyo tamaño máximo está acotado por el tamaño de 2M .
Esto significa que todas las operaciones se hacen en un anillo de restos Z/(2M )Z y el número
de bits de los números involucrados está limitado por
log2 (n)
log2 M + log2 (2) ≤ 2n( + log2 (H)) + 1.
2
Lo que sigue nos permitirá observar que incluso esta talla (que evita crecimientos desmesurados
de resultados intermedios) es excesiva y que se puede hacer trabajando con clases de restos
módulo enteros mucho más peque nos.
5.3. EL TEOREMA CHINO DE LOS RESTOS EN EL CASO R = Z 265
El número de operaciones elementales (bit) necesarias para calcularlos está acotado por
O s log22 (s) log2 (H) + log22 (H) log22 (log2 (H)) .
Elijamos k := log2 (log2 (H)) + 1, tenemos r := 2k = 2 log2 (H) números primos distintos y,
claramente,
k
2
Y r
Y
H≤ pi = pi .
i=1 i=1
Más aún, el número primo pi más grande de esta lista, es de valor absoluto menor que 22k =
(2 log2 (H))2 y, por tanto, su tamaño en base 2 (tamaño bit) es, a lo sumo, 2(log2 (log2 (H)) + 1).
Para calcularlos, basta con hallar los primeros 2k números primos menores que 22k . Usando la
clásica Criba de Eratóstenes (sin mayor esfuerzo), el número de operaciones a realizar (escritura
2
de 1 a 22k , lectura y tachado) es del orden de 22k O(log2 k) . Nótese que el factor O(log2 k)
aparece por el esfuerzo de lectura de cada uno de los números de la lista. El cuadrado viene
porque hay que leer la lista entera cada vez que detectamos un nuervo número primo. Luego
el número total de operaciones realizadas está acotado por
2
(log2 (2H)O(log2 log2 H)) .
Finalmente, elijamos ni := psi , 1 ≤ i ≤ r . Claramente, son co-primos dos a dos, su tamaño
en base 2 (talla bit) está determinada por su logaritmo y está, por tanto, acotado por 2ks =
5.3. EL TEOREMA CHINO DE LOS RESTOS EN EL CASO R = Z 267
2(log2 (log2 (H)) + 1)s. El número de números obtenidos sigue siendo r y, obviamente, su pro-
ducto es mayor que H s . Para calcularlos, tenemos que realizar a lo sumo r log2 (s) multiplica-
ciones adicionales de números de tamaño acotado por s max{log2 (pi ) : 1 ≤ i ≤ r} ≤ s(2k). Us-
ando el reciente método de multiplicación de D. Harvey y J. an der Hoeven (cf. [HarvdH, 19]),
estas multiplicaciones pueden hacerse mediante el siguiente número de operaciones adicionales:
r log2 (s)O(s(2k) log2 (2ks)) ≤ (2 log2 (H)) log2 (s)O (s (2(log2 (log2 (H)) + 1)) (log2 (s) + log2 (2k))) .
Luego, con un número máximo de operacioens adicionales:
r log2 (s)O(s(2k) log2 (2ks)) ≤ O s log2 (H) log22 (s) + log22 (log2 (H)) .
En total, el número de operaciones bit a realizar está, por tanto, acotado por
2
(log2 (2H)O(log2 log2 H)) + O s log2 (H) log22 (s) + log22 (log2 (H)) ,
El resultado final serı́a el siguiente: Consideremos la siguiente notación (conocida como Big-O-
tilde o Landau-Big-O) :
g ∈ Oe(f ) ⇔ ∃k ∈ N, g ∈ O(f logk2 (f )).
Es decir “olvida” factores poli-logarı́micos por simplicidad de la escritura y teniendo en cuenta
que logk (n) tiene menor crecimiento que n para cualquier ε > 0.
268 5. TEOREMA CHINO DE LOS RESTOS
Teorema 5.3.17. Aplicando técnicas modulares al cálculo del determinante podemos concluir :
El determinante de una matriz A ∈ Mn (Z) cuyos coeficientes tienen tamaño (logarı́tmo en base
2) acotado por h se puede calcular en tiempo
Oe(n3 h2 ).
Además, todos los cálculos se realizan en anillos de la forma Z/pZ, donde la talla bit de p está
acotada por:
O(log2 (n) + log2 (log2 (H)) + log2 (log2 (n))).
O n log22 (n)(log2 (h) + log2 (n)) + (log2 (h) + log2 (n))2 log22 (log2 (h) + log2 (n))) .
Lo que, en notación Big-O de Landau, queda resumido en Oe(n log22 (h)). Ahora, para cada i,
debemos calcular en determinante de A módulo ni . Para cada i esto se puede realizar en O(n3 )
operaciones aritméticas (y divisiones euclı́deas) usando números enteros de tamaño acotado por
el tamaño de ni que, a su vez, está acotado por O(log2 (n) + log2 (log2 (H)) + log2 (log2 (n))) =
Oe(log2 (n) + log2 (h)), olvidando términos del tipo log2 (log2 (n)).
Por tanto, el tiempo requerido para la ejecución de esta parte del algoritmo está acotada
por el tiempo requerido en calcular del determinante usando O(n3 ) operaciones aritméticas
con números de tamaños acotados por lo indicado anteriormente. Esto da una cota del tipo
siguiente asumiendo el algoritmo escolar sobre Z/ni Z:
Como r ∈ O(h + log2 (n)), el coste del cálculo de todos los restos en todos los Z/nZ condiere a
una acotación del tipo:
Oe(n3 log22 (n) + h log22 (h)).
Finalmente, siguiendo el problema Problema 191, tenemos que aplicar el algorimo de Eu-
clides con números enteros acotados (en valor absoluto) por 3(nH)n r veces. Se trata de
rO(n(log2 (H) + log2 (n))) = O(rn(h + log2 (n))) divisiones euclı́deas. Como r = 2 log2 (3nH) =
2(h + log2 n + log2 (3)) = O(h + log2 (n)), se trata de realizar Oe(nh2 ) divisiones euclı́deas
de enteros de tamaños acotados por O(n(h + log2 (n))). Esto puede realizarse en un número
de operaciones bit acotadas por Oe(n3 h2 ). Dado que la operación de Lehmer final es lineal en
O(n(h+log2 (n))), el tiempo final para calcular un determinante por este método estará acotado
por
Oe(n3 h2 ).
Debe señalarse que se han usado los algoritmos más “escolares” tanto para el cálculo del deter-
minante módulo ni como para la división euclı́dea. La cota es obviamente refinable por diversas
técnicas; pero no modifica lo esencial de la estrategia: se hacen del orden de O(n3 ) operaciones
aritméticas con números enteros (modulares) de tamaño muy controlado.
5.3.3. Secretos compartidos. Una de las aplicaciones estándar del Teorema Chino de
los Restos es el sistema de compartimentar la información llamado Secretos Compartidos (del
inglés “secret sharing”) y que se usa, por ejemplo, en los cajeros automáticos. Se trata de lo
siguiente : se dispone de una información codificada en un número entero n ∈ N. Ahora se
eligen r personas distintas, cada una de las cuales lleva asociado un módulo mi . Suponemos
que los módulos mi y mj son dos a dos comaximales. Ahora se entrega a cada persona la
información rem(n, mi ). Para poder recuperar la información inicial es necesario que todas
las personas estén dispuestas a aportar su información y ejecutar el algoritmo subyacente al
Teorema Chino de los Restos. Por ejemplo, el cajero (la máquina) posee posee una parte del
código de autorización de una cuenta/tarjeta y el propietario de la tarjeta una segunda parte:
su código personal PIN.
5.3. EL TEOREMA CHINO DE LOS RESTOS EN EL CASO R = Z 269
i=1
incluyendo los casos en los que ai,j = 0 que significará que ai,t = 0, para cada t ≥ j. Tenemos ası́
los elementos descritos en las propiedades i), ii) y iii) del enunciado. Para concluir, baste con
utilizar el Teorema Chino de los Restos precedente (Teorema 5.2.2). Para cada j, 1 ≤ j ≤ m,
tenemos un isomorfismo de anillos
Y
ϕj : R/dj R −→ (R/qi,j R) ,
ai,j 6=0
a Q
donde qi,j = pi i,j . Nótese que hemos escrito ai,j 6=0 porque los primos pi que tengan exponente
nulo no aparecen en el cociente como anillo (no tiene unidad el cociente R/qi,j R = R/R = 0). Es
un ejercicio de fácil verificación el observar que los morfismo de anillo ϕ del Teorema 5.2.2 son,
en este caso, morfismo de R−módulos. Como añadir la suma directa de copias del R−módulo
0, no cambia el R−módulo, tenemos también un isomorfismo de R−módulos
Y Y Y r
ϕj : R/dj R −→ (R/qi,j R) ⊕ {0} = R/qi,j R,
ai,j 6=0 ai,j =0 i=1
a
donde qi,j := pi i,j . Reintegrando estos isomorfismos de R−módulos, tenemos un isomorfismo
de R−módulos
r m m r
!
ai,j
Y Y Y Y
ϕ := ϕj : (R/dj R) −→ R/pi R .
i=1 j=1 j=1 i=1
N := (ai,j )1≤i≤r,1≤j≤m ,
a
donde, en el caso de que qi,j = pi i,j = p0i = 1 ∈ Z, se sobreentiende que Z/qi,j Z = 0 es el
Z−módulo (o grupo abeliano) nulo.
Además, los elementos descritos en la lista i), ii) y iii) anterior son únicos salvo permutaciones
a
y unidades en Z. A los elementos {qi,j := pi i,j : 1 ≤ i ≤ r, 1 ≤ j ≤ m} se les denominan los
divisores elementales (de la torsión) del grupo abeliano G.
5.3. EL TEOREMA CHINO DE LOS RESTOS EN EL CASO R = Z 271
1http://en.wikipedia.org/wiki/Transport_Layer_Security
272 5. TEOREMA CHINO DE LOS RESTOS
5.3.5.1. El Test de G. Miller y M.O. Rabin. Vamos a trabajar en esta serie de prob-
lemas el test de M.O. Rabin y G. Miller entre 1976 y 1980 (cf. [Milr, 1976] y [Rabin, 1980]).
Se trata del segundo test de primalidad probabilista (o, para ser exactos, el segundo test de
composición probabilista) de la literatura matemática. Originariamente fue presentado por G.
Miller bajo la hipótesis de Riemann y, posteriormente, M.O. Rabin demostró que la hipótesis
de Riemann no era necesaria. El algoritmo hace uso intenso del Teorema Pequeño de Fermat y
la función de Euler (véase la Subsección de Problemas 3.6.5.3).
Problema 197. Para n ∈ N, sea 1 ≤ d ≤ n − 1, definamos el grupo de las raı́ces d−ésimas de
la unidad módulo n como:
K(d) := {a ∈ {1, . . . , n − 1} : ad − 1 = 0(mod n)}
Pruébese que para cada n ∈ N, K(d) es un subgrupo del grupo de las unidades (Z/nZ)× . En
particular, ](K(n − 1)) | ](Z/nZ)× y se tiene:
](K(n − 1)) | ϕ(n)
Input n ∈ 2N + 1
compute ` tal que n − 1 = 2` m, m impar.
guess randomly a ∈ {1, . . . , n − 1}
compute am mod n
if am = 1 mod n, aceptar, Output Probablemente primo.
2 `
else compute am mod n, a2m mod n, a2 m mod n, . . . , a2 m mod n
n−1
if a 6= 1 mod n, aceptar y Output Compuesto.
k
else encontrar el mayor k such that a2 m 6= 1 mod n
k
if a2 m = −1 mod n, aceptar, Output Probablemente primo.
else Output Compuesto.
fi
fi
fi
end
Problema 206. Sea ω ∈ K(2` ) una raı́z cuadrada de la unidad distinta de la unidad (i.e.
ω 2 = 1 mod n y ω 6= 1). Definamos el conjunto :
k
Tω,k := {a ∈ (Z/nZ)× : a2 = x mod n, `(a) = k}.
Pruébese, que, con estas notaciones, la siguiente es una descomposición como unión disjunta
de Tω :
[
Tω := Tω,k .
k≥0
Problema 207. Con las notaciones del problema prcedente, para cada ω ∈ K(2` ) una raı́z
cuadrada de la unidad distinta de la unidad (i.e. ω 2 = 1 mod n y ω 6= 1), definamos :
L(ω) := max {k : Tω,k 6= ∅}.
En otras palabras, L(ω) = k si y solamente si existe x ∈ Tω con `(x) = k y no hay ningún
y ∈ Tω con `(ω) > k. Con estas notaciones, pruébese que para cada ω ∈ K(2` ) una raı́z
cuadrada de la unidad distinta de la unidad (i.e. ω 2 = 1 mod n y ω 6= 1), se tiene :
L(ω)
X
](Tω ) = ](Tω,k ).
k=0
Problema 208. Con las anteriores notaciones, pruébense las siguientes propiedades:
i) Para cada raı́z cuadrada de la unidad ω 2 = 1, con ω 6= 1 t para cada k ≤ L(ω), si
Tω,k 6= ∅, se tiene :
](Tω,k ) = ](K(2k )).
ii) Con las notaciones del apartado i), se tiene que si Tω,k 6= ∅, para algún k, entonces,
Tω,j 6= ∅, para todo j < k.
iii) Finalmente, L(−1) ≤ L(ω) para todo ω tal que ω 2 = 1 mod n, ω 6= 1, −1 mod n.
En particular, pruébese que se tiene:
L(−1) L(−1) L(ω)
X X X
](T−1 ) := ](T−1,k ) = ](Tω,k ) ≤ ](Tω,k ) = ](Tω ).
k=0 k=1 k=1
(n)
que βζ es de cardinal n, y n es la dimensión de K[X]/(f ), tenemos que es base.
Para la afirmación ii), observemos la siguiente cadena:
ηX (1 + (f )) = ((X − ζ) + (f )) + ζ (1 + (f )) = v2 + ζv1
ηX ((X − ζ) + (f )) = (X − ζ)2 + (f ) + ζ ((X − ζ) + (f )) = v3 + ζv2
ηX (X − ζ)2 + (f ) = (X − ζ)3 + (f ) + ζ (X − ζ)2 + (f ) = v4 + ζv3
.. ..
. .
ηX (X − ζ)n−1 + (f ) = ((X − ζ)n + (f )) + ζ (X − ζ)n−1 + (f ) = 0 + ζvn−1 ,
(n)
donde hemos escrito βζ := {v1 , v2 , . . . , vn } y vi := (X − ζ)i−1 + (f ), para 1 ≤ i ≤ n. Esta
(n)
cadena de igualdades justifica que la matriz de ζX en la base βζ sea justamente la “caja” de
Jordan J(ζ, n).
Estamos ya en condiciones de justificar una primera interpretación del Teorema Chino de los
Restos en el caso de polinomios mónicos que se descomponen completamente sobre un cuerpo
K.
Proposición 5.4.2. Sea f ∈ K[X] un polinomio mónico de grado n y supongamos que existen
ζ1 , . . . , ζr ∈ K, con ζi 6= ζj , y exponentes mi ∈ N, con mi ≥ 1, 1 ≤ i ≤ r, tales que:
r
Y
f (X) := (X − ζi )mi .
i=1
Consideremos:
• Sea Φe : K[X]/(f ) −→ Qr (K[X]/(X − ζi )mi ) el isomorfismo de anillos del Teo-
i=1
rema Chino de los Restos. Entonces, Φ e es también un isomorfismo de K−espacios
vectoriales.
• En K[X]/(f ) la base monomial βQ:= {1 + (f ), X + (f ), X 2 + (f ), . . . , X n−1 + (f )}.
r
• En el espacio vectorial producto i=1 (K[X]/(X − ζi )mi ), la base Γ inducida por las
(m )
bases βζi i en cada uno de los espacios vectoriales K[X]/(X − ζi )mi .
• Y sea MΦ la matriz del isomorfismo Φ e en las bases β y Γ.
Entonces, se tiene:
J(ζ1 , m1 ) 0 ··· 0
0 J(ζ 2 , m2 ) ··· 0
C(f ) := MΦ−1 MΦ .
.. . .. .. ..
. . .
0 0 ··· J(ζr , mr )
En paricular, C(f ) posee forma canónica de Jordan, ésta es única (salvo permutación de los
bloques) y la matriz de cambio de base es la matriz del Teorema Chino de los Restos.
Demostración. Obsérvese que si ζi 6= ζj , entonces, (X −ζi )k y (X −ζj )s son co-maximales
para k, s ≥ 1. Por tanto, el hecho de ser Φ
e un isomorfismo se sigue del Teorema Chino de los
Restos. De otro lado, tenemos el siguiente diagrama conmutativo:
Φ
e
Qr
K[X]/(f ) −→ i=1 (K[X]/(X − ζi )mi )
Qr (i)
ηX ↓ ↓ i=1 ηX
Qr mi
K[X]/(f ) −→ i=1 (K[X]/(X − ζi ) )
Φe
Qr (i)
Este diagrama es conmutativo, donde i=1 ηX es el endomorfismo dado mediante el producto
de los endomorfimos
(i)
ηX : K[X]/(X − ζi )mi −→ K[X]/(X − ζi )mi .
5.4. FORMA DE JORDAN 277
es decir
J(ζ1 , m1 ) 0 ··· 0
0 J(ζ2 , m2 ) · · · 0
C(f ) = MΦ−1 MΦ ,
.. .. .. ..
. . . .
0 0 ··· J(ζr , mr )
que es la propiedad buscada.
M = P Jord(M )P −1 .
A la matriz Jord(M ) se la llama forma canónica de Jordan de M y es única salvo permutación
de las cajas de Jordan que aparecen en Jord(M ).
Observación 5.4.4 (La forma canónica de Jordan). Retomando los cursos básicos de
Álgebra Lineal, la anterior Proposición nos dice que si el polinomio mı́nimo de un endomorfismo
A se escinde completamente en un cuerpo, entonces, existe una única forma canónica de Jordan.
Obviamente, si K es algebraicamente cerrado, tanto el mı́nimo como el caracterı́stico se escinden
completamente en K. La unicidad viene dada por los divisores de la forma (X − ζ)m de los
factores invariantes y las matrices de paso de la forma de Frobenius (suma diagonal de matrices
compañeras) a la forma canónica de Jordan son las matrices del Teorema Chino de los Restos
en bases adecuadas.
278 5. TEOREMA CHINO DE LOS RESTOS
5.4.2. Teorı́a del endomorfismo y el máximo común divisor en K[X]. Como apli-
cación final del Teorema Chino de los Restos (al menos en esta parte del curso), veremos cómo
predecir el grado del máximo común divisor de dos polinomios usando Teorı́a del Endomorfismo
y sin acudir a la matriz de Sylvester de la Eliminación Univariada Clásica. Comencemos con
algunos resultados clásicos de Álgebra Lineal.
Lema 5.4.5. Sea K un cuerpo, y sea K su clausura algebraica. Sea g ∈ K[X] un polinomio
univariado. Tendremos las siguientes propiedades :
i) Sea J(0, m) una caja de Jordan con valor propio 0 de tamaño m × m. Entonces,
• Para todo k, 1 ≤ k ≤ m, se tiene :
k 0 0
J(0, m) = ,
Idm−k 0
donde Idm−k es la matriz identidad (m − k) × (m − k) y los 0’s representan
matrices rectangulares de tamaño apropiado.
• Para todo k ≥ m, se tiene :
J(0, m)k = 0.
ii) Si J(ζ, m) es una caja de Jordan de orden m y valor propio ζ ∈ K y denotamos por
ordζ (g) como el máximo número natural k ∈ N tal que (X −ζ)k | g en K[X], entonces,
tenemos
rank (g(J(ζ, m))) = max{0, m − ordζ (g)}.
Demostración. Las propiedades descritas en i) son las propiedades habituales de las
matrices nilpotentes, esto es, de las matrices tales que existe una potencia que se anula. Más
aún, son propiedades de las cajas de Jordan de valor propio 0. Para la propiedad ii), obsérvese
que ha de existir h ∈ K[X] un polinomio tal que g = h(X)(X − ζ)k , donde:
• h(ζ) 6= 0,
• k = ordζ (g).
Ahora, observamos que
g(J(ζ, m)) = h(J(ζ, m))(J(ζ, m) − ζIdm )k ,
Obsérvese que
h(ζ) 0 0 ··· 0
∗ h(ζ) 0 ··· 0
∗ ∗ h(ζ) · · · 0
h(J(ζ, m)) = ,
.. .. .. .. ..
. . . . .
∗ ∗ ∗ · · · h(ζ)
donde ∗ denota un elemento de K cuyo valor no nos ocupa. En otras palabras, h(J(ζ, m))
es una matriz triangular inferior con el valor h(ζ) en la diagonal principal. Como h(ζ) 6= 0,
entonces, es una matriz regular y, por tanto, el rango de g(J(ζ, m)) es igual al rango de ma
matriz (J(ζ, m) − ζIdm )k . Ahora observemos que
(J(ζ, m) − ζIdm )k = (J(0, m))k .
Luego el rango de g(J(ζ, m)) es igual a m − k si m ≥ k y 0 en caso contrario. ésto es lo que se
indica en el enunciado del Lema.
Demostración. Por la Proposición 5.4.2, sabemos que C(f ) es semejante (en Mn (K) a
la matriz suma diagonal de bloques de Jordan siguiente:
J(ζ1 , n1 ) 0 ··· 0
0 J(ζ2 , n2 ) · · · 0
C(f ) ∼
=
.. . . . . .
.
. . . .
0 0 · · · J(ζr , nr )
Por tanto, la matriz g(C(f )) es una matriz semejante a una matriz de la forma:
g(J(ζ1 , n1 )) 0 ··· 0
0 g(J(ζ 2 , n2 )) ··· 0
g(C(f )) ∼
= .
.. . .. ..
. ··· .
0 0 · · · g(J(ζr , nr ))
Como el determinante es un invariate de la clase de semejanza, tendremos que
g(J(ζ1 , n1 )) 0 ··· 0
0 g(J(ζ2 , n2 )) · · · 0
ResX (f, g) = det (g(C(f ))) = det .
.. . . .
.
. . ··· .
0 0 · · · g(J(ζr , nr ))
Como el determinante se porta bien con las sumas diagonales de matrices, lo anterior implica:
r
Y
ResX (f, g) = det (g(J(ζi , ni ))) .
i=1
Como en la demostración del ı́tem ii) del Lema 5.4.5 precedente, cada matriz g(J(ζi , ni )) tiene
la forma:
g(ζi ) 0 0 ··· 0
∗ g(ζ i ) 0 ··· 0
∗ ∗ g(ζ i) ··· 0
g(J(ζi , ni )) = ∈ Mni (K),
.. .. .. .. ..
. . . . .
∗ ∗ ∗ ··· g(ζi )
que es una matriz triangular inferior en la que los elementos por debajo de la diagonal principal
no nos interesan demasiado por ahora. Por tanto,
det (g(J(ζi , ni ))) g(ζi )ni .
con lo que concluimos:
r
Y r
Y
ResX (f, g) = det (g(J(ζi , ni ))) = g(ζi )ni .
i=1 i=1
Proposición 5.4.7 (Barnett, Grado del máximo común divisor de dos polinomios).
Dados dos polinomiso f, g ∈ K[X] supongamos que f es mónico. Entonces, el grado d del
máximo común divisor h de f y g satisface:
deg(f ) = rank(g(C(f )) + deg(h),
donde C(f ) es la matriz compañera de f .
Demostración. En primer lugar, podemos suponer que existen ζ1 , . . . , ζr ∈ K, con ζi 6=
ζj , cuando i 6= j, y existen m1 , . . . , mr ∈ N, con mi ≥ 1, 1 ≤ i ≤ r, tales que
r
Y
f (X) := (X − ζi )mi .
i=1
280 5. TEOREMA CHINO DE LOS RESTOS
Pr
En particular tenemos i=1 mi = deg(f ) = m. Gracias al Teorema Chino de los Restos
podemos suponer que existe una matriz regular P con coordenadas en K tal que
J(ζ1 , m1 ) 0 ··· 0
0 J(ζ2 , m2 ) · · · 0
C(f ) = P −1 P.
.. .. .
..
. . ···
0 0 ··· J(ζr , mr )
Entonces,
g(J(ζ1 , m1 )) 0 ··· 0
0 g(J(ζ 2 , m2 )) ··· 0
g(C(f )) = P −1 P.
.. . . ..
. . ··· .
0 0 ··· g(J(ζr , mr ))
Como P es una matriz regular, el rango de la matriz g(C(f )) viene dado por:
g(J(ζ1 , m1 )) 0 ··· 0
0 g(J(ζ ··· r
2 , m2 )) 0
X
rank (g(C(f ))) = rank = rank (g(J(ζi , mi )))) .
.. . .. ..
. ··· . i=1
0 0 ··· g(J(ζr , mr ))
Ahora, usando el Lema anterior, tendremos:
r
X
rank (g(C(f )))) = max{0, mi − ordζi (g)}.
i=1
Escribamos νi := ordζi (g) por simplicidad notacional. Para concluir, probemos que la suma
descrita a la derecha es igual a deg(f ) − deg(h) donde h es el gcd(f, g).
Supongamos, entonces, que
Yr
g = p(X) (X − ζi )νi ,
i=1
donde p(ζi ) 6= 0 para todo i y νi = ordζi (g). El máximo común divisor de g y f vendrá dado
por la igualdad
Y r
h(X) := (X − ζi )min{mi ,νi } .
i=1
Luego
r
X
deg(h) = min{mi , νi }.
i=1
Pero, nótese que
mi − min{mi , νi } = max{0, mi − νi }.
Por tanto,
r
X r
X r
X
deg(h) = min{mi , νi } = mi − max{0, mi − νi } = deg(f ) − rank (g(C(f ))) ,
i=1 i=1 i=1
Corolario 5.4.9. Con las anteriores notaciones, el grado del máximo común dividor de f y g
con f mónico satisface:
deg (gcd(f, g)) = dim ker (Mg ) .
Demostración. Obvio desde lo anterior, dado que
dim (ker (Mg )) = deg(f ) − rank (Mg ) .
end
Proposición 5.4.11. Con las notaciones del algoritmo precedente, sean f, g ∈ K[X] y sea
h := gcd(f, g) y supongamos que h es mónico. Consideremos el anillo R := K[X]/(f ) y las
homotecias ηg , ηh : R −→ R. Se tiene:
i) Los subespacios ker(ηh ) = ker(ηg ) y las dimensiones como K−espacios vectoriales
satisfacen:
dimK (ker(ηh )) = dimK (ker(ηg )) = deg(h).
ii) Sea f1 ∈ K[X] polinomio mónico tal que hf1 = f , sea a = (f1 ) ⊆ K[X] el ideal que
genera f1 (y que es un ideal que contiene al ideal (f ) generado por f en K[X]. Sea
a/(f ) su proyección al anillo de restos R = K[X]/(f ). Entonces,
ker(ηh ) = ker(ηg ) = a/(f ).
Más aún, el siguiente conjunto es una base de ker(ηg ) como K−subespacio:
B := {f1 , Xf1 , X 2 f1 , . . . , X deg(h)−1 f1 },
donde X i f1 = X i f1 + (f ) es la clase de X i f1 módulo (f ).
iii) El subespacio K := ker(ηg ) es un subespacio ηX −invariante (i.e. ηX (K) ⊆ K) y tiene
sentido considerar el siguiente endomorfismo de espacios vectoriales:
ηX : K −→ K.
iv) La matriz del endomorfismo ηX : K −→ K en la base B es la matriz compañera de
h.
En particular, el máximo común divisor de f y g es precisamente el poliomio caracterı́stico de
la restricción de ηX a ker(ηg ).
Demostración. Probaremos cada una de las propiedades indicadas:
282 5. TEOREMA CHINO DE LOS RESTOS
Pero como deg(µf1 ) = deg(µ) deg(f1 ) = deg(h) + deg(f1 ) = deg(f ), y todos son
mónicos, concluimos que µf1 = f , con lo que, por ser K[X] un dominio de integridad,
concluiremos que µ = ff1 = h. En particular, la matriz de ηX en la base B es la
matrix compañera de µ y, por tanto,
MB (ηX ) = C(h).
5.4. FORMA DE JORDAN 283
ϕ Qr
K[X]/(f ) i=1 (K[X]/ai )
ηX ηeX
Qr
K[X]/(f ) i=1 (K[X]/ai )
ϕ
ϕ Qr
K[X]/(f ) i=1 (K[X]/ai )
ηg ηeg
Qr
K[X]/(f ) i=1 (K[X]/ai )
ϕ
M (ηg ) := M (ϕ)−1 M (e
ηg )M (ϕ),
Siendo M (ϕ) ∈ GL(n, K) una matriz regular (porque corresponde a un isomorfismo
de espacios vectoriales.
• Para cada i, 1 ≤ i ≤ r, consideramos la base βi de K[X]/ai dada por (ver Proposición
5.4.1 anterior):
(5.4.3) βi := {1 + ai , (X − ζi ) + ai , . . . , (X − ζi )mi −1 + ai }.
Qr
• Definamos para el espacio vectorial producto i=1 (K[X]/ai ), la base natural del
espacio producto dada mediante:
r
[ r
Y
β := {0}i−1 × βi × {0}r−i ⊆ (K[X]/ai ) .
i=1 i=1
• La matriz en la base β de ηX es dada por una suma de cajas de Jordan asociada a los
ceros de f contando su mutiplicidad:
J(ζ1 , m1 ) 0 ··· 0
0 J(ζ2 , m2 ) ··· 0
Mβ (eηX ) =
.. . . ..
. . ··· .
0 0 ··· J(ζr , mr )
5.4. FORMA DE JORDAN 285
Nótese que son los trozos ordenados de la base Θ ue se corresponde con los bloques de Jordan
J(ζi , mi ) y g(J(ζi , mi )). De hecho, podemos observar los siguiente:
• Los subespacios vectorials Vi ⊆ K[X]/(f ) generados por la subbase Θi son invariantes
por ηX y la matriz en la base Θi de Vi de ηX : Vi −→ Vi es dada mediante:
(5.4.6) MΘi (ηX ) = J(ζi , mi ) ∈ Mmi (K).
• Los subespacios vectorials Vi ⊆ K[X]/(f ) generados por la subbase Θi son invariantes
por ηg y la matriz en la base Θi de Vi de ηg : Vi −→ Vi es dada mediante:
MΘi (ηg ) = g(J(ζi , mi )) ∈ Mmi (K).
Ambas afirmaciones son consecuencia inmediata de tener forma de suma diagonal de cajas las
matrices asociadas a ηX y ηg en la base
Θ := Θ1 ∪ · · · ∪ Θr .
Supongamos que, para cada i, 1 ≤ i ≤ r, g factoriza en K[X] del modo siguiente:
g(X) := hi (X)(X − ζi )ti ,
donde hi (ζi ) 6= 0 y ti := ordζi (g). Entonces, tendremos que:
t
g(J(ζi , mi )) = hi (J(ζi , mi )) (J(ζi , mi ) − ζi Idmi ) i = hi (J(ζi , mi ))J(0, mi )ti ,
donde hi (ζi , mi ) ∈ GL(mi , K) es una matriz regular.
Ahora retomamos el Lema 5.4.5 sobre matrices nilpotentes y concluimos que:
• Si ti < mi se tiene:
0 0
J(0, mi )ti = ,
Idmi −ti 0
donde Idmi −ti es la matriz identidad (mi −ti )×(mi −ti ) y los 0’s representan matrices
rectangulares de tamaño apropiado.
• Si ti ≥ mi tenemos directamente J(0, mi )ti = 0 ∈ Mmi (K).
Construyamos el trozo de base siguiente:
286 5. TEOREMA CHINO DE LOS RESTOS
• Si ti ≥ mi definamos Θi := Θi .
e
Observamos que Θe i es la base de la intersección siguiente:
e i i = ker(ηg ) ∩ Vi .
KhΘ
La prueba es obvia dada la forma de las matrices g(J(ζi , mi ) discutida más arriba. Juntemos
estos trozos de base para defnir en conjunto de vectors linealmente independientes:
Θ e1 ∪ · · · ∪ Θ
e := Θ e r ⊆ Θ.
Son vectores linealmente independientes dado que son una unión disjunta de vectores que forman
parte de la base Θ. Además, Θ e ⊆ ker(ηg ) por construcción. Finalmente, ker(ηg ) que es
invariante por ηg se descompone mediante:
ker(ηg ) = (ker(ηg ) ∩ V1 ) ⊕ · · · (ker(ηg ) ∩ Vr ) ,
luego Θ
e es una base de ker(ηg ). Se tiene:
KhΘi
e = ker(ηg ).
Observemos seguidamete que ker(ηg ) es invariante por la acción de ηX . De hecho, si h + (f ) ∈
ker(ηg ), tendremos que
ηX (ηg (h + (f ))) = ηg (ηX (h + (f ))) = 0 + (f ).
Podemos construir, por tanto, el endomorfismo:
(5.4.7) ηX : ker(ηg ) −→ ker(ηg ).
Calculemos la matriz de ηX en la base Θ e que acabamos de construir.
Para cada i, 1 ≤ i ≤ r, consideremos un vector vi,k ∈ Θ
e i ⊆ Θ,
e con mi − ti + 1 ≤ k ≤ mi . Nótese
que vi,k ∈ Vi y que Θ
e i ⊆ Θi . Conforme a la Igualdad (5.4.6), la matriz de ηX en la base Θi es
dada mediante J(ζi , mi ). Por tanto, se tiene:
• Si mi − ti + 1 ≤ k ≤ mi − 1, la imagen de vi,k verifica:
ηX (vi,k ) = ζi vi,k + vi,k+1 .
• Si k = mi , la imagen de vi,k verifica:
ηX (vi,k ) = ζi vi,k .
Esta dos identidades se verifican observando simplemente la forma de J(ζi , mi ) en la base Θi
de Vi .
Por tanto, la matriz de ηX restringida a ker(ηg ) ∩ Vi en la base θei tiene la forma:
J(ζi , ti ) si ti < mi
MΘ (η
ei X ) = J(ζ i , min{t i , mi } =
J(ζi , mi ) si ti ≥ mi
Finalmente, la matriz de ηX en la base Θ e de ker(ηg ) toma la forma:
J(ζ1 , min{t1 , m1 }) · · · 0
MΘ .. .. ..
e (ηX ) = .
. . .
0 · · · J(ζr , min{tr , mr })
Por tanto, el polinomo caracterı́stico de MΘ
e (ηX ) satisface
r
Y
χM e (ηX ) (T ) :=
Θ
(X − ζi )min{ti ,mi } = gcd(f, g),
i=1
satisface
χηker = gcd(f, g).
X
Se pide:
i) Probar que del determinante
iii) Halla el valor DiscX (f ) cuando f = X 2 + bX + c. Idem con los polinomios mónicos
genérios de grados 3 y 4.
iv) Concluye que f no posee factores múltiples en K[X] si y solamente si DiscX (f ) = 0.
v) Conluye que la matrix compañera C(f ) es diagonalizable si y solamente si DiscX (f ) 6=
0.
vi) Diseña un algoritmo que realice la siguiente tarea:
Dada una matrix A ∈ Mn (K), decide si A es diagonalizable sobre alguna clausura
algebraica de K.
C ω (R, C) := {f : R −→ C : f es analı́tica}.
Probar que C ω (R, C) es un anillo conmutativo con unidad. Denotemos este anillo por R :=
C ω (R, C) y sean Mn (C) y Mn (R) respectivamente, las matrices n × n con coordenadas en C y
R. Para una matriz A ∈ Mn (C), consideraremos sistemas de ecuaciones diferenciales lineales
homogéneos coeficientes constantes con condición inicial de la forma siguiente:
A · X(t) = Ẋ(t),
(5.4.8)
X(0) = v,
donde
0
x1 (t) x1 (t) v1
X(t) := ... , Ẋ(t) := ... , v = .. ∈ Cn .
.
xn (t) x0n (t) vn
Dada una caja de Jordan J(λ, m) ∈ Mm (C), definamos la matriz
5.4. FORMA DE JORDAN 289
1 0 0 ··· 0
t 1 0 ··· 0
t2
eJ(λ,m)t λt
:= e
2! t 1 ··· 0
.
.. .. .. .. ..
. . . . .
tm−1 tm−2 tmi −3
(m−1)! (m−2)! (m−3)! ··· 1
Se pide:
i) Probar que eJ(λ,m)t ∈ Mm (C ω (R, C)).
ii) Probar que una solución en C ω (R, C)n de la ecuación diferencial dada por la Ecuación
(5.4.8), tomando A = J(λ, m) es la dada mediante:
x1 (t) v1
.. J(λ,m)t ..
. =e . .
xn (t) vn
iii) Sean A, B ∈ Mn (C) dos matrices complejas semejantes. Sea P ∈ GL(n, C) tal que
P AP −1 = B.
Probar que las soluciones de la Ecuación Diferencial (5.4.8) están en biyección con
las soluciones de la siguiente Ecuación Diferencial:
B · Y (t) = Ẏ (t),
(5.4.9)
X(0) = w,
donde w = P −1 v ∈ Cn . ( Pista: Probar que la relación Y 7−→ X = P −1 Y define la
biyección entre las soluciones).
iv) Dada la matriz A ∈ Mn (C) suma diagonal de cajas de Jordan siguiente:
J(λ1 , m1 ) 0 ··· 0
0 J(λ2 , m2 ) · · · 0
A := .
.. . .. .
..
.
0 0 ··· J(λr , mr )
Probar que una solución de la Ecuación Diferencial (5.4.8) para esta matriz A viene
dada mediante:
J(λ ,m )t
x1 (t) e 1 1 ··· 0 v1
.. At .
. . . .
. ..
X(t) = . = e v := . .
. . .
J(λr ,mr )t
xn (t) 0 ··· e vn
v) Dar una expresión general de la solución de la Ecuación Diferencial (5.4.8) usando la
forma canónica de Jordan de la matriz A y la matriz de paso P ∈ GL(, n, C).
Problema 218. Sea f ∈ C{X − ζ} una serie de Taylor de una función analı́tica compleja
(función holomorfa). Sea J(ζ, m) un bloque de Jordan de valor propio ζ y orden m. Prueba
que
rank(f (J(ζ, m)) = max{0, m − ordζ (f )}.
5.4.3.1. El algoritmo de Csanky-Leverrier-Fadeev-Souriau. En esta subsección
vamos a presentar un algoritmo eficiente para el cálculo del determinante de una matriz conocido
como el algoritmo de simultáneamente debido a los siguientes autores:
• L. Csanky (cf. [Csa, 1976]).
• V.N. Faddeeva (En el texto de V. N. Fadeeva : V. N. Fadeeva, “Computational Methods
of Linear Algebra” (versión española V.N. Fadeeva, Métodos de Cálculo de Algebra
Lineal. Paraninfo, 1972.) se le asigna la autorı́a de la recuperación del método de Le
Verrier a D. K. Fadeev en su trabajo (en ruso) : D.K. Fadeev, I.S. Sominskii, Sbornik
zadach po vysshei algebry ( Colección de Problemas en Álgebra Superior). Moscú,
1949. La versión bien paralelizable es descrita en [Fad, 77].
290 5. TEOREMA CHINO DE LOS RESTOS
Output: σ0 , σ1 , . . . , σn .
End
Problema 220. Al principio del Capı́tulo aparece una frase que I. Newton escribió en respuesta
a su competidor R. Hooke. Sin embargo, la frase “like dwarfs standing on the shoulders of
giants” no es originaria de Newton. Busca su origen y explica su significado. ¿Pensaba Newton
que él era bajito de estatura?, ¿Crees que la sociedad actual conoce el sentido y significado de
esa frase?.
Cuestión 1. Se proponen varias tareas:
• Localiza el siguiente texto de A. Grothendieck “Allons-nous continuer la recherche
scientifique ? ”.
• Tradúcelo, haya su fuente, dale un contexto. Especialmente, averigua quién fue A.
Grothendieck e interpreta lo que quiere decir con el discurso completo.
• Traduce la expresión “C’est un con”, en el contexto del que habla Grotendieck. Explica
por qué él la considera detestable y expresa algún argmento por el que esa expresión y
todas sus traduciones a cada uno de los idiomas actuales o futuros, deberı́an prohibirse,
explusarse del mundo Matemático y, en general, del mundo cientı́fico.
• Explica si existe un abuso de semejantes descalificaciones en Twiter sobre cualquier
aspecto de la vida o en el contexto educativo sobre los alumnos. ¿Crees que deberı́a
mantenerse o exluirse?, ¿Es un debate nuevo o viejo?.
• Busca en la Biblioteca de la UC algún otro texto de A. Grothendieck distinto de su
tesis y sus primeros trabajos (o sea, busca algún EGA o SGA, que alguna hay). Trata
de leerlo y resume su contenido, desde tu punto de vista.
• Responde, desde tu perspectiva: ¿Son las Matemáticas un hecho individual o social?.
5.4. FORMA DE JORDAN 291
“...Pour illustrer ce point, j’aimerais donner ici un exemple très concret. Je suis allé, il y a
deux semaines, faire un tour en Bretagne. J’ai eu l’occasion, entre autres, de passer à Nantes
où j’ai vu des amis, où j’ai parlé dans une Maison de Jeunes et de la Culture (MJC) sur le
genre de problèmes que nous abordons aujourd’hui. J’y étais le lundi. Comme les collègues
de l’Université de Nantes étaient avertis de ma venue, ils avaient demandé in extremis que je
vienne, le lendemain après-midi, pour faire une causerie sur des sujets mathématiques avec eux.
Or il s’est trouvé que, le jour même de ma venue, un des mathématiciens de Nantes, M. Moli-
naro, s’est suicidé. Donc, à cause de cet incident malheureux, la causerie mathématique qui
était prévue a été annulée. Au lieu de ceci, j’ai alors contacté un certain nombre de collègues
pour demander s’il était possible que l’on se réunisse pour parler un peu de la vie mathématique
à l’intérieur du département de mathématiques à l’Université et pour parler également un peu
de ce suicide. Il y a eu une séance extrêmement révélatrice du malaise général, cette après-midi
là à Nantes, où manifestement tout le monde présent -avec une exception je dirais- sentait bien
clairement que ce suicide était lié de très près au genre de choses que, précisément, on discutait
la veille au soir à la MJC.
En fait, je donnerai peut-être un ou deux détails. Il s’est trouvé que Molinaro avait deux
thésards auxquels il faisait faire des thèses de troisième cycle - je crois que ce n’était pas des
thèses d’état. Or, ces thèses furent considérées comme n’étant pas de valeur scientifique suff-
isante. Elles furent jugées très sévèrement par Dieudonné qui est un bon collègue à moi et avec
lequel j’ai écrit un gros traité de géométrie algébrique. Je le connais donc très bien, c’est un
homme qui a un jugement scientifique très sûr, qui est très exigeant sur la qualité d’un travail
scientifique. Ainsi, alors que ces thèses étaient discutées par la Commission pour l’inscription
sur la liste d’aptitude aux fonctions de l’Enseignement Supérieur, il les a saqués et l’inscription
a été refusée. Ceci, bien entendu, a été ressenti comme une sorte d’affront personnel par Moli-
naro qui avait déjà eu des difficultés auparavant et il s’est suicidé sur ces circonstances. En fait,
j’ai eu un ami mathématicien, qui s’appelait Terenhôfel qui s’est également suicidé. Je connais
un certain nombre de mathématiciens - je parle surtout ici de mathématiciens puisque c’est le
milieu que j’ai le mieux connu -qui sont devenus fous.
Je ne pense pas que cela soit une chose propre aux mathématiques. Je pense que le genre,
disons, d’atmosphère qui prévaut dans le monde scientifique, qu’il soit mathématique ou non,
une sorte d’atmosphère à l’air extrêmement raréfié, et la pression qui s’exerce sur les chercheurs
sont pour beaucoup dans l’évolution de ces cas malheureux.
Ceci concernant le plaisir que nous prenons à faire de la recherche scientifique. Je crois qu’il
peut y avoir plaisir, mais je suis arrivé à la conclusion que le plaisir des uns, le plaisir des gens
haut placés, le plaisir des brillants, se fait aux dépends d’une répression véritable vis-à-vis du
scientifique moyen....
Mais, d’autre part, quand je parle d’une vie qui est digne d’être vécue, il ne s’agit pas seulement
de ma vie à moi, il s’agit de la vie de tous. Et je me rends compte que l’épanouissement que j’ai
pu réaliser dans une direction très limitée se faisait au dépends des possibilités d’épanouissement
d’autres personnes. Si certaines personnes se sont trouvées sous une pression psy-
chologique si forte qu’elles en sont parfois venues au suicide, c’est bien à cause
d’un consensus dominant qui faisait que la valeur de la personne était jugée, par
exemple, d’après sa virtuosité technique à démontrer des théorèmes, c’est-à- dire
à effectuer des opérations excessivement spécialisées - alors que, précisément, tout
le reste de lapersonne était complètement laissée dans l’ombre. C’est une chose que
j’ai expérimenté maintes fois. Quand on parle d’une certaine personne et que je demande “Qui
est-ce ?”, on me répond “C’est un con”, En voulant dire par là, entre mathématiciens, que
c’est un type qui soit démontre des théorèmes qui ne sont pas très intéressants, soit démontre
des théorèmes qui sont faux, ou bien ne démontre pas de théorèmes du tout.
Donc, là, j’ai défini un peu négativement ce que j’entends par une vie qui soit digne d’être
vécue. Je pense que, pour tout le monde, il y a possibilité d’épanouissement sans
que nous soyons jugés par les autres, par des critères aussi étroits, aussi étriqués.
En fait, je pense que cette échelle de valeurs a un effet directement mutilant sur
les possibilités d’épanouissement. Enfin, c’est un des aspects, je ne prétends pas répondre
ici à la question soulevée qui est très vaste ; mais dans l’optique où nous nous plaçons ici, en
partant de la pratique scientifique, c’est ce que je vois de plus immédiat à répondre....”
CAPı́TULO 6
293
294 6. FACTORIZACIÓN: GAUSS, LASKER. NOETHER
Índice
6.1. Introducción 294
6.2. Dominios de factorización única: Lema de Gauss 295
6.2.1. Dominios de factorización única 295
6.2.2. Máximo común divisor en dominios de factorización única 298
6.2.3. El Lema de Gauss 301
6.2.4. Ejercicios y problemas de la Sección 6.2 305
6.2.4.1. Ley de Reciprocidad Cuadrática. 307
Sı́mbolo de Legendre. 307
La Construcción de Einsenstein 308
Una Reflexión sobre la Construcción de Einsenstein 310
El Lema de Einsenstein (1859) 310
6.2.4.2. (Otro) Lema de Gauss 311
6.2.4.3. Ley de Reciprocidad Cuadrática de Jacobi 312
Sı́mbolo de Jacobi. 312
Ley de Reciprocidad Cuadrática para el sı́mbolo de Jacobi 313
6.2.4.4. El test de R. Solovay y V. Strassen 313
6.3. El Teorema de Lasker-Noether (Existencia): “factorizando”
ideales en anillos noetherianos 314
6.3.1. Radical de un Ideal 315
6.3.2. Ideales Primarios 318
6.3.3. Descomposición Primaria en anillos noetherianos: Teorema de Lasker-
Noether 323
6.3.4. Unicidad (Primer Teorema): descomposición primaria, asociados e ideales
primos minimales de un anillo noetheriano 325
6.3.4.1. Unas palabras sobre los ideales primos minimales en Spec(R), con
R noetheriano. 328
6.3.5. Ejercicios y Problemas de la Sección 6.3 330
6.3.5.1. Cociente de Ideales 330
6.3.5.2. El Teorema de Lasker-Noether para módulos noetherianos 330
6.3.5.3. Anillos y módulos de Artin 333
6.1. Introducción
Ya vimos en la Sección 3.3 la noción de anillo noetheriano y cómo esa noción permite concluir
que un caso particular (los DIP’s) admiten factorización de sus elementos. Vimos el Teorema
de la Base de Hilbert en la Sección ?? que muchos anillos no principles son noetherianos (como
Z[X], K[X1 , X2 , X3 ] y otros). Más aún hay anillos que no son dominios y sı́ son noetherianos
(simplemente por paso al cociente con un ideal que no sea primo). Pero nos queda la pregunta
de si es posible alguna forma de factorización de todo tipo de ideales que, en algún sentido,
generaliza los ideales de C.F. Gauss sobre factorización y dominios de factorización única. De
eso nos ocupamos en lo que sigue del Capı́tulo. .
El primer resultado destacable de los anillos noetherianos no fue el de generalizar simplemente
la noción de Hilbert sino el demostrar que, dentro del contexto noetheriano se podı́a extender
la idea de factorizar elementos (como en el Capı́tulo precdente) a la idea de “factorizar” ideales,
aunque no sean principales. Ese es el conocido como Teorema de Lasker-Noether. Dado que los
elementos de un anillo de polinomios K[X1 , . . . , Xn ] se pueden expresar como producto único
de elementos primos, la pregunta natural era extender el concepto a ideales de K[X1 , . . . , Xn ] y
descomponerlos mediante ideales primos y sus potencias. No funcionó la cosa como se esperaba
y hubo que introducir los ideales primarios (que no siempre son potencias de primos).
Fue el alumno de D. Hilbert (y famoso jugador de ajedrez, a quien le interesaban más los tableros
que las matemáticas) E. Lasker, en su trabajo [Lasker, 1905] de 1905, quien demostró que se
podı́an descomponer ideales (en anillos de polinomios y anillos de series de potencias formales)
como intersección finita de ideales “irreducibles”. Pero fue, sin embargo, E. Noether quien lo
generalizó a todo anillo y módulo verificando las condiciones de cadena ascendente numerables
en su trabajo de [Noether, 1921]. Ası́ los anillos neotherianos y el pensamiento noetheri-
ano se transformó en métodos de trabajo y métodos concenptuales (“Methoden...Arbeits- und
6.2. DOMINIOS DE FACTORIZACIÓN ÚNICA: LEMA DE GAUSS 295
i∈I
β
Y Y
(6.2.1) ab = uv pα
i
i
qj j ,
i∈I j∈J
Nos ocupamos de este segundo caso. Para cada i ∈ I tenemos que, obviamente,
Y β
pi | x = v qj j .
i∈J
es decir
Y β −αi Y β
u pα σ(i)
(ω αi u−1 v) qj j .
k = qσ(i)
k
k∈I\{i} j∈J\{σ(i)}
298 6. FACTORIZACIÓN: GAUSS, LASKER. NOETHER
Siendo qσ(i) primo, debe ocurrir que ∃k ∈ I, k 6= i tal que qσ(i) | pk , luego qσ(i) ∼ pk y, sabiendo
que qσ(i) ∼ pi , concluirı́amos pi ∼ pk , con k 6= i, lo que es contradictorio con las hipótesis
que satisfacen las dos factorizaciones. Por tanto βσ(i) ≥ αi y βσ(i) 6> αi . Lo cual implica
necesariamente que βσ(i) = αi y tenemos la unicidad de la factorización en R.
Corolario 6.2.5. Todo dominio euclı́deo (resp. todo dominio de ideales principales) es do-
minio de factorización única.
Demostración. Obvio por los Teoremas 3.4.10 (caso de dominios euclı́deos) y Teorema
3.3.10 (caso de dominios de ideales principales). En ambos Teoremas se prueba la existencia
de factorización en irreducibles. De otro lado, en el Teorema 3.2.14 hemos probado que en los
dominios de ideales principales las nociones de primo e irreducible equivalen. Por tanto, se
tienen las hipótesis de la Proposición previa y tenemos probada la afirmación del Corolario.
Con ello concluimos que αk ≤ ordpk (a) para cada a ∈ F \ {0} y, por tanto, αk ≤ ok para cada
k, 1 ≤ k ≤ m. Entonces, es claro que x | h.
Finalmente, es fácil verificar la propiedad iv). Si y ∈ R verifica (a) entonces, y | h (por verificar
h la propiedad (b). De otro lado, si y ∈ R, verifica (b), entonces h | y, con lo que h e y estarán
asociados y termina la prueba del enunciado.
y tenemos el contenido:
a ⊆ (gcdDFU (F)) .
El hecho de que (h) = (gcdDFU (F)) implica que ambos generadores de un mismo ideal principal
son asociados, esto es,
h ∼ gcdDFU (F),
y el enunciado queda probado.
Observación 6.2.9. A partir de esta proposición tenemos que, en el caso de que un conjunto
F genera un ideal principal, su generador es el DFU-máximo común divisor. Esto hace que no
se distinga entre las dos denominaciones y se diga simplemente “máximo común divisor” (y se
denote gcd(F)) al máximo común divisor de F y se suprime la referencia al prefijo DFU (y al
sub-ı́ndice DFU) a partir de este momento.
Observación 6.2.11. El máximo común divisor verifica las propiedades siguientes (de obvia
verificación):
i) Dados {ai : i ∈ I} un conjunto de elementos de un DFU R no todos nulos, entonces,
gcd(ai : i ∈ I) = 1 ⇐⇒ ¬ (∃p ∈ R, (p ∈ R es primo) ∧ (p | ai , ∀i ∈ I)) .
6.2. DOMINIOS DE FACTORIZACIÓN ÚNICA: LEMA DE GAUSS 301
Observación 6.2.12. En la anterior definición, tanto el contenido como la parte primitiva están
definidos salvo unidades en R. En lo que respecta al contenido, si escribimos cont(f ) = a ∈ R,
se verifica que cont(f ) = b, para cualquier b ∈ R con a ∼ b.
En cuanto a la parte primitiva, hemos visto que las unidades de R[X] son exactamente las
unidades de R (i.e. (R[X])× = R× ). Por tanto, cuando escribimos pp(f ) = g, estamos, en
realidad, usando igualdad salvo unidades en R y queremos decir que pp(f ) = g para cualquier
g ∼ f . Usaremos indistintamente la notación = y ∼ al referirnos a contenido y parte primitiva
de un polinomio, sabiendo que son “igualdades salvo unidades en R”.
Obviamente también, la parte primitiva de un polinomio es un polinomio primitivo.
Lema 6.2.13. Sea R un dominio de factorización única, sean {a1 , . . . , am } ⊆ R tales que
gcd({a1 , . . . , am }) = 1.
Sea a ∈ R \ {0} un elemento adicional. Entonces,
gcd({(aa1 ), . . . , (aam )}) ∼ a.
Demostración. Es un Lema técnico menor, que haremos. Para empezar es claro que
a | (aai ) para cada i, 1 ≤ i ≤ m. Por tanto,
a | gcd({(aa1 ), . . . , (aam )}).
Por tanto, existirá b ∈ R tal que ab = gcd({(aa1 ), . . . , (aam )}). En particular, existirán
α1 , . . . , αn ∈ R tales que αi ab = aai para cada i, 1 ≤ i ≤ m. Como estamos en un dominio de
integridad, tenemos que
a(αi b − ai ) = 0 =⇒ αi b = ai , ∀i, 1 ≤ i ≤ m.
En particular, b | ai para cada i, 1 ≤ i ≤ m. Pero como gcd({a1 , . . . , am }) = 1, concluiremos
que b ∈ R× y el resultado se sigue.
Lema 6.2.15. Sea R un dominio de factorización única, si q(X) ∈ R[X] \ {0} es irreducible
entonces o bien q ∈ R y q irreducible en R o bien q ∈ R[X] \ R es un polinomio no constante
y, en ese caso, es un polinomio primitivo.
Demostración. De la descomposición q = cont(q)pp(q) deducimos que o bien cont(q) ∈
R× y q es primitivo o bien cont(q) 6∈ R× , en cuyo caso pp(f ) es una unidad en R[X] y, por
tanto, es una constante y q ∈ R× . En este segundo caso, q ∼ cont(q) en R y, necesariamente,
q es irreducible en R.
f g = f g.
Por ser R/p[X] un dominio de integridad, tendremos que f 6= 0 y g 6= 0, implicará que f g =
f g 6= 0. En particular, existirá un coeficiente de f g que no es divisible por p. En suma, no hay
ningún elemento primo (o irreducible) de R que divida simultáneamente a todos los coeficientes
de f g, luego su contenido es unidad cont(f g) ∈ R× y concluimos que f g es un polinomio
primitivo.
Observación 6.2.17. Nótese que hemos probado implı́citamente que si p es un elemento primo
de R, entonces p es primo en R[X].
Corolario 6.2.21. Con las notaciones anteriores, sea f ∈ K[X] un polinomio no nulo. En-
tonces, existe a ∈ R \ {0} tal que af ∈ R[X]. Además, si f es irreducible en K[X], la parte
primitiva pp(af ) ∈ R[X] es irreducible en R[X] y en K[X].
Demostración. Es lo que se ha probado en el resultado precedente.
con qj (X) ∈ K[X] irreducible para cada j, 1 ≤ j ≤ m. Para cada uno de tales subı́ndices j,
existirán constantes aj ∈ R no nulas, tales que aj qj ∈ R[X]. Por ejemplo, usando el producto de
los denominadores de los coeficientes de qj . Escribamos, Fj := pp(aj qj ) para cada j, 1 ≤ j ≤ m
y tenemos:
m m m m
α α
Y Y Y Y
( aj j )f1 = (aj qj (X))αj = cont(aj qj )αj Fj j .
j=1 j=1 j=1 j=1
Observación 6.2.23 (No todos los DFU’s son DIP). Por el Lema de Gauss precedente,
todo anillo de polinomios sobre un cuerpo K[X1 , . . . , Xn ] es dominio de factoirización única.
Pero para n ≥ 2, K[X1 , . . . , Xn ] no es dominio de ideales principales (ver iv) en Ejemplo 3.2.1).
donde
Qn
i) cont(f ) = k=1 pβkk es una factorización del contenido de f en producto de irreducibles
de R, Q
m α
ii) pp(f ) = j=1 Fj j es una factorización de pp(f ) como producto de polinomios primi-
tivos e irreducibles en R[X] (y, por tanto, irreducibles en K[X]).
Demostración. Es lo visto en la demostración del Lema de Gauss precedente.
iii) Haz una reflexión sobre la corrección de la prueba de Proofwiki (Prueba del caso
de anillos, llamada Proof 1) en la página https: // proofwiki. org/ wiki/ Square_
Matrix_ is_ Row_ Equivalent_ to_ Triangular_ Matrix . Reflexiona, por tanto, si el
enunciado que ahı́ se cita es cierto o falso y sobre el oscuro significado de ”Row Equiv-
alent” usado en ese texto.
iv) Reflexiona sobre la corrección de la prueba de la propiedad det(AB) = det(A) det(B)
que se exhibe en Proofwiki (también como Proof 1) en la página https: // proofwiki.
org/ wiki/ Determinant_ of_ Matrix_ Product .
6.2.4.1. Ley de Reciprocidad Cuadrática. Los problemas que siguen son una sencilla
descomposición de la prueba de la Ley de Reciprocidad Cuadrática de Gauss (cf. [Gauss, 1801]),
siguiendo la demostración de G. Einsenstein en [Eins,1859].
Sı́mbolo de Legendre. Sea p ∈ N un número primo impar y sea m ∈ N un entero positivo.
Se define el sı́mbolo de Legendre mediante la siguiente igualdad:
m p−1
:= m 2 mod p.
p
Es decir, es el resto módulo p de m(p−1)/2 . El sı́mbolo de Legendre aparece como tal en su obra
de 1789 (cf. [Legendre, 1789]).
Definición 76 (Residuos Cuadráticos). Sea p ∈ N un número primo y sea m ∈ Z un
número entero. Decimos que m es un residuo cuadrático módulo p si la ecuación siguiente
porsee solución en Fp :
X 2 − m = 0.
Nótese que m es un residuo cuadrático módulo p si y solamente si el polinomio X 2 − m ∈ Fp [X]
es reducible (lo que se puede decidir algorı́tmicamente usando, por ejemplo, el Algoritmo de
Berlekamp descrito en la serie de problemas expuestos en la Subsección 3.6.5.2
Problema 236 (Euler). Con las notaciones precedentes, pruébese la siguiente propiedad debida
a Euler:
“Sea p ∈ N un número primo impar. En número de residuos cuadráticos módulo p en F× p es
p−1
exactamente 2 .” ( Hint: Purébese que el conjunto de residuos cuadráticos módulo p es
2
p−1
{12 , 22 , 32 , . . . , }.)
2
Problema 237 (Criterio de Euler). Purébese la siguiente propiedad conocida como Criterio
de Euler (cf. [Euler, 1750]):
“ Con las notaciones precedentes, sea p ∈ N un número primo impar y sea m ∈ Z un entero,
entonces se tiene:
1, si p - m y m es residuo cuadrático módulo p
m
= -1, si p - m y m no es residuo cuadrático módulo p
p
0, si p | m.
( Hint: Úsese el Teorema Pequeño de Fermat (ver Problema 151), obsérvese que
p−1 p−1
X −1 − 1 = (X 2 − 1)(X 2 + 1) = 0 en Fp [X],
y úsese el problema precedente.)
Problema 238. Realı́cense las tareas siguientes:
i) Probar que el sı́mbolo de Legendre m p es cı́clico de orden p.
ii) Probar que el sı́mbolo de Legendre es una función multiplicativa:
mn m n
= .
p p p
iii) Hallar los siguientes valores del sı́mbolo de Legendre:
• 2
m 1, si p - m.
=
p 0, si p | m.
308 6. FACTORIZACIÓN: GAUSS, LASKER. NOETHER
•
−1 1, si p ≡ 1 mod 4.
=
p -1, si p ≡ 3 mod 4.
La Construcción de Einsenstein. Consideremos p ∈ N un primo impar y q ∈ N un
entero positivo impar tales que p no divide a q (i.e. p - q). Consideremos los intervalos abiertos
(0, p), (0, q) ⊆ R y definamos la región
R := (0, p) × (0, q) ⊆ R2 .
Y consideremos el conjunto de los puntos en R con coordenadas enteras:
Λ := Z2 ∩ R.
La siguiente imagen muestra los conjuntos R y Λ para p = 7 y q = 9, por ejemplo.
(p, q)
(0, q)
× ×
× ×
R (p, 0)
× ×
R (p, 0)
Ninguna de las dos contiene a ningún punto de Λ porque tanto p como q son impares. Consid-
eremos la imagen resultante con los puntos:
A := (0, 0), X := (p/2, 0), Y := (p/2, p/2), B := (p, 0), C := (p, q), Z := (p/2, q), W := (0, q/2).
C
(0, q) Z
× × ×
Y
W× ×
× × ×
A X B
4
Problema 239. Con la construcción precedente, sea ABC el triángulo descrito por los vértices
A := (0, 0), B := (p, 0), C := (p, q) dentro de la región precedente. Para cada u ∈ {1, . . . , p − 1}
sea Lu la recta paralela al eje vertical pasando por el punto (u, 0). Pruébese que
4
uq
] Lu ∩ Λ ∩ ABC ≤ b c,
p
donde b·c significa parte entera.
Con las misma notaciones precedentes dada Ω ⊆ Λ una región acotada (como Ω := R ∩ Λ
anterior), denotaremos mediante:
Ω1 := {(x, y) ∈ Ω : x 6∈ 2Z},
y
Ω2 := {(x, y) ∈ Ω : x ∈ 2Z}.
Problema 240. Con la construcción y las notaciones precedentes, pruébense las siguientes
igualdades:
i) Para cada Ω ⊆ Λ, acotadapor una región finita,
](Ω) = ](Ω1 ) + ](Ω2 ).
ii) Con las notaciones precedentes:
p−1
4
X
uq
] Λ ∩ ABC = b c,
u=1
p
Problema 242. Con las notaciones precedentes, considérese la región BXY C determinada por
los puntos B := (p, 0), X := (p/2, 0), Y := (p/2, q/2) y C := (p, q). Pruébese que
4
] Λ ∩ BXY C 2 = ] Λ ∩ CY Z mod 2.
2
Es decir, pruébese:
4
(−1)
]((Λ∩BXY C )
2
) = (−1)] Λ∩CY Z
2 .
Problema 243. Usando las notaciones y resultados precedentes, pruébese:
P p−1
b uq c b uq c 2 b uq c
P Y
(−1) u∈2Z∩{1,...,p−1} p = (−1) p = (−1) u=1 p .
u∈2Z∩{1,...,p−1}
ii) Dados m, n ∈ N dos enteros positivos impares y supuestas dadas dos factorizaciones
en primos (impares) posiblemente repeidtos:
n := p1 · · · pr , m := q1 · · · qs .
Entonces,
r
! s
n−1 m−1 X pi − 1 X qj − 1
× = mod 2.
2 2 i=1
2 j=1
2
6.2. DOMINIOS DE FACTORIZACIÓN ÚNICA: LEMA DE GAUSS 313
Problema 255. Pruébese que si n ∈ N es un número compuesto impar, entonces hay al menos
×
un testigo de Euler en (Z/nZ) .( Hint: Distinguir los casos en los que n posee un factor múltiple
(∃p ∈ N, p2 | n) y el aso en el que todos sus factores primos tienen multiplicidad 1).
Input: n ∈ N, con n ≥ 3 y k ∈ N
guess randomly a1 , . . . , ak ∈ {2, . . . , n − 1}
for i := 1 to k, compute:
a
i
xi :=
n
n−1
if xi = 0 o xi 6= ai 2 mod p, para algún i Output Compuesto
else Output: Probablemente Primo
fi
end
También pueden caracterizarse los elementos del radical del modo siguiente: Dado un elemento
f ∈ R y el ideal a consideremos el endormorfismo de R−módulos siguiente:
ηf : R/a −→ R/a
x + a 7−→ f x + a.
√
Entonces, un elemento f ∈ R está en a si y solamente si el endomorfismo ηf anterior es
nilpotente, es decir, si y solamente si existe n ∈ N, n ≥ 1 tal que ηfn = 0. En otras palabras, se
tiene:
Lema 6.3.1. Sea R un anillo, a ⊆ R un ideal y R/a el anillo cociente de R por a. Sea (0 + a)
el ideal cero del anillo cociente R/a. Se tiene:
√ p
a = {f ∈ R : f + a ∈ (0 + a)}.
En otras palabras, si π : R −→ R/a es la proyección canónica sobre el anillo cociente, entonces,
√ p p
a = π −1 ( (0 + a) = ( (0 + a))c ,
donde la contracción del ideal se refiere a la contracción con respecto al morfismo π (ver
Proposición 1.4.9, ı́tem v)).
Demostración. Es mera reconstrucción de las frases que preceden a este enunciado.
p ón. Basta con probar el resultado i). Aplicando i) al anillo cociente, obten-
Demostraci
dremos que (0 + a) es un ideal en R/a. Por el Lema precedente, el radical de un ideal a es la
contracción de un ideal de R/a. Por el ı́tem√v) de la Proposición 1.4.9, toda contracción de un
ideal es también un ideal y concluimos que a es ideal de R.
Para probar i), basta con probar que la suma y el producto de elementos nilpotentes es nilpo-
tente. Para ello, sean x, y ∈ R tales que xm = 0 e y n = 0, con n, m ∈ N, n, m ≥ 1 y z ∈ R.
Entonces, Tendremos que
(zy)m = 0,
y
n+m
X
(x + y)n+m = cn+m,k xk y n+m−k = 0,
i=0
donde cn+m,k es o bien el número combinatorio n+m
k o 0 dependiendo de la estructura de
grupo abeliano de R. √
Para√probar iii) nótese que los elementos nilpotentes de√R/ a son, precisamente,
√ los elementos
n
f + a tales que existe n ∈ N, n ≥ 1, verificando (f √ + a) = 0 en R/ a. Esto es equivalente
a decir que existe n ∈ N, n ≥ 1, verificando f n ∈ a. Pero esta condición significa que existe
316 6. FACTORIZACIÓN: GAUSS, LASKER. NOETHER
√
m ∈ N, m ≥ 1 tal que (f n )m ∈ a y esto implica f nm ∈ a, con nm ∈ N, nm ≥ 1. Luego f ∈ a
como se pretende.
Proposición 6.3.3 (Propiedades inmediatas del radical). Sea a, b dos ideales de un anillo
R. Se tiene:
p√ √
i) √ a =√ a, √
√
ii) √ab = a ∩ b = a ∩ b,
iii) a = R siq y solamente si a = R,
√ √ √
iv) a + b = a + b,
√
v) Si p ∈ Spec(R), pn = p, para todo n > 0.
Demostración. Siendo de fácil demostración que dejamos como Problema 258.
donde cada ideal primo pi = (pi ). Aplicando la elemental Proposición precedente, concluimos
que:
r q r
√ q \ \
a = pα 1
1
· · · pαr
r = pαi
i = pi = p1 · · · pr .
i=1 i=1
La última igual se tiene porque cada pi es principal y primo en un DFU. En conclusión, si
a = (a), tenemos que
√
a = (p1 · · · pr ).
Obviamente, el mismo resultado se tiene si, además de ser DFU, el anillo R es DIP.
Ejemplo 6.3.5. En el ejemplo precdente hemos preludiado alguna de las ideas que subyace al
Teorema de Lasker-Noether aunque, como veremos, es sólo un idea sesgada e incompleta. Es
decir, supongamos que a es un ideal cualquiera en un anillo cualquiera (no necesriadamente
DFU, ni tampoco a es principal). Supongamos que a es una producto de potencias de primos,
i.e.
a = pα αr
1 · · · pr ,
1
Entonces,
√
a = p1 ∩ · · · ∩ pr .
Los mismo sucede para las intersecciones de potencias de ideales primos por la Proposición
elemental precdente. Como veremos, no todos los ideales son producto (ni siquiera intersección)
de potencias de ideales primos. Esta especia de generalización de las ideas de Gauss falla ya
para anillos noetherianos y propiciará el Teorema de Lasker-Noether.
6.3. LASKER-NOETHER (EXISTENCIA) 317
Ejemplo 6.3.6. Sea (X, T ) un espacio topológico y sea C (X) el anillo de las funciones continuas
a valores reales sobre X. Es obvio observar que C (X) no posee elementos nilpotentes no nulos
(incluso si poseyera divisores de cro no nulos, como en el caso en que X no sea conexo). Por
tanto, C (C) es un ejemplo natural de anillo reducido.
Más aún, sea F ⊆ X un subconjunto cualquiera. Definamos IC (F ) como el siguiente conjunto:
IC (F ) := {f ∈ C (X) : f ≡ 0}.
F
Es sencillo observar que IC (F ) es un ideal en C (X) (si dos funciones se anulan en F , su suma
también se anulará, etc.). Es sencillo observar también que si f sin C (X) es tal que una potencia
suya f n se aula en F , entonces, por ser R un cuerpo, f debe anularse en F . Es decir, se tiene
p
IC (X) = IC (X),
y concluimos que IC (F ) es un ideal radical en C (X). Será un ejemplo inspirador que, a su vez,
nos llevará al Nullstellensatz que veremos en Capı́tulos posteriores.
6.3.2. Ideales Primarios. Ya hemos sugerido que no todo ideal propio de un anillo, ni
siquiera cuando es noetheriano, va a ser una intersección (o producto) de potencias de ideales
primos. En otras palabras, las potencias de ideales primos no van a bastar para “factorizar”
ideales que no sea principales. Sugre ası́ la noción que reemplaza a la noción de “potencia de
ideal primo” que será la noción de ideal primario de Lasker y Noether.
Haremos el estudio con la perspectiva de poder extender los resultados para R−módulos noethe-
rianos (de tal modo que sea sencillo generalizar a módulos nuestro discurso para anillos). Pero
nos restringiremos al caso de anillos y dejaremos para los Problemas el caso de R−módulos.
Para empezar retomamos nuestras homotecias. Sea M un R−módulo. Para cada elemento
a ∈ R, denotaremos por ηa,M en endomorfismo de R−módulos definido, de nuevo del modo
siguiente
ηa,M : M −→ M
m 7−→ am.
que denominamos la homotecia de razón a sobre M . La generalización de lo que sigue pasa por
considerar esta homotecia como elemento fundamentador. En la Sección, nos restringiremos
6.3. LASKER-NOETHER (EXISTENCIA) 319
al caso del R−módulo M := R/q y de la homotecia ηa,R/q , dejando el caso general para los
problemas. Por garantizar que esta homytecia, en este caso, queda definida con precisión,
observamos que viene dada por la siguiente expresión:
ηa,R/q : R/q −→ R/q
x + q 7−→ ax + q.
En ocasiones, cuando no haya posibilidad de confusión, escribiremos simplemente ηa , pero hay
que ser cuidadoso con estanotación en muchos casos.
Recordemos también la noción de endomorfimso nilpotente de un R−módulo M como el en-
domorfismo φ : M −→ M tal que existe n ∈ N, n ≥ 1, verificando φn ≡ 0, donde φn es la
composición de φ consigo mismo n veces.
Lema 6.3.10. Sea R un anillo, M un R−módulo, las homotecias verifican las siguientes propiedades:
i) Si a = 0 es el elemento nulo del anillo, η0,M ≡ 0 es el endomorfismo nulo de M .
ii) Si a = 1 es el elemento unidad para el producto del anillo, entonces η1,M = IdM es el
endomorfismo identidad sobre M .
iii) Dados a1 , a2 ∈ R dos elementos, se verifican las siguientes identidades:
ηa1 +a2 ,M = ηa1 ,M + ηa2 ,M , ηa1 a2 ,M = ηa1 ,M ◦ ηa2 ,M = ηa2 ,M ◦ ηa1 ,M ,
donde ◦ significa composición de aplicaciones
En otras palabras, el siguiente es un morfismo de anillos con unidad (aunque el segundo anillo
no sea conmutativo):
H : (R, +, ·) −→ (HomR (M, M ), +, ◦)
a 7−→ ηa,M .
Demostración. Es un sencillo ejercicio de comprobación.
Los siguientes ejemplos sirven para mostrar que los ideales primarios tratan de generalizar
los conceptos de potencia de un ideal primo en un dominio de ideales principales. Pero la
generalización no consiste de manera obvia en pensar en potencias de ideales primos.
Ejemplo 6.3.16 (Ideales primarios principales en DIP’s y DFU’s). Los ideales primarios
en dominios de ideales principales son las potencias de ideales primos. Ası́ el ideal 8Z es un
ideal (2)−primario, pero el ideal (12) no es primario.
Del mismo modo, si R es un DFU y si q = (q) es un ideal principal. Este ideal (q) es primario
si y solamente si q es una potencia de un elemento primo.
Ejemplo 6.3.18 (No toda potencia de primo es primario). Consideramos ahora el ideal
a := (XY − Z 2 ) ⊆ Q[X, Y, Z] y sea R el anillo cociente:
R := Q[X, Y, Z]/a.
Sea p = (X + a, Z + a) = (X, Z)/a ⊆ R el ideal generado por las clases de X y Z con respecto
al ideal a. Tenemos que p es un ideal primo de R. Esto se ve fácilmente, dado que
(6.3.1) R/p ∼= (R/a) /((X, Z)/a) ∼ = Q[X, Y, Z]/(X, Z) ∼ = Q[Y ].
Ejemplo 6.3.19 (No todo ideal con radical primo es primario). Si bien el radical de
un ideal primario es un ideal primo, no es necesariamente cierto que todo ideal cuyo radical
2
√ el ideal a := (XY, Y ) ⊆
es primo sea un ideal radical. El ejemplo clásico pasa por considerar
R := Q[X, Y ]. Observamos que el radical del ideal a satisface a = (Y ), que es un ideal
primo en Q[X, Y ]. Pero, el ideal a no es primario: la homotecua ηX,R/a no es inyectiva porque
√
ηX,R/a (Y + a) = 0, y tampoco es nilpotente porque X 6∈ a.
Proposición 6.3.21. Sea a un ideal propio de un anillo R. Dada una presentación de a como
intersección finita de ideales primarios:
(6.3.2) a := q1 ∩ · · · ∩ qt ,
entonces esta descomposición puede refinarse a una descomposición primaria irredundante y,
en particular, a posee una descomposición primaria irredudante.
Demostración. El refinamiento se hará en dos fases:
i) Fase 1: Agrupar los primarios con el mismo radical:En primer lugar, supongamos
que cada qi es pi −primario, con pi ∈ Spec(R). Salvo reordenación de los subı́ndices,
podremos encontrar r ≤ t tal que se tenga:
{p1 , . . . , pt } = {p1 , . . . , pr },
con pi 6= pj para cada i 6= j, 1 ≤ i, j ≤ r. En otras palabras, identificamos los
elementos distintos del conjunto {p1 , . . . , pt }. Seguidamente, agrupamos los ideales
primarios de la Identidad 6.3.2 que tengan el mismo radical. Es decir, para cada j,
1 ≤ j ≤ r, definamos:
\ \ √
rj := {qi : qi es pj −primario} = {qi : qi = pi }.
Observación 6.3.24. Otra manera de interpretar los ideales primos asociados a un R−módulo
M viene dada por la formulación siguiente :
Un ideal primo p ∈ Spec(R) es asociado a M si y solamente si existe un monomorfismo de
R−módulos:
ϕ : R/p −→ M.
El elemento ϕ(1R + p) = x verifica p = Ann({x}). La clase de ideales primos asociados a un
R−módulo es especialmente importante por determinar sus divisores de cero.
Nótese que, en el caso de anillos, son los divisores de cero del anillo.
326 6. FACTORIZACIÓN: GAUSS, LASKER. NOETHER
Ejemplo 6.3.25. Por tomar un ejemplo clásico, retomemos la Teorı́a del Endomorfismo in-
troducida en el Ejemplo 2.2.4. Consideramos un K−espacio vectorial de dimensión finita V
y un endormorfismo como K−espacio vectorial ϕ : V −→ V . Esto inducı́a una estructura de
K[X]−módulo sobre V dada mediante:
· : K[X] × V −→ V
(p, v) 7−→ p(ϕ)(v),
donde el endomorfismo p(ϕ) se define en el citado ejemplo. Ahora, dado un elemento v ∈ V , su
anulador será:
AnnK[X] (v) := {p ∈ K[X] : p(ϕ)(v) = 0}.
Como K[X] es un dominio de ideales principales el ideal AnnK[X] (v) = (q(X)) es un ideal
principal. Sugenerador es el polinomio mı́nimo de ϕ en v (que hemos denotado mediante µv en
el Problema 165). Este ideal es asociado a V como K[X]−módulo si y solamente si µv es un
elemento primo.
Por el ı́tem iv) de la Proposición 4.2.12, dado que p es un ideal primo, existirá un
cierto k, 1 ≤ k ≤ j, tal que pk ⊆ p. Fijemos ese k, con 1 ≤ k ≤ j.
Por otro lado, a partir de la Identidad (6.3.5), como k ≤ j, se tiene que x 6∈ qk o,
equivalentemente, x + qk 6= 0. Para cada a ∈ p = AnnR (x), tendremos que ax = 0 en
R y, por tanto, la homotecia ηa,R/qk : R/qk −→ R/qk no es inyectiva:
ηa,R/qk (x + qk ) = 0 + qk .
Por tanto, por ser qk un ideal pk −primario, los elementos a ∈ R tales que la homotecia
ηa,R/qk no es inyectiva están en el ideal pk . En conclusión, para cada a ∈ p, concluimos
que a ∈ pk y tenemos p = pk .
Combinando ambas inclusiones, concluimos que si p ∈ Ass(R), entonces existe k ∈
6.3. LASKER-NOETHER (EXISTENCIA) 327
{1, . . . , r} tal que p = pk y tenemos probada la primera inclusión de las dos afirmadas
en el enunciado del Teorema.
• ⊇ :Para el otro contenido, probemos que cada i, 1 ≤ i ≤ r, pi ∈ Ass(M ). Supongamos,
sin pérdida de la generalidad, i = 1 y considremos x ∈ q2 ∩ · · · ∩ qr tal que x 6∈ q1 .
Tal elemento x ∈ R ha de existir porque la descomposición primaria del enunciado
es irredundante. Puesto que q1 es p1 −primario, existirá n ∈ N tal que pn1 ⊆ q1 . Por
tanto, pn1 x ⊆ q1 . Consideremos el conjunto:
B := {m ∈ N : m ≥ 1, pm
1 x ⊆ q1 }.
Hemos visto que ese es un conjunto no vacı́o de enteros positivos, ası́ que debe tener
algún mı́nimo. Supongamos que n es el mı́nimo de A. Existirá, entonces, un elemento
y ∈ pn−1
1 x tal que y 6∈ q1 . En particular y 6= 0 en R y p1 y ⊆ pn1 x ⊆ q1 . Por lo tanto,
p1 ⊆ AnnR ({y}). De otro lado, si a ∈ R es un elemento tal que ay = 0, la homotecia
ηa,R/q1 : R/q1 −→ R/q1 no es inyectiva (porque y 6∈ q1 y ay = 0). Por la Proposición
6.3.12, dado que q1 es p1 −primario, concluimos que a ∈ p1 . Habremos probado que
AnnR ({y}) ⊆ p1 ⊆ AnnR ({y}) y concluimos la igualdad que pretendı́amos. Por tanto,
concluimos que:
p1 = AnnR ({y}) ∈ Ass(R).
Los ideales primos dados como radical de los primarios que aparecen en una descomposición
primaria irredundante de (0), están determinados de maneraúnica como la clase Ass(R). La
unicida de tales primos se sigue dela definición de Ass(R), cuyos elementos nada tienen que ver,
a priori, con la descomposición primaria irredundante considerada.
La siguiente propiedad muestra la relación entre los divisores de cero de un anillo noetheriano
y los primos asociados:
Proposición 6.3.29. Sea R un anillo noetheriano, a ( R un ideal propio. Entonces, el conjunto
de los divisores de cero de R/a como R−módulo es dado por la siguiente igualdad:
[
p.
p∈Ass(R)
En particular, los divisores de cero de un anillo R es la unión de los ideales primos en Ass(R).
Demostración. Hagamos la prueba para el caso a = (0) y dejemos el caso general como
ejercicio para el lector.
Tomemos una descomposición primaria irredundante del ideal (0) de R :
(0) = q1 ∩ · · · ∩ qr
donde cada qi es pi −primario.
Sin pérdida de la generalidad, consideremos el ideal primo p1 . Por el teorema precedente, como
p1 es un ideal primo en Ass(R), existe x ∈ R tal que p1 = AnnR (x). Pero x 6= 0 puesto que si
x = 0, entonces AnnR ({0}) = R y p1 es primo y, por tanto, propio en R. Pero esto significa
que para cada λ ∈ p1 existe x 6= 0 en R tal que λx = 0, con lo cual λ es un divisor de cero
en R y tenemos que todos los elementos de p1 son divisores de cero en R. Cambiando 1 por
328 6. FACTORIZACIÓN: GAUSS, LASKER. NOETHER
cualquier i en este argumento, concluimos que la siguiente unión está formada por divisores de
cero de R: [
p = p1 ∪ · · · ∪ pr .
p∈Ass(R)
6.3.4.1. Unas palabras sobre los ideales primos minimales en Spec(R), con R
noetheriano. Consideremos R un anillo noetheriano a ( R un ideal propio, consideremos
una descomposición primaria irredudante
a = q1 ∩ · · · ∩ qr ,
donde cada qi es un ideal pi −primario. Consideremos el conjunto
V (a) = {p ∈ Spec(R) : p ⊇ a}.
Consideremos ahora la relación de inclusión sobre V (a). Esto define una estructura de grafo
orientado sobre V (a) donde las aristas orientadas E ⊆ V (a) × V (a) vienen dadas por los pares
(p, n) ∈ V (a)2 tales que p ⊆ n. Como V (a) está identificado con el espectro primo Spec(R/a),
en realidad estamos hablando de la estructura de grafo del espectro de ese anillo cociente.
Supongamos ası́ p ∈ V (a) y tenemos que
p ⊇ a = q1 ∩ · · · ∩ qr .
Tomando radicales a ambos lados tenemos que
√ √ √ √ √
p = p ⊇ a = q1 ∩ · · · ∩ qr = q1 ∩ · · · ∩ qr = p1 ∩ · · · ∩ pr .
Retomemos ahora el ı́tem iii) de la Proposición 4.2.12. Si p no contuviera a ninguno de los
ideales primos p1 , . . . , pr es porque para cada i, 1 ≤ i ≤ r, existirá xi ∈ pi \ p. Pero, entonces,
r
Y r
Y
xi ∈ pi ⊆ p1 ∩ · · · ∩ pr ⊆ p.
i=1 i=1
Esto estarı́a en contradicción con la condición “p es un ideal primo de R”. Hemos probado ası́
la siguiente propiedad:
Proposición 6.3.31. Sea R un anillo noetheriano, a ( R un ideal propio de R. Entonces, el
grafo Spec(R/a) orientado mediante la inclusión posee solamente un número finito de elemen-
tos minimales. Más aún, los ideales minimales de Spec(R/a) están entre los ideales primos
asociados Ass(R/a).
La afirmación es, en particular, cierta para Spec(R) y sus ideales primos minimales. En este
caso, los ideales primos minimales de un anillo noetheriano están formados por algunos de los
divisores de cero del anillo.
Demostración. La hemos dado justo antes del enunciado.
6.3. LASKER-NOETHER (EXISTENCIA) 329
A los ideales primos minimales sobre a se les denomina componentes aisladas del ideal a.
Existen ideales a propios en anillos noetherianos R y descomposiciones primarias como en (??)
en las que no todos los ideales primos de la colección {p1 , . . . , pr } son minimales entre los primos
que contienen a a. En el Problema 260 se muestra un ejemplo sencillo de un ideal que posee
primos asociados que no son minmales. A los ideales primos asociados que no son minimales
sobre a se les denomina primos inmersos o componentes inmersas sobre el ideal a.
Un de los (pocos) casos en los que podemos garantizar que no tenemos componentes inmersas
es el siguiente:
Proposición 6.3.32 (Los ideales radicales no poseen componentes √ inmersas). Si R es
un anillo noetheriano y a ( R es un ideal propio y radical (i.e. a = a. Entonces los primos
asociados de Ass(R/a) son todos primos aislados (i.e. primos minimales sobre el ideal a).
El resultado es, en particular, cierto para los anillos reducidos (i.e. sin elementos nilpotentes
no nulos) y, en ese caso, los ideales primos asociados son los primos minimales del anillo y,
además, los divisores de cero de anillo son la unión de los primos minimales del anillo.
√
Demostración. Supongamos que a = a y consideremos una descomposición primaria
irredudante del ideal a:
a = q1 ∩ · · · ∩ qr ,
donde qi es pi −primario y, por el Teorema de Unicidad,
√
Ass(R/a) = Ass(R/ a) = {p1 , . . . , pr }.
Como a es un ideal radical también tenemos una descomposición primaria de a dada mediante
los ideales primos asociados:
√ √ √ √
a = a = q1 ∩ · · · ∩ qr = q1 ∩ · · · ∩ qr = p1 ∩ · · · ∩ pr .
Si esta descomposición primaria no fuera irredudante, entonces podrı́amos refinarla y existirı́a
un subconjunto S ( {1, . . . , r} tal que una descomposición primaria irredudante de a se tendrı́a
con la forma: \
a= pi .
i∈S
Pero, por el Teorema de Unicidad precedente concluirı́amos que los ideales primos asociados
del anillo cociente R/a satisfarı́an la siguiente propiedad imposible:
Ass(R/a) = {pi : i ∈ S} ( {p1 , . . . , pr } = Ass(R/a).
Por tanto, la siguiente es una descomposición primaria irredundante del ideal radical a:
(6.3.6) a = p1 ∩ · · · ∩ pr .
Los ideales primarios que aparecen en la descomposición son ciertamente ideales primos y,
además, no se puede refinar esta descomposición sin añadir elementos que no están en a. Es
decir, para cada S ( {1, . . . , r}, se tiene que:
\
a( pi .
i∈S
lo cual no es posible por ser la descomposición descrita en la Identidad (6.3.6) una descom-
posición irredudante. En particular, como los ideales primos minimales sobre a están entre
{p1 , . . . , pr } y no hay relación de inclusión posible entre dos distintos de ellos, todos los primos
de {p1 , . . . , pr } son ideales minimales sobre el ideal a.
En el caso a = (0) y radical (i.e. R no posee elementos nilpotentes) es un caso particular de lo
anterior.
330 6. FACTORIZACIÓN: GAUSS, LASKER. NOETHER
Problema 261 (Propiedades Elementales del Cociente de Ideales). Pruébense las sigu-
ientes propiedades:
Sea a, b, c ideales de un anillo R. Se tiene:
i) a ⊆ (a : b),
ii) (a : b)b ⊆ a,
iii) ((a : b) : c) = (a : bc) = ((a : c) : b),
i : b) = ∩i (ai : b),
iv) (∩i aP
v) (a : i bi ) = ∩i (a : ai ).
6.3.5.2. El Teorema de Lasker-Noether para módulos noetherianos. La sigu-
iente ser de problemas extiende a los R−módulos noetherianos el Teorema de Lasker-Noether
que acabmos de ver para anillos. Están estructurados de manera incremental y acumulativa,
de modo que cada problema suele depender de problemas precedentes. Para el material sobre
módulos noetherianos, véase la Sección ??.
Comencemos deiniendo el equivalente para submódulos de la noción de ideal primario:
Definición 86 (Submódulos e ideales primarios). Sea M un R−módulo. Un submódulo
N de M se denomina primario si N 6= M y para cada a ∈ R, la homotecia ηa,M/N es o bien
inyectiva o bien nilpotente.
Problema 262. Pruébese lo siguiente:
Si N es un submódulo primario de un R−módulo M , entonces el conjunto:
p := {a ∈ R : ηa,M/N no es inyectiva},
es un ideal primo de R. Diremos que el submódulo N es p−primario.( Hint: Se trata de repetir
la prueba, adaptándola a este contexto, de la Proposición 6.3.12).
Problema 263. Pruébese lo siguiente:
Sean N1 , . . . , Ns submódulos p−primarios de un R−módulo M (es decir, primarios con respecto
al mismo ideal primo de R). Entonces, la intersección
N = N1 ∩ · · · ∩ Ns
es un submódulo p−primario.( Hint:Adaptar al contexto de módulos la demostración de la
Proposición 6.3.20).
6.3. LASKER-NOETHER (EXISTENCIA) 331
una descomposición primaria irredudante del submódulo h0i de M , donde cada Ni es pi −primario.
Entonces,
AssR (M ) = {p1 , . . . , pr }.
En particular, los ideales primos asociados a una descomposición primaria irredudante del
submódulo h0i de M son únicos e independientes de la descomposición primaria irredundante
elegida. De otro lado, el número de los ideales primos asociados a un R−módulo finitamente
generado sobre un anillo noetheriano es finito y están determinados por una descomposición
primaria irredundante del submódulo h0i de M .
N = N1 ∩ · · · ∩ Nr
Problema 270. Sea R un anillo y R[X] el anillo de polinomios en una variable con coeficientes
en R. Para cada ideal a de R, denotemos por a[X] (o por a ⊗R R[X]) el conjunto de los
elementos en R[X] tales que todos sus coeficientes están en el ideal a. Se pide probar las
siguientes afirmaciones:
i) El conjunto a[X] es un ideal de R[X] y es precisamente la extensión de a a R[X] para
la inclusión ι : R ,−→ R[X], i.e. ae = a[X].
ii) Si p ∈ Spec(R) es un ideal primo, entonces su extensión p[X] ∈ Spec(R[X]) es también
un ideal primo.
iii) Si q ⊆ R es un ideal p−primario en R[X], entonces q[X] es un ideal p[X]−primario
en R[X].
iv) SI a ⊆ R es un ideal y tenemos una descomposición primaria irreduidante de a dada
mediante:
\m
a= qi ,
i=1
Índice
7.1. Introducción 335
7.1.1. Geometrı́a Diferencial: objetos dados “explı́citamente” ( por parametrizaciones
locales o globales) con buenos rangos en los Jacobianos: 336
7.1.2. Geometrı́a Algebraica, Analı́tica, Diofántica etc.: Objetos geométricos
dados implı́citamente por sus ecuaciones globales (o locales): 338
7.2. Geometrı́a y soluciones: La(s) topologı́a(s) de Zariski 339
7.2.1. Variedades o conjuntos de ceros (o de soluciones): Topologı́a(s) de Zariski 340
7.2.1.1. Algunos Ejemplos de Topologı́as de Zariski 344
7.2.2. Ideal de un objeto geométrico, primos, maximales y variedades. 346
7.2.2.1. Ideales Primos e Irreducibles 348
7.2.2.2. Ideales maximales y puntos 349
7.2.2.3. Nullstellensätze y y Variantes: ¿Diccionario Álgebra–
Geometrı́a?. 350
7.3. Rudimentos de Geometrı́a Algebraica: Variedades algebraicas
K−definibles 350
7.3.1. Funciones polinomiales K−definibles. 351
7.3.2. Variedades algebraicas afines y K−definibles. 352
7.3.3. Primos, maximales y variedades algebraicas afines. 355
7.3.4. Otras consecuencias de la argumentación noetheriana 357
7.3.4.1. Proyección y contracción de ideales 362
7.4. Variedades algebraicas en el espacio proyectivo: Ideales
homogéneos 362
7.4.1. Ejercicios y problemas de la Sección 7.2 378
7.1. Introducción
Se trata simplemente de empezar a conocer los términos más elementales como conjunto al-
gebraico, variedad algebraica sobre un cuerpo algebraicamente cerrado (K−definible, en algún
335
336 7. GEOMETRÍA ALGEBRAICA: TOPOLOGÍA DE ZARISKI
caso), ideal asociado, componentes irreducibles y/o la topologı́a de Zariski definida por un anillo
de funciones o en el espectro de un anillo.
Aunque la terminologı́a, especialmente la Tolopogı́a, no es propia del siglo XIX, sı́ que es cierto
que hay una gran lista de geómetras del siglo XIX que se ocuparon de estudiar de estos objetos
geométricos, sin disponer de herramientas notacionales o culturales como las que que están a
uestra disposición en este siglo XXI. Sólo por citar algunos de los gigantes de ese sigloi XIX,
aunque sus nombres no salgan en el texto de manera distinguida, y algunos alcanzaron su cénit
a comienzos del siglo XX, pongamos unos nombres cuya historia puede encontrarse fácilmente
en la red:
• E. Bézout, E. Laguerre, A. Cayley, F. Klein,...
• La escuela italiana: L. Cremona, E. D’Ovidio, C. Segre, G. Castelnouvo, F. Enriques,
E. Bertini, P. Del Pezzo, G. Fano, G. Veronese y un larguı́simo etcétera.
• H. Baker, M. Noether (padre de E. Noether), H. Schubert, E. Kähler, C. É. Picard,...
• D. Hilbert, L. Kronecker, E. Netto, F.S. Macaulay, D. König,...
• Y, desde la Teorı́a de Números como elemento influyente en el Álgebra Conmutativa,
R. Dedekind, E. Kummer, etc....
Muchos de estos autores continuaron trabajando en el primer tercio del siglo XX, cuando la
influencia de D. Hilbert y E. Noether impregna los desarrollos que ya exhibimos en el Capı́tulo
precedente. Casi todos ellos han tenido un homenaje en la terminologı́a de la Geometrı́a Al-
gebraica moderna: Bézout Inequality, Cayley form, Klein surfaces, Cremona transform, Segre
variety and Segre embbeding, del Pezzo varieties, Castlenouvo regularity, Bertini theorem, Fano
varieties, Max Noether resolution of singularities, Schubert calculus, Kähler manifold, Picard
group, Macaulay elimination, Dedekind rings, etc. Todos ellos son términos que deberı́an entrar
en un curso estándard de Geometrı́a Albebraica. Desgraciadamente, las limitaciones de tiempo
impiden llegar hasta algunos de ellos. En todo caso, todos ellos se ocuparon de un modo u otro
de los objetos geométricos cuya terminologı́a se incia en este Capı́tulo.
Como esta mera introducción genera ciertas dificultades en su lectura, abriremos un paréntesis
diáctico sobre objetos geométricos dados explı́cita o implı́ticamente.
(lo que se llamarán parametrizaciones locales). Estos son los objetos de estudio de la
Geometrı́a Diferencial. Un dibujo ilustrativo (sin entrar en el asunto esencial de
la compatibilidad de la carta) podrı́a ser el siguiente:
iii) Leminiscatas: Son los objetos geométricos con forma de “ocho tumbado” o sı́mbolo
del infinito que atrajeron a los matemáticos del pasado. Por ejemplo, la Lemniscata
de Gerono: que viene dada por la parametrización siguiente:
ϕ: R 7−→ R2
t 7−→ (cos(t), cos(t) sin(t)),
Un dibujo serı́a el siguiente:
Este objeto geométrico posee casi todas las propiedades de las curvas del ejemplo
precedente: es dada por una parametrización, la parametrización es global (toda la
curva es imagen), pero ya no es una curva diferenciable: es imposible encontrar un
difeomorfismo (ni siquiera un homeomorfismo) entre un entorno del origen (0, 0) ∈
ϕ(R) en la curva ϕ(R) y un intervalo abierto de 0 ∈ R. La razón puede verse del modo
siguiente: eligiendo un entorno suficientemente pqequeño del origen (0, 0) ∈ ϕ(R) en
la curva (por ejemplo, la intersección de la curva con la bola en R2 centrada en (0, 0)
de radio 1/4), eliminando el origen (0, 0) de ese entorno nos quedan 4 componentes
conexas. Y no hay ningún intervalo abierto de R tal que eliminando un punto nos
salgan más de 2 componentes conexas. Surge ası́ una pregunta obvia: ¿Qué clase de
objetos son éstos?.
topológico) que satisfacen ciertas ecuaciones. Esas formas de geometrı́a son las que se dis-
cuten en este Capı́tulo. El primer ejemplo a considerar es la anterior Lemniscata de Gerono.
Tenı́amos una descripción como la imagen por una aplicación analı́tica:
ϕ: R 7−→ R2
t 7−→ (cos(t), cos(t) sin(t)),
Siendo la Lemniscata el conjunto L := ϕ(R), podemos también darla como el conjunto de
puntos que satisfacen una cierta ecuación:
L := {(x, y) ∈ R2 : x4 − x2 + y 2 = 0}.
Ya hemos visto que no es una curva local o globalmente parametrizable mediante una función
que tenga un buen gradiente. No es, por tanto, una subvariedad en el sentido de Riemann,
presenta puntos especialmente malos (llamados singularidades) y se puede entender como el
conjunto de los ceros de la ecuación polinomial indicada. De ese modo surgen diversas formas
de Geometrı́a, algunas de las cuales se definen groseramente como sigue:
i) Geometrı́a Algebraica: Inicialmente es la Geometrı́a de los objetos definidos
por ecuaciones polinomiales (es decir por polinomios en K[X1 , . . . , Xn ], usualmente
suponiendo que K es un cuerpo algebriacamente cerrado) y las soluciones pueden
estar en un espación afı́n sobre un cuerpo algebraicamente cerrado An (K) = An (K)
(se llamará Geometrı́a Algebraica Afı́n), o en un espacio projectivo sobre un cuerpo
algebraicamente cerrado Pn (K) (Geometrı́a Algebraica Proyectiva). Por extensión, la
Geometrı́a Algebraica admite también estructuras en las que, localmente, los objetos
geométricos son ceros en un espectro primo Spec(R) de un anillo, susualmente neothe-
riano, y las ecuaciones son elementos del anillo (ver Problema 296, por ejemplo). A
partir de Grothendieck, estas geometrı́as se llamarán también Geometrı́a Algebraica
de Esquemas Afines. Pero esa terminologı́a nos obligarı́a a ir mucho más allá del curso.
ii) Geometrı́a Analı́tica: Se trata de objetos geométricos M ⊆ An (K), donde K = R
o K = C (y, en ocasiones, K es un cuerpo valuado completo, como el cuerpo de los
números p−ádicos, pero se sale de nuestro contexto). Un subconjunto M ⊆ An (K)
se llama variedad analı́tica, si para cara punto p ∈ M , existe un entorno abierto
U ⊆ An (K) (para la topologı́a usual) y existe un familia finita de funciones analı́ticas
f1 , . . . , fs ∈ C ω (U ) (u holomorfas- analı́ticas complejas- en H (U ), si K = C) de tal
modo que
U ∩ M := {z ∈ U : f1 (z) = · · · = fs (z))0}.
Al darse en un entorno de cada punto, hablamos de ser soluciones de ecuaciones
analı́ticas localmente definidas. Un ejemplo simple de variedad anaı́tica que no es
algebraica serı́a la siguiente:
{x ∈ R : sin(x) = 0}.
Es una variedad analı́tica porque está dada por una ecuación analı́tica, no es algebraica
porque al corarla con la recta {x = 0} tiene una cantidad infinita (numerable) de ceros.
iii) Geometrı́a Diofántica o Puntos Raciones de Variedades Algebraicas: Es
similar a la Geometrı́a Algebraica, pero aquı́ las soluciones no tienen coordenadas en
un cuerpo sino en un anillo de enteros. Es decir, se considera R = Z o√bien R un anillo
√
de enteros algebraicos (como los ejemplos R := Z[ m] o R := Z[ 1+2 m ] descritos en
los ejemplos). Se consideran polinomios f1 , . . . , fs ∈ R[X1 , . . . , Xn ] y se estudian sus
soluciones en Rn :
{(x1 , . . . , xn ) ∈ Rn : f1 (x1 , . . . , xn ) = 0, . . . , fs (x1 , . . . , xn ) = 0}.
EL objetivo es estudiar estos tipos de objetos. Est conduce a diverso problemas de
gran relevancia histórica:
• El Problema X de Hilbert (ver Problema 189) que fue el origen de la noción
de algoritmo, gracias a Gödel, Church y Turing, y, por tanto, de la informática
tal y como la conocemos.
• Las Variedades Abelianas Son variedades algebraicas Z−definibles (i.e. las
ecuaciones tienen coeficientes en Z) y que poseen una estructura de grupo abeliano
(como las curvas elı́pticas, por ejemplo). Ver https://en.wikipedia.org/wiki/
340 7. GEOMETRÍA ALGEBRAICA: TOPOLOGÍA DE ZARISKI
Proposición 7.2.3. Sea X un conjunto no vacı́o, sea R un anillo y sea A[X] una R−álgebra
que es subanillo de RX . Sea F ⊆ A[X] un conjunto y a ⊆ A[X] el ideal que F genera en A[X].
Entonces,
VX (F) = VX (a).
Más aún, el variedad VX (a) coincide con la variedad VX (G) asociada a cualquier conjunto de
generadores G de a como ideal en A[X]. Es, por tanto, independiente del conjunto generador
elegido. En particular, toda variedad A[X]−definibles de X es una variedad asociada a un ideal
de A[X].
Adicionalmente, si A[X] es un anillo noetheriano, toda variedad A[X]−definible es una inter-
sección finita de hipersuperficies, es decir, dado a ⊆ A[X] un ideal, si A[X] es noetheriano,
existe una familia finita f1 , . . . , fs ∈ A[X] tales que
VX (a) = VX (f1 ) ∩ · · · ∩ VX (fs ) = VX (f1 , . . . , fs ).
342 7. GEOMETRÍA ALGEBRAICA: TOPOLOGÍA DE ZARISKI
Por tanto, f (x) = 0 para cualquier f ∈ a, luego x ∈ VX (a) y habremos probado VX (F) ⊆ VX (a)
concluyendo la primera afirmación del enunciado.
Obviamente, si tuviéramos otro conjunto G de generadores del ideal a, aplicxando esta misma
afirmación tendrı́amos:
VX (G) = VX (a) = VX (F),
y la variedad no depende del sistema generador de a elegido.
En lo que concierne al caso noetheriano, es claro que, por definición de anillo noetheriano, todo
ideal a de A[X] posee un sistema generador finito y, por lo que acabamos de probar, VX (a) será
el conjunto de ceros comunes a ese sistem generador finito de elementos del ideal a.
ii) Es obvio.
iii) Es obvio.
7.2. LA(S) TOPOLOGÍA(S) DE ZARISKI 343
P S
iv) Recuérdese (Definición 35) que i∈I ai es el ideal generado por i∈I ai . Obsérvese,
además, que
[ [
VX ( ai ) := {x ∈ X : f (x) = 0, ∀f ∈ ai } ⊆ VX (ai ), ∀i ∈ I.
i∈I i∈I
P
Luego, como aj ⊆ i∈I ai , para cada j ∈ I, aplicando la afirmación i) concluimos
[ X \
(7.2.1) VX ( ai ) = VX ( ai ) ⊆ VX (ai ).
i∈I i∈I i∈I
T P
Para el otro contenido,
S sea x ∈P i∈I VX (ai ) y sea f ∈ i∈I ai dos elementos cua-
lesquiera. Como i∈I ai genera i∈I ai , existirá J ⊆ I un conjunto finito y para cada
(j) (j) (j) (j)
j ∈ J, existirán elementos {f1 , . . . , fkj } ⊆ aj y elementos {g1 , . . . , gkj } ⊆ A en
número finito y elementos tales que:
kj
(j) (j)
X X
f= gi fi .
j∈J i=1
Pero como x ∈ VX (ai ) para todo i ∈ I, también se tiene x ∈ VX (aj ) para todo j ∈ J.
(j) (j)
Como {f1 , . . . , fkj } ⊆ aj , para cada j ∈ J, entonces concluimos:
(j)
fi (x) = 0, ∀j ∈ J, ∀i, 1 ≤ i ≤ kj .
Por tanto, la igualdad precedente se puede escribir como:
kj kj
(j) (j) (j)
X X X X
f (x) = gi (x)fi (x) = gi (x) · 0 = 0,
j∈J i=1 j∈J i=1
vii) Una de las inclusiones es obvia por√i). Para la otra, sI R no posee elementos nilpo-
tentes, dado f ∈ A[X] tal que f ∈ a, existe
√ n ≥ 1, n ∈ N, tal que f n ∈ a. Por tanto
si x ∈ X es tal que x ∈ VA[X] (a) y f ∈ a, entonces f n (x) = 0 entonces f (x) = 0 y
√
x ∈ VA[X] ( a).
Corolario 7.2.5 (Topologı́a de Zariski). Con las notaciones precedentes, dado un conjunto
X, un dominio de integridad R y una R−álgebra A[X] que es subanillos de RX , el conjunto de
los subconjuntos de ceros A[X]−definibles
{VX (a) : a es un ideal de A[X]},
define una única topologı́a en X en la que dicho conjunto es la clase de cerrados. A esa topologı́a
se la denomina topologı́a de Zariski sobre X dada por el anillo A[X] y la denotaremos mediante
TZ (A[X]). Discutiremos diversos ejemplos en las páginas que siguen.
Demostración. Basta observar la proposición precedente, y las propiedades allı́ probadas,
para concluir que existe una única topologı́a en X para la cual los cerrados son los subconjuntos
del conjunto de las variedades A[X]−definibles.
Esto nos permite introducir el lenguaje de la topologı́a en nuestro contexto y podemos usar los
términos siguientes:
Definición 90. Sea X un conjunto y A[X] ⊆ RX una clase de funciones, con R dominio de
integridad.
i) Llamaremos cerrados (A[X]−definible) para la topologı́a de Zariski a las variedades
A[X]−definibles.
ii) Llamaremos abierto (A[X]−definible) en la topologı́a de Zariski a los complementarios
de las veriadades A[X]−definibles. Es decir, son abiertos aquellos subconjuntos O ⊆ X
tales que existe un ideal a ⊆ A[X] de tal modo que:
[
O= {x ∈ X : f (x) 6= 0} = X \ VX (a).
f ∈a
Observación 7.2.6. Obviamente resulta incómodo y oneroso repetir una y otra vez el término
A[X]−definble. Por ello, evitaremos esa insistencia cuando la R−álgebra A[X] sea clara por
el contexto. Especificaremos el detalle del objeto en los casos en los que la R−álgebra sea
determinante para alguna propiedad en cuestión. Ası́ que hablaremos de cerrados, abiertos,
localmente cerrados en X para la topologı́a de Zariski, etc.
7.2.1.1. Algunos Ejemplos de Topologı́as de Zariski.
Ejemplo 7.2.7 (Ceros de funciones continuas a valores reales). Sea (X, T ) un espacio
topolológico sea R = R el cuerpo de los números reales y A[X] = C (X) (o también denotado,
en ocasiones como C 0 (X)) el anillo de las funciones contı́nuas de X en R. Podemos definir
conjuntos como:
VX (f ) := {x ∈ X : f (x) = 0} := f −1 ({0}).
El conjunto VX (f ) es, obviamente, un cerrado en X y resulta fácil observar algunas identidades
elementales como las siguientes:
VX (f ) ∪ VX (g) := VX (f.g), VX (f ) ∩ VX (g) := VX (f 2 + g 2 ).
Sobre los reales se da un patologı́a especial y es que intersecciónes finitas de hipersuperficies
definidas por una sola ecuación son también hipersuperficies definidas por una sola ecuación.
Esto no necesariamente ocurre para una colección infinita de ecuaciones dadas por funciones
continuas a valores reales definidas sobre un espacio topológico.
En todo caso, observamos que la topologı́a T dada inicialmente es “a priori” más fina que
la topologı́a de Zariski TZ (C (X)) definida sobre X por las funciones continuas, es decir,
TZ (C (X)) ⊆ T . Observemos también (en virtud del Teorema de Banach-Stone-Čech-Gel’fand-
Kolmogorov) que si X es compacto, ambas topologı́as coinciden.
Ejemplo 7.2.13 (Ceros de una función a valores complejos). A partir de una función
continua f ∈ C (X, C) podemos definir el conjunto de sus ceros comunes en X:
VX (f ) := {x ∈ X : f (x) = 0} := f −1 ({0}).
La demostración no la daremos aquı́ porque exige una fuerte introducción previa en variable
compleja y funciones analı́ticas reales que no se corresponde al curso pero, en todo caso, ilustra
la distinción entre la toopologı́a de Zariski y la topologı́a usual.
7.2. LA(S) TOPOLOGÍA(S) DE ZARISKI 347
Observación 7.2.16. Es obvio que IA[X] (F ) es un ideal de A[X]. Obviamente en cada caso
hemos de especificar el anillo sobre el que trabajamos. Los ideales respectivos son distintos,
obviamente, aún cuando estemos en el caso de subanillos como, por ejemplo, en el caso de la
siguiente cadena de sub–anillos:
R[X1 , . . . , Xn ] ⊆ C ω (X) ⊆ C ∞ (X) ⊆ C (X),
tendremos ası́ la cadena de los “respectivos” ideales;
IR[X1 ,...,Xn ] (F ) ⊆ IC ω (X) (F ) ⊆ IC ∞ (X) (F ) ⊆ IC (X) (F ),
que no coincidirán. Como notación, una vez hemos fijado el contexto de una R−álgebra A[X]
sobre la que estamos trabajando, escribiremos simplemente I(F ). en lugar de IA[x] (F ), en-
tendiéndose la R−álgebra A[X] por el contexto. Sólo lo especificaremos cuando pueda haber
confusión y el contexto no sea claro.
Proposición 7.2.17. Con las anteriores notaciones, sean X el conjunto, R dominio de integri-
dad, fijemos una R−álgebra A[X] que es subanillo de RX . Escribamos I(F ) := IA[X] (F ) para
cualquier subconjunto F ⊆ X. Se verifican las propiedades siguientes:
i) Si F ⊆ G son dos subconjuntos de X, I(G) ⊆ I(F ).
ii) I(∅) = A[X], (0) = I(X). p
iii) LosS ideales I(F
T ) son ideales radicales (i.e. I(F ) = I(F )).
iv) I(Ti∈I Fi ) = Pi∈I I(Fi ).
v) I( i∈I Fi ) ⊇ i∈I I(Fi ).
vi) Además, la clausura en la topologı́a de Zariski sobre X definida por A[X] de cualquier
subconjunto viene dada mediante:
z
F = V (I(F )).
Además,
z
I(F ) = I(F ).
Demostración. La primera afirmación es evidente desde la Definición. La segunda también.
La afirmación iii) es consecuencia de ser R un dominio de integridad (el resultado también serı́a
cierto si hubiéramos asumido quep R un anillo reducido, i.e. sin elementos nilpotentes no nulos,
ver Definición 79). Ası́, si f ∈ I(F ), entonces existe n ∈ N, n ≥ 1, tal que f n ∈ I(F ). Por
tanto, f (x)n = 0 para cada x ∈ F . Como R es un anillo reducido, el único elementos nilpotentes
es el 0 ∈ R. Como f (x) ∈ R, claramente se tiene que f (x)n = 0 =⇒ f (x) = 0 y esto es cierto
para todo x ∈ F . Por tanto f ∈ I(F ) y concluimos que I(FS ) es un ideal radical. S
Para la afirmación iv), aplicando i) observamos que Fj ⊆ i∈I Fi y, por tanto, I( i∈I Fi ) ⊆
I(Fj ) para cada j ∈ I, con lo que se obtiene el contenido
[ \
I( Fi ) ⊆ I(Fi ).
i∈I i∈I
T
Para el otro contenido usamos la definición directamente.SSi f ∈ i∈I I(Fi ), entonces, f se
anula en todos los Fi ’s y, por tanto, se anula en la unión i∈I Fi . Y el otro contenido queda
demostrado.
La propiedad v) sólo establece el contenido (la igualdad es incierta) y es consecuencia inmediata
de la propiedad i): Como ∩i∈I Fi ⊆ Fj para cada j ∈ I, entonces, I(Fj ) ⊆ I(∩i∈I Fi ) para cada
j ∈ I. Por tanto, la suma también está incluida y tendremos
X \
I(Fi ) ⊆ I( I(Fi ).
i∈I i∈I
348 7. GEOMETRÍA ALGEBRAICA: TOPOLOGÍA DE ZARISKI
La propiedad iv), aún siendo sencilla, tiene algún interés en su prueba. Recordemos la topologı́a
de Zariski, descrita en la Proposición 7.2.5 anterior. Escribamos I(F ) en lugar de IA[X] (F )
por descaragr un poco la notación. En particular, VX (I(F )) es cerrado en esa topologı́a y,
z
claramente, F ⊆ VX (I(F )). Por tanto, tenemos un primer contenido F ⊆ VX (I(F )). De otro
z
lado, por la propia definición de la topologı́a de Zariski, como F es cerrado, debe existir un
ideal a en A[X] tal que:
z
(7.2.3) F ⊆ F = VX (a) ⊆ VX (I(F )).
Como F ⊆ VX (a), para cada f ∈ a, f F ≡ 0. Pero, entonces, para cada f ∈ a, tenemos
que f ∈ I(F ) y habremos probado que a ⊆ I(F ). Finalmente, usando la primera de las
afirmaciones de la Proposición 7.2.4 anterior, concluiremos VX (I(F )) ⊆ VX (a), por cuanto
z
F = VX (a) = VX (I(F )). La última afirmación se sigue elementalmente de esta. Si f ∈ A[X]
z
se anula en un conjunto F , entonces f ∈ I(F ), con lo que f se anula también en V (I(F )) = F .
z
Obviamente, si f se anula en la clausura F , se anulará también en F y habremos terminado
la prueba del enunciado.
Observación 7.2.18. En estos apuntes hemos decidido presentar las variedades algebraicas
a través de una R−álgebra de funciones sobre X, es decir, hemos escrito, por simplicidad,
A[X] ⊆ RX . Pero no siempre va a ser ası́. En ocasiones, se consideran R−álgebras A[X]
cuyos elementos definen funciones, pero no de manera unı́voca. En esos casos, algunas de la
igualdades predecentes se pierden. Por ejemplo, consideremos R = Fq el cuerpo finito de q
elementos, supongamos X = F2q como conjunto no vacı́o y supongamos que consideramos la
R−álgebra A[X] = Fq [X1 , X2 ]. Los polinomios en A[X] definen funciones sobre X y se tiene
(0) ⊆ IA[X] (X), pero no se tiene la igualdad porque, obviamente,
(0) ( a ⊆ IA[X] (X),
con lo que la propiedad ii) de la proposición precedente no se da.
Corolario 7.2.19. Con las notaciones anteriores, para cualquier subconjunto C ⊆ X, se tiene
que C es cerrado Zariski para la topologı́a definida por A[X] si y solamente si
C = VX (IA[X] (C)).
Más aún, se verificarán las propiedades siguientes para cerrados F y G en la topologı́a de
Zariski:
F ⊆ G ⇐⇒ IA[X] (G) ⊆ IA[X] (F ).
Corolario 7.2.21. Con las notaciones y propiedades precedentes, los cerrados irreducibles para
la topologı́a de Zariski están contenidos en el conjunto:
{VX (p) : p ∈ Spec(A[X])}.
Demostración. Si V es cerrado irreducible en la topologı́a de Zariski, entonces p :=
I(V ) ∈ Spec(A[X]). Pero, como es cerrado
z
V = V = VX (I(V )) = VX (p),
lo que prueba el enunciado.
Observación 7.2.22. La pregunta natural pasa por intentar conocer qué ideales primos p
definen un irreducible y cuáles no. Es una pregunta de tipo Nullstellensatz.
Proposición 7.2.23 (Ideales asociados a puntos). Con las mismas notaciones pecedentes,
R un dominio de integridad, A[X] una R−álgebra que es subanillo de RX y x ∈ X un punto
de X. Denotemos por mx ) al ideal mx := I({x}), es decir,
mx = IA[X] ({x}) := {f ∈ A[X] : f (x) = 0}.
Entonces,
i) El ideal mx ∈ Spec(A[X]) es un ideal primo. En particular, la clausura Zariski de un
z
punto cualquiera {x} es una variedad A[X]−definible irreducible.
ii) Si R es un cuerpo y A[X] es una R−álgebra, entonces el ideal mx ∈ MaxSpec(A[X])
es un ideal maximal.
iii) En general no es cierto que {x} sea un cerrado para la topologı́a de Zariski definida
por A[X] sobre X. Ni siquiera en el caso de que R sea un cuerpo.
350 7. GEOMETRÍA ALGEBRAICA: TOPOLOGÍA DE ZARISKI
Observación 7.2.24. Del mismo modo que en el caso de ideales primos (ver Observación
7.2.22) y subvariedades irreducibles, nos podemos pregunta qué ideales maximales están aso-
ciados a los puntos de x y viceversa. De nuevo es una pregunta que será respondida por el
Nullstellensatz.
7.2.2.3. Nullstellensätze y y Variantes: ¿Diccionario Álgebra–Geometrı́a?.
En las observaciones 7.2.24 y 7.2.22 nos preguntamos por la identificación entre conjuntos de
ceros irreducibles y primos. De modo general, podemos retomar el Corolario 7.2.19 e interpre-
tarlo del modo siguiente:
Fijemos in conjunto X no vacı́o, un dominio de integridad R, una R−álgebra A[X] que sea
subanillo de RX . Definamos los conjuntos de cerrados en la topologı́a de Zariski en X
T c (X) := {F ⊆ X : F es cerrado Zariski en X},
y de ideales en A[X]:
IA[X] := {a ⊆ A[X] : a es un ideal de A[X]}.
Tenemos las transformaciones:
V : IA[X] −→ T c (X), I : T c (X) −→ IA[X]
a 7−→ VX (a), F 7−→ IA[X] (F ).
El Corolario 7.2.19 se traduce simplemente en:
V ◦ I |T c (X) = IdT c (X) .
En particular, I es inyectiva, V es suprayectiva, pero no queda claro quién es la imagen de
I o, dicho de otro modo, cómo podemos caracterizar qué ideales de A[X] están identificados
con los objetos geométricos. A las respuetas a estas preguntas se les conoce como Teoremas
de los Ceros o Nullstellensätze. En el Capı́tulo 8 daremos el enunciado y demostración
del Nullstellensatz de Hilbert-Kronecker. Este resultado considera un cuerpo K y su clausura
algebraica K, toma como espacio X un espacio afı́n de dimensión finita (pongamos de dimensión
n) sobre K, esto es en el caso X = An (K) = An (K) y considera como anillo de funciones al
anillo A[X] = K[X1 , . . . , Xn ]. Mostraremos, sin demostración, también otros ejemplos de
Nullstellensätze en otros ámbitos de funciones y espacios.
7.3. RUDIMENTOS DE GEOMETRÍA ALGEBRAICA 351
(Clay Institute 1) sin olvidar que aparecen 3 de los problemas aún abiertos de la lista original
de 18 problemas de Steve Smale para las Matemáticas del siglo XXI ([Smale, 1998]), aunque,
en realidad, se hace referencia a 4 de ellos.
7.3.1. Funciones polinomiales K−definibles. Sea K un cuerpo y K un cuerpo alge-
braicamente cerrado que le contiene. Denotemos por An (K) = Kn el espacio afı́n n−dimensional
sobre K. Consideraremos el conjunto de las funciones polinomiales K−definibles sobre An (K),
que denotaremos mediante K[An (K)], definido del modo siguiente:
K[An (K)] := {f : An (K) −→ K : ∃F ∈ K[X1 , · · · , Xn ], f (x) = F (x), ∀x ∈ An (K)}.
Se trata obviamente de un anillo y una K−álgebra. En el caso K = K escribiremos simplemente
K[An ]. En el Problema 56, ya tratamos sobre este anillo. Consideramos el anillo de aplicaciones
Ap(An (K), K) y consideremos las proyecciones canónicas
πi : An (K) −→ K
(x1 , . . . , xn ) 7−→ xi .
n
Sea K[π1 , . . . , πn ] la menor sub-K−álgebra de KA (K) que verifica las dos propiedades siguientes:
• K ⊆ K[π1 , . . . , πn ],
• πi ∈ K[π1 , . . . , πn ], para cada i, 1 ≤ i ≤ n.
Nótese que, en las notaciones de la Proposición 1.4.7, K[π1 , . . . , πn ] es otra notación para la sub-
n
K−álgebra de KA (K) generada por {π1 , . . . , πn }, es decir, K[π1 , . . . , πn ] := K[{π1 , . . . , πn }].
Proposición 7.3.1. Con las anteriores notaciones, se tiene
i) Existe un epimorfismo de K−álgebras (i.e. es la identidad sobre el subcuerpo K)
Φ : K[X1 , . . . , Xn ] −→ K[An (K)] = K[π1 , . . . , πn ],
verificando Φ(Xi ) = πi , para cada i, 1 ≤ i ≤ n.
ii) Además, como K es un cuerpo de cardinal infinito, Φ es un isomorfismo de K−álgebras.
Demostración. La buena definición del morfismo Φ es obvia. Es claro que las proyec-
ciones πi = Φ(Xi ) ∈ Im(Φ). Esto prueba que K[An (K)] ⊇ K[π1 , . . . , πn ]. De otro lado,
supongamos f ∈ K[An (K)] existe un polinomio F ∈ K[X1 , . . . , Xn ] tal que f (x) = F (x) para
cada x ∈ An (K). Supongamos que
X
F := aµ X1µ1 · · · Xnµn .
|µ|≤d
1Véase https://www.claymath.org/millennium-problems
7.3. RUDIMENTOS DE GEOMETRÍA ALGEBRAICA 353
o el caso K = R y K = C.
• En el caso K = Q y K := Q ⊆ C, dado un ideal a = (f ) ⊆ Q[X1 ], podemos considerar
los conjuntos siguientes:
VA (a) := VA1 (Q) (a) = VA1 (Q) (f ) = {ζ ∈ Q : f (ζ) = 0}.
mientras que
VQ (a) := VA (a) ∩ Q = {ζ ∈ Q : f (ζ) = 0}.
Tomemos como ejemplo el polinomio:
√ √
f := X14 + 1 = (X12 − 2X1 + 1)(X12 + 2X1 + 1),
y el ideal a que genera. Entonces, la variedad Q−posee cuatro puntos
√ 1±i √
−1 ± i
VA (a) = { 2 , 2 } ,
2 2
mientras que no hay ningún punto Q−racional, es decir,
VQ (a) = ∅.
• Si hubiéramos elegido K = R y K = C, con el mismo polinomio f := X14 + 1 y
denotemos por ae el ideal que define en R[X1 ], la variedad de los ceros complejos sigue
teniendo 4 puntos, pero admite una descomposicón en R−definibles:
√ √
VA1 (C) (ae ) = VA1 (C) (X12 − 2X1 + 1) ∪ VA1 (C) (X12 − 2X1 + 1),
porque el ideal ae 6∈ Spec(R[X1 ]). El conjunto de los puntos R−racionales sigue siendo
vacı́o:
VR (ae ) = ∅.
Ejemplo 7.3.7. Obviamente, los objetos de estudio de la Geometrı́a algebraica no son simple-
mente los casos de una variable n = 1 descritos anteriormente (ese serı́a el objeto de estudio
de la Teorı́a de Galois), sino el estudio de variedades dadas por ecuaciones polinomiales como
los siguientes. A pesar de mi escaso interés por los dibujos de estos objetos geométricos,
sino por otras propiedades, he incluido un par de ejemplos de imágenes (en general de difı́cil
tratamiento, para ilustrar estas variedades algebraicas. Nótese que las imágenes vertidas no
son todos los puntos en VAn (C) porque no podemos dibujarlos para n ≥ 2, sino solamente sus
puntos R−racionales, llamados puntos reales de la variedad :
• La Cardioide VA2 (C) (g) es una curva plana, dada por una ecuación de grado 4 (una
cuártica) cuyos puntos reales se ven en la imagen siguiente:
Igualmente usaremos los términos cerrado Zariski, abierto Zariski, localmente cerrado Zariski
o clausura Zariski en las respectivas topologı́as de Zariski K−definibles en An (K).
Recordemos que los abiertos distinguidos son los complementarios de las hipersuperficies, es
decir, un abierto distinguido en An (K) dado por f ∈ K[X1 , . . . , Xn ] es un subconjunto OA (f )
dado mediante:
OAn (K) (f ) := {x ∈ An (K) : f (x) 6= 0}.
356 7. GEOMETRÍA ALGEBRAICA: TOPOLOGÍA DE ZARISKI
Corolario 7.3.10. Cada abierto en la topologı́a de Zariski de An (K) dada por los K−definibles
es unión finita de abiertos distinguidos de la forma
OA (f ) := OAn (K) (f ) := An (K) \ VAn (K) (f ) := {x ∈ An (K) : f (x) 6= 0}.
Demostración. Es obvio a partir del Basissatz. La Proposición 7.3.5 nos dice que la
variedad definida por un ideal es igual a la variedad de ceros comunes a cualquiera de sus
generadores. De ello se sigue que toda variedad algebraica K−definible es la interseción de un
número finito de hipersuperficies. Por tanto, sus complementarios son los abiertos Zariski y son
uniones finitas de abiertos en la clase {O(f ) : f ∈ K[X1 , . . . , Xn ]}.
Corolario 7.3.12. Con las notaciones anteriores, para cualquier subconjunto C ⊆ An (K), se
tiene que C es cerrado para la topologı́a de Zariski definida en An (K) por K[X1 , . . . , Xn ] si y
solamente si
C = VA (IK (C)).
Más aún, se verificarán las propiedades siguientes para cerrados F y G en la topologı́a de
Zariski:
F ⊆ G ⇐⇒ IK (G) ⊆ IK (F ).
Proposición 7.3.14. Con las notaciones precedentes, V ⊆ An (K) es cerrado irreducible K−definible
si y solamente si es cerrado e IK (V ) ∈ Spec(K[X1 , . . . , Xn ])
Demostración. Idéntica a la Demostración de la Proposición 7.2.20.
Proposición 7.3.15 (Ideales asociados a puntos afines). Con las mismas notaciones prece-
dentes, dado x ∈ An (K) un punto de An (K), Denotemos por mx al ideal IK ({x}), es decir,
mx = IK[X1 ,...,Xn ] ({x}) := {f ∈ K[X1 , . . . , Xn ] : f (x) = 0}.
Entonces,
z
i) El ideal mx ∈ Spec(K[X1 , . . . , Xn ]) es un ideal primo y la clausura Zariski {x} es
una variedad irreducible.
ii) Si K es la clausura algebraica de K, entonces, el ideal mx ∈ MaxSpec(K[X1 , . . . , Xn ])
es un ideal maximal. De hecho, si todas las coordenadas del punto x ∈ An (K) son
elementos algebraicos sobre K, entonces mx ∈ MaxSpec(K[X1 , . . . , Xn ]).
iii) En general no es cierto que {x} sea un cerrado para la topologı́a de Zariski de los
K−definibles (definida por K[X1 , . . . , Xn ] sobre An (K)).
iv) Si K = K o si ζ = (z1 , . . . , zn ) ∈ K n entonces, el ideal mζ viene dado mediante:
mζ = (X1 − z1 , . . . , Xn − zn ) ⊆ K[X1 , . . . , Xn ],
y está generado por una familia de n polinomios de grado 1. Más aún, si f ∈
K[X1 , . . . , Xn ], entonces
f + mζ = f (ζ) + mζ = f (z1 , . . . , zn ) + mζ ,
en el anillo K = K[X1 , . . . , Xn ]/mζ .
Demostración. La primera parte sigue las mismas pautas de la prueba de la Proposición
7.2.23. Consideremos el morfismo de anillos:
evx : K[X1 , . . . , Xn ] −→ K
f 7−→ f (x).
Es claro, por los mismos argumentos de entonces, que mx ∈ Spec(K[X1 , . . . , Xn ]).
Para la segunda de las afirmaciones, obsérvese que si K es la clausura algebraica de K y si
x = (x1 , . . . , xn ), entonces los elementos x1 , . . . , xn son algebraicos sobre K. De hecho se
observa que
K(x1 , . . . , xn ) := {f (x1 , . . . , xn ) : f ∈ K[X1 , . . . , Xn ]},
es el menor cuerpo que contiene a K y a los elementos algebraicos {x1 , . . . , xn } (ver Problema
280). De hecho, observamos que la imagen de evx es precisamente el cuerpo K(x1 , . . . , xn ):
Im(evx ) = K(x1 , . . . , xn ).
Por tanto,
K[X1 , . . . , Xn ]/mx ∼
= Im(evx ) = K(x1 , . . . , xn ),
es un cuerpo y mx ∈ MaxSpec(K[X1 , . . . , Xn ]). Lo mismo para la segunda afirmación, puesto
que sólo hemos usado que las coordenadas del punto x son elementos algebraicos sobre K.
La tercera afirmación del enunciado sigue el mismo caso del ejemplo mostrado en prueba de la
afirmación iii) de la Proposición 7.2.23.
La cuarta afrmación es un sencillo ejericio de inducción que dejamos al lector, aplicando la
división por el polinomio mónico Xi − ζi como en el Teorema 1.4.15 (de la División Euclı́dea
por un polinomio mónico).
358 7. GEOMETRÍA ALGEBRAICA: TOPOLOGÍA DE ZARISKI
Demostración. Tenemos un claro argumento del estilo noetheriano: Razonemos por re-
ducción al absurdo y supongamos que existen cerrados Zariski K−definibles en An (K) que no
son unión finita de irreducibles. Entonces, el siguiente conjunto es no vacı́o:
F := {V ⊆ An (K) : V no es unión finita de irreducibles K−definibles}.
Como F es no vacı́o, ha de poseer algún elemento minimal. Si V es un elemento minimal de F ,
entonces no puede ser irreducible. Si fuera irreducible, serı́ una unión finita de irreducibles y,
por tanto, no podrı́a estar en F . Si no es irreducible, entonces es reducible y existirán W1 , W2
cerrados Zariski tales que
• V = W1 ∪ W2 ,
• Wi ( V , i ∈ {1, 2}.
Ahora bien, de la segunda de estas afirmaciones, como cada Wi está estrictamente contenido
en un elemento minimal de F es claro que Wi 6∈ F para i ∈ {1, 2}. Por tanto, cada Wi es
una unión finita de irreduciles. Pero, si ası fuera, como V es unión de W1 y W2 , entonces
también V es unión finita de irreducibles lo que significarı́a que V 6∈ F . Por tanto F debe ser
necesariamente vacı́o y, por tanto, todo cerrado Zariski K−definible de An (K) ha de ser unión
finita de cerrads irreducibles K−definibles.
Ahora consideremos, para una variedad V fijada, el siguiente conjunto de números naturales:
N (V ) := {s ∈ N : existe una descomposición de V como unión de s irreducibles}.
Hemos visto que N (V ) es un conjunto no vacı́o de números naturales y, por tanto, debe poseer
un mı́nimo. Sea r := min(N (V )) ese mı́nimos y existirá una descomposición de V como unión
de r cerrados irreducibles
V = V1 ∪ · · · ∪ Vr ,
de tal modo que no existe ningún subconjunto propio S ( {1, . . . , r} tal que
[
V = Vi .
i∈S
De existir, el lector fácilmente inferirá que entonces r no puede ser el mı́nimo de N (V ). Clara-
mente, no es posible que haya inclusiones entre dos variedades irreducibles Vi y Vj en la de-
scomposición precedente. De tener Vi ⊆ Vj podrı́amos escribir
[
V = Vk ,
k∈{1,...,r}\{i}
y tendrı́amos que V es unión finita de una subfamilia propia de {V1 , . . . , Vr } contraviniendo ii).
Con esto quedan probadas las afirmaciones i) a iii).
En cuanto a la afirmación iv), supongamos que tenemos dos descomposiciónes irredudantes de
V ⊆ An (K) :
(7.3.3) V = V1 ∪ · · · ∪ Vr = W1 ∪ · · · ∪ Ws .
Tendremos que para cada i
Vi := (Vi ∩ W1 ) ∪ (Vi ∩ W2 ) ∪ · · · (Vi ∩ Ws ).
Por ser irreducible, existirá j tal que Vi = Vi ∩ Wj ⊆ Wj . Ahora bien tenemos también
Wj = (Wj ∩ V1 ) ∪ · · · ∪ (Wj ∩ Vr ).
De nuevo, por ser Wj irreucible, habrá de existir t tal que Wj ∩ Vt ⊆ Vt . Esto nos lleva a una
cadena de contenidos
Vi = Vi ∩ Wj ⊆ Wj = Wj ∩ Vt ⊆ Vt .
Pero como la descomposición es irredundante, entonces t = i, lo que implicará:
Vi = Vi ∩ Wj ⊆ Wj = Wj ∩ Vi ⊆ Vi .
Serán todo igualdades y esto nos permite definir una aplicación:
σ : {1, . . . , r} −→ {1, . . . , s}
i 7−→ σ(i), Vi = Wσ(j) .
360 7. GEOMETRÍA ALGEBRAICA: TOPOLOGÍA DE ZARISKI
Del mismo modo podemos argumentar partiendo desde los Wj ’s y construir una aplicación
τ : {1, . . . , s} −→ {1, . . . , r}
j 7−→ τ (j), Wj = Vτ (i) .
Es fácil verificar que σ y τ son respectivamente una inversa de la otra y, por tanto, ambas son
biyecciones, r = s y las dos descomposiciones de (7.3.3) son la misma salvo permutación.
Proposición 7.3.18. Con las notaciones precedentes, dado Y ⊆ An (K) un cerrado Zariski
K−definible de An (K) y dado un espacio recubridor de Y por abiertos Zariski de An (K): A :=
{Ai : i ∈ I}, entonces, A posee un subcubrimiento finito de Y . Es decir, con la topologı́a
inducida por la topologı́a de Zariski de los cerrados K−definibles de An (K), todo cerrado es
quasi-compacto.
Demostración. Veamos primero que X satisface la propiedad. Ası́ pues supongamos que
tenemos un recubrimiento de X por abiertos Zariski en la topologı́a de los K−definibles:
[
X= Ai .
i∈I
Consideremos la familia de cerrados dados por los complementarios de los abiertos Ai , es decir,
E := {Fi := An (K) \ Ai : i ∈ I}.
Y definamos el conjunto de las intersecciones finitas de los elementos de E :
\
F := { Fj : J ⊆ I, J es finito}.
j∈J
Luego,
\ \ \ \ \
Fi = Fi Fj = Fj .
i∈I i∈I\J j∈J j∈J
o, equivalentemente,
[ [
An (K) = Ai = Aj ,
i∈I j∈J
7.3. RUDIMENTOS DE GEOMETRÍA ALGEBRAICA 361
con lo que tenemos un subcubrimiento finito del original. Ahora procedemos del modo habitual
con compactos: dado Y ⊆ An (K) un cerrado Zariski K−definible y un recubrimiento de Y por
abiertos Zariski K−definible en An (K):
[
Y ⊆ Ai ,
i∈I
n
tenemos un cubrimiento por abiertos de A (K) dado mediante:
!
[ [
n
X = (A (K) \ Y ) Ai .
i∈I
n
Aplicando que A (K) satisface la existencia de un subcubrimiento finito, concluimos que Y
posee también un subcubrimiento finito, concluyendo el enunciado.
El Teorema de Lasker-Noether (Teorema 6.3.23) y nuestro estudio del radical de un ideal (Sub-
sección 6.3.1) nos permite hacer alguna observación especial sobre los ideales asociados a var-
iedades K−racionales.
Proposición 7.3.19. Con las notaciones precedentes:
i) Si a ⊆ K[X1 , . . . , Xn ] es un ideal, entonces,
√
VAn (K) (a) = VAn (K) ( a).
ii) Los ideales de la forma IK (V ) ⊆ K[X1 , . . . , Xn ] son ideales radicales. Es decir,
p
IK (V ) = IK (V ).
iii) Existe una descomposición primaria irredundante de cada ideal IK (V ) dada por ideales
primos. Esto es, para cada V ⊆ An (K) existe una familia finita de ideales primos
{p1 , . . . , ps } ⊆ Spec(K[X1 , . . . , Xn ]) tales que pi 6= pj , para cada i 6= j, la siguiente
descomposición es irredudante:
(7.3.4) IAn (K) (V ) = p1 ∩ · · · ∩ ps .
De hecho, esta descomposicón es única, salvo permutación de los ideales primos in-
volucrados. Los primos asociados del anillos cociente por el ideal vienen dados por:
Ass(K[X1 , . . . , Xn ]/IK (V )) = {p1 , . . . , ps } ⊆ Spec(K[X1 , . . . , Xn ]).
iv) Los ideales de la forma IK (V ) no poseen primos inmersos y todos sus ideales primos
asociados son minimales. Es decir, no hay relación de inclusión entre los ideales de
la familia {p1 , . . . , ps }.
v) De hecho, si disponemos de una descomposición de V en componentes irreducibles
V = V1 ∪ · · · ∪ Vs ,
se tendrá que pi = IK (Vi ) ∈ Spec(K[X1 , . . . , Xn ]).
Demostración. La afirmación i) se sigue de la última afirmación de la Proposición 7.2.4.
Como K es cuerpo y no posee elementos nilpotentes no nulos, el lector puede fácilmente concluir
que los ideales de funciones que se anulan en cerrados en la topologı́a de Zariski son radicales.
El resto de las propiedades se siguen del hecho de ser un ideal radical y de los resultados
relativos al Teorema de Lasker-Noether visto en las subsecciones 6.3.1, ??, 6.3.4 y, en especial,
las Proposiciones ?? y ??.
Corolario 7.3.22. Con las notaciones de loa Proposición precedente, si V ⊆ An+m (K) es una
z
variedad algebraica K−definible e irreducible, entonces π(V ) es también irreducible.
Demostración. La prueba es inmediata por la proposición precedente y la Proposiciń
7.3.14, sabemos que IK (V ) es un ideal primo en K[X1 , . . . , Xn , Y1 , . . . , Ym ]. Por la Proposición
4.2.6, sabemos que la contracción de un ideal primo es también primo. Por tanto, IK (V )c es
z
un ideal primo en K[X1 , . . . , Xn ]. Por tanto, π(V ) es una variedad algebraica irreducible.
2Otras notaciones que se encuentran en la literatuyra son: KPn , Pn K, etc... Nosotros mantendremos la
propuesta Pn (K).
364 7. GEOMETRÍA ALGEBRAICA: TOPOLOGÍA DE ZARISKI
Nótese que si nos dan (x0 : · · · : xn ) ∈ Pn (K) con x0 6= 0 es inmediata comprobar que:
x1 xn
(x0 : · · · : xn ) = ϕ0 ( , . . . , ),
x0 x0
y es que la condición x0 6= 0 nos permite dar sentido a la anti-imagen del punto proyectivo a
partir de un punto afı́n. Como veremos después, la condición x0 6= 0 nos permitirá interpretar
ϕ0 (An (K)) como un abierto en ∓n (K) que algunos autores tienden a llamar los puntos a dis-
tancia finita, aunque esa idea de distancia finita sea un poco irreal en este contexto. En todo
caso, son puntos afines con respecto a la inmersión ϕ0 .
Obviamente, los puntos que no están en ϕ0 (An (K)) se caracterizan mediante las siguientes
igualdades:
(0)
H∞ := Pn (K) \ ϕ0 (An (K)) = {(x0 : · · · : xn ) ∈ Pn (K) : x0 = 0}.
En la presentación clásica de la geometrı́a afı́n, que el lector he recibido seguramente, los
puntos de An (K) se presentan mediante (1, x1 , . . . , xn ) mientras que las “direcciones” se suelen
representar mediante (0, v1 , . . . , vn ). Se hacı́a de tal modo que una recta afı́n, por ejemplo, se
representa mediante
r := {(1, x1 , . . . , xn ) + t(0, v1 , . . . , vn ) ∈ {1} × Kn : t ∈ K},
o también mediante
r := {1, x1 + tv1 , . . . , xn + tvn ) ∈ {1} × Kn : t ∈ K},
observando que la dirección (0, v1 , . . . , vn ) depende solamente del subespacio vectorial de di-
mensión 1, Kh(0, v1 , . . . , vn )i, generado por (0, v1 , . . . , vn ) ∈ {0} × Kn . Se distinguı́a entonces,
por razones de elegancia, entre el punto afı́n (1, x1 , . . . , xn ) y las direcciones (0, v1 , . . . , vn ). En
(0)
este sentido el hiperplano H∞ “recoge” todas las direcciones de rectas del espacio afı́n y, en un
sentido más estético que formal, las “pone en el infinito”. De ahı́ que ese espacio de direcciones
(0)
de rectas afines H∞ se llame hiperplano en el infinito.
En los casos K = R ∨ C, por ejemplo,la proyección canónica π : Kn+1 \ {0} −→ Pn (K) induce
una topologı́a cociente en Pn (K). La imagen del espacio afı́n ϕ0 (An (K)) será un abierto, es esos
(0)
casos, y el hiperplano en el infinito H∞ será un cerrado. Es sencillo verificar que, en ambos
casos, la imagen del espacio afı́n ϕ0 (An (K)) es denso para la topologı́a cociente en Pn (K) y,
en un cierto sentido en estos casos particulares, hay sucesiones (xm )m∈N de puntos afines (en
(0)
ϕ0 (An (K))) que tienden a las direcciones en H∞ cuando m 7→ ∞. En ese sentido, en los casos
K = R ∨ C, uno puede ver la asintótica y la convergencia “en el infinito” (o hacia puntos en el
infinito, que serı́a más correcto), como en el caso de las ası́ntotas que los alumnos recordraán
(0)
de sus cursos más elementales de Secundaria. En algún sentido es en H∞ donde viven las
ası́ntotas (verticales, horizontales u oblicuas), que se vuelven “alcanzables”.
Obviamente, la elección de la coordenada 0 en la definición de ϕ0 (en la Ecuación (7.4.1))
es una elección arbitraria. Igualmente podrı́amos haber elegido unicar el 1 en cualquier otra
coordenada distinta a la 0−ésima, dando lugar a las correspondentes inmersiones {ϕ0 , . . . , ϕn }.
Son inmersiones del espacio afı́n en el proyectivo Pn (K) que identifican An (K) con un “abierto”
para cada i, 0 ≤ i ≤ n:
ϕi (An (K)) = {(x0 : · · · : x0 ) ∈ Pn (K) : xi 6= 0}.
A su vez cada una de estas inmersiones define un hiperplano en el infinito
(i)
(7.4.2) H∞ := {(x0 : · · · : xn ) ∈ Pn (K) : xi = 0}.
Estas diversas inmersiones definen un cubrimiento de Pn (K) por una familia de n + 1 abiertos:
n
[
(7.4.3) Pn (K) = ϕi (An (K)) = ϕ0 (An (K)) ∪ · · · ∪ ϕ0 (An (K)),
i=0
que le confiere una instintiva naturaleza de vareidad topológica y deferenciable, término que
sólo tiene sentido natural cuando K = R ∨ C.
De todos modos, no era el propósito de estas primeras palabras el hacer una inmersión en
Geometrı́a Proyectiva sino, en todo caso, ilustrar el objeto antes de pasar a interpretar los
7.4. VARIEDADES PROYECTIVAS E IDEALES HOMOGÉNEOS 365
Obviamente, los conos proyectantes sobre subconjuntos de ¶n (K) son conos afines en Kn+1 .
En ciertos casos, tenemos una presentación del espacio que le confiere una estructura de variedad
diferenciable real o compleja. Que resultará variedad de Riemann en el caso K = R y variedad
de Kähler en el caso K = C.
• En el caso real, podemos identificar isométricamente (como variedades de Riemann)
Pn (R) con el cociente S n /S 0 , entendiendo por S 0 := {±1} la versión multiplicatica del
grupo abeliano Z/2Z y la relación “ser puntos antipodales”. En esta caso, un punto
proyectivo representa dos puntos sobre S n .
• En el caso complejo, identificamos Pn (C) con el coenciente S 2n+1 /S 1 , donde S 2n+1
es la esfera unidad en Cn+1 con la métrica hermı́tica canónica y S 1 es visto como el
grupo de los números complejos de valor absoluto 1, actuando sobre S 2n+1 . En este
caso un punto en Pn (C) representa un gran cı́rculo (una geodésica) en S 2n+1 .
En nuestro contexto, estamos especialmente interesados en aquellos subconjuntos de espacio
proyectivo Pn (K) que puedan ser dados implı́citamente por ecuaciones. En eso nos ayudan los
polinomios homogéneos.
Dado f ∈ K[X0 , . . . , Xn ] y consideremos la función polinomial que define:
f : An+1 (K) −→ K.
Observamos que esta función no siempre es “trasladable” al espacio proyectivo. La “traslación”
de la idea necesita alguna reflexión adicional. Pero, si suponemos que f ∈ Hd (X0 , . . . , Xn ) es
un polinomio homogéneo de grado d (cf. Proposición 1.4.40). Entonces, para todo λ ∈ K× y
para todo x ∈ An+1 (K) \ {0} observamos que se tiene la igualdad siguiente:
f (λx) = λd f (x).
Por tanto, dados dos puntos x e y que definen el mismo punto proyectivo π(x) = π(y) ∈ Pn (K)
tenemos claramente que para todo f ∈ Hd (X0 , . . . , Xn ) se tiene
f (x) = 0 ⇐⇒ f (y) = 0.
Esto nos permite definir la noción de hiper-superficie proyectiva del modo siguiente:
Con las mismas notaciones, llamaremos abierto algebraico proyectivo distinguido definido por
f ∈ Hd (X0 , . . . , Xn ) ⊆ K[X1 , . . . , Xn ] al conjunto dado mediante la siguiente igualdad:
OPn (K) (f ) := {(x0 : · · · : xn ) ∈ Pn (K) : f (x0 , . . . , xn ) 6= 0} = Pn (K) \ VPn (K) (f ).
Usualmente, y cuando el espacio Pn (K) esté fijado por el contexto, escribiremos simplemente
VP (f ) y OP (f ).
Observación 7.4.1. Simplemente obsérvese que, entre las hiper-superficies algebraicas proyec-
(i)
tivas, se encuentran los hiperplanos del infinito H∞ , con 0 ≤ i ≤ n definidos en la Ecuación
(7.4.2). Dado que son dados por ecuaciones lineales se suele decir hiper-superficie lineal o,
simplemente, hiperplano proyectivo.
Por su parte, las imágenes del espacio afı́n ϕi (An (K)) ⊆ Pn (K) por la diversas inmersiones
destacadas anterior mente, son abiertos distinguidos en Pn (K):
ϕi (An (K)) = OPn (K) (Xi ), ∀i, 0 ≤ i ≤ n.
La expresión “forma” viene del latı́n y ha sido el término clásico para designar a los polinomios
homogéneos. El término “forma cuadrática” hace referencia a un polinomio homogéneo de
grado 2 y, por tnto, como se puede fácilmente observar, q ∈ H2 (X0 , . . . , Xn ) es un polinomio
homogéneo de grado 2.
Por su parte, la hiper-superficie proyectiva definida por una forma cuadrática se suele denominar
“cuádrica proyectiva” y no es otra cosa que una variedad K−definible
VPn (K) (q), q ∈ H2 (X0 , . . . , Xn ).
Por razones de simplicidad (y por el Lema de Cancelación de Witt sobre cuerpos realmente cer-
rados) se suelen estudiar principalmente las cuádricas proyectivas reales, pero, en nuestro caso,
nos ocupamos de la variedad proyectiva sobre un cuerpo algebraicamente cerrado. Es sencillo
recordar que si la caracterı́stica del cuerpo es distinta de 2, salvo un cambio de coordenadas
definido por un polinomio P ∈ GL(n + 1, K), toda cuádrica es equivalente a una cuádrica de
la forma:
VPn (K) (q),
donde q tiene la forma:
X r
q(X0 , . . . , Xn ) = ai Xi2 ,
i=0
donde r ≤ n, ai ∈ K. En el caso K = K, la forma se puede refinar a una forma cuadrática q
del tipo
r
X
q(X0 , . . . , Xn ) = Xi2 ,
i=0
con r ≤ n.
Como en el caso afı́n no sólo tendremos hiper-superficies sino que tendremos toda una topologı́a
de Zariski en Pn (K), justificando el término “abierto distinguido” usado anteriormente. Pero
necesitaremos analizar un poco má el tipo de ideale que nos hacen funcionar en este caso.
Comencemos recordando la descomposición en suma directa del anillo de polinomios con coefi-
cientes en un cuerpo hecho en la Proposición 1.4.40:
(7.4.4) K[X0 , . . . , Xn ] = ⊕d∈N Hd (X0 , . . . , Xn ),
donde la suma directa descrita por el sı́mbolo ⊕ es suma directa como subespacios del K−espacio
vectorial K[X0 , . . . , Xn ]. Observemos que los subespacios Hd verifican la siguiente propiedad:
(7.4.5) Hd (X0 , . . . , Xn )Hk (X0 , . . . , Xn ) ⊆ Hd+k (X0 , . . . , Xn ),
7.4. VARIEDADES PROYECTIVAS E IDEALES HOMOGÉNEOS 367
Entonces, el ideal que generan estas componentes homogéneas también estarán con-
tenido en el ideal a. Es decir,
b := ({gi,j : 1 ≤ i ≤ r, 0 ≤ j ≤ di }) ⊆ a.
Pero, obviamente, cada uno de los gi ’s está en el ideal b porque cada gi es suma de
elementos de b. Es decir,
{g1 , . . . , gr } ⊆ b := ({gi,j : 1 ≤ i ≤ r, 0 ≤ j ≤ di }) ⊆ a.
Entonces, el ideal que generan los gi ’s también estará contenido en b y habremos
concluido:
a = (g1 , . . . , gr ) ⊆ b := ({gi,j : 1 ≤ i ≤ r, 0 ≤ j ≤ di }) ⊆ a.
Por tanto, a = b y a está generado por la familia finita siguiente que está formada
solamente por polinomios homogéneos:
{gi,j : 1 ≤ i ≤ r, 0 ≤ j ≤ di }.
Y tenemos probado i).
Observación 7.4.4. Como se observa, excluimos de entre los ideales homogéneos al ideal
K[X0 , . . . , Xn ] y nos restringimos solamente a ideales propios. No es un restricción significativa,
pero facilita la coherencia de lo que sigue.
Cnuando no haya confusión sobre el cuerpo K o la dimensión n del espacio proyectivo sobre el
que se trabaja, escribiremos simplemente VP (H).
Obsérvese que H(a), mencionado en la Definición 99, es una familia de polinomios homogéneos,
no necesariamente finita, que generan a como ideal. De hecho, se tiene que
!
\ [ [
H(a) = a Hd (X0 , . . . , Xn ) = ad ,
d∈N d∈N
y el apartado iii) de la citada Proposición implica que H(a) genera a como K−espacio vectorial
y, por ende, como ideal de K[X0 , . . . , Xn ].
370 7. GEOMETRÍA ALGEBRAICA: TOPOLOGÍA DE ZARISKI
En conclusión, tenemos una biyección entre los conos afines propios V ⊆ Kn+1 que son
variedades algebraicas K−definibles y las variedades algebraicas proyectivas K−definibles en
Pn (K).
Demostración. La afirmación i) es inmediata. Nótese que si a es homogéneo y es propio
(i.e. si a 6= K[X0 , . . . , Xn ]) está generado por una familia de polinomios homogéneos. Pero no
contiene a ningún polinmio homogéneo no nulo de grado 0 por ser ideal propio. Por tanto a está
generado por polinomios homogéneos de grado al menos 1. A su vez, los polinomios homogéneos
de grado al menos 1 son combinaciones lineales, con coeficientes en K, de monomios de grado
al menos 1. Y los monomios de grado al menos 1 son divisibles por alguna de las variables en
el conjunto {X0 , . . . , Xn } lo que conduce a la afirmación, para un ideal heomogéneo a:
a 6= K[X0 , . . . , Xn ] =⇒ a ⊆ (X0 , . . . , Xn ).
La afirmación sobre el vacı́o como variedad algebraica proyectiva es obvia.
Para la afirmación ii), es claro que si V = VPn (K) (a) y si x ∈ Ve \ {0} , entonces f (x) = 0 para
todo f ∈ a homogéneo. Pero como los ceros afines de un ideal coinciden con los ceros afines de
cualquiera de sus sistemas de generadores (cf. Proposición 7.2.3 Proposición 7.3.5), y a es un
ideal homogéneo, entonces entonces x ∈ VA (a). Además, como a es un ideal homogéneo y es
propio, a ⊆ (X0 , . . . , Xn ) y, por tanto, 0 ∈ VA (a). En suma, tenemos
Ve = π −1 (V ) ∪ {0} ⊆ VA (a).
En cuanto al recı́proco, si x ∈ VA (a) y x 6= 0, supongamos que las coordenadas afines de x
vienen dadas por x = (x0 , . . . , xn ) ∈ Kn+1 \ {0}. Sea π(x) = (x0 : · · · : xn ) ∈ Pn (K) el punto
proyectivo asociado. Como f (x0 , . . . , xn ) = 0 para cada f ∈ a, entonces f (x0 , . . . , xn ) = 0
para cualquier polinomio homogéneo en a por lo que (x0 : · · · : xn ) ∈ VPn (K) (a). Por tanto
x ∈ π −1 (V ). Como a es homogéneo propio, 0 ∈ VA (a) y habremos probado que
VA (a) ⊆ Ve = π −1 (V ) ∪ {0}.
Y tenemos la igualdad.
La afirmación iii) es la que requiere de un poco más de reflexión. Supongamos que V es un
cono afı́n propio con respecto a K (i.e. λx ∈ V, ∀λ ∈ K, ∀x ∈ V ) y sea IK (V ) el ideal asociado
en K[X0 , . . . , Xn ]. Sea f ∈ IK (V ). Consideremos la descomposición de f en sus componentes
homogéneas:
f = f0 + f1 + · · · + fd ,
donde fi es homogéneo de grado i y fd 6= 0. Consideremos ahora un punto x ∈ V cualquiera.
Por ser V un cono, tendremos también que λx ∈ V para cada λ ∈ K. Como f ∈ IK (V ) se tiene
que f (x) = 0, pero también f (λx) = 0. Pero observemos que
0 = f (λx) = f0 (x) + λf1 (x) + · · · + λd fd (x).
Es decir, si consideramos el polinomio en una variable:
F = fd (x)T d + fd−1 (x)T d−1 + · · · + f1 (x)T + f0 (x) ∈ K[T ],
tenemos que F es un polinomio que se anula en todos los puntos de K que es un cuerpo infinito.
Entonces F ≡ 0 es el polinomio idénticamente nulo o, equivalentemente, todos sus coeficientes
son nulos. Es decir, f0 (x) = 0, . . . , fd (x) = 0. Hemos probado que:
∀x ∈ V, ∀f ∈ IK (V ) =⇒ f0 (x) = f1 (x) = · · · = fd (x) = 0.
Dicho de otra manera, si f ∈ IK (V ), entonces sus componentes homogéneas f0 , . . . , fd ∈ IK (V )
y, por nuestra caracterización de los ideales homogéneos, el ideal IK (V ) es un ideal homogéneo.
es un ideal homogéneo.
ii) Si a y b son ideales homogéneos, también son homogéneos los ideales ab y a ∩ b son
homogéneos. Más generalmente, dada una familia cualquiera de ideales homogéneos
{ai : i ∈ I}, la intersección ∩i∈I ai también es un idael homogéneo.
√
iii) Si a es un ideal homogéneo, también es homogéneo su radical: a.
Demostración. Hagamos cada afirmación por su lado.
• Afirmación i): El ideal suma está generado por la unión de los ideales. Pero, a
su ves, cada ideal ai está generado por una familia Hi de polinomios homogéneos
(i.e. ai = (Hi ) para cada i ∈ I). Es un sencillo ejercicio probar que el ideal suma
está generado por la unión de conjuntos de generadores de los ideales que se están
sumando. Es decir,
! !
X [ [
ai = ai = Hi .
i∈I i∈I i∈I
Por tanto, el ideal suma está generado por un conjunto cualquiera de polinomios
homogéneos y será un ideal homogéneo.
• Afirmación ii): Para el caso del ideal a ∩ b, si f ∈ a ∩ b, por ser a y b homogéneos,
las componentes homogéneas de f están en tanto en a como en b y, por tanto, las
componente homogéneas de f están en a ∩ b y el ideal a ∩ b es homogéneo por la
afirmación iv) de la Proposición 7.4.3.
Para el ideal producto ab, nótese que si H es un sistema generador del ideal a y G es un
sistema generador del ideal b entonces, el siguiente conjunto es un sistema generador
del ideal ab:
HG := {f g : f ∈ a, g ∈ b}.
Si, por ser a y b homogéneos, suponemos que los polinomios en H y en G son todos
homogéneos, por la inclusión descrita en la Identidad (7.4.5), el producto de dos
polinomios homogéneos es un polinomio homogéneo. En suma, los elementos de HC
son todos polinomios homogéneos y como
ab = (HG) ,
el ideal producto ab será un ideal homogéneo.
Para el caso de una familia cualquiera de ideales homogéneos {ai : i ∈ I} la prueba
de que su intersección es un ideal homogéneo sigue as mismas pautas que el caso de
la intersección de 2. Lo dejamos como reflexión para el lector.
• Afirmación iii): Supongamos que a es un ideal propio (en el caso impropio no hay
nada que probar). Consideremos el siguiente conjunto:
√ √
A := {t ∈ N : ∃f ∈ a, f = f0 + · · · ft , ft 6= 0, fi ∈ Hi , ft 6∈ a}.
√
Es decir, A es el conjunto de los grados de polinomios en a cuya colponente ho-
mogénea de mayor grado no está en a. Supongamos, razonando por reducción √ al
absurdo, que A 6= ∅ y sea d := min(A ). Entonces, existe un polinomio f ∈ a tal
que deg(f ) = d y dada la descomposición de f en componentes homogéneas
f = f0 + · · · + fd ,
√
con fi ∈ Hi (X0 , . . . , Xn ), fd 6= 0. Ahora, como f ∈ a existe una potencia m ∈ N,
m ≥ 1, tal que f m ∈ a. Ahora bien, tenemos que
X d
Y
f m = (f0 + · · · + fd )m = aµ fiµi ,
|µ|=m i=0
7.4. VARIEDADES PROYECTIVAS E IDEALES HOMOGÉNEOS 373
(P)
En particular, existe una única topologı́a Tz en el espacio proyectivo Pn (K) cuyos cerrados
son las variedadees algebraicas proyectivas K−definibles. Es decir, los cerrados de Pn (K) son
la familia:
{VP (a) : a es un ideal homogéneo}.
Demostración. La prueba de las propiedades i) a v) es similar a la hecha para la
Proposición 7.2.4 poniendo cuidado en el hecho de que nuestros ideales son homogéneos (y,
por tanto, usando la homogeneidad de los generadores de los ideales implicados). La conclusión
sobre la topologı́a de Zariski es inmediata a partir de las propiedades i) a v).
Igual que en el caso del espacio afı́n, podemos definir la noción de ideal asociadoa a un subcon-
junto del espacio proyectivo.
Definición 100 (Ideal asociado a un subconjunto de Pn (K)). Sea F ⊆ Pn (K) un sub-
(P)
conjunto del espacio proyectivo. Definiremos el ideal asociado a F como el ideal IK (F ) ⊆
K[X0 , . . . , Xn ] generado por todos los polinomios hompogéneos f ∈ K[X0 , . . . , Xn ] que se anu-
lan en el cono proyectante Fe sobre F . Es decir,
(P)
IK (V ) := {f ∈ K[X0 , . . . , Xn ] : f es homogéneo y f Fe ≡ 0} .
(P)
Nótese que IK (F ) es un ideal homogéneo en K[X0 , . . . , Xn ] por estar generado por elementos
homogéneos. Más aún, obsérvese la diferencia con la definición de IK (F ) dado que hemos
consideramo el “ideal generado por” los polinomios homogéneos que se anulan en Fe ⊆ Kn+1 . A
(P)
posteriori, todos los polinomios de IK se anulan en todos los puntos afines del cono proyectante
Fe sobre F .
la razón es que los conos proyectantes sobre variedades algebraicas proyectivas K−definibles
son variedades algebraicas K−definibles afines. Pero debemos notar que la topologı́a de Zariski
en Kn+1 es estrictamente más fina (i.e. posee estrictamente más abiertos y cerrados) que la
(cones)
topologı́a Tz . Esta última es meramente instrumental y sirve solamente para intuir cómo
es la topoplogı́a de Zariski en Pn (K). Para estudiar más en profundidad la relación entre las
topologı́as de Zariski en espacios afines y proyctivos esperamos a desarrollos posteriores.
Dado que tenemos una topologı́a podemos hablar de cerrados irreducibles como en la Definición
92:
Definición 101 (Variedad algebraica proyectiva irreducible). Con las notaciones prece-
dentes, una variedad algebraica proyectiva K−definible V ⊆ Pn (K) se denomina reducible si
existen dos variedades algebraicas proyectivas K−definibles W1 , W2 ⊆ Pn (K) tales que
Wi ( V, i ∈ {1, 2},
y
V = W1 ∪ W2 .
Si V no es reducible, diremos que V es irreducible.
De nuevo, tenemos la conexión con los ideales primos, aunque, en este caso, debe ser homogéneo.
Proposición 7.4.13. Con las notaciones precedentes, V ⊆ Pn (K) una variedad algebraica
proyectiva K−definible, son equivalentes:
i) V es irreducible,
(P) (P)
ii) IK (V ) ∈ Spec(K[X0 , . . . , Xn ]), i.e. IK (V ) es un ideal primo y homogéneo.
Demostración. Esencialmente, es la prueba de la Proposición 7.2.20, poniendo cuidado
con los polinomios e ideales homogéneos y los puntos proyectivos.
(P)
Ası́, si el ideal IK ∈ Spec(K[X0 , . . . , Xn ]) es un ideal primo, y si tenemos una descomposición
V = W1 ∪ W2 en dos subvariedades algebraicas proyectivas, tenemos la misma relación entre
los conos proyectantes Ve = Wf1 ∪ W f1 ) ∩
f2 . Entonces, los ideales afines verifican IK (Ve ) = IK (W
IK (W2 ). Como en el caso afı́n, por la Proposición 4.2.12, se tiene que dar
f
IK (Ve ) ⊇ IK (W
f1 ) ∨ IK (Ve ) ⊇ IK (W
f2 ).
Todos ellos son ideales homogéneos y se tendrá, alternando las inclusiones
VP (IK (Ve )) ⊆ VP (IK (W
f1 )) ∨ VP (IK (Ve )) ⊆ VP (IK (W
f2 )).
(P) fi ) = I (P) (Wi ), para cada i ∈ {1, 2} y usando la
Pero sabemos que IK (Ve ) = IK (V ), IK (W K
Proposición 7.4.11, siendo V , W1 y W2 cerrados en Pn (K), concluimos
V = VP (IK (Ve )) ⊆ W1 = VP (IK (W
f1 )) ∨ V = VP (IK (Ve )) ⊆ W2 VP (IK (W
f2 )),
lo que nos permite concluir que V es irreducible.
Recı́procamente, supongamos que V es irreducible, escribamos, para simplificar la lectura,
(P)
i = IK (V ). Sea f ∈ K[X0 , . . . , Xn ] un polinomio tal que f 6∈ i. Supogamos que deg(f ) = d y
consideremos sus componentes homogéneas:
f = f0 + f1 + · · · + fd , fi ∈ Hi (X0 , . . . , Xn ), fd 6= 0.
Como i es homogéneo debe existir una componente homogénea de f que no está en ese ideal.
Es decir, existe t, con
P0 ≤ t ≤ d tal que ft 6∈ i y fj ∈ i para t + 1 ≤ j ≤ d. Consideremos el
d
polinomio f 0 := f − 0
j=t+1 fj . Obviamente f 6∈ i porque ft 6 i y el ideal i es homogéneo.
Consideremos los siguientes dos conjuntos siguiente conjunto:
F (f ) := {g ∈ K[X0 , . . . , Xn ] : gf ∈ i, g 6∈ i},
y
F (f 0 ) := {g ∈ K[X0 , . . . , Xn ] : gf 0 ∈ i, g 6∈ i}.
P
d
Observemos que F (f ) = F (f 0 ). Dado g ∈ F (f ), tenemos que g 6∈ i y, además, g j=t+1 fj ∈
P P
d d
i, porque j=t+1 fj ∈ i. Por tanto, gf 0 = gf − g j=t+1 fj ∈ i, luego g ∈ F (f 0 ). El
376 7. GEOMETRÍA ALGEBRAICA: TOPOLOGÍA DE ZARISKI
P
d
recı́proco es análogo: si g 6∈ i y gf 0 ∈ i, entonces f g = gf 0 + g j=t+1 fj ∈ i.
Para concluir nuestro argumento, veamos que F (f 0 ) = ∅.
Supongamos que F (f 0 1) no es vacı́o, entonces el siguiente conjunto posee mı́nimo:
F := {deg(g) : g ∈ F (f 0 )}.
Sea r = min(F ) el mı́nimo. De momento, no es posible que r = −1 porque si r = −1, entonces
0 ∈ F , pero 0 6∈ F dado que 0 ∈ p para cualquier ideal p primo. Por tanto, r ≥ 0. Sea g ∈ F
tal que deg(g) = r = min(F ). Escribamos las coordenadas homogéneas de g:
g = g0 + g1 + · · · + gr , gj ∈ Hj (X0 , . . . , Xn ), gr 6= 0.
Tenemos que g 6∈ i, pero tenemos también la expansión en componentes homogéneas de f 0 g:
t+r
X X
f 0g = fi gj .
k=0 i+j=k
gr ∈ i, entonces
f 0 g 0 = f g − f gr ∈ i.
Por tanto, g 0 ∈ F (f 0 ), lo que contradice la minimalidad de r = min(F ). Por tanto, la única
opción es que F (f ) = F (f 0 ) = ∅. Es decir, que si f g ∈ i y f 6∈ i, concluimos que g ∈ i y el
ideal i es primo.
Corolario 7.4.14. Con las notaciones y propiedades precedentes, los cerrados irreducibles para
la topologı́a de Zariski en Pn (K) están contenidos en el conjunto siguiente:
{VPn (K) (p) : p ∈ Spec(K[X0 , . . . , Xn ]), p homogéneo}.
La discusión de cuántos de los ideales primos homogéneos determinan una variedad algebraica
proyectiva queda para el estudio del Nullstellensatz proyectivo ulterior.
De nuevo, por estar en un contexto noetheriano (ver ı́tem iv) de la Proposición 7.4.3, tenemos
las buenas cualidades de la topologı́a de Zariski en Pn (K):
Corolario 7.4.15. Cada abierto en la topologı́a de Zariski de Pn (K) dada por los K−definibles
es unión finita de abiertos distinguidos de la forma
OP (f ) := OPn (K) (f ) := Pn (K) \ VP (f ) := {x ∈ Pn (K) : f (x) 6= 0},
donde f ∈ K[X0 , . . . , Xn ] es un polinomio homogéneo.
Y se presevran las concidiones de cadena:
Proposición 7.4.16. Con las notaciones de los Teoremas precedentes se tiene:
i) Condición de Cadena Numerable Descendente (para cerrados):Toda ca-
dena descendente de cerrados para la topologı́a de Zariski en Pn (K) definida por las
variedades algebraicas proyectivas se estabiliza.
ii) Asumiendo el Axioma de Elección Dependiente, todo conjunto no vacı́o de variedades
algebraicas proyectivas K−definibles posee elemento minimal para la inclusión.
Se dice que la topologı́a de Zariski en Pn (K) define un espacio topológico noetheriano por
satisfacer estas dos propiedades.
Demostración. La prueba sigue, esencialmente, los mismos argumentos que la demostración
de la Proposición 7.3.16.
7.4. VARIEDADES PROYECTIVAS E IDEALES HOMOGÉNEOS 377
Proposición 7.4.19. Con las notaciones precedentes, sea V ⊆ Pn (K) una variedad algebraica
proyectiva K−definible. Se tiene:
(P)
i) El ideal IK (V ) ⊆ K[X1 , . . . , Xn ] es un ideal radical.
(P)
ii) Existe una descomposición primaria irredundante de cada ideal IK (V ) dada por ide-
ales primos y homogéneos. Esto es, para cada V ⊆ An (K) existe una familia finita
de ideales primos {p1 , . . . , ps } ⊆ Spec(K[X0 , . . . , Xn ]), que son, además ideales ho-
mogéneos, tales que pi 6= pj , para cada i 6= j, y la siguiente descomposición es irredu-
dante:
(7.4.7) IPn (K) (V ) = p1 ∩ · · · ∩ ps .
De hecho, esta descomposicón es única, salvo permutación de los ideales primos in-
volucrados.
(P)
iii) Los ideales de la forma IK (V ) no poseen componentes inmersas y todos sus ideales
primos asociados son minimales.
iv) De hecho, si disponemos de una descomposición de V en componentes irreducibles en
Pn (K),
V = V1 ∪ · · · ∪ Vs ,
se tendrá que pi = IK (Vi ) ∈ Spec(K[X0 , . . . , Xn ]).
Demostración. La prueba es un punto más delicada que la prueba de la Prosición 7.4.19,
pero se sigue con esencialmente los mismos pasos.
Observación 7.4.20 (Los ideales de los puntos proyectivo). Dado un punto proyectivo
(P)
z = (z0 : · · · : zn ) ∈ Pn (K), el ideal asociado IK ({z}) es un ideal homogéneo. Consideremos la
recta afı́n r ⊆ Kn+1 determinada como el cono proyectante sobre el punto z: r = {z}. g Se trata,
n+1
obviamente, del subespacio generado por z en K , i.e.
r = Khzi = {z}.
g
378 7. GEOMETRÍA ALGEBRAICA: TOPOLOGÍA DE ZARISKI
Ahora, dado un punto z = (z0 : · · · : zn ) ∈ Pn (K) existe alguno de esos abiertos distinguidos en
el que se encuentra. Supongamos que z ∈ OP (Xi ) entonces se puede probar (y es un sencillo
ejercicio de verificación que
(P)
IK ({z}) = (zk Xi − zi Xk : k ∈ {0, . . . , n}, k 6= i}.
Y concluimos que los ideales asociados a puntos proyectivos están generados por n polinomios
homogéneos de grado 1. En particular, los puntos “afines” embebidos en el proyectos a través
de la usual homogeneización (i.e los puntos z = (z0 : · · · : zn ) ∈ ϕ0 (An (K))) tienen ideales
dados por:
(P)
IK ({(1 : z1 : · · · : zn )}) = (X1 − z1 X0 , . . . , Xn − zn X0 ) ,
que “recuerdan” al ideal mz := (X1 − z1 , . . . , Xn − zn ) homogeneizando los polinomios que le
generan. Volveremos sobre esta idea más adelante.
381
382 8. NULLSTELLENSATZ
Índice
8.1. Introducción. 382
8.1.1. Unas palabras sobre la Conjetura de Cook (P 6= NP). 384
8.2. Una demostración elemental del Nullstellensatz de Hilbert: Parte
I 386
8.2.1. La resultante y los tensores de multiplicación módulo un polinomio mónico:
especialización de la resultante 386
8.2.2. La prueba de la Parte I del Nullstellensazt de Hilbert-Kronecker 391
8.3. Un cambio de coordenadas útil 391
8.4. Tests de (no) nulidad para polinomios. 393
8.4.1. El Test de Schwartz-Zippel-DeMillo-Lipton. 395
8.4.2. Cuestores (Opcional, resumen de sólo lectura) 397
8.4.3. Witness Theorem. 397
8.4.4. Tests de (no) nulidad para números enteros dados por esquemas de
evaluación. 399
8.5. Una demostración elemental del Nullstellensatz de Hilbert: Parte
II 401
8.5.1. Nullstellensatz de Hilbert-Kronecker: Parte II 401
8.5.2. Nullstellensatz de Hilbert: Cuerpos finitos 402
8.5.2.1. Un recordatorio sobre Cuerpos Finitos. 403
8.5.3. Nullstellensatz: Identidad de Bézout 404
8.5.4. Nullstellensatz: Maximales 404
8.5.5. Nullstellensatz: Rabinowitsch y el radical de un ideal 406
8.5.6. Nullstellensatz e ideales primos. 408
8.5.7. Nullstellensatz y Geometrı́a Algebraica en Pn (K) 408
8.5.8. Nullstellensätze Efectivos y eliminación de un bloque de cuantificadores
existenciales (sólo enunciados). 410
8.6. Nullstellensatz y equivalencia natural: El lenguaje de las categorı́as 414
8.6.1. El lenguaje de las categorı́as. 414
8.6.2. Categorı́as 414
8.6.3. Functores y equivalencias naturales 416
8.6.4. La categorı́a de las variedades algebraicas afines y los morfimos regulares. 418
8.6.5. La Categorı́a de las K−álgebras reducidas finitamente generadas. 419
8.6.6. Nullstellensatz como Equivalencia Natural 421
8.7. Variaciones del Nullstellensatz en otros contextos (Cultura
General) 421
8.7.1. Variación de un primer tema clásico: El Teorema de Banach-Čech-Gel’fand-
Stone- 421
8.7.2. Variación de un segundo tema clásico: El Lema de Urysohn y el Teorema
de Extensión de Tietze. 422
8.7.3. Variación de un tercer tema clásico: Extensión de funciones en Variedades
Diferenciables 422
8.8. Ejericios y Problemas sobre el Nullstellensatz 423
8.8.1. La topologı́a de Zariski en el espectro de un anillo. 424
8.9. Meta-matemática: La Teorı́a de Primer Orden sobre los Complejos
admite Eliminación de Cuantificadores (Opcional, no se imparte
en esta forma). 426
8.9.1. Teorı́a de Primer Orden sobre cuerpos algebraicamente cerrados 426
8.1. Introducción.
El Nullstellensatz (o Teorema de los Ceros) es el punto de partida de la algebrización de la Geo-
metrı́a de los conjuntos definidos implı́citamente y, muy especialmente, de las conexiones entre el
Álgebra Conmutativa y la Geometrı́a Algebraica. El resultado tiene dos padres antagónicos en el
final del siglo XIX : D. Hilbert y L. Kronecker. El primero en observar un Nullstellensatz fue E.
Netto en 1885 (cf. [Netto, 1885]), quien probó una presentación del resultado, introduciendo
el radical, “ à la Rabinowitsch” ([Rainich, 1929]), aunque sólo para curvas. Este resultado
de Netto disparó la prueba posterior del Nullstellensatz general, que puede encontrarse en el
8.1. INTRODUCCIÓN. 383
trabajo de D. Hilbert (cf. el famoso [Hilbert, 1890]). Antes de ellos, en 1882, L. Kronecker
(cf [Kronecker, 1882]) demuestra un resultado similar, aunque en un contexto y con una
interpretación distintas que hacen más difı́cil identificarlo. Aquı́ nos conformaremos con dar
una demostración que minimiza los requisitos de Álgebra Conmutativa para poder seguirla.
La prueba que mostramos tiene dos bases sencillas de enunciar:
i) Que la resultante se especializa bien cuando uno de los polinomios involucrados es
mónico (cf. la Sección 3.6 y la Subsección 4.7.3).
ii) Que si K es un cuerpo con muchos elementos (por ejemplo, un cuerpo infinito) y si
f ∈ K[X1 , . . . , Xn ] es un polinomio no nulo, existe un cambio lineal de coordenadas
en el espacio ambiente que transforma nuestro polinomio en un polinomio mónico.
Para la propiedad ii) nos conformaremos con demostrar el Test de Schwartz-Zippel-DeMillo-
Lipton, aunque brevemente discutiremos otros métodos más sofisticados, y de mayor significado.
Haremos una sucinta revisión con la sola intención de ofrecer al lector la posibilidad de am-
pliar conocimientos sobre el tema. A ellos dedicaremos las secciones 8.3 y 8.4. Más adelante,
cuando dispongamos de las herramientas matemáticas requeridas, haremos una discusión más
promenorizada con pruebas. El lector puede también acudir a [Pardo, 95] para entender más
el contexto.
Uno de los problemas clásicos del uso de la resultante en la formulación de Sylvester (i.e. tal
y como se vió en la Sección 3.6) es que no es estable por especialización en el caso general.
De ahı́ que el tratamiento de la proyección de conjuntos dados como soluciones de polinomios
multivariados no se reduzca de modo inmediato al caso univariado y al uso de la matriz de
Sylvester (en palabras más técnicas, la proyección de un algebriaco no siempre es algebraico, ni
siquiera en el caso de “olvidar” sólo una coordenada). Pero la resultante sı́ se comporta bien bajo
especialización cuando uno de los polinomios involucrados es mónico. Este resultado es un mic-
mac pseudo-combinatorio, usando la noción original de Sylvester, pero es casi evidente desde C.
Jordan. El conocimiento de la forma canónica de Jordan no sólo es útil para entender ecuaciones
diferenciales homogéneas con coeficientes constantes (cf. Sección 5.4) sino que también permite
interpretar la resultante de modo muy conveniente cuando uno de los polinomios involucrados
es mónico:
ResX (f, g) := det (g(C(f ))) ∈ R,
donde f ∈ R[X] es un polinomio mónico, C(f ) es la compañera de f y f, g ∈ R[X]. Es la
presentación hecha en la Subsección 4.7.3. Por eso dedicamos un tiempo importante a recordar
esta forma de ver la resultante y a demostrar su estabilidad por especialización en la Subsección
8.2.1.
Armados con esas herramientas, una vez probado que la resultante está en la contracción
del ideal, observamos que está muy relacionada con la proyección de la intersección de hiper-
superficies (cf. Subsección 7.3.4.1). Con esto, el Nullstellensatz se vuelve inmediato: se trata de
un mero argumento inductivo que combina i), ii) y las propiedades de la resultante univariada.
Esta es la forma de la revisión en [Arr, 2006] y también la forma clásica del pensamiento
de L. Kronecker en [Kronecker, 1882], aunque no tanto la forma original de D. Hilbert. De
hecho, nuestra aproximación simplemente usa implı́citamente la Normalización de Noether (cf.
[Noether, 1926]) y las extensiones enteras de anillos sin explictar ninguna de las nociones.
Una vez probado el Nullstellensatz nos queda la tarea de dar versiones equivalentes del mismo
cuando K es un cuerpo algebraicamente cerrado: la identificación entre el espectro maximal
de K[X1 , . . . , Xn ] y los puntos del espacio afı́n An (K) (en Subsección 8.5.4), la identificación
entre ideales radicales y conjuntos algebraicos afines (el famoso “truco” de Rabonowitsch en la
Subsección 8.5.5), la identificación completa entre variedades algebraicas irreducibles e ideales
primos en K[X1 , . . . , Xn ] o la equivalencia natural entre las K−álgebras reducidas finitamente
generadas (i.e. sin elementos nilpotentes) y la categorı́a de conjuntos algebraicos y morfismos
regulares (cf. Sección 8.6).
La Sección 8.9 está dedicada a resumir cómo el Nullstellensatz se relaciona con la eliminación
de bloques de cuantificadores existenciales (∃) y tiene un estilo más cultural que preciso. En
el mismo tono cultural se escribe la Sección 8.7, donde se muestra, muy sucintamente, cómo
el Nullstellensatz influye el estudio de otros anillos. Destacamos el Teorema de Banach-Stone-
Čech-Gel’fand-Kolmogorov (cf. Teorema 8.7.1) que afirma que si C (X) es el anillo de funciones
384 8. NULLSTELLENSATZ
• 1 ∈ (f, g),
• ResX (f, g) ∈ R× .
Demostración. La mayorı́a de las propiedades descritas estaban ya probadas en las las
Proposiciones 4.7.2 y 4.7.3. Si acaso, un pequeño inciso sobre la equivalencia entre:
• 1 ∈ (f, g),
• ResX (f, g) ∈ R× .
Es claro que si ResX (f, g) ∈ R× , entonces 1 ∈ (f, g)c ⊆ (f, g) con lo que tenemos una de las
implicaciones. En cuanto a la otra implicación, supongamos que 1 ∈ (f, g) en R[X]. Entonces,
existirán polinomios h1 , h2 ∈ R[X] tales que
1 = h1 f + h1 .g.
Por las propiedades de las homotecias, tenemos que
Id = η1 = ηh1 ◦ ηf + ηh2 ◦ ηg = ηh1 ◦ 0 + ηh2 ◦ ηg = ηh2 ◦ ηg ,
A
por lo que concluimos que ηg−1 existe y coincide con ηh2 . Por tanto, ηg es un isomorfismo de
R−módulos libres y ResX (f, g) = det(g(C(f ))) ∈ R× .
(R/p)[X]/(f ) ∼
= R/p ⊗R R[X]/(f ),
donde ya destacamos la presencia de la extensión de escalares, aunque aún no hallamos
hablado de ello. No es inapropiado empezar a encontrar el producto tensorial ⊗R ,
aunque sólo sea como notación en un caso muy particular.
En ambos casos tenemos las matrices compañeras:
−u−1 a0
0 0 0 ···
−u−1 a1
1 0 0 ··· α1,1 α1,2 ··· α1,d
−u−1 a2
0 1 0 ··· α2,1 α2,2 ··· α2,d
C(f ) = 0 0 1 −u−1 a3 := . .. ∈ Md (R),
··· .. ..
.. . . .
.. .. . . .. ..
. . . . . αd,1 αd,2 ··· αd,d
0 0 0 · · · −u−1 ad−1
8.2. NULLSTELLENSATZ: PARTE I 389
y
−u−1 a0 + p
0 0 0 ···
1 + p 0 0 ··· −u−1 a1 + p
−u−1 a2 + p
0 1 + p 0 ···
C(f ) = 0 −u−1 a3 + p ∈ Md (R/p),
0 1+p ···
.. .. .. .. ..
. . . . .
−1
0 0 0 ··· −u ad−1 + p
luego
α1,1 + p α1,2 + p ··· α1,d + p
α2,1 + p α2,2 + p ··· α2,d + p
C(f ) = ∈ Md (R/p).
.. .. .. ..
. . . .
αd,1 + p αd,2 + p · · · αd,d + p
Ahora, consideremos
i
α1,1 α1,2 ··· α1,d γ1,1 γ1,2 ··· γ1,d
m
X α2,1 α2,2 ··· α2,d γ2,1 γ2,2 ··· γ2,d
g(C(f )) := bi . .. = .. .. ∈ Md (R),
.. .. .. ..
i=
.. . . . . . . .
αd,1 αd,2 ··· αd,d γd,1 γd,2 ··· γd,d
i
α1,1 + p α1,2 + p ··· α1,d + p
m
X α2,1 + p α2,2 + p ··· α2,d + p
g(C(f )) := (bi + p) ∈ Md (R/p),
.. .. .. ..
i=0
. . . .
αd,1 + p αd,2 + p ··· αd,d + p
Denotemos
δ1,1 δ1,2 ··· δ1,d
δ2,1 δ2,2 ··· δ2,d
g(C(f )) = . .. ∈ Md (R/p),
.. ..
.. . . .
δd,1 δd,2 ··· δd,d
donde δi,j ∈ R/p se obtiene mediante funciones polinomiales en las coordenadas αk,` + p de
C(f ) y los coeficientes de g. Como las operaciones del anillo cociente se definen a partir de
las operaciones de cualesquiera de los representantes de la clase módulo p, podemos fácilmente
concluir que:
∀ i, j, 1 ≤ i, j ≤ d, γi,j + p = δi,j .
Seguidamente, las respectivas resultantes son determinantes, por cuanto concluimos:
γ1,1 γ1,2 · · · γ1,d
γ2,1 γ2,2 · · · γ2,d
ResX (f, g) + p := det . .. + p ∈ R/p,
. .. . .
. . . .
γd,1 γd,2 ··· γd,d
Lo cual es equivalente a:
γ1,1 + p γ1,2 + p ··· γ1,d + p
γ2,1 + p γ2,2 + p ··· γ2,d + p
ResX (f, g) + p = det ∈ R/p.
.. .. .. ..
. . . .
γd,1 + p γd,2 + p ··· γd,d + p
390 8. NULLSTELLENSATZ
Luego
δ1,1 δ1,2 ··· δ1,d
δ2,1 δ2,2 ··· δ2,d
ResX (f, g) + p = det . .. = ResX (f , g) ∈ R/p,
.. ..
.. . . .
δd,1 δd,2 ··· δd,d
como se afirma en el enunciado.
En particular, bajo estas hipótesis, π(VAn (K) (f, g)) ⊆ An−1 (K) es una variedad algebraica
K−definible.
donde d := deg(fx ) = degXn (f ) y los ceros ζi aparecen repetidos con su multiplicidad. Ahora,
por la capacidad de especialización de la resultante en K[X1 , . . . , Xn−1 ][Xn ], cuando uno de los
polinomios es mónico, tendremos que:
Pero, además, hemos visto en la Proposición 5.4.6 que, gracias al pensamiento de C. Jordan, la
resultante, en el caso de que uno de los polinomios sea mónico, consiste en evaluar el segundo
polinomio en los ceros de primero repetidos con su multiplicidad. Es decir,
d
Y d
Y
ResXn (fx , gx ) = gx (ζi ) = g(x, ζi ).
i=1 i=1
Por lo anterior, como ResXn (f, g)(x) = 0 concluimos que ha de existir i, 1 ≤ i ≤ d tal que
g(x, ζi ) = 0. Pero eso significa que el punto (x, ζi ) ∈ An (K) verifica
f (x, ζi ) = g(x, ζi ) = 0.
En otras palabras, (x, ζi ) ∈ VA (f, g) y, en particular, x = π(x, ζi ) ∈ π(VA (f, g)), lo que concluye
la prueba del otro contenido y del enunciado.
Observación 8.2.5. El anterior resultado, en realidad, prueba el poder de tener las variables
en posición de Noether o, dicho de otro modo, estar ante una extensión entera de anillos. Pero
ese asunto lo trataremos en detalle más adelante.
392 8. NULLSTELLENSATZ
De nuevo, jugando con las proyecciones, observamos que la propiedad de tener un elemento
a ∩ K[X1 , . . . , Xn−1 ][Xn ]mon facilita determinar las proyecciones (al menos en una variable) de
los ceros afines de a:
Lema 8.2.7 (cf. [Arr, 2006]). Sea K un cuerpo, sea K su clausura algebraica. Sea n ∈ N un
entero con n > 1. Sea a ⊆ K[X1 , . . . , Xn ] un ideal propio y sea ac = a ∩ K[X1 , . . . , Xn−1 ] su
contracción. Supongamos que existe f ∈ a un polinomio mónico con respecto a la variable Xn .
Sea π : An (K) −→ An−1 (K) la proyección que “olvida” la coordenada n−ésima. Entonces, se
tiene:
i) π(VAn (K) (a)) = VAn−1 (K) (ac ),
ii) VAn (K) (a) 6= ∅ si y solamente si VAn−1 (K) (ac ) 6= ∅.
Demostración. Supongamos K = K es algebraicamente cerrado y probemos la afirmación
i). Notemos que si a es un ideal propio en K[X1 , . . . , Xn ], también su contracción ac es propio
porque no puede darse 1 ∈ ac . De nuevos escribiremos de forma simplificada VA , dejando al
lector interpretar si se trata de An (K), An−1 (K) o A( K).
z
Por la Proposición 7.3.21, sabemos que VA (ac ) = π(VA (a)) ⊃ π(VA (a).
Recı́procamente, supongamos que x ∈ VA (ac ). Ahora consideremos el siguiente conjunto de
polinomios univariados:
ax := {g(x, Xn ) : g ∈ a}.
Es obvio que ax es un ideal en K[Xn ]. Por tanto, es un ideal principal y posee un generador
hx (Xn ) := h(x, Xn ) donde h ∈ a. También tendremos un polinomio f ∈ a que es mónico con
respecto a la variable Xn . Consideremos ahora la resultante:
ResXn (f, h) ∈ ac ⊆ K[X1 , . . . , Xn−1 ].
Tenemos que ResXn (f, g)(x) = 0 y, por los mismos argumentos que en el Corolario 8.2.4 prece-
dente, existirá ζ ∈ K tal que
f (x, ζ) = 0, h(x, ζ) = 0.
Ahora sea g ∈ a tenemos que hx | gx (con las notaciones precedentes) porque gx ∈ ax . Por
tanto, gx se ha de anular en todas las raı́ces de hx , pero como hx (ζ) = 0, concluimos que
gx (ζ) = g(x, ζ) = 0 para todo g ∈ a. Por tanto, (x, ζ) ∈ VA (a) y x = π(x, ζ) ∈ π(VA (a)).
Nótese que, en los argumentos precedentes, el papel del cuerpo de coeficientes es nulo: lo único
que usamos es la existencia de raı́ces en la clausura algebraica del cuerpo de coeficientes, luego el
argumento sigue siendo válido para un ideal a en K[X1 , . . . , Xn ] siempre que VA (a) = VAn (K) (a),
VA (ac ) = VAn−1 (K) (ac ) y la proyección sea entre los respectivos espacios afines de dimensiones
n y n − 1 sobre K.
La propiedad ii) se sigue obviamente de la propiedad i) dado que un subconjunto X ⊆ An (K)
es no vacı́o si y solamente si su proyección π(X) es no vacı́a.
n (i)
donde µ = (µ1 , . . . , µn ) ∈ N , |µ| = µ1 + · · · + µn ∈ N, aµ ∈ K. Supongamos que deg(f ) = d
y, por tanto, que fd 6= 0.
Sea ϕ : K[X1 , . . . , Xn ] −→ K[Y1 , . . . , Yn ] el isomorfismo de K−álgebras descrito en la Sección
precedente. Por ser ϕ, de hecho, una aplicación lineal entre K−espacios vectoriales, ϕ respe-
ta las componentes homogéneas de los polinomios y tendremos que si g = ϕ(f ) admite una
descomposición en componentes homogéneas del tipo:
g := gd (X1 , . . . , Xn ) + · · · + g0 (X1 , . . . , Xn ),
donde gi = ϕ(fi ). En otras palabras, tenemos que
gi (Y1 , . . . , Yn ) = fi (Y1 + t1 Yn , . . . , Yn−1 + tn−1 Yn , Yn ), ∀i, 0 ≤ i ≤ d.
En particular, tendremos la siguiente igualdad:
X
gi (Y1 , . . . , Yn ) := a(i)
µ (Y1 + t1 Yn )
µ1
· · · (Yn−1 + tn−1 Yn )µn−1 Ynµn .
|µ|=d
∀f ∈ C, f (x1 ) = · · · = f (xM ) = 0 =⇒ f ≡ 0.
Luego
n n n
! n n n
!
Y Y X di d1 Y d1 Y X di
P := ](Ii ) − ](Ii ) − ](Ii ) + ](Ii ) .
i=1 i=1 i=2
](I i) ](I1 ) i=1 ](I1 ) i=1 i=2
](I i)
Por tanto,
8.4. TESTS DE (NO) NULIDAD PARA POLINOMIOS. 397
n n
! n n n
!
Y X di d1 Y Y X di
P ≥ ](Ii ) 1 − − ](Ii ) = ](Ii ) 1 − ,
i=1 i=2
](Ii ) ](I1 ) i=1 i=1 i=1
](Ii )
y se sigue el enunciado previsto.
Tenemos la siguiente aplicación inmediata:
Corolario 8.4.2. Con las notaciones previas, sea I un subconjunto finito de K and F ∈
K[X1 , . . . , Xn ] un polinomio de grado d. La probabilidad de que una elección aletaoria de un
punto x ∈ I n sea un cero de F es, a lo sumo :
d
](I)
En particular, si ](I) ≥ 2d + 1,la probabilidad de que una elección aletoria en I n de un valor
no nulo de F es, al menos, 1/2.
Demostración. Basta con usar el Lema precedente con I = I1 = · · · = In .
Esto genera el siguiente algoritmo probabilista polinomial (RP o MonteCarlo) para detectar
polinomios no nulos.
Nótese que, aunque muy lejanamente, esto nos acerca a la pregunta de saber cuántos puntos
K−racionales hay en una hipersuperficie VA (f ) y, en general, en una variedad VA (a).
8.4.4. Tests de (no) nulidad para números enteros dados por esquemas de eva-
luación. Del mismo modo que los esquemas de evaluación pueden ser la buena estructura de
datos para codificar polinomios que aparecen en Teorı́a de la Elminación, la misma estructura
de datos se aplica a la representación de números enteros y racionales que aparecen como
resultados de eliminación. Del mismo modo que ocurre con los polinomios, los esquemas de
evaluación de números son muy adecuados para realizar operaciones aritméticas entre números
codificados mediante esquemas. Sin embargo, los Tests de Igualdad (o Tests de Nulidad) son
problemáticos. En este sentido, la operación correspondiente a la evaluación de un polinomio
es la operación de evaluar un esquema de evaluación módulo una constante dada. La buena
capacidad de adaptación de los esquemas de evaluación para estas propiedades hace que los
Tests de Nulidad para esquemas de evaluación representando números pasen por los cálculos
modulares.
Los algoritmos esenciales en esta Sección vienen de los trabajos de O.H. Ibarra, S. Moran
([IM, 1983]) y del trabajo de A. Schönhage (cf. [Schö, 1979]).
Comencemos recordando el Teorema de (Densidad) de los Números primos (visto en el párrafo
5.3.2.1 precedente). Como en aquel párrafo, definamos la función π : N −→ N dada por
π(n) := ]({p ∈ N : 2 ≤ p ≤ n, p es un número primo},
es decir el cardinal de los números primos no nulos menores que n.
Recordemos el Teorema (de Densidad) de los Números Primos (cf. Teorema ??) y la estimación
de [Rosser, 1941] allı́ descrita:
Teorema 8.4.10 ([Rosser, 1941]). Con las anteriores notaciones, para n ≥ 55,
n n
≤ π(n) ≤ ,
ln(n) + 2 ln(n) − 4
donde ln se refiere al logaritmo neperiano.
Podemos dar una versión más probabilı́stica del mismo resultado. Para ello, consideremos
el conjunto A (22n ) := {2, . . . , 22n }. Consideremos la distribución uniforme sobre A (22n ) y
escribamos
](A) ](A)
Probunif [A] := = 2n ,
](A (22n )) 2 −1
8.4. TESTS DE (NO) NULIDAD PARA POLINOMIOS. 401
22n
](A2 (N )) ](A2 (N )) 2n+2 − 2n2n 1 2n 1
Probunif [A2 (N )] = 2n ≥ ≥ = − ≥ ,
2 −1 22n 22n 2n + 2 2n 4n
para n ≥ 12, por ejemplo. Por tanto,
1
Probunif [A1 (N )] ≥ Probunif [A2 (N )] ≥
,
4n
y, por tanto, tomando d = 55, concluimos que para n ≥ d se tiene:
1
Probunif [m ∈ A (22n ) : N = 0 mod m] = 1 − Probunif [A1 (N )] ≤ 1 − .
4n
Consideremos ahora el mismo conjunto A (22n ) y hagamos su producto cartesiano 4kn veces
con k ∈ N. es decir,
A (22n )4kn := {(m1 , . . . , m2kn ) ∈ N4kn : mi ∈ A (22n )}.
Consideremos en esta conjunto la distribución uniforme que, en este caso, es la misma que la
distribución producto. entonces, tenemos:
Teorema 8.4.13 ([IM, 1983]). Sea k ∈ N un entero positivo. Sea N un número natural no
nulo tal que
n
|N | ≤ 22n2 .
Existe una constante universal f > 0, f ∈ R, tal que para n ≥ f , la probabilidad de que una
lista aleatoriamente elegido (m1 , . . . , m4kn ) ∈ A (22n )4kn satisfaga:
N =0 mod mi , ∀i, 1 ≤ i ≤ 4kn,
está acotada por e−k , donde e es el número de Neper. Es decir,
1 1
Probunif [(m1 , . . . , m4kn ) ∈ A (22n )4kn : N = 0 mod mi , ∀i, 1 ≤ i ≤ 4kn] ≤ < k.
ek 2
402 8. NULLSTELLENSATZ
Para concluir el test de Ibarra-Moran, considérese N ∈ Z un número entero que se evalúa me-
diante un programa que usa sólo operaciones en {+, −, ×} y constante en {−1, 0, +1}. Supong-
amos que L es el número total de operaciones realizables por el programa (también llamada
talla del esquema de evaluación). Entonces,
L
0 ≤ |N | ≤ 22 .
Tiene sentido, entonces, diseñar el siguiente programa probabilista para detectar si N 6= 0:
Los coeficientes de f0 son los mismos coeficientes de f , aunque los términos difieren ahora por
ser términos en las variables {X1 , . . . , Xn }. Por tanto, si existe µ tal que aµ 6= 0 tendremos que
f 6= 0 si y solamente si f0 6= 0.
Teorema 8.5.2 (Hilbert-Kronecker’s Nullstellensatz). Sea K un cuerpo infinito, K su
clausura algebraica y a un ideal en un anillo K[X1 , . . . , Xn ]. Entonces, la variedad algebraica
V = VA (a) ⊆ An (K) verifica:
VA (a) = ∅ ⇐⇒ 1 ∈ a.
Demostración. Hay una implicación obvia: si 1 ∈ a, es decir a = K[X1 , . . . , Xn ], es obvio
que VA (a) = ∅.
Para la otra implicación haremos inducción en n, usando el Corolario 8.4.4 anterior. El caso
n = 1 es obvio.
Supongamos que el resultado es cierto para todo ideal propio en todo ideal de un anillo de
polinomios involucrando a los sumo n−1 variables (esto es, en todo anillo del tipo K[Y1 , . . . , Yr ],
con r ≤ n − 1).
Por hipótesis, a es un ideal propio en K[X1 , . . . , Xn ]. Como K es infinito, podemos encontrar
un elemento f ∈ a de grado d no nulo y un subconjunto I de K de cardinal 2d + 1. Siguiendo
la descomposición descrita en la Observación 8.3.2, sea fd (X1 , . . . , Xn ) su parte homogénea de
grado d y no nula. tendremos que fd (X1 , . . . , Xn−1 , 1) 6= 0. Por tanto, existe (t1 , . . . , tn−1 ) ∈
I n−1 , tal que
fd (t1 , . . . , tn−1 , 1) 6= 0.
Consideremos ahora el isomorfismo descrito en la Sección 8.3 (es decir, el isomorfismo de
K−álgebras dado la Ecuación (8.3.2)):
ϕ : K[X1 , . . . , Xn ] −→ K[Y1 , . . . , Yn ]
(8.5.1)
f 7−→ f (Y1 + t1 Yn , . . . , Yn−1 + tn−1 Yn , Yn ).
Entonces, por el apartado i) del Lema 8.3.1, como a es un ideal propio, también lo es el ideal
b := ϕ(a). Pero g := ϕ(f ) es, tras este cambio de variables un polinomio mónico con respecto
a la variable Yn y no nulo en b. Consideremos su contracción:
bc := b ∩ K[Y1 , . . . , Yn−1 ].
Como b es propio, también lo es bc . Por hipótesis inductiva VAn−1 (K) (bc ) 6= ∅. Por el Lema
8.2.7 VAn−1 (bc ) = π(VAn (b). Luego si VAn−1 (K) (bc ) 6= ∅, entonces VA (b) 6= ∅.
Finalemente, usando el apartado iii) del Lema 8.3.1, tendremos que VA (a) 6= ∅ es no vacı́o.
8.5.2. Nullstellensatz de Hilbert: Cuerpos finitos.
Teorema 8.5.3 (Hilbert’s Nullstellensatz: cuerpos finitos). Sea a un ideal en un anillo
K[X1 , . . . , Xn ], siendo K un cuerpo finito. Supongamos que a posee un elemento no nulo y no
unidad de grado d ≥ 1. Supongamos que el cardinal de K verifica: ](K) ≥ 2d + 1. Entonces, la
variedad algebraica V = VK (a) ⊆ An (K) verifica:
V = ∅ ⇐⇒ 1 ∈ a.
Demostración. El resultado se sigue de una demostración idéntica a la anterior. Nótese
que el punto crı́tico es que el número de elementos del cuerpo sea suficientemente grande.
Observación 8.5.4. En las utilizaciones algorı́tmicas del Nullstellensatz sobre cuerpos finitos,
si el cuerpo inicial K sobre el que se trabaja no tiene suficientemente elementos se suelen usar
extensiones finitas de K que tienen un cardinal suficientemente grande con respecto a los grados
de los polinomios involucrados. Una forma de entender estas construcciones son las siguientes.
404 8. NULLSTELLENSATZ
8.5.2.1. Un recordatorio sobre Cuerpos Finitos. Unas palabras para recordar los
cuerpos finitos y cómo podemos extenderlos.
Teorema 8.5.5. Todo cuerpo finito F de cardinal pm y caracterı́stica p es el menor cuerpo que
contiene a Z/pZ y a todas las raı́ces de la ecuación
m
X p − X = 0.
De hecho, los elementos de F son justamente las raı́ces de esa ecuación.
Definición 104. Sea F un cuerpo finito de cardinal q = pm y sea n un número entero coprimo
con q. Llamaremos raı́z primitiva n−ésima de la unidad a todo elemento θ de F tal que las
siguientes sean las n raı́ces distintas de la unidad :
{1, θ, θ2 , . . . , θn−1 }.
En el caso en que n es coprimo con q las raı́ces n−ésimas primitivas de la unidad sobre F tienen
un comportamiento próximo al caso de caracterı́stica 0; aunque con matices y diferencias que
es necesario destacar.
Definición 105. Sea F un cuerpo finito de cardinal q = pm y sea n un número natural no
nulo coprimo con q. La siguiente función racional es un polinomio en F [X] llamado polinomio
ciclotómico de grado n :
Y µ(d)
fn (X) := X n/d − 1 ,
d|n
donde µ es la función de Möbius. La función de Möbius fue introducida como el discriminante
en Teorı́a de Números. Viene definida del modo siguiente : Sea n ∈ N un número natural.
Definimos µ(n), mediante :
0 si n posee algún factor irreducible múltiple
µ(n) := (−1)r si n = p1 · · · pr con pi primo, gcd(pi , pj ) = 1
1 si n = 1
En suma, µ(n) = 0 si y solamente si posee factores irreducibles múltiples. Esto permite iden-
tificar las propiedades de la función de Möbius con las propiedades del discriminante de un
polinomio. Sin embargo, la función de Möbius no se sabe calcular sin conocer la factorización
(lo que hace de ella una función difı́cil de evaluar) y tiene propiedades muy significativas como
la famosa “Fórmula de Inversión de Möbius” (véase el texto de G. H. Hardy and E. M. Wright
[Hardy-Wright, 1938] para más información).
Obsérvese que el cálculo de polinomio √ ciclotómico fn puede hacerse fácilmente√a partir de la
factorización de n (en tiempo O( nlog22 n)) y de todos sus divisores (tiempo O( nlog22 n)).
Una raı́z n−ésima de la unidad sobre F es un elemento θ tal que θn = 1 y las potencias
{1, θ, θ2 , . . . , θn−1 } son todas las raı́ces n−ésimas de la unidad sobre F y son todos distintos.
Para calcularlas y poder trabajar con ellas, es necesario hacer uso del siguiente :
Lema 8.5.6. Sea F un cuerpo finito de cardinal q = pm y sea n un número natural no nulo
coprimo con q. Sea (Z/nZ)× el grupo multiplicativo de las clases de restos módulo n. Sea r
el orden de q como elemento de (Z/nZ)× . Entonces, el polinomio ciclotómico fn factoriza en
F [X] como un producto de ϕ(n)r polinomios irreducibles de grado r cada uno de ellos, siendo ϕ
la función de Euler (cf. Subsección de Problemas 3.6.5.3).
La función de Euler : Se define mediante φ(1) = 1 y para n ≥ 2 del modo siguiente :
ϕ(m) := ]{a ∈ N : 1 ≤ a ≤ m − 1, mcd(a, m) = 1}.
Se trata de probar que φ(m) coincide con el número de elementos del grupo de las unidades
en (Z/mZ)× . En particular, Z/mZ es un cuerpo si y solamente si ϕ(m) = m − 1. Otras
propiedades de la función de Euler :
i) La función de Euler es multiplicativa, esto es, si mcd(p, q) = 1, entonces ϕ(pq) =
ϕ(q)ϕ(q).
ii) Se tiene :
X
ϕ(m) = n
m|n
8.5. NULLSTELLENSATZ, PARTE II 405
Las raı́ces primitivas n−ésimas de la unidad sobre F son las raı́ces de uno de esos factores.
Para detectar las raı́ces primitivas de la unidad, factoricemos fn usando uno cualquiera de
los algoritmos de factorización de polinomios univariados sobre cuerpos finitos. Por ejemplo, el
método descrito por E. Berlekamp (cf. también la serie de Problemas descritos en la Subsección
3.6.5.2) y que puede resumirse en el siguiente enunciado:
Teorema 8.5.7 ([Be, 1970]). Sea p ∈ N un número primo. Sea Fp el cuerpo primo de p
elementos. Entonces, existe una máquina de Turing M determinista tal que realiza la siguiente
tarea :
dado f ∈ Fp [T ] un polinomio mónico, sin factores múltiples y de grado d, M calcula los factores
irreducibles de f en Fp [T ]. El tiempo de cálculo de tal máquina de Turing es polinomial en p y
d, i.e.
pO(1) dO(1)
A partir de esa factorización, sea gn uno de esos factores y definamos el cuerpo
F 0 := F (θ) = F [Y ]/(gn (Y )).
Se tiene :
Lema 8.5.8. La clase de Y módulo gn (esto es, θ ∈ F 0 ) es una raı́z primitiva n−ésima de la
unidad sobre F .
Con ello tenemos una descripción de cualquier cuerpo.
K[X1 , . . . , Xn ]/mζ ∼
= K(x1 , . . . , xn ).
mζ := (X1 − z1 , . . . , Xn − zn ).
m : An (K) −→ MaxSpec(K[X1 , . . . , Xn ])
(8.5.2)
ζ 7−→ mζ
1 6∈ a, =⇒ ∃ζ ∈ An (K), f (ζ) = 0, ∀f ∈ a.
Dicho de otra manera, para cada ideal a de K[X1 , . . . , Xn ] y cada cerrado K−definible V en
An (K) se verifica √
IK (VA (a)) = a, VA (IK (V )) = V.
Demostración. Sólo hay que probar que para cada ideal b de K[X1 , . . . , Xn ] se verifica
√
IK (VA (b)) = b.
Y, dado que tenemos que K[X1 , . . . , Xn ] es noetheriano, basta con que probemos que dado
un conjunto finito de elementos {f1 , . . . , fs } en K[X1 , . . . , Xn ], y dado un elemento adicional
f ∈ K[X1 , . . . , Xn ], si f se anula sobre VA (f1 , . . . , fs ), entonces, existen m ∈ N y existen
g1 , . . . , gs ∈ K[X1 , . . . , Xn ] verificando:
f m := g1 f1 + · · · + g2 f2 .
En realidad, técnicamente, el Truco de Rabinowitsch consiste en trabajar en la localización
K[X1 , . . . , Xn ]f , pero, hasta que no introduzacmos el lenguaje de las localizaciones, lo haremos
408 8. NULLSTELLENSATZ
“auto-suficientemente”.
Para hacerlo de la manera clásica, introduzcamos una nueva variable Xn+1 y trabajemos en el
anillo de polinomios K[X1 , . . . , Xn , Xn+1 ]. En este anillo de polinomios, consideremos el ideal
b0 generado por los siguientes polinomios:
b0 := (f1 , . . . , fs , Xn+1 f − 1).
Dado que f se anula en todos los puntos en los que se anulan simultáneamente f1 , . . . , fs ,
entonces
VA (b0 ) ⊆ An+1 (K),
es el conjunto vacı́o. La razón es que si x = (x1 , . . . , xn , xn+1 ) ∈ An+1 (K) es un elemento en
VA (b0 ), entonces se tiene:
f1 (x1 , . . . , xn ) = 0, . . . , fs (x1 , . . . , xn ) = 0, xn+1 f (x1 , . . . , xn ) − 1 = 0.
Pero si f1 (x1 , . . . , xn ) = 0, . . . , fs (x1 , . . . , xn ) = 0, como f se anula en VA (f1 , . . . , fs ), entonces
se ha de tener f (x1 , . . . , xn ) = 0 y la imposible igualdad:
xn+1 0 − 1 = 0.
0
Ası́, VA (b ) = ∅ y, por el Nullstellensatz (Teorema 8.5.2 anterior), concluiremos que existen
g1 , . . . , gs , gs+1 en K[X1 , . . . , Xn+1 ] tales que la siguiente igualdad se da en K[X1 , . . . , Xn+1 ]:
1 = g1 f1 + · · · + g2 f2 + gs+1 (Xn+1 f − 1).
Consideremos K(X1 , . . . , Xn ) el cuerpo de fracciones de K[X1 , . . . , Xn ] introducido en el Párrafo
3.2.0.1. Reemplazamos la variable Xn+1 por f1 ∈ K(X1 , . . . , Xn ) en la expresión anterior, ob-
servando que f1 , . . . , fs no contienen esa variable, y obtendremos:
s
!
X 1 1 1
1 := gi (X1 , . . . , Xn , )fi (X1 , . . . , Xn ) + gs+1 (X1 , . . . , Xn , )( f − 1).
i=1
f f f
Es decir, obtenemos la siguiente igualdad (en el cuerpo K(X1 , . . . , Xn )):
s
!
X 1
(8.5.3) 1 := gi (X1 , . . . , Xn , )fi (X1 , . . . , Xn ) .
i=1
f
Sea D una cota superior de los grados de los gi ’s con respecto a la variable Xn+1 . Entonces, es
una mera comprobación el verificar que, para i, 1 ≤ i ≤ s, existe hi ∈ K[X1 , . . . , Xn ] tal que se
verifica la siguiente igualdad en K(X1 , . . . , Xn ):
1
hi (X1 , . . . , Xn ) = f D gi (X1 , . . . , Xn , ) ∈ K[X1 , . . . , Xn ].
f
Por tanto, multiplicando por f D a la identidad (8.5.3) obtendremos la siguiente igualdad entre
elementos de K[X1 , . . . , Xn ] que se satisface en K(X1 , . . . , Xn ):
s
!
X
D
f := hi (X1 , . . . , Xn )fi (X1 , . . . , Xn ) .
i=1
Observación 8.5.14. El Truco de Rabinowitsch, que no es sino una variante del Nullstellen-
satz, permite introducir un Diccionario Álgebra-Geometrı́a que permitirá traducir indistin-
tamente los objetos geométriocs a objetos descriptibles mediante polinomios y recı́procamente.
Éste es el principio de la Geometrı́a Algebraica y tendrá su influencia en el posterior desarrollo
de la Geometrı́a a lo largo de la segunda mitad del siglo XX y princpios del XXI. Por lo que
a nosotros respecta, nos quedaremos con que esa identificación existe y la usaremos cuando
convenga.
8.5. NULLSTELLENSATZ, PARTE II 409
Luego,
(P)
IK (VP (a)) = IK ({0}) = (X0 , . . . , Xn ).
Pero, además, por la Proposición 7.4.7, el cono proyectante satisface
^
{0} = VP (a) = VA (a).
Fijada M (PTK ) como base ordenada, dado f ∈ K[X1 , . . . , Xn ] un polinomio de grado d, pode-
mos definir una aplicación lineal como sigue:
Lema 8.5.21. Con las notaciones precedentes, dado f ∈ K[X1 , . . . , Xn ] u polinomio de grado d
se tiene:
Para cada h ∈ PTn+d (X1 , . . . , Xn ), sea H la columna de sus coeficientes en la base M (PTK+d ),
orenada con respecto al orden monomial prefijado. Entonces, f divide a h si y solamente si el
siguiente sistema de ecuaciones lineales posee solución en K N (T,n) :
Hf · Z = H,
donde
Zµ0
Zµ1
Z := .. ,
.
ZµN (T ,n) −1
Sea s ∈ N un número entero positivo. Consideremos ahora el espacio vectorial sobre K dado
por el producto cartesiano siguiente:
s
Y
P(T
K
) (X1 , . . . , Xn ) := PTK (X1 , . . . , Xn ) := {(g1 , . . . , gs ) ∈ K[X1 , . . . , Xn ]s : deg(gi ) ≤ T }.
i=1
Sobre él podemos considerar la base inducida, como espacio producto, por las respectivas bases
monomiales M (PTK ) en cada uno de los multiplicandos. Ciha base B(T s
) viene dada por la
siguiente igualdad:
s
[
B(T
s
{0}i−1 × M (PTK ) × {0}s−i .
) :=
i=1
Lema 8.5.22. Con las notaciones precedentes, fijando las bases B(T
s
) y M (PK ) las bases mono-
T
miales respetivas en los espacios de entrada y salida de η(f1 ,...,fs ) existe una única matriz
(T )
H(f1 ,...,fs ) con coordenadas en K, con N (T + d, n) filas y sN (T, n) que representa la aplicación
8.5. NULLSTELLENSATZ, PARTE II 413
Z(s)
donde para cada i, 1 ≤ i ≤ s, se tiene
(i)
Zµ0
(i)
Zµ1
(i)
Z :=
.. ,
.
(i)
ZµN (T ,n) −1
es el vector columna de los posibles coeficientes de un polinomio en PTK (X1 , . . . , Xn ),
ordenados por el orden monomial prefijado.
Demostración. Es simplemente la transcipción de la linearidad de η(f1 ,...,fs ) al lenguaje
de matrices y vectores.
(T )
Nótese que la matriz de H(f1 ,...,fs ) de la aplicación lineal η(f1 ,...,fs ) tiene un apsecto como el
siguiente:
s
(T )
X
H(f1 ,...,fs ) := H
g fi ,
i=1
Qs
donde H
g fi es la matriz Hfi extendida mediante zeros al producto cartesiano i=1 PTK (X1 , . . . , Xn ).
A partir de aquı́, el procedimiento que podemos definir es el siguiente:
Procedimiento:
eval una cota de D(d, n, s), por ejemplo
T := max{3, n}n .
Siguiendo el Lema precedente:
eval las matrices: Hf1 , . . . , Hfs .
(T )
eval la matriz: H(f1 ,...,fs ) .
decide whether sl siguiente sistema de ecuaciones lineales es o no compatible:
(1)
Z
(T ) ..
(8.5.5) H(f1 ,...,fs ) . = 1,
Z(s)
414 8. NULLSTELLENSATZ
(8.5.5) cuya matriz tiene coordenadas en L. De hecho, las coordenadas están en K[Y1 , . . . , Ym ].
Ahora, el sistema es incompatible si y solamente si ciertos menores de la matriz de coeficientes
del sistema de ecuaciones lineales (8.5.5) son nulos o no. La fórmula Ψ(Y1 , . . . , Ym ) son combi-
naciones booleanas de condiciones de signo sobre los menores de esa matriz. Esos menores son
polinomios en K[Y1 , . . . , Ym ]2. En particular, acabamos de denostrar el Teorema Fundamental
de la Eliminación usando el Nullstellensatz y Álgebra Lineal Elemental. El resto se sigue de
modo obvio.
Observación 8.5.26 (Crı́ticas a este Procedimiento). Este procedimiento es el que subyace
a los intentos de mejorar los Nullstellensatz Efectivos que fueron moda a finales de los años 80 y
principios de los 90, pero que siguen siendo considerados resultados de élite en Matemáticas. Sin
embargo, el método no es óptimo porque la complejidad ni siquiera es simplemente exponencial:
2
está en O(dωn ). Veremos, si es posible a lo largo del curso, que se puede decidir en tiempo
O(d(ω+1)n ) con una complejidad que necesariamente están en Ω(dn ) (al menos para algoritmos
universales). Por tanto, no es recomendable usar este procedimiento por más que sea el más
accesible e inmediato de entender.
Ejemplo 8.6.1 (Ejemplos de Categorı́as). Los ejemplos usados en anteriormente sirven para
ilustrar la noción de categorı́as.
2Note el alumno que se trata de los menores que, rudimentariamente, le salı́an en los lejanos cursos
de secundaria en los que se discutı́a si un sistema de ecuaciones lineales con parámetros era compatbile
o no.
416 8. NULLSTELLENSATZ
Definición 107 (Tipos elementales de Morfismos). Dados dos objetos X, Y en una cate-
gorı́a C y un morfismo f ∈ HomC (X, Y ), definiremos las condiciones para que f sea
i) Monomorfismo: Decimos que f es un monomorfismo en C si para todo otro objeto T
de C y cualesquiera dos morfismos α1 , α2 ∈ HomC (T, X), se tiene:
f ◦ α1 = f ◦ α1 =⇒ α1 = α2 .
f
IdT X Y
α2
T f ◦ α2
entonces, α1 = α2 .
ii) Epimorfismo: Decimos que f es un epimorfismo de grupos si para todo grupo (T, ?) y
cualesquiera dos morfismos α1 , α2 : (H, ⊥) −→ (T, ?), se tiene:
α1 ◦ f = α1 ◦ f =⇒ α1 = α2 .
α1 ◦ f T
α1
f
X Y IdT
α2
α2 ◦ f T
entonces α1 = α2 .
iii) Isomorfismo: Decimos que f es isomorfismo en la categorı́a C si existe un morfismo
g ∈ HomC (X, Y ) tal que:
g ◦ f = IdX , f ◦ g = IdX .
F (f ) G(f )
F (Y ) G(Y )
ϕY
Proposición 8.6.3. Con las notaciones precedentes, el conjunto K[V ] es una K−álgebra con
las operaciones usuales de suma y producto de aplicaciones a valores en el cuerpo K. De hecho,
K[V ] es una K−álgebra finitamente generada (cf. Definición 34) y reducida (i.e. sin elementos
nilpotentes). Más aún, sea IK (V ) ⊆ K[X1 , . . . , Xn ] el ideal de los polinomios con coeficientes
en K que se anulan en V . Entonces, los siguientes anillos son isomorfos como K−álgebras:
∼ K[X1 , . . . , Xn ]/IK (V ).
K[V ] =
Demostración. Es claro que K[V ] es un subanillo de KV con las operaciones usuales.
Además, como K es cuerpo, el anillo KV no tiene elementos nilpotentes y tampoco los tendrá
el subanillo K[V ]. Por la propia definición de función polinomial, tenemos un epimorfismo de
anillos dado por la siguiente aplicación:
ρ : K[X1 , . . . , Xn ] −→ K[V
]
p 7−→ p V ,
donde la restricción es simplemente la función consistente en evaluar p es los puntos de V . Es
un epimorfismo de anillos y es un epimorfismo de K−álgebras (nótese que ρ(λ) es la función
constante λ definida en V ). Obviamente el núcleo es el ideal
ker(ρ) = IK (V ) := {p ∈ K[X1 , . . . , Xn ] : p(x) = 0, ∀x ∈ V },
ya estudiado anteriormente. Por el Primer Teorema de isomorfı́a concluiremos el isomorfismo
anunicado en la proposición.
(A)
Denotaremos mediante VK esta categorı́a. Nótese que fijado el cuerpo K su clausura algebraica
K queda determinada de manera unı́voca, y las objetos son subconjuntos de espacios afines sobre
la clausura algebraica de K.
Demostración. Para probar esta Proposición basta con observar que IdV es ciertamente
una aplicación polinomial y que la composición de dos aplicaciones polinomiales es una apli-
cación polinomial. Esta segunda afirmación es de fácil verificación.
(A)
• A cada objeto V ⊆ An (K) de la categorı́a VK le asociamos la K−álgebra reducida
finitamente generada K[V ].
(A)
• A cada morfismo regular ϕ : V −→ W de la categorı́a VK le asociamos el morfismo
de K−álgebras finitamente generadas reducidas:
ϕ∗ : K[W ] −→ K[V ].
Demostración. Esencialmente tenemos que probar que Id∗V = IdK[V ] , lo cual es obvio, y
que dados dos morfismos regulares ϕ : V −→ W y ψ : W −→ Z entre variedades algebraicas
K−definibles, se tiene que los morfismos de K−álgebras satisfacen:
∗
(ψ ◦ ϕ) = ϕ∗ ◦ ψ ∗ .
Pero esa es una propiedad de fácil verificación a partir de las definiciones expuestas.
es decir,
0 + IK (W )F (f + IK (V )) = f (p1 + IK (W ), . . . , pn + IK (W )) = f (p1 , . . . , pm ) + IK (W (.
Por tanto, f (p1 , . . . , pn )(y) = f (p1 (y), . . . , pn (y)) = 0 para cada y ∈ W o, equivalentemente,
F∗ (y) ∈ VA (f ), para cada f ∈ IK (V ). Es decir, F∗ (y) ∈ V y F∗ : W −→ V es una aplicación
polinomial bien definida.
Dicho de otro modo, ambas categorı́as son equivalentes y lo mismo da estudiar los espacios
topológicos compactos o esta subclase de la categorı́a de anillos. Éste es el propósito de es-
tablecer equivalencias naturales: establecer conexiones entre teorı́as matemáticas que permitan
transferir en ambos sentidos información, resultados y, por ende, conocimiento.
8.7. VARIACIONES DEL NULLSTELLENSATZ EN OTROS CONTEXTOS (CULTURA GENERAL) 423
Ejemplo 8.7.4. Unos pocos ejemplos convencionales: espacios métricos, espacios compactos
de Hausdorff. Mientras que Cn es normal con la topologı́a usual y no lo es con la topologı́a de
Zariski.
Teorema 8.7.5 (Lema de Urysohn). Sea X un espacio topológico normal, dados F, G dos
cerrados en X, existe una función continua f ∈ C (X) tal que f (X) ⊆ [0, 1] y se tiene:
f = 0, f = 1.
F G
Este resultado es conocido como el primer resultado no trivial en Topologı́a. Se puede obvia-
mente probar que un espacio topológico es normal si y solamente si verifica la propiedad descrita
en el Lema de Urysohn. Una de sus consecuencias más famosas es el siguiente resultado:
Teorema 8.7.6 (Teorema de Extensión de Tietze-Urysohn). Sea F un cerrado en un
espacio topológico normal X. Entonces, para cada función continua f ∈ C (F ) existe una
función continua ϕ ∈ C (X) tal que
ϕF = f.
Una interpretación casi inmediata del Teorema de Tietze (en nuestro contexto) es la siguiente.
Consideremos X un espacio topológico y sea F ⊆ X un cerrado. Tenemos un morfismo de
anillos dado por la restricción:
ρ : C (X) −→ C (F ),
ϕ 7−→ ϕ . F
Claramente se trata de un morfismo de anillos y se tiene el siguiente enunciado equivalente del
Teorema de Tietze:
Teorema 8.7.7 (Teorema de Extensión de Tietze-Urysohn, versión 2). Con las anteri-
ores notaciones, si X es un espacio topológico normal, entonces ρ es un epimorfismo de anillos,
Ker(ρ) = I(F ) y se tiene el siguiente isomorfismo de anillos:
C (F ) =∼ C (X)/I(F ).
• Para cada x ∈ X, X
ϕi (x) = 1.
i∈I
Se dice que una partición de la unidad {ϕi : i ∈ I} ⊆ C (X) está subordinada a un cubrimiento
abierto {Ui : i ∈ I} de X si supp(ϕi ) ⊆ Ui para cada i ∈ I 3.
Corolario 8.7.10. Con las anteriores notaciones, para cualquier cerrado F en X, la re-
stricción:
ρ : C ∞ (M ) −→ C ∞ (F )
ϕ 7−→ ϕ , F
es un epimorfismo de anillos. Más aún, el siguiente es un isomorfismo de anillos:
C ∞ (F ) ∼
= C ∞ (M )/I(F ).
Problema 296 (La topologı́a de Zariski en Spec(R)). Comencemos con un aspecto nota-
cional: Sea R un anillo, p ∈ Spec(R) y f ∈ R. Denotemos mediante f (p) la clase f + p ∈ R/p.
Nótese que es una notación, aunque no debe entenderse f funcionalmente, pero nos permite
definir los siguientes conjuntos. Dado a un ideal de R, definamos
V (a) := {p ∈ Spec(R) : f (p) = 0 ∈ R/p}.
Del mismo modo, dado F ⊆ Spec(R) podemos definir
I(F ) := {f ∈ R : f (p) = 0, ∀p ∈ F }.
Probar las afirmaciones siguientes:
i) V (a) = {p ∈ Spec(R) : p ⊇ a}. En particular, pruébese que V (a) es biyectable con
Spec(R/a).T
ii) I(F ) := {p ∈ Spec(R) : p ⊇ (F )}, donde (F ) es el ideal geberado por F .
iii) Existe una única topologı́a en Spec(R) cuyos cerrados son los subconjuntos de la forma
V (a) (llamada topologı́ de Zariski en el espectro Spec(R)).
iv) Un subconjunto F ⊆ Spec(R) es cerrado si y solamente si V (I(F )) = F .
v) Definimos elemento nilpotente módulo un ideal a de R como un elemento f ∈ R tal
que el morfismo de R−módulos siguiente es nilpotente:
ηf : R/a −→ R/a
h + a 7−→ f h + a.
Pruébese que el conjunto de todos los√elementos nilpotentes con respecto a un ideal a
es un ideal de R. Denotaremos √ por a a ese ideal y lo denominaremos radical del
ideal a y lo denotaremos
√ por a. Diremos que un ideal a es radical si coincide con su
su radical (i.e. si a = a) √
vi) Pruébese que para cada ideal a de R, a = I(V (a)).
vii) Existe una biyección entre los ideales radicales de R y los cerrados de Spec(R) para la
topologı́a de Zariski.
viii) Dado un morfismo de anillos ϕ : R −→ T , la aplicación
Spec(ϕ) : Spec(T ) −→ Spec(R)
p 7−→ pc := ϕ−1 (p),
es una aplicación continua para las respectivas topologı́as de Zariski.
Problema 297 (Noetherianidad en Spec(R)). Con las notaciones del problema precedente,
consideremos R un anillo notheriano y sea Spec(R) su espectro primo con la topologı́a de Zariski.
Pruébese que se verifican las siguientes propiedades:
i) Todo cerrado para la topologı́a de Zariski de Spec(R) puede ser dado como la inter-
sección finita de cerrados de la forma
V (f ) := {p ∈ Spec(R) : f (p) = 0},
con f ∈ R.
ii) Todo abierto para la topologı́a de Zariski de Spec(R) puede ser dado como la unión
finita de abiertos de la forma
D(f ) := {p ∈ Spec(R) : f (p) 6= 0},
con f ∈ R.
iii) Los cerrados de Spec(R) verifican la Condición de Cadena Descendente para
Cerrados, i.e. toda cadena numerable descendente de cerrados de Spec(R):
V0 ⊇ V1 ⊇ V2 ⊇ · · · ⊇ Vn ⊇ · · · ,
se estabiliza.
iv) Los abiertos de Spec(R) verifican la Condición de Cadena Ascendente para
abiertos, i.e. toda cadena numerable ascendente de abiertos de Spec(R):
A0 ⊆ A1 ⊆ A2 ⊆ · · · ⊆ Vn ⊇ · · · ,
se estabiliza.
v) Bajo el Axioma de Elección Dependiente, toda familia no vacı́a de cerrados de Spec(R)
para la topologı́a de Zariski posee elemento minimal.
8.9. META-MATEMÁTICA DE PRIMER ORDEN SOBRE CUERPOS 427
vi) Bajo el Axioma de Elección Dependiente, toda familia no vacı́a de abiertos de Spec(R)
para la topologı́a de Zariski posee elemento minimal.
vii) Todo cerrado en Spec(R) para la topologı́a de Zariski es quasi-compacto.
viii) Todo abierto en Spec(R) para la topologı́a de Zariski es quasi-compacto.
Una de las primeras observaciones casi inmediatas es que se puede suponer que todas las
fórmulas son estudiables en forma pre-nexa, es decir, con los cuantifidaores por delante. Suponiendo
428 8. NULLSTELLENSATZ
que fi,j , hi,j ∈ K[X0 , . . . , Xn ], una fórmula se primer orden en el lenguaje de cuerpos algebra-
caente cerrados en forma pre-nexa es una fórmula del tipo:
!
_n k
^ ^ ^ t
Q1 Xi1 , . . . , Qr Xir , (fi,j = 0) (gi,` 6= 0) ,
i=1 j=1 `=1
donde Qi ∈ {∀, ∃} son cuantificadores. Si los cuantificadores son todos del tipo Qi ∈ {∃},
decimos que es una fórmula existencial o que sólo involucra un bloque de cuantificadores exis-
tenciales.
La Semántica de esas fórmulas consiste en interpretar (instanciar o sustituir variables por
constantes en un dominio) las fórmulas con subconjuntos de An (K), donde K es algebraicamente
cerrado:
i) Ası́, un átomo, f (X0 , . . . , Xn ) = 0 se iterpreta como el conjunto algebraico
V (f ) := {x = (x0 , . . . , xn ) ∈ Kn+1 : f (x) = 0}.
ii) Una fórmula del tipo:
k
^
(fi,j (X0 , . . . , Xn ) = 0) ,
j=1
De hecho, el Teorema de la Base indica que todo V (a), para cualquier ideal a de
K[X0 , . . . , Xn ] se puede escribir mediante una fórmula de este tipo.
iii) Una negación de un átomo f (X0 , . . . , Xn ) 6= 0 se identifica con el complementario de
un conjunto algebraico dado por una sola ecuación:
V (f )c := {x = (x0 , . . . , xn ) ∈ Kn+1 : f (x) 6= 0}.
Son los abiertos de la base de la toplogı́a de Zariski.
iv) Las fórmulas del tipo:
t
!
^
(gi,` (X0 , . . . , Xn ) 6= 0) ,
`=1
Es decir, se tiene
!
\k \ t
\
Si = {x ∈ Kn+1 : fi,j = 0} {x ∈ Kn+1 : gi,` 6= 0} .
j=1 `=1
o, equivalentemente,
s t
!!
[ \ \
C := VA (fi,1 , . . . , fi,k ) {x ∈ Kn+1 : gi,` 6= 0} .
i=1 `=1
tal que
π(C) := {x ∈ Kn−r+1 : Ψ(x0 , . . . , xn−r )}.
Por tanto, toda fórmula con cuantificadores existencias es equivalente a una fórmula sin cuan-
tificadores (se dice libre de cuantificadores). Como los constructibles son cerrados por comple-
mentación y ∀ se interpreta mediante ¬ (∃¬(...)), podemos concluir.
Teorema 8.9.2. Toda fórmula de primer orden del lenguajde de cuerpos algebraicamente cer-
rados es semánticamente equivalente a una fórmula libre de cuantificadores. Luego la teorı́a es
completa. Además es decidible, es decir, existe un algoritmo que elimina los cuantificadores de
la fórmula cuantificada.
Glosario de Términos
k−ciclo, 44
Hilbert, Problema X, 254
hiper-superficie, 341 Legendre, sı́mbolo, 307
hiper-superficie afı́n definida por f en lenguaje, 18
An (K), 353 lexicográfico, orden, 19
hiper-superficie algebraica proyectiva, 365 libre, modulo, 94
hiperplano en el infinito, 364 lifting property, 197
hiperplano proyectivo, 366 local, anillo, 187
holomorfa, función , 71 localemente cerrado, 429
homeomorfismo, 23 localización de A en pZ, 110
homogéneo, ideal de polinomios, 369
homotecia, 28 Möbius, función, 404
homotecia (de multiplicación por máximo común divisor, 140
g ∈ R[X]: ηg ), 387 máximo común divisor en DFU’s, 298
homotecia asocial al elemento g, 242 métrica m−ádica en K[[X]], 111
homotecia de razón a sobre M , 318 módulo dual, 86
módulos de homologı́a, 101
ideal, 58 Matrices de Operaciones Elementales en
finitamente generado, 87 GL(2, R), 218
impropio, 58 Matrices de Operaciones Elementales en
ideal irreducible, 324 GL(n, R), 222
maximal, 187 matriz adjunta, 122
ideal maximal asociado a un punto, 349 compañera, 212, 242
primo, 187 hermitiana, 31
principal, 58 orlada, 225
propio, 58 ortogonal, 36
ideal radical, 315 unitaria, 31
radical, 426 simétrica, 31
ideal reducible, 324 transpuesta, 31, 115
, asociado a una variedad I(V ), 356 transpuesta conjugada, 31
, asociado a una K−variedad R−módulo, 80
IK (V ), 356 cociente, 85
, funciones que se anulan en F (i.e. finitamente generado, 87
IA[X] (F )), 347 libre, 94
, intersección, 86 libre de torsión, 204
ideales co-maximales, 258 proyectivo, 197
imagen (morfismo de R−módulos), 85 monoide, 17
inclusiones naturales en la suma directa, 85 monomio, 67
ı́ndice (de una permutación), 50 monomorfismo (de R−módulos), 84
intersección (de subgrupos), 26 monomorfismo (de anillos), 59
irreducible, elemento, 141 monomorfismo (de grupos), 23
irreducible, variedad algebraica, 356 monomorfismo (en una categorı́a), 416
irreducible, variedad algebraica biyectivo (de grupos), 23
K−definible, 356 morfismo de anillos, 58
irreducible, variedad algebraica proyectiva, (de R−módulos), 84
375 de monoides, 17
434 GLOSARIO DE TÉRMINOS
de semigrupos, 17 univariado, 56
morfismo docminante K−definible, 420 , mı́nimo de un endomorfismo, 212
morfismo dominante, 420 , multigrado (ord. monomial), 77
inyectivo (de grupos), 23 , término director, 77
morfismo regular, 419 polinomios multivariados, 67
suprayectivo (de grupos), 23 polinomios multivariados, anillo, 67
morfismos (de una categorı́a), 415 pre-orden (sobre un cuerpo), 75
morfismos frontera, 101 pre-orden propio (sobre un cuerpo), 75
morfismos regulares entre variedades, 419 primario, ideal, 319
multi-ı́ndice, 17 primario, submódulo, 330
, grado, 17 primitivo, polinomio, 301
multiplicar por un polinomio sobre K[X]d , primo, elemento, 141
acción, 169 primos inmersos, 329
producto (de ideales), 89
núcleo, (morfismo de R−módulos), 85 producto cartesiano de módulos, 107
número mı́nimo de generadores de un producto de módulos, 81
R−módulo, 88 producto semi-directo, grupos, 37
naturalemente equivalentes, functores proyecciones naturales del producto
covariantes, 418 cartesiano, 85
naturalmente equivalentes, functores proyectivo, módulo, 197
contravariantes, 418 pseudo-anillo, 55
Newton, sumas, 134, 135 [x0 : · · · : xn ], 363
nilpotente, 315 puntos K−racionales de una variedad, 353
nilpotente, elemento, 73
nilpotente, endomorfismo, 319 quasi-compacto, 360
no arquimqediano, valor absoluto, 110
noetheriano, anillo, 145 racional, forma canónica de un
noetheriano, espacio topológico, 379 endomorfismo, 215, 248
normal, espacio topológico, 423 racionales p−ádicos, 110
NP-completos, 385 radical de un ideal, 315√
Nullstellensatz Efectivo, 411 radical de un ideal ( a), 426
Nullstellensatz sobre vareidades rango de un R−módulo libre (caso finito),
cero-dimensionales, 386 97
rango de un R−módulo libre, 195
objetos (de una categorı́a), 415 reducible, variedad algebraica, 356
operación externa, 81 reducible, variedad algebraica
operaciones con matriz orlada, reglas, 225 K−definible, 356
órbita, 29 reducible, variedad algebraica proyectiva,
orden de una serie univariada en 0, 57 375
orden monomial, 66 reducido, anillo, 315
orden sobre un cuerpo, 75 relación de congruencia unitaria, matrices,
31
p−primario, ideal, 319 relación de congruencia, matrices, 31
p−primario, submódulo, 330 relación de equivalencia, matrices, 31
palabra, 18 relación de semejanza, matrices, 31
palabra vacı́a, 18 resto de la división (euclı́dea) rem(f, g), 62
paracompacto, espacio, 423 resultante univariada (“à la
parte primitiva de un polinomio (pp(f )), Sylvester-Bézout”), 172
301 resultante univariara (vı́a homotecias), 387
patición de la unidad, 423 retı́culo, 253
permanente de una matriz, 112 , paralelepı́pedo fundamental, 253
permutación, 42 , volumen, 253
caracterı́stico, 126 RSA, criptosistema, 180
polinomio eliminante en una variable, 173
polinomio homogéneo, 70 Sarrus, Regla determinantes 3 × 3, 121
polinomio mı́nimo en un vector, 211 Satisfactibilidad sobre cuerpos finitos, 386
polinomio univariado, 56 Schur, factorización compleja, 36
INDEX 435
A∗ , 31 EndR (M ), 84
At , 31 E(α), 77
ac , 59 An (K) = Kn , 352
ae , 90 An (K) = K n , 74
(a), 58
aR, 58 Fp , 60
aB, 90 Fq , 106
ab, 89 (F ), 87
aN , 89 hFi, 26
a + b, 88 RhFi, 87
a1 + · · · + am , 88
P m GFq , 106
i=1 ai , 88
gcdDFU , 298
An , 115
gcd(F ), 140
An , 53
gcd(a1 , . . . , am ), 140
AnnR (m), 204, 325
GL(n, R), 125
AnnR[X] (A), 131
[L : K], 164
AnnK (ζ), 162
Ap(S,
√ R), 65 Hd (X1 , . . . , Xn ), 70
a, 426 (i)
H∞ , 364
AssR (M ), 325 (0)
H∞ , 364
H(U ), 71
Bn , 70
ηg , 29
ηg , 387
C (X)(= C 0 (X)), 60
ηX , 242
C ω (U ), 70
HomR (M, M 0 ), 84
C k (U ), 1 ≤ k ≤ ∞, 72
cf., 7 i.e., 19
G/G1 , 37 IK (V ), 356
M/M 0 , 85 I(V ), 356
R/a, 59 IA[X] (F ), 347
(a : b), 330 I(F ), 347
Coker(f ), 86 mx , 349
C(f ), 212 (a1 , . . . , am ), 87
CCA, 144 Id , 21
X
cont(f
` ), 301 Im(f ), 85
i∈I M i , 107 λi , i ∈ I, 85
K(X1 , . . . , Xn ), 142 I(σ), 50
IrrK (ζ), 162
deg(f ) (multivariado), 68
deg(f ) (univariado), 57 Jord(M ), 277
det, 112
DFU, 295 K[X]d , 168
, 100 K[V ], 419
DiscX (f ), 288 K[V ], 419
DIP, 139 χ (X), 126
A
DE, 147 ker(f ), 85
439
440 GLOSARIO DE SÍMBOLOS Y ABREVIATURAS
p
K[An ], 352 (0), 315
K[An (K)], 352 rankR (M ) (caso finito), 97
rankR (M ), 195
λ,
18 rem(f, g), 62
m
p , 307 rem(a, b), 147
ZpZ , 110 ResX (f, g), 387
LT (f ), 77 Res(f, g), 172
ρf , 168
m
, 307 RS , 65
Qp n
RN , 66
i∈I Mi , 81
⊕i∈I Mi , 82 Σ∗ , 18
mx , 187, 349, 357 S (X), 21
µϕ , 212 Symn (K), 31
µv , 211 Sn , 42
0 (módulo nulo), 81 MaxSpec(R), 187
M ∗ , 86 Spec(R), 187
ϕ∗ , 420 SO(n), 53
StabG (x), 32
[n], 42
R1 [F], 59
P1m+ · · · + Nm , 88
N
2X , 16
i=1 Ni , 88 s.e.c,
µ(M ), 88 P 102
Pi∈I ai , 88
Oe(f ), 267 i∈I Ni , 88
O¶ (f ), 366 ⊕
Pi∈I Mi , 107
O(f ), 78 K , 75
Og (x), 29 SVD, 39, 40
OS (Y ), 29 SVD, matrices complejas, 41
≤deglex , 66 S (X), 29
≤lex , 66 Sylv(f, g), 171
≤revdeglex , 77 Sm+1 (f ), 169
ord0 (·), 57 T orR (M ), 204
O(n), 36
˙ 25
∪,
pp(f ), 301 U (n), 31
P roj(K[X0 , . . . , Xn ]), 410
Q
i∈I Mi , 107
VAn (K) (a), 353
πi , i ∈ I, 85 VAn (K) (f ), 353
Pn (K), 38 VX (F), 341
P(V ), 38 VX (a), 341
Pn−1 (K), 30 VA (f1 , . . . , fm ), 353
P(V ), 30 VAn (K) (f1 , . . . , fm ), 353
(x0 : x1 : · · · : xn ), 363 VX (f ), 341
VPn (K) (H), 369
Q, 60 VPn (K) (a), 369
quo(f, g), 62 VA (a), 353
qf (R), 142 VA (f ), 353
VP (f ), 365
⊕X R, 94
R[[X1 , . . . , Xn ]], 66 Y X , 16
R[[X]], 56 z
R[X1 , . . . , Xn ], 67 Y , 345
R[X], 56 √ 21
Z/nZ,
(R× , ·), 58 Z[√2]× , 178
Z[ m], 64
√p , 110
Q √
1+ m
a, 315 Z[ 2 ], 64
Bibliografı́a
[AKS, 04] M. Agrawal, N. Kayal, N. Saxena, PRIMES is in P. Annals of Math. 160 (2004), 781-793.
[AW, 2004] S. Alaça, K.S. Williams, “Introductory Algebaic Number Theory”. Cambridge Univ. Press, 2004.
[al-Khwārizmı̄, 820] Muhammad ibn Mūsā al-Khwārizmı̄, “al-Kitāb al-Mukhtas.ar fı̄ H . isāb al-Jabr wal-
Muqābalah”, Bagdad, 820.
[Al, 1999] N. Alon, Combinatorial Nullstellensatz. Combin. Probab. Comput. 8 (1999), 7-29.
[Arr, 2006] E. Arrondo, Another elementary proof of the Nullstellensatz. Amer. Math. Monthly 113 (2006),
169-171.
[AtMc, 1969] M.F. Atiyah, I.G. Macdonald, “Introduction to Commutative Algebra”, Addison-Wesley Pub-
lishing Co., 1969. [Edición en español por Ed. Reverté, 1980].
[AuBu, 1957] M. Auslander, D.A. Buchsbaum, Homological dimension in local rings.Trans. of the Amer.
Math. Soc. 85 (1957), 390–405.
[AuBu, 1959] M. Auslander, D.A. Buchsbaum, Unique factorization in regular local rings. Proc. of the Nat.
Acad. of Sci. of the USA 45 (1959), 733–734.
[Azu, 1951] G. Azumaya, On maximally central algebras, Nagoya Mathematical Journal 2 (1951), 119-150.
[BaSh, 1996] E. Bach, J. Shallit, “Algorithmic Number Theory. Vol 1 : Efficient Algorithms”, MIT Press,
1996.
[Baer, 1940] R. Baer, Abelian groups that are direct summands of every containing abelian group. Bulletin of
the Amer. Math. Soc. 46 (1940), 800-807.
[BS, 1988] D. Bayer, M. Stillman, On the complexity of computing syzygies. J. of Symb. Comput. 6 (1988),
135-147.
[BW, 1993] T. Becker, V. Weispfenning, “Groebner bases: a computational approach to commutative alge-
bra”. Grad. Texts in Maths. 141, Springer, 1993.
[Bls, 1984] A. Blass, Existence of Basis Implies the Axiom of Choice. Contemporary Mathematics 31 (1984)
31-33.
[Be, 1970] E.R. Berlekamp, Factoring Polynomials over Large Finite Fields. Mathematics of Computation 24,
(1970), 713-735.
[Berk, 1984] S.J. Berkowicz,On computing the determinant in small parallel time using a small number of
processors, Inf. Proc. Letters 18 (1984), 147-150.
[Be, 1970] E.R. Berlekamp, Factoring Polynomials over Large Finite Fields. Mathematics of Computation 24,
(1970), 713-735.
[Béz, 1764] E. Bézout, Recherches su le degré des équations résultants de l’évanouisement des inconnnues.
Histoires de l’Academie Royale des Sciences (1764), 288-338.
[Béz, 1779] É. Bézout, “Théorie générale des équations algébriques”. Paris, France: Ph.-D. Pierres, 1779.
[Bls, 1984] A. Blass, Existence of Basis Implies the Axiom of Choice. Contemporary Mathematics 31 (1984)
31-33.
[BCSS, 1996] L. Blum, F. Cucker, M. Shub, S. Smale,Algebraic settings for the problem P6=NP?. In “The
mathematics of numerical analysis (Park City, UT, 1995)”, Amer. Math. Soc., Providence, 1996, 125-144.
[BCSS, 1998] L. Blum, F. Cucker, M. Shub, and S. Smale, “Complexity and real computation”, Springer-
Verlag, New York, 1998.
[Bourbaki, 1967] N. Bourbaki, “Algébre Commutative, Éléments de mathématique, Fascicule XXVIII,
chapitres 1-7”, Hermann 1961-.
[BS, 02] M. Brin , G. Stuck, “Introduction to Dynamical Systems”. Cambridge Univ. Press, 2002.
[BL, 1972] Th. Bröcker, L. Ladner, “Differentiable germs and catastrophes”. Cambridge Univ. Press, 1972.
[Br, 1987] W. D. Brownawell, Bounds for the degree in the Nullstellensatz. Annals of Math. 126 (1987),
577-591.
[Buch, 1965] B. Buchberger, “Ein Algoritmus zum Auffinden der Basiselemente des Restklassenringes nach
einen nulldimensionallen Polynomideal”. Tesis Doctoral, Universidad Leopold-Franzens, Innsbruck, 1965.
[Buch, 1985] B. Buchberger, Gröbner Basis : An Algorithmic Method in Polynomial Ideal theory. In “Multi-
dimensional Systems Theory” , Mathematics and its Applications 6, Reidel, 1985, 184-232.
[Caj, 1911] F. Cajori, Horner’s method of approximation anticipated by Ruffini. Bull. Amer. Math. Soc.
17(1911), 409-414.
[CGH, 1988] L. Caniglia, A. Galligo and J. Heintz, Borne simplement exponentielle pour les degrés dans
le théorème des zéros sur un corps de caractéristique quelconque, C.R. Acad. Sci. Paris, t. 307, Série I
(1988), 255-258.
[CaEi, 1956] H. Cartan, S. Eilenberg, “Homological algebra. With an appendix by David A. Buchsbaum”.
Princeton Landmarks in Mathematics. Princeton University Press, Princeton, NJ, 1999 [Reedición del
original editado en Princeton en 1956].
441
442 BIBLIOGRAFÍA
[Cas, 59] J.S.W. Cassels, “An Introduction to the Geometry of Numbers”. Die Grund. Math. Wiss. 99,
Springer, 1959.
[CHMP, 2001] D. Castro, K. Hägele, J.E.Morais, L. M. Pardo, Kronecker’s and Newton’s approaches to
Solving : A first Comparison. J. of Complexity 17 (2001), 212-303.
[Cayley, 1858] A. Cayley, A Memoir on the Theory of Matrices. Phil. Trans. of the Royal Soc. of London 148
(1858), 17-37.
[Ch, 1957] N. Chomsky, “Syntactic Structures”. Mouton and Co., The Hague, 1957.
[ChMi, 1957] N. Chomsky, G. A. Miller, Finite state languages. Information and Control 1 (1957), 91-112.
[Ch, 1959a] N. Chomsky, On certain formal properties of grammars. Information and Control 2 (1959), 137-
167.
[Ch, 1959b] N. Chomsky, A note on phrase structure grammars. Information and Control 2 (1959), 393-395.
[Ch, 1962] N. Chomsky, Context-free grammarsand pushdown storage. Quarterly Progress Report No. 65. Re-
search Laboratory of Electronics, M. I. T., Cambridge, Mass., 1962.
[Ch, 1965] N. Chomsky, Three models for the description of language. IEEE Trans. on Information Theory 2
(1965), 113-124.
[Church, 36] A. Church, An unsolvable problem of elementary number theory. Am. J. Math. 58 (1936) 345-363.
[Coh, 1946] I.S. Cohen, On the structure and ideal theory of complete local rings. Transactions of the Amer.
Math. Soc. 59 (1946), 54–106.
[Cook, 1971] S. Cook, The complexity of theorem-proving procedures. In Proc. 3rd Ann. ACM SToC, ACM
Press, 1971, 151-158.
[CoLiOS, 1997] D. Cox, J. Little, D. O’Shea, “Ideals, Varieties, and Algorithms”, Springer, 1997 (1a. edición,
1992).
[CoLiOS, 1998] D. Cox, J. Little, D. O’Shea, “Using algebraic geometry”. Graduate Texts in Mathematics
185, Springer, 1998.
[Csa, 1976] L. Csanky, Fast Parallel Matrix Inversion Algorithm. SIAM J. on Comput. 5,4 (1976) 618-623.
[Dav, 49] M. Davis,Arithmetical problems and recursively enumerable predicates. The Journal of Symbolic Logic,
18 (1949), 33-41.
[Dem, 1984] M. Demazure, “Le monoı̈de de Mayr y Meyer”. Notes informelles de Calcul Formel, École Poly-
technique, 1984.
[DeMLi, 1978] R.A. DeMillo, R.J. Lipton, A probabilistic remark on algebraic program testing. Information
Processing Letters 7 (1978), 193–195.
[Dix, 1913] L.E. Dickson, Finiteness of the odd perfect and primitive abundant numbers with n distinct prime
factors. American Journal of Mathematics, 35 (1913), 413-422.
[Dvr, 09] Z. Dvir, On the size of Kakeya sets on finite fields. J. of the A.M.S. 22 (2009), 1093-1097.
[EiMc, 1945] S. Eilenberg, S. Mac Lane, General Theory of Natural Equivalence. Trans. of the Amer. Math.
Soc. 58 (1945), 231-294.
[Eins,1859] G. Einsenstein, Beweiss del allgemeinsten Reciprocitätgesetze zwischen reellen un komplexen
Zahlen. Verhandlungen der Königlich Pr. Akad. des Wissen. zu Berlin (1859), 189-198.
[Ei, 1995] D. Eisenbud, “Commutative algebra: with a view toward algebraic geometry”, Springer Verlag, 1995.
[Euler, 1750] L. Eulero, Theoremata circa Divisores Numerorum, Novi Commentarii academiae scientiarum
Petropolitanae 1 (1750), 20-48.
[Fad, 77] N. Fadeeva, D. K. Fadeev, Parallel Calculations in Linear Algebra. Kibernetika 6 (1977) 28-40.
[Frobenius, 1878] G. Frobenius, Über lineare Substutionen und bilineare Formen. J. Reine Angew. Math.
(Crelle) 84 (1878), 1–63.
[Fulton, 1984] W. Fulton, “Intersection theory”. New York-Heidelberg-Berlin Tokyo Springer, 1984.
[GaJo, 1979] M.R. Garey, D.S. Johnson, “Computers and Intractability: A Guide to the Theory of NP-
Completness”. W.H. Freeman, 1979.
[Gauss, 1801] C.F. Gauss, “Disquistiones Arithmeticae”. LIPSIAE in Commussionis apud Ger. Fleischer, 1801.
[Gen, 1976] E.R. Gentile, On the invariant factors. Rev. Un. Mat. Argentina 27 (1976), 240–243.
[GTZ, 1988] P. Gianni, B. Trager, G. Zacharias, Gröbner bases and primary decomposition of polynomial
ideals. J. Symbolic Comput. 6 (1988), 149-167.
[GiJe, 1976] L. Gillman and M. Jerison,“Rings of Continuous Functions”. Springer-Verlag, New York, 1976.
[GHMP, 97a] M. Giusti, J. Heintz, J.E. Morais, L. M. Pardo, Le rôle des structures des données dans les
problèmes d’élimination . Comptes Rendues Acad. Sci. Paris, Sér. I 325 (1997), 1223-1228.
[GHHMMP, 97b] M. Giusti, K. Hägele, J. Heintz, J.E. Morais, J.L. Montaña, L. M. Pardo, Lower bounds
for diophantine approximations. Journal of Pure and Applied Algebra 117 & 118 (1997), 277-317.
[GHMMP, 98] M. Giusti, J. Heintz, J.E. Morais, J. Morgenstern, L. M. Pardo, Straight-line programs in
geometric elimination theory. Journal of Pure and Applied Algebra 124 (1998), 101-146.
[Gödel, 31] K. Gödel, Über formal unentscheidbare Sätze der Principia Mathematica und verwandter Systeme,
I. Monatsh. Math. Phys. 38 (1931) 173-198.
[Gödel, 65] K. Gödel, On undecidable propositions of formal mathematical systems. In “The undecidable,
Basic Papers on Undecidable Propositions, Unsolvable Problemas and Computable Functions”, Raven
Press, Hewlett, NY (1965) 41-71.
[Goldman, 1951] O. Goldman, Hilbert rings and the Hilbert Nullstellensatz. Mathematische Zeitschrift 54
(1951), 136–140.
[HMPS, 2000] K. Hägele, J.E. Morais, M. Sombra, L. M. Pardo,The intrinsic complexity of the Arithmetic
Nullstellensatz. J. of Pure and App. Algebra vol. 146, (2000), 103-183.
BIBLIOGRAFÍA 443
[Hamilton, 1843] W.R. Hamilton, On Quaternions; or on a new System of Imaginaries in Algebra. Letter to
John T. Graves, dated October 17, 1843.
[Hamilton, 1853] W.R. Hamilton, “Lectures on Quaternions”. Hodges & Smith, Dublin, 1853.
[Hardy-Wright, 1938] G. H. Hardy, E. M. Wright, “An Introduction to the Theory of Numbers”. Oxford at
the Clarendon Press, 1938.
[HarvdH, 19] D. Harvey, J. Van Der Hoeven, Integer multiplication in time O(nlogn). (2019). hal-02070778.
[HHPS, 21] A. Hashemi, J. Heintz, L.M. Pardo, P. Solernó, On Bézout inequalities for non-homogeneous
polynomial ideals. J. of Symbolic Computation 106 (2021), 1-22.
[Heintz, 1983] J. Heintz, Fast quantifier elimination over algebraically closed fields. Theoret. Comp. Sci. 24
(1983), 239-277.
[HeSc, 82] J. Heintz, C.P. Schnorr, Testing Polynomials wich are easy to compute. In Logic and Algorith-
mic (an International Symposium in honour of Ernst Specker), Monographie n. 30 de l’Enseignement
Mathématique (1982), 237-254.
[Hen, 75] M. Henriksen, A simple characterization of commutative rings without maximal ideals. Amer. Math.
Monthly 82.5 (1975), 502-505.
[Hermann, 1926] G. Hermann, Die Frage der endlich vielen Schritte in der Theorie der Polynomideale. Math.
Ann. 95 (1926), 736-788.
[Hilbert, 1890] D. Hilbert, Über die Theorie der algebraischen Formen. Mathematische Annalen 36 (1890),
473-530.
[Hilbert, 1893] D. Hilbert, Über die vollen Invariantensysteme. Math. Annalen 42 (1893) 313-373.
[HiSt, 1997] P. Hilton, U. Stammbach, “A course in homological algebra. Second edition”. Graduate Texts in
Mathematics, 4. Springer-Verlag, New York, 1997.
[Hir, 1964a] H. Hironaka, Resoluction of Singularities of an Algebraic Variety over a Field of Characteristic
Zero I. Annals of Math. 79 (1964), 109-203.
[Hir, 1964b] , Resoluction of Singularities of an Algebraic Variety over a Field of Characteristic Zero
II. Annals of Math. 79 (1964), 205-326.
[HSD, 1974] M. W. Hirsch, S. Smale, R. L. Devaney, “Differential Equations, Dynamical Systems, and
Linear Algebra , 1st Ed.”. Academic Press, 1974.
[Hod, 1974] W. Hodges, Six impossible rings, J. Algebra 31 (1974), 218-244
[Hol, 1889] O. Hölder, Zurückführung einer beliebigen algebraischen Gleichung auf eine Kette von Gleichun-
gen. Math. Ann. 34 (1889), 26–56.
[Hor, 1819] W. G. Horner, A new method of solving numerical equations of all orders, by continuous approx-
imation. Philosophical Transactions (Royal Society of London), July 1819, 308-335.
[IM, 1983] O.H. Ibarra, S. Moran, Equivalence of Straight–Line Programs. J. of the ACM 30 (1983), 217-228.
[Jacobi, 1837] Carl Gustav Jacobi, Über die Kreisteilung und iher Anwendung auf die Zahlentheorie. Bericht
Akademi Wissen. Berlin (1837), 127-136.
[Jacobson, 1945] N. Jacobson,The radical and semi-simplicity for arbitrary rings. Amer. Journal of Math. 67
(1945), 300–320.
[Jen, 1899] J. Jensen,Sur un nouvel et important théorème de la théorie des fonctions. Acta Mathematica 22
(1899), 359–364.
[Jiushao, 1247] Qin Jiushao, “Shu Shu Jiu Zhang” (Tratado Matemático en Nueve Secciones), 1247.
[Jod, 1967] M.A. Jodeit, Uniqueness in the Division Algorithm. Amer. Math. Monthly 74 (1967), 835-836.
[Jordan, 1869] C. Jordan, “Théorème sur les équations algébriques”. C.R. Acad. Sci. Paris 68 (1869), 257–258.
[Jordan, 1870] C. Jordan, “Traité des substitutions et des équations algébriques”. Gauthier-Villars, Paris, 1870.
[KLL, 84] R. Kannan, A. K. Lenstra, L. Lovász, Polynomial factorization and non-randomness of bits of
algebraic and some transcendental numbers. In “Proceedings of the 16th Ann. ACM Symp. Theory of
Computing (STOC’84)”, Washington, D.C., 1984, 191-200.
[Kap, 1970] I. Kaplansky, “Commutative Rings”, Allyn and Bacon, 1970.
[Krp, 1972] R. Karp, Reducibility among combinatorial problems. In Complexity of Computer Computations,
(R.E. Miller & J.W. Hatcher, eds.), Plenum Press, 1972, 85-103.
[KO, 1962] A. Karatsuba, Yu. Ofman, Multiplication of Many-Digital Numbers by Automatic Computers.
Proceedings of the USSR Academy of Sciences. 145 (1962), 293–294. Traducción al inglés en Physics-
Doklady 7 (1963), 595–596.
[Knu, 1981] D.E. Knuth, “The Art of Computer Programming, vol. 2 Seminumerical Algorithms” Addison-
Wesley, 1981.
[KMH, 1988] H. Kobayashi, S. Moritsugu, R.W. Hogan, On Solving Systems of Algebraic Equations. In
“Proceedings ISSAC 88”, ACM, 1988, 139-149.
[Köning, 1903] J. Köning, “Einleitung in die allgemeine Theorie der Algebraischen Groessen”. Leipzig, 1903.
[Kol, 1988] J. Kollár, Sharp Effective Nullstllensatz. J. of A.M.S. 1 (1988), 963-975.
[Koz, 1992] D.C. Kozen, “The Design and Analysis of Algorithms”. Texts and Monographs in Computer Sci-
ence, Springer Verlag, 1992.
[KrPa, 1996] T. Krick, L.M. Pardo, A Computational Method for Diophantine Approximation. In Algorithms
in Algebraic Geometry and Applications, Proc. MEGA’94, Progress in Mathematics 143, Birkhäuser
Verlag, 1996, 193-254.
[KPS, 2001] T. Krick, L.M. Pardo, M. Sombra, Sharp Estimates for the Arithmetic Nullstellensatz. Duke
Math. Journal 109 (2001), 521-598.
[Kronecker, 1882] L. Kronecker, Grundzüge einer arithmetischen theorie de algebraischen grössen. J. reine
angew. Math. 92 (1882) 1-122.
444 BIBLIOGRAFÍA
[Ku, 1985] E. Kunz, “Introduction to Commutative Algebra and Algebraic Geometry”, Birkhäuser, 1985.
[Krull, 1928] W. Krull, “Primidealketten in allgemeinen Ringbereichten”. Sitzungs berichte der Heidelberger
Akademie der Wissenschaften, Mathematische-Naturwissenschaftliche Klasse 7 (1928).
[Krull, 1929] W. Krull, Die Idealtheorie in Ringen ohne Endlicheitsbedingungen. Mathematische Annalen 10
(1929), 729-744.
[Krull, 1935] , “Idealtheorie”. Springer, 1935.
[Krull, 1938] W. Krull, Dimensionstheorie in Stellenringen. J. Reine Angew. Math. 179 (1938), 204.
[Krull, 1951] W. Krull, Jacobsonsche Ringe, Hilbertscher Nullstellensatz, Dimensionstheorie. Mathematische
Zeitschrift, 54 (1951), 354–387.
[Laf, 1977] J.P. Lafon, “Algèbre commutative”, Hermann, 1977.
[Lan, 1905] E. Landau, Sur quelques Théorèmes de M. Petrovic relativs aux zéros des fonctions analytiques.
Bull Soc. Math. France 33 (1905), 251-261.
[Lm, 1844] G. Lamé, Note sur la limite du nombre des divisions dans la recherche du plus grand commun
diviseur entres deux nombres entiers. Comptes Rendus Acad. Sci. 19 (1844), 876-870.
[Lasker, 1905] E. Lasker, Zur Theorie der Moduln und Ideale, Math. Ann. 60 (1905), 19-116.
[Lau, 1962] H. Läuchli, Auswahlaxiom in der Algebra, Commentarii Mathematici Helvetici, 37 (1962-1963),
1-18.
[Laz, 1981] D. Lazard, Résolution des systèmes d’équations algébriques, Theor. Comp. Sci. 15 (1981), 77-110.
[Legendre, 1789] A.M. Legendre, “Essai sur la Théorie des Nombres”. Paris, 1789.
[Leh, 1933] D.H. Lehmer,Factorization of Certain Cyclotomic Functions. Ann. of Math. 34 (1933), 461-479.
[Lens, 1981] A. K. Lenstra, “Lattices and Factorization of Polynomials”. Report IW 190, 81. Amsterdam
Mathematisch Centrum, 1981.
[LLL, 1982] A.K. Lenstra, H. W. Lenstra, L. Lovász, Factoring Polynomials with Rational Coefficientes.
Math. Ann. 261 (1982), 515-534.
[Lind, 1970] C. Linderholm, A Group Epimorphism is Surjective. American Mathematical Monthly 77 (1970),
176–177.
[LeV, 1840] U. Le Verrier, Sur les variations séculaires des elements elliptiques des sept planètes principales.
Liouville J. Math. 5 (1840) 220-254.
[Macaulay, 1916] F.S. Macaulay, “The Algebraic Theory of Modular Systems”. Cambridge tracts in math. and
Math. Physics, Cambridge University Press, 1916.
[Mc, 1975] S. Mac Lane, “Homology. Reprint of the 1975 edition”. Classics in Mathematics. Springer-Verlag,
Berlin, 1995.
[Mah, 1962] K. Mahler, On Some Inequalities for Polynomials in Several Variables. J. London Math. Soc. 37
(1962), 341-344.
[MaWü, 1971] D. W. Masser and G. Wüstholz, Fields of large transcendence degree generated by values of
elliptic functions. Invent. Math. 72 (1971) 407-463.
[Matj, 1970] Juri. V. Matjasevich, Enumerable sets are Diophantine. Doklady Akademii Nauk SSSR (en ruso)
191 (1970), 279-282. (Traducción al inglés en Soviet Mathematics 11 (2) (1970) pp. 354-358).
[Mat, 1980] H. Matsumura,“Commutative Algebra (2nd. Edition)”, Benjamin/Cummings, 1980.
[Ma, 1989] H. Matsumura, “Commutative Ring Theory”. Cambridge Studies in advanced Math. 8, Cambridge
Univ. Press, 1989.
[Mayr, 1989] E. Mayr, Membership in Polynomial Ideals over Q Is Exponential Space Complete. In “Proc.
of the 6th Annual Symposium on Theoretical Aspects of Computer Science (STACS’89)”, ACM, 1989,
400-406.
[MM, 82] E. Mayr and A. Meyer, The complexity of the word problem for commutative semigroups. Advances
in Math. 46 (1982), 305-329.
[Mign, 1989] M. Mignotte, “Mathématiques pour le Calcul Formel”, Presses Univ. de France, 1989.
[Milr, 1976] G.L. Miller, Riemann’s hypothesis and tests for primality. J. Comput. Syst. Sci. 13 (1976), 300-
317.
[Mks, 10] H. Minkowski, “Geometrie der Zahlen”. Leipzig and Berlin: R. G. Teubner, 1910. Chelsea, 1953
(reprint).
[Mtz, 1949] T. Motzkin, The Euclidean algorithm. Bull. Amer. Math. Soc., 55 (1949), 1142-1146.
[Mul, 1986] K. Mulmuley, A Fast Parallel Algorithm to Compute the Rank of a Matrix over an Arbitrary
Field. In Proc. STOC 1986, 338-339.
[Nag, 1958] M. Nagata, A general theory of algebraic geometry over Dedekind domains. II. Separably generated
extensions and regular local rings. American J. of Math. 80 (1958), 382–420,
[Nag, 1975] M. Nagata,“Local Rings”, Robert E. Krieger, 1975.
[Nak, 1951] T. Nakayama, A remark on finitely generated modules, Nagoya Mathematical Journal 3 (1951),
139-140.
[Netto, 1885] E. Netto, Zur Theorie der Elimination. Acta math. 7 (1885), 101–104.
[NP, 21] V. Neiger, C. Pernet, Deterministic computation of the characteristic polynomial in the time of
matrix multiplication. J. of Complexity 67 (2021), 101572.
[Noether, 1921] E. Noether, Idealtheorie in Ringbereichen. Math. Annalen 83 (1921), 24-66.
[Noether, 1926] E, Noether, Der Endlichkeitsatz der Invarianten endlicher linearer Gruppen der Charakter-
istik p. In “Nachritten von der Gesellschaft der Wissenschaften zu Göttingen, aus dem Jahre 1926”, 1926,
28–35.
[Noether, 1927] E. Noether, Abstrakter Aufbau der Idealtheorie in algebraischen Zahl und Funktionenkörpern.
Math. Ann. , 96 (1927), 26-61.
BIBLIOGRAFÍA 445
[vdW, 1931] , “Moderne Algebra. Teil II”. Die Grundlehren der mathematischen Wissenschaften 34,
Springer, 1931.
[Wallis, 1656] J. Wallis, “Arithmetica infinitorum”, 1656.
[Weierstras, 1854] K. Weierstras, “Zur Theorie der Abelschen Functionen”. J. für Reine und Angew. Math.
(1854).
[Weirstrass, 1876] K. Weierstrass, “Zur Theorie der eindeutigen analytischen Functionen”. Berl. Abh. (1876),
11-60.
[Wls, 1973] J.C. Wilson, A Principal Ideal Ring that is not a Euclidean Ring. Mathematics Magazine, 46
(1973), 34-38.
[Yap, 1991] C. K. Yap, A New Lower Bound Construction for Commutative Thue Systems with Applications.
J. of Symb. Comput. 12 (1991) 1-27.
[ZarSam, 1960] O. Zariski, P. Samuel, “Commutative Algebra”, vols. I-II, Van Nostrand, Princeton,
1958,1960.
[Zer, 1904] E. Zermelo, Beweis, dass jede Menge wohlgeordnet werden kann. Mathematische Annalen 59
(1904), 514-516.
[Zip, 1990] R. Zippel, Interpolating Polynomials from their Values. J. Symbol. Comput. 9 (1990), 375-403.
[Zh, 13] Zhuangzi,“The Complete works of Zhuangzi (Translated by Burton Watson)”. Columbia Univ. Press,
2013.