Está en la página 1de 323

See discussions, stats, and author profiles for this publication at: https://www.researchgate.

net/publication/365129117

Notas deÁlgebra II: Grupos, anillos, módulos y categorías

Preprint · November 2022

CITATIONS READS
0 57

1 author:

Ricardo Toledano
Universidad Nacional del Litoral
24 PUBLICATIONS   111 CITATIONS   

SEE PROFILE

Some of the authors of this publication are also working on these related projects:

Polynomials with all roots on the unit circle View project

All content following this page was uploaded by Ricardo Toledano on 05 November 2022.

The user has requested enhancement of the downloaded file.


Notas de Álgebra II: Grupos, anillos,
módulos y categorı́as

Ricardo Toledano
Departamento de Matemática
Las presentes notas representan los temas teóricos dados en la materia Álgebra
II, correspondiente al primer año del ciclo superior de la Licenciatura en Matemática
Aplicada (Plan 2018). Se definen las estructuras básicas de grupo, anillo, módulos y
se da una breve introducción a la Teorı́a de Categorı́as. La mayorı́a de los resultados
expuestos se demuestran completamente. Algunos de ellos son dejados como ejercicios
y se pueden ver las demostraciones (al menos las ideas) en los siguientes libros clásicos
sobre estructuras algebraicas:

• Atiyah M. y Macdonald I., Introducción al álgebra conmutativa. Editorial Reverte.


1980.

• Dummit D. y Foote R., Abstract Algebra. 3rd Edition. Wiley, 2004.

• Herstein, I. N., Algebra moderna. Editorial Trillas, 2da Edición, 2013.

• Jacobson, N., Basic algebra I y II, Ed. Freeman, 1974.


Algebra II
Introducción

A lo largo de la carrera hemos visto distintas clases de conjuntos con opera-


ciones entre sus elementos que vuelven a dar como resultado otro elemento
del mismo conjunto.

Por ejemplo, en el conjunto de los números enteros (o reales o complejos),


dados dos enteros podemos sumarlos, restarlos y multiplicarlos y obtenemos
como resultado un número entero.

Lo mismo ocurre con vectores: podemos sumar y restar dos de ellos y el


resultado será un vector.

También con matrices cuadradas de n × n (es decir n filas y n columnas):


podemos sumar, restar y multiplicar dos de ellas y obtenemos como resultado
una matriz cuadrada de n × n.

Finalmente mencionamos al conjunto de funciones de A en B (simbólicamente


escribiremos f : A → B para denotar a una función de A en B): también
podemos sumar, restar y multiplicar dos de ellas y obtenemos como resultado
una función de A en B.
Este tipo de situaciones ocurre con mucha frecuencia con otros objetos
matemáticos. Damos dos ejemplos algo inusuales.

• Consideremos un cuadrado en el plano (centrado en el origen para que sea

1
más fácil razonar con él) e imaginemos que este cuadrado esta anclado al plano
solamente en el centro de manera que podemos girarlo.

Tenemos una pregunta para hacernos: ¿cuáles son las rotaciones que dejan
invariante (es decir, coincide con la posición orginal) a esta figura? (no es
una pregunta artificial, pues respuestas a este tipo de preguntas con diver-
sas figuras geométricas pueden ser de interés para fı́scos y quı́micos cuando
estudian estructuras moleculares)

Por ejemplo, una rotación de π/2 radianes (tanto en sentido horario como
antihorario) lo deja invariante pero una de π/4 radianes no.

Para entender lo que está ocurriendo con las rotaciones del cuadrado, eti-
quetamos los vértices del cuadrado:

2 1

3 4

2
De esta manera podemos representar una rotación de π/2 radianes en sen-
tido antihorario como  
 1 2 3 4
σ= ,
 
 
 
2 3 4 1
 

lo que significa que el vértice 1 fue al lugar del vértice 2, el 2 al lugar del 3,
etc.

2 1 1 4

3 4 2 3

Veamos todas las posibles rotaciones antihorarias que dejan invariante al


cuadrado:

I : rotación de 0 radianes (rotación identidad, no hay movimiento)


σ : rotación de π/2 radianes
γ : rotación de π radianes
δ : rotación de 3π/2 radianes

Notar que toda rotación antihoraria que deje invariante al cuadrado que se
considere a partir de 2π radianes corresponde a una y solamente una del
cuadro anterior. Por ejemplo, una rotación de 2π radianes coincide con la
rotación identidad I.

Podemos definir una operación con este conjunto de cuatro rotaciones. Por
3
ejemplo al escribir σγ signfica que primero se hace una rotación de π radianes
y luego una de π/2 radianes. De esta manera vemos que

σγ = δ,

y decimos que δ es el producto de σ por γ.

De manera similar tenemos rotaciones en sentido horario que dejan invari-


antes al cuadrado. Por ejemplo, si β representa la rotación horaria de π/2
radianes entonces podemos escribir
 
 1 2 3 4
β= .
 
 
 
4 1 2 3
 

Vemos que β = δ. ¿Por qué?

Ejercicio. ¿Es cierto que toda rotación en sentido horario que deje invariante
al cuadrado se puede expresar en función de las antihorarias?

Ejercicio. Completar la siguiente tabla de productos de las rotaciones I, σ,


γ y δ:
I σ γ δ
I
σ δ
γ
δ
Vemos que tenemos una situación similar a la de las operaciones con enteros,
vectores, matrices, etc., es decir, multiplicar rotaciones antihorarias que dejan

4
invariantes al cuadrado dan como resultado rotaciones antihorarias que dejan
invariante al cuadrado.

• Veamos otro ejemplo, que es de interés en criptografı́a y es muy usado en


la generación de firmas digitales seguras para las operaciones financieras con
criptomonedas. Todo se basa en la definición de una operación entre ciertos
puntos pertenecientes a una clase especial de curvas en el plano denominadas
curvas elı́pticas.

Una curva elı́ptica es una curva en el plano con ecuación de la forma

y 2 = x3 + ax + b,

Por ejemplo, la gráfica de la curva elı́ptica con ecuación y 2 = x3 + 4 es

Se define una operación entre los puntos en la curva. Dados dos puntos P
y Q en la curva, definimos su “suma”

S = P ⊕ Q,
5
donde S es un punto en la curva que se obtiene de la siguiente manera: se
traza la recta que pasa por P y Q. Esta recta corta a la curva en un punto R
y luego se traza un lı́nea vertical que pasa por R. El punto S de intersección
de esta recta con la curva se define como la “suma” de P y Q.

Se puede demostrar que esta operación entre los puntos de una curva elı́ptica
tiene propiedades muy parecidas, por ejemplo, a la suma usual entre números
enteros, matrices, vectores y la multiplicación entre rotaciones del cuadrado
que lo deja invariante.
Por ejemplo, se puede demostrar que P ⊕ Q = Q ⊕ P (conmutatividad
de la “suma”) y que P1 ⊕ (P2 ⊕ P3) = (P1 ⊕ P2) ⊕ P3 (asociatividad de la
“suma”).

Estas propiedades en común responden a una estructura algebraica abs-


tracta que se denomina estructura de grupo, que será uno de los princi-
pales objetos de estudio en este curso, junto a las estructuras de anillo y
módulo.

6
Los ejemplos anteriores son un pequeña muestra de la importancia de la
estructura de grupo no solamente en la Matemática sino también en sus
usos en la Fı́sica, Quı́mica, seguridad informática, etc.

7
Grupos
1 Definiciones y propiedades básicas

Hemos visto en la Introducción diferentes conjuntos con diferentes operaciones


entre sus elementos y que, dejando de lado la clase de elementos que son
(números, matrices, vectores, funciones, etc.) se puede operar con ellos con
propiedades muy similares.

La idea es definir un concepto abstracto que represente todas estas situa-


ciones (y otras que no hemos visto) y estudiar sus propiedades en este
contexto abstracto. Estas propiedades pueden luego revelar nuevas situa-
ciones en las aplicaciones. Por ejemplo, podrı́an revelar maneras de que-
brar la seguridad de las firmas digitales al utilizar curvas elı́pticas para
generarlas.

Sea G un conjunto no vacı́o. Una operación binaria en G es una función


de G × G en G.
Es usual utilizar la notación a ∗ b para denotar a la imagen de un par
ordenado (a, b) ∈ G × G por tal función, es decir, a cada par de elementos a
y b de G la operación binaria le asigna un único elemento a ∗ b ∈ G.

Por ejemplo si G = Z (el conjunto de los números enteros), la suma es una


operación binaria en Z, pues a cada par de enteros a y b le asigna la suma de
ellos a + b que vuelve a ser un entero (es decir, en este caso, a ∗ b no es otra
cosa que la suma usual de a y b.)
1
Sea G un conjunto no vacı́o y ∗ una operación binaria en G. Se dice que
el par (G, ∗) es un grupo si se cumplen las siguientes propiedades:

i) (Asociatividad) Se cumple que (a ∗ b) ∗ c = a ∗ (b ∗ c) para toda terna de


elementos a, b y c de G.

ii) (Elemento neutro) Existe e ∈ G tal que a ∗ e = a = e ∗ a para todo


a ∈ G.

iii) (Elemento inverso) Para cada a ∈ G existe un elemento b ∈ G tal que

a ∗ b = e = b ∗ a.

Tal elemento b se denomina inverso de a en G y es usual denotarlo como


a−1.
Atención. La notación a−1 no representa una fracción 1/a como es
usual en el caso de tratar con números reales o complejos. Es solamente
una manera de escribir al elemento inverso de a en G.

• Por ejemplo, utilizando la notación de las rotaciones del cuadrado que lo


dejan invariante, vemos que σ −1 = δ.

• Vemos que (Z, +) es un grupo. En este caso el cero es el elemento neutro


y el inverso de cada entero a no es otra cosa que −a, lo que denominamos
usualmente como opuesto aditivo de a.

• Sea Mn(R) el conjunto de las matrices cuadradas de n × n formadas con


números reales. En este caso se tiene que (Mn(R), +) es también un grupo.

2
Aquı́ el elemento neutro es la matriz nula de n × n y el inverso de cada matriz
A es la matriz −A formada con los opuestos aditivos de cada elemento de A.

• Denotamos con sı́mbolo GL(n, R) al conjunto de las matrices de las


matrices cuadradas de n × n, formadas con números reales, con determinante
no nulo. Con la multiplicación de matrices el par (GL(n, R), ·) forma un
grupo. En este caso el elemento neutro es la matriz identidad y el inverso
de cada matriz es su matriz inversa (cada matriz es inversible pues tienen
determinante no nulo y eso equivale a que sean inversibles).

• Si con N denotamos al conjunto de los números naturales, el par (N, +)


no es un grupo pues el inverso de cada entero positivo n es el entero negativo
−n que no pertenece a N.

El par (N, +) es un ejemplo de una estructura que requiere menos condi-


ciones que la de grupo. Un conjunto no vacı́o M junto a una operación
binaria en M que sea asociativa se denomina monoide. El par (N, +)
es justamente un ejemplo de monoide.

3
2 Algunas propiedades

El cardinal del conjunto G (puede ser finito ó infinito) se denotará como |G|.
Un grupo G se dice que es finito si G tiene una cantidad finita de elementos.
En sı́mbolos G es finito si |G| < ∞.

El orden de un grupo G es su cardinal |G|.

Un ejemplo importante de grupo finito se consigue con las denominadas


raı́ces n-ésimas de la unidad. Son las raı́ces del polinomio xn − 1. Las
n raı́ces de este polinomio se pueden representar con potencias enteras no
negativas del número complejo θn = cos(2π/n) + i sen(2π/n) utilizando la
fórmula de De Moivre (ver Capı́tulo 1 del libro de Herstein):

θnk = cos(2kπ/n) + i sen(2kπ/n), k = 0, 1, 2, . . . , n − 1.

Si denotamos con En al conjunto de tales raices tenemos que |En| = n. No


es difı́cil verificar que θnk θnl = θnk+l (hacerlo!), con lo cual En, con el producto
usual de números complejos, cumple con todas las condiciones para ser un
grupo que es, además, finito y de orden n.

Un grupo (G, ∗) se dice que es abeliano si la operación binaria ∗ es con-


mutativa, es decir, si a ∗ b = b ∗ a para todo par de elementos a, b ∈ G.

Por ejemplo, (Z, +) es un grupo abeliano pero (GL(n, R), ·) no lo es (¿por


qué?).

4
• Ejemplo ejercitado. Sea S un conjunto no vacı́o. Definimos

A(S) = {f : S → S : f es biyectiva},

es decir, A(S) es el conjunto de todas las funciones biyectivas de S en S.


Verificar que con la composición de funciones A(S) es un grupo. Cuando se
escribe f n, con f ∈ A(S), significa que componemos f consigo misma n veces
f ◦ f ◦ · · · ◦ f . Se define f 0 como la función identidad de S en S. Supongamos
ahora que S = R2 y lo consideramos como el plano usual con ejes x e y. La
función f : R2 → R2 definida como

f (a, b) = (−a, b),

representa una reflexión con respecto al eje y. La función g : R2 → R2


definida como
f (a, b) = (−b, a),

representa una rotación de π/2 radianes en sentido antihorario (compro-


barlo!). Verificar que ambas funciones f y g son elementos de A(R2). Se
define
G = {f n ◦ g m : n = 0, 1 y m = 0, 1, 2, 3}.

Demostrar que el conjunto G con la composición de funciones tiene una es-


tructura de grupo no abeliano de orden 8. Este grupo se denomina grupo
dihedral orden 8.

5
A partir de ahora, omitiremos el sı́mbolo ∗ de la operación binaria, es decir,
en lugar de escribir a ∗ b, escribiremos simplemente ab. Tambien en lugar de
escribir (G, ∗) escribiremos solamente G, salvo en casos en donde sea necesario
explicitar la operación binaria en G.

Lema 1. Sea G un grupo. Entonces


i) El elemento neutro e de G es único.

ii) El inverso a−1 de cada elemento a ∈ G es único.

iii) (a−1)−1 = a para todo a ∈ G.

iv) (ab)−1 = b−1a−1 para todo a, b ∈ G.

Demostración. Veamos i). Supongamos que e0 es otro elemento neutro de


G. Entonces ae0 = a = e0a para todo a ∈ G. En particular haciendo a = e,
tenemos que ee0 = e. Pero como e es elemento neutro, también se tiene que
ee0 = e0. Luego e0 = e.
Veamos ii). Si b ∈ G es también inverso de a entonces ab = e = ba. En
particular ab = e. Multiplicando ambos lados por a−1 nos queda que

a−1(ab) = a−1e = a−1.

Pero, asociando, vemos que a−1(ab) = (a−1a)b = eb = b. Luego b = a−1.


Veamos iii). Sea b = a−1. Se tiene que

ab = aa−1 = e y ba = a−1a = e.

Como el inverso de b es único, entonces a = b−1 = (a−1)−1.


6
Finalmente veamos iv). El inverso de ab es (ab)−1 y es único. Por otro lado

(b−1a−1)(ab) = b−1((a−1a)b) = b−1(eb) = b−1b = e,

y
(ab)(b−1a−1) = (a(bb−1))a−1 = (ae)a−1 = aa−1 = e,

con lo cual b−1a−1 también es inverso de ab. Luego (ab)−1 = b−1a−1.




Lema 2. Sea G un grupo. Entonces las siguientes leyes cancelativas son


válidas en G:
i) Si ab = ac entonces b = c.

ii) Si ba = ca entonces b = c.

Demostración. Vemos i) solamente pues la demostración de ii) es similar. Si


ab = ac, al multiplicar ambos lados por a−1 nos queda

a−1(ab) = a−1(ac).

Pero a−1(ab) = (a−1a)b = eb = b y también a−1(ac) = (a−1a)c = ec = c.


Luego b = c.


7
Grupos
1 Subgrupos

En muchos casos se tiene un grupo (G, ∗) y un subconjunto H de G no vacı́o


tal que (H, ∗) es también un grupo. Tal es el caso de, por ejemplo, los grupos
(R, +) y (Z, +) pues Z ⊂ R. Este tipo de situaciones motiva la siguiente
definición:

Sea (G, ∗) un grupo y sea H un subconjunto no vacı́o de G. Decimos que


H es subgrupo de G si (H, ∗) es también un grupo.

Para hablar de subgrupo se tiene que considerar en ambos conjuntos G


y H la misma operación binaria. Por ejemplo H = {1, −1} es un sub-
conjunto de Z y H es un grupo con el producto usual de números (com-
probarlo!). Pero (H, ·) no es subgrupo de (Z, +). Notar también que,
por definición, G es subgrupo de sı́ mismo y es un ejemplo de subgrupo
trivial de G

Cuando decimos que ∗ es una operación binaria en G, también se suele


decir que G es cerrado bajo esa operación (es decir, si a y b ∈ G en-
tonces a ∗ b ∈ G). Esta última manera es, a veces, más conveniente para
usar en los enunciados que la primera. Finalmente, como en la mayorı́a
de los casos escribimos ab en lugar de a ∗ b, es usual referirse a la ope-
ración binaria en G como un producto en G.

1
Atención: en el contexto abstracto hablaremos de producto en G pero
en los ejemplos concretos, este producto en G puede ser, por ejemplo,
una suma usual, una multiplicación usual, una composición de funciones,
etc.

Cuando H es un subgrupo de un grupo G es usual expresarlo


simbólicamente ası́: H ≺ G.

Para comprobar si un subconjunto de un grupo G es un subgrupo no es


necesario comprobar todas las condiciones de grupo.

Lema 3. Sean G un grupo y H un subconjunto no vacı́o de G. Luego H


es subgrupo de G si y sólo si H es cerrado con respecto al producto en G y
para todo a ∈ H se cumple que a−1 ∈ H.

Demostración. Si H es subgrupo de G entonces es inmediato que H es


cerrado con el producto de G y que para todo a ∈ H se cumple que a−1 ∈ H.
Supongamos ahora que H es cerrado con el producto de G y para todo
a ∈ H se cumple que a−1 ∈ H. Tenemos que demostrar H es un grupo. Ya
tenemos, por hipótesis, que el producto de G es también un producto en H.
También se cumple inmediatamente la asociatividad en H por cumplirse en
G y por ser H ⊂ G.
Veamos que el neutro e de G es elemento neutro de H: como H 6= ∅
existe a ∈ H y por hipótesis, a−1 ∈ H. Como H es cerrado con respecto al

2
producto de G entonces e = aa−1 ∈ H. Luego existe un elemento neutro en
H (y vemos también que es el mismo de G).
Finalmente cada elemento a ∈ H tiene su inverso a−1 ∈ H por hipótesis.

Cuando H es un subconjunto finito de G, una sola condición garantiza que


H sea subgrupo de G. Antes de enunciar el resultado es conveniente utilizar
las siguientes convenciones notacionales. Dado a ∈ G y n ∈ Z definimos

aaa · · · a (n veces) si n > 0











an =  si n = 0


e


a−1a−1a−1 · · · a−1 (n veces) si n < 0





Es sencillo verificar que se cumplen las reglas usuales de los exponentes que
son válidas en el contexto de los números reales: anam = an+m y (an)m = anm.

Lema 4. Sean G un grupo y H un subconjunto no vacı́o y finito de G.


Luego H es subgrupo de G si H es cerrado con respecto al producto en G.

Demostración. Por Lema 3 solo queda comprobar que para todo a ∈ H


se cumpla que a−1 ∈ H. Sea a ∈ H. Si a = e (e neutro de G) entonces
a−1 = e−1 = e ∈ H. Supongamos que a 6= e y consideremos el conjunto

S = {ai : i ∈ N}.

Como H es cerrado con respecto al producto en G vemos que S ⊂ H. En


consecuencia, al ser H finito tenemos que S también lo es.

3
Sea k = |S|. Entonces en el conjunto {a, a2, . . . , ak , ak+1} tiene que haber
al menos dos elementos iguales, es decir, ai = aj para 1 ≤ i < j ≤ k + 1
(caso contrario, al ser todos distintos entre sı́ el conjunto S tendrı́a más de k
elementos, una contradicción). Luego

aj−i = e.

Notar que j − i ≥ 2 (pues si j − i = 1 entonces e = aj−i = a contradiciendo


que a 6= e). Luego j − i − 1 ≥ 1 y tenemos que

e = aj−i−1a y también que e = aaj−i−1.

Por lo tanto a−1 = aj−i−1 ∈ S ⊂ H.

Tenemos ası́ el siguiente

Corolario. Sean G un grupo finito y H un subconjunto no vacı́o de G.


Entonces H es subgrupo de G si H es cerrado con respecto al producto en
G.

4
2 Algunos subgrupos con nombre y apellido

Sea G un grupo con elemento neutro e.

• Subgrupos triviales de G. Son G y el conjunto unitario {e}. Todo subgrupo


H de G no trivial se dice que es propio.

• Subgrupo cı́clico de G generado por un elemento de G. Sea a ∈ G.


Definimos el subconjunto de G

(a) = {an : n ∈ Z}.

Vemos que (a) 6= ∅ pues e = a0 ∈ (a). Tenemos que (a) es cerrado con
respecto al producto en G pues anam = an+m y también que dado an se tiene
que (an)−1 = a−n ∈ (a). Luego por Lema 3, (a) es subgrupo de G.
El subgrupo (a) se denomina subgrupo cı́clico de G generado por a ∈ G.
Un grupo G se dice que es cı́clico si existe a ∈ G tal que G = (a). Por
ejemplo, (Z, +) = (1), por lo tanto (Z, +) es un grupo cı́clico.

• Centralizador de un elemento de G. Sea a ∈ G. Definimos el subconjunto

C(a) = {b ∈ G : ab = ba}.

Tenemos que C(a) 6= ∅ pues e ∈ G. También C(a) es cerrado con respecto


al producto en G: si b y c ∈ C(a) entonces

a(bc) = (ab)c = (ba)c = b(ac) = b(ca) = (bc)a,

con lo cual bc ∈ C(a). Finalmente sea b ∈ C(a). Entonces ab = ba y al


5
multiplicar ambos lados por b−1 por la izquierda nos queda

b−1(ab) = b−1(ba) = (b−1b)a = ea = a.

Luego (b−1a)b = a. Multiplicamos ahora por b−1 a la derecha y obtenemos

((b−1a)b)b−1 = ab−1.

Pero ((b−1a)b)b−1 = (b−1a)(bb−1) = (b−1a)e = b−1a. Luego

ab−1 = b−1a,

con lo cual b−1 ∈ C(a). Por Lema 3 concluı́mos que C(a) es un subgrupo de
G.
El subgrupo C(a) de G se denomina centralizador de a en G.
Notar que G es abeliano si y sólo si C(a) = G para todo a ∈ G.

• Centro de G. Definimos el subconjunto de G

Z(G) = {a ∈ G : ab = ba para todo b ∈ G}.

Vemos que Z(G) 6= ∅ pues e ∈ Z(G). Sean a y a0 ∈ Z(G) y sea b ∈ G.


Entonces

(aa0)b = a(a0b) = a(ba0) = (ab)a0 = (ba)a0 = b(aa0),

con lo cual aa0 ∈ Z(G) (pues b es arbitrario).


Veamos que si a ∈ Z(G) entonces también a−1 ∈ Z(G): sea b ∈ G,

6
entonces
a−1b = (b−1a)−1.

Como a ∈ Z(G) y b−1 ∈ G entonces b−1a = ab−1. Luego

a−1b = (b−1a)−1 = (ab−1)−1 = (b−1)−1a−1 = ba−1,

lo cual nos dice que a−1 ∈ Z(G). Por lo tanto Z(G) es un subgrupo de G
por Lema 3.
El subgrupo Z(G) recibe el nombre de centro de G.

• Subgrupos conjugados de un subgrupo. Sea H un subgrupo de G y a ∈ G.


Definimos el conjunto

a−1Ha = {a−1ha : h ∈ H}.

Veamos que a−1Ha es un subgrupo de G. Como H 6= ∅ tenemos que


a−1Ha 6= ∅.
Veamos que a−1Ha es cerrado con el producto de G: sean x, y ∈ a−1Ha.
Entonces x = a−1h1a e y = a−1h2a. Luego

xy = (a−1h1a)(a−1h2a)
= (a−1h1)(aa−1)(h2a)
= (a−1h1)e(h2a)
= a−1(h1h2)a ∈ a−1Ha.

7
Finalmente, sea x = a−1ha ∈ a−1Ha. Entonces

x−1 = (a−1ha)−1 = a−1(a−1h)−1 = a−1h−1(a−1)−1 = a−1h−1a.

Como h−1 ∈ H, se concluye que x−1 ∈ a−1Ha. Luego, por Lema 13, el
subconjunto a−1Ha de G es un subgrupo de G.
Los subgrupos de G de la forma a−1Ha con a ∈ G se denominan subgrupos
conjugados de G.

8
3 Un teorema importante de Lagrange

En esta sección daremos una demostración de uno de los resultados más im-
portantes en la teorı́a de los grupos finitos que es debido a Lagrange. Este
resultado establece que si G es un grupo finito y H es un subgrupo de G
entonces |H| divide |G|.

Para llegar a una demostración de este resultado necesitaremos primero


recordar lo que significa tener una relación de equivalencia en un conjunto
X. Primero, dar una relación en X es simplemente dar un subconjunto R
del producto cartesiano X × X (con lo cual los elementos de R son pares
ordenados).
Una relación R en X es de equivalencia si R es

• reflexiva, es decir (x, x) ∈ R para todo x ∈ X,

• simétrica, es decir si (x, y) ∈ R entonces (y, x) ∈ R,

• transitiva, es decir si (x, y) ∈ R e (y, z) ∈ R entonces (x, z) ∈ R.

Es usual escribir x ∼ y en lugar de (x, y) ∈ R.

Por ejemplo en Z tenemos la siguiente (importante!) relación de equivalen-


cia: dado n ∈ N definimos

a ∼ b si y sólo si n|(a − b).

Cuando n|(a − b) es usual decir que a y b son congruentes módulo n y


se escribe a ≡ b mod n.

9
Veamos ahora dos ejemplos importantes de relaciones de equivalencia en
un grupo G.

• Sea H un subgrupo de G y sea e su elemento neutro. Definimos la siguiente


relación en G:
a ∼ b si y sólo si ab−1 ∈ H.

Veamos que es de equivalencia. La relación es reflexiva ya que a ∼ a para


todo a ∈ G pues aa−1 = e ∈ H.
Supongamos ahora que a ∼ b. Entonces ab−1 ∈ H con lo cual existe
h ∈ H tal que h = ab−1. Luego h−1 = ba−1 y como h−1 ∈ H entonces
ba−1 ∈ H. Esto nos dice que b ∼ a y, por lo tanto, la relación es simétrica.
Finalmente veamos que es transitiva. Si a ∼ b y b ∼ c entonces ab−1 ∈ H
y bc−1 ∈ H. Luego existen h1 y h2 ∈ H tales que ab−1 = h1 y bc−1 = h2.
Entonces b = h2c con lo cual

h1 = ab−1 = a(h2c)−1 = ac−1h−1


2 ,

y ası́ vemos que h1h2 = ac−1. Esto nos dice que ac−1 ∈ H y, por lo tanto,
a ∼ c.
Notar que la relación de congruencia en Z es un caso particular de este
ejemplo pues nZ es subgrupo de Z (comprobarlo!) y decir que a ≡ b
mod n es equivalente a decir que a − b ∈ nZ.

• Sea G un grupo con elemento neutro e. Definimos en G la siguiente relación:

a ∼ b si y sólo si existe c ∈ G tal que b = c−1ac.


10
Esta relación es reflexiva pues si a ∈ G entonces a = e−1ae con lo cual a ∼ a.
También simétrica pues si a ∼ b entonces existe c ∈ G tal que b = c−1ac.
Luego cb = ac y entonces cbc−1 = a. Si hacemos d = c−1 entonces podemos
escribir a = d−1bd, con lo cual b ∼ a.
Finalmente esta relación es transitiva pues a ∼ b y b ∼ c entonces existen
h y g ∈ G tales que b = h−1ah y c = g −1bg. Luego b = gcg −1, entonces

h−1ah = b = gcg −1.

Multiplicando esta igualdad a la izquierda por g −1 y a la derecha por g nos


queda que
(g −1h−1)a(hg) = c.

Como g −1h−1 = (hg)−1 vemos que c = (hg)−1a(hg) con lo cual a ∼ c.

Volvemos a las relaciones de equivalencia en general. Recordemos que toda


relación de equivalencia en un conjunto X induce una partición de X en
clases de equivalencia.
Dado x ∈ X, su clase de equivalencia [x] es el subconjunto de X

[x] = {y ∈ X : y ∼ x}.

Hay dos propiedades fundamentales de las clases de equivalencia:

a) [x] ∩ [y] = ∅ si y sólo si x no es equivalente a y.

b) [x] = [y] si y sólo si [x] ∩ [y] 6= ∅.

Además, con las clases de equivalencia se puede formar una partición de X,

11
es decir, existe un subconjunto no vacı́o I de X tal que

1) cada par de elementos distintos de I son no equivalentes (con lo cual [x] ∩


[y] = ∅ si x e y son elementos distintos de I).

2) X = ∪x∈I [x].

• Un ejemplo importante. Cuando se considera en G la relación de equiva-


lencia inducida por un subgrupo H de G

a ∼ b si y sólo si ab−1 ∈ H,

las clases de equivalencia son de la forma [a] = Ha (los conjuntos de la forma


Ha se denominan coclases a derecha de H en G): primero recordemos que

Ha = {ha : h ∈ H}.

Sea b ∈ [a]. Entonces b ∼ a y esto significa que ba−1 = h ∈ H. Luego


b = ha ∈ Ha con lo cual [a] ⊂ Ha.
Supongamos ahora que b ∈ Ha. Entonces b = ha donde h ∈ H. Luego
ba−1 = h ∈ H con lo cual b ∼ a y esto nos dice que b ∈ [a]. Luego Ha ⊂ [a]
y ası́ vemos que [a] = Ha.

Atención: cuando escribimos Ha estamos eligiendo al elemento a ∈


G como representante de la coclase a derecha, que también puede ser
escrita como Hb si b ∈ G es tal que ab−1 ∈ H, pues esto último es
equivalente a que Ha = Hb.

12
Estamos ahora en condiciones de enunciar y demostrar el siguiente teorema
de Lagrange:

Teorema 5. Si G es un grupo finito y H es un subgrupo de G entonces


el orden de H divide al orden de G.

Demostración. Consideramos en G la relación de equivalencia

a ∼ b si y sólo si ab−1 ∈ H.

Ya sabemos que las clases de equivalencia forman una partición de G. En este


caso, al ser G finito, existen elementos a1, . . . , ak ∈ G tales que

G = [a1] ∪ [a2] ∪ · · · ∪ [ak ],

donde [ai] ∩ [aj ] = ∅ si i 6= j. Al ser [a] = Ha podemos escribir a G como


unión disjunta de coclases a derecha

G = Ha1 ∪ Ha2 ∪ · · · ∪ Hak .

Veamos ahora que |H| = |Ha| para cualquier a ∈ G. Para ver esta igualdad
de cardinales, tenemos que hallar una biyección entre los conjuntos H y Ha.
Definimos la función
f : H → Ha

como f (h) = ha. Veamos que f es inyectiva: si f (h) = f (h0) entonces


ha = h0a con lo cual (multiplicando a la derecha por a−1) nos queda que
h = h0.
13
Veamos que f es sobreyectiva: sea x ∈ Ha. Luego x = ha para algún
h ∈ H. Entonces xa−1 ∈ H y f (xa−1) = (xa−1)a = x.
Por lo tanto f es una biyección entre H y Ha y ası́ tenemos que |H| = |Ha|
para cualquier a ∈ G.
Volvemos a G. Por el Principio de la Adición tenemos que

|G| = |Ha1 ∪ Ha2 ∪ · · · ∪ Hak | = |Ha1| + |Ha2| + · · · + |Hak | = k|H|,

lo que nos dice que |H| divide a |G|.

Sean G un grupo finito y H subgrupo de G. La cantidad de coclases a


derecha de H en G se denomina ı́ndice de H en G y suele escribirse como
(G : H) (o también iG(H)). De la demostración del Teorema de Lagrange
vemos que
|G| = (G : H)|H|.

Atención: el recı́proco del Teorema de Lagrange es falso, es decir, si n


es un divisor del orden de un grupo finito G no necesariamente tiene que
existir un subgrupo de G de orden n.

14
4 Algunas consecuencias del Teorema de Lagrange

Teorema 6. Todo grupo G de orden primo es cı́clico.

Demostración. Sea e el neutro de G y sea p primo tal que |G| = p. Si H


es subgrupo de G, por Teorema de Lagrange, |H| divide a p. Luego |H| = 1
o |H| = p. Si |H| = 1 entonces H = {e}, pues e ∈ H. Por otro lado si
|H| = p entonces H = G (pues si H 6= G, al ser H ⊂ G, se tendrá que
|H| < |G| = p, una contradicción.)
Al ser p primo se tiene que p ≥ 2, luego existe un elemento a 6= e en G.
Sea H = (a), el subgrupo cı́clico de G generado por a. Como a 6= e entonces
H 6= {e}. Por lo anterior debemos tener que G = H = (a), lo que nos dice
que G es cı́clico.

Sea G un grupo finito con elemento neutro e. El mismo argumento que se


utilizó en la demostración del Lema 4 muestra que para cada a ∈ G existe un
entero positivo n tal que an = e. Esto permite la siguiente definición.
Sea G un grupo finito con elemento neutro e. El orden de un elemento
a ∈ G es el menor entero positivo n tal que an = e. El orden de un elemento
a ∈ G se denotará como o(a). Notar que o(a) = 1 si y sólo si a = e.

Teorema 7. Sea G un grupo finito. Entonces o(a) divide a |G| para todo
a ∈ G.

15
Demostración. Sea a ∈ G y sea n = o(a). Veamos que el subgrupo cı́clico
(a) generado por a tiene n elementos. Más precisamente, veamos que

(a) = {ai : i ∈ N} = {a, a2, . . . , an−1, an = e}.

Notar que los elementos del conjunto {a, a2, . . . , an−1, an = e} son todos
distintos, pues si ai = aj para i < j ≤ n, entonces aj−i = e y j − i < n
contradiciendo que n es el orden de a.
Por otro lado, si i > n entonces i = mn + r (por el algoritmo de la división
en Z) donde 0 ≤ r < n. Luego

ai = amnar = (an)mar = emar = ar .

Es decir, toda potencia ai con i > n es un elemento del conjunto

{a, a2, . . . , an−1, an = e}.

Luego (a) = {a, a2, . . . , an−1, an = e} y ası́ (a) es un subgrupo de orden


n = o(a). Por Teorema de Lagrange, o(a) divide a |G|.

Teorema 8. Sea G un grupo finito de orden n con elemento neutro e.


Entonces an = e para todo a ∈ G.

Demostración. Sea a ∈ G y sea k = o(a). Por Teorema 7 se tiene que k|n.


Luego existe m ∈ N tal que n = mk y ası́ an = amk = (ak )m = em = e.

16
Todos los resultados anteriores se pueden demostrar también con co-
clases a izquierda, es decir conjuntos de la forma aH donde H es sub-
grupo de G. En este caso el conjunto cociente G/H es el conjunto de las
coclases a izquierda y se tiene que aH = bH cuando b−1a ∈ H. En los
ejercicios de 2.4 del libro de Herstein se demuestra que, cuando G es un
grupo finito, hay tantas coclases a derecha como a izquierda, con lo cual,
por ejemplo, el ı́ndice (G : H) = |G/H| es el mismo independientemente
de qué tipo de coclases se considere.

Atención: en la versión en castellano del libro de Herstein (no ası́ en la


versión orginal en inglés), a las coclases Ha las llama coclases a izquierda
(y a las coclases aH las llama coclases a derecha). Es solo una cuestión
de nombres, pero la mayorı́a de los autores llama coclase a derecha a con-
juntos de la forma Ha.

Ejercicio (Una aplicación a la Teorı́a Elemental de Números).


Recordemos que la función ϕ de Euler cuenta la cantidad de enteros positivos
coprimos a uno dado, es decir, si n ∈ N entonces

φ(n) = |{m ∈ N : m < n y m.c.d(n, m) = 1}|.

Ası́ ϕ(1) = 1, ϕ(2) = 1, ϕ(3) = 2, etc. En particular ϕ(p) = p − 1 para todo


primo p. Un famoso teorema de Euler de la Teorı́a Elemental de Números
establece que
aϕ(n) ≡ 1 mod n,
17
para todo entero positivo a coprimo con n. En particular se obtiene el de-
nominado pequeño Teorema de Fermat: si p es un número primo entonces

ap−1 ≡ 1 mod p,

para todo entero a no divisible por p.


El propósito de este ejercicio es demostrar este resultado utilizando lo que
sabemos hasta ahora de la Teorı́a de Grupos.
Para ello, recordemos la relación de equivalencia en Z inducida por un
entero positivo n:
a ∼ b si y sólo si n|(a − b).

Esto es equivalente a decir que a ∼ b si y sólo si al dividir a y b por n se


obtiene el mismo resto (comprobarlo!). Como hay exactamente n posibles
restos y estos son 0, 1, 2, . . . , n − 1, tenemos n clases de equivalencia

[0], [1], [2], . . . , [n − 1],

los cuales forman una partición de Z. Definimos el conjunto Zn como el


conjunto de estas clases de equivalencia, es decir

Zn = {[0], [1], [2], . . . , [n − 1]}.

Definimos luego una suma y un producto en Zn:

• (adición de clases) [a] + [b] = [a + b].

• (multiplicación de clases) [a][b] = [ab].

18
Antes de continuar hay que demostrar que estas operaciones están bien defini-
das, es decir, que no dependen del representante elegido de la clase de equiv-
alencia. Por ejemplo, si c ∼ a y d ∼ b entonces [a] = [c] y [b] = [d] y ası́
tendrı́amos dos maneras de definir la suma: o bien [a+b] o bien [c+d]. Probar
la buena definición es mostrar que el resultado es el mismo sin importar el
representante que se elige. En el caso de la suma, hay que demostrar que si

[a] = [c] y [b] = [d],

entonces [a + b] = [c + d].
Supongamos entonces que [a] = [c] y [b] = [d]. Esto quiere decir que
existen enteros k y k 0 tales que kn = a − c y k 0n = b − d. Luego (k + k 0)n =
a + b − (c + d). Esto signfica que [a + b] = [c + d] y ası́ queda demostrada la
buena definición de la suma en Zn.
Demostrar ahora que el producto en Zn está bien definido. Luego demostrar
que Zn con la suma de clases en un grupo y que con el producto de clases no
lo es (considerar la clase nula [0]).
Restringiéndonos a un subconjunto de Zn, podemos definir una estructura
de grupo con el producto. Definimos

Un = {[i] ∈ Zn : m.c.d(i, n) = 1}.

En pocas palabras, Un está formado por las clases de equivalencia cuyos repre-
sentantes son coprimos con n. Nuevamente, antes de continuar, hay que
comprobar que Un está bien definido, es decir, si [i] = [j] y m.c.d(i, n) = 1

19
entonces m.c.d(j, n) = 1 (comprobarlo!).
Demostrar luego que Un con el producto de clases en un grupo de orden
ϕ(n) (al grupo (Un, ·) se lo denomina grupo de unidades de Zn).
Deducir de este resultado el Teorema de Euler mencionado al principio de
este ejercicio.

20
Grupos
1 Homomorfismos de grupos

Vimos en las clases pasadas varios ejemplos de grupos formados con elemen-
tos de distinta naturaleza: números, residuos módulo n, vectores, matrices,
funciones, etc.

Sucede a veces que, a pesar de tener dos grupos cuyos elementos son de
naturaleza muy diferente, a nivel de estructura de grupo se observa que son
similares. Nace aquı́ la necesidad de comparar diferentes grupos para poder
discernir entre aquellos que son similares entre sı́ y aquellos que no.

Formalmente, la idea de similaridad en grupos se expresa a través de la


existencia de cierta clase de funciones entre ellos.

Sean (G, ∗) y (G0, •) dos grupos y φ : G → G0 una función. Decimos que


φ es un homomorfismo de G en G0 si

φ(a ∗ b) = φ(a) • φ(b),

para todo par de elementos a, b ∈ G.

Por ejemplo, la función φ(x) = ln(x) define un homomorfismo entre los


grupos (R>0, ·) y (R, +) pues ln(xy) = ln(x) + ln(y).

Entre dos grupos G y G0 cualesquiera siempre tenemos el homomorfismo


trivial de, por ejemplo, G en G0 definido como φ(a) = e0 para todo a ∈ G,
1
donde e0 es el neutro en G0 (comprobar que tal función es efectivamente un
homomorfismo!).

Hay homomorfismos no triviales entre grupos finitos e infinitos. Por ejem-


plo, la función φ(m) = [m] define un homomorfismo entre Z y Zn (compro-
barlo!).

A partir de ahora omitiremos los sı́mbolos de la operaciones binarias


∗ y • en la definición de homomorfismo y escribiremos directamente
φ(ab) = φ(a)φ(b) (salvo en los casos en donde sea necesario aclarar las
operaciones binarias)

De acuerdo a ciertas propiedades de la función que define el homomorfismo,


tenemos distintos tipos de homomorfismos: sea φ : G → G0 un homomorfismo
de grupos. Decimos que φ es un

• monomorfismo si φ es inyectiva,

• epimorfismo si φ es sobreyectiva,

• isomorfismo si φ es biyectiva.

Cuando G = G0 decimos que φ es un endomorfismo de G y es un


automorfismo de G si φ es biyectiva.

Tenemos ahora todo listo para establecer formalmente qué significa que
dos grupos sean similares, en el sentido que son estructuralmete iguales sin
importar la naturaleza de sus elementos.

2
Dos grupos G y G0 se dicen que son isomorfos si existe un isomorfismo
de G en G0. Es usual escribir G ' G0 para decir que G y G0 son isomorfos.

Grupos isomorfos son considerados, desde el punto de vista del Algebra,


iguales. Más aún, algunos autores escriben directamente G = G0 cuando
ambos grupos son isomorfos.

La definición de grupos isomorfos es simétrica, es decir, si G ' G0 en-


tonces también G0 ' G pues si φ : G → G0 es un isomorfismo entonces la
función inversa φ−1 : G0 → G también es un isomorfismo (comprobarlo!)

Por ejemplo, los grupos (R>0, ·) y (R, +) son isomorfos pues φ(x) = ln(x)
es un homomorfismo biyectivo de R>0 en R. También podrı́amos haber con-
siderado la función inversa φ−1(x) = ex que es un isomorfismo de R en R>0.

Luego, como grupos, da lo mismo considerar a los reales positivos con


el producto que a todos los reales con la suma. Esta identificación era
clave antes de la aparición de calculadoras mecánicas y electrónicas, pues
mediante extensas tablas de logaritmos se podı́a saber el resultado de
multiplicar números relativamente grandes al sumar (que es más sencillo
que multiplicar) sus respectivos logaritmos (que son números mucho más
pequeños).

3
2 Algunas propiedades de los homomorfismos

Veremos ahora que podemos definir nuevos subgrupos asociados a homomor-


fismos de grupos. Pero primero veamos un par de propiedades básicas en el
siguiente lema.

Lema 9. Sea φ : G → G0 un homomorfismo de grupos. Entonces


1) φ(e) = e0, donde e y e0 son los neutros de G y G0 respectivamente.

2) φ(a−1) = φ(a)−1 para todo a ∈ G.

Demostración. Veamos 1). Tenemos que

φ(e) = φ(ee) = φ(e)φ(e).

Multiplicando por el inverso de φ(e) en G0 nos queda que e0 = φ(e).


Veamos 2). Sea a ∈ G. Entonces

e0 = φ(e) = φ(aa−1) = φ(a)φ(a−1).

Multiplicamos a la izquierda por φ(a)−1 (el inverso de φ(a) en G0) y obtenemos


que φ(a)−1 = φ(a−1).

Recordemos que si f : A → B es una función, la imagen de f es el


subconjunto de B definido como

f (A) = {f (a) : a ∈ A}.

4
Teorema 10. Sea φ : G → G0 un homomorfismo de grupos. Entonces la
imagen φ(G) es un subgrupo de G0.

Demostración. Tenemos que φ(G) 6= ∅ pues, por Lema 9, e0 ∈ φ(G), donde


e0 es el neutro de G. Veamos que φ(G) es cerrado por el producto en G0.
Sean x, y ∈ φ(G). Luego existen a, b ∈ G tales que x = φ(a) e y = φ(b).
Entonces
xy = φ(a)φ(b) = φ(ab),

con lo cual xy ∈ φ(G).


Finalmente, sea x ∈ φ(G). Entonces existe a ∈ G tal que x = φ(a), luego
por Lema 9
x−1 = φ(a)−1 = φ(a−1),

y ası́ vemos que x−1 ∈ φ(G).

Dado que una función f : A → B inyectiva es biyectiva de A en f (A), el


siguiente resultado es una consecuencia inmediata del Teorema 10.

Corolario. Sea φ : G → G0 un monomorfismo de grupos. Entonces


G ' φ(G).

5
3 Un teorema importante de Cayley

Utilizando lo ya visto de grupos y de homomorfismos, podemos demostrar el


siguiente teorema debido a Cayley.

Teorema 11. Para cada grupo G existe un conjunto S tal que G es


isomorfo a un subgrupo de A(S).

Demostración. Sea G un grupo y sea a ∈ G. Definimos un elemento Ta ∈


A(G) (el conjunto de todas las funciones biyectivas de G en G) de la siguiente
manera: Ta(b) = ab para todo b ∈ G (notar que Ta no es un homomorfismo).
Veamos que Ta es biyectiva. Si Ta(b) = Ta(c) entonces ab = ac luego, por
la propiedad cancelativa en G, se tiene que b = c. Es decir, Ta es inyectiva.
Veamos que Ta es sobreyectiva: sea c ∈ G. Luego a−1c ∈ G y Ta(a−1c) =
a(a−1c) = c. Por lo tanto Ta ∈ A(G) para cada a ∈ G.
Por otra parte sabemos que A(G) es un grupo con la composición de fun-
ciones. Definimos ahora una función

φ : G → A(G),

definido como φ(a) = Ta. Veamos que φ es, en realidad, un homomorfismo


de grupos: por un lado tenemos que

φ(ab) = Tab,

pero Tab(x) = (ab)x = a(bx) = Ta(Tb(x)) = (Ta ◦ Tb)(x) para todo x ∈ G,

6
es decir que
Tab = Ta ◦ Tb,

con lo cual φ(ab) = Ta ◦ Tb = φ(a) ◦ φ(b), es decir, φ es un homomorfismo de


grupos.
Luego, por Teorema 10, φ(G) es un subgrupo de A(G). Si vemos que φ es
inyectiva, entonces, por el Corolario al Teorema 10, tendremos que G ' φ(G),
que es lo que se quiere demostrar.
Supongamos entonces que φ(a) = φ(b). Luego Ta = Tb. Al evaluar ambas
funciones en e (neutro de G), tenemos que

a = ae = Ta(e) = Tb(e) = be = b,

y ası́ vemos que φ es inyectiva.

Cuando S es un conjunto finito, el grupo A(S) recibe el nombre de


grupo de permutaciones. En el caso de grupos finitos, el Teorema de
Cayley suele enunciarse ası́: todo grupo finito es isomorfo a un grupo
de permutaciones.

7
4 El núcleo de un homomorfismo

Vimos que un homomorfismo de grupos φ : G → G0 define un subgrupo φ(G)


de G0. Veremos ahora que también define un subgrupo muy importante de
G.

Sea φ : G → G0 un homomorfismo de grupos y sea e0 el neutro de G0. Se


define el núcleo de φ como

Ker φ = {a ∈ G : φ(a) = e0}.

(la abreviatura Ker viene de la palabra inglesa kernel que significa núcleo).

Por ejemplo si φ : Z → Zn es el homomorfismo definido como φ(m) = [m]


(clase residual de m módulo n) entonces

Ker φ = nZ = {nm : m ∈ Z} (comprobarlo!),

es decir, el núcleo de φ está formado por los múltiplos enteros de n. En


particular vemos que Ker φ es un subgrupo de Z. Pero esto último siempre es
el caso como lo muestra el siguiente teorema.

Teorema 12. Sea φ : G → G0 un homomorfismo de grupos. Entonces


i) Ker φ es un subgrupo de G.

ii) a−1Ker φ a ⊂ Ker φ para todo a ∈ G (es decir, los subgrupos conjugados
de Ker φ son subgrupos de Ker φ).

Demostración. Veamos i). Sea e elemento neutro de G. Tenemos que φ(e) =


8
e0 con lo cual e ∈ Ker φ y ası́ Ker φ 6= ∅.
Veamos que Ker φ es cerrado bajo el producto de G: sean a, b ∈ Ker φ.
Entonces
φ(ab) = φ(a)φ(b) = e0e0 = e0,

lo que nos dice que ab ∈ Ker φ.


Sea a ∈ Ker φ. Entonces

φ(a−1) = φ(a)−1 = (e0)−1 = e0,

y ası́ tenemos que a−1 ∈ Ker φ.


Veamos ii). Sea a ∈ G y sea x ∈ a−1Ker φ a. Luego existe b ∈ Ker φ tal
que x = a−1ba. Entonces

φ(x) = φ(a−1ba) = φ(a−1)(φ(b)φ(a)) = φ(a)−1(e0φ(a)) = φ(a)−1φ(a) = e0,

con lo cual x ∈ Ker φ. Por lo tanto

a−1Ker φ a ⊂ Ker φ.

Un aspecto importante del subgrupo Ker φ es que su tamaño determina si


el homomorfismo φ es inyectivo o no.

Teorema 13. Sea φ : G → G0 un homomorfismo de grupos. Entonces φ


es un monomorfismo si y sólo si Ker φ = {e}, donde e es el neutro de G.

Demostración. Sea e0 el neutro de G0. Supongamos que φ es inyectiva. Si


9
a ∈ Ker φ entonces φ(a) = e0 = φ(e). Luego a = e y ası́ Ker φ = {e}.
Recı́procamente supongamos que Ker φ = {e}. Si φ(a) = φ(b) entonces

φ(ab−1) = φ(a)φ(b−1) = φ(a)φ(b)−1 = e0.

Luego ab−1 ∈ Ker φ = {e} y ası́ ab−1 = e, con lo cual a = b. Esto nos dice
que φ es inyectiva.

10
5 Subgrupos normales

Vimos en ii) del Teorema 12 una propiedad muy importante del subgrupo
Ker φ: todos sus subgrupos conjugados son subgrupos de sı́ mismo. Esta
propiedad da lugar a una nueva clase de subgrupos que jugará un papel desta-
cado en la Teorı́a de Grupos.

Sea G un grupo y H un subgrupo de G. Decimos que H es un subgrupo


normal de G si
a−1Ha ⊂ H para todo a ∈ G,

es decir, todos los subgrupos conjugados de H son subgrupos de H.

Simbólicamente escribiremos H / G para expresar que H es subgrupo


normal de G.

Atención: la inclusión a−1Ha ⊂ H significa que para cada h ∈ H el


elemento a−1ha pertenece a H, es decir, existe h0 ∈ H tal que a−1ha =
h0 (y no necesariamente tiene que ser h0 = h).

Hay una relación importante entre subgrupos normales, coclases a derecha


(de la forma Ha) y coclases a izquierda (de la forma aH). El primer paso
hacia esa relación es el siguiente

Lema 14. Sea G un grupo y H un subgrupo de G. Entonces H es normal


en G si y sólo si a−1Ha = H para todo a ∈ G.

11
Demostración. Una implicación es inmediata. Supongamos entonces que H
en normal en G. Tenemos que a−1Ha ⊂ H para todo a ∈ G. Veamos que
H ⊂ a−1Ha para todo a ∈ G: sea h ∈ H. Entonces

h = (a−1a)h(a−1a) = a−1(aha−1)a.

Haciendo b = a−1 vemos que aha−1 = b−1hb = h0 ∈ H por hipótesis. Luego

h = a−1h0a ∈ a−1Ha,

con lo cual H ⊂ a−1Ha y ası́ a−1Ha = H.

Este último resultado nos da la relación entre normalidad e igualdad de


coclases a derecha e izquierda:

Teorema 15. Sea G un grupo y H un subgrupo de G. Entonces H es


normal en G si y sólo si aH = Ha para todo a ∈ G. En otras palabras
que H sea normal en G es equivalente a que toda coclase a izquierda (resp.
derecha) sea una coclase a derecha (resp. izquierda).

Demostración. Tener que a−1Ha = H para todo a ∈ G es claramente


equivalente a tener que Ha = aH para todo a ∈ G. La conclusión se sigue
del Lema 14.

12
Atención: la igualdad aH = Ha significa que para cada elemento
ah ∈ aH existe h0 ∈ H tal que ah = h0a (y recı́procamente) y no
necesariamente h0 = h.

• La parte ii) del Lema 12 nos dice que para cualquier par de grupos G y G0
y cualquier homomorfismo φ : G → G0 se tiene que Ker φ es un subgrupo
normal de G. (Más adelante veremos que la recı́proca de esta propiedad
también es válida, es decir, que todo subgrupo normal de un grupo dado es
el núcleo de algún homomorfismo de grupos).

• También el centro Z(G) es un subgrupo normal de G para cualquier grupo


G pues

aZ(G) = {ab : b ∈ Z(G)} = {ba : b ∈ Z(G)} = Z(G)a,

para todo a ∈ G.

• Si G es un grupo abeliano, todo subgrupo de G es claramente normal en G.

La recı́proca de este último ejemplo es falsa pues existen grupos no


abelianos tal que todos sus subgrupos son normales. El ejemplo más
conocido es el denominado grupo de cuaterniones de Hamilton, que
es un grupo de orden 8 y lo veremos en detalle cuando estudiemos la es-
tructura de anillo.

13
Grupos
1 Grupos cociente

Hemos visto en una clase anterior que, en el caso de Zn, se definió una adición
de clases residuales transformando Zn es un grupo.

Recordemos que las clases residuales son también clases de equivalencia en


Z definidas por la relación de equivalencia en Z inducida por el subgrupo nZ
de Z.

Este proceso se puede generalizar a las clases de equivalencia en un grupo


G definidas por la relación de equivalencia en G inducida por un subgrupo
normal H de G, en cuyo caso las clases de equivalencia son las coclases a
derecha Ha (o las coclases a izquierda aH, dependiendo si se elige ab−1 ∈ H
o b−1a ∈ H como relación de equivalencia en G).

Sea G un grupo y sea H subgrupo normal de G. Definimos el producto


de coclases a derecha simplemente como

HaHb = H(ab).

Si se trabaja con coclases a izquierda, la operación entre coclases se define


como aHbH = abH. Veremos en los ejercicios de la práctica que hay tantas
coclases a derecha como a izquierda y nada cambia si se trabaja con coclases
a derecha o a izquierda. En este curso elegimos trabajar con las coclases a
derecha.
1
Tal como hicimos en el caso de Zn, primero hay que verificar la buena
definición de este producto, es decir, que el resultado no depende del repre-
sentante que se haya elegido de la coclase: si Ha = Hc y Hb = Hd entonces,
como el neutro e de G es elemento de H, existen h ∈ H y h0 ∈ H tales que

ha = ec = c y h0b = ed = d.

Luego cd = (ha)(h0b) = h(ah0a−1)ab. Por ser H /G se tiene que ah0 ∈ aH =


Ha, con lo cual existe h00 ∈ H tal que ah0 = h00a. Entonces

cd = h(ah0a−1)ab = h(h00aa−1)ab = (hh00)ab,

con lo cual (cd)(ab)−1 = hh00 ∈ H y esto nos dice que

H(cd) = H(ab).

Por lo tanto HaHb = H(ab) = H(cd) = HcHd, es decir, el prodructo de


coclases no depende de los representantes elegidos para las coclases.
El próximo paso es poner un nombre al conjunto de todas las coclases a
derecha: sean G un grupo y H subgrupo normal de G. Definimos el conjunto
cociente G/H como el conjunto de todas las coclases de derecha de H en
G, es decir
G/H = {Ha : a ∈ G}.

Con el producto de coclases a derecha arriba definido, tenemos que el cociente


G/H es un grupo:

2
Teorema 16. Sea G un grupo con elemento neutro e y sea H subgrupo
normal de G. El conjunto cociente G/H con el producto de coclases a
derecha es un grupo. El grupo G/H de denomina grupo cociente o
también grupo factor.

Demostración. Por definición tenemos que G/H 6= ∅ y también que es


cerrado bajo el producto de coclases a derecha.
Veamos la asociatividad:

Ha(HbHc) = HaH(bc) = H(a(bc)) = H((ab)c) = H(ab)Hc = (HaHb)Hc.

Existencia de elemento neutro: la coclase He ∈ G/H es el neutro en el


cociente pues

HaHe = H(ae) = Ha = H(ea) = HeHa,

para todo a ∈ G.
Existencia de inverso: sea Ha ∈ G/H, entonces Ha−1 ∈ G/H y

HaHa−1 = H(aa−1) = He = H(a−1a) = Ha−1Ha.

En el grupo cociente G/H podemos escribir H en lugar de He pues


He = H ya que Hh = H para todo h ∈ H (comprobarlo!)

3
Vemos que Zn no es otra cosa que el grupo cociente Z/nZ con la adición
de coclases. En este caso, por ser la operación en Z la suma de enteros,
las coclases a derecha se escriben como nZ + m para m ∈ Z. En gen-
eral, cuando en un grupo G la operación binaria se representa por una
adición, las coclases a derecha suelen escribirse como H + a en lugar de
Ha

El concepto de grupo cociente es uno de los más importante en Alge-


bra. A lo largo de ese curso veremos cómo se logran deducir importantes
propiedades de un grupo G utilizando grupos cociente. Muchos otros ob-
jetos de la Matemática pueden ser representados como grupos cociente.

Por ejemplo, veremos más adelante que la circunferencia unitaria S 1 =


{z ∈ C : |z| = 1}, que es un grupo con el producto usual de números
complejos, puede ser vista como el grupo cociente R/Z considerando la
estructura de grupo en R con la adición.

Vimos que el núcleo de un homomorfismo de grupos define un subgrupo


normal. La construcción del grupo cociente proporciona el resultado recı́proco.

Teorema 17. Sea H un subgrupo normal de un grupo G. Entonces existe


un homomorfismo π : G → G/H tal que H = Ker π. Tal homomorfismo
es, en realidad, un epimorfismo que suele denominarse la proyección
natural de G en G/H.

4
Demostración. Definimos la función π : G → G/H como π(a) = Ha para
todo a ∈ G. Claramente π es un homomorfismo de grupos pues

π(ab) = H(ab) = HaHb = π(a)π(b).

También es inmediato que π es sobreyectiva, pero esta propiedad no la nece-


sitaremos en la demostración de este teorema.
Calculamos ahora Ker π. Recordemos que H es el elemento neutro del
cociente G/H. Tenemos que Ker π = {a ∈ G : π(a) = H}. Como π(a) =
Ha y e (neutro de G) está en H, de la igualdad Ha = H vemos que a =
ea ∈ Ha = H. Luego Ker π ⊂ H.
Recı́procamente, si a ∈ H entonces π(a) = Ha = H (por ser H normal
en G). Luego H ⊂ Ker π con lo cual Ker π = H. 
Si conocemos los órdenes de H y G, podemos calcular el orden del grupo
cociente G/H de manera sencilla gracias al Teorema de Lagrange, pues este
teorema nos dice que el tamaño del conjunto cociente G/H satisface la igual-
dad
|G| = |G/H| |H|,

con lo cual tenemos inmediatamente el siguiente teorema.

Teorema 18. Sea G un grupo finito y sea H un subgrupo normal de G.


Entonces G/H es un grupo de orden |G|/|H|.

5
2 Un teorema de Cauchy sobre grupos finitos

Una de las aplicaciones interesantes de los grupos cociente es que proporcionan


un argumento que merece ser estudiado en detalle, para demostrar el siguiente
caso particular de un famoso (e importante) teorema debido a Cauchy.

Teorema 19. Sea G un grupo abeliano finito y sea p un divisor primo de


|G|. Entonces existe un elemento en G de orden p.

La demostración (ver el libro de Herstein) del Teorema 19 queda como tarea


para el examen final teórico.

El Teorema de Cauchy es válido, en realidad, para cualquier grupo finito.


Es decir, si G es un grupo finito y un primo p divide al orden de G en-
tonces hay en G un elemento de orden p.

6
3 Teoremas de isomorfismo

Veremos ahora tres situaciones generales en las que podemos establecer un


isomorfismo entre grupos. Estos resultados son de tal importancia en la Teorı́a
de Grupos que se los denomina teoremas fundamentales de homomorfismos.

El siguiente teorema, denominado Primer Teorema de Isomorfismo es


de los más importantes a la hora de establecer un isomorfismo entre grupos.
Volverá a aparecer, en versiones adecuadas, cuando veamos las estructuras de
anillo y módulo.

Teorema 20. Sea φ : G → G0 un homomorfismo de grupos. Entonces


φ(G) ' G/Ker φ. En particular, G/Ker φ ' G0 si φ es un epimorfismo.

Demostración. Escribimos H = Ker φ y definimos una función φ̃ desde el


cociente G/H en G0:
φ̃(Ha) = φ(a).

Antes de continuar, tenemos que verificar que φ̃ está bien definida (es decir,
que su valor no depende del representante elegido de la coclase): si Ha = Hb
entonces, ab−1 ∈ H. Como H = Ker φ tenemos que

φ(a)φ(b)−1 = φ(a)φ(b−1) = φ(ab−1) = e0,

donde e0 es el neutro de G0. Luego φ(a) = φ(b).


Veamos ahora que φ̃ es un homomorfismo de grupos:

φ̃(HaHb) = φ̃(H(ab)) = φ(ab) = φ(a)φ(b) = φ̃(Ha)φ̃(Hb).


7
Finalmente comprobamos que φ̃ es inyectiva: si φ̃(Ha) = φ̃(Hb) entonces
φ(a) = φ(b), con lo cual φ(ab−1) = e0. Luego ab−1 ∈ H y ası́ vemos que
Ha = Hb.
Luego, por corolario del Teorema 10, φ̃ define un isomorfismo entre G/H
y φ(G) pues φ̃(G/H) = φ(G).

Notar que en la definición de φ̃ en el Primer Teorema de Isomorfismo, al


ser Ha = π(a) donde π : G → G/H es la proyección natural, vemos que

φ̃ ◦ π = φ.

• Gráficamente el Primer Teorema de Isomorfismo se puede representar con


el siguiente diagrama:
φ
G G0

π φ̃

G/Ker φ

La ecuación φ̃ ◦ π = φ suele expresarse diciendo que el diagrama de arriba


conmuta. En esta situación también se suele decir que φ se factoriza a
través de G/Ker φ como φ̃ ◦ π.

• Veamos qué es el grupo cociente R/Z considerando en R la adición: sea S 1 =


{z ∈ C : |z| = 1} la circunferencia unitaria que es un grupo con el producto
8
usual de números complejos y cuyo elemento neutro es el 1. Definimos la
función φ : R → S 1 como

φ(x) = cos(2πx) + i sen(2πx).

Utilizando las fórmulas de adición del seno y coseno, es sencillo verificar (ha-
cerlo!) que φ define un homomorfismo de grupos, es decir que φ(x + y) =
φ(x)φ(y).
Por definición, φ es sobreyectiva, con lo cual φ es un epimorfismo. Calcu-
lamos ahora Ker φ: x ∈ Ker φ si y sólo si φ(x) = 1. Por lo tanto x ∈ Ker φ
si y sólo si cos(2πx) = 1 y sen(2πx) = 0 y esto es equivalente a que x es un
entero. Luego
Ker φ = Z.

Por el Primer Teorema de Isomorfismo

S 1 ' R/Ker φ = R/Z,

y ası́ podemos decir que el grupo cociente R/Z es la circunferencia unitaria


(con el producto de números complejos).

• Una (de las tantas) aplicación interesante del Primer Teorema de Isomor-
fismo es que nos permite ver, de manera sencilla, que los grupos cı́clicos no
son otra cosa que (Z, +) o bien (Z/nZ, +) para algún n ∈ N. Para ver esto,
sea G un grupo cı́clico (de orden finito o infinito) con elemento neutro e y sea

9
a ∈ G un generador de G. Definimos

φ : Z → G,

como φ(i) = ai. Dado que G = (a) y que ai+j = aiaj , es inmediato comprobar
que φ es un epimorfismo de grupos. Por el Primer Teorema de Isomorfismo
tenemos que
G ' Z/Ker φ.

Si |G| = n, entonces o(a) = n y

Ker φ = {i ∈ Z : ai = e} = {i ∈ Z : n | i} = nZ,

con lo cual
G ' Z/Ker φ = Z/nZ.

Si |G| = ∞ entonces Ker φ = {0} (¿por qué?) y ası́

G ' Z/Ker φ. = Z/(0) ' Z.

Enunciamos a continuación los denominados Segundo Teorema y Tercer


Teorema de Isomorfismo.
Las demostraciones (ver el libro de Herstein) de ambos teoremas quedan
como tarea para el final teórico.

10
Teorema 21. Sea G un grupo y sea H un subgrupo de G. Si N es un
subgrupo normal de G entonces
1) HN = {hn : h ∈ H y n ∈ N } es subgrupo de G.

2) N es subgrupo normal de HN .

3) H ∩ N es subgrupo normal de H.

4) H/H ∩ N ' HN/N .

Teorema 22. Sea G un grupo y sean H y N subgrupos normales de G.


Si H ⊂ N entonces
1) H es subgrupo normal de N .

2) N/H es subgrupo normal de G/H.

3) (G/H)/(N/H) ' G/N .

Veamos ahora que ante la presencia de un epimorfismo de grupos φ : G →


G0, los subgrupos de G0 tienen una forma particular que se describe en el
siguiente Teorema de Correspondencia.

Teorema 23. Sea φ : G → G0 un epimorfismo de grupos. La correspon-


dencia
H 7→ φ(H),

es uno a uno entre subgrupos de G que contienen a Ker φ y subgrupos de


G0.

11
Demostración. Sea e0 el neutro de G0 y sea H un subgrupo de G que contiene
a K = Ker φ. Tenemos que la preimagen de φ(H) por φ es

φ−1(φ(H)) = {a ∈ G : φ(a) ∈ φ(H)},

con lo cual H ⊂ φ−1(φ(H)). Recı́procamente si a ∈ φ−1(φ(H)) entonces


φ(a) ∈ φ(H), con lo cual existe b ∈ H tal que φ(a) = φ(b). Luego φ(ab−1) =
e0 y ası́ ab−1 ∈ K ⊂ H. Entonces existe h ∈ H tal que ab−1 = h. Esto
implica que a = hb ∈ H y obtenemos que

φ−1(φ(H)) = H.

Supongamos ahora que la correspondencia H 7→ φ(H) no es uno a uno.


Luego existen H y H̃ subgrupos distintos de G que contienen a K tales que
φ(H) = φ(H̃). Por lo visto más arriba esto implica que

H̃ = φ−1(φ(H̃)) = φ−1(φ(H)) = H,

contradiciendo que H̃ 6= H.
Recı́procamente, sea H 0 un subgrupo de G0. Veamos que la preimagen

φ−1(H 0) = {a ∈ G : φ(a) ∈ H 0},

es un subgrupo de G que contiene a K. Sea e el neutro de G. Por definición


tenemos que e ∈ φ−1(H 0) pues φ(e) = e0.
Sean a, b ∈ φ−1(H 0). Entonces φ(ab) = φ(a)φ(b) ∈ H 0 pues φ(a), φ(b) ∈
H 0. Luego ab ∈ φ−1(H 0) y ası́ vemos que φ−1(H 0) es cerrado con el producto

12
en G.
Sea a ∈ φ−1(H 0). Luego φ(a−1) = φ(a)−1 ∈ H 0 pues φ(a) ∈ H 0. Luego
a−1 ∈ φ−1(H 0).
Por lo tanto, φ−1(H 0) es subgrupo de G y, además, K ⊂ φ−1(H 0) pues
φ(a) = e0 ∈ H 0 para todo a ∈ K.
Como φ(φ−1(H 0)) = H 0 (por ser φ sobreyectiva) todo subgrupo de G0 es
de la forma φ(H) para algún subgrupo H de G.

Dado que la proyección natural π : G → G/H es un epimorfismo cuyo


núcleo es H, tenemos la siguiente consecuencia inmediata del Teorema de
Correspondencia.

Corolario. Sean G un grupo y H subgrupo normal de G. Hay una


correspondencia biunı́voca entre los subgrupos del cociente G/H y los
subgrupos de G que contienen a H.

Notar que si φ : G → G0 es un epimorfismo de grupos y H 0 es sub-


grupo de G0 entonces, tal como vimos en la demostración del Teorema
23, tenemos que φ−1(H 0) es un subgrupo que contiene a Ker φ, con lo
cual Ker φ es subgrupo normal de φ−1(H 0) (¿por qué?). Entonces por el
Primer Teorema de Isomorfismo

φ−1(H 0)/Ker φ ' H 0.

13
Además si φ : G → G0 es un epimorfismo de grupos y H 0 es subgrupo
normal de G0 entonces φ−1(H 0) es normal en G (comprobarlo!)

14
4 La propiedad universal de los grupos cociente

Veremos en esta sección que los grupos cociente puede ser definidos de una
manera indirecta, es decir, sin explicitar sus elementos ni la operación binaria
entre ellos.

Vemos primero la siguiente propiedad universal del grupo cociente que es


la clave de esta definición alternativa de un grupo cociente.

Teorema 24. Sea φ : G → G0 un homomorfismo de grupos. Sea


H ⊂ Ker φ un subgrupo normal de G. Luego existe un único homomorfismo
φ̃ : G/H → G0 tal que φ se factoriza a través de G/H como φ̃ ◦ π, donde
π : G → G/H es la proyección natural.

Demostración. Definimos φ̃ : G/H → G0 como φ̃(Ha) = φ(a). Vemos que


φ̃ está bien definida pues si Ha = Hb entonces ab−1 ∈ H ⊂ Ker φ, con lo
cual φ(ab−1) = e0 donde e0 es neutro de G. Luego

φ̃(Ha) = φ(a) = φ(b) = φ̃(Hb).

Tal como en la prueba del Primer Teorema de Isomorfismo, vemos que φ̃ es


un homomorfismo de grupos tal que, por definición, φ̃ ◦ π = φ.
Si ψ : G/H → G0 es un homomorfismo que también cumple que ψ ◦π = φ,
entonces
ψ(Ha) = ψ(π(a)) = φ(a) = φ̃(π(a)) = φ̃(Ha),

para todo a ∈ G. Luego ψ = φ̃. 

15
Supongamos ahora que, dados un grupo G y H subgrupo normal de G

i) existen un grupo G̃ y un epimorfismo de grupos

π̃ : G → G̃,

tal que Ker π̃ = H y, además

ii) se cumple la siguiente propiedad universal: para todo grupo G0 y


todo homomorfismo de grupos φ : G → G0 tal que H ⊂ Ker φ se tiene
que existe un único homomorfismo de grupos ψ : G̃ → G0 tal que el
diagrama

φ
G G0

π̃ ψ

conmuta.

Con estas dos propiedades se tiene que

G/H ' G̃.

Para ver esto hacemos G0 = G/H y φ = π, la proyección natural de G en


G/H y vemos que se cumplen i) y ii). Luego hay un único homomorfismo

ψ : G̃ → G/H

16
tal que ψ ◦ π̃ = π.
Tenemos ası́ el diagrama conmutativo
π
G G/H

π̃ ψ

Por otro lado, gracias al Teorema 24 también tenemos el siguiente diagrama


conmutativo pues H = Ker π̃ por i):
π̃
G G̃

π
π̃˜

G/H

es decir, π̃ = π̃˜ ◦ π. Luego

π = ψ ◦ π̃ = ψ ◦ (π̃˜ ◦ π) = (ψ ◦ π̃˜ ) ◦ π.

Entonces tenemos que ψ ◦ π̃˜ = IdG/H (la función identidad en G/H) pues

(ψ ◦ π̃˜ )(Ha) = (ψ ◦ π̃˜ )(π(a)) = ((ψ ◦ π̃˜ ) ◦ π)(a) = π(a) = Ha.

También podemos decir que

π̃ = π̃˜ ◦ (ψ ◦ π̃) = (π̃˜ ◦ ψ) ◦ π̃,

17
y esto nos dice que π̃˜ ◦ ψ = IdG̃ pues si x ∈ G̃, por ser π̃ sobreyectiva, existe
a ∈ G tal que x = π̃(a) y ası́

(π̃˜ ◦ ψ)(x) = (π̃˜ ◦ ψ)(π̃(a)) = π̃(a) = x.

Por lo tanto ψ y π̃˜ son inversas una de la otra y esto implica que ambas son
isomorfismos y queda demostrada nuestra afirmación de que G/H ' G̃.

Vemos que la propiedad universal en ii) nos permite definir el grupo co-
ciente G/H sin hacer mención a las coclases ni a la operación entre ellas:
es el grupo G̃ que cumple i) y ii) anteriores.

18
Grupos
1 Acción de un grupo sobre un conjunto

Hemos visto previamente cómo el denominado grupo dihedral (formado por


rotaciones y reflexiones en el plano) actúa sobre los vértices de objetos geométricos
como un triángulo, cuadrado, etc. Sucede que este tipo de situaciones se da
en muchos otros contextos y es el principal motivo de la siguiente definición:

Sea G un grupo con elemento neutro e y sea S un conjunto no vacı́o. Una


acción de G en S es una función ϕ : G × S → S tal que

i) ϕ(ab, s) = ϕ(a, ϕ(b, s)) para todo a, b ∈ G y todo s ∈ S.

ii) ϕ(e, s) = s para todo s ∈ S.

Notar que la expresión ϕ(a, ϕ(b, s)) en el item i) es coherente pues


ϕ(b, s) ∈ S.

Es usual escribir a · s en lugar de ϕ(a, s). Con esta notación las condi-
ciones de acción de G sobre S se escriben como
i) (ab) · s = a · (b · s)) para todo a, b ∈ G y todo s ∈ S.

ii) e · s = s para todo s ∈ S.

• Todo subgrupo H de un grupo G actúa sobre G por conjugación, es decir

h · g = hgh−1,
1
para todo h ∈ H y par todo g ∈ G. Es sencillo verificar que tenemos una
acción de H sobre G:

(h1h2) · g = (h1h2)g(h1h2)−1 = h1(h2gh−1


2 )h1 = h1 · (h2 · g),
−1

y claramente e · g = g. ¿Qué ocurre si escribimos h · g = h−1gh? ¿Es una


acción de H sobre G?

Recordemos que una permutación de un conjunto S es un elemento del


grupo A(S). Veamos ahora que una acción de un grupo G sobre un conjunto
S induce una permutación de S.

Teorema 25. Sea G un grupo actuando en un conjunto no vacı́o S. Para


cada a ∈ G definimos una función

σa : S → S,

donde σa(s) = a · s para todo s ∈ S. Entonces σa ∈ A(S). Además la


función
φ : G → A(S),

definida como φ(a) = σa es un homomorfismo de grupos.

Recı́procamente, si ϕ : G → A(S) es un homomorfismo de grupos entonces


ϕ induce una acción de G sobre S de la siguiente manera: para todo a ∈ G
y s ∈ S se define
a · s = ϕ(a)(s).

2
(Notar que ϕ(a) es un elemento de A(S) y, por lo tanto, ϕ(a) es una
función de S en S para cada a ∈ G).

Demostración. Sea e el neutro de G. Veamos que σa es biyectiva: si σa(s) =


σa(s0) entonces a · s = a · s0. Luego

s = e · s = (a−1a) · s = a−1 · (a · s) = a−1(a · s0) = (a−1a) · s0 = e · s0 = s0,

con lo cual σa es inyectiva. Sea s ∈ S, entonces a−1 · s ∈ S y, por lo tanto

σa(a−1 · s) = a · (a−1 · s) = (aa−1) · s = e · s = s.

Luego σa es sobreyectiva y ası́ tenemos que σa ∈ A(S) para todo a ∈ G.


Veamos ahora que φ es un homomorfismo de grupos: tenemos que

φ(ab) = σab,

pero

σab(s) = (ab) · s = a · (b · s) = a · σb(s) = σa(σb(s)) = (σa ◦ σb)(s).

Luego σab = σa ◦ σb, lo que implica que

φ(ab) = φ(a) ◦ φ(b).

Recı́procamente, sea ϕ : G → A(S) un homomorfismo de grupos. Veamos


que la asignación a · s = ϕ(a)(s) define una acción de G sobre S. Por ser ϕ
un homomorfismo de grupos ϕ(e) = IS , la función identidad de S (es decir

3
IS (s) = s para todo s ∈ S). Luego

e · s = ϕ(e)(s) = IS (s) = s,

para todo s ∈ S.
Finalmente

(ab)·s = ϕ(ab)(s) = (ϕ(a)◦ϕ(b))(s) = ϕ(a)(ϕ(b)(s)) = ϕ(a)(b·s) = a·(b·s).

4
2 Órbitas y grupos de isotropı́a

Sea G un grupo que actúa sobre un conjunto no vacı́o S. Recordemos el


ejemplo de las rotaciones y reflexiones que dejan invariante a un cuadrado en
el plano o alguna otra figura. En ciertas aplicaciones interesa ver, por ejemplo,
al elegir un vértice, cuáles son todos los vértices a donde va a parar el vértice
elegido mediante las rotaciones y reflexiones que forman un grupo. En el caso
de un cuadrado, si tenemos en cuenta la numeración de los vértices como en
la Introducción, partiendo del vértice 1 y con una rotación antihoraria de π
radianes, el vértice 1 recorre las posiciones de los vértices del conjunto {1, 3}.
Decimos entonces que el conjunto {1, 3} es la órbita del vértice 1 bajo la
acción del grupo cı́clico G generado por la rotación antihoraria de π radianes.
Este tipo de situaciones motiva la siguiente definición.

Sea G un grupo que actúa sobre un conjunto S no vacı́o y sea s ∈ S. La


órbita de s se define como

Os = {a · s : a ∈ G}.

• Una propiedad importante de la órbitas es que ellas definen una relación


de equivalencia en S (o, equivalentemente, una partición de S): se define la
relación en S
s ∼ s0 si y sólo si s0 ∈ Os.

En otras palabras s ∼ s0 si y sólo si existe a ∈ G tal que s0 = a · s. Veamos


que esta relación es de equivalencia: tenemos que s ∼ s para todo s ∈ S pues

5
e · s = s donde e es el neutro de G. Supongamos que s ∼ s0, entonces existe
a ∈ G tal que s0 = a · s. Luego a−1 · s0 = s con lo cual s0 ∼ s. Finalmente si
s ∼ s0 y s0 ∼ s00 entonces existen a, b ∈ G tales que s0 = a · s y s00 = b · s0.
Luego (ba) · s = b · (a · s) = b · s0 = s00 con lo cual s ∼ s00.

Esto nos dice que, dadas dos órbitas Os y Os0 , se tiene que

Os = Os0 ,

o, en caso contrario
Os ∩ Os0 = ∅.

Ası́ como interesa conocer todas las posiciones que visita un vértice de una
figura bajo la acción de rotaciones y reflexiones, también interesa saber qué
rotaciones y reflexiones dejan fijo a un vértice dado de la figura. Esta situación
motiva la siguiente definición.

Sea G un grupo que actúa sobre un conjunto no vacı́o S y sea s ∈ S. El


grupo de isotropı́a de s (o también el estabilizador de s en G) es el
conjunto
Gs = {a ∈ G : a · s = s}.

Antes de seguir, tenemos que justificar el nombre de grupo de isotropı́a que


se le da al conjunto Gs.

6
Teorema 26. Sea G un grupo que actúa sobre un conjunto no vacı́o S y
sea s ∈ S. Entonces el conjunto

Gs = {a ∈ G : a · s = s},

es un subgrupo de G.

Demostración. Sea e el neutro de G. Entonces e ∈ Gs con lo cual Gs 6= ∅.


Sean a y b ∈ Gs. Entonces

(ab) · s = a · (b · s) = a · s = s,

con lo cual ab ∈ Gs. Finalmente si a ∈ Gs entonces a · s = s. Luego

a−1 · s = a−1 · (a · s) = s,

con lo cual a−1 ∈ Gs.


Cuando G es un grupo finito hay una importante relación entre los cardi-
nales de una órbita Os y del estabilizador Gs. Recordemos que, en el caso
de coclases a izquierda con respecto a un subgrupo H de G, se tiene que
aH = bH cuando b−1a ∈ H y que el cardinal del cociente G/H (como con-
junto de coclases a izquierda) es el ı́ndice (G : H) = |G|/|H| que se obtuvo
trabajando con coclases a derecha (ver los ejercicios 5 y 11 de 2.4 del libro de
Herstein y recordar que lo que aquı́ llamamos coclase a derecha, en el libro de
Herstein en castellano se llama coclase a izquierda (una aparente atribución

7
que se tomó el traductor.))

Teorema 27. Sea G un grupo que actúa sobre un conjunto no vacı́o S y


sea s ∈ S. Entonces
|G| = |Os||Gs|.

(Aunque Os no es un grupo, igual utilizamos la notación |Os| para denotar


su cardinal.)

Demostración. Consideremos el conjunto cociente G/Gs formado por las


coclases a izquierda aGs con a ∈ G.
Definimos una función
f : Os → G/Gs,

como f (a · s) = aGs. Veamos primero que f está bien definida: si a · s = b · s


entonces (b−1a) · s = s con lo cual b−1a ∈ Gs. Pero esto nos dice que
aGs = bGs.
Veamos que f es biyectiva: por definición f es sobreyectiva. Ahora si
f (a · s) = f (b · s) entonces aGs = bGs. Luego b−1a ∈ Gs y ası́ (b−1a) · s = s
con lo cual a · s = b · s. Por lo tanto f es inyectiva.
Al ser f biyectiva tenemos que

|Os| = |G/Gs| = |G|/|Gs|.

8
3 La ecuación de clases

Cuando G es un grupo que actúa sobre un conjunto no vacı́o S, sabemos que


S se puede particionar en órbitas definidas por la acción de G sobre S. Esto es
la clave de la siguiente ecuación de clases que tiene muchas e importantes
consecuencias.

Teorema 28. Sea G un grupo finito y supongamos que G actúa sobre sı́
mismo por conjugación, es decir tenemos la acción de G sobre G definida
como
a · g = aga−1,

para todo a, g ∈ G. Luego existen g1, . . . , gk ∈ G tales que


k
|G| = |Z(G)| + |Ogi |.
X

i=1

(Las órbitas Og generadas por la acción a · g = aga−1 de un grupo G en sı́


mismo suelen denominarse clases de conjugación y es por ello que a estas
órbitas las denotaremos como Cg .)

Demostración. Dado que G es finito, la acción de G sobre G induce un


partición de G en un número finito de órbitas. Luego existen g1, . . . , gn ∈ G
tales que
G = ∪ni=1Cgi ,

donde Cgi ∩ Cgj = ∅ si i 6= j. Notemos que hay órbitas unitarias (es decir, con

9
un solo elemento) pues si g ∈ Z(G) entonces

Cg = {a · g : a ∈ G} = {aga−1 : a ∈ G} = {g}.

Recı́procamente si |Cg | = 1 entonces Cg = {g}. Esto implica que a · g = g


para todo a ∈ G, es decir que aga−1 = g para todo a ∈ G. Luego g ∈ Z(G)
y vemos ası́ que
|Cg | = 1 si y sólo si g ∈ Z(G).

Supongamos (re-etiquentando si es necesario) que Z(G) = {gk+1, . . . , gn}


(notar que las órbitas con los elementos de Z(G) tienen que estar en el con-
junto {g1, . . . , gn}). Luego, al tener una unión disjunta de conjuntos, por el
Principio de la Adición vemos que
k n k
|G| = |Cgi | + |Cgi | = |Cgi | + |Z(G)|.
X X X

i=1 i=k+1 i=1

10
4 Algunos teoremas clásicos sobre grupos finitos

Veamos ahora algunas de las consecuencias de esta ecuación de clases. Una


de las que merecen ser mencionadas es el Teorema de Cauchy en su forma
general (lo enunciamos en una clase anterior para grupos abelianos):

Teorema 29. Sea G un grupo finito y sea p un divisor primo de |G|.


Entonces existe un elemento de G de orden p.

La demostración se puede ver en el libro de Farinati-Solotar y queda como


tarea para el final teórico.

Por supuesto, hay demostraciones del Teorema de Cauchy en donde no se


hace uso de la ecuación de clases.

Veamos ahora una clase especial de grupos en donde la ecuación de clases


tiene mucho para decir: sea p un número primo. Un grupo G se dice que es
un p-grupo si el orden de cada elemento de G es un potencia de p, es decir,
para cada a ∈ G existe un entero positivo na tal que o(a) = pna . Por ejemplo,
todo grupo G de orden pn es un p-grupo, pues el orden de un elemento divide
al orden del grupo.
Demostramos a continuación tres resultados clásicos sobre p-grupos finitos.

Teorema 30. Sea G un p-grupo finito. Entonces |Z(G)| ≥ p. En


particular Z(G) 6= {e}.

11
Demostración. Por ser G un grupo finito, vimos en el teorema anterior que
existen elementos g1, . . . , gn ∈ G tales que
k
|G| = |Z(G)| + |Cgi |.
X

i=1

donde |Cgi | > 1 para i = 1, . . . , k. Tambien vimos que

|Cg | = 1 si y sólo si g ∈ Z(G),

con lo cual {e} = Ce (donde e es el neutro de G) y, por lo tanto, e ∈


/ Cgi para
i = 1, . . . , k, pues cada una de estas clases de conjugación tiene más de un
elemento y son disjuntas dos a dos. Luego, por Teorema 27, tenemos que

|Cgi | divide al orden de G,

/ Cgi en realidad
para cada 1 ≤ i ≤ k. Luego |Cgi | ≤ |G|, pero como e ∈
tenemos que
1 < |Cgi | < |G|,

para cada 1 ≤ i ≤ k.
Por otro lado |G| = pm para algún entero positivo m. Por lo tanto, por
Teorema 27 y la desigualdad anterior

|Cgi | = pni ,

para cada 1 ≤ i ≤ k donde cada 1 ≤ ni < m. Usando esto en la ecuación de


clases tenemos que
k
p = |Z(G)| +
m
p ni ,
X

i=1

12
con lo cual p divide a |Z(G)| y ası́ |Z(G)| ≥ p.

Teorema 31. Sea p un número primo. Todo grupo de orden p2 es


abeliano.

Demostración. Sea G un grupo de order p2 con elemento neutro e. El teorema


anterior nos dice que |Z(G)| ≥ p y, como |Z(G)| es un divisor de p2 por ser
Z(G) subgrupo de G, debemos tener que |Z(G)| = p o que |Z(G)| = p2.
Si |Z(G)| = p, entonces Z(G) 6= G y ası́ vemos que existe g ∈ G tal que
/ Z(G). Por otro lado, si a ∈ Z(G) entonces ag = ga, con lo cual a ∈ Gg ,
g∈
es decir Z(G) ⊂ Gg . Como Z(G) 6= Gg (pues g ∈ Gg con la acción por
conjugación) entonces |Gg | > p y, como por Teorema 27 tenemos que |Gg | es
un divisor de p2, debe ocurrir que |Gg | = p2 y ası́ Gg = G. Pero esto nos dice
que |Cg | = 1 con lo cual g ∈ Z(G), contradiciendo la elección del elemento g.
Por lo tanto |Z(G)| = p2 y esto implica que G = Z(G), es decir, G es
abeliano.

Teorema 32. Sea G un p-grupo de orden pn. Entonces existe un subgrupo


normal de G de orden pn−1.

Demostración. Sea e el neutro de G. Procedemos por inducción sobre n. Si


n = 1 entonces n − 1 = 0 y el subgrupo trivial {e} es normal en G y de orden
1 = p0 .
13
Supongamos que el teorema es válido para todo p-grupo de orden pn. Sea
G un p-grupo de orden pn+1. Sabemos que Z(G) es subgrupo de G y, por
lo tanto, es un p-grupo finito. Por Teorema de Cauchy, existe a ∈ Z(G) de
orden p. Luego, por ser a elemento del centro de G, el subgrupo (a) es normal
en G y es de orden p. Por lo tanto el grupo cociente es un p-grupo de orden
pn pues
|G/(a)| = |G|/|(a)| = pn+1/p = pn.

Por hipótesis inductiva existe un subgrupo normal H 0 del cociente G/(a) de


orden pn−1. Usando el Teorema de Correspondencia con la proyección natural

π : G → G/(a),

tenemos que existe (y es único, pero esta propiedad no la necesitamos) un


subgrupo H de G tal que (a) = ker π ⊂ H y H 0 = π(H) = H/(a). También
sabemos (ver las observaciones posteriores al Teorema de Correspondencia)
que π −1(H 0) es subgrupo normal de G. Pero, tal como vimos en la de-
mostración del Teorema de Correspondencia, tenemos que

π −1(H 0) = π −1(π(H)) = H,

con lo cual H es subgrupo normal de G y su orden es pn pues

pn−1 = |H 0| = |H|/|(a)| = |H|/p.

14
En la demostración del Teorema 32 se exhibe una técnica para tener
en cuenta: se pasa de un grupo G a un grupo cociente G/H en donde
vale una cierta propiedad y se deduce tal propiedad en G utilizando la
proyección natural.

Finalizamos esta clase enunciando un famoso teorema debido a Sylow, que


se denomina Primer Teorema de Sylow.

Teorema 33. Sea p un número primo y sea G un grupo de orden pnm


donde m.c.d(m, p) = 1. Entonces existe un subgrupo de G de orden pn.

La demostración (ver el libro de Herstein) de este importante teorema queda


como tarea para el final teórico.

Si G es un grupo de orden pnm donde p no divide a m, los subgrupos de


G de orden pn se denominan p-subgrupos de Sylow de G.
Ası́ como hay un Primer Teorema de Sylow, hay un Segundo Teorema
de Sylow y un Tercer Teorema de Sylow: bajo las hipótesis del Primer
Teorema de Sylow
• el segundo establece que si H1 y H2 son p-subgrupos de Sylow de G
entonces son conjugados, es decir, existe a ∈ G tal que

H2 = a−1H1a.

• El tercero establece que si N es el número de p-subgrupos de Sylow


de G entonces N ≡ 1 mod p y, además, N |m.

15
Grupos
1 Producto directo de grupos

Hemos visto en los ejercicios de la Práctica 1 que a partir de dos grupos (G1, ∗)
y (G2, •) podemos formar un nuevo grupo con el producto cartesiano G1 ×G2,
definiendo una operación binaria ⊗ entre pares ordenados como

(a1, b1) ⊗ (a2, b2) = (a1 ∗ a2, b1 • b2).

Este procedimiento se puede generalizar fácilmente a un producto cartesiano


de n grupos. Más allá de lograr fabricar nuevos grupos a partir de otros, hay
un interés en este tipo de construcciones pues, a veces, dado un grupo G se
encuentran otros grupos G1, . . . , Gn, cuyas estructuras de grupos son bien
conocidas o han sido estudiadas con más detalle, tales que

G ' G1 × G2 × · · · × Gn.

Al contar con este isomorfismo, se pueden deducir propiedades de G anali-


zando estas propiedades en cada Gi donde es, a priori, más sencillo de realizar
que en G. Uno de los casos más representativos de esta situación es la de
los grupos abelianos finitos, pues se demuestra que todo grupo abeliano
finito es isomorfo a un producto de grupos Zn (un caso particular del denomi-
nado Teorema fundamental de los grupos abelianos finitamente
generados) y, ciertamente, la estructura de estos grupos Zn es bien sencilla.

1
Cuando un grupo G se puede expresar de la forma G1 × G2 × · · · × Gn,
diremos que G es producto directo externo de los grupos Gi.

De ahora en adelante omitiremos las operaciones binarias correspondientes


a cada grupo. Por ejemplo, en el caso de G1 × G2 al producto de dos pares
ordenados lo escribiremos

(a1, b1)(a2, b2) = (a1a2, b1b2).

Por otra parte hemos visto en la Práctica 2 que también hay un producto
de subgrupos H1 y H2 de un grupo G

H1H2 = {ab : a ∈ H1, b ∈ H2},

y se demostró que si H1 es subgrupo normal de G entonces el producto H1H2


es un subgrupo de G.

Es natural preguntarse si hay alguna relación entre los grupos

H1H2 y H1 × H2 .

Vamos a ver que, bajo ciertas condiciones, H1H2 ' H1 × H2.

A partir de ahora consideraremos el caso de un producto directo de dos


grupos. Las demostraciones para el caso de un producto directo de n gru-
pos son similares y se dejan como ejercicio.

2
Teorema 34. Sean G1 y G2 grupos y sea G = G1 × G2 el grupo producto
directo de G1 y G2. Entonces
1) si G1 y G2 son finitos, entonces G es finito y, además, |G| = |G1||G2|.

2) Si a ∈ G1 y b ∈ G2 son elementos de orden finito, el orden de (a, b) ∈ G


es m.c.m{o(a), o(b)}.

3) Existe un subgrupo normal G̃i de G tal que G̃i ' Gi para i = 1, 2.

4) Para cada x ∈ G existen únicos xi ∈ G̃i (i = 1, 2) tales que

x = x1 x2 .

5) Si x1 ∈ G̃1 y x2 ∈ G̃2 entonces x1x2 = x2x1.

Demostración. La parte 1) es consecuencia directa del Principio de Multi-


plicación para conjuntos finitos. Veamos 2). Sea m = m.c.m{o(a), o(b)}.
Entonces existen enteros s y t tales que m = o(a)s = o(b)t. Luego, si ei es el
neutro de Gi, tenemos que

(a, b)m = (am, bm) = (es1, et2) = (e1, e2),

con lo cual (a, b) es orden finito. Sea n = o(a, b), luego n | m y ası́ n ≤ m.
Pero
an = e1 y bn = e2,

con lo cual o(a) | n y o(b) | n. Esto nos dice, por ser m el menor múltiplo de
o(a) y o(b), que n = m.

3
Veamos ahora 3). Definimos los conjuntos

G̃1 = {(a, e2) : a ∈ G1} y G̃2 = {(e1, b) : b ∈ G2},

y las funciones φi : G → Gi para i = 1, 2 como φ1(a, b) = a y φ2(a, b) = b


respectivamente. Vemos que φ1 es un homomorfismo de grupos pues

φ1((a, b)(c, d)) = φ1((ac, bd)) = ac = φ1(a, b)φ1(c, d).

Luego

Ker φ1 = {(a, b) ∈ G : φ1(a, b) = e1} = {(a, b) ∈ G : a = e1} = G̃2,

con lo cual G̃2 es subgrupo normal de G. El mismo argumento muestra que


G̃1 = Ker φ2 con lo cual G̃1 también es subgrupo normal de G.
Las funciones ϕi : G̃i → Gi para i = 1, 2 definidas como ϕ1(a, e2) = a
y ϕ2(e1, b) = b respectivamente, son claramente isomorfismos y ası́ G̃i ' Gi
para i = 1, 2.
Finalmente vemos que 4) y 5) son inmediatos por la forma que tienen los
elementos de G̃1 y G̃2 (comprobarlo!).

Lo visto en 4) del teorema anterior es una buena motivación para la siguiente


definición.

Sea G un grupo y sean H1, . . . , Hn subgrupos normales de G. Decimos


que G es producto directo interno de H1, . . . , Hn si para cada x ∈ G

4
existen únicos xi ∈ Hi para i = 1, . . . , n tales que x = x1x2 · · · xn.

Por ejemplo, si G = G1 × G2, el Teorma 34 muestra que G es también


producto directo interno de los subgrupos normales G̃1 y G̃2 de G, para los
cuales se cumple, además, que

G̃1G̃2 = G1 × G2.

Vamos a ir ahora en dirección opuesta, es decir, buscamos condiciones que


garanticen que un producto directo interno sea isomorfo a un producto directo
externo.

Lema 35. Sea G un grupo con elemento neutro e y sean H y K subgrupos


normales de G. Si H ∩ K = {e} entonces

ab = ba,

para todo a ∈ H y b ∈ K. Además si G = HK, entonces G es producto


directo interno de H y K.

Demostración. Sea x = (ab)(a−1b−1) donde a ∈ H y b ∈ K. Asociando


vemos que x = (aba−1)b−1. Como K es normal en G tenemos que aba−1 ∈ K
y como b−1 ∈ K, concluimos que x ∈ K. Asociamos ahora de esta manera:
x = a(ba−1b−1). Vemos que ba−1b−1 ∈ H por ser H normal en G y a−1 ∈ H.
Como a ∈ H concluimos que x ∈ H. Luego x ∈ H ∩ K = {e}, con lo cual
e = (ab)(a−1b−1 = (ab)(ba)−1 y ası́ ab = ba.
5
Asumimos ahora que G = HK y sea x ∈ G. Luego x = ab para a ∈ H
y b ∈ K. Veamos que esta expresión es única: si c ∈ H y d ∈ K son tales
x = cd, luego ab = cd y ası́ c−1a = db−1. Entonces c−1a ∈ H ∩ K y también
db−1 ∈ H ∩ K. Como H ∩ K = {e} vemos que a = c y b = d y, por lo
tanto, cada elemento de G se escribe de manera única como producto de un
elemento de H y otro de K. 

Teorema 36. Sean H y K dos subgrupos normales de un grupo G tales


que H ∩ K = {e}, donde e es el neutro de G. Entonces

HK ' H × K.

Demostración. Definimos la función φ : HK → H ×K como φ(ab) = (a, b).


Notar que φ está bien definida, ya que por Lema 35 la expresión ab con a ∈ H
y b ∈ K define un único elemento de HK.
Veamos que φ es un homomorfismo de grupos: por Lema 35 tenemos que
si ab y cd son dos elmentos de HK entonces

(ab)(cd) = a(bc)d = a(cb)d = (ac)(bd),

y, por la unicidad de la expresión en HK, el elemento (ac)(bd) es el único


elemento de HK que representa a (ab)(cd). Luego

φ((ab)(cd)) = φ((ac)(bd)) = (ac, bd) = (a, b)(c, d) = φ(ab)φ(cd).

Finalmente, φ es sobreyectiva por definición. Por otra parte, como el neutro


6
de H × K es (e, e), entonces

Ker φ = {ab ∈ HK : (a, b) = (e, e)} = {e},

con lo cual φ es inyectiva y ası́ vemos que φ es un isomorfismo entre HK y


H × K.

Los teoremas 34 y 36 muestran que la distinción entre producto directo


interno y externo es, básicamente, una cuestión notacional.

7
2 El Teorema fundamental de los grupos abelianos finitamente
generados

Vimos lo que significa que un grupo G sea cı́clico: existe a ∈ G tal que
G = (a) y decimos que G es generado por a. Podemos generalizar esta
noción tomando un conjunto no vacı́o S ⊂ G (finito o infinito) y considerar el
conjunto (S) de todos los posibles productos (repetidos o no) con elementos
de S y sus inversos, es decir

i
(S) = {ai11 ai22 · · · akk : k ∈ Z , cada ai ∈ S y cada ij = ±1}.

Es sencillo ver que (S) es un subgrupo de G (comprobarlo!). Se dice que un


grupo G es finitamente generado si existe un conjunto finito S ⊂ G tal
que G = (S).

• Si S = {a}, tenemos que (S) = (a), el subgrupo cı́clico generado por a ∈ G.


Por lo tanto todo grupo cı́clico es finitamente generado.

• Todo grupo finito G es finitamente generado, pues se toma S = G. La


recı́proca es falsa pues (Z, +) es finitamente generado (es cı́clico) pero no es
finito.

• No es difı́cil ver que si S ⊂ G entonces el conjunto

hSi = ∩{H : H es subgrupo de G y S ⊂ H},

no solamente es un subgrupo de G sino que es, además, el menor (en el


sentido de la inclusión) subgrupo de G que contiene a S (comprobarlo!).

8
Además, si S ⊂ G es finito entonces hSi = (S) (Obviamente, comprobarlo!).

Enunciaremos (sin demostración) a continuación un importante resultado


sobre grupos abelianos finitamente generados. Este resultado establece que la
estructura de cualquier grupo abeliano finitamente generado es un producto
directo de grupos que son bien conocidos: los grupos Z y Zn. Utilizamos la
notación Zr para denotar el producto de r factores Z × · · · × Z.

Teorema 37. Sea G un grupo abeliano finitamente generado. Entonces


existen únicos enteros no negativos r, n1, . . . , nk tales que

G ' Zr × Zn1 × Zn2 × · · · × Znk ,

donde ni ≥ 2 para i = 1, . . . , k y ni+1 | ni para i = 1, . . . , k − 1.

El entero r del Teorema 37 se denomina rango o número de Betti de


G, mientras que los enteros n1, . . . , nk se denominan factores invarian-
tes de G.

Si G es abeliano y finito el factor Zr no aparece y se tiene directamente


que
G ' Zn1 × Zn2 × · · · × Znk ,

donde ni ≥ 2 para i = 1, . . . , k y ni+1 | ni para i = 1, . . . , k − 1. En este


caso decimos que G es de rango cero.

9
Este resultado nos permite, por ejemplo, calcular la cantidad de grupos
abelianos finitos de un orden dado, pues si G es abeliano finito de orden n,
entonces
k
n = |G| = |Zn1 × Zn2 × · · · × Znk | = ni.
Y

i=1

Antes de continuar para ver cómo se lleva a cabo tal cálculo, podemos ver el
caso particular n = pm donde p es primo: cada ni tiene que ser de la forma
pri y ası́ la ecuación anterior queda
k
m
p = pri = pr1+···+rk ,
Y

i=1

con lo cual m = r1 + · · · + rk , es decir, se tiene una partición de m. Luego la


cantidad de posibles productos que se pueden lograr para obtener un grupo
abeliano finito de orden pm coincide con el número de particiones que hay de
m. Por ejemplo las particiones de m = 3 son

3 = 3 + 0, 3 = 2 + 1, 3 = 1 + 1 + 1.

Por lo tanto, lo grupos

Zp3 , Zp2 × Zp, Zp × Zp × Zp,

son todos los posibles grupos abelianos finitos de orden p3.


El siguente resultado es clave para llevar a cabo este cálculo en la situación
general.

Lema 38. Zmn ' Zm × Zn si y sólo si m.c.d.(m, n) = 1.

10
Demostración. Supongamos que m y n son coprimos. Dado x ∈ Z escribimos
como [x] a la clase de x en Zmn y como [x]m (resp. [x]n) a la clase de x
en Zm (resp. Zn). Teniendo en cuenta esta notación, definimos la función
φ : Zmn → Zm × Zn como

φ([x]) = ([x]m, [x]n).

Recordemos, antes de seguir, que estos conjuntos Zn son grupos con respecto
a la adición de clases, con lo cual escribir [x]k significa sumar esta clase k
veces, es decir se tiene que [x]k es k[x] y esto es lo mismo que [kx].
Veamos que φ está bien definida: si [x] = [y] en Zmn entonces x ≡ y
mod mn, luego existe k ∈ Z tal que x = y + kmn y ası́

[x]m = [y + kmn]m = [y]m + [kmn]m = [y]m + [0]m = [y]m.

El mismo argumento muestra que [x]n = [y]n. Claramente φ es un homomor-


fismo de grupos.
Veamos que φ es biyectiva: por un lado tenemos que

Ker φ = {[x] ∈ Zmn : ([x]m, [x]n) = ([0]m, [0]n)}.

Pero [x]m = [0]m y [x]n = [0]n si y sólo si existen enteros a y b tales que
x = am y x = bn. Luego am = bn y esto nos dice que n | am. Por ser m y
n coprimos, debemos tener que n | a. Entonces x = am = kmn, con lo cual
[x] = [kmn] = [0] en Zmn. Por lo tanto

Ker φ = {[0]},

11
lo que nos dice que φ es inyectiva. Consideremos ahora ([x]m, [y]n) ∈ Zm ×Zn.
Por ser m y n coprimos, el Teorema Chino del Resto de la Teorı́a Elemental
de Números nos dice que existe un entero z tal que

z≡x mod m y z ≡ y mod n.

Luego existen enteros a y b tales que z = x + am y z = y + bn y ası́ vemos


que
φ([z]) = ([z]m, [z]n) = ([x + am]m, [y + bn]n) = ([x]m, [y]n),

con lo cual φ es sobreyectiva. Por lo tanto

Zmn ' Zm × Zn.

Recı́procamente, supongamos que Zmn ' Zm × Zn. Si m y n no fuesen


coprimos entonces m.c.m(m, n) = d < mn pues recordemos que

mn
m.c.m(m, n) = .
m.c.d(m, n)

Sea ([x]m, [y]n) ∈ Zm × Zn. Luego, por ser d múltiplo de m y también de n,


vemos que

([x]m, [y]n)d = (d[x]m, d[y]n) = ([dx]m, [dy]n) = ([0]m, [0]n).

Por ser Zmn isomorfo a Zm × Zn, para todo elemento [x] ∈ Zmn se debe tener
también que
[0] = [x]d = [dx].

Pero, por ejemplo, [1] 6= [0] en Zmn y por lo anterior debemos tener que
12
[d] = [1]d = [0] en Zmn. Luego mn | d, lo cual es imposible por ser d < mn.
Por lo tanto, m y n tienen que ser coprimos si Zmn ' Zm × Zn.

El siguiente resultado es consecuencia directa del Lema 38 y el Principio de
Inducción y queda como ejercicio.

Corolario. Zn ' Zpk1 × Zpk2 × · · · × Zpkmm donde


1 2

m
n= pki i ,
Y

i=1

es la factorización de n en sus factores primos. En otras palabras, cada Zn es


producto directo de sus p-subgrupos de Sylow donde p es factor primo de n.

Con todo esto se puede demostrar la siguiente versión del Teorema funda-
mental de los grupos abelianos finitamente generados para el caso de grupos
abelianos finitos:

Teorema 38. Sea G un grupo abeliano finito de orden n > 1 y consideremos


Qm ki
la factorizacón de n en factores primos n = i=1 pi con p1 > p2 > · · · > pm.
Entonces existen únicos pi-grupos Hi para i = 1, . . . , m tales que
1) G ' H1 × · · · × Hm y |Hi| = pki i para i = 1, . . . , m.

2) Para cada H ∈ {H1, . . . , Hm} si |H| = ps entonces

H ' Zps1 × Zps2 × · · · × Zpsj ,

donde s1 + s2 + · · · + sj = s y s1 ≥ s2 ≥ · · · ≥ sj .

13
Por ejemplo, veamos que hay (salvo isomorfismos) dos grupos abelianos de
orden 20. Tenemos que 20 = 5 · 22, luego por la parte 1) del Teorema 38,
existen dos grupos cı́clicos H1 de orden 5 y H1 de orden 4 tales que

G ' H1 × H2 .

Por la parte 2) del Teorema 38 tenemos que

H2 ' Z4 o H2 ' Z2 × Z2,

pues las particiones de 2 son 2 = 2 y 2 = 1 + 1, mientras que H1 ' Z5. Luego

G ' Z5 × Z4 o G ' Z5 × Z2 × Z2.

Vemos que en este tipo de cálculo aparece repetidamente la frase salvo iso-
morfismos. Esto se debe a que uno puede elegir el orden de aparición de
los factores Zn que intervienen, pero cualquier elección produce un grupo
isomorfo a otra posible elección. Por ejemplo, podrı́amos escribir

G ' Z5 × Z2 × Z2 y también G ' Z2 × Z5 × Z2,

pero no podemos contar a estas dos posibilidades como distintas pues

Z5 × Z2 × Z2 ' Z2 × Z5 × Z2.

14
En el caso de grupos abelianos es usual utilizar la notación aditiva en lugar
de la multiplicativa, es decir, en lugar de escribir ab escribimos a + b. Si G
es un grupo abeliano y H1 y H2 son subgrupos de G (y por ser G abeliano
son subgrupos normales) se tiene la suma de subgrupos

H1 + H2 = {h1 + h2 : h1 ∈ H1, h2 ∈ H2},

en lugar del “producto” H1H2 que utilizamos con la notación multiplica-


tiva. Cuando cada elemento de un grupo abeliano G se escribe de manera
única como suma de elementos de ciertos subgrupos H1, . . . , Hk de G, se
expresa simbólicamente ası́

G = H1 ⊕ H2 ⊕ · · · ⊕ Hk ,

y se habla de suma directa (interna) en lugar de producto directo interno.


Utilizaremos la notación aditiva para grupos abelianos cuando veamos las
estructuras de anillo y de módulo.

15
3 Grupos abelianos finitos y el recı́proco al Teorema de La-
grange

Recordemos que el Teorema de Lagrange establece que si G es un grupo finito


entonces el orden de todo subgrupo de G divide al orden de G. Mencionamos
en esa clase que el recı́proco es falso (aunque no dimos un contraejemplo), es
decir, si n es un divisor del orden de G no hay, necesariamente, subgrupos de
G de orden n.
No obstante, en el caso de grupos abeliano finitos el recı́proco del Teorema
de Lagrange es verdadero, pues por el Teorema fundamental para grupos
Qm ki
abelianos finitos, si d es un factor del orden de G, digamos que d = i=1 pi ,

los grupos
Zpk1 , . . . , Zpkmm ,
1

aparecen en la descomposicón de G como un producto directo o bien como


factores del producto o bien como combinaciones de ellos en el producto. Por
lo tanto, en la descomposición en producto directo hay un subgrupo de orden
d y, en consecuencia, la preimagen de tal subgrupo por el isomorfismo es un
subgrupo de G de orden d.
A modo de ilustración, consideremos el caso de un grupo abeliano G de
orden 20. Vimos que

G ' Z5 × Z4 o G ' Z5 × Z2 × Z2.

Los divisores d no triviales de 20 son 2, 4, 5 y 10 (si d = 1 o d = 20 no hay


nada que probar!). Supongamos que elegimos d = 4. Si G ' Z5 × Z2 × Z2,
16
tenemos el subgrupo

H = {(0, a, b) : a, b ∈ Z2},

de Z5 × Z2 × Z2 que es de orden 4, por lo tanto hay en G un subgrupo de


orden 4. Si en cambio G ' Z5 × Z4 entonces

H = {(0, b) : b ∈ Z4},

es un subgrupo de orden 4 de Z5 ×Z4 y, por lo tanto, hay en G un subgrupo de


orden 4. Con los otros divisores se procede de igual manera y ası́ comprobamos
que hay en G un subgrupo de orden d para cada divisor d de 20.

El ejemplo más conocido que demuestra que el recı́proco al Teorema de


Lagrange es falso, es un subgrupo normal de un grupo de permutaciones
con 4 elementos. Tal subgrupo se denota como A4 y se denomina grupo
alternante de grado 4 y pertenece a una clase muy especial de grupos
denominados grupos alternantes de grado n que veremos a continuación.

Denotamos con Sn al grupo A(S), donde S = {1, 2, . . . , n}. Es decir, Sn


es el grupo conformado por todas las funciones biyectivas de S en S con la
operación de composición de funciones. Los elementos de Sn suelen denotarse
con legras griegas y es costumbre referirse a ellas como permutaciones (de n
sı́mbolos).
Una notación que suele ser usada para describir una permutación σ ∈ Sn

17
es la siguiente:  
 1 2 ··· n 
σ=
 
 
 
i1 i2 · · · in
 

donde σ(1) = i2, σ(2) = i2, . . . , σ(n) = in.


En general, se utiliza la notación en ciclos que es mucho más económica:
sea σ ∈ Sn. Un ciclo de longitud k en σ es un subconjunto {i1, i2, . . . , ik }
de k elementos de {1, 2, . . . , n} tal que

σ(i1) = i2, σ(i2) = i3, . . . , σ(ik−1) = ik , σ(ik ) = i1.

Es usual denotar a un ciclo {i1, i2, . . . , ik } de longitud k de σ ∈ Sn como

(i1 i2 · · · ik )

Por ejemplo, si σ ∈ S6 está definida como


 
 1 2 3 4 5 6
σ=
 
 
 
2 4 5 1 3 6
 

entonces (124) es un ciclo de longitud 3 de σ, mientras que (35) es un ciclo de


longitud 2 de σ y (6) es un ciclo de longitud 1 de σ.
Notar que con esta notación, hay varias maneras de denotar a un mismo
ciclo mediante corrimientos hacia la derecha o izquierda. Por ejemplo

(1234) y (4123)

representan el mismo ciclo de longitud 4.


Vemos que el conocer a todos los ciclos de longitud al menos 2 de una

18
permutación σ ∈ Sn, describe completamente y de manera unı́voca a σ. Por
ejemplo si escribimos σ ∈ S8 como

σ = (1357)(24),

significa que  
 1 2 3 4 5 6 7 8
σ=
 
 
 
3 4 5 2 7 6 1 8
 

De esta manera hemos expresado a σ ∈ S8 como producto de ciclos.


Veremos luego que no importa el orden en que se escriben los ciclos siempre
que sean disjuntos o ajenos (concepto que definimos más abajo). Por ejemplo,
veremos que se puede escribir σ = (1357)(24) o bien σ = (24)(1357).
Notar que un ciclo (i1 i2 · · · ik ) de una permutación σ ∈ Sn define una
permutación τ ∈ Sn definiendo

τ (i1) = i2, τ (i2) = i3, . . . , τ (ik−1) = ik , τ (ik ) = i1,

y
τ (j) = j,

para todo j ∈
/ {i1, i2, . . . , ik }. De esta manera, hablaremos de ciclos de Sn.
Esta situación explica la frase producto de ciclos: cuando escribimos, por
ejemplo, σ = (1357)(24) en S8 estamos expresando σ como producto de los
ciclos (1357) y (24) de S8. El hecho que no importe el orden en que se
escriba el producto de ciclos disjuntos se encuentra formalmente expresado en
el Teorema 39 que enunciamos más abajo .

19
Dos ciclos (i1 i2 · · · ik ) y (j1 j2 · · · jm) de Sn se dicen que son disjuntos (o
ajenos) si
{i1, i2, . . . , ik } ∩ {j1, j2, . . . , jm} = ∅.

Por ejemplo σ = (1357)(24) en S8 está expresado como producto de dos ciclos


disjuntos de S8.
Una transposición de Sn es un ciclo de longitud 2 de Sn.
La demostración de los siguientes resultados quedan como ejercicio:

Teorema 39. Toda permutación de Sn es producto de ciclos disjuntos. Tal


expresión es única salvo el orden en que se escriben los ciclos. Además, si τ1
y τ2 son dos ciclos disjuntos de Sn entonces

τ1 τ2 = τ2 τ 1 .

Finalmente, si σ ∈ Sn es producto de m ciclos disjuntos de longitudes k1,


k2, . . . , km, entonces

o(σ) = m.c.m{k1, k2, . . . , km}.

Teorema 40. Toda permutación de Sn se puede expresar como producto de


transposiciones.

La descomposición en transposiciones no es única: por ejemplo si σ =

20
(1357)(24) ∈ S8 entonces vemos que

(1357) = (17)(15)(13),

pero también
(1357) = (13)(37)(35),

con lo cual
(17)(15)(13)(24) = σ = (13)(37)(35)(24).

Una permutación de Sn se dice que es una permutación par si es pro-


ducto de un número par de transposiciones. Caso contrario se dice que es una
permutación impar.
Lo que justifica esta definición es el siguiente resultado cuya demostración
queda como ejercicio:

Teorema 41. Si una permutación de Sn se expresa como producto de un


número par (respectivamente impar) de transposiciones, entonces no puede
expresarse como producto de un número impar (respectivamente par) de
transposiciones.

Sea An el conjunto de todas las permutaciones pares de Sn. Vemos que An


es, en realidad, un subgrupo de Sn: claramente An es no vacı́o y si σ, τ ∈ An
entonces es inmediato que στ ∈ An. Como Sn es un grupo finito, entonces
An es un subgrupo por Lema 4 (ver notas de la semana 2).
El grupo An recibe el nombre de grupo alternante de grado n.

21
Teorema 42. An es subgrupo normal de Sn de orden

n!
|An| = .
2

Demostración. Definimos una función f : Sn → Z2 como




0 si σ es par.




f (σ) = 
1 si σ es impar.



Veamos que f es un homomorfismo de grupos: sean σ, τ ∈ Sn. Es claro que

i) στ es par si ambas permutaciones son pares o ambas son impares.

ii) στ es impar si una de ellas es par y la otra es par.

En el caso i) tenemos que

f (στ ) = 0 = 0 + 0 = 1 + 1 = f (σ) + f (τ ).

Si ocurre ii), entonces

f (στ ) = 1 = 0 + 1 = 1 + 0 = f (σ) + f (τ ).

Luego f es un homomorfismo de grupos y es, en realidad, un epimorfismo.


Por otro lado
Ker(f ) = {σ ∈ Sn : f (σ) = 0} = An.

Por lo tanto An es un subgrupo normal de Sn y por el Primer Teorema de


Isomorfismo
Sn/An ' Z2.
22
Luego, por Teorema 18, tenemos que

|Sn|/|An| = |Sn/An| = |Z2| = 2,

y como |Sn| = n! vemos que


n!
|An| = .
2


Consideramos ahora el grupo alternante A4 y sus subgrupos. Sabemos que
A4 es el subgrupo de permutaciones pares de S4 y es un grupo de orden 12.
Por lo tanto los posibles órdenes de los subgrupos de A4 son 1, 2, 3, 4, 6 y 12.
Veremos que no hay subgrupo de A4 de orden 6, lo que demuestra que
el recı́proco del Teorema de Lagrange es falso. Supongamos que H es un
subgrupo de orden 6 de G = A4. Por lo tanto el ı́ndice de H en G

(G : H) = |G|/|H| = 2,

y ası́ tenemos dos coclases (que las consideramos a izquierda) H y gH para


algún g ∈
/ H.
Consideremos la coclase g 2H. Hay dos posibilidades:

g 2H = gH o g 2H = H.

Si g 2H = gH entonces g 2 = gh para algún h ∈ H. Luego g = h ∈ H, una


contradicción. Por lo tanto
g 2H = H,

23
y ası́ vemos que g 2 ∈ H. Notemos por un lado que todo ciclo (ijk) de S4 de
longitud 3 está en A4 pues todo ciclo de longitud 3 es par ya que

(ijk) = (ik)(ij).

Por otro lado (ijk) es una permutación de S4 de orden 3 (Teorema 39) con lo
cual
2 2
 
4
(ijk) = (ijk) = (ijk) ,

con lo cual todo ciclo de longitud 3 está en H pues si (ijk) ∈


/ H entonces el
argumento anterior muestra que (ijk)2 ∈ H y ası́ (ijk) = (ijk)4 ∈ H, una
contradicción.
Es sencillo verificar que todos los ciclos de longitud 3 de S4 son los siguientes:

{(123), (132), (124), (142), (134), (143), (234), (243)}.

Vemos ası́ que |H| ≥ 8, contradiciendo que |H| = 6. Luego no hay subgrupo
de A4 de orden 6.

24
Grupos
1 Producto semidirecto de grupos

Hemos visto que a partir de dos grupos H y K podemos fabricar un nuevo


grupo G = H × K (el producto directo de H y K) en donde G contiene a
dos subgrupos normales H̃ ' H y K̃ ' K. Veremos ahora un procedimiento
para fabricar un nuevo grupo G a partir de H y K que, en general, será
diferente al producto directo de H y K y solamente tendremos que uno de
los dos grupos H o K es isomorfo a un subgrupo normal de G. Este nuevo
grupo G se denominará producto semidirecto de H y K y se denotará
como
H oφ K.

donde φ : K → Aut(H) es un homomorfismo de grupos y Aut(H) es el grupo


de automorfismos de H. En general el producto semidirecto H oφ K será un
grupo no abeliano y esto permite agrandar, por ejemplo, la clasificación de
grupos finitos conocidos.
Vamos a definir una operación binaria en H × K que dependerá de un
homomorfismo de grupos φ : K → Aut(H). Tenemos que φ induce una
acción de K sobre H definiendo

k · h = φ(k)(h)

1
para todo k ∈ K y todo h ∈ H, pues

(k1k2) · h = φ(k1k2)(h)
= (φ(k1) ◦ φ(k2)) (h)
= φ(k1)(φ(k2)(h))
= φ(k1)(k2 · h)
= k1 · (k2 · h),

y si eK es el neutro de K entonces

eK · h = φ(eK )(h) = h.

Con esta acción definimos una operación binaria en H × K de la siguiente


manera:
(h1, k1)(h2, k2) = (h1(k1 · h2), k1k2). (1)

Esta operación generaliza, por ejemplo, a la operación en el producto HK


cuando H y K son subgrupos normales de un grupo G: al ser H / G tenemos
el homomorfismo φ : K → Aut(H) definido como

φ(k)(h) = khk −1

para todo h ∈ H. Luego

(h1(k1 · h2))(k1k2) = (h1(k1h2k1−1))(k1k2) = (h1k1)(h2k2).

2
Notar que como φ : K → Aut(H) entonces

φ(k)(eH ) = eH ,

para todo k ∈ K, donde eH es el elemento neutro de H, pues φ(k) : H → H


es un homomorfismo de grupos. En otras palabras

k · eH = eH ,

para todo k ∈ K.

Teorema 43. Sean H y K dos grupos con elementos neutros eH y eK


respectivamente y sea φ : K → Aut(H) un homomorfismo de grupos. La
operación binaria (1) define una estructura de grupo en H × G. Este grupo
se denomina producto semi-directo de H y K y se lo denota como

H oφ K.

Además
1) H̃ = {(h, eK ) : h ∈ H} y K̃ = {(eH , k) : k ∈ K} son subgrupos de
H oφ K tales que
H ' H̃ y K ' K̃.

2) H̃ ∩ K̃ = {(eH , eK )}.

3) H oφ K = H̃ K̃.

4) H̃ / H oφ K.

Demostración. Es sencillo verificar que H × K con la operación binaria (1)


3
forma un grupo con elemento neutro (eH , eK ) y donde el inverso de (h, k) es
(h, k)−1 = (k −1 · h−1, k −1).
Veamos ahora que vale 1). Lo demostramos para H̃ pues el caso K̃ es
similar: si (h1, eK ) y (h2, eK ) ∈ H̃ entonces

(h1, eK )(h2, eK ) = (h1(eK · h2), eK ) = (h1h2, eK ) ∈ H̃,

y si (h, eK ) ∈ H̃ entonces

(h, eK )−1 = (eK · h−1, eK ) = (h−1, eK ) ∈ H̃,

con lo cual H̃ es subgrupo de de H oφ K. Por otro lado la función

f : H → H̃,

definida como f (h) = (h, eK ) es biyectiva y es también un homomorfismo de


grupos:

f (h1h2) = (h1h2, eK ) = (h1(eK · h2), ek ) = (h1, eK )(h2, eK ) = f (h1)f (h2).

Por lo tanto f es un isomorfismo y ası́ H ' H̃.


Claramente H̃ ∩ K̃ = {(eH , eK )} ası́ que 2) es inmediato.
Veamos que vale 3): claramente H̃ K̃ ⊂ H oφ K. Reciprocamente si
(h, k) ∈ H oφ K entonces

(h, eK )(eH , k) = (h(eK · eH ), k) = (heH , k) = (h, k),

y ası́ vemos que (h, k) ∈ H̃ K̃.

4
Finalmente demostramos 4): por un lado tenemos que

(eH , k)H̃(eH , k)−1 ⊂ H̃,

para todo k ∈ K pues

(eH , k)(h, eK )(eH , k)−1 = (eH (k · h), k)(k −1 · eH , k −1)


= (k · h, k)(eH , k −1)
= (k · h(k · eH ), kk −1) = (k · h, eK ) ∈ H̃

Por otro lado por lo visto en la demostración de 3) (h, k) = (h, eK )(eH , k)


con lo cual
(h, k)−1 = (eH , k)−1(h, eK )−1.

Luego
 
−1 −1
(h, k)H̃(h, k) = (h, eK ) (eH , k)H̃(eH , k) (h, eK )−1
⊂ (h, eK )H̃(h, eK )−1 ⊂ H̃,

lo que demuestra que H̃ / H oφ K. 

Si el contexto es claro, es usual omitir el homomorfismo φ y escribir H o K


en lugar de H oφ K

En vista del Teorema 43 es natural hacerse la siguiente pregunta: ¿cuándo

H oφ K = H × K ?

5
Teorema 44. Sean H y K dos grupos y sea φ : K → Aut(H) un
homomorfismo de grupos. Las siguientes afirmaciones son equivalentes:
1) La función identidad Id : H oφ K → H × K es un homomorfismo de
grupos.

2) φ es el homomorfismo trivial, es decir

φ(k) = IdH

para todo k ∈ K.

3) K̃ / H oφ K.

Demostración. 1) ⇒ 2). Por un lado tenemos la operación en H oφ K

(h1, k1)(h2, k2) = (h1(k1 · h2), k1k2),

y por el otro, al ser Id : H oφ K → H × K es un homomorfismo de grupos

(h1(k1 · h2), k1k2) = Id((h1(k1 · h2, k1k2)))


= Id((h1, k1)(h2, k2))
= Id(h1, k1)Id(h2, k2)
= (h1, k1)(h2, k2) = (h1h2, k1k2),

con lo cual h1(k1 · h2) = h1h2. Luego k1 · h2 = h2. Como los elementos son
arbitrarios, esto nos dice que k · h = h para todo k ∈ K y todo h ∈ H. Pero
esto equivale a tener que φ(k)(h) = h para todo k ∈ K y todo h ∈ H, con

6
lo cual
φ(k) = IdH ,

para todo k ∈ K.
2) ⇒ 3). Por hipótesis tenemos que k · h = h para todo k ∈ K y todo
h ∈ H. Escribimos h̃ = (h, eK ) ∈ H̃ y k̃ = (eH , k) ∈ K̃. Entonces

h̃k̃ h̃−1 = (h, ek )(eH , k)(h−1, eK )


= (h, k)(h−1, eK )
= (h(k · h−1), k)
= (hh−1, k) = (eH , k) = k̃.

Sea g = (h, k) ∈ H oφ K y sea k˜1 = (eH , k1) ∈ K̃. Como vimos en la


demostración del item 3) del Teorema 43

g = h̃k̃.

Luego g = k̃ h̃ y ası́ g −1 = h̃−1k̃ −1. Entonces

g k̃1g −1 = k̃(h̃k˜1h̃−1)k̃ −1
= k̃ k˜1k̃ ∈ K̃,

con lo cual g K̃g −1 ⊂ K̃ para todo g ∈ H oφ K, es decir que

K̃ / H oφ K.

3) ⇒ 1). Sea h̃ = (h, eK ) ∈ H̃ y k̃ = (eH , k) ∈ K̃. El conmutador [h̃, k̃] de

7
h̃ y k̃ se define como
[h̃, k̃] = h̃−1k̃ −1h̃k̃.

Tenemos que [h̃, k̃] ∈ H̃ ∩ K̃ pues por ser K̃ / H oφ K


 
−1 −1
[h̃, k̃] = h̃ k̃ h̃ k̃ ∈ K̃,

y por ser H̃ / H oφ K ( item 4) del Teorema 43)


 
−1 −1
[h̃, k̃] = h̃ k̃ h̃k̃ ∈ H̃,

Como H̃ ∩ K̃ = {(eH , eK )} ( item 2) del Teorema 43), entonces

h̃k̃ = k̃ h̃.

En términos de coordenadas esto nos dice que

(h, k) = h̃k̃ = k̃ h̃
= (eH , k)(h, ek ) = (eH (k · h), k) = (k · h, k),

con lo cual k · h = h para todo k ∈ K y todo h ∈ H. Esto implica que la


función identidad Id : H oφ K → H × K es un homomorfismo de grupos
pues

Id ((h1, k1)(h2, k2)) = Id(h1(k1 · h2), k1k2)


= (h1h2, k1k2) = (h1, k1)(h2, k2) = Id(h1, k1)Id(h2, k2).

8
El Teorema 44 muestra, en particular, que la noción de producto semi-
directo es una generalización del producto directo. Notar que el producto
directo es un concepto simétrico, en el sentido que H × K ' K × H pero
el producto semi-directo no lo es en general.

Vemos ahora un criterio para construir productos semi-directos a partir de


subgrupos de un grupo G.

Teorema 45. Sean H y K dos subgrupos de un grupo G tales que


1) H / G y

2) H ∩ K = {e}, donde e es el elemento neutro de G.


Sea φ : K → Aut(H) la función definida como

φ(k)(h) = khk −1.

para todo k ∈ K y todo h ∈ H. Entonces φ es un homomorfismo de grupos,


HK es subgrupo de G y
HK ' H oφ K.

En particular si G = HK y H y K son subgrupos de G que satisfacen 1) y


2), entonces
G ' H oφ K.

Demostración. Veamos que φ es un homomorfismo de grupos: dados k1,


k2 ∈ K y h ∈ H

9
φ(k1k2)(h) = (k1k2)h(k1k2)−1
 
= k1 k2hk2−1 k1−1
= k1φ(k2)(h)k1−1 = φ(k1) (φ(k2)(h))
= (φ(k1) ◦ φ(k2)) (h),

con lo cual φ(k1k2) = φ(k1) ◦ φ(k2).


Por otro lado, HK es subgrupo de G (pues H / G) y por 2) para cada
elemento g ∈ HK existen únicos h ∈ H y k ∈ K tales que g = hk. Por lo
tanto tenemos una función

f : HK → H oφ K,

definida como f (hk) = (h, k) que es claramente biyectiva. Veamos que f es


un homomorfismo de grupos:

f ((h1k1)(h2k2)) = f (h1(k1h2k1−1)k1k2)
= f (h1h3k1k2) = (h1h3, k1k2)
= (h1(k1h2k1−1), k1k2)
= (h1(k1 · h2), k1k2) = (h1, k1)(h2, k2) = f (h1k1)f (h2k2).

Por lo tanto f : HK → H oφ K es un isomorfismo.

10
Notar que en el Teorema 45 se consigue un resultado similar al del Teorema
36 relajando la hipótesis de que ambos subgrupos de G sean normales en
G.

El Teorema 45 puede ser usado para clasificar ciertos grupos de orden n, en


el sentido de que para ciertos valores de n se puede dar una lista completa
de todos los grupos de orden n que no son isomorfos dos a dos.

2 Grupos de orden pq con p y q primos

Una de las situaciones en donde podemos aplicar muchos de los resultados


teóricos vistos hasta el momento es el problema de la determinación, salvo iso-
morfismos, de todos los posibles grupos de orden pq donde p y q son números
primos.
Necesitaremos, además, el siguiente resultado. Recordemos que U(Zn) es
el grupo multiplicativo de las unidades de Zn, es decir, el grupo multiplicativo
formado por las clases residuales [m] ∈ Zn donde m.c.d(n, m) = 1.

Teorema 46. Sea p un número primo. Entonces

Aut(Zp) ' U(Zp).

11
Demostración. Escribimos Zp = {[0], [1], . . . , [p − 1]}. Dado que p es primo,
todo entero 1 ≤ m ≤ p − 1 es coprimo con p, con lo cual

U(Zp) = {[1], [2], . . . , [p − 1]}.

Si f ∈ Aut(Zp) y [k] ∈ Zp entonces

f ([k]) = f ([1] + [1] + · · · + [1]) = f ([1]) + f ([1]) + · · · + f ([1]) = kf ([1]).

Como f ([1]) 6= [0], pues f es inyectiva y f ([0]) = [0], lo anterior nos dice que
f queda determinado por el valor de f ([1]). Definimos ası́ una función

ϕ : Aut(Zp) → U(Zp),

como ϕ(f ) = f ([1]). Esta función es inyectiva pues si ϕ(f ) = ϕ(g) entonces
f ([1]) = g([1]). Luego, dado [k] ∈ Zp, se tiene que

f ([k]) = kf ([1]) = kg([1]) = g([k]),

con lo cual f = g. También ϕ es sobreyectiva pues si [k] ∈ U(Zp), la


función f : Zp → Zp definida como f ([s]) = [s][k] es un automorfismo de Zp
(verificarlo!) y ası́
ϕ(f ) = f ([1]) = [1][k] = [k].

Por lo tanto ϕ es una función biyectiva. Finalmente ϕ es un homomorfismo


de grupos: si f y g ∈ Aut(Zp) entonces existe 1 ≤ k ≤ p − 1 tal que

g([1]) = [k].

12
Luego

ϕ(f ◦ g) = (f ◦ g)([1])
= f (g([1])) = f ([k]) = kf ([1]) = [k]f ([1])
= f ([1])g([1]) = ϕ(f )ϕ(g).


Sea G un grupo de orden pq. Si p = q entonces G es de orden p2 y ya
vimos que esto implica que G es abeliano. Por el Teorema Fundamental de
los Grupos Abelianos Finitos sabemos que

G ' Zp2 ó G ' Zp × Zp.

Por lo tanto queda estudiar el caso donde p 6= q. Podemos suponer, sin


pérdida de generalidad, que p < q. Como |G| = pq el Primer Teorema de
Sylow nos dice que existen un p-subgrupo K de G de orde p y un q-subgrupo
H de G de orden q. Luego K y H son subgrupos cı́clicos de G y ası́

K ' Zp y H ' Zq .

Sea Nq el número de q-subgrupos de Sylow de G. Por el Tercer Teorema de


Sylow sabemos que

Nq ≡ 1 mod q y Nq | pq.

Luego Nq | p y ası́ Nq = 1 o Nq = p. Si Nq = p entonces existe un entero

13
positivo n tal que
p = 1 + nq ≥ 1 + q,

contradiciendo que p < q. Por lo tanto Nq = 1 y ası́ tenemos que H es el


único q-subgrupo de Sylow de G. Esto implica que H / G pues si g ∈ G
entonces gHg −1 es también un p-subgrupo de Sylow de G con lo cual

gHg −1 = H,

para todo g ∈ G. En particular HK es subgrupo de G.


Por otro lado H ∩ K = {e}, donde e es el elemento neutro de G, pues
H ∩ K es subgrupo de H y de K y ası́ |H ∩ K| tiene que dividir a p y a q.
Luego |HK| = pq pues la función f : HK → H × K donde f (hk) = (h, k)
está bien definida (por ser H ∩ K = {e}) y es biyectiva. Por lo tanto

G = HK.

Sea Np el número de p-subgrupos de Sylow de G. Nuevamente, por el


Tercer Teorema de Sylow, tenemos que

Np ≡ 1 mod p y Np | pq.

Luego Np | q y ası́ Np = 1 o Nq = q. Si Np = 1 entonces, tal como vimos


en el caso Nq = 1, necesariamente K / G. Por lo tanto en el caso Np = 1
tenemos que

i) H / G,

ii) K / G y
14
iii) H ∩ K = {e}.

Entonces, por Teorema 36 y Lema 38, se tiene que

G = HK ' H × K ' Zq × Zp ' Zpq .

En otras palabras, si Np = 1 entonces G es un grupo cı́clico de orden pq.


Si Np = q entonces q ≡ 1 mod p y ası́ tenemos que p | q − 1. Como
H ' Zq y por Teorema 46 Aut(Zq ) ' U(Zq ) y U(Zq ) es un grupo cı́clico
de orden q − 1, vemos que Aut(H) es un grupo cı́clico de orden q − 1. En
particular, por el Teorema de Cauchy, hay un elemento en Aut(H) de orden
p. Dado que en todo grupo cı́clico hay un único subgrupo de un orden que
divida al orden del grupo (comprobarlo!), hay en Aut(H) un único subgrupo
de orden p. Tal subgrupo es cı́cliclo de orden p y, por lo tanto, isomorfo a
Zp ' K. Tenemos ası́ p − 1 automorfismos de Zp (pues por Teorema 46,
Aut(Zp) ' U(Zp)) y, en consecuencia, tenemos p − 1 homomorfismos no
triviales
φi : K → Aut(H),

donde 1 ≤ i ≤ p − 1. Luego, por Teorema 44, tenemos que hay p − 1 grupos


no abelianos de orden pq
H oφi K, (2)

donde 1 ≤ i ≤ p − 1. Pero, como vemos a continuación, no hay más de p − 1


homomorfismos no triviales de K en Aut(H). Esto se debe a que hay tantos
homomorfismos de K en Aut(H) como homomorfismos de Zp en U(Zq ) pues

15
K ' Zp y como H ' Zq entonces

Aut(H) ' Aut(Zq ) ' U(Zq ),

y ası́ el siguiente diagrama


θ
Aut(H) U(Zq )

φ η
µ
K Zp

donde θ : Aut(H) → U(Zq ) y µ : K → Zp son isomorfismos, nos dice que


φ define unı́vocamente a η como η = θ ◦ φ ◦ µ−1 y, recı́procamente, η define
unı́vocamente a φ como φ = θ−1 ◦ η ◦ µ.
¿Cuántos homomorfismos se pueden definir de Zp en U(Zq )? Si

η : Zp → U(Zq ) = {[1], . . . , [q − 1]},

es un homomorfismo entonces η([0]) = [1] y η([1]) = [k] para algún 1 ≤ k ≤


q − 1. Luego

[1] = η([0]) = η([p]) = η([1] + · · · + [1]) = [k]p.

Esto implica que o([k]) | p y ası́ o([k]) = 1 o, en caso contrario, o([k]) = p. Si


o([k]) = 1 entonces [k] = [1] y esto implica que η es el homomorfismo trivial,
es decir, η([n]) = [1] para todo [n] ∈ Zp. Si o([k]) = p tenemos que η es
un homomorfismo no trivial. Recı́procamente cada elemento [k] ∈ U(Zq ) de
orden p define un homomorfismo η : Zp → U(Zq ) haciendo η([0]) = [1] y
16
η([1]) = [k] (comprobarlo!). Como hay exactamente p − 1 elementos de orden
p en U(Zq ) (pues ϕ(p) = p − 1, donde ϕ es la función de Euler, y U(Zq ) es un
grupo cı́clico de orden q−1 y p | q−1), hay exactamente p−1 homomorfismos
no triviales de Zp en U(Zq ). Por lo tanto hay p−1 homomorfismos no triviales
de K en Aut(H) que son los anteriormente dados que definen los grupos no
abelianos de la forma (2).
Dejamos como ejercicio demostrar que, en realidad, los grupos no abelianos
de la forma (2) son isomorfos entre sı́. En consecuecia, salvo isomorfismos, hay
un único grupo no abeliano de orden pq. Luego, si G es un grupo de orden
pq con p y q primos, entonces, salvo isomorfismos, G = Zp2 o G = Zp × Zp
cuando p = q y si p 6= q entonces G = Zpq o G es el único grupo no abeliano
de orden pq dado en (2).

17
Anillos
1 Definiciones y ejemplos

En varios ejemplos de grupos que hemos visto en las clases pasadas hay dos
operaciones entre los elementos del grupo y que satisfacen ciertas “reglas de
convivencia”.

Por ejemplo, en el conjunto Z tenemos la adición de enteros, que transforma


a Z en un grupo abeliano, pero también podemos multiplicar enteros y el
resultado vuelve a ser un entero. Con el producto Z no es un grupo (tiene al 1
como elemento neutro multiplicativo pero todo entero distinto de ±1 no tiene
inverso multiplicativo en Z). No obstante, el producto en Z es asociativo
pues (ab)c = a(bc) para todo entero a, b y c, hay elemento neutro para
el producto (el 1) y, además, entre la suma y el producto en Z hay cierta
interacción: tenemos la propiedad distributiva del producto con respecto a la
suma: a(b + c) = ab + ac (y por ser el producto en Z conmutativo, también
tenemos que a(b + c) = ab + ac = ba + ca = (b + c)a.

Este ejemplo y muchos otros conducen a la noción de estructura de anillo.


Sea R un conjunto no vacı́o y supongamos que tenemos dos operaciones bi-
narias ⊕ y ∗ en R tales que

i) (R, ⊕) es un grupo abeliano.

ii) (a ∗ b) ∗ c = a ∗ (b ∗ c) para todo a, b y c ∈ R.

1
iii) a ∗ (b ⊕ c) = (a ∗ b) ⊕ (a ∗ c) y (a ⊕ b) ∗ c = (a ∗ c) ⊕ (b ∗ c) para todo
a, b y c ∈ R.

Decimos entonces que la terna (R, ⊕, ∗) es un anillo.

También se puede definir una estructura más general de anillo sin pedir la
propiedad asociativa ii). Es esos casos se habla de anillos no asociativos.

Si también se cumple que

iv) a ∗ b = b ∗ a para todo a, b ∈ R,

decimos que (R, ⊕, ∗) es un anillo conmutativo.

Si se cumple que

v) Existe u ∈ R tal que u ∗ a = a = a ∗ u para todo a ∈ R,

decimos que (R, ⊕, ∗) es un anillo con unidad.

• Los conjuntos de los números enteros, racionales, reales o complejos son


ejemplos de anillos conmutativos con unidad con la suma y el producto usual.
En todos estos casos la unidad es el entero 1.

• El conjunto Mn(R) de todas la matrices cuadradas de n×n con componente


reales es un anillo con unidad no conmutativo con la suma y el producto de
matrices. Aquı́ la unidad es la matriz identidad de n × n.

• El conjunto de todas las funciones reales f : X → R definidas en un


conjunto X forma un anillo conmutativo con unidad con la suma y el producto
usual de funciones. Aquı́ la unidad es la función constante 1 ∈ R.
2
De ahora en adelante reemplazaremos el sı́mbolo ⊕ por el de suma + para
denotar la operación binaria en R que hace de R un grupo abeliano. Nos
referiremos al grupo (R, +) como la estructura aditiva del anillo R. El
elemento neutro del grupo abeliano (R, +) será denotado como 0, mientras
que el inverso de a ∈ R será denotado como −a. Como es costumbre con
los grupos abelianos, en lugar de llamar inverso de a al elemento −a, lo
llamaremos el opuesto aditivo (o simplemente el opuesto) de a ∈ R.
Además reemplazaremos el sı́mbolo de la operación binaria ∗ en R por el
sı́mbolo · de “producto” y nos referiremos al par (R, ·) como la estructura
multiplicativa de R. Denotaremos la estructura de anillo como la terna
(R, +, ·). Usualmente la asocitiviad del producto de la propiedad ii) se ex-
presará como
(ab)c = a(bc),

mientras que la propiedad distributiva iii) se expresará como

a(b + c) = ab + ac y (a + b)c = ac + bc,

sin hacer mención al sı́mbolo · del producto (a menos que sea necesario).
En caso de existir una unidad en el anillo (R, +, ·), el mismo será denotado
como 1, con lo cual tendremos que a1 = a = 1a para todo a ∈ R.
A lo largo de todas estas notas siempre asumiremos que 1 6= 0 para evitar
la mención de situaciones patológicas en varios de los resultados que vere-
mos.

3
Finalmente, a menos que sea necesario, hablaremos de un anillo R sin men-
cionar la terna (R, +, ·).

Un anillo conmutativo R se dice que es un dominio de integridad si


ab = 0 implica que a = 0 o b = 0.

• Los conjuntos Zn de las clases de residuos módulo n forman un anillo con-


mutativo con unidad con la suma y el producto de clases. La unidad para
el producto de clases es la clase [1]. Vemos que, por ejemplo, Z6 no es un
dominio de integridad pues [2] 6= [0] y [3] 6= [0] pero [2][3] = [6] = [0].

Sea R un anillo conmutativo. Un elemento a 6= 0 de R se dice que es un


divisor de cero si existe b 6= 0 tal que ab = 0.

Alternativamente, un dominio de integridad puede definirse como un anillo


conmutativo sin divisores de cero.

La noción de divisor de cero también puede enunciarse en anillos no con-


mutativos y se habla de que a 6= 0 elemento de R es divisor de cero a
izquierda o derecha según sea ab = 0 o ba = 0 para algún b 6= 0 en R.

Un anillo R con unidad se dice que es un anillo con división si para


cada elemento a 6= 0 de R existe b ∈ R tal que ab = 1 = ba. En tal caso, el
elemento b será denotado como a−1 y diremos que a−1 ∈ R es el inverso de
a ∈ R.

4
• En general, si R es un anillo con unidad, un elemento a ∈ R se dice que
es inversible si existe b ∈ R tal que ab = 1 = ba. Tal elemento b ∈ R
es el inverso de a en R y se lo denotará como a−1. El conjunto U (R) de
los elementos inversibles de R se denomina grupo de unidades de R,
pues U (R) es un grupo con el producto de R (comprobarlo!). Por ejemplo
U (Zn) = {[i] : mcd(i, n) = 1}.
Notar que si R es un anillo con división entonces U (R) = R∗, donde R∗
denota al conjunto de los elementos no nulos de R.

• Sea p un número primo. Entonces el anillo conmutativo con unidad Zp es


un anillo con división, pues si [n] 6= [0] en Zp entonces p - n. Luego por el
Pequeño Teorema de Fermat

np−1 ≡ 1 mod p,

lo que en términos de clases se expresa como [np−1] = [1] en Zp. Por lo tanto

[n][n]p−2 = [n][np−2] = [np−1] = [1],

y ası́ [n]−1 = [n]p−2 en Zp.

• Los cuaterniones sobre R de Hamilton son los elementos del conjunto H(R)
conformado por todas las combinaciones lineales con coeficientes reales del 1
y los sı́mbolos i, j y k, es decir

H(R) = {a + bi + cj + dk : a, b, c, d ∈ R}.

Los sı́mbolos i, j y k satisfacen las reglas dadas en el Ejercicio 4 de la Práctica


5
1. Se establece que dos cuaterniones reales

a + bi + cj + dk y a0 + b0i + c0j + d0k,

son iguales si a = a0, b = b0, c = c0 y d = d0.

Si un coeficiente real es cero, no se escribe el sı́mbolo afectado por el coefi-


ciente mientras que si un coeficiente real es 1, se escribe solamente el sı́mbolo
afectado por 1. Por ejemplo el cuaternión i+k es el cuaternión 0+1i+0j +1k.

Se define una estructura de anillo con unidad en H(R) definiendo la suma


de cuaterniones como

(a+bi+cj +dk)+(a0 +b0i+c0j +d0k) = (a+a0)+(b+b0)i+(c+c0)j +(d+d0)k,

y el producto como

(a + bi + cj + dk)(a0 + b0i + c0j + d0k) = a00 + b00i + c00j + d00k,

donde
a00 = aa0 − bb0 − cc0 − dd0
b00 = ab0 + ba0 + cd0 − dc0
c00 = ac0 − bd0 + ca0 + db0
d00 = ad0 + bc0 − cb0 + da0
Se llega a estas fórmulas distribuyendo y usando las reglas entre los sı́mbolos i,
j y k del Ejercicio 4 de la Práctica 1 (comprobarlo, pero hay que ser pacientes!).
La unidad es el cuaternión 1, es decir, el cuaternión 1 + 0i + 0j + 0k.

Como, por ejemplo, ij = k y ji = −k, vemos que HR es un anillo no


6
conmutativo.

Si multiplicamos los cuaterniones a + bi + cj + dk y a − bi − cj − dk vemos,


usando las fórmulas para el resultado del producto de dos cuaterniones, que

b00 = c00 = d00 = 0 y que a00 = a2 + b2 + c2 + d2.

Por lo tanto, si un cuaternión a + bi + cj + dk es no nulo, entonces algunos


de los coeficientes a, b, c o d es no nulo, con lo cual a2 + b2 + c2 + d2 6= 0.
Sea r = a2 + b2 + c2 + d2. Luego r 6= 0 y tenemos ası́ un cuaternión bien
definido
a b c d
− i − j − k.
r r r r
Es sencillo verificar que

a b c d r
 

(a + bi + cj + dk)  − i − j − k  = = 1,
r r r r r

y que
a b c d r
 
 − i − j − k  (a + bi + cj + dk) = = 1,
r r r r r
con lo cual vemos que todo cuartenión no nulo tiene un inverso que es tambı́en
un cuaternión. Por lo tanto H(R) es un anillo con división no conmutativo.

Un dominio de integridad R se dice que es un cuerpo si es también un


anillo con división.

• Son ejemplos de cuerpos Q, R y C con la suma y producto usuales.

• Hay ejemplos de cuerpos finitos como es el caso de Zp con p primo. También


hay cuerpos finitos distintos de los Zp, pero su existencia y propiedades no
7
serán parte de este curso. No obstante hay que mencionar que los cuerpos
finitos son objetos matemáticos abstractos con enorme cantidad de aplica-
ciones, en especial a ciertos problemas que tienen que ver con la Teorı́a de la
Información, como por ejemplo la transmisión segura y confiable de datos de
manera electrónica.

• Consideremos ahora el conjunto R de los número racionales m/n donde m


y n son coprimos. Para p primo definimos el conjunto

Rp = {m/n : p - n} ∪ {0}.

Es sencillo verificar que Rp con la suma y el producto usuales en Q forma un


dominio de integridad (comprobarlo!). No obstante Rp no es un cuerpo, pues
p es un elemento no nulo de Rp pero su inverso es 1/p, que no es elemento de
Rp .

Ası́ como en un grupo G hay subgrupos, es decir, subconjuntos H de G


que son en sı́ mismos grupos con el producto en G, en el caso de los anillos
ocurre algo similar.

Sea (R, +, ·) un anillo. Un subconjunto no vacı́o S de R se dice que un


subanillo de R si (S, +, ·) es un anillo.

• Por ejemplo, con la suma y el producto usual, Z es subanillo de Q, pero


también Q es subanillo de R y R es subanillo de C. También, para n ∈ N,
los conjuntos de la forma nZ son subanillos de Z.

Usaremos con frecuencia la notación a − b para la suma a + (−b) de a y el


8
opuesto de b.

Teniendo en cuenta el criterio principal que vimos para determinar si un


subconjunto no vacı́o de G es subgrupo o no, el siguiente resultado es inmedia-
to (comprobarlo!).

Lema 1. Sea R un anillo y S un subconjunto no vacı́o de R. Entonces S es


subanillo de R si y sólo si para cada a, b ∈ S se cumple que
i) a ± b ∈ S, y

ii) ab ∈ S.

9
2 Algunas propiedades básicas de los anillos

Recordemos que el neutro para la estructura aditiva de grupo abeliano de un


anillo R es denotado como 0, con lo cual a + 0 = a = 0 + a para todo a ∈ R.
También recordemos que dado a ∈ R, denotamos con −a al opuesto de a que
satisface a + (−a) = 0 = (−a) + a.

Lema 2. Sea R un anillo y sean a, b ∈ R. Entonces


1) a0 = 0 = 0a.

2) a(−b) = −(ab) = (−a)b.

3) (−a)(−b) = ab.

4) Si R es anillo con unidad 1, entonces (−1)a = −a.

Demostración. Veamos 1). Como 0 + 0 = 0 entonces

a0 = a(0 + 0) = a0 + a0 y 0a = (0 + 0)a = 0a + 0a,

con lo cual, por las leyes cancelativas en el grupo (G, +) nos queda que

0 = a0 y 0 = 0a.

Veamos 2). Por un lado tenemos que ab + (−(ab)) = 0 y por el otro

ab + a(−b) = a(b + (−b)) = a0 = 0,

luego, por unicidad del opuesto (ya demostrado en el Lema 1 de la parte de


grupos), debemos tener que a(−b) = −(ab). Un argumento similar muestra
10
que (−a)b = −(ab) (hacerlo!)
Veamos ahora 3). Por 2) y Lema 1 de la parte de grupos, tenemos que

(−a)(−b) = −(a(−b)) = −(−(ab)) = ab.

Finalmente, vemos 4). Por 2) y por ser 1 unidad de R, tenemos que

(−1)a = −(1a) = −a.

Recordemos la notación para grupos que vimos en las clases anteriores: es-
cribir an significa hacer n veces el producto aa · · · a de a con sı́ mismo. En
el caso de un anillo, si estamos con el grupo abeliano usamos la notación
aditiva para la operación del grupo, ası́ que en lugar de escribir an escribi-
mos na y significa sumar n veces a si n > 0, es decir

na = a
|
+ a +{z· · · + a}
n veces si n > 0

y si n < 0 significa sumar −n veces el opuesto de a, es decir

na = |(−a) + (−a){z+ · · · + (−a)}


−n veces si n < 0

Si en cambio estamos con el producto en R, la notación an significa multi-


plicar n veces a si n > 0. El caso n < 0 es similar pero se usa cuando un
elemento tiene inverso multiplicativo. Si R es un anillo con unidad, con el
producto en R se define a0 = 1.

11
• En el caso de números reales estamos acostumbrados a escribir

(a + b)2 = a2 + 2ab + b2.

Cuando estamos con un anillo R, también podemos desarrollar (a + b)2, pero


al no ser R necesariamente conmutativo queda

(a + b)2 = (a + b)(a + b)
= a(a + b) + b(a + b)
= a2 + ab + ba + b2.

Solamente si R es conmutativo podemos expresar ab + ba como 2ab o 2ba.

Una situación curiosa que surge en los anillos con unidad es que la conmu-
tatividad de la suma se deduce de las otras propiedades de anillo.

Lema 3. Sea R un conjunto con dos operaciones de suma + y producto


· en donde (R, +) es grupo no necesariamente abeliano y con el producto
(R, ·) cumple con todos los axiomas de anillo con unidad 1. Entonces (R, +)
es un grupo abeliano. En consecuencia (R, +, ·) es, en realidad, un anillo con
unidad.

Demostración. Sean a y b ∈ R. Por un lado tenemos que

(a + b)(1 + 1) = a(1 + 1) + b(1 + 1) = a + a + b + b,

12
y por otro lado también tenemos que

(a + b)(1 + 1) = (a + b)1 + (a + b)1 = a + b + a + b.

Luego
a + a + b + b = a + b + a + b,

de donde se deduce que a + b = b + a. 

Finalizamos esta clase con la presentación de una clase muy importante de


anillos: los anillos booleanos.

Un anillo R se dice que es booleano si a2 = a para todo a ∈ R.

• Un clásico ejemplo de anillo booleano está dado por el conjunto de partes


P(X) de un conjunto no vacı́o X, considerando la diferencia simétrica de
conjuntos como la suma en P(X) y la intersección de conjuntos como el
producto en P(X) (comprobarlo!).

Vemos ahora una propiedad para destacar de los anillos booleanos.

Teorema 4. Todo anillo booleano es conmutativo.

Demostración. Sea R un anillo booleano y sean a, b ∈ R. Entonces

a2 = a, b2 = b, y (a + b)2 = a + b.

Luego

a + b = (a + b)2 = a2 + ab + ba + b2 = a + ab + ba + b,
13
lo cual implica que ab + ba = 0. Entonces

0 = a0 = a(ab + ba) = a2b + aba = ab + aba,

y también
0 = 0a = (ab + ba)a = aba + ba2 = aba + ba.

Por lo tanto aba + ab = aba + ba y ası́ ab = ba.

14
3 Homomorfismos de anillos, ideales y anillos cociente

Veamos ahora que los conceptos de homomorfismo, grupo cociente y teoremas


de isomorfismos que vimos para grupos tienen su versión en la estructura de
anillo. Aquı́ aparecerá un nuevo concepto, el de ideal en un anillo, que hará
el papel, en el contexto te los anillos, de los subgrupos normales que definen
el grupo cociente.

Sean (R, +, ·) y (R0, ⊕, ∗) dos anillos. Decimos que una función φ : R → R0


es un homomorfismo de anillos si para todo a, b ∈ R

i) φ(a + b) = φ(a) ⊕ φ(b), (es decir, φ es un homomorfismo de grupos


abelianos) y

ii) φ(ab) = φ(a) ∗ φ(b).

A partir de ahora usaremos en ambos anillos el sı́mbolo de suma + para la


operación de grupo abeliano y omitiremos el sı́mbolo de producto (a menos
que sea necesario explicitar las operaciones en cada anillo). Por lo tanto, las
condiciones i) y ii) se escribirán generalmente ası́:

φ(a + b) = φ(a) + φ(b) y φ(ab) = φ(a)φ(b).

También usaremos al 0 para denotar el neutro aditivo tanto en R como en R0.

Tal como ocurre con los homomorfismos de grupos, los homomorfismos


de anillos definen subanillos. Es sencillo demostrar (hacerlo!) el siguiente
resultado.

15
Teorema 5. Sea φ : R → R0 un homomorfismo de anillos. Entonces la
imagen φ(R) es un subanillo de R0.

Asociado a un homomorfismo φ : R → R0 de anillos tenemos el núcleo


Ker φ como homomorfismo de grupos abelianos, es decir

Ker φ = {a ∈ R : φ(a) = 0}.

Ya sabemos que Ker φ es un subgrupo de R. Algo más es cierto también.

Teorema 6. Sea φ : R → R0 un homomorfismo de anillos. Entonces Ker φ


es un subanillo de R. Además Ker φ satisface la siguiente propiedad:

a Ker φ = {ab : b ∈ Ker φ} ⊂ Ker φ,

y también
Ker φ a = {ba : b ∈ Ker φ} ⊂ Ker φ,

para todo a ∈ R.

Demostración. Para ver que Ker φ es subanillo de R solo queda ver que
Ker φ es cerrado por el producto y eso es consecuencia directa de ver que
a Ker φ ⊂ Ker φ para todo a ∈ R.
Sean a ∈ R y b ∈ Ker φ, entonces, recordando 1) del Lema 2, tenemos que

φ(ab) = φ(a)φ(b) = φ(a)0 = 0,

con lo cual ab ∈ Ker φ. En particular ab ∈ Ker φ para todo a, b ∈ Ker φ.


16
De manera similar se ve que φ(ba) = 0 para todo b ∈ Ker φ y todo a ∈ R
y, por lo tanto, Ker φ a ⊂ Ker φ para todo a ∈ R.


Las propiedades a Ker φ ⊂ Ker φ y Ker φ a ⊂ Ker φ que valen para todo
a ∈ R, son claves para el concepto de anillo cociente y motivan la siguiente
definición.

Sea R un anillo. Un subconjunto I de R se dice que es un ideal bilátero


de R si

i) I es subgrupo aditivo de R.

ii) aI ⊂ I y también Ia ⊂ I para todo a ∈ R.

Esta propiedad ii) de absorción puede relajarse y pedirse la validez de una


sola de ellas, en cuyo caso hablaremos de ideal a izquierda si aI ⊂ I para
todo a ∈ R e ideal a derecha si Ia ⊂ I para todo a ∈ R. Obviamente, en el
caso de anillos conmutativos, todos los ideales son biláteros.

Todos los ideales que consideraremos en este curso (salvo contadas excep-
ciones) se asumirán biláteros y hablaremos simplemente de ideales dejando
de lado la palabra bilátero.

• Vemos que el Teorema 6 nos dice que el núcleo Ker φ de un homomorfismo


de anillos φ : R → R0 es un ideal de R. Veremos más adelante que vale la
recı́proca, es decir, todo ideal es el núcleo de algún homomorfismo de anillos
(observar la similitud de esta situación con los subgrupos normales!)
17
• Sea n ∈ N. La función φ : Z → Zn definida como φ(x) = [x] es un
homomorfismo de anillos, pues [x + y] = [x] + [y] y [xy] = [x][y]. Tenemos
que
Ker φ = {x ∈ Z : [x] = [0]}.

Como [x] = [0] si y sólo si n | x, vemos que Ker φ = nZ, con lo cual nZ es
un ideal de Z.

• Sea R un anillo. Es sencillo verificar que los subconjuntos {0} y R mismo


son ideales de R. Estos dos ideales se llaman ideales triviales de R.

• Sea R un anillo con unidad e I un ideal de R. Entonces I = R si y sólo si


1 ∈ R, pues si 1 ∈ I entonces a = a1 ∈ I para todo a ∈ R. En particular,
vemos que los únicos ideales de un cuerpo R son los triviales: si I 6= {0}
entonces existe a ∈ I tal que a 6= 0. Por ser R un cuerpo existe el inverso
a−1 de a. Luego 1 = a−1a ∈ I y ası́ I = R.

• Sean R un anillo y A un subconjunto de R. Sea JA el conjunto de todos los


ideales de R que contienen a A. Vemos que JA 6= ∅ pues R ∈ JA. El ideal
generado por A se define como

(A) = I.
\

I∈JA

Veamos que (A) es un ideal: JA es subgrupo de R pues es una intersección de


subgrupos de R. Sea a ∈ R y sea b ∈ (A). Luego b ∈ I para todo I ∈ JA,
con lo cual ab ∈ I y ba ∈ I para todo i ∈ JA. Esto nos dice que ab y ba
son elementos de (A) y, por lo tanto, (A) es ideal de R. Cuando A es un

18
subconjunto finito de R, digamos A = {a1, . . . , an}, el ideal de R generado
por A suele escribirse como (a1, . . . , an) y en este caso es sencillo verificar
(hacerlo!) que
n
(a1, . . . , an) = { riairi0 : ri, ri0 ∈ R, i = 1, . . . , n}.
X

i=1

Un caso particular de esta situación recibe un nombre especial: un ideal I


de R se dice que es principal si está generado por un elemento, es decir, si
existe a ∈ I tal que I = (a).

• Por ejemplo nZ es un ideal principal de Z (está generado por n). En


realidad, utilizando el algoritmo de la división en Z y el Principio del Buen
Orden se comprueba (hacerlo!) que todo ideal de Z es principal. El anillo Z
es un ejemplo de los denominados dominios de ideales principales, es decir,
dominios de integridad en donde todos los ideales son principales.

Veamos ahora que con los ideales de un anillo R podemos definir una es-
tructura de anillo cociente. Sea I un ideal de R. Al ser (R, +) un grupo
abeliano, tenemos que I es subgrupo normal de R (como grupo aditivos) y,
por lo tanto, tenemos el grupo cociente R/I que es abeliano (comprobarlo!).
Recordar que en el caso de grupos denotados aditivamente, las coclases (los
elementos de R/I) a derecha o izquierda se denotan como I + a o como a + I,
para a ∈ R. Pero por ser (R, +) abeliano las coclases a derecha e izquierda
son las mismas.

Usaremos la notación como coclases a izquierda para denotar a los elemen-

19
tos de R/I, es decir
R/I = {a + I : a ∈ R}.

Tenemos ya un grupo abeliano R/I con la suma de coclases

(a + I) + (b + I) = a + b + I,

y nos falta definir una estructura multiplicativa en R/I. Dados a + I y b + I


elementos de R/I, definimos

(a + I)(b + I) = ab + I.

Nuevamente, como esta operación se define en función de los representantes


de las coclases, tenemos que probar la buena definición de esta operación: si
a + I = a0 + I y b + I = b0 + I entonces existen x e y ∈ I tales que a0 = a + x
y b0 = b + y. Luego

a0b0 = (a + x)(b + y) = ab + ay + xb + xy.

Como I es ideal de R, tenemos que ax, xb y xy pertenecen a I y ası́ ay +


xb + xy ∈ I. Luego

a0b0+I = ab+ay+xb+xy+I = (ab+I)+(ay+xb+xy+I) = (ab+I)+I = ab+I,

pues ay + xb + xy + I = I y la coclase I es el neutro en R/I.

No es difı́cil (hacerlo!) comprobar que el producto de clases arriba definido


en R/I es asociativo y satisface las leyes distributivas iii) de la definición de
anillo.
20
Por lo tanto, el conjunto cociente R/I con la suma y producto de coclases
arriba definidas, es un anillo y se denomina anillo cociente.

Podemos ver ahora que todo ideal es el núcleo de algún homomorfismo de


anillos.

Teorema 7. Sea R un anillo y sea I un ideal de R. La proyección natural

π : R → R/I,

donde π(a) = a + I para todo a ∈ R, es un epimorfismo de anillos tal que


I = Ker π.

Demostración. Claramente π es un homomorfismo de anillos por cómo están


definidas la suma y el producto en R/I. También es inmediato que π es
sobreyectiva. Veamos la segunda afirmación.

Ker π = {a ∈ R : a + I = I},

pero a + I = I si y sólo si a ∈ I, con lo cual I = Ker π.

21
Anillos
1 Teoremas de isomorfismo de anillos

Similar a la terminologı́a que usamos en el caso de grupos, un homomorfismo


de anillos φ : R → R0 es un

• monomorfismo si φ es inyectiva,

• epimorfismo si φ es sobreyectiva, y un

• isomorfismo si φ es biyectiva.

Cuando R0 = R se dice que φ es un endomorfismo de R y si φ es, además,


biyectiva, se dice que φ es un automorfismo de R.

Dos anillos R y R0 son isomorfos si existe un isomorfismo de anillos φ :


R → R0 y lo representamos simbólicamente como R ' R0. Si R ' R0 también
R0 ' R pues si φ : R → R0 es un isomorfismo de anillos, entonces la función
inversa φ−1 : R0 → R también es un isomorfismo de anillos (comprobarlo!).

Enunciamos ahora los teoremas de isomorfismo de anillos que son similares


a los que vimos para el caso de grupos. Las demostraciones quedan como
tarea para el final teórico ya que estos teoremas se demuestran siguiendo las
mismas ideas usadas para probar los teoremas de isomorfismo para grupos.

1
Teorema 8 (Primer teorema de isomorfismo). Sea φ : R → R0 un
homomorfismo de anillos. Entonces

R/Ker φ ' φ(R),

como anillos. En particular, si φ es un epimorfismo entonces R/Ker φ ' R0


como anillos.

Teorema 9 (Teorema de correspondencia). Sea φ : R → R0 un


epimorfismo de anillos y sea I 0 ideal de R0. Entonces φ−1(I 0) es un ideal de
R que contine a Ker φ y, además

φ−1(I 0)/Ker φ ' I 0,

como anillos. La correspondencia I 0 → φ−1(I 0) es uno a uno entre ideales de


R0 e ideales de R que contienen a Ker φ. En particular φ−1({0}) = Ker φ y
φ−1(R0) = R.

Teorema 10 (Segundo teorema de isomorfismo). Sean R un anillo,


S un subanillo de R e I un ideal de R. Entonces

S + I = {s + a : s ∈ S, a ∈ I},

es un subanillo de R e I es ideal de S + I. Además, como anillos

(S + I)/I ' S/S ∩ I.

2
Teorema 11 (Tercer teorema de isomorfismo). Sea R un anillo y
sean I y J ideales de R tales que I ⊂ J. Luego I es ideal de J, el cociente
J/I es ideal de R/I y, además

R/J ' (R/I)/(J/I),

como anillos.

• Sea R el conjunto de la funciones reales definidas en el intervalo [0, 1]. Con


la suma y producto usual de funciones

(f + g)(x) = f (x) + g(x) y (f g)(x) = f (x)g(x),

sabemos que R es un anillo conmutativo con unidad.


Tenemos que el conjunto I = {f ∈ R : f (1/2) = 0} es un ideal de R: si f
y g ∈ I entonces

(f ±g)(1/2) = f (1/2)±g(1/2) = 0 y también (f g)(1/2) = f (1/2)g(1/2) = 0,

con lo cual f ± g ∈ I y f g ∈ I, es decir, I es subanillo de R. Además si


f ∈ R y g ∈ I entonces

(f g)(1/2) = f (1/2)g(1/2) = f (1/2)0 = 0,

y ası́ f g ∈ I. Por ser R anillo conmutativo también tenemos que gf ∈ I.


Por lo tanto I es ideal de R. ¿Qué es el anillo cociente R/I?
Para ver qué es R/I definimos la función φ : R → R como φ(f ) = f (1/2).

3
Tenemos que

φ(f + g) = (f + g)(1/2) = f (1/2) + g(1/2) = φ(f ) + φ(g),

y también

φ(f g) = (f g)(1/2) = f (1/2)g(1/2) = φ(f )φ(g),

con lo cual φ es un homomorfismo de anillos.


Sea α ∈ R. Entonces la función constante Cα (x) = α para todo x ∈ [0, 1]
pertenece a R y φ(Cα ) = Cα (1/2) = α, con lo cual φ es sobreyectiva. Luego
φ es un epimorfismo.
Por otro lado
Ker φ = {f ∈ R : f (1/2) = 0} = I.

Entonces por el Primer teorema de isomorfismo para anillos

R/I ' R,

como anillos.

4
2 Ideales primos e ideales maximales

A lo largo de esta sección los resultados más importantes se darán en término


de anillos conmutativos. Hay dos tipos de ideales que se diferencian del resto
de los ideales en un anillo. Estos son los denominados ideales primos e ideales
maximales.

Sea R un anillo conmutativo. Un ideal I de R se dice que es primo si


I 6= R y además si

ab ∈ I entonces a ∈ I o bien b ∈ I.

• Por ejemplo, los ideales de Z de la forma pZ, con p número primo, son
ideales primos, pues pZ 6= Z y si ab ∈ pZ entonces p | ab, con lo cual p | a o
p | b. Esto nos dice que a ∈ pZ o b ∈ pZ.

Esta propiedad de los números primos:


si un número primo divide a un producto entonces divide a uno de ellos
es una de las principales motivaciones en la creación del concepto de ideal
primo.

• En realidad, los ideales primos de Z son exactamente aquellos de la forma


pZ, con p número primo. Ya vimos que pZ es ideal primo de Z. Supongamos
ahora que nZ es ideal primo de Z. Entonces nZ 6= Z, con lo cual n > 1. Si
n no es primo, entonces existen enteros m ≥ 2 y k ≥ 2 tales que n = km.
Como n ∈ nZ, entonces km ∈ nZ. Luego k ∈ nZ o m ∈ nZ, lo que nos

5
dice que n | k o n | m. Pero esto es un absurdo pues k < n y m < n. Por lo
tanto n tiene que ser un número primo.

• Notar que un anillo conmutativo es un dominio de integridad si y sólo si el


ideal trivial {0} es un ideal primo (comprobarlo!).

Una propiedad interesante de los ideales primos es que permiten caracterizar


a los anillos cocientes que son dominios de integridad.

Teorema 12. Sea R un anillo conmutativo y sea I un ideal de R. Entonces


I es ideal primo de R si y sólo si el cociente R/I es un dominio de integridad
no trivial.

Demostración. Supongamos que I es ideal primo de R. Luego, como I 6= R


el anillo cociente R/I es no trivial, pues hay a + I 6= I para a ∈ R \ I. Si el
producto de dos coclases es nulo, es decir

(a + I)(b + I) = I,

(recordemos que el “cero” en R/I es la coclase I), entonces

ab + I = I,

y esto es equivalente a que ab ∈ I. Luego a ∈ I o b ∈ I y ası́ a + I = I o


b + I = I, es decir, una de las dos coclases es la coclase nula. Por lo tanto,
R/I es un dominio de integridad.
Supongamos ahora que R/I es un dominio de integridad no trivial y veamos
que I tiene que ser primo. Al ser R/I no trivial tenemos que I 6= R.
6
Sea ab ∈ I. Si a ∈ I no hay nada que probar. Si a ∈
/ I entonces a + I 6= I
y, además
I = ab + I = (a + I)(b + I),

con lo cual, al ser R/I un dominio de integridad, la coclase b + I tiene que


ser nula, es decir, b + I = I y ası́ b ∈ I. Por lo tanto I es ideal primo de R.

• Si φ : R → R0 es un isomorfismo de anillos y R0 es un domino de integridad,


entonces R también lo es, pues si ab = 0 en R, entonces

0 = φ(ab) = φ(a)φ(b),

con lo cual φ(a) = 0 o φ(b) = 0. Entonces a ∈ Ker φ o b ∈ Ker φ. Pero por


ser φ biyectiva, Ker φ = {0} y ası́ a = 0 o b = 0.

• Vimos en un ejemplo anterior que si R es el anillo de las funciones reales


definidas en [0, 1], entonces I = {f ∈ R : f (1/2) = 0} es un ideal de R y
además
R/I ' R,

como anillos. Al ser R un dominio de integridad no trivial, R/I también lo


es y ası́ tenemos, por Teorema 12, que I es un ideal primo de R.

7
El conjunto de los ideales primos de un anillo conmutativo R recibe el
nombre de espectro de R y es usualmente denotado como Spec(R). En
general no es una tarea sencilla (a veces muy difı́cil) determinar el espectro
de un anillo. En el caso de Z hemos visto que

Spec(Z) = {pZ : p es primo} ∪ {0}.

Sea R un anillo (no necesariamente conmutativo). Un ideal I de R se dice


que es maximal si I 6= R y si, además, el único ideal de R que lo contiene
propiamente es R mismo. En otras palabras, un ideal I de R es maximal si
para todo ideal J de R tal que I ⊂ J ⊂ R se tiene que J = I o J = R.

• Se puede demostrar utilizando el denominado Lema de Zorn que en los


anillos con unidad todo ideal no trivial está contenido en un ideal maximal.

• Veamos que los ideales maximales del anillo Z son exactamente los ideales
pZ donde p es un número primo. Sea n > 1 un entero. Si n no es primo
entonces existen enteros k ≥ 2 y m ≥ 2 tales que n = km. Luego, por
ejemplo, nZ ⊂ kZ pues si un entero es múltiplo de n también es múltiplo de
k. Por lo tanto, si el ideal nZ es maximal, entonces n tiene que ser primo
(caso contrario el ideal nZ estarı́a contenido en el ideal kZ, que es un ideal
no trivial de Z). Recı́procamente, sea p es primo y sea n un entero positivo
tal que pZ ⊂ nZ (recordar que todos los ideales de Z son de la forma nZ).
Luego n | p con lo cual n = p o n = 1. Entonces nZ es el ideal pZ o el ideal
trivial Z. Por lo tanto pZ es ideal maximal de Z.

8
Vemos que en el caso del anillo Z los ideales maximales y los ideales primos
son los mismos. Esto no se da en general (veremos luego que todo ideal
maximal es primo, pero no recı́procamente) pero en los anillos denomina-
dos dominios de Dedekind ambas clases coinciden. Justamente el anillo Z
es un ejemplo de dominio de Dedekind.

Ası́ como los ideales primos en anillos conmutativos permiten caracterizar


los anillos cociente que son dominios de itegridad, los ideales maximales per-
miten caracterizar los anillos cociente que son cuerpos en el caso de anillos
conmutativos con unidad. Para probar este resultado, primero necesitamos la
siguiente caracterización de los cuerpos.

Teorema 13. Sea R un anillo conmutativo con unidad. Luego R es un


cuerpo si y sólo si los únicos ideales de R son los triviales.

Demostración. Vimos previamente que en un cuerpo los únicos ideales que


hay son los triviales. Recı́procamente, supongamos que en R solo hay ideales
triviales. Sea a ∈ R no nulo. Tenemos que el ideal principal (a) no puede
ser el ideal trivial {0} pues a 6= 0 y a = 1 a ∈ (a). Entonces (a) = R y ası́
1 ∈ (a). Luego existe b ∈ R tal que 1 = ab, es decir, a tiene inverso en R y,
por lo tanto, R es un cuerpo.

9
Teorema 14. Sea R un anillo conmutativo con unidad y sea I un ideal de
R. Entonces I es ideal maximal de R si y sólo si el anillo cociente R/I es un
cuerpo.

Demostración. Tenemos que R/I es conmutativo por ser R conmutativo y,


además, la coclase 1 + I satisface que

(a + I)(1 + I) = a 1 + I = a + I.

Luego R/I es un anillo conmutativo con unidad. Supongamos que I es ideal


maximal de R. Por Teorema 13, basta con demostrar que los únicos ideales
de R/I son los triviales, es decir {I} (el ideal nulo en R/I) o R/I. Sea I 0 un
ideal de R/I. Como la proyección natural

π : R → R/I,

es un epimorfismo de anillos, el Teorema de correspondencia nos dice que


π −1(I 0) es un ideal de R que contiene al núcleo Ker φ = I. Por ser I maximal
se tiene que
I = π −1(I 0) o R = π −1(I 0).

Como π −1({I}) = I y π −1(R/I) = R y la correspondencia es uno a uno,


necesariamente ocurre que I 0 = {I} o que I 0 = R/I y ası́ queda demostrado
que R/I es un cuerpo.
Recı́procamente, sea I ideal de R tal que R/I es un cuerpo. Luego los ide-
ales de R/I son los triviales {I} o R/I. Nuevamente, utilizando la proyección

10
natural
π : R → R/I,

y el Teorema de correspondencia, si J es ideal de R tal que I ⊂ J ⊂ R,


entonces hay un único ideal J 0 de R/I tal que J = π −1(J 0). Pero J 0 = {I}
o J 0 = R/I, con lo cual J = π −1({I}) = I o J = π −1(R/I) = R. Esto nos
dice que I es ideal maximal de R.

Los Teoremas 13 y 14 nos dicen que todo ideal maximal es primo, pues un
cuerpo es, en particular, un dominio de integridad. Como no todo dominio
de integridad es un cuerpo, hay ideales primos que no son maximales. Ve-
remos un ejemplo de esta situación cuando veamos el caso del anillo de
polinomios con coeficientes enteros.

• Si φ : R → R0 es un isomorfismo de anillos y R0 es un cuerpo, entonces R


también es un cuerpo, es decir, R es un dominio de integridad con división
(comprobarlo!)

• En el ejemplo del anillo R de las funciones reales definidas en [0, 1], vimos
que el ideal I = {f ∈ R : f (1/2) = 0} es un ideal primo. Pero I también es
maximal por Teorema 14, pues R/I ' R y R es un cuerpo.

• Recordemos que en el cuerpo de lo números complejos C tenemos la unidad


imaginaria i ∈ C que satisface la ecuación i2 = −1. Consideremos el de-

11
nominado anillo de enteros gaussianos

Z[i] = {a + bi : a, b ∈ Z}.

Es sencillo comprobar que Z[i] es un anillo conmutativo con unidad (hacerlo!).


Los elementos de Z[i] se denominan enteros gaussianos y son utilizados en
la denominada Teorı́a Algebraica de Números.
Sea M = {a + bi ∈ Z[i] : a y b son divisibles por 3}. Tenemos que M es
subanillo de Z[i] pues si a + bi ∈ M y c + di ∈ M entonces

(a + bi) ± (c + di) = (a ± c) + (b ± d)i ∈ M,

pues tanto a ± c como b ± d son divisibles por 3. También

(a + bi)(c + di) = (ac − bd) + (ad + bc)i ∈ M,

pues ac − bd y ad + bc son divisibles por 3.


Veamos que M es un ideal maximal de Z[i]. Sea J un ideal de Z[i] tal que

M ⊂ J ⊂ Z[i].

Si M = J, no hay nada que probar. Por lo tanto, supongamos que M 6= J.


Luego existe un entero gaussiano c + di ∈ J que no está en M . Por lo tanto
3 - c o 3 - d y por el Pequeño Teorema de Fermat

c2 ≡ 1 mod 3 o d2 ≡ 1 mod 3.

Si tanto c como d no son divisibles por 3 entonces c2 + d2 ≡ 2 mod 3 (las

12
congruencias se pueden sumar y multiplicar término a término con el mismo
módulo). Caso contrario, uno de ellos (y sólo uno) es divisible por 3. Luego
c2 ≡ 0 mod 3 o d2 ≡ 0 mod 3 (pero no ambas). Cualquiera sea el caso,
tendremos que c2 + d2 ≡ 1 mod 3. Entonces las posibilidades son que c2 +
d2 ≡ 2 mod 3 o que c2 + d2 ≡ 1 mod 3. Esto implica que c2 + d2 no es
divisible por 3. Si escribimos t = c2 + d2 tenemos que 3 - t y también que

t = c2 + d2 = (c + di)(c − di),

y como c + di ∈ J y c − di es un entero gaussiano, por ser J un ideal vemos


que t ∈ J. Como 3 - t entonces 3 y t son coprimos, y esto implica que existen
enteros n y m tales que
1 = 3n + tm.

Pero t ∈ J y 3 ∈ M ⊂ J, con lo cual tm ∈ J y también 3n ∈ M ⊂ J y ası́


tenemos que 1 = 3n + tm ∈ J. Luego J = Z[i] y queda demostrado que M
es ideal maximal de Z[i].
En particular, por Teorema 14, el cociente Z[i]/M es un cuerpo. Veamos
que Z[i]/M es un cuerpo finito con nueve elementos. Los elementos del co-
ciente son las coclases de la forma

a + bi + M,

donde a + bi es un entero gaussiano. Recordemos que dos coclases a + bi + M


y c + di + M son iguales si (a + bi) − (c + di) ∈ M , es decir, si a ≡ c mod 3
y b ≡ d mod 3. Es sencillo entonces comprobar que las siguientes nueve

13
coclases son distintas entre si:

M 1+M 2+M
i+M 1+i+M 2+i+M
2i + M 1 + 2i + M 2 + 2i + M

Veamos ahora que cualquier otra coclase es igual a una de estas nueve que
figuran en el cuadro. Sea a + bi un entero gaussiano. Como

a≡0 mod 3 o a ≡ 1 mod 3 o a ≡ 2 mod 3,

y también

b≡0 mod 3 o b ≡ 1 mod 3 o b ≡ 2 mod 3,

vemos que la coclase a + bi + M coincide con alguna de las coclases listadas


en en cuadro anterior. Por lo tanto los elementos de Z[i]/M son los nueve
elementos

M, 1 + M, 2 + M, i + M, 1 + i + M, 2 + i + M, 2i + M, 1 + 2i + M, 2 + 2i + M,

lo que muestra que Z[i]/M es un cuerpo finito con nueve elementos. Este
ejemplo muestra también que hay cuerpos finitos que no son de la forma pZ
con p primo.

14
3 La propiedad universal del anillo cociente

Tal como vimos para el caso de grupos, el anillo cociente R/I satisface la
siguiente propiedad universal, lo que permite dar una definición alternativa de
anillo cociente sin dar la construcción explı́cita con coclases. La demostración
queda como tarea para el final teórico.

Teorema 15. Sea R un anillo y sea I un ideal de R. La proyección natural

π : R → R/I,

satisface la siguiente propiedad universal: para todo anillo R0 y todo homomor-


fismo de anillos φ : R → R0 tal que I ⊂ Ker φ, existe un único homomorfismo
de anillos φ̃ : R/I → R0 que hace conmutativo al siguiente diagrama:

φ
R R0

π φ̃

R/I

• Recordando lo hecho con grupos, ¿cómo se podrı́a definir el anillo cociente


R/I utilizando esta propiedad universal?

15
4 Cuerpo de fracciones. Localización

Finalizamos estas notas con el concepto de cuerpo de fracciones, que es, en


pocas palabras, el cuerpo “más pequeño” que contiene a un dominio de in-
tegridad. Se imita lo que ocurre con el domino de integridad Z y el cuerpo
de números racionales Q, cuyos elementos se consideran fracciones formadas
por enteros. No hay cuerpo intermedio entre Z y Q, con lo cual Q es el
menor cuerpo que contiene a Z y, por lo tanto, Q recibe el nombre de cuerpo
de fracciones de Z. La idea del procedimiento abastracto para construir el
cuerpo de fracciones de un domino de integridad se basa en lo que ocurre con
las fracciones de Q. Por ejemplo, la fracciones 2/4, 3/6 y 5/10 representan la
misma fracción 1/2 (despues de “simplificar” los factores comunes entre nu-
merador y denominador). Uno podrı́a pensar, de manera más formal, que la
fracción 1/2 es un representante de una clase de equivalencia en donde están
toda las fracciones que coinciden con 1/2 despues de simplicar numerador y
denominador, como 2/4, 3/6, 5/10, etc.

Sea R un dominio de integridad y sea R∗ el conjunto de los elementos no


nulos de R. Definimos en R × R∗ la siguiente relación:

(a, b) ∼ (c, d) si y sólo si ad = bc.

Veamos que es de equivalencia: claramente (a, b) ∼ (a, b) pues ab = ba.


Supongamos que (a, b) ∼ (c, d) entonces ad = bc, con lo cual da = cb y ası́
(c, d) ∼ (a, b). Finalmente si (a, b) ∼ (c, d) y (c, d) ∼ (e, f ) entonces ad = bc
y cf = de. Luego a(de) = b(ce) entonces a(cf ) = b(ce) y ası́ af = be. Esto
16
quiere decir que (a, b) ∼ (e, f ).
Cada clase de equivalencia [(a, b)] será denotada con el sı́mbolo de fracción
a/b y hablaremos de fracciones. No hay que olvidar que en este contexto,
cuando escribimos a/b con a ∈ R y b ∈ R∗ estamos denotando a un conjunto,
es decir
a/b = {(c, d) ∈ R × R∗ : (c, d) ∼ (a, b)}.

Notar que si consideramos esta relación de equivalencia en Z × Z∗ tenemos


que, por ejemplo,

1/2 = {(n, m) ∈ Z × Z∗ : 2n = m},

con lo cual las clases de equivalencia 1/2, 2/4, 3/6, 5/10, etc son todas iguales
entre sı́.
Sea RR∗ el conjunto de todas las fracciones a/b con a ∈ R y b ∈ R∗.
Veamos ahora que podemos definir una suma y un producto con estas frac-
ciones, imitando el caso de los números racionales.

Sean a/b y c/d dos fracciones. Definimos

a/b + c/d = (ad + cb)/bd.

Notar que, al ser R un dominio de integridad, bd ∈ R∗ pues b 6= 0 y d 6= 0


con lo cual bd 6= 0. En términos de clases de equivalencia, esta definición se
define como
(a, b) + (c, d) = (ad + cb, bd).

Veamos que está bien definida, es decir, que no depende de los representantes
17
elegidos en cada clase de equivalencia: si a/b = ã/b̃ y c/d = c̃/d˜ entonces

ab̃ = bã y cd˜ = dc̃.

Tenemos que comprobar que

(ad + cb)/bd = (ãd˜ + c̃b̃)/b̃d,


˜

y para eso hay que verificar que

(ad + cb)b̃d˜ = bd(ãd˜ + c̃b̃).

Esta igualdad es cierta pues

(ad + cb)b̃d˜ = adb̃d˜ + cbb̃d˜


= (ab̃)dd˜ + (cd)b
˜ b̃

= (ãb)dd˜ + (dc̃)bb̃
= bd(ãd˜ + c̃b̃),

con lo cual hemos demostrado que el resultado de la suma a/b + c/d no


depende del representante elegido.
Definimos ahora el producto de dos fracciones a/b y c/d como

(a/b) (c/d) = (ac)/(bd).

Nuevamente hay que verificar la buena definición: si a/b = ã/b̃ y c/d = c̃/d˜

18
˜ es decir que
entonces hay que comprobar (ac)/(bd) = (ãb̃)/(c̃d),

˜ = (bd)(ãc̃).
(ac)(b̃d)

Esta igualdad es cierta pues

˜ = (ab̃)(cd)
ac(b̃d) ˜ = (bã)(dc̃) = (bd)(ãc̃),

con lo cual hemos demostrado que el resultado del producto (a/b) (c/d) no
depende del representante elegido.

La fracción 0/b con b ∈ R∗ se denomina fracción nula y se la denota direc-


tamente como 0 (es un ejemplo de lo que se llama “abuso de notación” pues
con 0 se denota al neutro aditivo de R, pero el contexto nos dice claramente
cuando tratamos a 0 como elemento de R o de RR∗ ). Notar que 0/b = 0/d
para todo b, d ∈ R∗ pues 0d = 0 = b0. En particular, podemos escribir a la
fracción nula como 0/1 para demostrar propiedades. Por ejemplo, se cumple
que
0 + a/b = a/b = 0 + a/b,

pues 0 + a/b = 0/1 + a/b = (0b + 1 a)/(1 b) = a/b y de la misma manera se


demuestra que a/b + 0 = a/b. Es decir, la fracción nula es neutro aditivo en
RR ∗ .

Por otro lado la fracción 1/1 se escribirá directamente como 1 (otro ejemplo
de “abuso de notación”) y vemos que

1 (a/b) = (1/1) (a/b) = (1 a)/(1 b) = a/b,

19
y de igual manera se ve que (a/b) 1 = a/b, con lo cual la fracción 1/1 es
elemento neutro para el producto en RR∗ .

Sucede que mucho más es cierto: RR∗ con estas operaciones es un cuerpo y
lo enunciamos en el siguiente teorema, cuya demostración (algo tediosa pero
bastante directa) queda como ejercicio.

Teorema 16. Sea R un dominio de integridad y sea R∗ el conjunto de los


elementos no nulos de R. Entonces el conjunto RR∗ de las fracciones a/b con
a ∈ R y b ∈ R∗ es un cuerpo con la suma y el producto de fracciones recién
definidos. El cuerpo RR∗ recibe el nombre de cuerpo de fracciones de R.

Tenemos entonces un cuerpo formado con fracciones a partir de un dominio


de integridad R. Veamos ahora que podemos considerar que R está “incluido”
en RR∗ (ası́ como consideramos a Z subconjunto de Q). Definimos la función

φ : R → RR ∗ ,

como φ(a) = a/1. Tenemos que φ es un monomorfismo de anillos, pues

φ(a + b) = (a + b)/1 = a/1 + b/1 = φ(a) + φ(b),

y también
φ(ab) = (ab)/1 = (a/1)(b/1) = φ(a)φ(b),

con lo cual φ es un homomorfismo de anillos. Por otra parte si φ(a) = φ(b)


entonces a/1 = b/1, pero por definición de igualdad de fracciones, tenemos
que a = a 1 = 1 b = b. Luego φ es inyectiva.
20
Esto nos dice que φ(R) = {a/1 : a ∈ R} es un subanillo de RR∗ isomorfo
a R y ası́ podemos identificar a cada elemento a ∈ R con la fracción a/1.
De esta manera es que se considera que el cuerpo RR∗ contiene al anillo R
(aunque, formalmente, sabemos que contiene a una copia de R, es decir, un
subanillo isomorfo a R).

Con esta convención es sencillo demostrar (hacerlo!) que si F es un cuerpo


intermedio, es decir
R ⊂ F ⊂ RR∗ ,

entonces F = RR∗ , con lo cual RR∗ es el menor cuerpo que contiene a R.

La construcción del cuerpo de fracciones de un dominio de integridad es un


caso particular de un prodecimiento abstracto que se denomina localización.

Sea R un domino de integridad y sea S ⊂ R un monoide multiplicativo


(es decir, si a y b ∈ S entonces ab ∈ S) tal que 1 ∈ S pero 0 ∈
/ S (por
ejemplo, S = R∗ cumple con estas condiciones). Definimos una relación de
equivalencia en R × S como

(a, s) ∼ (b, s0) si y sólo si as0 − sb = 0.

El argumento para demostrar que tal relación es de equivalencia es el mismo


que usamos para el caso particular S = R∗.

El conjunto de las clases de equivalencia se denotará como RS y la clase de


equivalencia [(a, s)] se denotará como la fracción a/s (por esta razón alguno
autores escriben S −1R en lugar de RS ).
21
• De la misma manera que en el caso S = R∗, se define la suma y el producto
de fracciones que transforman a RS es un dominio de integridad. El dominio
de integridad RS recibe el nombre de localización de R con respecto a S.

• Es sencillo verificar (hacerlo!) que la función φ : R → RS es un monomor-


fismo de anillos con lo cual podemos considerar a R como un subanilllo de RS
(igual a lo que hicimos con R y RS ).

• Un caso importante es cuando S es el complemento de un ideal primo de


R, es decir, si I es un ideal primo de R, se define

S = R \ I = {r ∈ R : r ∈
/ I}.

No es difı́cil verificar que S es un monoide multiplicativo tal que 1 ∈ S pero


0∈
/ S (comprobarlo!). Para expresar la dependencia del ideal I, en lugar de
escribir RS es usual escribir RI (otro abuso de notación pues I no cumple con
las condiciones que se pide a S).

Se puede demostrar que la localización RI es un domino de integridad que


tiene un único ideal maximal. Los anillos conmutativos que tienen un único
ideal maximal se denominan anillos locales y es común referirse a RI
como el anillo local de R en I. Los anillos locales se encuentran con
frecuencia en el Álgebra Conmutativa, la Geometrı́a Algebraica y la Teorı́a
Algebraica de Números.

22
5 Operaciones con ideales

Los ideales de un anillo R pueden ser “sumados” y “multiplicados” de tal


modo que se obtienen ideales nuevamente.
Sea R un anillo y sean I y J ideales de R. Se define la suma de I con J
como
I + J = {a + b : a ∈ I, b ∈ J},

mientras que el producto de I con J se define como


n
IJ = { aibi : n ∈ N, ai ∈ I, bi ∈ J.}
X

i=1

En otras palabras, IJ es el ideal generado por el conjunto de todos los ele-


mentos de la forma ab con a ∈ I y b ∈ J.

Teorema 17. Sea R un anillo y sean I y J ideales de R. Entonces I + J e


IJ son ideales de R. Además
1) I + J es el menor (en el sentido de la inclusión) ideal de R que contiene a
I y a J.

2) I ∩ J es un ideal de R que contiene a IJ.

Demostración. Verificar que I + J, IJ e I ∩ J son ideales de R queda como


ejercicio. Veamos 1). Claramente I ⊂ I + J y J ⊂ I + J. Sea L un ideal de
R que contiene a I y a J. Entonces a + b ∈ L para todo a ∈ I y para todo
b ∈ J. Luego
I + J ⊂ L,

23
con lo cual I + J ⊂ L para todo ideal L de R que contiene a I y a J.
Veamos 2). Sean a ∈ I y b ∈ J entonces ab ∈ I (por ser I ideal) y también
ab ∈ J (por ser J ideal), es decir, ab ∈ I ∩ J. Luego si a1, . . . , an ∈ I y
b1, . . . , bn ∈ J entonces
n
aibi ∈ I ∩ J,
X

i=1

con lo cual IJ ⊂ I ∩ J. 

En algunos casos es posible “calcular” la suma y el producto, es decir, ex-


presar la suma y el producto de dos ideales en terminos de otro ideal concreto.
Por ejemplo, para los ideales nZ y mZ de Z se tiene que

nZ + mZ = dZ,

donde d = m.c.d(n, m), pues por un lado d | n (y también d | m) con lo cual


nZ ⊂ dZ (y también mZ ⊂ dZ) y ası́ nZ + mZ ⊂ dZ.
Por otro lado, existen enteros k y t tales que d = kn + tm, con lo cual
d ∈ nZ + mZ entonces dZ ⊂ nZ + mZ.
¿Qué se podrı́a decir del producto de los ideales nZ y mZ de Z?
Finalmente, tenemos la suma directa de ideales un anillo R, que no es
otra cosa que el producto directo de grupos, al que se le adiciona una operación
de producto. Como la estructura de grupo en los ideales es aditiva, es usual
escribir I ⊕ J en lugar de I × J para el producto directo de dos ideales.
Formalmente, si I y J son ideales de R, la suma directa de I y J se define
como
I ⊕ J = {(a, b) : a ∈ I, b ∈ J},

24
y con las operaciones

(a, b) + (c, d) = (a + c, a + d) y (a, b)(c, d) = (ac, bd),

se tiene que I ⊕ J es un anillo (comprobarlo!).

25
Anillos
1 Anillos de polinomios

A lo largo de estas notas R será un dominio de integridad con unidad 1 6= 0.


Informalmente un “polinomio en x” sobre R, o con coeficientes en R, es una
expresión del tipo
a0 + a1x + a2x2 + · · · + anxn,

donde a0, a1, a2, . . . , an son elementos de R (los coeficientes del polinomio).
En los cursos de Cálculo este tipo de expresiones son consideradas como fun-
ciones de una variable real x y solemos llamarlas funciones polinomiales.
En estos casos R = R y ası́ tenemos, por ejemplo, las funciones lineales
f (x) = ax + b, la funciones cuadráticas f (x) = ax2 + bx + c, etc.

En este curso introduciremos la noción de polinomio sobre R como elemen-


tos de un anillo abstracto en donde los polinomios no se consideran como
funciones, tal como ocurre en los cursos de Cálculo.

Sea R un cuerpo y sea S el monoide multiplicativo con unidad generado


por las potencias de un sı́mbolo x, es decir

S = {xi : i ∈ N ∪ {0}},

con el producto en S definido como xixj = xi+j donde x0 se define como


1 ∈ R. Definimos el conjunto R[x] de los polinomios sobre R como el
1
conjunto de todas las combinaciones lineales finitas sobre R con los elementos
de S. Es decir

R[x] = {a0x0 + a1x + a2x2 + · · · + anxn : n ∈ N y ai ∈ R para 0 ≤ i ≤ n}


= {a0 + a1x + a2x2 + · · · + anxn : n ∈ N y ai ∈ R para 0 ≤ i ≤ n}

La elección del sı́mbolo x en la definición del monomio S es totalmente ar-


bitraria y es una cuestión de tradición, nada cambia al elegir cualquier otro
sı́mbolo para definir S.

Dos polinomios sobre R

a0 + a1x + a2x2 + · · · + anxn y b0 + b1x + b2x2 + · · · + bmxm,

se dice que son iguales si n = m y ai = bi para i = 0, . . . , n.

Cuando un coeficiente de un polinomio sobre R es nulo, es usual omitir


el elemento de S correspondiente a tal coeficiente. Por ejemplo, en lugar de
escribir a + 0x + x2, escribimos a + x2.

Sea f = a0 + a1x + a2x2 + · · · + anxn ∈ R[x]. El grado de f se denota


como deg(f ) y se define como

n, si n = max{i : ai 6= 0}.









deg(f ) =  0, si an = · · · = a1 = 0 y a0 6= 0.




∞, si an = · · · = a1 = a0 = 0.





Asumiremos que para todo entero n vale que ∞ > n también que ∞ + n =
2
∞ = n + ∞.

El polinomio nulo de R[x] es aquel que tiene todos sus coeficientes nulos
y se lo denota con 0, es decir, 0 = 0 + 0x + · · · + 0xn para todo n ∈ N.

El polinomio nulo y los polinomios de grado cero se denominan poli-


nomios constantes.

Sea f un polinomio no nulo sobre R de grado n ≥ 0. El coeficiente an de


xn se denomina coeficiente principal de f .
Definimos dos operaciones en R[x], una de suma (o adición) de polinomios
y otra de producto de polinomios: sean f y g dos polinomios no nulos sobre
R de grados n y m respectivamente, digamos

f = a0 + a1x + a2x2 + · · · + anxn y g = b0 + b1x + b2x2 + · · · + bmxm.

Sea k = max{n, m}. La suma de f y g es el polinomio f + g sobre R de


grado k definido como

f + g = c0 + c1 x + · · · + ck xk ,

donde ci = ai + bi para i = 0, 1, . . . , k.

El producto de f y g es el polinomio f g sobre R de grado n + m definido


como
f g = c0 + c1x + · · · + cn+mxn+m,

donde
i
ci = ai−j bj , para i = 0, 1, . . . , n + m.
X

j=0

3
Es decir
c 0 = a0 b0 ,
c 1 = a1 b0 + a0 b1 ,
c2 = a2b0 + a1b1 + a0b2,
c3 = a3b0 + a2b1 + a1b2 + a0b3,
...

cn+m = anbm
Este producto de polinomios no es otra cosa que la manera usual en que
multiplicamos polinomios en los cursos de Cálculo, distribuyendo y sacando
factor común a las potencias iguales de la variable x. Por ejemplo, para
calcular (a0 + a1x)(b0 + b1x) de la manera “usual” harı́amos

(a0 + a1x)(b0 + b1x) = a0b0 + a0b1x + a1b0x + a1b1x2


= a0b0 + (a1b0 + a0b1)x + a1b1x2,

y esto coincide con la fórmula anterior.

Teorema 18. R[x] es un dominio de integridad con unidad con las


operaciones de suma y producto recién definidas.

Demostración. La demostración de que R[x] es un anillo conmutativo con


unidad queda como ejercicio (hay que tener un poco de paciencia!). Veamos
que si f y g polinomios no nulos entonces f g también es no nulo. Al ser f y g
polinomios no nulos tenemos que los grados de f y g son enteros no negativos,
digamos n = deg(f ) y m = deg(g). Sean an y bm los coeficientes principales

4
de f y g respectivamente. Por ser R un dominio de integridad, anbm 6= 0 pues
an 6= 0 y bn 6= 0. Luego anbm es el coeficiente principal de f g, lo que implica
que f g tiene, al menos, un coeficiente no nulo, es decir f g 6= 0. 

El Teorema 17 es falso cuando R no es un dominio de integridad, pues 2x


y 3x son polinomios no nulos de Z6[x] pero 2x3x = 6x = 0 en Z6[x].

Veamos ahora alguna propiedades del grado que serán de utilidad en todo
lo que sigue.
Lema 19. Sean f y g dos polinomios sobre R.
1) Si f y g son no nulos entonces deg(f g) = deg(f ) + deg(g).

2) Si f + g 6= 0 entonces deg(f + g) ≤ deg(f ) + deg(g).

Demostración. Sean n = deg(f ) y m = deg(g) y sean an y bm los coeficientes


de xn y xm en f y g respectivamente. Luego an 6= 0 y bm 6= 0.
Veamos 1). Sabemos que f g es un polinomio no nulo de grado n + m por
Teorema 18 y, además, el coeficiente principal de f g es anbm. Luego

deg(f g) = n + m = deg(f ) + deg(g).

Veamos 2). Tenemos ahora que f + g no es el polinomio nulo. Si uno de ellos


es el polinomio nulo, entonces

deg(f ) + deg(g) = ∞ > deg(f + q),

pues deg(f + g) ∈ N ∪ {0} ya que f + g 6= 0.


5
Supongamos entonces que f y g son no nulos. Notemos que

max{n, m} ≤ n + m,

pues n y m son enteros no negativos y si n ≥ m entonces max{n, m} = n ≤


n + m y lo mismo se concluye si m > n. Luego

deg(f + g) = max{n, m} ≤ n + m = deg(f ) + deg(g).


Recordemos que en los cursos de Cálculo es posible dividir entre polinomios,
logrando un cociente y un resto (y hay varios procedimientos para lograr tal
división). En el contexto abstracto del anillo F [x] de polinomios sobre un
cuerpo F , también podemos dividir polinomios y el resultado se conoce como
algoritmo de la división en F [x].

Teorema 20. Sea F un cuerpo y sean f y 0 6= g dos polinomios sobre F .


Existen únicos polinomios q y r sobre F tales que

f = qg + r,

donde r = 0 o, en caso contrario, deg(r) < deg(g).

Demostración. Demostramos primero la existencia de los polinomios q y r y


luego demostraremos la unicidad.
Si f = 0 entonces q = r = 0 y si deg(f ) < deg(g), entonces q = 0 y r = f .

6
Podemos suponer entonces que deg(f ) ≥ deg(g). Procedemos por in-
ducción sobre el grado de f .
Si deg(f ) = 0 entonces deg(g) = 0 pues g 6= 0. Luego f = a y g = b donde
a, b ∈ F son no nulos. Entonces

f = a = (ab−1)b = (ab−1)g,

con lo cual q = ab−1 y r = 0. Supongamos que el teorema es cierto para todo


polinomio no nulo de grado menor o igual a n − 1. Sea f ∈ F [x] de grado n,
digamos
f = a0 + a1 x + · · · + an xn ,

de modo que an es su coeficiente principal. Escribimos

g = b 0 + b1 x + · · · + bm x m ,

donde bm es el coeficiente principal de g, con lo cual deg(g) = m y recordemos


que estamos asumiendo que n ≥ m.
Al multiplicar g por el polinomio anb−1
m x
n−m
nos queda

anb−1
m x
n−m
g = anb−1
m b0 x
n−m
+ anb−1
m b1 x
n−m+1
+ · · · + an xn .

Al restar este polinomio a f nos queda un polinomio h sobre F de grado


menor a n, pues en ambos aparece repetido, al menos, el término anxn. Es
decir, si
h = f − anb−1
m x
n−m
g,

entonces deg(h) < n. Por hipótesis inductiva existen polinomios q1 y r sobre

7
F tales que
h = q1g + r,

donde r = 0 o, en caso contrario, deg(r) < deg(g). Esto quiere decir que

f − anb−1
m x
n−m
g = q1g + r,

con lo cual
f = (anb−1
m x
n−m
+ q1)g + r.

Si hacemos q = (anb−1
m x
n−m
+ q1) tenemos que q y r son polinomios sobre F
tales que
f = qg + r,

donde r = 0 o, en caso contrario, deg(r) < deg(g). Luego, por el Principio


de Inducción la parte de la existencia del teorema queda demostrada.
Veamos ahora la unicidad de q y r. Si q̃ y r̃ son polinomios sobre F tales
que
f = q̃g + r̃,

donde r̃ = 0 o, en caso contrario, deg(r̃) < deg(g), entonces

qg + r = q̃g + r̃,

con lo cual (q − q̃)g = r̃ − r.


Supongamos que r 6= r̃. Esto implica que tanto r̃ − r como q − q̃ son
polinomios no nulos. Luego deg(q − q̃) ≥ 0 y por Lema 19 tenemos que

deg(r̃ − r) = deg((q − q̃)g) = deg(q − q̃) + deg(g) ≥ deg(g),

8
pero, por otro lado, si ambos r y r̃ son no nulos

deg(r̃ − r) ≤ max{deg r, deg r̃} < deg g,

lo que es una contradicción. Si r = 0 entonces necesariamente r̃ 6= 0. Luego


(q − q̃)g = r̃ y entonces

deg r̃ = deg(q − q̃) + deg g ≥ deg g,

lo que es, nuevamente, una contradicción. Una contradicción similar se obtiene


si r̃ = 0.
Por lo tanto r = r̃. Entonces (q − q̃)g = 0 y, por ser F [x] un dominio
de integridad y g 6= 0, necesariamente tiene que ser q − q̃ = 0, es decir que
q = q̃. 

Cuando se trabaja en un cuerpo, algunos autores escriben el producto ab−1


de un elemento a por el inverso de otro elemento b, como la fracción a/b
y es en este sentido que debe entenderse esta notación con fracciones, es
solamente una manera de escribir ab−1.

El algoritmo de la división en F [x] permite utilizar un argumento similar


al que usamos para probar que en Z todos los ideales son principales. Mucho
más aún, ambos anillos son ejemplos de dominios de ideales principales, es
decir, dominios de integridad cuyos ideales son principales. Esta propiedad,
y otras que veremos luego, hacen que los anillos Z y F [x] tengan muchas
propiedades en común, aunque no son isomorfos como anillos (¿por que?).

9
Teorema 21. Sea F un cuerpo. Entonces F [x] es un dominio de ideales
principales.

Demostración. Por Teorema 18 ya sabemos que F [x] es un dominio de


integridad. Veamos que todo ideal de F [x] es principal. Sea I ideal de F [x].
Si I es l trivial, es decir, I = {0} o I = F [x], entonces I es principal pues
I = (0) o I = (1).
Supongamos entonces que I es un ideal no trivial de F [x]. Al ser I 6= (0)
hay polinomios no nulos en I. Notemos que el único polinomio constante en
I es el polinomio nulo, pues si a ∈ F ∩ I y a 6= 0, luego 1 = a−1a ∈ I y
esto implica que I = F [x]. Por lo tanto, los elementos de I son, además del
polinomio nulo, polinomios de grado positivo.
Como el conjunto de los grados de los polinomios no nulos en I son enteros
positivos, el Principio de Buena Ordenación asegura la existencia en I de un
polinomio de mı́nimo grado positivo posible, es decir, existe g ∈ I tal que

0 < deg(g) ≤ deg(f ),

para todo f ∈ I no nulo.


Por ser I un ideal, tenemos que (g) ⊂ I. Sea f ∈ I no nulo. Por el
Algoritmo de la división en F [x] (Teorema 20) existen únicos polinomios q y
r sobre F tales que
f = qg + r,

donde r = 0 o, caso contrario, deg(r) < deg(g). Si r 6= 0 entonces, por ser f

10
y qg elementos de I
r = f − qg ∈ I,

y esto contradice la minimalidad del grado de g en I. Por lo tanto r = 0 y ası́

f = qg,

lo que nos dice que I ⊂ (g). Luego I = (g), es decir, I es ideal principal.

En la demostración del Teorema 21 hemos visto que todo ideal de F [x] es


principal y cuando un ideal I de F [x] es no nulo se tiene que I está gen-
erado por un polinomio de I de menor grado positivo posible. Claramente
tal generador no es único, pues si I = (g) y a ∈ F es no nulo, entonces
I = (ag) (comprobarlo!).
La unicidad del generador de I 6= (0) se consigue si se pide que tal gene-
rador sea un polinomio mónico, es decir, un polinomio con coeficiente
principal 1. Veamos que en cada ideal I 6= (0) hay un único polinomio
mónico que genera a I: por un lado si I = (g) y g no es mónico, entonces
si a es su coeficiente principal, tenemos que I = (a−1g) y el polinomio
a−1g es mónico, con lo cual todo ideal no nulo de F [x] tiene un generador
mónico.

11
Si g y h son mónicos y generan a I, ambos son del mismo menor grado
positivo posible. Como (g) = I = (h) uno es múltiplo del otro, es decir,
existen polinomios r y s sobre F tales que g = rh y h = sg. Como g
y h tienen el mismo grado, necesariamente r y s son constantes pues, por
ejemplo, deg(g) = deg(r) + deg(h) = deg(r) + deg(g), y ası́ deg(r) = 0 (lo
mismo se deduce para s). Luego, por ser g y h mónicos, debemos tener que
r = 1 (y también que s = 1), con lo cual g = h.

Veamos ahora que en el anillo R[x] se pueden definir conceptos similares a


los de divisibilidad, máximo común divisor y coprimalidad que se tienen con
los números enteros.

Sean f y g polinomios sobre R. Decimos que f divide a g en R[x] si existe


un polinomio h sobre R tal que g = hf . Tal como en el caso de números
enteros, escribimos f | g si f divide a g.

• Si f | g en R[x] entonces existe h ∈ R[x] tal que g = hf , con lo cual

deg(g) = deg(hf ) = deg(h) + deg(f ) ≥ deg(f ).

En el caso de números enteros, si n | m entonces |m| ≥ |n|.

• Notar también que f | g en R[x] si y sólo si (g) ⊂ (f ) (comprobarlo!). Lo


mismo ocurre en Z cuando n | m.
Sean f y g dos polinomios sobre R y supongamos que, al menos, uno de
ellos es no nulo. Un polinomio mónico d ∈ R[x] se dice que es el máximo
común divisor de f y g si
12
1) d | f y d | g,

2) Si h | f y h | g entonces h | d.

Si tal polinomio mónico d existe, escribiremos d = mcd(f, g). Notar que


mcd(f, g), si existe, es un divisor común de f y g del mayor grado posible
(comparar con la definición de máximo común divisor en Z).

Veremos ahora que mcd(f, g) existe cuando R es un cuerpo y si uno de


ellos es un polinomio no nulo.

Teorema 22. Sea F un cuerpo y sean f y g polinomios sobre F y


supongamos que g 6= 0. Entonces mcd(f, g) existe, es único y, además,
existen polinomios h1 y h2 sobre F tales que

mcd(f, g) = h1f + h2g.

Demostración. Sea I el conjunto de todas las combinaciones lineales de f y


g sobre F [x], es decir

I = {rf + sg : r, s ∈ F [x]}.

Veamos que I es un ideal no nulo de F [x]: al ser f 6= 0, vemos que f ∈ I


(tomando r = 1 y s = 0), con lo cual I 6= (0). Por otro lado sean

rf + sg y r̃f + s̃g,

13
dos elementos de I. Entonces

(rf + sg) ± (r̃f + s̃g) = (r ± r̃)f + (s ± s̃)g = r0f + s0g ∈ I.

También

(rf + sg)(r̃f + s̃g) = rr̃f 2 + rsf g + sr̃f g + ss̃g 2


= (rr̃f + rsg)f + (sr̃f + ss̃g)g
= r̂f + ŝg ∈ I,

con lo cual I es un ideal de F [x]. Por Teorema 21 (y las observaciones que le


siguen) existe un único polinomio mónico d ∈ F [x] que genera a I, es decir
I = (d). Como f y g ∈ I entonces f y g son múltiplos de d, con lo cual d | f
y d | g.
Por otro lado, como d ∈ I (pues 1 ∈ F ), entonces existen h1 y h2 ∈ F [x]
tales que
d = h1f + h2g.

Si h ∈ F [x] es tal que h | f y h | g, entonces existen polinomos u y v sobre


F tales que uh = f y vh = g. Luego

d = h1uh + h2vh = (h1u + h2v)h,

con lo cual d|h. Luego d = mcd(f, g) y es único.


Dos polinomios f y g sobre R se dice que son coprimos si mcd(f, g) = 1.

14
Utilizando el Teorema 22, no es difı́cil demostrar el siguiente resultado que
queda como ejercicio.

Teorema 23. Sea F un cuerpo y sean f y g dos polinomios sobre F .


Entonces
i) f y g son coprimos si y sólo si existen polinomios h1 y h2 sobre F tales
que 1 = h1f + h2g.

ii) Si f y g son coprimos y f | hg entonces f | h.

Definimos ahora una clase importante de polinomios que juegan un papel


similar al de los números primos en el anillo Z.

Un polinomio f sobre R de grado positivo se dice que es irreducible


sobre R si f no se puede expresar como producto de dos polinomios sobre R
de grado positivo. En otras palabras, f ∈ R[x] de grado positivo es irreducible
sobre R si la igualdad f = hg en R[x] implica que deg(h) = 0 o deg(g) = 0,
es decir, uno de los polinomios h o g es constante. Cuando un polinomio sobre
R no es irreducible sobre R, decimos que es reducible sobre R.

• La propiedad de ser irreducible depende fuertemente del dominio de integri-


dad que se considere. Por ejemplo el polinomo x2 − 2 es irreducible sobre Q,
pues si h y g son dos polinomios sobre Q no constantes tales que x2 − 2 = hg,
entonces h y g tienen que ser lineales, es decir, h = ax + b y g = a−1x + c
donde a, b y c ∈ Q. Luego

x2 − 2 = (ax + b)(a−1x + c) = x2 + (ac + ba−1)x + bc,

15
con lo cual ac + ba−1 = 0 y bc = −2. Entonces b = −a2c y ası́ (ac)2 = 2.

Esto es una contradicción pues ac ∈ Q pero 2 es irracional. Si embargo,
x2 − 2 es reducible sobre R pues
√ √
x2 − 2 = (x + 2)(x − 2),
√ √
y ambos polinomios x + 2 y x− 2 son polinomios sobre R y no son
constantes.

• Es sencillo verificar que todo polinomio lineal sobre R es irreducible sobre


R (comprobarlo!).

En general no es sencillo determinar si un polinomio sobre un dominio de


integridad R es irreducible sobre R. Es un problema difı́cil, aún cuando R
es un cuerpo, y es quizás tan difı́cil como determinar si un entero positivo
dado es primo o no.

• Hay un resultado que se conoce como criterio de Eisenstein que permite


construir polinomios irreducibles en Q[x] a partir de polinomios en Z[x]. Este
criterio establece que si f = a0 + a1x + · · · + an−1xn−1 + xn es un polinomio
mónico no constante con coeficientes enteros, entonces f es irreducible en Q[x]
si existe un número primo p tal que p | ai para i = 0, . . . , n − 1 pero p2 - a0.

Una propiedad importante de los polinomios irreducibles es que determinan


los ideales maximales de F [x].

16
Teorema 24. Sea F un cuerpo y sea f un polinomio sobre F de grado
positivo. Entonces f es irreducible sobre F si y sólo si el ideal (f ) es maximal.

Demostración. Supongamos que f es irreducible sobre F . Sea J un ideal


de F [x] tal que (f ) ⊂ J. Por Teorema 21, existe g ∈ F [x] tal que J = (g).
Como (f ) ⊂ (g) tenemos que f es múltiplo de g, es decir, existe h ∈ F [x]
tal que f = hg. Luego, por ser f irreducible sobre F , o bien h es constante
o bien g es constante. Si h es constante, entonces h = a ∈ F y ası́ f = ag.
Esto implica que
(f ) = (ag) = (g) = J.

Si g es constante, entonces 1 ∈ J (¿por qué?) con lo cual J = F [x]. Por lo


tanto el ideal (f ) es maximal.
Recı́procamente, supongamos ahora que el ideal (f ) es maximal. Si f no es
irreducible sobre F entonces existen polinomios h y g sobre F no constantes
tales que f = hg. Si (g) = F [x] entonces 1 ∈ (g) con lo cual existe r ∈ F [x]
tal que 1 = rg. Pero esto nos dice que r 6= 0 y ası́ 0 = deg(1) = deg(r) +
deg(g) > 0, una contradicción. Luego (g) 6= F [x] (y un argumento similar
muestra que (h) 6= F [x]). Tenemos ası́ un ideal no trivial (g) tal que (f ) ⊂ (g)
pues f es múltiplo de g. Por ser (f ) maximal y ser (g) 6= F [x], debemos tener
que (f ) = (g). Esto nos dice que g es múltiplo de f , es decir, existe r ∈ F [x]
tal que g = rf . Luego
f = hg = (hr)f,

y entonces deg(f ) = deg(hr) + deg(f ), lo que implica que deg(hr) = 0, es

17
decir hr es constante y, por lo tanto, hr = 1. Esto nos dice que 1 ∈ (h) con
lo cual (h) = F [x], una contradicción. Luego f es irreducible sobre F .

• Consideremos el anillo de polinomios Z[x] (que es un dominio de integridad


pues Z lo es) y consideremos el ideal principal (x), el ideal de Z[x] generado
por el polinomio lineal x. Veamos que el anillo cociente Z[x]/(x) es un dominio
de integridad pero no es un cuerpo: notemos primero que los elementos del
cociente son las coclases de la forma n + (x) donde n ∈ Z, pues la parte
no constante de un polinomio está en el ideal (x) (¿por qué?). Definimos la
función
φ : Z[x]/(x) → Z,

como φ(n + (x)) = n. Veamos que está bien definida: sean n y m enteros
tales que n + (x) = m + (x). Luego n − m ∈ (x). Como n − m ∈ Z, la única
manera de que la constante n − m sea múltiplo del polinomio lineal x es que
n − m = 0. Luego

φ(m + (x)) = m = n = φ(n + (x)).

Tenemos que φ es un isomorfismo de anillos, pues

φ(n + (x) + m + (x)) = φ(n + m + (x)) = n + m = φ(n + (x)) + φ(m + (x)),

φ(n + (x))φ(m + (x)) = φ(nm + (x)) = nm = φ(n + (x))φ(m + (x)),

18
con lo cual φ es un homomorfismo de anillos. Veamos que φ es biyectiva: por
definición φ es sobreyectiva. Si φ(n + (x)) = φ(m + (x)) entonces n = m,
luego n + (x) = m + (x) y ası́ vemos que φ es inyectiva. Por lo tanto φ es un
isomorfismo de anillos, con lo cual

Z[x]/(x) ' Z,

como anillos. Luego Z[x]/(x) es un domino de integridad que no es un cuerpo,


pues Z no es un cuerpo. En particular el ideal (x) es ideal primo de Z[x] pero
no es maximal. Esta situación nos dice también que el Teorema 23 no es
válido si se cambia F por un anillo R que no sea un cuerpo. Claramente el
polinomio lineal x es irreducible en Z[x] pero el cociente Z[x]/(x) no es un
cuerpo.

• El Teorema 24 da una manera de construir cuerpos a partir de polinomios


irreducibles. De esta manera es posible, por ejemplo, construir cuerpos finitos
distintos de los cuerpos Zp con p primo.

• A pesar de que los polinomios sobre R no son funciones, se puede “evaluar”


un polinomio sobre R en elementos de R y obtener ası́ una función definida
en R. Sea f ∈ R[x] de grado n, digamos

f = a0 + a1 x + · · · + an xn ,

y sea α ∈ R. La evaluación de f en α es un elemento de R que se denota

19
como f (α) y se define como

f (α) = a0 + a1α + · · · + anαn.

(notar que la expresión a0 + a1α + · · · + anαn es un elemento de R).


De esta manera podemos hablar de las raı́ces de un polinomio f ∈ R[x]
en el anillo R. Un elemento α ∈ R es raiz de un polinomio f ∈ R[x] si
f (α) = 0. Vemos que, por ejemplo, los polinomios constantes no nulos no
tienen raı́ces en R, mientras que todo elemento de R es raiz del polinomio
nulo. Por otro lado los polinomios lineales ax + b sobre un cuerpo F siempre
tienen una raiz (la única, ¿por qué?) en F , pues a 6= 0 y ası́ α = −a−1b ∈ F
y entonces aα + b = 0.

Con esta noción de raiz de un polinomio, podemos deducir una propiedad


de reducibilidad para polinomios con coeficientes en un cuerpo.

Teorema 25. Sea F un cuerpo Un polinomio no constante f ∈ F [x] tiene


una raiz α ∈ F si y sólo si el polinomio lineal x − α divide a f . En particular,
si un polinomio f ∈ F [x] de grado al menos 2 tiene un raiz en F , entonces f
es reducible sobre F .

Demostración. Supongamos que existe α ∈ F tal que f (α) = 0. Como


x − α es un polinomio no nulo sobre F , por el Algoritmo de la división en
F [x] (Teorema 20), existen únicos polinomios q y r sobre F tales que

f = q(x − α) + r,

20
donde r = 0 o, caso contrario, deg(r) < deg(x − α) = 1, es decir deg(r) = 0.
Si r 6= 0, entonces ocurre la segunda condición deg(r) = 0, con lo cual r es
un polinomio constante no nulo, es decir, r = a para algún a ∈ F no nulo.
Por otro lado, evaluando la igualdad de arriba en α, nos queda que

0 = f (α) = q(α)(α − α) + a = 0 + a = a,

y esto nos dice que r = a = 0, una contradicción. Por lo tanto r = 0 y ası́


tenemos que f = q(x − α), y como q ∈ F [x], podemos concluir que x − α
divide a f .
Recı́procamente, supongamos que x − α divide a f . Entonces existe h ∈
F [x] tal que f = (x − α)h. Evaluando en α nos queda que

f (α) = (α − α)h(α) = 0,

es decir, α es raiz de f .
Claramente vemos que si f tiene una raiz α ∈ F entonces f no es irreducible
sobre F pues vimos que existe h ∈ F [x] tal que f = (x − α)h y, por hipótesis,
deg(f ) ≥ 2 con lo cual

2 ≤ deg(f ) = deg(x − α) + deg(h) = 1 + deg(h),

y ası́ vemos que deg(h) ≥ 1, es decir h no es constante. Por lo tanto f es


reducible sobre F pues es producto de dos polinomios no constantes sobre F .

21
El recı́proco de la segunda parte del Teorema 24 es falso, es decir, si un
polinomio f sobre un cuerpo F es reducible sobre F , no necesariamente
tiene una raiz en F . Por ejemplo, el polinomio x4 + 3x2 + 2 ∈ R[x] es
reducible sobre R pues

x4 + 3x2 + 2 = (x2 + 1)(x2 + 2),

pero no tiene raı́ces en R, pues sus raı́ces no son números reales (sus raı́ces

son ±i y ±i 2 donde i es la unidad imaginaria de C).

El siguiente resultado refleja otra similaridad entre Z y F [x] donde F es


un cuerpo. En Z todo entero positivo es producto, de manera única, de
potencias de números primos, lo que da a lugar al Teorema Fundamental de
la Aritmética. En el contexto del anillo F [x] también tenemos un resultado
similar con polinomios irreducibles. La demostración queda como tarea para
el final teórico.

Teorema 26. Sea f un polinomio no constante sobre un cuerpo F con


coeficiente principal a. Si f no es irreducible sobre F entonces existen un
entero k ≥ 2, únicos polinomios mónicos e irreducibles p1, . . . , pk sobre F y
únicos enteros positivos n1, . . . , nk tales que

n
f = apn1 1 · · · pk k .

22
En otras palabras, todo polinomio no constante sobre F es irreducible sobre
F o, en caso contrario, es producto de potencias de polinomios mónicos
irreducibles. Tal factorización de f en irreducibles es única salvo el orden de
los factores.

Finalizamos estas notas diciendo que una parte de esta teorı́a de polino-
mios sobre un cuerpo F es válida en el contexto más general de los anillos
euclideanos.

Un anillo R se dice que es euclideano si es un dominio de integridad para


el cual existe una función d : R → Z con las siguientes propiedades:
• para a y b ∈ F no nulos se tiene que d(a) ≤ d(ab).

• Para a y b ∈ F no nulos existen elementos q y r ∈ R tales que

a = qb + r,

con r = 0 o, caso contrario, d(r) < d(b).


Vemos que Z es un anillo euclideano donde la función d es el valor absoluto
y también el anillo de polinomios F [x] es un dominio euclideano donde la
función d es el grado de un polinomio.

23
Módulos
1 Definiciones y ejemplos

En un primer curso de Álgebra Lineal la estructura de espacio vectorial so-


bre un cuerpo F es uno de los principales objetos de estudio. A su vez,
esta estructura abstracta está motivada por la forma en que manipulamos
vectores en el plano o en el espacio (de ahı́ el nombre de espacio vectorial).
Geométricamente representamos a los vectores como segmentos orientados.
Esta manera geométrica es muy útil, por ejemplo, en Fı́sica ya que con vec-
tores se representan fuerzas que actúan sobre objetos, velocidad y aceleración
de partı́culas que se mueven en un fluı́do, campos de fuerzas electromagnéticas,
etc.

¿Qué operaciones elementales podemos hacer con vectores que den como
resultado un vector? Podemos sumar y restar vectores

~v ~v − w
~ ~v + w
~

w
~

y también podemos multiplicar vectores por un número real (que usualmente


se llama escalar en este contexto). Esta última operación contrae o dilata el
vector en la misma dirección si el escalar es positivo (o la opuesta si el escalar
es negativo) según sea el valor absoluto del escalar mayor o menor a uno
1
α~v w
~

~v
αw
~

(α > 1) (0 < α < 1)

El conjunto de vectores con la operación de suma de vectores forma un


grupo abeliano (es decir ~v + w
~ = w
~ + ~v ) y el producto de un escalar real
por un vector se puede considerar como una acción del cuerpo de escalares R
sobre el conjunto de vectores pues α~v es un vector y también

α(β ~v ) = (αβ)~v y 1 ~v = ~v .

También hay otras propiedades de esta acción que se utilizan frecuentemente:

α(~v + w)
~ = α~v + αw,
~

y
(α + β)~v = α~v + β~v .

Estas dos últimas propiedades hacen que la acción de R sobre el conjunto de


vectores se llame acción lineal.

Analı́ticamente los vectores en el plano se representan por pares ordenados


(a, b) ∈ R2, los vectores en el espacio por ternas ordenadas (a, b, c) ∈ R3 y,
en general, los vectores en un espacio n-dimensional por n-uplas ordenadas
(a1, . . . , an) ∈ Rn, de manera que Rn forma un espacio vectorial sobre R, es
decir, con escalares en el cuerpo R. La suma de vectores de Rn es componente

2
a componente

(a1, . . . , an) + (b1, . . . , bn) = (a1 + b1, . . . , an + bn),

mientras que la acción del cuerpo de escalares R sobre los vectores de Rn se


define como
α(a1, . . . , an) = (αa1, . . . , αan).

Es sencillo verificar que con esta adición Rn es un grupo abeliano, la acción de


R sobre Rn es lineal y, además, esta estructura es la misma que vimos recı́en
con la versión geométrica de los vectores.

Como ya dijimos la estructura de espacio vectorial es uno de los conceptos


básicos más importantes del Álgebra Lineal y sus aplicaciones. El Álgebra
Lineal es fundamental para entender partes sustanciales del Análisis, del
Álgebra, las Ecuaciones Diferenciales, la Estadı́stica, Optimización, el
tratamiento matemático de Big Data, etc. El concepto de módulo es una
generalización de la noción de espacio vectorial en donde el conjunto de
vectores se reemplaza por un grupo abeliano M , y la acción lineal del
cuerpo de escalares R sobre el conjunto de vectores se reemplaza por una
acción lineal de un anillo R sobre los elementos de M .

Formalmente un grupo abeliano M se dice que es R-módulo a izquierda


si R es un anillo que actúa linealmente a izquierda sobre M , es decir, si
existe una función
ϕ : R × M → M,
3
tal que para todo r, s ∈ R y para todo a, b ∈ M se cumple que

1) ϕ(rs, a) = ϕ(r, ϕ(s, a)),

2) ϕ(r + s, a) = ϕ(r, a) + ϕ(s, a),

3) ϕ(r, a + b) = ϕ(r, a) + ϕ(r, b).

Si, además, R es un anillo con unidad se pide que

4) ϕ(1, a) = ϕ(a) para todo a ∈ M .

De manera similar se define un R-módulo a derecha si la acción lineal de


R sobre M viene dada por una función ϕ : M × R → M .

De aquı́ en adelante en lugar de escribir ϕ(r, a) escribiremos ra y con esta


notación las condiciones de acción lineal a izquierda de R sobre M quedan
expresadas ası́: para todo r, s ∈ R y todo a, b ∈ M

1) (rs)a = r(sa),

2) (r + s)a = ra + sa,

3) r(a + b) = ra + rb.

Si, además, R es un anillo con unidad se pide que

4) 1 a = a para todo a ∈ M .

4
A menos que sea necesario aclarar, siempre trataremos con R-módulos a
izquierda y, por lo tanto, omitiremos la frase “a izquierda” y hablaremos
simplemente de R-módulos. Todos los resultados obtenidos se pueden
trasladar al caso de R-módulos a derecha. También llamaremos escalares
a los elementos del anillo R, en consonancia con el lenguaje utilizado en el
caso de espacios vectoriales.

• Una manera equivalente para definir un R-módulo M es la siguiente: el


conjunto E(M ) de los endomorfismos de M (es decir, homomorfismos de
grupos de M en M ) es un anillo con la suma y composición de homomorfismos
(comprobarlo!). Luego definir una acción lineal de R en M es equivalente a
dar un homomorfismo de anillos ρ : R → E(M ), es decir, si ρ : R → E(M ) es
un homomorfismo de anillos, entonces definiendo ra = ρ(r)(a) (recordar aquı́
que ρ(r) es un endomorfismo de M para cada r ∈ R) vemos que se satisfacen
las propiedades 1), 2) y 3) de acción lineal de R sobre M y, recı́procamente,
si se tiene una acción lineal de R sobre M la funcion φr : M → M definida
como φr (a) = ra es un endomorfismo de M para cada r ∈ R y, además, la
función ρ : R → E(M ) definida como ρ(r) = φr es un homomorfismo de
anillos (verificar la veracidad de todas estas afirmaciones!).

• Todo espacio vectorial sobre un cuerpo de escalares F es un F -módulo.


Por ejemplo Rn es un R-módulo, el conjunto Pn(R) de los polinomios con
coeficientes reales de grado a lo sumo n es un R-módulo y también el conjunto
Mn(R) de las matrices cuadradas de n × n con componentes reales en un R-

5
módulo. En este caso la acción lineal de R sobre Mn(R) es componente a
componente, es decir
   

 a11 a12 · · · a1n 


 αa11 αa12 · · · αa1n 

   
   
a21 a22 · · · a2n αa21 αa22 · · · αa2n
   
   
α =
   
... ... ... ... ... ...
   
   
   
   
   
   
   
an1 an2 · · · ann αan1 αan2 · · · αann
   

• Si I es un ideal de un anillo R entonces I es un R-módulo (comprobarlo!).


En particular R es un R-módulo.

• Todo grupo abeliano es un Z-módulo, pues si M es un grupo abeliano


entonces Z actúa linealmente sobre M como

a + · · · + a, (n veces si n > 0).






na = 

(−a) + · · · + (−a), (−n veces si n < 0).


 

• Sean R y R0 dos anillos y sea M un grupo abeliano tal que simultáneamente


es un R-módulo a izquierda y también un R0-módulo a derecha. Se dice que
M es un R-R0-bimódulo si para todo r ∈ R, r0 ∈ R0 y a ∈ M se cumple
que
r(ar0) = (ra)r0.

Por ejemplo, si R es un anillo conmutativo y M es un R-módulo a izquierda,


definiendo la acción a derecha

ar = ra

6
para todo a ∈ R y todo r ∈ R, es sencillo verificar (hacerlo!) que M es
también un R-módulo a derecha. Luego M es un R-R-bimódulo.

7
2 Propiedades básicas

Con ideas similares a las usadas en el caso de anillos se puede demostrar el


siguiente resultado cuya demostración queda como ejercicio.

Utilizaremos al 0 para denotar el neutro aditivo tanto de M como de R. En


caso de ser necesario hacer una distinción entre ambos neutros, utilizaremos
la notación 0M y 0R para el neutro aditivo de M y R respectivamente.

Lema 1. Sea M un R-módulo. Entonces


1) r0 = 0 para todo r ∈ R.

2) 0a = 0 para todo a ∈ M .

3) (−r)a = −(ra) para todo r ∈ R y todo a ∈ M .

Un submódulo de un R-módulo M es un R-módulo N tal que N ⊂ M .


Diremos directamente que N es submódulo de M sin hacer referencia al anillo
R, a menos que sea necesario.

• Los conjuntos {0} y M son submódulos del R-módulo M y son los submódulos
triviales del módulo M .

• Sabemos que un anillo R es un R-módulo. Entonces todo ideal de R es


un submódulo de R. En realidad, los submódulos de R (considerado como
R-módulo) son exactamente los ideales de R.
Tal como en el caso de grupos y anillos hay un criterio para determinar si
un subconjunto de un R-módulo M es un submódulo. La demostración queda
como ejercicio.
8
Lema 2. Sea M un R-módulo y sea N un subconjunto no vacı́o de M .
Entonces N es un submódulo de M si y sólo si a + rb ∈ N para todo a,
b ∈ N y todo r ∈ R. En particular todo submódulo de un R-módulo M es
un subgrupo de M .

Sea M un R-módulo. Un elemento a ∈ M se dice que es de torsión si


existe 0 6= r ∈ R tal que ra = 0. Por ejemplo Z6 es un Z-módulo y [3] ∈ Z6
es un elemento de torsión pues 2[3] = [6] = [0] en Z6.
El conjunto de todos los elementos de torsión de un R-módulo M se denota
con Tor(M ).
Si R es un dominio de integridad entonces Tor(M ) es un submódulo de M
pues 0 ∈ Tor(M ) con lo cual Tor(M ) 6= ∅. Sean a, b ∈ Tor(M ) entonces
existen s, t ∈ R no nulos tales que sa = tb = 0. Por ser R dominio de
integridad rs 6= 0, luego si r ∈ R entonces a + rb ∈ Tor(M ) pues

st(a + rb) = (st)a + (st)rb = t(sa) + (sr)(tb) = 0,

y, por Lema 2, Tor(M ) es un submódulo de M .


Un R-módulo M se dice que es libre de torsión si Tor(M ) = {0}. Por
ejemplo Zn es un Z-módulo libre de torsión.

Sea N un submódulo de un R-módulo M . El aniquilador (o también


anulador) de N en R se define como el conjunto

Ann(N ) = {r ∈ R : ra = 0 para todo a ∈ N }.

9
Tenemos que Ann(N ) es un ideal a izquierda de R pues 0 ∈ Ann(N ), con
lo cual Ann(N ) 6= ∅. Además Ann(N ) es un subgrupo aditivo de R pues si
r, r0 ∈ Ann(N ) entonces para todo a ∈ N

(r ± r0)a = (ra) ± (r0a) = 0,

con lo cual r ± r0 ∈ Ann(N ). Finalmente si r ∈ R y s ∈ Ann(N ) entonces


para todo a ∈ N
(rs)a = r(sa) = 0,

con lo cual rAnn(N ) ⊂ Ann(N ) y queda demostrado que Ann(N ) es un ideal


a izquierda de R. Esto equivale a decir que Ann(N ) es un submódulo de R
como R-módulo.

Sean N1, . . . , Nk submódulos de un R-módulo M . Es sencillo verificar que


la intersección de todos ellos

N1 ∩ · · · ∩ Nk ,

es un submódulo de M (hacerlo!).

Se define la suma de los submódulos N1, . . . , Nk como


k
N1 + · · · + Nk = { ni : ni ∈ Ni con 1 ≤ i ≤ k}.
X

i=1

Tenemos que N1 + · · · + Nk 6= ∅ pues al ser cada Ni un subgrupo de M


entonces 0 ∈ Ni para i = 1, . . . , k, con lo cual 0 ∈ N1 + · · · + Nk . Por otro
lado si a, b ∈ N1 + · · · + Nk y r ∈ R entonces existen elementos ni, n0i ∈ Ni

10
para i = 1, . . . , k tales que
k k
a= ni y b = n0i,
X X

i=1 i=1

luego
k k
a + rb = ni + r n0i
X X

i=1 i=1
k k
= ni + rn0i
X X

i=1 i=1
k
= (ni + rn0i).
X

i=1

Como cada ni + rn0i ∈ Ni (por ser cada Ni un submódulo de M ) entonces


k
a + rb = (ni + rn0i) ∈ N1 + · · · + Nk ,
X

i=1

con lo cual N1 + · · · + Nk es un submódulo de M por Lema 2.

Sea M un R-módulo y sean a1, . . . , ak ∈ M . El conjunto


k
ha1, . . . , ak i = { riai : ri ∈ R con 1 ≤ i ≤ k},
X

i=1

es un submódulo de M : ha1, . . . , ak i =
6 ∅ pues 0 ∈ ha1, . . . , ak i. Sean a,
b ∈ ha1, . . . , ak i y r ∈ R, entonces existen escalares ri y ri0 ∈ R con 1 ≤ i ≤ k
tales que
k k
a= riai y b = ri0 ai.
X X

i=1 i=1

Luego
k k k
a + rb = riai + (rri0 )ai = (ri + rri0 )ai ∈ ha1, . . . , ak i,
X X X

i=1 i=1 i=1

11
con lo cual, por Lema 2, vemos que ha1, . . . , ak i es un submódulo de M .

El submódulo ha1, . . . , ak i de M se denomina submódulo generado


por a1, . . . , ak . No es difı́cil demostrar que es el menor submódulo de M que
contiene al conjunto {a1, . . . , ak }, en el sentido de que si N es un submódulo
de M que contiene al conjunto {a1, . . . , ak } entonces ha1, . . . , ak i ⊂ N (com-
probarlo!). Alternativamente, para demostrar esta propiedad basta con de-
mostrar (hacerlo!) que la intersección de todos los submódulos de M que
contienen al conjunto {a1, . . . , ak } es el submódulo ha1, . . . , ak i.

Notar que si M es un R-módulo y a ∈ M entonces

Ra = {ra : r ∈ R},

es el submódulo hai de M , con lo cual vemos que

ha1, . . . , ak i = Ra1 + Ra2 + · · · + Rak .

Un R-módulo M se dice que es finitamente generado o de tipo finito


sobre R si existen a1, . . . , ak ∈ M tales que M = Ra1 + · · · + Rak .

• Todo espacio vectorial sobre un cuerpo F de dimensión finita es un ejemplo


de F -módulo finitamente generado sobre F . Por ejemplo

Rn = Re1 + · · · + Ren,

donde ei = (0, . . . , 0, 1, 0, . . . , 0) con 1 ≤ i ≤ n, donde la única componente


no nula es la i-ésima componente con un 1. El conjunto con los vectores

12
e1, . . . , en se denomina base canónica de Rn. Tambien el espacio vectorial
Pn(R) sobre R de los polinomios en R[x] de grado a lo sumo n, es un espacio
vectorial de dimensión finita y en este caso tenemos que

Pn(R) = R + Rx + · · · + Rxn.

• El anillo de polinomios R[x] con coeficientes en R es un R-módulo que no


es finitamente generado sobre R.

• Un R-módulo M se dice que es cı́clico si existe a ∈ M tal que M = Ra.


Por ejemplo, si I es un ideal principal de R entonces I es un submódulo cı́clico
de R. En particular si R es un anillo con unidad, entonces R es un R-módulo
cı́clico, pues R = Ra con a = 1.

La noción de R-módulo finitamente generado o de tipo finito es la misma


que la de conjunto generador en un espacio vectorial. Sin embargo en el
caso de R-módulos pueden ocurrir situaciones que no ocurren con espacios
vectoriales: por ejemplo, si {v1, . . . , vk } es un conjunto de generadores de
un espacio vectorial V sobre un cuerpo F y {v1, . . . , vk } no es linealmente
independiente sobre F , entonces V se puede generar con k − 1 vectores del
conjunto {v1, . . . , vk }. En cambio, si consideramos por ejemplo a Z como
Z-módulo vemos que Z es finitamente generado de varias maneras. Una de
ellas es Z = Z2 + Z3 ya que n = (−n)2 + 3n para todo n ∈ Z. Vemos que
{2, 3} son linealmente dependientes sobre Z pues 3 · 2 + (−2) · 3 = 0 pero
Z 6= Z2 y Z 6= Z3, con lo cual no se puede descartar ninguno de los dos
generadores para poder seguir generando a Z como Z-módulo.
13
Más generalmente, dados un R-módulo M y un conjunto ∅ 6= A ⊂ M , el
conjunto
n
R(A) = { riai : n ∈ N, ri ∈ R, ai ∈ A, 1 ≤ i ≤ n},
X

i=1

es un submódulo de M (comprobarlo!) que se denomina submódulo gene-


rado por A.
Claramente cuando A = {a1, . . . , ak } tenemos que

R(A) = Ra1 + · · · + Rak .

Puede ocurrir que un R-módulo sea finitamente generado pero tenga submó-
dulos que no lo son, a diferencia de los espacios vectoriales en donde subespa-
cios de un espacio vectorial de dimensión finita son subespacios de dimensión
finita. Por ejemplo, sea R el anillo de polinomios sobre un cuerpo F en
infinitas variables x1, x2, . . . , xn, . . ., es decir

R = ∪∞
k=1 F [x1 , . . . , xk ].

Como 1 ∈ R, vemos que R es un R-módulo cı́clico. Por otro lado, el


submódulo R(A) de R generado por A = {xi : i ≥ 1} no es finitamente
generado.

14
3 Homomorfismos de módulos

Sean M y M 0 dos R-módulos. Una función f : M → M 0 se dice que un


homomorfismo de módulos si f es un homomorfismo de grupos, es decir

f (a + b) = f (a) + f (b),

para todo a, b ∈ M y, además, f conmuta con la acción de R sobre M en el


siguiente sentido:
f (ra) = rf (b),

para todo a ∈ M y todo r ∈ R. Es inmediato comprobar que (hacerlo!)


si R es un anillo con unidad 1, estas dos condiciones equivalen a pedir que
f (a + rb) = f (a) + rf (b) para todo a, b ∈ M y todo r ∈ R.

Cuando R es un cuerpo (con lo cual M y M 0 son espacios vectoriales sobre


R), en lugar de hablar de homomorfismos de módulos de M en M 0 es usual
hablar de transformaciones lineales de M en M 0.

• Sea R un anillo conmutativo. Sean M y M 0 dos R-módulos y sea HomR (M, M 0)


el conjunto de todos los homomorfismos de módulos de M en M 0.
Es sencillo comprobar que HomR (M, M 0) es un grupo abeliano con la suma
usual de funciones. El neutro aditivo de HomR (M, M 0) es la función nula,
que denotamos también como 0 y se define como 0(a) = 0 para todo a ∈ M .
En particular vemos que HomR (M, M 0) 6= ∅.
Se define una acción lineal de R sobre HomR (M, M 0) como sigue: dada
15
f ∈ HomR (M, M 0) y r ∈ R definimos la función rf : M → M 0 como
(rf )(a) = rf (a) par todo a ∈ R. Vemos que rf ∈ HomR (M, M 0) pues si a,
b ∈ M entonces

(rf )(a + b) = r(f (a) + f (b)) = rf (a) + rf (b) = (rf )(a) + (rf )(b),

mientras que si r0 ∈ R entonces

(rf )(r0a) = rf (r0a) = r(r0f (a)) = (rr0)f (a) = (r0r)f (a) = r0(rf )(a),

para todo a ∈ M , con lo cual rf ∈ HomR (M, M 0). La acción es lineal pues
si r, r0 ∈ R y f ∈ HomR (M, M 0) entonces (rr0)f = r(r0f ) ya que si a ∈ M
vemos que

((rr0)f )(a) = (rr0)f (a) = f ((rr0)a) = f (r(r0a)) = rf (r0a) = (r(r0f ))(a),

y también

(r(f + g))(a) = r(f (a) + g(a)) = rf (a) + rg(a) = (rf )(a) + (rg)(a),

para todo a ∈ R, con lo cual

r(f + g) = rf + rg.

Finalmente si r y r0 ∈ R y f ∈ HomR (M, M 0) entonces (r + r0)f = rf + r0f


pues tenemos que

((r + r0)f )(a) = (r + r0)f (a) = rf (a) + r0f (a) = (rf )(a) + (r0f )(a),

16
para todo a ∈ M . Por lo tanto HomR (M, M 0) es un R-módulo si R es
conmutativo.

Al igual que con grupos y anillos, un homomorfismo f : M → M 0 de


R-módulos se dice que es un

• monomorfismo si f es inyectiva,

• epimorfismo si f es sobreyectiva,

• isomorfismo si f es biyectiva,

• endomorfismo si M 0 = M , y

• automorfismo si M 0 = M y f es biyectiva.

Usaremos la notación M ' M 0 cuando los R-módulos M y M 0 son iso-


morfos.

Puede ocurrir que dos anillos R y R0 no sean isomorfos como anillos pero
sı́ lo sean como S-módulos para algún submódulo S de R y R0. Por ejemplo
los anillos
Z[i] = {a + bi : a, b ∈ Z},

donde i = −1, y
√ √
Z[ 2] = {a + b 2 : a, b ∈ Z},

no pueden ser isomorfos como anillos pues en Z[i] hay una cantidad finita de

unidades (comprobarlo!) mientras que en Z[ 2] hay infinitas unidades, pues

17
√ √
(1 + 2) es inversible en Z[ 2] para todo n ∈ N ya que
n

√ √ √ 2
(1 + 2)(−1 + 2) = 2 − 1 = 1,


√ n  √ n
con lo cual 1 + 2
−1 + 2 = 1n = 1 para todo n ∈ N.



No obstante Z[i] y Z[ 2] son isomorfos como Z-módulos: pues las funciones

f : Z × Z → Z[ 2] definida como

f (a, b) = a + b 2,

y g : Z × Z → Z[i] definida como

g(a, b) = a + bi,

son isomorfismos de Z-módulos (comprobarlo!), con lo cual



f ◦g −1
: Z[i] → Z[ 2],

es un isomorfismo de Z-módulos.

Sea f : M → M 0 un homomorfismo de R-módulos. Se define el núcleo


de f como
Ker f = {a ∈ M : f (a) = 0},

mientras que la imagen de f se define como

f (M ) = {f (a) : a ∈ M }.

Similar al caso de anillos y grupos, estos dos conjuntos son submódulos de M

18
y M 0 respectivamente.

En el siguiente teorema renunimos varios resultados que se demuestran de


manera similar a lo demostrado con grupos. Por lo tanto la demostración del
teorema queda como ejercicio.

Teorema 3. Sea f : M → M 0 un homomorfismo de R-módulos. Entonces


1) f es un monomorfismo si y sólo si Ker f = {0}.

2) Ker f es un submódulo de M .

3) f (M ) es un submódulo de M 0.

4) Si N 0 es un submódulo de M 0 entonces f −1(N 0) es un submódulo de M .

5) Si f es un epimorfismo la correspondencia

N 7→ f (N ),

es uno a uno entre submódulos N de M tales que Ker f ⊂ N y


submódulos de M 0.

Hay una caracterización de los monomorfimos de módulos en términos de


la Teorı́a de Categorı́as, tema que veremos luego de módulos. En este sentido
es usual decir que el concepto de monomorfismo categórico coincide con
el de monomorfismo de R-módulos.

19
Teorema 4. Sea f : M → M 0 un homomorfismo de R-módulos. Las
siguientes afirmaciones son equivalentes
i) f es un monomorfismo.

ii) Para todo R-módulo T y todo par de homomorfismos de módulos


g, h : T → M la igualdad f ◦ g = f ◦ h implica que g = h.

iii) Para todo R-módulo T y todo homomorfismo de módulos g : T → M la


igualdad f ◦ g = 0 implica que g = 0.

Demostración. Veamos que i) implica ii). Sea T un R-módulo y sean g, h :


T → M dos homorfismos de R-módulos tales que f ◦ g = f ◦ h. Entonces
para todo a ∈ T tenemos que f (g(a)) = f (h(a)), es decir,

f (g(a)) − f (h(a)) = f (g(a) − h(a)) = 0,

lo que nos dice que g(a) − h(a) ∈ Ker f para todo a ∈ T . Por hipótesis y
Teorema 3 Ker f = {0}, por lo tanto g(a) = f (a) para todo a ∈ T y esto
quiere decir que g = h.
Vemos que ii) implica iii) pues si se toma h = 0 (la función nula) en ii)
tenemos que f ◦ 0 = 0 pues (f ◦ 0)(a) = f (0(a)) = f (0) = 0 para todo a ∈ T ,
con lo cual f ◦ g = 0 y esto implica (por hipótesis) que g = h = 0.
Finalmente veamos que iii) implica ii). Consideramos T = Ker f y g : T →
M como la función identidad, es decir, g(a) = a para todo a ∈ T . Claramente
g es un homomorfismo de R-módulos pues g(a + b) = a + b = g(a) + g(b) para
todo a, b ∈ T y si r ∈ R, entonces g(ra) = ra = rg(a) para todo a ∈ T .

20
Como T = Ker f tenemos que

(f ◦ g)(a) = f (g(a)) = f (a) = 0,

para todo a ∈ T , con lo cual f ◦ g = 0 y esto implica que g = 0. Luego


a = g(a) = 0(a) = 0 para todo a ∈ T . Esto nos dice que Ker f = {0} lo que
implica que f es un monomorfismo por Teorema 3.

21
4 Producto y suma directa de módulos

Recordemos que en el caso de grupos abelianos la suma directa (interna) de


subgrupos N1, . . . , Nk de un grupo abeliano M se escribe

N1 ⊕ · · · ⊕ Nk ,

y esto significa que cada elemento a ∈ N1 + · · · + Nk se escribe de manera


única como a = a1 + · · · + ak con ai ∈ Ni para i = 1, . . . , k.

Por otro lado si M1, . . . , Mk es una colección finita de R-módulos el pro-


ducto directo (externo) de M1, . . . , Mk es el conjunto de las k-uplas

M1 × · · · × Mk = {(a1, . . . , ak ) : ai ∈ Mi para 1 ≤ i ≤ k},

Ya sabemos que M1 × · · · × Mk es un grupo abeliano con la suma de k-uplas


componente a componente. Vemos que R actúa linealmente (comprobarlo!)
sobre M1 × · · · × Mk componente a componente, es decir

r(a1, . . . , ak ) = (ra1, . . . , rak ).

De este modo tenemos que el producto directo M1 × · · · × Mk de R-módulos


es un R-módulo.

Con argumentos similares al caso de producto directo de grupos se demues-


tra el siguiente teorema cuya demostración queda como tarea para el final
teórico.

22
Teorema 5. Sean N1, . . . , Nk submódulos de un R-módulo M . Las
siguientes afirmaciones son equivalentes.
1) La función f : M1 × · · · × Mk → N1 + · · · + Nk definida como

f (a1, . . . , ak ) = a1 + · · · + ak ,

es un isomorfismo de R-módulos.

2) Nj ∩ (N1 + · · · + Nj−1 + Nj+1 + · · · + Nk = {0} para cualquier


1 ≤ j ≤ k.

3) Cada elemento a ∈ N1 + · · · + Nk se escribe de manera única como

a = a1 + · · · + ak ,

con ai ∈ Ni para 1 ≤ i ≤ k.

Vemos ası́ que, tal como ocurre con los grupos, el producto directo externo y
la suma directa de N1, . . . , Nk submódulos de un R-módulo M representan
R-módulos isomorfos y, por lo tanto, la distinción entre ellos es esencialmente
una cuestión notacional. Tal como mencionamos al principio de esta sección,
por ser M un grupo abeliano es más usual hablar de suma directa y escribir

M = M1 ⊕ · · · ⊕ Mk ,

que hablar de producto directo. No obstante, algunos autores usan el sı́mbolo


⊕ para denotar también a un producto directo.

23
Se puede considerar una familia arbitraria de submódulos y definir el pro-
ducto directo de ellos (también con grupos y anillos). En general veremos
que el producto directo no va coincidir necesariamente con la suma directa
de los mismos. Trataremos este tipo de situaciones con más detalle en las
notas sobre Teorı́a de Categorı́as.

24
Módulos
1 Módulos libres sobre un conjunto

En la teorı́a de espacios vectoriales sobre un cuerpo F están los conceptos


(fundamentales!) de base y dimensión. En el caso de módulos sobre un anillo
R se habla también de bases o generadores libres y de rango en lugar de
dimensión.

Formalmente, dado un R-módulo M , un conjunto no vacı́o A ⊂ M se dice


que es una base o conjunto de generadores libres de M si para cada
a ∈ M existen únicos elementos a1, . . . , an ∈ A y r1, . . . , rn ∈ R tales que

a = r1a1 + · · · + rnan.

En este caso también se suele decir que M es libre sobre A ⊂ M . Notar que
el subconjunto A de M no es necesariamente finito.

• El anillo R[x] de polinomios sobre un anillo R con unidad es un R-módulo


libre sobre el conjunto A = {xi : i ∈ N} ∪ {1}. En este caso A es un conjunto
infinito.

• Todo espacio vectorial sobre un cuerpo F de dimensión finita (como, por


ejemplo, Rn sobre R) es un ejemplo de módulo libre sobre un conjunto finito.

• Consideremos el Z-módulo Z2 ×Z2. Este Z-módulo no es libre sobre ningún

1
subconjunto A de Z2 × Z2. Primero notemos que si

A = {(1, 0), (0, 1)},

entonces Z2 × Z2 no es libre sobre A pues, por ejemplo

(1, 1) = (1, 0) + (0, 1),

pero también
(1, 1) = 3(1, 0) + 5(0, 1),

con lo cual no hay unicidad en los escalares y, por lo tanto, Z2 × Z2 no es libre


sobre A. Con un poco de paciencia se puede verificar (hacerlo!) que con todo
subconjunto no vacı́o de Z2 × Z2 ocurre que, o bien no se puede generar a
Z2 × Z2 sobre Z o bien no hay una manera única de hacerlo, tal como ocurre
con el caso particular recién visto.

• Que un R-módulo M sea finitamente generado no garantiza que exista A ⊂


M tal que M sea libre sobre A (a diferencia del caso de espacios vectoriales
donde ser finitamente generado implica la existencia de una base). Por ejemplo
√ √
sea R = Z[ −5] = {a+b −5 : a, b ∈ Z} y consideremos el ideal I generado

por 2 y 1 + −5, es decir

I = 2R + (1 + −5)R.

Esto es equivalente a decir que I es un submódulo de R finitamente generado.


Pero cada par de elementos a, b ∈ I son linealmente dependientes sobre R
pues siempre tenemos la combinación lineal c1a + c2b = 0 con c1 = b y
2
c2 = −a. Por lo tanto, si existe una base de I como R-módulo, tal base
consiste de un solo elemento, es decir que I = Ra para algún a ∈ I. En otras
palabras, la existencia de una base de I como R-módulo implica que I sea un
ideal principal. Pero I no es principal (ejercicio!).

Lema 6. Sea M un R-módulo libre sobre A. Si A es un conjunto finito con


n elementos entonces
M ' Rn ,

como R-módulos.

Demostración. Sea A = {a1, . . . , an} ⊂ M tal que M es libre sobre A.


Definimos una función f : M → Rn como

f (a) = (r1, . . . , rn),

donde para cada a ∈ M los elementos r1, . . . , rn son los únicos escalares tales
que
a = r1a1 + · · · + rnan.

Veamos que f es un homomorfismo de grupos: si a, b ∈ M existen únicos


escalares r1, . . . , rn y r10 , . . . , rn0 tales que

a = r1a1 + · · · + rnan y b = r10 a1 + · · · + rn0 an.

Luego
a + b = (r1 + r10 )a1 + · · · + (rn + rn0 )an,

3
y por la unicidad de los escalares, esta es la única manera de expresar a + b
como combinación lineal de a1, . . . , an sobre R. Luego

f (a + b) = (r1 + r10 , . . . , rn + rn0 ) = (r1, . . . , rn) + (r10 , . . . , rn0 ) = f (a) + f (b).

También si r ∈ R y a = r1a1 + · · · + rnan entonces

ra = (rr1)a1 + · · · + (rrn)an,

y es la única manera de expresar ra como combinación lineal de a1, . . . , an


sobre R. Luego

f (ra) = (rr1, . . . , rrn) = r(r1, . . . , rn) = rf (a).

Por lo tanto f es un homomorfismo de R-módulos. Veamos que f es biyectiva:


tenemos que si (r1, . . . , rn) ∈ Rn entonces a = r1a1 + · · · + rnan ∈ M y

f (a) = (r1, . . . , rn),

con lo cual f es sobreyectiva. Por otra parte

Ker f = {a ∈ M : f (a) = (0, . . . , 0)}


= {r1a1 + · · · + rnan : (r1, . . . , rn) = (0, . . . , 0)}
= {r1a1 + · · · + rnan : r1 = · · · = rn = 0}
= {0},

y ası́ vemos que f es inyectiva. Por lo tanto f es un isomorfismo de R-módulos.


4
Un R-módulo M se dice que es de rango n si n es el único entero positivo
tal que M ' Rn como R-módulos. En otras palabras, M es de rango n si
todo conjunto de generadores libres de M tiene cardinalidad n.

Esta definición luce a primera vista algo mal formulada pues no parece
posible que por un lado ocurra que M ' Rn y por otro que M ' Rm para
m 6= n. Sin embargo hay ejemplos de anillos R no conmutativos tales que,
como R-módulos, R ' Rn para todo n ∈ N, con lo cual módulos libres
sobre anillos no conmutativos no necesariamente tienen conjuntos de
generadores libres de la misma cardinalidad

Sin embargo, para anillos conmutativos la situación es distinta.

Teorema 7. Sea R un anillo conmutativo con unidad. Si

Rn ' Rm ,

como R-módulos entonces n = m. En particular, si M es un R-módulo libre


sobre un conjunto A de cardinalidad n entonces el rango de M es n.

No daremos la demostración de este resultado pero podemos señalar que se


utiliza la existencia de ideales maximales en anillos con unidad, la caracteri-
zación de ideales maximales en anillos conmutativos y el hecho de que la
existencia de una base de cardinalidad n en un espacio vectorial implica que
toda otra base del mismo espacio también tiene cardinalidad n.

5
2 Módulos cociente

Ya hemos visto en los casos de grupos y anillos la importancia de los grupos


y anillos cociente. Definimos ahora el concepto de módulo cociente y veremos
que se obtienen resultados similares a los que vimos para grupos y anillos
cociente.

Sea M un R-módulo y N un submódulo de M . Al ser M un grupo abeliano


tenemos que N es subgrupo normal de M y ası́ el cociente M/N es un
grupo que es, además, abeliano. Recordemos que cuando tratamos grupos
abelianos la notación es aditiva y utilizamos coclases a izquierda, con lo cual
los elementos de M/N son las coclases a + N con a ∈ M .

Veamos ahora que podemos definir una acción lineal de R sobre M/N .
Dado r ∈ R definimos
r(a + N ) = ra + N.

Antes de continuar tenemos que ver que esta acción está bien definida, es
decir, que no depende del representante elegido de la coclase. Sabemos que
a + N = b + N si y sólo si a − b ∈ N . Si a + N = b + N entonces a − b ∈ N
y por ser N submódulo de M tenemos que r(a − b) ∈ N . Ası́

ra − rb = r(a − b) ∈ N,

con lo cual ra + N = rb + N . Comprobamos ahora que la acción es lineal.


Tenemos que si r, s ∈ R entonces

(rs)(a + M ) = (rs)a + M = r(sa) + M = r(sa + M ) = r(s(a + M )),


6
r((a + N ) + (b + N )) = r((a + b) + N )
= r(a + b) + N
= ra + rb + N
= (ra + N ) + (rb + N ),

y también

(r + s)(a + M ) = (r + s)a + M = (ra + sa) + M = (ra + M ) + (sa + M ).

Vemos que si N es un submódulo de un R-módulo M entonces el grupo


cociente M/N es también un R-módulo. El R-módulo cociente M/N se
denomina módulo cociente.

Similar al caso de subgrupos normales, veremos que todo submódulo de


un R-módulo es el núcleo de un homomorfismo de módulos. Sea M un R-
módulo y sea N un submódulo de M . Tenemos la proyección natural a nivel
de estructura de grupos
π : M → M/N.

Sabemos que, a nivel de grupos, N = Ker π. Si vemos que π es un homomor-


fismo de R-módulos, nos aseguramos que N es el núcleo de un homomorfismo
de módulos. Sea r ∈ R y a ∈ M , entonces

π(ra) = ra + M = r(a + M ) = rπ(a).

Como ya sabemos que π es un homomorfismo de grupos, esto muestra que π


es un homomorfismo de R-módulos.
7
Hemos demostrado el siguiente teorema.

Teorema 8. Sea M un R-módulo y sea N un subconjunto no vacı́o de


M . Entonces N es un submódulo de M si sólo si N es el núcleo de un
homomorfismo de R-módulos.

8
3 Teoremas de isomorfismo de módulos

Por supuesto que todos los teoremas de isomorfismo que vimos para grupos
tienen su versión para módulos y se demuestran de manera muy similar, con el
adicional de comprobar la validez de los enunciados para la acción lineal. Por
lo tanto las demostraciones de los mismos quedan como tarea para el examen
final teórico.

Comenzamos con el Teorema de correspondencia para módulos.

Teorema 9. Sea f : M → M 0 un epimorfismo de R-módulos. Hay una


correspondencia uno a uno entre submódulos de M 0 y submódulos de M que
contienen a Ker f .

Seguimos con el Primer, Segundo y Tercer teorema de isomorfismo.

Teorema 10. Sea f : M → M 0 un homomorfismo de R-módulos. Entonces

M/Ker f ' f (M ),

como R-módulos.

Teorema 11. Sea M un R-módulo y sean N y S submódulos de M .


Entonces
(N + S)/S ' N/N ∩ S,

como R-módulos.

9
Teorema 12. Sea M un R-módulo y sean S ⊂ N dos submódulos de M .
Entonces N/S es submódulo de M/S y

(M/S)/(N/S) ' M/N,

como R-módulos.

Vemos ahora una caracterización de los epimorfismos de módulos en términos


de la Teorı́a de Categorı́as. La demostración queda como tarea para el examen
final teórico. Necesitaremos la definición de conúcleo de un homomorfismo
f : M → M 0 de R-módulos: es el módulo cociente

Coker f = M 0/f (M ).

Teorema 13. Sea f : M → M 0 un homomorfismo de R-módulos. Las


siguientes afirmaciones son equivalentes.
1) f es un epimorfismo.

2) Coker f es el R-módulo trivial nulo.

3) Para todo R-módulo M 00 y todo par de homomorfismos de R-módulos


g, h : M 0 → M 00, la igualdad g ◦ f = h ◦ f implica que g = h.

4) Para todo R-módulo M 00 y todo homomorfismo de R-módulos


g : M 0 → M 00, la igualdad g ◦ f = 0 implica que g = 0.

10
4 Propiedad universal del módulo cociente

Nuevamente tenemos una propiedad universal para módulo cociente similar


a la que vimos para grupos y permite definir un módulo cociente de manera
alternativa a la construcción explı́cita que vimos. La demostración sigue los
lineamientos del caso para grupos y queda como tarea para el examen final
teórico.

Teorema 14. Sea f : M → M 0 un homomorfismo de R-módulos. Sea


N ⊂ Ker f un submódulo de M . Luego existe un único homomorfismo de
R-módulos f˜ : M/N → M 0 tal que f se factoriza a través de M/N como
f˜ ◦ π, donde π : M → M/N es la proyección natural.

11
5 Sumandos directos y retracciones

Sea M un R-módulo y N un submódulo de M . Se dice que N es un sumando


directo de M si existe un submódulo S de M tal que

M = N ⊕ S.

En el caso particular de espacios vectoriales con un producto interno h·i se


dice que S es el complemento ortogonal N en M si hn, si = 0 para todo
n ∈ N y s ∈ y es una situación es importante, por ejemplo, en la teorı́a de
operadores lineales tanto en dimensión finita como infinita.

Daremos a continuación una caracterización de la existencia de un sumando


directo en términos de homomorfismos. Un homomorfismo f : M → M 0 de
R-módulos se dice que es una retracción si existe un homomorfismo de R-
módulos g : M 0 → M tal que f ◦ g = IM 0 (el homomorfismo identidad en
M 0).

0
g f
M M M0

f ◦ g = IM 0

Sea M un R-módulo y N un submódulo de M . Se dice que N es un


retracto de M si existe un homomorfismo de R-módulos f : M → N tal
que f (n) = n para todo n ∈ N , es decir f|N = IN donde f|N representa la
restricción de f a N .
Notar que si N es un retracto de M entonces tenemos que el homomorfismo
12
de R-módulos f : M → N tal que f|N = IN es una retracción. Para ver esto
consideramos g = IN : N → M que es un homomorfismo de R-módulos y,
además, (f ◦ g)(n) = (f ◦ IN )(n) = f (n) = n para todo n ∈ N con lo cual
f ◦ g = IN .

Teorema 15. Sea M un R-módulo y sea N un submódulo de M . Entonces


N es un sumando directo de M si y sólo si N es un retracto de M .

Demostración. Supongamos que N es un sumando directo de M . Luego


existe un submódulo S de M tal que M = N ⊕ S. Esto quiere decir que
para cada a ∈ M existen únicos n ∈ N y s ∈ S tales que a = n + s. Esta
unicidad garantiza que tenemos definida una función f : M → N escribiendo
f (a) = n. Veamos que f es una retracción: por un lado si a, b ∈ M entonces
existen únicos elementos n, n0 ∈ N y s, s0 ∈ S tales que

a = n + s y b = n0 + s0,

con lo cual a + b = (n + n0) + (s + s0) y la única manera de expresar a + b


como suma de elementos de N y S. Entonces

f (a + b) = n + n0 = f (a) + f (b).

Por otro lado si r ∈ R entonces ra = rn + rs y esta es la única manera de


expresar ra como suma de elementos de N y S. Luego

f (ra) = rn = rf (a).

13
Por lo tanto f : M → N es un homomorfismo de R-módulos. Además si
n ∈ N entonces n = n + 0 y esta expresión es única como suma de elementos
de N y S, entonces f (n) = n para todo n ∈ N . Todo esto nos dice que N es
un retracto de M .
Recı́procamente, supongamos que N es un retracto de M . Entonces existe
un homomorfismo f : M → N de R-módulos tal que f (n) = n para todo
n ∈ N . Si S = Ker f tenemos que S es un submódulo de M . Si a ∈ N ∩ S
entonces
f (a) = a y f (a) = 0,

con lo cual a = 0. Luego N ∩ S = {0} y por Teorema 5 vemos que esto es


equivalente a que cada elemento de N + S se escribe de manera única como
suma de un elemento de N y otro de S.
Sea a ∈ M y sea b = f (a). Entonces b ∈ N y ası́ f (b) = b. Si escribimos

a = (a − b) + b,

tenemos que f (a − b) = f (a) − f (b) = b − b = 0 con lo cual a − b ∈ S. Como


b ∈ N hemos expresado a ∈ M como suma de un elemento de N y otro de
S. Entonces M = N + S y por la unicidad que se tiene gracias al Teorema
5, concluimos que M = N ⊕ S, es decir, N es un sumando directo de M .

Un problema de interés en Álgebra es, dado un R-módulo M , determinar


cuántos sumandos directos de M hay (salvo isomorfismos).

14
Este tipo de problemas ha sido una de las motivaciones que hay detrás del
desarrollo de una de las herramientas que forman parte del Álgebra ho-
mológica: la homologı́a y la cohomologı́a de módulos. La teorı́a de ho-
mologı́a (y su dual, la cohomologı́a) se construye a partir del estudio de las
denominadas sucesiones exactas de módulos. Al final de estas notas vere-
mos algo de sucesiones exactas de módulos y su relación con el problema de
hallar sumandos directos de un R-módulo.

15
6 Complejos y sucesiones exactas de módulos

Los complejos de R-módulos son sucesiones de R-módulos y aparecen en di-


versas ramas de la Matemática (Álgebra, Análisis, Geometrı́a Algebraica, Ge-
ometrı́a Diferencial, etc). Su importancia se refleja en el extensivo uso que
se hace de estas sucesiones para obtener nuevos resultados y profundizar el
entendimiento sobre muchos objetos matemáticos.

Un complejo de R-módulos es una sucesión {Mi}∞


i=0 de R-módulos junto

a una sucesión {fi}∞


i=1 de homomorfismos de R-módulos fi : Mi → Mi+1

tales que la imagen de cada fi es un submódulo del núcleo de fi+1, es decir

fi(Mi) ⊂ Ker fi+1,

para todo i ≥ 1. En general se representa gráficamente una parte del complejo

f i−1 f i f
i+1 f
i+2
· · · −→ Mi −→ Mi+1 −→ Mi+2 −→ ···

Un complejo de R-módulos se dice que forma una sucesión exacta de R-


módulos si para todo ı́ndice i ≥ 1 la imagen de fi coincide con el núcleo de
fi+1, es decir
fi(Mi) = Ker fi+1,

para todo i ≥ 1.

En estas notas trataremos en general con sucesiones finitas R-módulos de,


a lo sumo, 5 términos. Utilizaremos las siguientes convenciones. En los dia-
gramas con flechas el R-módulo trivial {0} será escrito simplemente como 0.

16
Si tenemos el diagrama
0 −→ M,

significa que M es un R-módulo y que el homomorfismo de R-módulos de 0


a M es el homomorfismo nulo. Por otra parte si se tiene el diagrama

M −→ 0,

significa que M en un R-módulo y que el homomorfismo de R-módulos de M


a 0 es el homomorfismo nulo.

Por lo tanto, decir que la siguiente sucesión de R-módulos

f
0 −→ M −→ M 0,

es exacta es equivalente a tener que Ker f = {0} y esto, a su vez, es equivalente


a decir que f es inyectiva. Por otro lado decir que la siguiente sucesión de
R-módulos
f
M −→ M 0 −→ 0,

es exacta es equivalente a tener que f (M ) = Ker 0 = M 0 y esto, a su vez, es


equivalente a decir que f es sobreyectiva.

Por lo tanto queda demostrado el siguiente lema.

Lema 16. Tener la sucesión exacta de R-módulos

f
0 −→ M −→ M 0 −→ 0,

17
es equivalente a decir que f es un isomorfismo de R-módulos y, por lo tanto,
es equivalente a decir que M ' M 0 como R-módulos.

Veremos a continuación que algunos teoremas de isomorfismo pueden ser


enunciados en términos de sucesiones exactas.
En algunos casos no será necesario escribir los homomorfismos de R-módulos
en una sucesión y por lo tanto omitiremos escribirlos.

Una sucesión de R-módulos de la forma

0 −→ M −→ M 0 −→ M 00 −→ 0,

se denomina sucesión exacta corta de R-módulos. En este caso también


se dice que el R-módulo M 0 es una extensión de M por M 00.

Un problema central en la teorı́a de R-módulos es el siguiente: dados dos


R-módulos M y M 0 determinar el número de extensiones no isomorfas de
M por M 0. En otras palabras ¿cuántos R-módulos E no isomorfos existen
tales que la sucesión de R-módulos

0 −→ M −→ E −→ M 0 −→ 0,

sea exacta?

18
Teorema 17. Sean M , M 0 y M 00 tres R-módulos.

1) Si la sucesión
f h
0 −→ M −→ M 0 −→ M 00 −→ 0,

es exacta entonces

M ' f (M ) y M 0/f (M ) ' M 00,

como R-módulos.

2) Si M ⊂ M 0 ⊂ M 00 entonces la sucesión de R-módulos

ι φ
0 −→ M 0/M −→ M 00/M −→ M 00/M 0 −→ 0,

es exacta, donde ι es la inclusión, es decir, ι(a + M ) = a + M y además


φ(a + M ) = a + M 0.

Demostración. La parte 1) es consecuencia inmediata de la definición de


sucesión exacta corta (comprobarlo!). Veamos la parte 2). Primero compro-
bamos que las funciones ι (la inclusión) y φ están bien definidas: es claro
que la función inclusión ι está bien definida. Sean a y a0 ∈ M 00 tales que
a + M = a0 + M . Luego a − a0 ∈ M ⊂ M 0. Entonces a + M 0 = a0 + M 0,
con lo cual vemos que φ está bien definida.
Claramente ι es un monomorfismo de R-módulos. Veamos que φ es un

19
homomorfismo de R-módulos:

φ((a1 + M ) + (a2 + M )) = φ(a1 + a2 + M ) = a1 + a2 + M 0


= (a1 + M 0) + (a2 + M 0) = φ(a1 + M ) + φ(a2 + M ),

y si r ∈ R entonces

φ(r(a + M )) = φ(ra + M ) = ra + M 0 = r(a + M 0) = rφ(a + M ).

Veamos ahora que ι(M 0/M ) = Ker φ. Tenemos que ι(M 0/M ) = M 0/M y,
por otro lado

Ker φ = {a+M ∈ M 00/M : φ(a+M ) = M 0} = {a+M ∈ M 00/M : a+M 0 = M 0}.

Como a + M 0 = M 0 si y sólo si a ∈ M 0, vemos que

Ker φ = {a + M : a ∈ M 0} = M 0/M = ι(M 0/M ).

Finalmente es inmediato ver que, por definición, φ es sobreyectiva.


Vemos que la parte 1) del Teorema 16 es el Primer Teorema de Isomorfismo
mientras que la parte 2) es el Tercer Teorema de Isomorfismo (¿por qué?).

20
7 Complejos de R-módulos en el Cálculo multivariable

Sea U ⊂ R2 un conjunto abierto y sea f = (f1, f2) : U → R2 una función


suave (es decir, f ∈ C ∞(U, R2) ). Una pregunta básica (y difı́cil de contestar
en general) es la siguiente:

Problema 1 ¿Existe una función suave F : U → R tal que

∂F ∂F
= f1 y = f2 ?
∂x ∂y

Como las derivadas parciales mixtas coinciden con estas hipótesis, vemos
que la existencia de tal función F implica que

∂f1 ∂ 2F ∂ 2F ∂f2
= = = .
∂y ∂y∂x ∂x∂y ∂x

Tenemos ası́ una manera de responder a esta pregunta (con otra pregunta!):

Problema 2 ¿Alcanza con que se cumpla que

∂f1 ∂f2
= ,
∂y ∂x

en U para que exista una función F que resuelva el Problema 1?

La respuesta es no! El clásico contra-ejemplo viene dado por la función

−y x 
 

f (x, y) =  2 , ,
x + y 2 x2 + y 2

definida en U = R2 \ {(0, 0)}. Esta función satisface la condición ∂f1/∂y =

21
∂f2/∂x en U pero no existe función suave F : U → R tal que

∂F −y ∂F x
= 2 y = 2 .
∂x x + y2 ∂y x + y2

Una clase de subconjuntos de Rn en los cuales se puede responder afir-


mativamente el Problema 1 es la clase de subconjuntos de Rn denominados
estrellados: un conjunto X ⊂ Rn se dice que es estrellado si existe un punto
x ∈ X tal que para todo y ∈ X el segmento que une x con y está contenido
en X.
Es un clásico resultado del Cálculo multivariable que si U ⊂ R2 es un
abierto estrellado entonces el Problema 1 tiene solución para toda función
f ∈ C ∞(U, R2) que satisface la condición del Problema 2.
Este tipo de “situaciones favorables” para responder el Problema 1 a par-
tir de funciones que satisfacen la condición del Problema 2, sugiere que la
geometrı́a de los subconjuntos abiertos juega un rol preponderante en la
búsqueda de soluciones al Problema 1.

Una manera alternativa de estudiar el Problema 1 es intentar formularlo


de manera algebraica. Sea U ⊂ R2 un conjunto abierto y consideremos el
conjunto C ∞(U, Rk ) de todas las funciones suaves f : U → Rk para k = 1, 2.
Tenemos que C ∞(U, R) y C ∞(U, R2) son espacios vectoriales sobre R y,
además, las funciones

grad : C ∞(U, R) → C ∞(U, R2),

22
definida como
∂f ∂f
 

grad(f ) =  ,  ,
∂x ∂y
y rot : C ∞(U, R2) → C ∞(U, R) definida como

∂f1 ∂f2
rot(f ) = − ,
∂y ∂x

donde f = (f1, f2), son transformaciones lineales.


Sabemos que rot ◦ grad = 0. Esto nos dice que

Im(grad) ⊂ Ker(rot),

y tenemos ası́ una sucesión corta de R-módulos


grad rot
C ∞(U, R) C ∞(U, R2) C ∞(U, R)

Decir que esta sucesión es exacta quiere decir que Im(grad) = Ker(rot) y esto
es equivalente a que el R-módulo cociente

Ker(rot)/Im(grad),

sea trivial.
Notar que Ker(rot) consiste de todas la funciones suaves en U que satisfacen
la condición del Problema 2. Por lo tanto, decir que el R-módulo cociente
Ker(rot)/Im(grad) sea trivial nos dice que dada f = (f1, f2) ∈ C ∞(U, R2)
que satisface la condición del Problema 2, existe F ∈ C ∞(U, R) tal que

grad(F ) = f,

23
es decir que
∂F ∂F 
 
 , = f = (f1, f2),
∂x ∂y
con lo cual
∂F ∂F
= f1 y = f2 .
∂x ∂y
Vemos ası́ que el Problema 1 tiene solución en un abierto U ⊂ R2 para
funciones f ∈ C ∞(U, R2) que satisfagan la condición del Problema 2 si el
R-módulo cociente Ker(rot)/Im(grad) es trivial.

Es usual escribir
H 1(U ) = Ker(rot)/Im(grad).

El R-módulo H 1(U ) suele denominarse primer grupo de cohomologı́a


de De Rham (estos grupos abelianos se definen, en realidad, en el contexto
más general de las formas diferenciales).
La trivialidad de H 1(U ) suele expresarse escribiendo H 1(U ) = 0. Por
ejemplo, vemos que H 1(U ) = 0 si U es estrellado, mientras que H 1(U ) 6= 0
si U = R2 \ {(0, 0)}.

Más aún, si U = R2 \ {x1, . . . , xk } se puede demostrar que

H 1(U ) ' Rk ,

como R-módulos. Informalmente es usual decir que H 1(U ) mide la “cantidad


de huecos” que hay en un abierto U ⊂ R2.
El 0-ésimo grupo de cohomologı́a de De Rham para un abierto U ⊂ R2 se

24
define como
H 0(U ) = Ker(grad).

Tenemos ası́ la sucesión de R-módulos


ι grad rot
H 0(U ) C ∞(U, R) C ∞(U, R2) C ∞(U, R)

donde ι : H 0(U ) → C ∞(U, R) es la inclusión. Queda como ejercicio la


demostración del siguiente resultado.

Teorema 18. Un subconjunto U ⊂ R2 es conexo si y sólo si H 0(U ) = R.

En vista de este teorema, tenemos ahora la siguiente sucesión de R-módulos


asociada a los problemas 1 y 2 para abiertos U ⊂ R2 conexos:

ι grad rot
0 R C ∞(U, R) C ∞(U, R2) C ∞(U, R)

25
8 Sucesiones exactas y complementos

Consideremos ahora una sucesión exacta de R-módulos

ι p
0 −→ N −→ M −→ M 0 −→ 0,

donde ι es la inclusión (es decir, N es submódulo de M ). Se dice que tal


sucesión se parte (o divide) si p es una retracción, es decir, si existe un
homomorfismo q : M 0 −→ M de R-módulos tal que p ◦ q = IM 0 (la identidad
en M 0).

Con este concepto de sucesión exacta corta que se parte podemos enun-
ciar una condición equivalente (comparar con el Teorema 15) para que un
submódulo de un R-módulo sea un sumando directo.

Teorema 19. Sean N ⊂ M dos R-módulos y sea ι : N → M el


homomorfismo inclusión. Sea M 0 un R-módulo tal que la sucesión de R-
módulos
ι p
0 −→ N −→ M −→ M 0 −→ 0,

es exacta. Entonces esta sucesión se parte si y sólo si N es un sumando


directo de M .

Demostración. Supongamos primero que la sucesión se parte, es decir, existe


un homomorfismo de R-módulos q : M 0 −→ M tal que p ◦ q = IM 0 . Sea
b ∈ M . Entonces p(b) ∈ M 0 y ası́ q(p(b)) ∈ M . Luego

p(b − q(p(b))) = p(b) − (p ◦ q)(p(b)) = p(b) − IC (p(b)) = p(b) − p(b) = 0,


26
es decir, b − q(p(b)) ∈ Ker p. Por la exactitud de la sucesión, ι(M ) = Ker p,
con lo cual existe a ∈ N tal que

a = ι(a) = b − q(p(b)),

y esto quiere decir que b = a+q(p(b)). Luego M = N +(q ◦p)(M ) (como q ◦p


es un homomorfismo de R-módulos, tenemos que (q ◦ p)(M ) es un submódulo
de M ).
Veamos que N ∩ (q ◦ p)(M ) = {0}. Si a ∈ N ∩ (q ◦ p)(M ), entonces existe
b ∈ M tal que a = q(p(b)). Hacemos c = p(b). Luego c ∈ M 0 y a = q(c).
Tenemos por un lado que

p(a) = p(q(c)) = IM 0 (c) = c,

y por otro lado, como N = ι(N ) = Ker p, vemos que p(a) = 0. Entonces
c = 0 y ası́
a = q(c) = q(0) = 0,

por ser q un homomorfismo de R-módulos. Por Teorema 5 podemos decir que

M = N ⊕ S,

donde S = (q ◦ p)(M ), con lo cual queda demostrado que N es un sumando


directo de M .
La recı́proca queda como ejercicio.

27
Categorı́as
1 Definiciones y ejemplos

Vimos en notas pasadas que, por ejemplo, el concepto de grupo cociente


se puede definir mediante propiedades representadas con diagramas conmu-
tativos. Sucede que muchos otros conceptos pueden darse de una manera
unificada y simplificada mediante diagramas que involucran objetos (espacios
topológicos, grupos, anillos, cuerpos, módulos, etc) y “flechas” entre ellos que
representan funciones de un cierto tipo (homomorfismos, epimorfismos, etc).
Por ejemplo, el siguiente diagrama
X
f g
Y h Z

donde h = g ◦ f , las flechas representan homeomorfismos si X, Y y Z son


espacios topológicos, mientras que si X, Y y Z son grupos las flechas repre-
sentan homomorfismos de grupos.
Por otra parte muchas construcciones se pueden representar mediante propie-
dades “universales” de diagramas con flechas. Por ejemplo, el producto carte-
siano de dos conjuntos A y B viene acompañado de dos funciones naturales
que son las proyecciones πA : A × B → A y πB : A × B → B. Veremos
más adelante que el triple (A × B, πA, πB ) es “universal” en el sentido que
para todo otro triple (C, f, g) donde f : C → A y g : C → B son funciones,

1
existe una única función h : C → A × B
C
f g
h
πA πB
A A×B B

tal que f = πA ◦ h y g = πB ◦ h.
Esto permite definir, salvo biyecciones, al producto A × B sin necesidad de
mencionar los elementos de A × B: el producto cartesiano de A y B se puede
definir como el único triple (D, π1, π2) donde π1 : D → A y π2 : D → B
son funciones, tal que para todo otro triple (C, f, g) donde f : C → A y
g : C → B son funciones, existe una única función h : C → D
C
f g
h
π1 π2
A D B

tal que f = π1 ◦ h y g = π2 ◦ h. Notar que con esta propiedad “universal” se


demuestra que hay una biyección entre D y A × B.
De esta manera veremos que se podrá definir el concepto de “producto
cartesiano” de una cantidad arbitraria de objetos pertenecientes a ciertas “cat-
egorı́as” de objetos.
Este tipo de situaciones comienza a formar las bases de una teorı́a que se
denomina Teorı́a de Categorı́as. Es una teorı́a de elevado nivel técnico que
ha logrado tener mucha influencia en la Matemática moderna. De manera
muy informal podrı́amos decir que la Teorı́a de Categorı́as no se preocupa por
todos los materiales que se usan para construir un edificio, sino en los edificios

2
mismos desde un punto de vista global y estructural. Desde hace algunos
años esta teorı́a se viene aplicando en disciplinas fuera de la Matemática tales
como Programación, Computación, Fı́sica Cuántica, Neurociencia, Teorı́a del
Lenguaje, Bases de Datos, etc. Todo esto ha dado lugar a una rama bastante
nueva de la Matemática que lleva el nombre de Teorı́a de Categorı́as Aplicada.

En la descripción formal de lo que es una categorı́a, se usan los conceptos


de clases y conjuntos de la Teorı́a de Conjuntos desarrollada por Gödel-
Bernays para reparar algunos problemas que surgen con la Teorı́a de Con-
juntos de Zermelo-Fraenkel (por ejemplo, paradojas que surgen al considerar
a la colección de todos lo conjuntos como un conjunto). Informalmente una
clase es una colección de conjuntos definidos por alguna propiedad. Hay clases
que no son conjuntos y los conjuntos son clases que son miembros de otras
clases. Utilizaremos esta nomenclatura de clase y conjunto pero no haremos
uso de ningún resultado teórico sobre estos conceptos.

Una categorı́a C consiste de

1) una clase de objetos Obj(C). Los objetos de C serán denotados como A,


B, C, etc.

2) A cada par de objetos A y B de C se le asigna un conjunto HomC (A, B)


cuyos elementos se llaman morfismos de A en B o también flechas de A
en B. En este caso los objetos A y B reciben el nombre de dominio y
codomino del morfismo respectivamente. Los morfismos serán denotados
con letra minúsculas f , g, h, etc.

3
3) Para cada terna de objetos A, B y C de C hay una función

HomC (A, B) × HomC (B, C) → HomC (A, C),

que asigna a cada par de morfismos f ∈ HomC (A, B) y g ∈ HomC (B, C)


un morfismo de HomC (A, C) denotado como gf y que se denomina com-
posición de g con f .

Se asume que los objetos y morfismos (o flechas) de una categorı́a C satis-


facen las siguiente propiedades.

C1. La composición de morfismos es asociativa, es decir (hg)f = h(gf ) para


todo morfismo f ∈ HomC (A, B), g ∈ HomC (B, C) y h ∈ HomC (C, D).

C2. Si (A, B) 6= (C, D) entonces HomC (A, B) ∩ HomC (C, D) = ∅.

C3. Para cada par de objetos A y B existe un morfismo 1A ∈ HomC (A, A) tal
que para todo par de morfismos f ∈ HomC (A, B) y g ∈ HomC (B, A) se
tiene que f 1A = f y 1A g = g. Tal morfismo 1A se denomina morfismo
identidad de A en A.

• Es sencillo comprobar que el morfismo identidad 1A ∈ HomC (A, A) es único


(hacerlo!).

• Un morfismo (o flecha) f ∈ HomC (A, B) se denotará simbólicamente como

f
f : A → B, o A → B.

A pesar de esta notación los morfismos no son necesariamente funciones.

4
No obstante, en muchos de los casos que vamos a tratar, los morfismos serán
funciones.

• Con esta notación simbólica para los morfismos, muchas situaciones se


pueden representar con diagramas de flechas. Por ejemplo la propiedad 3)
de los morfismos en la definición de categorı́a se puede representar como el
sigiuente diagrama:

f
A B

g
gf

• Un diagrama de flechas como el siguiente


f
A B

g
h
C

se dice que conmuta si h = gf .

• Los conjuntos forman una categorı́a denotada como Set. Los objetos son
conjuntos y los morfismos entre objetos son funciones.

• Los grupos forman una categorı́a denotada como Grp. Los objetos son
grupos y los morfismos son homomorfismos de grupos.

5
• Los grupos abelianos forman una categorı́a denotada como Ab. Los objetos
son grupos abelianos y los morfismos son homomorfismos de grupos.

• Los anillos forman una categorı́a denotada como Ring. Los objetos son
anillos y los morfismos son homomorfismos de anillos.

• Sea R un anillo. Los R-módulos a izquierda (resp. a derecha) forman


una categorı́a denotada como R-Mod (resp. Mod-R). Los objetos son
R-módulos (a izquierda o derecha) y los morfismos son homomorfismos de
R-módulos (a izquierda o derecha). La mayorı́a de las veces usaremos en
los ejemplos la categorı́a R-Mod de los R-módulos a izquierda y, tal como
lo hicimos en las notas sobre módulos, nos referiremos a los R-módulos a
izquierda simplemente como R-módulos, a menos que sea necesario aclarar
que la acción lineal es a izquierda. Salvo algunas excepciones, todos estos
ejemplos también son válidos si se usa la categorı́a Mod-R de los R-módulos
a derecha.

• Una categorı́a C se dice que es pequeña si Obj(C) es un conjunto. Por


ejemplo sea M un monoide multiplicativo con unidad, es decir, existe 1 ∈ M
tal que 1m = m = m1 para todo m ∈ M . Definimos la categorı́a CM tal
que Obj(CM ) = {M } y HomCM (M, M ) = M . Vemos que en este caso hay
un solo objeto (el monoide M ) y los morfismos (o flechas) de M en M son
los elementos de M . La composición de morfismos no es otra cosa que el
producto en M . Al ser M un monoide con unidad vemos que se cumplen
todos las condiciones para que CM sea una categorı́a y es, además, pequeña
pues Obj(CM ) es un conjunto. Se puede demostrar que, por ejemplo, las
6
categorı́as Set, Grp, Ab y R-Mod no son pequeñas.

• Sea S un conjunto en el cual hay definido un pre-orden, es decir, una


relación sobre S que es reflexiva y transitiva. Usaremos el sı́mbolo ≺ para
denotar la relación. Con esta notación se tiene entonces que s ≺ s para todo
s ∈ S y también si s ≺ t y t ≺ r entonces s ≺ r. Definimos la categorı́a S
cuyos objetos son los elementos de S, es decir Obj(S) = S mientras que



si s ⊀ t




HomS(s, t) = 
{∗} si s ≺ t
 

donde {∗} significa que se eligió un elemento (cualquiera) de S. Si f y g


son elementos de S tales que f y g son lo únicos elementos de HomS(s, t)
y HomS(t, r) respectivamente (con lo cual s ≺ t, t ≺ r y entonces s ≺ r),
escribiremos como gf al único elemento de HomS(s, r). Notar que al ser la
relación reflexiva HomS(s, s) 6= ∅ para todo s ∈ S y es sencillo ver que el único
elemento de HomS(s, s) es el morfismo identidad de s. En realidad es sencillo
verificar (hacerlo!) que S es una categorı́a pequeña. Como cada conjunto no
vacı́o de morfismos consta de un solo elemento de S, es usual denotar con una
flecha s → t al único elemento de HomS(s, t). Con esta notación, la flecha
s → s es el morfismo identidad de s y si se tienen las flechas s → t y t → r,
entonces la composición de estos morfismos es la flecha s → r.

• Dada una categorı́a C se define otra que se denomina categorı́a opuesta


o categorı́a dual y se denota como C op. Los objetos de C op son los mismos
que los de C, es decir Obj(C)=Obj(C op) pero cambia el sentido de las flechas:

7
se define
HomC op (A, B) = HomC (B, A),

para todo par de objetos A y B de C. Es sencillo comprobar que C op es una


categorı́a (hacerlo!).

• Dadas dos categorı́as C1 y C2 se define la categorı́a producto C1 × C2


cuyos objetos son pares ordenados (A, B) de objetos donde A ∈ Obj(C1) y
B ∈ Obj(C2), es decir

Obj(C1 × C2) = Obj(C1) × Obj(C2),

mientras que los morfismos de C1 × C2 son pares ordenados de morfismos:

HomC1×C2 ((A, B), (C, D)) = HomC1 (A, C) × HomC2 (B, D).

La composición de morfismos es coordenada a coordenada, es decir, si (f, g) ∈


HomC1×C2 ((A, B), (C, D)) y (p, q) ∈ HomC1×C2 ((C, D), (E, F )) entonces se
define
(p, q)(f, g) = (pf, qg).

No es difı́cil ver que C1 × C2 es una categorı́a (comprobarlo!).

• Sean C y C˜ dos categorı́as. Se dice que C es una subcategorı́a de C˜ si


todo objeto de C es objeto de C˜ y si HomC (A, B) ⊂ HomC˜(A, B) para todo
par de objetos A y B de C. Notar que por definición, para cada objeto A de
C el morfismo identidad 1A ∈ HomC (A, A) es el morfismo identidad 1A que
˜
se tiene en C.

8
• Un objeto A de una categorı́a C se dice que es inicial si para cada objeto
B de C hay un solo morfismo en HomC (A, B). En otras palabras, A es objeto
inicial de C si para cada objeto B de C hay una sola flecha f : A → B).
Vemos que si A es un objeto inicial de C entonces HomC (A, A) = {1A}.
Esto muestra que si A y A0 son objetos iniciales de C entonces A ' A0. Más
aún, el isomorfismo entre A y A0 es el único morfismo en HomC (A, A0): por
ser A y A0 objetos iniciales hay únicos morfismos f : A → A0 y g : A0 → A.
Luego

gf ∈ HomC (A, A) = {1A} y f g ∈ HomC (A0, A0) = {1A0 },

es decir gf = 1A y f g = 1A0 , con lo cual f : A → A0 es un isomorfismo.

• Un objeto B de una categorı́a C se dice que es final si para cada objeto A


de C hay un solo morfismo en HomC (A, B). En otras palabras, B es objeto
final de C si para cada objeto A de C hay una sola flecha f : A → B). En este
caso también tenemos que dos objetos finales de una categorı́a son isomorfos
(comprobarlo!).

9
2 Tipos de morfismos

Hemos visto en notas pasadas caracterizaciones de monomorfismos y epimor-


fismos en términos de propiedades “cancelativas” que dijimos eran conceptos
de la Teorı́a de Categorı́as.

Sea C una categorı́a.

i) Un morfismo f : A → B se dice que es un isomorfismo si existe un


morfismo g : B → A tal que

gf = 1A y f g = 1B .

Es sencillo ver que g es único (comprobarlo!) y es, por lo tanto, usual


decir que el morfismo g es el morfismo inverso de f y escribir g = f −1.
También escribiremos A ' B si hay un isomorfismo de A en B. Notar
que A ' B es equivalente a tener que B ' A pues g también es un
isomorfismo.

ii) Si f : A → B y g : B → A son dos morfismos tales que gf = 1A, se dice


que f es una sección de g, mientras que g es una retracción de f .

iii) Un morfismo f : A → B se dice que es un monomorfismo si para


todo objeto C de C y todo par de morfismos h, g : C → A vale la ley
cancelativa a izquierda, es decir si

f g = f h entonces h = g.

iv) Un morfismo f : A → B se dice que es un epimorfismo si para todo ob-


10
jeto C de C y todo par de morfismos h, g : B → C vale la ley cancelativa
a derecha, es decir si

gf = hf entonces h = g.

Lema 1. Sea C una categorı́a y sean f ∈ HomC (A, B) y g ∈ HomC (B, C).
1) Si f y g son monomorfismos (resp. epimorfismos) entonces la
composición gf ∈ HomC (A, C) es un monomorfismo (resp. epimorfismo).

2) Si la composición gf ∈ HomC (A, C) es un monomorfismo (resp.


epimorfismo) entonces f es un monomorfismo (resp. g es un
epimorfismo).

3) f es un monomorfismo si y s’olo si para todo objeto C de C la función

f∗ : HomC (C, A) → HomC (C, B),

definida como f∗(h) = f h es inyectiva.

4) f es un epimorfismo si y s’olo si para todo objeto C de C la función

f ∗ : HomC (B, C) → HomC (A, C),

definida como f ∗(h) = hf es sobreyectiva.

Demostración. Veremos solamente las afirmaciones sobre monomorfismos.


El caso para epimorfismos es similar y queda como ejercicio. Veamos 1).
Supongamos que f y g son monomorfismos y sean D un objeto de C y h,
h0 ∈ HomC (D, A). Gráficamente tenemos la siguiente situación:

11
f g
A B C
h, h0
D

Si (gf )h = (gf )h0 entonces g(f h) = g(f h0). Por ser g un monomorfismo
podemos cancelar a izquierda y nos queda que f h = f h0. Pero ahora, por ser
f un monomorfismo podemos volver a cancelar a izquierda y obtenemos que
h = h0. Por lo tanto gf es un monomorfismo.
Veamos 2). Supongamos que la composición gf ∈ HomC (A, C) es un
monomorfismo. Sean D un objeto de C y h, h0 ∈ HomC (D, A) tales que
f h = f h0. Por ser tanto f h como f h0 morfismos de D en B, podemos
componer con g. Entonces g(f h) = g(f h0) con lo cual (gf )h = (gf )h0 y,
por ser gf un monomorfismo, podemos cancelar a izquierda y nos queda que
h = h0. Por lo tanto f es un monomorfismo.
Finalmente 3) es consecuencia directa de la definición de monomorfismo.


• Es sencillo verificar que los isomorfismos en las categorı́as Set, Grp y R-


Mod son funciones biyectivas y, por lo tanto, son isomorfismos en el sentido de
ser homomorfismos (de grupos, anillos o R-módulos) biyectivos. No obstante
no siempre los isomorfismos son funciones biyectivas en una categorı́a
cuyos morfismos sean funciones.

• Ya hemos visto en notas anteriores y ejercicios de las prácticas que en


las categorı́as Grp y R-Mod los monomorfismos y epimorfismos son los
12
monomorfismos y epimorfismos en el sentido de homomorfismos inyectivos y
sobreyectivos. También en la categorı́a Set los monomorfismos y epimorfismos
son las funciones inyectivas y sobreyectivas.

• Vemos ahora un ejemplo en donde los conceptos de monomorfismo categórico


y homomorfismo inyectivo no coinciden. Un grupo abeliano G se dice que es
divisible si para cada a ∈ G y cada n ∈ N existe b ∈ G tal que nb = a.
La colección de los grupos abelianos divisibles forma una categorı́a cuyos
morfismos son los homomorfismos de grupos. Claramente Q y el cociente
Q/Z (con las estructuras aditivas) son objetos de esta categorı́a. La proyección
natural π : Q → Q/Z no es un homomorfismo inyectivo de grupos abelianos
pues π(0) = Z = π(1) pero 1 6= 0. Sin embargo π es un monomorfismo en el
sentido de la Teorı́a de Categorı́as: sea G un grupo abeliano divisible y sean
f , g : G → Q dos morfismos distintos. Como f 6= g existe a ∈ G tal que
f (a) 6= g(a). Por lo tanto existe un número racional m/n no nulo tal que
f (a) − g(a) = m/n. Por ser G divisible existe b ∈ G tal que 2mb = a. Luego

m
= f (a) − g(a) = f (2mb) − g(2mb) = 2m(f (b) − g(b)),
n

con lo cual
1
= f (b) − g(b).
2n
Como 1/2n ∈
/ Z tenemos que

1
π(f (b)) − π(g(b)) = π(f (b) − g(b)) = π(1/2n) = + Z 6= Z.
2n

Esto nos dice que (π ◦ f )(b) 6= (π ◦ g)(b) y, por lo tanto, π ◦ f 6= π ◦ g. Hemos

13
demostrado (por el contrarecı́proco) que si π ◦ f = π ◦ g entonces f = g. Por
lo tanto π es un monomorfismo en la categorı́a de los grupos divisibles.

• Queda como ejercicio mostrar que en la categorı́a de los anillos con unidad los
conceptos de epimorfismo categórico y homomorfismo de anillos sobreyectivo
no coinciden. Más precisamente hay epimorfismos categóricos que no son
epimorfismos en el sentido de homomorfismos de anillos sobreyectivos.

14
3 Productos y coproductos

Sean A y B dos conjuntos. El producto cartesiano A × B puede ser definido


mediante propiedades de unicidad de funciones sin hacer mención a los ele-
mentos de A × B, que son pares ordenados (a, b) con a ∈ A y b ∈ B.
El producto cartesiano A × B tiene la siguiente propiedad universal: dado
cualquier conjunto C y funciones f1 : C → A y f2 : C → B existe una única
función h : C → A × B tal que

p1 ◦ h = f1 y p2 ◦ h = f2,

donde p1 : A × B → A es la proyección con respecto a la primera coordenada,


es decir, p1(a, b) = a para todo (a, b) ∈ A × B y p2 : A × B → B es la
proyección con respecto a la segunda coordenada, es decir, p2(a, b) = b para
todo (a, b) ∈ A × B. Tal función h tiene que estar, necesariamente, definida
de la siguiente manera:
h(c) = (f1(c), f2(c)),

para todo c ∈ C (comprobarlo!). Gráficamente se tiene el siguiente diagrama

A
f1
p1
h
C A×B
p2
f2
B

Esta manera alternativa sugiere cómo definir el producto de una colección

15
(finita o infinita) de objetos de una categorı́a dada. Para entender mejor la
definición comenzamos definiendo el producto de dos objetos en una categorı́a.

Sea C una categorı́a y sean A1 y A2 dos objetos de C. El producto


directo o simplemente un producto de A1 y A2 en C es un objeto A de C
junto a dos morfismos p1 ∈ HomC (A, A1) y p2 ∈ HomC (A, A2) con la siguiente
propiedad universal: para cada objeto B de C y cada par de morfismos fi ∈
HomC (B, Ai) con i = 1, 2, existe un único morfismo f ∈ HomC (B, A) tal que
el siguiente diagrama conmuta

A1
f1
p1
f
B A
p2
f2
A2

es decir, p1f = f1 y p2f = f2. Por cuestiones de comodidad en la notación,


nos referiremos al producto de A1 y A2 como la terna (A, p1, p2).

Notar que no se puede asegurar que siempre exista el producto de dos


objetos en una categorı́a. De momento lo que podemos demostrar es que
si existe, es esencialmente único en el sentido del siguiente teorema, lo que
justifica que digamos “el producto” de A1 y A2.

Teorema 2. Sea C una categorı́a y sean A1 y A2 dos objetos de C. Si las


ternas (A, p1, p2) y (A0, q1, q2) son dos productos de A1 y A2 en C entonces
existe un único isomorfismo h de A en A0 tal que pi = qih para i = 1, 2.

16
Demostración. Considerando la terna (A, p1, p2) y haciendo B = A0 y fi = qi
para i = 1, 2 en el diagrama anterior, tenemos que existe un único morfismo
f de A0 en A tal que
p1 f = q 1 y p 2 f = q 2 .

De manera similar, si consideramos ahora la terna (A0, q1, q2) y hacemos B =


A y fi = pi para i = 1, 2 en el diagrama anterior, vemos que existe un único
morfismo h de A en A0 tal que

q 1 h = p1 y q 2 h = p2 .

Por lo tanto
pi(f h) = qih = pi y qi(hf ) = pif = qi,

para i = 1, 2.
Por otro lado, al considerar el diagrama anterior con la terna (A, p1, p2), si
hacemos B = A y fi = pi para i = 1, 2 vemos que existe un único morfismo
g de A en A tal que
pi g = pi ,

para i = 1, 2. Como el morfismo identidad 1A ∈ HomC (A, A) cumple también


que pi1A = pi para i = 1, 2, vemos que por unicidad, g = 1A. Luego el
morfismo identidad es el único morfismo de A en A tal que pi1A = pi para
i = 1, 2. Pero f h es un morfismo de A en A que cumple lo mismo, entonces

f h = 1A.

17
Un argumento similar (comprobarlo!) muestra que

hf = 1A0 .

Por lo tanto h es un isomorfismo de A en A0 (también se obtiene que f es un


isomorfismo de A0 en A) y es el único que satisface pi = qih para i = 1, 2.


Definimos ahora el producto de una colección arbitraria de objetos de una
categorı́a. Sea C una categorı́a, I un conjunto de ı́ndices y {Ai}i∈I una
colección de objetos de C. El producto directo o simplemente el pro-
ducto de los objetos de la colección {Ai}i∈I es un objeto A de C junto a una
colección de morfismos pi : A → Ai para cada i ∈ I que satisfacen la siguiente
propiedad universal: para cada objeto B de C y cada colección de morfismos
{fi}i∈I tal que fi ∈ HomC (B, Ai) se tiene que el siguiente diagrama

f
B A

pi
fi
Ai

conmuta para cada i ∈ I, es decir, pif = fi para cada i ∈ I.

Siguiendo las ideas de la demostración del Teorema 2, se puede demostrar


el siguiente teorema que nos dice que el producto de los objetos Ai es esencial-
mente único (lo cual justifica que digamos “el producto” de los objetos Ai).
La demostración queda como tarea para el final teórico.
18
Por cuestiones de comodidad en la notación nos referiremos al producto A
de los objetos Ai como el par ordenado

(A, {pi : A → Ai}i∈I ).

Teorema 3. Sea C una categorı́a y sea {Ai}i∈I una colección de objetos


de C. Si (A, {pi : A → Ai}i∈I ) y (A0, {qi : A0 → Ai}i∈I ) son dos productos
de los objetos Ai entonces existe un único isomorfismo h de A en A0 tal que
pi = qih para cada i ∈ I.

• Recordemos que dada una colección de conjuntos {Ai}i∈I el producto carte-


siano de estos conjuntos se define como

Ai = {f : I → ∪i∈I Ai : f (i) ∈ Ai para todo i ∈ I},


Y

i∈I

es decir, es el conjunto de todas las funciones de I en ∪i∈I Ai tal que f (i) ∈ Ai


para cada i ∈ I. Notar que en el caso de una cantidad finita de conjuntos
A1, . . . , An el producto cartesiano se define usualmente como el conjunto de n-
uplas (a1, . . . , an) tal que cada ai ∈ Ai. Cada una de estas n-uplas determina
una función
f : {1, . . . , n} → ∪ni=1Ai,

definida como f (i) = ai para cada i ∈ {1, . . . , n}. Recı́procamente, cada


función
f : {1, . . . , n} → ∪ni=1Ai,

19
tal que f (i) ∈ Ai define la n-upla (f (1), . . . , f (n)). Por lo tanto el caso
usual de un producto cartesiano de una cantidad finita de conjuntos puede
verse como un caso particular de la definición de producto cartesiano de una
colección de conjuntos {Ai}i∈I . No es difı́cil verificar (hacerlo!) que en la
categorı́a Set el producto cartesiano Ai es el producto categórico de los
Q
i∈I

conjuntos Ai.

• En los casos de las categorı́as Grp, Ring y R-Mod, si se tiene una colección
de, por ejemplo, grupos {Ai}i∈I , se define una operación de grupo en el pro-
ducto cartesiano Ai de los grupos “coordenada a coordenada”, es decir si
Q
i∈I

f yg∈ Ai se define el producto f g como la función f g : I → ∪i∈I Ai


Q
i∈I

donde (f g)(i) = f (i)g(i) para cada i ∈ I. Es sencillo verificar (hacerlo!)


que con esta operación el producto cartesiano de grupos Ai es un grupo.
Q
i∈I

De manera similar si se considera una colección de objetos en las categorı́as


Ring o R-Mod y se definen las operaciones correspondientes “coordenada a
coordenada” en el producto Ai, se tiene que tanto el producto cartesiano
Q
i∈I

de anillos como el de R-módulos es un anillo o un R-módulo. Por lo tanto el


producto categórico de una colección {Ai}i∈I de objetos de cada una de estas
categorı́as existe y es, en realidad, el producto cartesiano Ai de grupos,
Q
i∈I

anillos or R-módulos según corresponda.

• Hay categorı́as en donde el producto categórico existe pero no coincide con


el producto cartesiano y otras en las que no existe. Consideremos un conjunto
S con un pre-orden ≺ en S. Recordemos que se construye una categorı́a S
(ver los ejemplos de la sección 1) cuyos objetos son los elementos de S. Si el

20
producto de dos objetos a1 ∈ S y 2 ∈ S existe en S es un elemento a ∈ S
junto a dos morfismos p1 = a → a1 y p2 = a → a2. Por lo tanto a ≺ a1 y
a ≺ a2. Por la propiedad universal, si b ∈ es un objeto junto a dos morfismos
f1 = b → a1 y f2 = b → a2, lo que equivale a que b ≺ a1 y b ≺ a2, entonces
existes un único morfismo f = b → a que hace conmutativo el diagrama

f
b a

pi
fi
ai

para i = 1, 2. Entonces b ≺ a con lo cual si el producto a de a1 y a2 existe,


es el ı́nfimo de a1 y a2 (la mayor de las cotas inferiores), que suele denotarse
como a1 ∧ a2.
Si consideramos, por ejemplo, S = N donde n ≺ m significa que n|m,
el ı́nfimo entre dos enteros positivos siempre existe, con lo cual el producto
categórico de dos elementos n y m de S existe pero no es el producto cartesiano
de los objetos, es decir, no es el par ordenado (n, m).
Por otro lado no siempre existe el ı́nfimo entre dos elementos de un conjunto
pre-ordenado. Por ejemplo si se considera como S al conjunto de todos los
cuerpos finitos con el pre-orden definido por la inclusión de conjuntos, el ı́nfimo
entre Z2 y Z3 no existe en S pues Z2 ∩ Z3 = ∅ (¿por qué?), luego no hay
un cuerpo finito incluido en Z2 y Z3 simultáneamente. Vemos ası́ que en este
conjunto S, con el pre-orden definido por la inclusión de conjuntos, no existe
el producto categórico.
21
Es usual denotar al producto categórico de una colección {Ai}i∈I de obje-
tos de una categorı́a con el sı́mbolo

Ai ,
Y

i∈I

lo que es un abuso de notación pues este sı́mbolo se usa para denotar al


producto cartesiano de conjuntos y hemos visto que no siempre coinciden.
El único recaudo que hay que tomar al usar esta notación es saber que no
representa, necesariamente, un producto cartesiano.

Vemos ahora la noción “dual” a la de producto en una categorı́a. Sea C


una categorı́a y sea {Ai}i∈I una colección de objetos de C. Un objeto A
de C junto a una colección de morfismos {ji : Ai → A)}i∈I se dice que
es el coproducto de los objetos Ai si para cada objeto B de C y para
cada colección de morfismos gi ∈ HomC (Ai, B) existe un único morfismo
g ∈ HomC (A, B) tal que el diagrama

gi
Ai B

g
ji

conmuta para cada i ∈ I, es decir gji = gi. Notar que el diagrama del
coproducto se obtiene revirtiendo el sentido de las flechas en el diagrama
que representa a un producto.
22
Similar al caso de producto, es usual referirse al coproducto de una colección
de objetos {Ai}i∈I de una categorı́a como el par ordenado

(A, {ji : Ai → A}i∈I ).

El siguiente resultado justifica que digamos “el coproducto” de una familia


de objetos pues es esencialmente único salvo isomorfismos. Su demostración
queda como ejercicio.

Teorema 4. Sea C una categorı́a y sea {Ai}i∈I una colección de objetos de


C. Si (A, {ji : Ai → A}i∈I ) y (A0, {ki : Ai → A0}i∈I ) son dos coproductos
de los objetos Ai, entonces existe un único isomorfismo h de A0 en A tal que
ji = hki para todo i ∈ I.

Cuando definimos coproducto hablamos de noción “dual” a la de producto.


Esta “dualidad” se debe a que se puede usar la categorı́a opuesta o dual
para definir el concepto de coproducto revirtiendo el sentido de las flechas.

• Esta dualidad nos permite encontrar ejemplos de categorı́as en donde no


existe el coproducto, pues hemos visto ejemplos en donde el producto no
existe, por lo tanto, en la categorı́a opuesta o dual el coproducto no puede
existir.

• A pesar de que, por dualidad, se puede demostrar la existencia de coproduc-


tos en una categorı́a no es sencillo, en general, hallar concretamente un objeto

23
que oficie de coproducto de una colección de objetos dados en la categorı́a. En
los casos de las categorı́as Set y R-Mod no resulta muy complicado hacerlo
como veremos a continuación.

• En la categorı́a Set de los conjuntos existe el coproducto. Sea {Ai}i∈I una


colección de conjuntos. La unión disjunta Ai de los Ai es el conjunto
F
i∈I

definido como
Ai = {(x, i) : x ∈ Ai, i ∈ I}.
G

i∈I

Para cada i ∈ I definimos el morfismo “proyección” πi : Ai → A como


πi(x) = (x, i) donde A = Ai. Tenemos que el par
F
i∈I

( Ai, {πi : Ai → A}i∈I ),


G

i∈I

es el coproducto de los conjuntos Ai: si B es un conjunto tal que para cada


j ∈ I existe un morfismo gj : Aj → B entonces podemos definir un morfismo

g: Ai → B,
G

i∈I

como g(x, j) = gj (x) para todo (x, j) ∈ Ai. Tenemos que, por definición
F
i∈I

gπj = gj ,

para todo j ∈ I, es decir el diagrama

24
gj
Aj B

πj g

Ai
F
i∈I

conmuta para cada j ∈ I. Claramente el morfismo g ası́ definido es el único


que hace que el diagrama conmute.

• En la categorı́a R-Mod de los R-módulos el coproducto existe. Sea {Ai}i∈I


una colección de R-módulos. Sabemos que en R-Mod existe el producto de
los Ai y es el producto cartesiano

Ai = {α : I → ∪i∈I Ai : α(i) ∈ Ai para todo i ∈ I}.


Y

i∈I

Sabemos que Ai es un R-módulo con la suma usual de funciones y el


Q
i∈I

producto de un escalar r ∈ R por una función α ∈ Ai como


Q
i∈I

(rα)(i) = rα(i),

para todo i ∈ I. Consideremos el siguiente subconjunto de Ai


Q
i∈I

Ai = {α ∈ Ai : α(i) = 0 para casi todo i ∈ I}.


M Y

i∈I i∈I

La expresión “α(i) = 0 para casi todo i ∈ I” significa que α(i) 6= 0 solamente


para una cantidad finita de ı́ndices i ∈ I.
Es sencillo verificar (hacerlo!) que ⊕i∈I Ai es un submódulo de Ai .
Q
i∈I

25
Para cada k ∈ I tenemos la función

jk : Ak → ⊕i∈I Ai,

definida como 

a si i = k,




jk (a)(i) = 
0 si i 6= k.
 

Veamos que cada jk es un homomorfismo de R-módulos: si a, b ∈ Ak entonces




a + b si i = k,




jk (a + b)(i) =  = jk (a)(i) + jk (b)(i),
0 si i 6= k.


para todo i ∈ I, con lo cual jk (a + b) = jk (a) + jk (b). También si r ∈ R y


a ∈ Ak se tiene que


ra si i = k,




jk (ra)(i) =  = rjk (a)(i),
0 si i 6= k.
 

es decir, jk (ra) = rjk (a). Luego jk es un morfismo de Ak en ⊕i∈I Ai.


Veamos ahora que ⊕i∈I Ai junto a la colección de morfismos {jk }k∈I recién
definida es el coproducto de los R-módulos Ai. Si B es un R-módulo y gk es
un morfismo de Ak en B para cada k ∈ I, tenemos que definir un morfismo
g de ⊕i∈I Ai en B para que el siguiente diagrama

gk
Ak B

g
jk

Ai
L
i∈I

26
conmute para todo k ∈ I . Esto nos induce primero a definir g(jk (a)) = gk (a)
para todo a ∈ Ak . Veamos ahora cómo definir g en todo el R-módulo ⊕i∈I Ai.
Si α ∈ ⊕i∈I Ai entonces α(i) 6= 0 para una cantidad finita de ı́ndices i ∈ I,
digamos {i1, . . . , in}. Tenemos ası́ que

as = α(is) ∈ Ais ,

para s = 1, . . . , n. Luego


as si i = is,




jis (as)(i) = 
0 si i 6= is,


para s = 1, . . . , n, por lo tanto


n
α= jis (as).
X

s=1

Esto nos permite “extender a g por linealidad” a todo ⊕i∈I Ai, es decir, defini-
mos
n n
g(α) = g(jis (as)) = gis (as).
X X

s=1 i=1

Veamos que g es un homomorfismo de R-módulos. Basta con comprobarlo


con las funciones jk (¿por qué?). Si a, b ∈ Ak entonces

g(jk (a)+jk (b)) = g(jk (a+b)) = gj (a+b) = gj (a)+gj (b) = g(jk (a))+g(jk (b)),

y si r ∈ R entonces

g(rjk (a)) = g(jk (ra)) = gj (ra) = rgj (a) = rg(jk (a)).

27
Por lo tanto g es un morfismo de ⊕i∈I Ai en B y cumple, por definición, que
gjk = gk para todo k ∈ I (es decir que el diagrama anterior conmuta para
todo k ∈ I) y claramente g es única.

• El coproducto ⊕i∈I Ai se suele denominar suma directa de los R-módulos


Ai. Notar que ya habı́amos definido una suma directa de una cantidad finita
de R-módulos. Es inmediato ver que si I es finito tenemos la misma definición.
También vemos que en el caso de una cantidad infinita de ı́ndices el producto
de R-módulos y la suma directa de R-módulos no coinciden, cosa que sı́ ocurre
en el caso de una cantidad finita de R-módulos.

• Al ser todo grupo abeliano un Z-módulo, vemos que en la categorı́a Ab de


los grupos abelianos existe el coproducto.

• Por dualidad también existe el coproducto en las categorı́as Grp y Ring,


pero con las herramientas que tenemos no es posible dar una descripción
concreta de los coproductos como en los casos de las categorı́as Set y R-
Mod.

28
Categorı́as
1 Núcleo y conúcleo categóricos

En algunas categorı́as es posible definir la noción de núcleo y conúcleo de


un morfismo. Veremos que esta noción coincide con el concepto de núcleo y
conúcleo de un homomorfismo de grupos o de R-módulos.

Sea C una categorı́a. Recordemos que un objeto A de C se dice que es un


objeto inicial de C si HomC (A, B) es un conjunto unitario para cada objeto B
de C, es decir, para cada objeto B de C existe un único morfismo de A en B.

Vimos que si A es objeto inicial de C entonces HomC (A, A) = {1A} y esto


implica que si un objeto incial existe es único salvo isomorfismo: si A y A0
son objetos iniciales de C entonces hay un único morfismo f : A → A0 y un
único morfismo g : A0 → A. Luego

gf ∈ HomC (A, A) = {1A} y f g ∈ HomC (A0, A0) = {1A0 },

con lo cual gf = 1A y f g = 1A0 , es decir, f (y también g) es un isomorfismo


y ası́ A ' A0.

También vimos la noción de objeto final: un objeto Z de C se dice que es


un objeto final de C si HomC (B, Z) es un conjunto unitario para cada objeto
B de C, es decir, para cada objeto B de C existe un único morfismo de B
en Z. Similar al caso de objetos iniciales, es sencillo verificar que los objetos
finales de una categorı́a son únicos salvo isomorfismos.
1
Un objeto de una categorı́a C se dice que es un cero de C si es simultáneamente
objeto inicial y final de C. Lo denotaremos como 0 y, por lo anterior, es único
salvo isomorfismo.

• En la categorı́a Set el conjunto vacı́o es un objeto inicial. La función vacı́o


(la que no asigna elemento alguno a otro conjunto) es el único morfismo de
∅ en cualquier conjunto B. Por otro lado no hay función desde un conjunto
no vacı́o en el conjunto vacı́o, por lo tanto, ∅ no puede ser un objeto final.
Cualquier conjunto unitario {∗} (formado por un elemento que denotamos
como ∗), es un objeto final, pues desde cualquier conjunto B hay una única
función de B a {∗}, simplemente la función que asigna a cada elemento de B
el elemento ∗ si B 6= ∅. Si B = ∅ la única función es la función vacı́o. Por lo
tanto en Set no hay objeto cero.

• En la categorı́a Grp hay objeto cero. Es sencillo verificar que el grupo


trivial {e}, donde e es el neutro de algún grupo G, es un objeto inicial y final
(comprobarlo!). Por lo tanto {e} es el cero de Grp.

• Sea C una categorı́a con objeto 0. Vemos que para cada par de objetos A y
B de C hay únicos morfismos

f0 : A → 0 y g0 : 0 → B.

Por lo tanto tenemos un único morfismo g0f0 ∈ HomC (A, B) con esta propiedad:
se factoriza a través del objeto 0 de C. Tal morfismo se denotará como 0AB o
simplemente como 0, lo que es un abuso de notación, pero el contexto dejará
en claro si con 0 se hace referencia al objeto cero o al morfismo cero.
2
Sea f : A → B un morfismo de una categorı́a C. Un morfismo g : K → A
es el núcleo de f si

1) f g = 0KB , es decir el siguiente diagrama es conmutativo

K 0KB
g
f
A B

y si, además, se cumple la siguiente

2) (propiedad universal): si h : D → A es un morfismo tal que f h = 0DB

g f
K A B
h̃ h
D

entonces existe un único morfismo h̃ : D → K tal que g h̃ = h.

• Es sencillo comprobar (hacerlo!) que el núcleo de un morfismo es único


salvo isomorfismo (lo que justifica que digamos “el núcleo” de un morfismo).
El objeto K de la definición de núcleo es usualmente denotado como Ker f ,
mientras que la flecha Ker f → A se suele denotar como ker f . Es un ejercicio
de la práctica comprobar que en el caso de las categorı́as Grp y ModR la
noción de núcleo categórico coincide con la de núcleo de un homomorfismo.

Hay una noción dual a la de núcleo que es la de conúcleo. Sea C una


categorı́a con cero y sea f : A → B un morfismo de C. Un morfismo g : B →
C es el conúcleo de f si
3
1) gf = 0AC , es decir el siguiente diagrama es conmutativo

f
A B
g
0AC
C

y si, además, se cumple la siguiente

2) (propiedad universal): si h : B → D es un morfismo tal que hf = 0AD

f g
A B C
h

D

entonces existe un único morfismo h̃ : C → D tal que h̃g = h.

• Tal como en el caso del núcleo categórico, el conúcleo de un morfismo es único


salvo isomorfismo. El objeto C de la definición de conúcleo suele denotarse
como Coker f , mientras que la flecha B → Coker f suele denominarse coker f .

• Es un ejercicio de la práctica demostrar que el concepto de conúcleo es


dual al concepto de núcleo. Más precisamente, un morfismo g : B → C es
el conúcleo de un morfismo f : A → B en una categorı́a con cero C si y
sólo si en la categorı́a C op el morfismo g : C → B es el núcleo del morfismo
f : B → A.

4
• En la categorı́a ModR el conúcleo categórico de un homomorfismo f :
M → M 0 de R-módulos es la proyección natural π : M 0 → M 0/f (M ). Por
lo tanto Coker f = M 0/f (M ) tal como se define en la teorı́a de módulos.
En el caso de la categorı́a Grp el conúcleo categórico del homomorfismo de
grupos φ : G → G0 es la proyección natural π : G0 → G0/N (φ(G)) donde
N (φ(G)) es el normalizador del subgrupo imagen f (G) en G0. Por lo tanto
Coker φ = G0/N (φ(G)). Todas estas afirmaciones quedan como ejercicios de
la práctica.

5
2 Egalizadores y coegalizadores

En la definición de núcleo interviene una igualdad de morfismos en términos


del morfismo cero de la categorı́a considerada. Una de las motivaciones para
introducir el concepto de egalizador está en que permite generalizar el concepto
de núcleo en categorı́as en donde no hay objeto cero.

Sean f y g dos morfismos de A en B en una categorı́a C. Un objeto C de


C junto a un morfismo e : C → A se dice que es un egalizador de f y g en
C si
f e = ge,

y si, además, se tiene la siguiente propiedad universal: si e0 : C 0 → A es un


morfismo tal que f e0 = ge0 entonces existe un único morfismo h : C 0 → C
tal que e0 = eh, es decir, el siguiente diagrama

C0
h e0
e
C A B
f, g

es conmutativo. Por comodidad en la notación nos referiremos al egalizador


como un par (C, e).

Teorema 5. Sea C una categorı́a. Si un par (C, e) es un egalizador de un


par de morfismos f y g de A en B, entonces e es un monomorfismo. Además
si otro par (C 0, e0) es también un egalizador de f y g entonces C ' C 0.

6
Demostración. Tenemos que ver que para el morfismo e : C → A vale la
propiedad cancelativa a izquierda. Sean p y q dos morfismos de D en C tales
que ep = eq. Luego los pares (D, ep) y (D, eq) son egalizadores de f y g,
pues
f (ep) = (f e)p = (ge)p = g(ep),

y de igual manera se ve que f (eq) = g(eq). Por la propiedad universal del


par (C, e) existe un únco morfismo h : D → C tal que

eh = ep,

pero también ep = eq donde q : D → C, luego q = h. El mismo argumento


cambiando p con q muestra que p = h. Por lo tanto p = q con lo cual e es
un monomorfismo.
Veamos ahora que si (C 0, e0) es también un egalizador de f y g entonces
C ' C 0. Tenemos la siguiente situación:

C0
e0
e
C A B
f, g

Por la propiedad universal con el par (C, e) existe un único morfismo h :


C 0 → C tal que eh = e0, y por la propiedad universal con el par (C 0, e0) existe
un único morfismo h0 : C → C 0 tal que e = e0h0. Luego

e0 = eh = (e0h0)h = e0(h0h).

7
Esta igualdad se puede reescribir como e01C 0 = e0(h0h). Como e0 es un
monomorfismo podemos decir que

1C 0 = h0h.

De manera similar (hacerlo!) se concluye también que 1C = hh0. Por lo tanto


h es un isomorfismo (y h0 también) y ası́ tenemos que C ' C 0. 

• Es un ejercicio de la práctica mostrar que en una categorı́a con cero el núcleo


Ker f de un morfismo f : A → B es el egalizador de los morfismos f y 0AB .
Esto muestra que el concepto de egalizador es una generalización del concepto
de núcleo de un morfismo.

El concepto dual al de egalizador es el de coegalizador. Sean f y g dos


morfismos de A en B en una categorı́a C. Un objeto C de C junto a un
morfismo u : B → C se dice que es un coegalizador de f y g en C si

uf = ug,

y si, además, se tiene la siguiente propiedad universal: si u0 : B → C 0 es un


morfismo tal que u0f = u0g entonces existe un único morfismo h : C → C 0
tal que u0 = hu, es decir, el siguiente diagrama

f, g u
A B C
u0 h
C0

8
es conmutativo. Por comodidad en la notación nos referiremos al coegalizador
como un par (C, u).

• La unicidad del coegalizador salvo isomorfismo y la relación del coegalizador


con el conúcleo son propiedades a demostrar como ejercicios de la práctica.

9
3 Pullbacks (productos fibrados) y pushouts (cuadrados carte-
sianos)

Introducimos ahora la noción de pullback que permite generalizar, por ejem-


plo, el concepto de producto cartesiano entre conjuntos. Sea C una categorı́a
y sean f : A1 → A y g : A2 → A dos morfismos de C. Un objeto P de C
junto a dos morfismos p : P → A1 y q : P → A2 se dice que es el pullback
de f y g si el diagrama

q
P A2

p g
f
A1 A

conmuta, es decir f p = gq, y además se tiene la siguiente propiedad universal:


dado un objeto P 0 y dos morfismos p0 : P 0 → A1 y q 0 : P 0 → A2 tales que
f p0 = gq 0,

P0
q0
h
P A2
q
p0
p g
f
A1 A

existe un único morfismo h : P 0 → P tal que p0 = ph y q 0 = qh. Tal


como ocurre con muchas de estas construcciones con propiedades universales,
10
el pullback de dos morfismos f : A1 → A y g : A2 → A de C es único salvo
isomorfismo: sea P 0 otro pullback de los morfismos f y g, entonces por la
propiedad universal (intercambiando P por P 0 en el diagrama anterior) existe
un único morfismo h0 : P → P 0 tal que p = p0h0 y q = q 0h0. Luego

p(hh0) = (ph)h0 = p0h0 = p.

Haciendo P 0 = P , p0 = p y q 0 = q en el diagrama anterior, vemos que h = 1P


es el único morfismo de P en P que satisface p = ph y q = qh. Como hh0 es
también un morfismo de P en P que satisface la misma propiedad, se concluye
que hh0 = 1P . De manera similar se demuestra que h0h = 1P 0 (hacerlo!). Por
lo tanto h es un isomorfismo y ası́ P ' P 0.

Teorema 6. Sea C una categorı́a y sea P un objeto de C tal que junto a


dos morfismos p : P → A1 y q : P → A2 es el pullback de los morfismos
f : A1 → A y g : A2 → A (ver diagrama de la definición de pullback). Si f
es un monomorfismo entonces q también lo es.

Demostración. Sean i y j dos morfismos de P 0 en P tales que qi = qj. Luego

f (pi) = (f p)i = (gq)i = g(qi) = g(qj) = (gq)j = (f p)j = f (pj).

Por ser f un monomorfismo tenemos que pi = pj. Usando el diagrama de la


propiedad universal del pullback con A2 = A1 y q = p

11
P0
pi = pj
i, j
P A1
p
pi
p f
f
A1 A

vemos que, por unicidad, i = j. Por lo tanto q es un monomorfismo.

• Veamos ahora que el producto cartesiano de dos conjuntos puede verse


como un caso particular de pullback. Sea S un conjunto no vacı́o. Definimos
la categorı́a CS como aquella que tiene por objetos a los pares ordenados (X, f )
donde X es un conjunto no vacı́o y f : X → S es una función. Un morfismo
de (X, f ) en (Y, g) es una función h : X → Y tal que f = g ◦ h, es decir, el
diagrama

X f
h S
Y g

conmuta. Es sencillo verificar que CS es una categorı́a (hacerlo!). Notemos


que f es un morfismo de (X, f ) en (S, iS ) donde iS es la función identidad
de S en S. De igual manera g es un morfismo de (Y, g) en (S, iS ). Definimos
ahora un objeto de CS como el par

(X ×S Y, π),
12
donde X ×S Y = {(x, y) ∈ X × Y : f (x) = g(y)} y π : X ×S Y → S es la
función definida como π(x, y) = f (x). Veamos que (X ×S Y, π) junto a las
funciones p1 : X ×S Y → X y p2 : X ×S Y → Y definidas como

p1(x, y) = x y p2(x, y) = y,

es el pullback de los morfismos f y g. Claramente el diagrama

p2
(X ×S Y, π) (Y, g)

p1 g
f
(X, f ) (S, iS )

conmuta. Supongamos que (Z, h) es un objeto de CS junto a dos morfismos


p de (Z, h) en (X, f ) y q de (Z, h) en (Y, g) tales que f ◦ p = g ◦ q. Entonces
tenemos un morfismo de (Z, h) en (X ×S Y, π) definiendo la función h̃ : Z →
X ×S Y como h̃(z) = (p(z), q(z)) pues f (p(z)) = g(p(z)) para todo z ∈ Z
y, además
π(h̃(z)) = π(p(z), q(z)) = f (p(z)) = h(z),

para todo z ∈ Z, con lo cual h = π ◦ h̃ y ası́ vemos que h̃ es un morfismo


de (Z, h) en (X ×S Y, π). Es sencillo verificar (hacerlo!) que el morfismo h̃
es el único que cumple que p1 ◦ h̃ = p y p2 ◦ h̃ = q. Por lo tanto el conjunto
X ×S Y junto a los morfismos p1 y p2 es el pullback de f y g.
El conjunto X ×S Y también recibe el nombre producto fibrado sobre
S de X e Y .

13
• Por ejemplo, si S es un conjunto unitario, digamos S = {s}, entonces toda
función de un conjunto X en S es constantemente igual a s y ası́

X ×S Y = {(x, y) ∈ X × Y : f (x) = g(y)}


= {(x, y) ∈ X × Y : s = s} = X × Y,

es decir, el producto cartesiano usual de conjuntos es un caso particular de


producto fibrado.

• Supongamos ahora que Y ⊂ S es un conjunto unitario, digamos Y = {b}.


Si consideramos la inclusión i : Y → S entonces

X ×S Y = {(x, y) ∈ X × Y : f (x) = i(b) = b}


= {(x, b) : x ∈ X} ' f −1(b) = {x ∈ X : f (x) = b},

es decir, el producto fibrado X ×S Y se puede identificar con el conjunto


preimagen f −1(b). Este último conjunto suele ser denominado como la fibra
de X sobre b por f .

• El pullback (si existe) de dos morfismos f : A1 → A y g : A2 → A es


usualmente denotado como A1ΠAA2 o también como A1 ×A A2.

La noción dual a la de pullback es la noción de pushout. Sea C una categorı́a


y sean f : A → A1 y g : A → A2 dos morfismos de C. Un objeto T de C
junto a dos morfismos p : A1 → T y q : A2 → T se dice que es el pushout
o cuadrado cartesiano de f y g si el diagrama

14
g
A A2

f q
p
A1 T

conmuta, es decir pf = qg, y además se tiene la siguiente propiedad universal:


dado un objeto T 0 y dos morfismos p0 : A1 → T 0 y q 0 : A2 → T 0 tales que
p0f = q 0g, existe un único morfismo h : T → T 0
g
A A2

f q
q0
p
A1 T
h
p0
T0

tal que p0 = hp y q 0 = hq.

• Tal como en el caso del pullback, se demuestra que (si existe) el pushout
de dos morfismos f : A → A1 y g : A → A2 es único salvo isomorfismo
(comprobarlo!). En caso de existir el pushout de f y g es usualmente denotado
como A1 A A2 .
a

• Un ejemplo sencillo de existencia de pushout se da en la categorı́a Set.


Primero notemos que dadas dos funciones f : A → C y g : B → C, hay una

15
función h : A ∪ B → C que extiende a f y g cuando f = g en A ∩ B:

f (x) si x ∈ A





h(x) = 
g(x) si x ∈ B
 

Claramente h = f en A y h = g en B y, además, h es única. Veamos


ahora que existe el pushout de las funciones inclusión i1 : A ∩ B → A e
i2 : A ∩ B → B en la categorı́a Set: es sencillo comprobar que el siguiente
diagrama conmuta

i2
A∩B B

i1 iB
iA
A A∪B

donde iA e iB son las funciones inclusión. Supongamos que un conjunto D


junto con las funciones p : A → D y q : B → D son tales que p ◦ i1 = q ◦ i2.
Entonces p = q en A ∩ B y, por lo visto anteriormente, existe una única
función h : A ∪ B → D que extiende a p y a q. Por lo tanto h ◦ iA = p y
h ◦ iB = q. Cualquier otra función h0 : A ∪ B → D tal que h0 ◦ iA = p y
h0 ◦ iB = q es una extensión de p y q, con lo cual h0 = h. Luego existe en Set
el pushout de las funciones inclusión i1 : A ∩ B → A e i2 : A ∩ B → B.

• El pushout de dos homomorfismos de R-módulos f : A → A1 y g : A → A2


existe en la categorı́a ModR . En vista del ejemplo anterior, en donde la unión
de los conjuntos es un pushout, un primer intento podrı́a ser considerar la suma
directa A1 ⊕ A2 junto a las “inclusiones” p(a1) = (a1, 0) de A1 en A1 ⊕ A2 y
16
q(a2) = (0, a2) de A2 en A1 ⊕ A2 . Es sencillo verificar que la conmutatividad
del diagrama

g
A A2

f q
p
A1 A1 ⊕ A2

se da solamente para los elementos de Ker(f ) ∩ Ker(g). Esto nos dice que
la suma directa A1 ⊕ A2 es un objeto muy “grande” para oficiar de pushout.
Esta obstrucción se soluciona pasando a un R-módulo cociente: el conjunto

S = {(f (a), −g(a)) ∈ A1 ⊕ A2 : a ∈ A},

en un submódulo del producto directo A1 × A2 (comprobarlo!).


Sea T = (A1 ⊕ A2)/S el módulo cociente. Es sencillo verificar que las
funciones p : A1 → T y q : A2 → T definidas como

p(a1) = (a1, 0) + S y q(a2) = (0, a2) + S,

para todo a1 ∈ A1 y todo a2 ∈ A2 son homomorfismos de R-módulos.

g
A A2

f q
p
A1 T = (A1 ⊕ A2)/S

17
Tenemos que para cada a ∈ A

p(f (a)) = (f (a), 0) + S y q(g(a)) = (0, g(a)) + S.

Como (f (a), 0) − (0, g(a)) = (f (a), −g(a)) ∈ S, entonces p(f (a)) = q(g(a))
para todo a ∈ A, es decir p ◦ f = q ◦ g.
Supongamos que T 0 es un R-módulo junto a dos homomorfismos de R-
módulos p0 : A1 → T 0 y q 0 : A2 → T 0 tales que p0 ◦ f = q 0 ◦ g. Definimos una
función
h : (A1 ⊕ A2)/S → T 0,

como h((a1, a2) + S) = p0(a1) + q 0(a2). Veamos que está bien definida: si
(a1, a2) + S = (b1, b2) + S entonces existe a ∈ A tal que a1 − b1 = f (a) y
a2 − b2 = −g(a). Luego

p0(b1) = p0(a1 − f (a)) = p0(a1) − p0(f (a)) = p0(a1) − q 0(f (a)),

y también
q 0(b2) = q 0(a2 + g(a)) = q 0(a2) + q 0(g(a)),

con lo cual p0(b1) + q 0(b2) = p0(a1) + q 0(a2). Dado que p0 y q 0 son homo-
morfismos de R-módulos, es inmediato ver que h es un homomorfismo de
R-módulos. También tenemos que

h(p(a1)) = h((a1, 0 + S)) = p0(a1) + q 0(0) = p0(a1),

para todo a1 ∈ A1, y de manera similar se ve que h(q(a2)) = q 0(a2) para todo
a2 ∈ A2. Por lo tanto p0 = h ◦ p y q 0 = h ◦ q. Finalmente veamos que h es

18
único: si h̃ : (A1 ⊕ A2)/S → T 0 es un homomorfismo de R-módulos tal que
h̃ ◦ p = p0 y h̃ ◦ q = q 0 entonces

h̃((a1, a2) + S) = h̃((a1, 0) + S + (0, a2) + S)


= h̃(p(a1) + q(a2))
= h̃(p(a1)) + h̃(q(a2))
= p0(a1) + q 0(a2) = h((a1, a2) + S),

con lo cual h̃ = h.

• Estos ejemplos nos dicen que el concepto de pushout puede considerarse


también como una generalización del proceso de construir un objeto a partir
de dos objetos que tienen alguna relación entre ellos.

19
Categorı́as
1 Funtores

Vimos la importancia de relacionar grupos (y también anillos y módulos)


entre sı́ mediante funciones con ciertas propiedades, los homomorfismos de
grupos (o de anillos o módulos). Esta idea se traslada también al caso de
las categorı́as y recibe el nombre funtor. Con este concepto podemos definir
de manera formal, por ejemplo, cuándo dos categorı́as pueden considerarse
“iguales” en algún sentido.

Sean C1 y C2 dos categorı́as. Un funtor covariante F de C1 a C2 consiste


de

i) una función de Obj(C1) en Obj(C2) que a cada objeto A de C1 le asigna


un objeto F A de C2.

ii) Una función tal que a cada par de objetos A y B de C1 asigna a cada
morfismo f : A → B un morfismo F (f ) : F A → F B en C2 con estas
propiedades:

a) si se tiene la composición f g de dos morfismos en C1 entonces

F (gf ) = F (g)F (f ),

en C2 y

b) F (1A) = 1F A para todo objeto A de C1.

1
La condición ii) a) nos dice que si se tiene un diagrama conmutativo en C1

f B
A g
h C

entonces se tiene el diagrama conmutativo en C2

F (f ) FB
FA F (g)
F (h) F C

Un funtor contravariante F de C1 a C2 es un funtor de C1 a C2 que


revierte el sentido de las flechas, es decir, la condición ii) cambia de la siguiente
manera: si f : A → B un morfismo en C1 entonces F (f ) : F B → F A es
un morfismo en C2. Por lo tanto la propiedad ii) a) cambia ası́: si se tiene la
composición f g de dos morfismos en C1 entonces

F (gf ) = F (f )F (g),

en C2. Es decir, si se tiene el diagrama conmutativo en C1

f B
A g
h C

entonces se tiene el diagrama conmutativo en C2

2
F (f ) FB
FA F (g)
F (h) F C

Alternativamente, un funtor contravariante F de C1 a C2 es un funtor de


C1 a C2op.

Es usual referirse a los funtores covariantes simplemente como funtores,


omitiendo la palabra covariante. De ahora en adelante haremos lo mismo, a
menos que sea necesario aclarar que se trata de un funtor covariante.

• Dada una categorı́a C, se tiene el funtor identidad 1C que asigna a cada


objeto A de C el mismo objeto A y a cada morfismo f : A → B en C le asigna
el mismo morfismo f . Es inmediato comprobar que 1C es un funtor de C en
C.

• Si F es un funtor de C1 en C2 y G es un funtor de C2 en C3, se tiene un


funtor de C1 en C3, que de denota como GF y se denomina la composición
de F con G, que asigna a cada objeto A de C1 el objeto (GF )A = G(F A) de
C3 y si f : A → B es un morfismo de C1 entonces (GF )(f ) = G(F (f )), que
es un morfismo de (GF )A en (GF )B en C3.

• Todo funtor lleva isomorfismos en isomorfismos, pues si f : A → B es un


isomorfismo de una categorı́a C, entonces existe un morfismo g : B → A tal

3
que f g = 1B y gf = 1A. Luego si F es un funtor de C en C˜ entonces

F (f )F (g) = F (f g) = F (1B ) = 1F B ,

y
F (g)F (f ) = F (gf ) = F (1A) = 1F A,

con lo cual F (f ) es un isomorfismo de F A → F B. No obstante (ver ejercicios


de la práctica) un funtor no necesariamente lleva epimorfismos en epimorfismos
ni monomorfismos en monomorfismos.

• Se tiene un funtor desde Grp en Set que “despoja” a cada grupo G de


su estructura y se queda con el conjunto de los elementos, es decir, dado un
grupo (G, ∗) se define
F (G, ∗) = G,

y si φ : (G, ∗) → (G0, ∗0) es un homomorfismo de grupos, F (φ) = φ como


función de G en G0. Tal funtor recibe el nombre de funtor “olvido” o “forget-
ful” (en inglés). De manera similar se tiene un funtor “olvido” desde Ring o
R-Mod en Set.

• Sea R un anillo y sea n ∈ N. Definimos el funtor Mn de Ring en Ring


de la siguiente manera: MnR es el anillo formado por todas las matrices
cuadradas de n × n cuyas componentes son elementos de R. Si f : R → R0 es
un homomorfismo de anillos, entonces Mn(f ) es el homomorfismo de anillos
que a cada matriz A = (aij )n×n de MnR le asigna la matriz B = (bij )n×n de
MnR0 donde cada bij = f (aij ). (Verificar que Mn es efectivamente un funtor!)

4
• El funtor abelianizador. Dado un grupo G el conmutador de G es el
subgrupo de G generado por todos los productos de la forma a−1b−1ab con
a, b ∈ G y es usual denotarlo como [G, G] o G0. Se demuestra (hacerlo!) que
[G, G] es un subgrupo normal de G y, además, [G, G] es el menor subgrupo
normal de G tal que G/[G, G] es abeliano (es decir, si H C G y G/H
es abeliano entonces [G, G0] < H). Utilizando el conmutador se define un
funtor F ab de Grp a Ab: si G es un grupo se define F abG = G/[G, G] y
si φ : G → G̃ es un homomorfismo de grupos entonces se demuestra que
φ([G, G]) es subgrupo de [G̃, G̃], con lo cual la función φ̃ : G/[G, G] →
G̃/[G̃, G̃] definida como φ̃([G, G]a) = [G̃, G̃]φ(a) es un homomorfismo de
grupos (demostrar todas estas afirmaciones!). Definiendo F ab(φ) = φ̃ tenemos
que F ab es un funtor de Grp en Ab que se denomina funtor abelianizador
(por obvias razones!).

• Sea R un anillo conmutativo. Definimos ahora un funtor contravariante de


R-Mod en R-Mod. Si M un R-módulo, entonces el conjunto

HomR (M, R) = {f : M → R : f es un homomorfismos de R-módulos},

tiene estructura de R-módulo definiendo la suma de manera usual, es decir, si


f y g ∈ HomR (M, R) entonces f +g se define como (f +g)(m) = f (m)+g(m)
para todo m ∈ M y si r ∈ R entonces rf se define como (rf )(m) = rf (m).
Es sencillo verificar que con estas operaciones HomR (M, R) es un R-módulo
(hacerlo!) (Si R no es conmutativo entonces la definición (rf )(m) = rf (m)
no es correcta. Hay que considerar la acción de R a la derecha, es decir, hay

5
que definir (f r)(m) = f (m)r, con lo cual HomR (M, R) será un R-módulo
a derecha y, por lo tanto, el funtor irı́a de la categorı́a de los R-módulos a
izquierda en la categorı́a de los R-módulos a la derecha). Definimos el funtor
D de R-Mod en R-Mod de la siguiente manera: si M es un R-módulo
entonces
DM = HomR (M, R).

Sea φ : M → N un homomorfismo de R-módulos. Definimos

D(φ) : HomR (N, R) → HomR (M, R),

como D(φ)(g) = g ◦ φ para todo g ∈ HomR (N, R):

φ
M N
g◦ g
φ
R

Claramente g ◦ φ : M → R es un homomorfismo de R-módulos, es decir


g ◦ φ ∈ HomR (M, R). Tenemos ası́ que D(φ) es un morfismo de D(N ) en
D(M ) para todo morfismo φ de M en N . Si

φ ψ
M N T

son homomorfismos de R-módulos, entonces ψ ◦ φ : M → T es un ho-


momorfismo de R-módulos. Veamos que D(ψ ◦ φ) = D(φ) ◦ D(ψ): si

6
h ∈ HomR (T, R) entonces

D(ψ ◦ φ)(h) = h ◦ (ψ ◦ φ)
= (h ◦ ψ) ◦ φ
= D(φ)(h ◦ ψ)
 
= D(φ)(D(ψ)(h)) = D(φ) ◦ D(ψ) (h).

Finalmente, si M es un R-módulo el morfismo identidad 1M : M → M es


la función identidad de M en M , es decir 1M (m) = m para todo m ∈ M .
Luego si g ∈ Hom(M, R) entonces

D(1M )(g) = g ◦ 1M = g = 1D(M )(g),

es decir D(1M ) = 1D(M ).

• El R-módulo HomR (M, R) que utilizamos en el ejemplo anterior suele de-


nominarse R-módulo dual de M y es usualmente denotado como M ∗. Con
esta notación y en relación al funtor D del ejemplo anterior, escribiremos
M ∗ = DM y φ∗ = D(φ) para todo R-módulo M y todo homomorfismo
φ : M → N de R-módulos. El funtor D también suele denotarse como
HomR (−, R), es decir

HomR (−, R)M = HomR (M, R) y HomR (−, R)(φ) = φ∗,

para todo R-módulo M y todo homomorfismo φ : M → N de R-módulos.

• En general, si R es un anillo conmutativo, fijado un R-módulo T se definen

7
(comprobar que lo son!) los funtores contravariante HomR (−, T ) y covariante
HomR (T, −) de R-Mod en R-Mod, donde

HomR (−, T )M = HomR (M, T ) y HomR (T, −)M = HomR (T, M )

para todo R-módulo M y

HomR (−, T )(φ) = φ∗ : HomR (N, T ) → HomR (M, T )

para todo homomorfismo φ : M → N de R-módulos, donde φ∗(g) = g ◦ φ


para todo homomorfismo de R-módulos g : N → T :

φ
M N
g◦ g
φ
T

mientras que

HomR (T, −)(ψ) = ψ 0 : HomR (T, M ) → HomR (T, N )

para todo homomorfismo ψ : M → N de R-módulos, donde ψ 0(g) = ψ ◦ g


para todo homomorfismo de R-módulos g : T → M :

T ψ◦
g g

M N
ψ

Estos funtores son de gran importancia en el Álgebra homológica, pues


actúan sobre sucesiones exactas de R-módulos dando lugar a una teorı́a que
8
se denomina cohomologı́a de módulos. Por ejemplo, al usar el funtor
HomR (T, −) se puede demostrar que si

φ ψ
0 M N L 0

es una sucesión exacta de R-módulos entonces la sucesión de R-módulos

φ0 ψ0
0 HomR (T, M ) HomR (T, N ) HomR (T, L)

es exacta. Cuando la sucesión

φ0 ψ0
0 HomR (T, M ) HomR (T, N ) HomR (T, L) 0

es exacta (no siempre lo es) se dice que el R-módulo T es proyectivo. Por


ejemplo, todo espacio vectorial sobre un cuerpo F (es decir, todo F -módulo)
es proyectivo. Por otra parte, si usamos el funtor contravariante HomR (−, T )
se puede demostrar que la sucesión de R-módulos

ψ∗ φ∗
0 HomR (L, T ) HomR (N, T ) HomR (M, T )

es exacta. Cuando la sucesión

ψ∗ φ∗
0 HomR (L, T ) HomR (N, T ) HomR (M, T ) 0

es exacta (no siempre lo es) se dice que el R-módulo T es inyectivo. Por


ejemplo el Z-módulo Q es inyectivo.

9
2 Transformaciones naturales

Ası́ como los funtores relacionan categorı́as, las denominadas transforma-


ciones naturales relacionan funtores de la siguiente manera: sean C1 y C2 dos
categorı́as y sean F y G dos funtores de C1 en C2. Una transformación
natural η de F en G consiste en asignar a cada objeto A de C1 un morfismo
ηA de F A en GA en C2 tal que para todo objeto B de C1 y todo morfismo f
de A en B el siguiente diagrama conmuta

ηA
FA GA

F (f ) G(f )
ηB
FB GB

es decir, G(f )ηA = ηB F (f ). Se dice que η es un isomorfismo natural


entre F y G si cada ηA es un isomorfismo. En este caso escribiremos F ' G.

• Por ejemplo, hay una transformación natural del funtor identidad en el


funtor doble dual D2 en la categorı́a R-Mod (R conmutativo), donde para
todo R-módulo M se tiene que D2M = (M ∗)∗ = HomR (M ∗, R). Por otro
lado si φ : M → N es un homomorfismo de R-módulos, recordemos que
φ∗ : N ∗ → M ∗ definida como φ∗(g) = g ◦ φ para todo g ∈ HomR (N, R)
es un homomorfismo de R-módulos. De igual manera tenemos definido un
homomorfismo de R-módulos φ∗∗ : (M ∗)∗ → (N ∗)∗ donde para cada f :
M ∗ → R se tiene que φ∗∗(f ) = f ◦ φ∗:

10
φ∗
N∗ M∗
f◦ f
φ∗
R

De esta manera definimos D2(φ) = φ∗∗ para cada homomorfismo de R-


módulos φ : M → N .
Definimos ahora una transformación natural η entre el funtor indentidad
1ModR y el funtor doble dual D2. Es decir, para cada homomorfismo de R-
módulos φ : M → N tenemos que definir homomorfismos de R-módulos ηM
y ηN tales que el siguiente diagrama

ηM
M D2(M )

φ φ∗∗
ηN
N D2(N )

conmuta.
Escribiremos M ∗∗ en lugar de (M ∗)∗ = D2(M ). Dado m ∈ M se define
ηM (m) ∈ M ∗∗ como
ηM (m)(f ) = f (m),

para todo f ∈ M ∗. Tenemos que ηM (m) : M ∗ → R y es un homomorfismo


de R-módulos pues

ηM (m)(f + g) = (f + g)(m) = f (m) + g(m) = ηM (m)(f ) + ηM (m)(g),

11
y si r ∈ R entonces

ηM (m)(rf ) = (rf )(m) = rf (m) = rηM (m)(f ).

Por lo tanto η(m) ∈ M ∗∗ para todo m ∈ M . Finalmente vemos que ηM :


M → M ∗∗ es un homomorfismo de R-módulos tal que el siguiente diagrama

ηM
M M ∗∗

φ φ∗∗
ηN
N N ∗∗

conmuta, es decir, φ∗∗ ◦ ηM = ηN ◦ φ. Primero tenemos que

ηM (m + m0)(f ) = f (m + m0) = f (m) + f (m0) = ηM (m)(f ) + ηM (m)(f ),

para todo f ∈ M ∗, lo que nos dice que

ηM (m + m0) = ηM (m) + ηM (m0),

y si r ∈ R entonces

ηM (rm)(f ) = f (rm) = rf (m) = rηM (m)(f ),

para todo f ∈ M ∗, con lo cual ηM (rm) = rηM (m) para todo r ∈ R. Veamos
ahora que φ∗∗ ◦ ηM = ηN ◦ φ. Para todo m ∈ M

(φ∗∗ ◦ ηM )(m) = φ∗∗(ηM (m)) = ηM (m) ◦ φ∗,

12
ηM (m)
M∗ R
φ∗ ∗
◦φ
N ∗ ( m)
η M

por lo tanto, para todo g ∈ N ∗

(ηM (m) ◦ φ∗)(g) = ηM (m)(φ∗(g)) = ηM (m)(g ◦ φ) = g(φ(m)).

Por otro lado


(ηN ◦ φ)(m) = ηN (φ(m)),

para todo m ∈ M , es decir tenemos el diagrama conmutativo

φ
M N
ηN ηN
◦φ
N ∗∗

Entonces, para todo m ∈ M y toda g ∈ N ∗ se tiene que

ηN (φ(m))(g) = g(φ(m)) = (ηM (m) ◦ φ∗)(g),

y ası́ vemos que φ∗∗ ◦ ηM = ηN ◦ φ. Todo esto nos dice que η es una trans-
formación natural entre el funtor indentidad 1ModR y el funtor doble dual D2
de R-Mod en R-Mod.

13
3 Equivalencia de categorı́as

Veremos ahora en qué sentido se puede definir que dos categorı́as son “esen-
cialmente” las mismas. Una idea bastante natural es definir una noción de
isomorfismo entre categorı́as teniendo en cuenta lo que hicimos para grupos,
anillos y módulos.
Dos categorı́as C1 y C2 se dice que son isomorfas si existen funtores F
de C1 en C2 y G de C2 y C1 tales que GF = 1C1 y F G = 1C2 . En este caso
escribiremos C1 ' C2.

• Por ejemplo Ab ' Z-Mod, pues todo grupo abeliano es un Z-módulo


(y recı́procamente), y todo homomorfismo de grupos es un homomorfismo de
Z-módulos pues si φ : G → G0 es un homomorfismo de grupos abelianos
entonces

φ(na) = φ(a + a + · · · + a) = φ(a) + φ(a) + · · · + φ(a) = nφ(a),

con lo cual φ es también un homomorfismo de Z-módulos. La recı́proca


también es inmediata. Por lo tanto el funtor F de Ab en Z-Mod tal que
F G = G y F (φ) = φ para todo homomorfismo φ : G → G0 de grupos
abelianos, es un isomorfismo pues el funtor G de Z-Mod en Ab tal que
G(M ) = M para todo Z-módulo M y G(f ) = f para todo homomorfismo
f : M → M 0 de Z-módulos satisface que GF = 1Ab y F G = 1Z-Mod.

Este concepto de isomorfismo de categorı́as resulta ser bastante restrictivo


para los propósitos de identificar categorı́as que son “esencialmente iguales”.

14
El concepto más amplio de equivalencia de categorı́as ha demostrado ser
el correcto: dos categorı́as C1 y C2 se dice que son equivalentes si existen
funtores F de C1 en C2 y G de C2 y C1 tales que GF ' 1C1 y F G ' 1C2 , es decir,
GF es naturalmente isomorfo al funtor identidad 1C1 y F G es naturalmente
isomorfo al funtor identidad 1C2 . Cuando sea necesario enfatizar la noción
de equivalencia en términos de la existencia de funtores F y G naturalmente
isomorfos, diremos que el par de funtores (F, G) es una equivalencia entre C1
y C2 .

• Es sencillo verificar (hacerlo!) que la noción de equivalencia entre cate-


gorı́as es una relación de equivalencia entre categorı́as. Claramente categorı́as
isomorfas son equivalentes.

Veremos ahora un criterio para demostrar que dos categorı́as son equiva-
lentes (o no) en términos de ciertas propiedades de uno de los funtores que
determinarı́an la equivalencia. Un funtor F de C1 en C2 se dice que es con-
fiable (resp. total o completo) si para cada par de objetos A y B de C1
la función de HomC1 (A, B) en HomC2 (F A, F B) definida como f 7→ F (f )
es inyectiva (resp. sobreyectiva). Antes de pasar a enunciar y demostrar el
criterio de equivalencia de categorı́as, necesitamos el siguiente lema auxiliar.

Lema 7. Sea F un funtor confiable y total de la categorı́a C1 en la categorı́a


C2. Si A y B son objetos de C1 tales que g : F A → F B es un isomorfismo,
entonces existe un único isomorfismo f : A → B tal que F (f ) = g.

Demostración. Sea g : F A → F B un isomorfismo. Por ser F confiable y


15
total, existe un único morfismo f : A → B tal que F (f ) = g. Por la misma
razón, usando que el morfismo inverso g −1 de g va de F B en F A, existe un
único morfismo h : B → A tal que F (h) = g −1. Entonces

F (f h) = F (f )F (h) = gg −1 = 1F B ,

y también F (1B ) = 1F B , con lo cual f h = 1B . De manera similar se de-


muestra que hf = 1A. Por lo tanto f : A → B es un isomorfismo tal que
F (f ) = g y es único.

Teorema 8. Sean C1 y C2 dos categorı́as. El par de funtores (F, G) es una


equivalencia entre C1 y C2 si y sólo si F es confiable y total y, además, para
cada objeto A0 de C2 existe un objeto A de C1 tal que A0 y F A son isomorfos.

Demostración. Supongamos que el par de funtores (F, G) es una equivalencia


entre C1 y C2, es decir, tenemos funtores F de C1 en C2 y G de C2 en C1 tales que
GF ' 1C1 y F G ' 1C2 . Vemos que la función f 7→ (GF )(f ) de HomC1 (A, B)
en HomC1 ((GF )A, (GF )B) es biyectiva pues GF ' 1C1 .
Esto implica que la función f 7→ F (f ) de HomC1 (A, B) en HomC2 (F A, F B)
tiene que ser inyectiva. Por lo tanto F es confiable.
De manera similar se ve que la función g 7→ (F G)(g) de HomC2 (A0, B 0)
en HomC2 ((F G)A0, (F G)B 0) es biyectiva, y esto implica que la función f 7→
F (f ) de HomC1 (A, B) en HomC2 (F A, F B) tiene que ser sobreyectiva. Por lo
tanto F es total.
16
Sea A0 un objeto de C2. Como F G ' 1C2 , hay un isomorfismo

ηA0 : A0 → (F G)A0,

y haciendo A = GA0, tenemos que A es un objeto de C1 tal que F A =


F (GA0) = (F G)A0, con lo cual A0 y F A son isomorfos.
Recı́procamente, supongamos que F es un funtor confiable y total de C1 en
C2 y que, además, para cada objeto A0 de C2 existe un objeto A de C1 tal que
A0 y F A son isomorfos. Tenemos que definir un funtor G de C2 en C1 tal que
GF sea naturalmente isomorfo al funtor identidad 1C1 y F G sea naturalmente
isomorfo al funtor identidad 1C2 .
Sea A0 un objeto de C2. Por hipótesis existe un objeto A de C1 y un
isomorfismo ηA0 : A0 → F A en C2. Asignamos ası́ a cada objeto A0 de
ObjC2 un objeto A de ObjC1 que denotamos como GA0 (el objeto A puede no
ser único, ası́ que se podrán definir tantas asignaciones GA0 como elecciones
posibles del objeto A haya). Luego, con esta notación, tenemos que

ηA0 : A0 → F GA0,

es un isomorfismo.
Dado otro objeto B 0 de C2 tenemos otro isomorfismo

ηB 0 : B 0 → F GB 0.

Sea g : A0 → B 0 un morfismo en C2 y consideremos el diagrama

17
ηA0
0
A F GA0
g (1)
ηB 0
B0 F GB 0

Tenemos ası́ el morfismo ηB 0 g ηA−10 : F GA0 → F GB 0. Por ser F confiable y


total existe un único morfismo f : GA0 → GB 0 tal que

F (f ) = ηB 0 g ηA−10 .

De esta manera tenemos una función de HomC2 (A0, B 0) en HomC1(GA0, GB 0)


definida como G(g) = f . Por lo tanto F (G(g)) = F (f ) = ηB 0 g ηA−10 y tenemos
el diagrama conmutativo
ηA0
0
A F GA0
g F (G(g)) (2)
ηB 0
B0 F GB 0

Notar que por la unicidad de f , tenemos que F (G(g)) es el único morfismo


de F GA0 en F GB 0 tal que el diagrama anterior conmuta.
Sea C 0 un objeto de C2 y sea h : B 0 → C 0 un morfismo. Por todo lo visto,
tenemos el diagrama
ηA0
0
A F GA0
g F (G(g))
ηB 0
B0 F GB 0
h F (G(h))
ηC 0
C0 F GC 0

18
que conmuta en los rectángulos “interiores”, es decir, F (G(g)) ηA0 = ηB 0 g y
F (G(h)) ηB 0 = ηC 0 h. Por lo tanto, el rectángulo “exterior” conmuta ya que

F (G(h))F (G(g))ηA0 = F (G(h))ηB 0 g


= ηC 0 hg.

Pero por otro lado, hg es un morfismo de A0 en C 0 y, por la construcción


anterior, se tiene el morfismo G(hg) : GA0 → GB 0 tal que F (G(gh)) es el
único morfismo de F GA0 en F GC 0 tal que el diagrama

ηA0
0
A F GA0
hg F (G(hg))
0
ηC 0
C F GC 0

conmuta. Como el morfismo F (G(h))F (G(g)) : F GA0 → F GC 0 también


hace conmutar este último diagrama, entonces

F (G(hg)) = F (G(h))F (G(g)).

Si en el diagrama (1) hacemos B 0 = A0 y g = 1A0 , tenemos que existe un


único morfismo f : GA0 → GA0 tal que

F (f ) = ηA0 1A0 ηA−10 .

Pero también ηA0 1A0 ηA−10 = ηA0 ηA−10 = 1F GA0 = F (1GA0 ), entonces f = 1GA0 ,
con lo cual
G(1A0 ) = 1GA0 .

19
Por lo tanto G es un funtor de C2 en C1.
Veamos ahora que GF es naturalmente isomorfo al funtor identidad 1C1 y
también que F G es naturalmente isomorfo al funtor identidad 1C2 . Notemos
que la conmutatividad del diagrama (2) nos dice directamente que F G ' 1C2
pues los morfismos ηA0 y ηB 0 son isomorfismos.
Por otro lado, tal como vimos previo a la construcción del diagrama (1),
dado un objeto A de C1 y haciendo A0 = F A, hay un isomorfismo ηF A :
F A → F GF A. Por Lema 7, existe un único isomorfismo ηA : A → GF A tal
que F (ηA) = ηF A. Si f : A → B es un morfismo en C1, y haciendo A0 = F A
y B 0 = F B en el diagrama (2), tenemos el siguiente diagrama conmutativo

ηF A
FA F GF A
F (f ) F (G(F (f )))
ηF B
FB F GF B

Como F (ηA) = ηF A, el diagrama conmutativo anterior queda ası́

F (ηA)
FA F GF A
F (f ) F (G(F (f )))
F (ηB )
FB F GF B

es decir
 
F G(F (f ))ηA = F (G(F (f )))F (ηA) = F (ηB )F (f ) = F (ηB f ).

20
Por ser F confiable tenemos que

G(F (f ))ηA = f ηB ,

con lo cual el diagrama


ηA
A GF A
f G(F (f ))
ηB
B GF B

es conmutativo. Por ser ηA y ηB isomorfismos concluı́mos que GF ' 1C1 . Por


lo tanto el par de funtores (F, G) es una equivalencia entre C1 y C2.

• Utilizaremos el criterio del Teorema 8 para demostrar que la categorı́a Mod-


R de los R-módulos a derecha es equivalente a la categorı́a Mod-Mn(R) de los
Mn(R)-módulos a derecha (recordemos que Mn(R) es el anillo de las matrices
cuadradas de n × n con componentes en R). Sea M un R-módulo a derecha
y sea M (n) = M × M × · · · × M el R-módulo a derecha que es producto
directo de n copias de M , es decir

M (n) = {(a1, . . . , an) : mi ∈ M, 1 ≤ i ≤ n}.

Definimos una acción lineal a derecha de Mn(R) sobre M (n): dados un vector
(a1, . . . , an) ∈ M (n) y una matriz A = (rij )n×n ∈ Mn(R) tenemos el producto
usual de matrices

(a1, . . . , an)A = (b1, . . . , bn) ∈ M (n),


21
Pn
donde bj = i=1 ai rij para j = 1, . . . , n. Es sencillo verificar (hacerlo!) que
este producto de matrices define una acción lineal a derecha de Mn(R) sobre
M (n). Más precisamente M (n) es un Mn(R)-módulo a la derecha. Tenemos
ası́ una asignación
M 7→ F M = M (n),

de Obj(Mod-R) en Obj(Mod-Mn(R)).
Sea f : M → N un homomorfismo de R-módulos a derecha. Definimos un
homomorfismo f n : M (n) → N (n) de Mn(R)-módulos de la siguiente manera
(verificarlo!):
f n(a1, . . . , an) = (f (a1), . . . , f (an)).

Tenemos ası́ una asignación

f 7→ F (f ) = f n,

de HomMod-R (M, N ) en HomMod-Mn(R)(M (n), N (n)).


Veamos ahora que F es un funtor de Mod-R en Mod-Mn(R): si f :
M → N y g : N → T son dos homomorfismos de R-módulos a derecha
entonces g ◦ f : M → T es un homomorfismo de R-módulos a la derecha.
Luego F (g ◦ f ) = (g ◦ f )n y

(g ◦ f )n(a1, . . . , an) = (g(f (a1)), . . . , g(f (an)))


= g n(f (a1), . . . , f (an)) = (g n ◦ f n)(a1, . . . , an),

22
para todo (a1, . . . , an) ∈ M (n), con lo cual

F (g ◦ f ) = (g ◦ f )n = g n ◦ f n = F (g) ◦ F (f ).

Además, si 1M : M → M es el homomorfismo identidad, es decir, 1M (a) = a


para todo a ∈ M , entonces

F (1M )(a1, . . . , an) = 1nM (a1, . . . , an) = (a1, . . . , an) = 1M (n) (a1, . . . , an),

para todo (a1, . . . , an) ∈ M (n), es decir, F (1M ) = 1M (n) .


Tenemos que verificar ahora que el funtor F es confiable y total. Sean f y g
dos homomorfismos R-módulos a derecha de M en N tales que F (f ) = F (g).
Luego f n = g n, con lo cual

(f (a1), . . . , f (an)) = (g(a1), . . . , g(an)),

para todo (a1, . . . , an) ∈ M (n). En particular f (a) = g(a) para todo a ∈ M ,
es decir, f = g. Por lo tanto F es confiable.
Sea h : M (n) → N (n) un homomorfismo de Mn(R)-módulos a derecha.
Es sencillo comprobar (hacerlo!) que existen n homomorfismos de grupos
abelianos hi : M (n) → N para 1 ≤ i ≤ n tales que h = (h1, . . . , hn), es decir

h(a1, . . . , an) = (h1(a1, . . . , an), . . . , hn(a1, . . . , an)),

para todo (a1, . . . , an) ∈ M (n) y además, para cada matriz A = (aij )n×n ∈
Mn(R) se tiene que

h((a1, . . . , an)A) = h(a1, . . . , an)A = (b1, . . . , bn),


23
Pn
donde bj = i=1 hi (a1 , . . . , an )aij para j = 1, . . . , n. Por otro lado

h((a1, . . . , an)A) = (h1((a1, . . . , an)A), . . . , hn((a1, . . . , an)A)),

con lo cual
n
hj ((a1, . . . , an)A) = bj = hi(a1, . . . , an)aij ,
X

i=1

para j = 1, . . . , n.
Para cada 1 ≤ k, l ≤ n definimos ahora las matrices Ekl = (eij ) ∈ Mn(R)
donde ekl = 1 mientras que eij = 0 para todo (i, j) 6= (k, l).
Sea E = E11. Entonces

h((a1, . . . , an)E) = h(a1, 0, . . . , 0) = (h1(a1, 0, . . . , 0), . . . , hn(a1, 0, . . . , 0)).

Por otro lado

h((a1, . . . , an)E) = h(a1, . . . , an)E = (b1, . . . , bn),

Pn
donde bj = i=1 hi (a1 , . . . , an )eij para j = 1, . . . , n. Luego

b1 = h1(a1, . . . , an) y bj = 0 para j = 2, . . . , n.

Esto nos dice que

h1(a1, 0, . . . , 0) = h1(a1, . . . , an),

y que hj (a1, 0, . . . , 0) = 0 para j = 2, . . . , n, con lo cual podemos escribir

24
f (a) = h1(a, 0, . . . , 0) y ası́

h(a, 0, . . . , 0) = (f (a), 0, . . . , 0),

para todo a ∈ M . Notar que f : M → N es un homomorfismo de R-módulos


a derecha pues

f (a + b) = h1(a + b, 0, . . . , 0)
= h1((a, 0, . . . , 0) + (0, b, . . . , 0))
= h1(a, 0, . . . , 0) + h1(0, b, . . . , 0)
= f (a) + f (b),

para todo a, b ∈ M . Sean a ∈ M y r ∈ R, entonces

(ar, 0, . . . , 0) = (a, 0, . . . , 0)E(r),

donde E(r) = rE.


Luego

f (ar) = h1(ar, 0, . . . , 0)
= h1((a, 0, . . . , 0)E(r))
n
= hi(a, 0, . . . , 0)rei1
X

i=1

= h1(a, 0, . . . , 0)r = f (a)r.

Para k = 1, . . . , n consideramos ahora la matriz Ek = (bij ) ∈ Mn(R)

25
donde b1k = 1 y bij = 0 para todo 1 ≤ i, j ≤ n con (i, j) 6= (1, k). Notar que

(a, 0, . . . , 0)Ek = (0, . . . , 0, a, 0, . . . , 0),

donde a aparece en la k-ésima posición y 0 en el resto de las posiciones.


Entonces

h(a1, . . . , an) = h((a1, 0, 0, . . . , 0) + (0, a2, 0, . . . , 0) + · · · + (0, 0, 0, . . . , an))


= h(a1, 0, 0, . . . , 0) + h(0, a2, 0, . . . , 0) + · · · + h(0, 0, 0, . . . , an)
= h(a1, 0, 0, . . . , 0) + h((a2, 0, 0, . . . , 0)E2) + · · · +
+ h((an, 0, 0, . . . , 0)En)
= h(a1, 0, 0, . . . , 0) + h(a2, 0, 0, . . . , 0)E2 + · · · +
+ h(an, 0, 0, . . . , 0)En
= (f (a1), 0, 0, . . . , 0) + (f (a2), 0, 0, . . . , 0)E2 + · · · +
+ (f (an), 0, 0, . . . , 0)En,

Con lo cual

h(a1, a2, . . . , an) = (f (a1), 0, 0, . . . , 0) + (0, f (a2), 0, . . . , 0) + · · · +


+ (0, 0, 0, . . . , f (an))
= (f (a1), f (a2), . . . , f (an))
= f n(a1, a2, . . . , an) = F (f )(a1, a2, . . . , an).

para todo (a1, a2, . . . , an) ∈ M (n). Esto nos dice que F (f ) = h y, por lo
tanto, F es total.

26
Finalmente, sea M̃ un Mn(R)-módulo a derecha. Tenemos que mostrar
que existe un R-módulo M a derecha tal que M̃ y F M = M (n) son Mn(R)-
módulos isomorfos. Vamos a utilizar las matrices diagonales D(r) de n × n
con componentes r ∈ R en la diagonal principal y ceros fuera de la diagonal
principal, es decir

r 0 0
0 r 0
D(r) =

0 0 r

Es sencillo verificar (hacerlo!) que la función φ : R → Mn(R) definida


como
φ(r) = D(r),

es un homomorfismo de R-módulos a derecha, es decir, φ(r+st) = φ(r)+φ(s)t


para todo r, s, t ∈ R.
Sea M̃ un Mn(R)-módulo a derecha. Veamos que podemos considerar a M̃
también como un R-módulo a derecha: definimos una acción lineal a derecha
de R sobre Mn(R) de la siguiente manera

xr = xD(r),

para todo x ∈ M̃ y todo r ∈ (comprobarlo!). Sea

M = M̃ E = {xE : x ∈ M̃ }.

Como E ∈ Mn(R), vemos que M ⊂ M̃ . Mucha más es cierto: considerando


27
a M̃ como un R-módulo a derecha, el conjunto M es un submódulo de M̃ ,
pues si r ∈ R y x, y ∈ M̃ entonces

xE + (yE)r = xE + (yE)D(r)
= xE + y(ED(r))
= xE + y(D(r)E)
= xE + (yD(r))E
= (x + yD(r))E = zE ∈ M

pues z = x + yD(r) ∈ M̃ . Demostraremos que M (n) = F M y M̃ son


isomorfos como Mn(R)-módulos a derecha.
Como Ek1 = Ek1E para cada 1 ≤ k ≤ n tenemos que si x ∈ M̃ entonces

xEk1 = x(Ek1E) = (xEk1)E = yE ∈ M,

donde y = xEk1 ∈ M̃ . Tenemos ası́ definida una función

ηM̃ : M̃ → F M = M (n),

como ηM̃ (x) = (xE11, xE21, . . . , xEn1). Tenemos que ηM̃ es un homomor-
fismo de Mn(R)-módulos a derecha pues si x, y ∈ M̃ entonces

ηM̃ (x + y) = ((x + y)E11, . . . , (x + y)En1)


= (xE11, . . . , xEn1) + (yE11, . . . , yEn1) = ηM̃ (x) + ηM̃ (y),

28
y si A = (rij ) ∈ Mn(R)

ηM̃ (xA) = ((xA)E11, . . . , (xA)En1) = (x(AE11), . . . , x(AEn1)).

Es sencillo verificar que


 

 r1k 0 · · · 0 0 

 
 
r2k 0 ··· 0 0
 
 
AEk1 =
 
 


 ... ... ... ... 


 
 
 
rnk 0 · · · 0 0
 

para todo 1 ≤ k ≤ n. Por otro lado

(xE11, xE21, . . . , xEn1)A = (b1, . . . , bn),

Pn
donde bk = i=1 (xEi1 )rik para cada 1 ≤ k ≤ n. Pero
n
bk = (xEi1)rik
X

i=1
n
= (xEi1)D(rik )
X

i=1
n
= x(Ei1D(rik ))
X

i=1
n
=x (Ei1D(rik ))
X

i=1

y
Ei1D(rik ) = (cst)n×n,

con ci1 = rik y cst = 0 para todo (s, t) 6= (i, k), y ası́
n
(Ei1D(rik )) = AEk1,
X

i=1

29
para todo 1 ≤ k ≤ n. Por lo tanto cada bk = x(AEk1), lo que demuestra que

ηM̃ (xA) = (x(AE11), . . . , x(AEn1)) = (xE11, xE21, . . . , xEn1)A = ηM̃ (x)A,

para todo x ∈ M̃ .
Finalmente veamos que ηM̃ es biyectiva: si

ηM̃ (x) = 0,

entonces xEi1 = 0 para 1 ≤ i ≤ n. Por otro lado tenemos que si IR es la


matriz identidad de Mn(R) entonces xIR = x y, además
n
IR = Eii.
X

i=1

Entonces
n n
x = xIR = x Eii = xEii.
X X

i=1 i=1

Por otra parte, Eii = Ei1E1i para 1 ≤ i ≤ n, con lo cual


n n n
x= xEii = x(Ei1E1i) = (xEi1)E1i = 0,
X X X

i=1 i=1 i=1

y ası́ tenemos que Ker ηM̃ = {0}, lo que nos dice que ηM̃ es inyectiva.
Sea (x1E, x2E, . . . , xnE) ∈ M (n). Como E = E11 = E1iEi1 para cada
1 ≤ i ≤ n (comprobarlo!) entonces

(x1E, x2E, . . . , xnE) = ((x1E11)E11, (x2E12)E21, . . . , (xnE1n)En1)


= (y1E11, y2E21, . . . , ynEn1),

donde yi = xiE1i ∈ M para i = 1, . . . , n. Es sencillo comprobar (hacerlo!)

30
que
E1j Ei1 = 0 si i 6= j.

Luego para i = 1, . . . , n,
n n
yiEi1 = (xiE1i)Ei1 = xi(E1iEi1) + xj (E1j Ei1) = xj (E1j Ei1),
X X

j=1 j=1
j6=i

con lo cual
n n n
yiEi1 = (xj E1j )Ei1 = ( xj E1j )Ei1 = ( yj )Ei1,
X X X

j=1 j=1 j=1

para i = 1, . . . , n.
Por lo tanto

(y1E11, y2E21, . . . , ynEn1) = (y1E11, y1E21, . . . , y1En1)


+ (y2E11, y2E21, . . . , y2En1)
...

+ (ynE11, ynE21, . . . , ynEn1)

y ası́ tenemos que

(x1E, x2E, . . . , xnE) = (y1E11, y2E21, . . . , ynEn1)


= ηM̃ (y1) + ηM̃ (y2) + · · · + ηM̃ (yn)
= ηM̃ (y1 + y2 + · · · + yn),

31
y esto nos dice que ηM̃ es sobreyectiva. Luego

ηM̃ : M̃ → F M = M (n),

es un isomorfismo de Mn(R)-módulos con lo cual M̃ ' F M como Mn(R)-


módulos. Por Teorema 6, las categorı́as Mod-R de los R-módulos a derecha
y Mod-Mn(R) de los Mn(R)-módulos a derecha son equivalentes.

View publication stats 32

También podría gustarte