Está en la página 1de 738

Matemáticas

Otros títulos Colección


textos Cuadernos José Oswaldo Lezama Serrano
Es licenciado en Matemáticas de la Universidad

de álgebra
Cuadernos de álgebra. Volumen 2 Industrial de Santander y doctorado en
Ipsumquam, core qui
José Oswaldo Lezama Serrano Matemáticas de la Universidad Estatal de San
blamene doluptas La obra Cuadernos de álgebra, dividida
Ecuaciones diferenciales ordinaria.
Armando Casas Petersburgo. En 2017 obtuvo el Premio Nacional de
en dos volúmenes, consta de diez Matemáticas, otorgado por la Sociedad Colombiana
Técnicas de resolución publicaciones sobre los principales
Et elitatenissi de Matemáticas. También, obtuvo reconocimiento
Edixon Rojas y Luz Marina Moya temas de esta rama de las matemáticas.
cuptaquates aliquunt pra como Egresado distinguido de la Universidad
Los cinco cuadernos del presente

Volumen 1
Cálculo integral en una variable
Armando Casas Industrial de Santander y de Excelencia académica,
Jeanneth Galeano Peñaloza y Claudio Rodríguez Beltrán volumen cubren el material fundamental Investigación meritoria y Medalla al mérito,
de las estructuras algebraicas básicas: concedidas por la Universidad Nacional de
Curso libre juvenil de matemáticas.Duntiaectur sene
Tercera edición
grupos, anillos, módulos, espacios Colombia. Fue profesor Titular del Departamento
Myriam Margarita Acevedo, evelibusto ent, sequatesti
Myriam Leonor Campos,
vectoriales y cuerpos. Los cinco de Matemáticas de la Universidad Nacional de
omnite la sit asimporia
Luis Rafael Jiménez y Blanca Aurora León
cuadernos del segundo volumen Colombia durante 35 años. Ha sido autor de libros y
Armando Casas

Cuadernos de álgebra. Volumen 1


contienen temas más especializados
José Oswaldo

José Oswaldo Lezama Serrano


artículos en áreas como grupos de matrices, anillos
como la teoría avanzada de anillos y módulos, álgebra lineal sobre anillos, álgebra
y módulos, categorías, álgebra
homológica, álgebra no conmutativa y Lezama Serrano homológica, álgebra conmutativa y no conmutativa,
geometría algebraica, teoría de categorías, teoría
geometría algebraica. algebraica del control, álgebra constructiva y
computacional. Actualmente es el director del
Los cuadernos del primer volumen
Seminario de Álgebra Constructiva (SAC2).
pueden servir como textos guía o de
apoyo para cursos básicos del área de
álgebra de las carreras de matemáticas
y de las licenciaturas que se ofrecen en
el país. Posiblemente el principal valor
de los cuadernos sea su presentación
ordenada y didáctica, así como la
inclusión de muchas pruebas omitidas
en la literatura y amplias listas de
ejemplos que ilustran la teoría.

Facultad de Ciencias
Sede Bogotá
Cuadernos de
álgebra
Cuadernos de
álgebra
José Oswaldo Lezama Serrano

Bogotá, D. C., Colombia, diciembre de 2020


© Universidad Nacional de Colombia
Facultad de Ciencias
© José Oswaldo Lezama Serrano

Primera edición, diciembre de 2020

ISBN 978-958-794-412-9 (papel)


ISBN 978-958-794-415-0 (digital)

Edición
Angélica María Olaya Murillo
Coordinación de publicaciones - Facultad de Ciencias
coorpub_fcbog@unal.edu.co

Corrección de estilo:
Juliana Monroy

Diseño de la colección
Leonardo Fernández Suárez

Maqueta LATEX
Camilo Cubides

Prohibida la reproducción total o parcial por cualquier medio


sin la autorización escrita del titular de los derechos patrimo-
niales

Hecho en Bogotá, D. C., Colombia


Contenido

Prefacio ix

I Grupos 1
Presentación i

Capítulo uno
Grupos y subgrupos 1
1. Operaciones binarias y estructuras algebraicas elementales . . . . 3
2. Grupos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 7
3. Subgrupos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 11
4. Generación de subgrupos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 14
5. Teorema de Lagrange . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 18
6. Ejercicios . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 20

Capítulo dos
Grupos cíclicos 27
1. Definición . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 29
2. Orden y periodo de un elemento . . . . . . . . . . . . . . . . . . . . . . . . . 31
3. Ejemplos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 33
4. Propiedades . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 34
5. Generadores . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 36
6. Ejercicios . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 37

Capítulo tres
Subgrupos normales y homomorfismos 41
1. Subgrupos normales . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 43
2. Grupo cociente . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 44
3. Homomorfismos de grupos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 46
4. Ejercicios . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 49
ii · Contenido

Capítulo cuatro
Teoremas de estructura 51
1. Teorema fundamental de homomorfismo . . . . . . . . . . . . . . . . . . 53
2. Teorema de factorización . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 55
3. Teorema de correspondencia . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 57
4. Teoremas de isomorfismo . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 59
5. Ejercicios . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 65

Capítulo cinco
Automorfismos 67
1. Automorfismos interiores . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 69
2. Teorema de Cayley . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 70
3. Ejemplos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 71
4. Ejercicios . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 78

Capítulo seis
Grupos de permutaciones 79
1. Ciclos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 81
2. El grupo alternante An . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 85
3. Sistemas de generadores . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 88
4. El grupo diédrico Dn , n ≥ 3 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 91
5. Subgrupos normales del grupo Dn , n ≥ 3 . . . . . . . . . . . . . . . . . . . 94
6. Ejercicios . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 95

Capítulo siete
Productos y sumas directas 97
1. Definición . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 99
2. Producto cartesiano: caso infinito . . . . . . . . . . . . . . . . . . . . . . . . . 101
3. Suma directa externa . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 102
4. Suma directa interna . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 104
5. Ejercicios . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 111

Capítulo ocho
G-conjuntos 113
1. Acción de grupos sobre conjuntos . . . . . . . . . . . . . . . . . . . . . . . . . 115
2. Órbitas y subgrupos estacionarios . . . . . . . . . . . . . . . . . . . . . . . . . 117
3. Grupos transitivos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 121
4. Ejercicios . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 124
Contenido · iii

Capítulo nueve
Teoremas de Sylow 125
1. p-grupos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 127
2. Preliminares . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 130
3. Teoremas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 133
4. Aplicaciones . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 137
5. Ejercicios . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 142

Capítulo diez
Grupos abelianos finitos 143
1. p-grupos abelianos finitos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 145
2. Sistemas de invariantes . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 149
3. Grupos abelianos finitos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 150
4. Grupos de orden ≤ 15 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 153
5. Ejercicios . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 153

Capítulo once
Grupos solubles 155
1. Centro de un grupo . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 157
2. Conmutante de un grupo . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 158
3. Cadenas normales . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 164
4. Grupos solubles . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 170
5. Ejercicios . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 171

II Anillos 1
Presentación i

Capítulo uno
Anillos y subanillos 1
1. Definición y ejemplos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3
2. Subanillos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 10
3. Ejercicios . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 13

Capítulo dos
Ideales 15
1. Definición y ejemplos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 17
2. Operaciones con ideales . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 20
3. Ejercicios . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 27
iv · Contenido

Capítulo tres
Anillo cociente y homomorfismos 31
1. Definiciones y ejemplos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 33
2. Teoremas de homomorfismo e isomorfismo . . . . . . . . . . . . . . . . 39
3. Ejercicios . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 44

Capítulo cuatro
Producto de anillos 47
1. Definición y propiedades elementales . . . . . . . . . . . . . . . . . . . . . . 49
2. Teorema chino de residuos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 51
3. Ejercicios . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 53

Capítulo cinco
Ideales primos y maximales 55
1. Definiciones y ejemplos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 57
2. Comportamiento a través de homomorfismos . . . . . . . . . . . . . . . 60
3. Ejercicios . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 64

Capítulo seis
Dominios de integridad 67
1. Definiciones y ejemplos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 69
2. Dominios gaussianos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 71
3. Ejercicios . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 77

Capítulo siete
Anillos de fracciones: caso conmutativo 79
1. Construcción y propiedades . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 81
2. Ejemplos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 85
3. Ejercicios . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 89

Capítulo ocho
Polinomios y series 91
1. El anillo de series . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 93
2. El anillo de polinomios . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 95
3. Propiedades elementales . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 97
4. Teorema de Gauss . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 102
5. Ejercicios . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 108
Contenido · v

III Módulos 1
Presentación i

Capítulo uno
Módulos, submódulos y cocientes 1
1. Definición y ejemplos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3
2. Submódulos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 8
3. Módulo cociente . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 10
4. Ejercicios . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 12

Capítulo dos
Módulos finitamente generados 15
1. Operaciones con submódulos . . . . . . . . . . . . . . . . . . . . . . . . . . . . 17
2. Submódulos maximales . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 19
3. Ejemplos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 21
4. Ejercicios . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 23

Capítulo tres
Homomorfismos 25
1. Definición y propiedades básicas . . . . . . . . . . . . . . . . . . . . . . . . . . 27
2. Teoremas de homomorfismo e isomorfismo . . . . . . . . . . . . . . . . 29
3. Ejemplos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 31
4. Ejercicios . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 32

Capítulo cuatro
Hom 35
1. El grupo HomA (M , N ) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 37
2. Ejemplos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 39
3. Bimódulos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 43
4. Ejercicios . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 44

Capítulo cinco
Producto y suma directa 47
1. Producto . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 49
2. Suma directa externa . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 50
3. Propiedades . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 51
4. Ejercicios . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 58
vi · Contenido

Capítulo seis
Suma directa interna 61
1. Definición y caracterizaciones . . . . . . . . . . . . . . . . . . . . . . . . . . . . 63
2. Sumando directo . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 65
3. Ejercicios . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 69

Capítulo siete
Módulos libres 71
1. Definición y caracterizaciones . . . . . . . . . . . . . . . . . . . . . . . . . . . . 73
2. Cardinalidad de las bases . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 75
3. Módulos libres y homomorfismos . . . . . . . . . . . . . . . . . . . . . . . . . 78
4. Ejercicios . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 83

Capítulo ocho
Módulos finitamente generados sobre DIPs 85
1. Módulos de torsión . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 87
2. Módulos sin torsión . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 89
3. Rango . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 91
4. Componentes primarias . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 92
5. Divisores elementales y factores invariantes . . . . . . . . . . . . . . . . . 95
6. Grupos abelianos finitamente generados . . . . . . . . . . . . . . . . . . . . 103
7. Ejercicios . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 107

IV Álgebra lineal 1
Presentación i

Capítulo uno
Matrices 1
1. Estructuras algebraicas básicas . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3
2. Matrices sobre anillos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 10
3. Inversa de una matriz y cambio de base . . . . . . . . . . . . . . . . . . . . 16
4. Matrices y operaciones elementales . . . . . . . . . . . . . . . . . . . . . . . . 21
5. Ejercicios . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 22

Capítulo dos
Determinantes y sistemas de ecuaciones lineales 27
1. Determinantes . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 29
2. Determinantes y funciones multilineales . . . . . . . . . . . . . . . . . . . 35
Contenido · vii

3. Menores y cofactores . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 37
4. Ideales, rango y sistemas de ecuaciones . . . . . . . . . . . . . . . . . . . . . 44
5. Ejercicios . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 59

Capítulo tres
Producto tensorial 61
1. Producto tensorial de espacios vectoriales . . . . . . . . . . . . . . . . . . 63
2. Producto tensorial de transformaciones y matrices . . . . . . . . . . . 68
3. Funciones multilineales y tensores . . . . . . . . . . . . . . . . . . . . . . . . 71
4. Tensores simétricos, antisimétricos y alternados . . . . . . . . . . . . . 78
5. Álgebras y producto tensorial . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 83
6. Ejercicios . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 95

Capítulo cuatro
Formas canónicas 97
1. Polinomios mínimo y característico . . . . . . . . . . . . . . . . . . . . . . . 99
2. Forma canónica clásica . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 108
3. Forma canónica racional . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 112
4. Forma canónica de Jordan . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 116
5. Forma canónica diagonal: valores y vectores propios . . . . . . . . . 121
6. Ejercicios . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 130

Capítulo cinco
Grupos de matrices 135
1. Grupos de matrices sobre cuerpos . . . . . . . . . . . . . . . . . . . . . . . . . 137
2. Grupos de matrices sobre anillos . . . . . . . . . . . . . . . . . . . . . . . . . . 156
3. El grupo elemental sobre anillos conmutativos . . . . . . . . . . . . . . 159
4. Grupos clásicos sobre anillos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 168
5. Ejercicios . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 175

V Cuerpos 1
Presentación i

Capítulo uno
Polinomios 1
1. Generalidades . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3
2. Polinomios sobre cuerpos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 7
3. Algoritmos de la división y Euclides en 𝕂 [x] . . . . . . . . . . . . . . . . 10
viii · Contenido

4. Teorema de Gauss . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 23
5. Ejemplos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 31
6. Polinomios en varias variables . . . . . . . . . . . . . . . . . . . . . . . . . . . . 32
7. Polinomios simétricos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 40
8. Ejercicios . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 46

Capítulo dos
Extensiones de cuerpos 49
1. Extensiones simples . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 51
2. Extensiones algebraicas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 62
3. El cuerpo de los números algebraicos . . . . . . . . . . . . . . . . . . . . . . 64
4. Cuerpo de descomposición de un polinomio . . . . . . . . . . . . . . . . 67
5. Clausura algebraica de un cuerpo . . . . . . . . . . . . . . . . . . . . . . . . . 75
6. Dependencia e independencia algebraica . . . . . . . . . . . . . . . . . . . 79
7. Ejercicios . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 87

Capítulo tres
Fundamentos de la teoría de Galois 91
1. Extensiones normales . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 93
2. Raíces de la unidad . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 96
3. Cuerpos finitos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 99
4. Extensiones separables y cuerpos perfectos . . . . . . . . . . . . . . . . . 102
5. Teorema del elemento primitivo . . . . . . . . . . . . . . . . . . . . . . . . . . 105
6. Ejercicios . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 108

Capítulo cuatro
Teoría de Galois 109
1. El grupo de Galois . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 111
2. Teorema fundamental de la teoría de Galois . . . . . . . . . . . . . . . . 115
3. Ejemplos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 118
4. Ejercicios . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 121

Capítulo cinco
Solubilidad por radicales 123
1. Polinomios solubles por radicales . . . . . . . . . . . . . . . . . . . . . . . . . 125
2. Teorema de Abel . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 127
3. Ejercicios . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 130

Bibliografía 131
Prefacio

La colección Cuadernos de álgebra, dividida en dos volúmenes, consta de 10


publicaciones sobre los principales temas de esta rama de las matemáticas
y pretende servir de material para preparar los exámenes de admisión y de
candidatura de los programas colombianos de doctorado en matemáticas.
Los cinco cuadernos del presente volumen cubren el material básico de los
cursos de estructuras algebraicas y álgebra lineal de los programas de maes-
tría. Los cinco cuadernos del segundo volumen contienen los principales
temas de los exámenes de candidatura, a saber, anillos y módulos, catego-
rías, álgebra homológica, álgebra no conmutativa y geometría algebraica.
Cada cuaderno es fruto de las clases dictadas por el autor en la Universidad
Nacional de Colombia en los últimos 25 años y están basados en las fuen-
tes bibliográficas consignadas en cada uno de ellos, así como también en el
libro Anillos, Módulos y Categorías, publicado por la Facultad de Ciencias de
la Universidad Nacional de Colombia, cuya edición está totalmente agota-
da (véase [31]). Los cuadernos también pueden servir como textos guía o
de apoyo para cursos básicos y avanzados del área de álgebra. Un material
similar, pero mucho más completo que el presentado en estas diez publi-
caciones, es el excelente libro Algebra, de Serge Lang, cuya tercera edición
revisada ha sido publicada por Springer en el 2002 (véase [20]). Posible-
mente el valor de los Cuadernos de álgebra sea su presentación ordenada y
didáctica, así como la inclusión de muchas pruebas omitidas en la literatura
y suficientes ejemplos que ilustran la teoría. Los cuadernos son:
1. Grupos 6. Anillos y módulos
2. Anillos 7. Categorías
3. Módulos 8. Álgebra homológica
4. Álgebra lineal 9. Álgebra no conmutativa
5. Cuerpos 10. Geometría algebraica
Los cuadernos están divididos en capítulos, los cuales a su vez se dividen
en secciones. En cada capítulo se añade al final una lista de ejercicios que
debería ser complementada por los lectores con las amplias listas de proble-
mas que incluyen las principales monografías relacionadas con el respectivo
tema.
x · Prefacio

El autor desea expresar su agradecimiento a Sandra Patricia Barragán


Moreno, a Claudia Milena Gallego Joya y a Milton Armando Reyes Villa-
mil, discípulos, colegas y amigos, por la digitalización de los materiales y la
revisión cuidadosa de los contenidos de la presente colección de cuadernos.
También a Arnold Oostra por la revisión juiciosa y sus aportes en el cua-
derno de álgebra lineal. Finalmente, el autor expresa su agradecimiento a
Haliaphne Annh Acosta Aguilar por las correcciones realizadas a los cua-
dernos del primer volumen, y a Fabio Alejandro Calderón Mateus por las
correcciones finales y la edición de toda la colección de cuadernos.

José Oswaldo Lezama Serrano


Departamento de Matemáticas
Universidad Nacional de Colombia
Bogotá, Colombia
jolezamas@unal.edu.co
Cuaderno I

Grupos
Dedicado a Justo Pastor, mi padre
Presentación

La teoría de grupos, como todas las ramas del álgebra contemporánea, estu-
dia ciertos objetos matemáticos llamados grupos, así como las relaciones en-
tre estos objetos, llamadas homomorfismos. Podríamos justificar el estudio
de la teoría de los grupos diciendo que los conjuntos son para la matemática
como los grupos son para el álgebra.
En el primer capítulo daremos la definición axiomática de la estructura
abstracta de grupo y veremos algunos conjuntos estructurados como gru-
pos. Se estudiará la noción de subgrupo y se demostrará un teorema de
gran importancia dentro de la teoría de grupos finitos, como es el teorema
de Lagrange. Quizá los grupos abelianos más importantes son los llama-
dos grupos cíclicos, ya que los grupos abelianos finitamente generados son
expresables a través de sumas directas de grupos cíclicos. En el segundo ca-
pítulo mostraremos las propiedades básicas de los grupos cíclicos.
El objetivo central del tercer capítulo será mostrar la estrecha relación
que guardan los conceptos de subgrupo normal y homomorfismo de grupos.
Se establecerá que, salvo isomorfismo, hay tantos subgrupos normales en un
grupo G como imágenes homomorfas tiene este último.
Los conceptos de homomorfismo e isomorfismo, así como los teoremas
correspondientes, serán el objeto del cuarto capítulo. Por medio de estos
teoremas es posible caracterizar las imágenes homomorfas de un grupo, y
además son herramienta clave para la clasificación de grupos, en particular,
para la de los grupos finitos. Los homomorfismos biyectivos de un grupo
G en sí mismo se conocen como los automorfismos de G. Estas funciones
conforman un grupo que tiene información importante relativa sobre grupo
el G y serán estudiadas en el quinto capítulo.
En el sexto capítulo estudiaremos con algún detalle al grupo simétrico
Sn . Destacaremos en Sn el subgrupo alternante An y describiremos el grupo
diédrico de grado n, Dn , por medio de permutaciones. El objetivo del sép-
timo capítulo será presentar la construcción del grupo producto cartesiano
y la suma directa externa para una familia dada de grupos. Como funda-
mento teórico para la demostración de los teoremas de Sylow, en el octavo
ii · Presentación

capítulo serán tratadas las acciones de grupos sobre conjuntos. Para los gru-
pos cíclicos finitos es válido el recíproco del teorema de Lagrange (véase el
segundo capítulo), es decir, si G un grupo cíclico finito de orden n y m di-
vide a n entonces G contiene exactamente un subgrupo de orden m. En el
noveno capítulo se mostrará que la afirmación anterior es válida cuando m
es potencia de un primo. Este resultado es uno de los famosos teoremas de
Sylow.
El objetivo del décimo capítulo será describir, para un entero positivo n
dado, todos los grupos abelianos de orden n (salvo isomorfismo). Se incluirá
también en este capítulo una tabla con la lista de todos los grupos de orden
≤ 15. Por último, una de las más importantes generalizaciones de la noción
de conmutatividad es la solubilidad, de la cual nos ocuparemos en el último
capítulo.
El material presentado está complementado con una gran variedad de
ejemplos que ilustran las definiciones y propiedades estudiadas a lo largo del
texto. Estos ejemplos constituyen parte muy importante de la teoría básica
de grupos introducida en el presente cuaderno.
Otras fuentes fuertemente recomendadas a los lectores para comple-
mentar los temas aquí tratados son [10], [14], [16], [20] y [36].
Capítulo
uno
Grupos y
subgrupos
Grupos y subgrupos · 3

La teoría de grupos estudia ciertos objetos matemáticos llamados grupos,


así como las relaciones entre ellos, los homomorfismos. Se podría justificar
el estudio de la teoría de los grupos diciendo que los conjuntos son para la
matemática como los grupos son para el álgebra. En este capítulo presenta-
mos la definición axiomática de la estructura abstracta de grupo y veremos
algunos ejemplos notables. Se estudiará la noción de subgrupo y se demos-
trará un teorema de gran importancia dentro de la teoría de grupos finitos,
como es el teorema de Lagrange sobre clases laterales.

1. Operaciones binarias y estructuras


algebraicas elementales
En esta sección definimos el concepto de operación binaria entre elementos
de un conjunto, noción que hemos utilizado en las matemáticas elementales.
Se dará además una definición precisa de las propiedades más comunes de
las que gozan estas operaciones. Esto permitirá introducir posteriormente
la estructura de grupo.
Definición 1.1.1. Sea G un conjunto no vacío. Una operación binaria
interna (también denominada ley de composición) en G es una función
∗ : G × G −→ G del producto cartesiano de G con G en G.
Así, a cada par ordenado (x, y) de elementos de G se le asigna un único
elemento de G. La imagen del par (x, y) mediante la función ∗ se denota
por x ∗ y. Se dice también que x ∗ y es el resultado de operar x con y (en ese
orden).
Ejemplo 1.1.2. La adición de números naturales es una ley de composi-
ción:

+ : ℕ × ℕ −→ ℕ
(a, b) ↦−→ a + b.

Lo mismo se tiene para el producto.


Ejemplo 1.1.3. En ℕ podemos definir una función △ por

△ : ℕ × ℕ −→ ℕ
(a, b) ↦−→ mı́n(a, b).

△ es una operación binaria interna en ℕ. Por ejemplo, 3△4=3, 5△2=2, y


3△3=3.
4 · Grupos y subgrupos

Ejemplo 1.1.4. Sea X un conjunto no vacío y sea P (X) el conjunto de


todos los subconjuntos de X, denominado el conjunto de partes de X. La
intersección de conjuntos define una operación binaria interna en P (X):
∩ : P (X) × P (X) −→ P (X)
(A, B) ↦−→ A ∩ B.
Ejemplo 1.1.5. En el conjunto de los números naturales ℕ definimos la
función:
∗ : ℕ × ℕ −→ ℕ
a ∗ b ↦−→ (a △ b) + 2,
donde la operación △ es como en el ejemplo 1.1.3. Así,
5 ∗ 3 = (5 △ 3) + 2 = 3 + 2 = 5,
4 ∗ 4 = (4 △ 4) + 2 = 4 + 2 = 6.
Ejemplo 1.1.6. La función ∇ : ℤ × ℤ −→ ℤ, definida por a∇b = (ab) ÷ 2,
no define en ℤ una operación binaria interna.
Dado un conjunto G con una operación binaria interna ∗ y dados 3 ele-
mentos a, b y c del conjunto G, podemos preguntarnos las maneras de ope-
rar estos tres elementos en ese orden e investigar si los resultados de estas
formas de operar coinciden. Así, en el ejemplo 1.1.2 sean 2, 5, 7 ∈ ℕ, en-
tonces
2 + 5 = 7, 7 + 7 = 14, 5 + 7 = 12, 2 + 12 = 14.
Es decir, (2+5) +7 = 2+ (5+7), donde los paréntesis indican la secuencia en
que se han efectuado las operaciones. Es bien conocido que para la adición
de números naturales esta propiedad es válida, es decir, cualesquiera que
sean a, b, c ∈ ℕ, se cumple (a + b) + c = a + (b + c). Nótese sin embargo que
en el ejemplo 1.1.5 sobre ℕ se definió la operación ∗ la cual no cumple esta
propiedad:
(3 ∗ 5) ∗ 7 = 5 ∗ 7 = 7 y 3 ∗ (5 ∗ 7) = 3 ∗ 7 = 5.
Esto permite clasificar las operaciones binarias de acuerdo con esta condi-
ción.
Definición 1.1.7. Sea ∗ una operación binaria definida sobre un conjunto
G. Se dice que la operación ∗ tiene la propiedad asociativa, o que ∗ es una
operación asociativa, si para cualesquiera elementos a, b, c ∈ G se cumple
la igualdad:
a ∗ (b ∗ c) = (a ∗ b) ∗ c.
Grupos y subgrupos · 5

De esta definición surge de inmediato una pregunta: en el caso que sean


dados 4, 5, ó n elementos (en un orden determinado), ¿la secuencia en que
se efectuen las operaciones influye en el resultado? Se puede probar por in-
ducción sobre n que si la operación es asociativa, es decir, si para el caso
de 3 elementos se tiene la propiedad exigida, entonces la misma propie-
dad tendrá lugar para cualesquiera n elementos dados. Así pues, si se dan n
elementos a1 , . . . , an del conjunto G y suponiendo que la operación ∗ de
G es asociativa, los paréntesis que indican la secuencia de como se realizan
las operaciones en la expresión a1 ∗ · · · ∗ an pueden ser colocados donde se
quiera y el resultado no varía.

Proposición 1.1.8. Sea G un conjunto donde se ha definido una operación binaria


asociativa ∗. Para a ∈ G, sea

a 1 := a, a n := a n−1 ∗ a, n ≥ 2.

Entonces, para cualesquiera naturales m y n se tienen las identidades:

a n ∗ am = a n+m , (a n ) m = a nm .

Demostración. La prueba se realiza por inducción y se deja como ejercicio al


lector. □✓

Definición 1.1.9. Un semigrupo es un conjunto G dotado de una opera-


ción binaria interna asociativa ∗ y se denota por (G , ∗). Se dice también que
sobre G se tiene una estructura de semigrupo.

Ejemplo 1.1.10. (ℕ, +) es un semigrupo (véase el ejemplo 1.1.2).

Ejemplo 1.1.11. Sea X un conjunto no vacío cualquiera y sea Aplc(X) el


conjunto de aplicaciones (funciones) de X en sí mismo. Por teoría elemental
de conjuntos sabemos que la operación composición de funciones ◦ es una
operación binaria interna en Aplc(X) que es asociativa. Así, (Aplc(X), ◦)
es un semigrupo.

El ejemplo anterior ilustra que no toda operación binaria ∗ definida sobre


un conjunto G satisface a ∗ b = b ∗ a para todos los elementos a y b de G.

Definición 1.1.12. Sea ∗ una operación binaria definida sobre un conjunto


G. Se dice que la operación ∗ es conmutativa si para cualesquiera elementos
a y b de G se tiene que:
a ∗ b = b ∗ a.

Mediante inducción es fácil probar la siguiente propiedad.


6 · Grupos y subgrupos

Proposición 1.1.13. Sea (G , ∗) un semigrupo conmutativo, es decir, la operación


∗ es asociativa y conmutativa. Entonces, para cualesquiera a, b ∈ G y cualquier
natural n se tiene que:
(a ∗ b) n = a n ∗ b n .

Demostración. Ejercicio para el lector. ✓


Existen conjuntos con operaciones binarias internas donde se destacan


elementos especiales.

Definición 1.1.14. Sea G un conjunto en el cual se ha definido una ope-


ración binaria ∗. Se dice que el elemento e de G es una identidad de G con
respecto a la operación ∗ si para cualquier elemento a de G se tiene que:

e ∗ a = a = a ∗ e.

Ejemplo 1.1.15. En el semigrupo (ℤ, +), donde ℤ es el conjunto de nú-


meros enteros y + es la adición habitual, 0 es una identidad.

Surge la siguiente pregunta: ¿en un conjunto G con una operación binaria


∗ pueden existir varias identidades?

Proposición 1.1.16. En un conjunto G con una operación binaria ∗ sólo puede


existir un elemento identidad respecto a ∗.

Demostración. Sean e, e ′ dos identidades, entonces e ∗ e ′ = e = e ′. ✓


Nótese que para diferentes operaciones, las identidades no necesaria-


mente coinciden, del mismo modo cada operación debe tener un elemento
identidad. Por ejemplo, 0 es la identidad del semigrupo (ℤ, +), 1 es la iden-
tidad de (ℤ, ·) y (ℕ, +) no tiene identidad.

Definición 1.1.17. Un monoide es un semigrupo que posee elemento iden-


tidad.

Definición 1.1.18. Sea G un conjunto dotado de una operación binaria


interna ∗ la cual posee un elemento identidad e. Se dice que u ∈ G es inver-
tible si existe u ′ ∈ G tal que u ′ ∗ u = e = u ∗ u ′. El elemento u ′ se denomina
inverso de u respecto a la operación ∗.

En la definición anterior no se exige que cada elemento de G sea inver-


tible. Sin embargo, de esta definición se desprende lo siguiente.

Proposición 1.1.19. Sea (G , ∗) un monoide.

(i) Si u ∈ G es invertible, entonces su inverso u ′ es único.


Grupos y subgrupos · 7

(ii) Sean x ′ , u ′ los inversos de x y u respectivamente. Entonces, x∗u es invertible,


y además,
(x ∗ u) ′ = u ′ ∗ x ′ , (x ′) ′ = x.

Demostración. Nótese que (u ′ ∗ x ′) ∗ (x ∗ u) = 1 = (x ∗ u) ∗ (u ′ ∗ x ′). De igual


manera, puesto que x ′ ∗ x = 1 = x ∗ x ′, entonces (x ′) ′ = x. ✓

2. Grupos
En la sección anterior fueron estudiadas algunas propiedades para una ope-
ración binaria definida en un conjunto. Se dijo que cuando la operación
binaria ∗ definida sobre el conjunto G es asociativa se obtiene sobre G una
estructura de semigrupo. Al poseer la operación ∗ más propiedades, la es-
tructura se hace más rica y las posibilidades de operar en G se hacen ma-
yores. Un ejemplo de tal situación lo constituyen los llamados grupos, los
cuales pasamos a definir.

Definición 1.2.1. Sea G un conjunto no vacío y ∗ una operación binaria


definida en G. Se dice que G es un grupo respecto de ∗, o también que ∗ da
a G una estructura de grupo, si ∗ cumple las siguientes propiedades:

(i) ∗ es asociativa.

(ii) En G existe un elemento identidad e respecto a ∗.

(iii) Cada elemento de G es invertible.

Denotaremos un grupo por (G , ∗), o también por (G , ∗, e) para destacar


la identidad, pero cuando no haya ambigüedad escribiremos simplemente
G.

Definición 1.2.2. Un grupo (G , ∗) es conmutativo, también denominado


abeliano, si la operación ∗ es conmutativa.

Ejemplo 1.2.3. Los siguientes conjuntos numéricos, donde las operaciones


indicadas son las habituales, constituyen grupos conmutativos:

(ℤ, +, 0), (ℚ, +, 0), (ℝ, +, 0), (ℂ, +, 0).

ℤ, ℚ, ℝ y ℂ denotan los conjuntos de números enteros, racionales, reales y


complejos, respectivamente.

Ejemplo 1.2.4. Los siguientes ejemplos no conforman grupos:


8 · Grupos y subgrupos

(ℤ, ·, 1): sólo hay dos elementos invertibles, 1 y −1,


(ℚ, ·, 1): el cero no es invertible,
(ℝ, ·, 1): el cero no es invertible,
(ℂ, ·, 1): el cero no es invertible.
Ejemplo 1.2.5 (El grupo de elementos invertibles de un monoide) . Sea
(G , ·, 1) un monoide con identidad 1. Entonces, el conjunto de elementos
de G que son invertibles no es vacío y, respecto a la misma operación, cons-
tituye un grupo, el cual se acostumbra a denotar por G ∗ : en efecto, G ∗ ≠ ∅ ya
que 1 ∈ G ∗ ; sean x, y ∈ G ∗ , entonces xy ∈ G ∗ ya que xyy ′ x ′ = 1, y ′ x ′ xy = 1.
Puesto que la operación que actúa sobre los elementos de G ∗ es la misma
que la de G, entonces la propiedad asociativa también se cumple para G ∗ .
1 ∈ G ∗ es la identidad. Por último, de acuerdo con la definición de G ∗ , cada
elemento de G ∗ es invertible y su inverso está en G ∗ .
Notemos por ejemplo que (ℤ, ·, 1) es un semigrupo conmutativo con
elemento identidad 1 y ℤ∗ = {1,-1}. De igual manera,

(ℚ∗ , ·, 1), (ℝ∗ , ·, 1), (ℂ∗ , ·, 1)

son grupos conmutativos, donde

ℚ∗ = ℚ − {0}, ℝ∗ = ℝ − {0}, ℂ∗ = ℂ − {0}.

De la proposición 1.1.19 y de la definición de grupo se obtienen de ma-


nera inmediata las siguientes conclusiones.
Proposición 1.2.6. Sea (G , ·, 1) un grupo. Entonces,
(i) El elemento identidad 1 del grupo G es único.

(ii) Cada elemento x de G tiene un único inverso, el cual se denota por x −1 .

(iii) Se cumple la ley cancelativa, es decir, para cualesquiera elementos x, y, z


en G se tiene que:

x·z=y·z⇔x=y
z · x = z · y ⇔ x = y.

(iv) Sean a, b elementos cualesquiera de G. Entonces, las ecuaciones lineales


a · x = b y z · a = b tienen solución única en G.
Demostración. Ejercicio para el lector. ✓

La proposición que demostraremos a continuación indica que los axio-


mas que definen un grupo pueden ser debilitados.
Grupos y subgrupos · 9

Proposición 1.2.7. Sea (G , ∗) un semigrupo. Entonces, G es un grupo si, y sólo


si, ∗ tiene las siguientes propiedades:

(i) Existe un elemento identidad a la izquierda e ∈ G tal que e ∗ x = x, para


cada x ∈ G.

(ii) Cada elemento x ∈ G tiene inverso a izquierda, es decir, existe x ′ ∈ G tal


que x ′ ∗ x = e.

Demostración. ⇒): las condiciones (i) y (ii) se cumplen trivialmente ya que


G es un grupo.
⇐): sea (G , ∗) un semigrupo en el cual se cumplen las condiciones (i)
y (ii). Demostremos que el inverso x ′ de x a la izquierda es también a la
derecha, es decir,
x ∗ x ′ = e.
Sea x ∗ x ′ = y ∈ G, entonces

y ∗ y = x ∗ x ′ ∗ x ∗ x ′ = x ∗ (x ′ ∗ x) ∗ x ′ = x ∗ (e ∗ x ′) = x ∗ x ′ = y.

Ahora, por (ii), existe y ′ ∈ G tal que y ′ ∗ y = e. Así pues, de y ∗ y = y se


deduce que (y ′ ∗ y) ∗ y = y ′ ∗ y, luego e ∗ y = e, es decir, y = e, de donde,
x ∗ x ′ = e. Finalmente, probemos que x ∗ e = x:

x ∗ e = x ∗ (x ′ ∗ x) = (x ∗ x ′) ∗ x = e ∗ x = x. ✓

Observación 1.2.8. (i) Según la proposición anterior, si se da un semigrupo


G, es suficiente encontrar en G un elemento identidad a la izquierda e y
encontrar para cada x ∈ G un inverso a la izquierda x ′ para concluir que G
es un grupo.
(ii) La proposición anterior es válida también por el lado derecho.
(iii) No es siempre cierto que si en un semigrupo (G , ∗) tiene lugar la
propiedad (i) por la derecha y la propiedad (ii) por la izquierda el sistema
sea un grupo. Por ejemplo, sea G un conjunto no vacío cualquiera y sea
∗ definida por a ∗ b = a, para cualesquiera a y b en G. ∗ es claramente
asociativa. Además, cualquier elemento x0 de G es identidad a la derecha:
a ∗ x0 = a. También, dado a ∈ G, a tiene inverso a la izquierda respecto al
elemento x0 : x0 ∗ a = x0 . Sin embargo, (G , ∗) no es un grupo en el caso
que G tenga al menos tres elementos distintos a, b, c. En efecto, si G fuera
un grupo se tendría la ley cancelativa:

a ∗ b = a,
a ∗ c = a,
a ∗ b = a ∗ c ⇒ b = c.
10 · Grupos y subgrupos

Análogamente, si tiene lugar la propiedad (i) a la izquierda y la propiedad


(ii) a la derecha, el sistema (G , ∗) no es necesariamente un grupo.

Presentamos a continuación algunos ejemplos notables de grupos.

Ejemplo 1.2.9. El grupo de elementos invertibles del semigrupo Aplc(X),


denotado por S (X), está constituido por las funciones f : X −→ X tales
que existe g : X −→ X para la cual f ◦ g = iX = g ◦ f . En otras palabras,
f ∈ S (X) si, y sólo si, f es una función biyectiva. S (X) es entonces el grupo
de todas las funciones biyectivas definidas de X en X, y es llamado el grupo
de permutaciones de X. En el caso en que X sea un conjunto finito de n ≥ 1
elementos, S (X) se denota por Sn . Este grupo será estudiado en detalle en
el capítulo 6. Para el caso n = 3, los elementos de S3 son:

© 1 2 3 ª © 1 2 3 ª © 1 2 3 ª
iX := ­­ ↓ ↓ ↓ ®® , f := ­­ ↓ ↓ ↓ ®® , h := ­­ ↓ ↓ ↓ ®®,
« 1 2 3 ¬ « 1 3 2 ¬ « 3 2 1 ¬

© 1 2 3 ª © 1 2 3 ª © 1 2 3 ª
g := ­­ ↓ ↓ ↓ ®® , k := ­­ ↓ ↓ ↓ ®® , m := ­­ ↓ ↓ ↓ ®®.
« 2 1 3 ¬ « 2 3 1 ¬ « 3 1 2 ¬

Nótese que este grupo no es conmutativo.

Ejemplo 1.2.10. Sea X un conjunto no vacío y sea (G , ·) un grupo con


elemento identidad 1. Sea Aplc(X , G) el conjunto de funciones de X en G.
Se define en este conjunto la siguiente operación:

f g : X −→ G
x ↦−→ ( f g) (x) = f (x) · g (x),

donde f , g son elementos de Aplc(X , G) y x ∈ X. Esta operación convierte


a Aplc(X , G) en un grupo. Nótese que el elemento identidad es la función i
que asigna a cada elemento x de X el elemento identidad 1 de G. El inverso
de la función f es una función f −1 tal que f −1 (x) = f (x) −1 , para cada x ∈ X.
Un caso particular de esta construcción es cuando X = ℕ y G = (ℝ, +). En
este caso Aplc(ℕ, ℝ) es el grupo de sucesiones reales.

Ejemplo 1.2.11. Del álgebra lineal tenemos el siguiente ejemplo: sea


Mn×m (ℝ) el conjunto de matrices rectangulares de n filas y m columnas con
entradas en ℝ con la operación habitual de adición definida sobre las en-
tradas de las matrices. Esta operación convierte a Mn×m (ℝ) en un grupo
conmutativo, en el cual el elemento identidad es la matriz nula y el inverso
Grupos y subgrupos · 11

aditivo de una matriz F := [ fi j ] es la matriz cuyas entradas son los elemen-


tos opuestos a las entradas de la matriz F , es decir, −F := [−fi j ]. El grupo
de matrices cuadradas de tamaño n × n se denota por Mn (ℝ).

Ejemplo 1.2.12. En álgebra elemental se consideran los polinomios


a0 + a1 x + · · · + an x n con coeficientes reales. La colección de todos estos
polinomios (n no es fijo) se denota por ℝ[x] y constituye un grupo respecto
de la adición mediante reducción de términos semejantes. El polinomio nu-
lo es el elemento identidad y el inverso aditivo de un polinomio se obtiene
cambiando el signo a cada uno de sus coeficientes.

3. Subgrupos
Dado un grupo (G , ·, 1) y un subconjunto no vacío S de G, es interesante
conocer si bajo la misma operación binaria S tiene también estructura de
grupo. Lo primero que deberá cumplirse es que el producto x · y de dos
elementos del conjunto S debe permanecer también en S.

Definición 1.3.1. Sean (G , ·, 1) un grupo y S ≠ ∅ un subconjunto de G.


Se dice que S es un subgrupo de G si S bajo la operación · tiene estructura
de grupo. En tal caso se escribe S ≤ G.

De acuerdo con esta definición se tendrían que verificar cuatro condicio-


nes para garantizar que un subconjunto ∅ ≠ S ⊆ G constituye un subgrupo:

(i) Si x, y ∈ S, entonces x · y ∈ S.

(ii) La operación · es asociativa en S.

(iii) Respecto a la operación ·, en S hay elemento identidad.

(iv) Cada elemento x de S tiene un inverso x −1 en S respecto a la opera-


ción · y del elemento identidad encontrado en (iii).

Sin embargo, como lo muestra la siguiente proposición, sólo hay que com-
probar el cumplimiento de dos condiciones.

Proposición 1.3.2. Sea (G , ·, 1) un grupo y ∅ ≠ S ⊆ G. S es un subgrupo de


G respecto a la operación · si, y sólo si, se cumplen las siguientes condiciones:

(i) Si a, b ∈ S, entonces a · b ∈ S.

(ii) Si a ∈ S, entonces a−1 ∈ S.


12 · Grupos y subgrupos

Demostración. ⇒): si S es un subgrupo de G, entonces S bajo la operación


· es un grupo. Por tanto, · es una operación binaria en S, con lo cual se
garantiza la condición (i). Puesto que S ≠ ∅, sea a ∈ S, sabemos entonces
que las ecuaciones a · x = a y x · a = a tienen soluciones únicas en el grupo S,
pero estas condiciones pueden ser consideradas en el grupo G, por tanto, 1,
que es la solución de ellas en G, debe ser también la solución en S, es decir,
1 ∈ S. Ahora, las ecuaciones a · x = 1 y x · a = 1 también tienen soluciones
únicas tanto en S como en G. Esto indica que a−1 ∈ S, luego la condición
(ii) está demostrada.
⇐): la condición (i) indica que · define en S una operación binaria inter-
na. La asociatividad de · en S es evidente ya que se cumple para todos los
elementos de G, en particular, para los elementos de S. Sea a ∈ S (S ≠ ∅).
Entonces, según (ii), a−1 ∈ S y, por (i), a · a −1 = 1 = a−1 · a, con lo cual
1 ∈ S. ✓

Ejemplo 1.3.3 (Subgrupos triviales) . Todo grupo (G , ·, 1) tiene al menos


dos subgrupos, llamados sus subgrupos triviales:
1 := {1} y G := (G , ·, 1).
Ejemplo 1.3.4. (ℤ, +, 0) ≤ (ℚ, +, 0) ≤ (ℝ, +, 0) ≤ (ℂ, +, 0).
Esta cadena de subgrupos induce la siguiente propiedad evidente.
Proposición 1.3.5. Sean (G , ·, 1) un grupo, (H , ·, 1) un subgrupo de G y
(K, ·, 1) un subgrupo de H . Entonces, (K , ·, 1) es un subgrupo de (G , ·, 1).
Demostración. Evidente a partir de la proposición 1.3.2. ✓

Ejemplo 1.3.6. (ℤ∗ , ·, 1) ≤ (ℚ∗ , ·, 1) ≤ (ℝ∗ , ·, 1) ≤ (ℂ∗ , ·, 1).


Ejemplo 1.3.7. Sean X un conjunto no vacío, S (X) el grupo de permu-
taciones de X respecto a la operación de composición de funciones, x0 un
elemento fijo de X y C := { f ∈ S (X) | f (x0 ) = x0 } el conjunto de funciones
que dejan fijo el punto x0 . Entonces, C ≤ S (X). En efecto, veamos que se
cumplen las condiciones de la proposición 1.3.2: C ≠ ∅ ya que iX ∈ C. Sean
f , g ∈ C, entonces ( f ◦ g)(x0 ) = f [g (x0 )] = f (x0 ) = x0 , así pues f ◦ g ∈ C.
Ahora, sea f ∈ C; f −1 (x0 ) = f −1 [ f (x0 )] = ( f −1 ◦ f )(x0 ) = iX (x0 ) = x0 , por
tanto f −1 ∈ C.
Como caso particular, sean S (X) = S3 y C el conjunto de permutaciones
que dejan fijo el punto 3, entonces

© 1 2 3 ª © 1 2 3 ª

 



 

C = iX = ­­ ↓ ↓ ↓ ®® , g = ­­ ↓ ↓ ↓ ®® .

« 1 2 3 ¬ « 2 1 3 ¬
 

 

Grupos y subgrupos · 13

Ejemplo 1.3.8. Para un semigrupo con notación multiplicativa fueron de-


finidas las potencias enteras positivas (véase la proposición 1.1.8). Preten-
demos ahora extender estas potencias a todos los enteros y presentar la co-
rrespondiente notación para el caso de los grupos aditivos. Sea G un grupo,
entonces
Notación multiplicativa Notación aditiva

(G , ·, 1) (G , +, 0)
a 1 := a 1 · a := a
a n := a n−1 · a, n ∈ ℤ+ n · a := (n − 1) · a + a, n ∈ ℤ+
a0 := 1 0 · a := 0
a−n := (a −1 ) n , n ∈ ℤ+ (−n) · a := n · (−a), n ∈ ℤ+

Teniendo en cuenta esta definición, es posible demostrar por inducción


matemática las siguientes relaciones en cualquier grupo: para cualesquie-
ra m, n ∈ ℤ se tiene

(a n ) m = a nm m · (n · a) = (mn) · a
a n · am = a n+m (n · a) + (m · a) = (n + m) · a
(a n ) −1 = a −n −(n · a) = (−n) · a

Sea (G , ·, 1) un grupo y sea a un elemento cualquiera de G. Simboli-


zamos por ⟨a⟩ el conjunto de todos los elementos de G que son potencias
enteras de a:

⟨a⟩ = {. . . , a −3 , a −2 , a −1 , 1, a, a2 , a3 , . . . } = {a n | n ∈ ℤ}.

Nótese que ⟨a⟩ es un subgrupo de G: claramente ⟨a⟩ es no vacío ya que


a ∈ ⟨a⟩, y además, si x = a n ∈ ⟨a⟩ , y = a m ∈ ⟨a⟩, entonces xy = a n+m ∈ ⟨a⟩;
si x = a n ∈ ⟨a⟩, entonces x −1 = (a n ) −1 = (a −n ) ∈ ⟨a⟩.
⟨a⟩ se denomina el subgrupo cíclico de G generado por el elemento a
(véase también más adelante la definición 2.1.1). En notación aditiva tene-
mos que el subgrupo cíclico generado por a es:

⟨a⟩ = {. . . , −3 · a, −2 · a, −a, 0, a, 2 · a, 3 · a, . . . } = {n · a | n ∈ ℤ} .

Definición 1.3.9. Sea G un grupo. Se dice que G es cíclico si existe un


elemento a ∈ G tal que el subgrupo cíclico generado por a coincide con
todo el grupo G, es decir, G = ⟨a⟩.

Ejemplo 1.3.10 (El grupo ℤ) . (ℤ, +, 0) es un grupo cíclico y todos sus


subgrupos son cíclicos. En efecto, sea H ≤ ℤ. Si H = {0} es el subgrupo
14 · Grupos y subgrupos

trivial nulo, entonces claramente ⟨0⟩ = {0} y H es cíclico. Ahora supon-


gamos que H ≠ {0}. Entonces existe k ≠ 0, k entero, k ∈ H . Si k ∈ ℤ− ,
entonces −k ∈ ℤ+ y −k ∈ H . Así,

H + := x ∈ H | x ∈ ℤ+ ≠ ∅.


Puesto que (ℤ+ , ≤) es bien ordenado, existe un entero positivo mínimo n


en H . Queremos probar que H coincide con el subgrupo cíclico generado
por n, es decir, H = ⟨n⟩ . En efecto, sea p ∈ H . Existen enteros q, r tales
que p = q · n + r, 0 ≤ r < n, luego r = p + [− (q · n)]. Si q ∈ ℤ+ , en-
tonces r = p + q · (−n). Como −n y p ∈ H se tiene que r ∈ H . Por la
escogencia de n, r = 0 y así p = q · n ∈ ⟨n⟩. Si q ∈ ℤ− , entonces −q ∈ ℤ+ y
r = p + [(−q) · n]. Como p, n ∈ H , entonces r ∈ H y, nuevamente, r = 0,
con lo cual p = q · n ∈ ⟨n⟩. Si q = 0, entonces p = r ∈ H , luego r = 0, y
así, p = 0 ∈ ⟨n⟩. En los tres casos hemos probado que H ≤ ⟨n⟩. Puesto que
n ∈ H , la otra inclusión es obvia. Se ha demostrado que cada subgrupo H
de ℤ es cíclico y generado por el menor entero positivo n contenido en H .
Además, ⟨n⟩ = ⟨−n⟩ . Así pues, los subgrupos de ℤ son: ⟨n⟩ , n ≥ 0.

Observación 1.3.11. En adelante omitiremos en la teoría general de gru-


pos con notación mutltiplicativa el punto para representar la operación co-
rrespondiente, así, escribiremos xy en lugar de x · y para denotar el producto
de los elementos x, y.

4. Generación de subgrupos
Dado un subconjunto X de un grupo G se desea establecer si existe un sub-
grupo H en G, distinto de G, que contenga a X. En el caso en que podamos
determinar una colección de tales subgrupos, conviene preguntar cuál es
el subgrupo más pequeño de G que contiene X. Antes de responder estas
preguntas aclaremos primero la expresión “subgrupo más pequeño”.

Proposición 1.4.1. Sea G un grupo. En el conjunto de todos los subgrupos de G


la relación “ser subgrupo de” determina un orden parcial.

Demostración. Evidente. ✓

Como en cualquier conjunto parcialmente ordenado, podemos hablar de


subgrupo maximal y subgrupo minimal.

Definición 1.4.2. Sean (G , ·, 1) un grupo y H ≠ G un subgrupo de G.


Grupos y subgrupos · 15

(i) Se dice que que H es un subgrupo maximal de G si para cada sub-


grupo K de G se tiene

H ≤ K ⇔ (K = H ó K = G).

(ii) Se dice que H ≠ {1} es un subgrupo minimal de G si para cada


subgrupo K de G se tiene

K ≤ H ⇔ (K = H ó K = {1}).

Ejemplo 1.4.3. Los subgrupos maximales del grupo (ℤ, +, 0) son de la


forma ⟨p⟩, donde p es primo. Además, (ℤ, +, 0) no posee subgrupos mini-
males.

Queremos responder ahora las preguntas planteadas al principio de la


sección.

Proposición 1.4.4. Sean G un grupo, {Hi }i ∈I una familia de subgrupos de G y


X un subconjunto cualquiera de G. Entonces,
Ñ
(i) La intersección i ∈I Hi es un subgrupo de G.

(ii) Existe en G un subgrupo, denotado por ⟨X⟩, que contiene a X y es el más


pequeño subgrupo de G con dicha propiedad.

(iii) ⟨X⟩ coincide con la intersección de la familia de todos los subgrupos de G que
contienen a X.

(iv) ⟨∅⟩ = 1.

Demostración. Evidente. ✓

La proposición anterior no permite de una manera concreta determinar


los elementos del subgrupo ⟨X⟩, ya que sería necesario determinar todos los
subgrupos de G que contienen X y luego efectuar la intersección. Se tiene
el siguiente resultado.

Proposición 1.4.5. Sean (G , ·, 1) un grupo y X ≠ ∅ un subconjunto de G.


Entonces,

⟨X⟩ = x1𝜀1 · · · xn𝜀 n | xi ∈ X , 𝜀 i = ±1, n ≥ 1 .

Demostración. Sea S el conjunto de la derecha de la igualdad anterior. En-


tonces, S es un subgrupo de G: en efecto, sean x = x1𝜀1 · · · xn𝜀 n , y = y1𝜃 1 · · · ym𝜃 m
dos elementos de S, entonces xy = x1𝜀1 · · · xn𝜀 n y1𝜃 1 · · · ym𝜃 m tiene la forma de
16 · Grupos y subgrupos

los elementos del conjunto S. Es claro que el inverso de un elemento de S


tiene la forma de los elementos de S. Además, S contiene al conjunto X: en
efecto, para cada elemento x de X se tiene que x = x 1 ∈ S. De lo anterior
se obtiene que ⟨X⟩ ≤ S.
De otra parte, Ù
⟨X⟩ = H,
X ⊆H ≤G

entonces cada H que contiene a X contiene a todos los productos de ele-


mentos de X e inversos de elementos de X, así pues, cada H que contiene
a X contiene también a S, luego S ≤ ⟨X⟩. ✓

Corolario 1.4.6. Sean (G , ·, 1) un grupo abeliano y ∅ ≠ X ⊆ G. Entonces,

⟨X⟩ = {x1k1 · · · xnkn | ki ∈ ℤ, xi ∈ X , n ≥ 1}.

En notación aditiva, ⟨X⟩ = {k1 · x1 + · · · + kn · xn | ki ∈ ℤ, xi ∈ X , n ≥ 1}.

Demostración. Como G es abeliano, para cada elemento


𝜀1 𝜀n
x = x1 · · · xn ∈ ⟨X⟩ podemos agrupar las potencias de elementos igua-
les. ✓

Definición 1.4.7. Sea G un grupo y sea X un subconjunto de G. ⟨X⟩ se


denomina el subgrupo generado por X y a X se le llama un conjunto de
generadores de ⟨X⟩. Si X es finito y ⟨X⟩ = G se dice que G es un grupo
finitamente generado.
Ejemplo 1.4.8. Todo grupo cíclico G con generador a es un grupo finita-
mente generado con conjunto generador {a}:

G = ⟨{a}⟩ = ⟨a⟩ = {ak | k ∈ ℤ}.

Nótese por ejemplo que

ℤ = ⟨{1}⟩ = ⟨1⟩ = {k · 1 | k ∈ ℤ} .

Ejemplo 1.4.9. Sea (ℚ, +, 0) el grupo aditivo de los números racionales,


entonces  
1
ℚ= |n∈ℕ .
n
En efecto, sea r un racional. Si r es positivo entonces podemos
 considerar
p 1
que r es de la forma r = q , con p, q ∈ ℕ, luego r = p · q . Si r = 0 entonces
 
r = 10 = 0 · 11 . Si r es negativo entonces podemos suponer que r es de la
 
forma r = −p 1
q , con p, q ∈ ℕ, luego r = (−p) · q .
Grupos y subgrupos · 17

Ejemplo 1.4.10. Sea (ℚ∗ , ·, 1) el grupo multiplicativo de los números ra-


cionales no nulos, entonces

ℚ∗ = ⟨−1, 2, 3, 5, 7, . . . ⟩ = ⟨x ∈ ℚ | x = −1 ó x es primo positivo⟩ .

En efecto, sea z un racional no nulo. Si z es positivo entonces z es de la


forma qp con p, q ∈ ℕ. p y q se pueden descomponer en factores primos,
𝛽 𝛽s
p = p1𝛼1 · · · pr𝛼r , q = q1 1 · · · qs , con 𝛼1 , . . . , 𝛼r , 𝛽 1 , . . . , 𝛽 s ∈ ℕ ∪ {0},
p  
−𝛽 −𝛽s

z = = pq −1 = p1𝛼1 · · · pr𝛼r q1 1 · · · qs .
q

Si z es negativo, podemos suponer que z es de la forma − qp con p, q ∈ ℕ,


entonces
p p  
−𝛽 −𝛽

z = − = (−1) = (−1)pq −1 = (−1) p1𝛼1 · · · pr𝛼r q1 1 · · · qs s .
q q
Proposición 1.4.11. Sea G un grupo y H un subconjunto no vacío de G. En-
tonces

(i) H ≤ G ⇔ ⟨H ⟩ = H .

(ii) X ⊆ Y ⊆ G ⇒ ⟨X⟩ ≤ ⟨Y ⟩.

(iii) ⟨X⟩ ∪ ⟨Y ⟩ ⊆ ⟨X ∪ Y ⟩.

Demostración. (i) Esta primera afirmación es evidente.


(ii) ⟨Y ⟩ es un subgrupo de G que contiene a Y ⊇ X, por tanto, ⟨X⟩ ≤ ⟨Y ⟩.
(iii) ⟨X ∪ Y ⟩ ⊇ X ∪ Y ⊇ X, luego ⟨X ∪ Y ⟩ ≥ ⟨X⟩. Análogamente,
⟨X ∪ Y ⟩ ≥ ⟨Y ⟩, de donde ⟨X⟩ ∪ ⟨Y ⟩ ⊆ ⟨X ∪ Y ⟩ (en general, la unión de
subgrupos no es un subgrupo). ✓

Proposición 1.4.12. Sea G un grupo finitamente generado y sea H un subgrupo


propio de G. Entonces, existe un subgrupo maximal de G que contiene a H .

Demostración. Sea {x1 , . . . , xn } un sistema finito de generadores de G. Sea


Φ := {K | H ≤ K ⪇ G}. Observemos que Φ ≠ ∅ ya que H ∈ Φ. (Φ, ≤) es
un conjunto parcialmente ordenado. Sea Φ0 una cadena de Φ. Sea
H ′ :=
Ð
K, la unión de los subgrupos K de esta cadena. Nótese que
H ≤ H ≤ G. En efecto, sean x, y ∈ H ′, entonces existen Kx , Ky ∈ Φ0

tales que x ∈ Kx , y ∈ Ky . Como Φ0 es totalmente ordenado podemos supo-


ner que Kx ≤ Ky , y entonces x, y ∈ Ky , luego xy ∈ Ky , con lo cual xy ∈ H ′.
Además, x −1 ∈ Kx ⊆ H ′ . Ahora, como H ≤ K para cada K ∈ Φ0 , entonces
H ≤ H ′.
18 · Grupos y subgrupos

Observemos que H ′ ≠ G. En efecto, si H ′ = G = ⟨x1 , . . . , xn ⟩, entonces


x1 ∈ Kx1 , . . . , xn ∈ Kxn , con Kxi ∈ Φ0 . Existe Kx j tal que x1 , . . . , xn ∈ Kx j ,
luego G ≤ Kx j , es decir, Kx j = G, lo cual es contradictorio. Así pues, H ′ ≠ G.
H ′ es cota superior para Φ0 en Φ. De acuerdo con el Lema de Zorn, Φ tiene
elemento maximal H0 el cual es obviamente subgrupo maximal de G. □ ✓

5. Teorema de Lagrange
Sea G un grupo con un número finito de elementos y sea H un subgru-
po de G. Resulta interesante preguntar qué relación guardan la cantidad de
elementos de H con la cantidad de elementos de G. En esta sección mos-
traremos que el número de elementos de H divide al número de elementos
del grupo dado G.

Proposición 1.5.1. Sea G un grupo y sea H un subgrupo de G. La relación en


G definida por
a ≡ b ⇔ ab −1 ∈ H , con a, b ∈ G (5.1)
es de equivalencia.

Demostración. Reflexiva: sea a ∈ G, entonces a ≡ a ya que aa−1 = 1 ∈ H .


Simétrica: sean a, b ∈ G tales que a ≡ b . Entonces, ab −1 ∈ H , pero como
H ≤ G tenemos que (ab −1 ) −1 = ba −1 ∈ H , es decir, b ≡ a.
Transitiva: sean a, b, c elementos de G tales que a ≡ b y b ≡ c. Enton-
ces ab −1 ∈ H y bc −1 ∈ H . De ahí resulta que (ab −1 )(bc −1 ) ∈ H , es decir,
ac −1 ∈ H , y por tanto, a ≡ c. Esto completa la demostración de la proposi-
ción. ✓

Observación 1.5.2. (i) Si dos elementos a y b de G están relacionados me-


diante (5.1) se dice que a es congruente con b módulo H.
(ii) Si el grupo G tiene notación aditiva entonces la relacion ≡ se define
como a ≡ b ⇔ a − b ∈ H .

Es conocido que cualquier relación de equivalencia ≡ definida sobre un


conjunto G determina una partición de dicho conjunto en clases de equiva-
lencia disyuntas entre sí, y la reunión de las cuales da G. Así, para el caso
que estamos tratando, dado a un elemento cualquiera del grupo G, la clase
de equivalencia a la cual pertenece el elemento a será denotada por [a] y
constituída por todos los elementos x de G con los cuales a está relacionado
mediante la relación ≡, es decir,

[a] = {x ∈ G | a ≡ x} = x ∈ G | ax −1 ∈ H .

Grupos y subgrupos · 19

Como dijimos antes, la reunión de las clases determinadas por la relación ≡


es todo el grupo G, Ø
G= [a].
a ∈G

Proposición 1.5.3. Sea G un grupo, H ≤ G, y ≡ la relación de equivalencia defi-


nida en (5.1) . Sea a un elemento cualquiera de G. Entonces,
[a] = H a := {xa | x ∈ H }. En particular, [1] = H .

Demostración. Sea z ∈ [a], entonces a ≡ z. Por ser ≡ una relación simétrica


tenemos que z ≡ a, y entonces za −1 = x, con x ∈ H , luego z = xa ∈ H a.
Hemos probado que [a] ⊆ H a. Recíprocamente, sea z = xa un elemento
de H a, con x ∈ H , entonces za −1 = x ∈ H , o sea z ≡ a, de donde a ≡ z, es
decir, z ∈ [a]. ✓

Definición 1.5.4. Sean G un grupo, H ≤ G y a ∈ G. El conjunto H a se


llama la clase lateral derecha del elemento a módulo H .

La proposición anterior muestra que la clase del elemento identidad 1


del grupo G coincide con el subgrupo H . Luego [1] y H tienen la misma
cantidad de elementos. A continuación probaremos que todas las clases tie-
nen la cardinalidad de H , y por tanto, todas las clases de equivalencia tienen
la misma cantidad de elementos.

Proposición 1.5.5. Sean G un grupo, H un subgrupo de G y ≡ la relación de


equivalencia definida en (5.1) . Entonces, todas las clases de equivalencia determi-
nadas por ≡ tienen el mismo cardinal que el subgrupo H .

Demostración. Sea a un elemento cualquiera de G. Entonces [a] = H a y


la función f : H a −→ H , f (xa) = x , x ∈ H , es biyectiva. En efec-
to, claramente f es sobreyectiva. Supóngase que f (xa) = f (ya), entonces
x = y, y así, xa = ya, con lo cual f es inyectiva. ✓

Estamos ya en condiciones de demostrar el teorema de Lagrange para


grupos finitos. Si G es un grupo, |G | denota el cardinal de G.

Teorema 1.5.6 (Teorema de Lagrange) . Sea G un grupo finito y sea H un


subgrupo cualquiera de G. Entonces, |H | | |G |.

Demostración. Puesto que G es finito entonces H determina un número fini-


to de clases de equivalencia en G. Sea k el número de clases de equivalencia
definidas, como estas clases son disyuntas y, además, todas tienen |H | ele-

mentos, entonces |H |+· · ·+|H | = |G | , es decir, k|H | = |G |, así |H | | |G |. □
20 · Grupos y subgrupos

Definición 1.5.7. Sean G un grupo y H un subgrupo de G. El cardinal del


conjunto de clases de equivalencia determinado por H mediante la relación
definida en (5.1) se llama el índice del subgrupo H en el grupo G y se
simboliza por |G : H |.
Cuando G es finito se tiene que
|G |
|G : H | = . (5.2)
|H |
Ejemplo 1.5.8. (i) Sea G = S3 y sea H = {1, f }, con 1 la función idéntica
y  
1 2 3
f = .
1 3 2
Calculemos |G : H | y determinemos el conjunto de clases laterales de H .
Denotemos mediante 1 a la función idéntica. Por el teorema de Lagran-
|G | 6
ge, |G : H | = |H | = 2 = 3, H 1 = H = {1, f }, Hh = {h, f h} = {h, k},
H f = f , f 2 = {1, f }, H k = {k, f k} = {k, h}, H g = {g , f g } = {g , m},


H m = {m, f m} = {m, g }. Nótese que H 1 = H f = H , H g = H m y


Hh = H k, es decir, se tienen 3 clases de equivalencia tal como lo había
pronosticado el teorema de Lagrange. Obsérvese que una clase de equiva-
lencia, o en otras palabras, una clase lateral derecha no es en general un
subgrupo del grupo dado.
(ii) |ℤ : ⟨n⟩| = n, para n ≥ 1 y |ℤ : ⟨0⟩| = ℵ0 .

6. Ejercicios
1. Demuestre por inducción las proposiciones 1.1.8 y 1.1.13.

2. Sea G un conjunto dotado de una operación binaria interna ∗. Se dice


que un elemento e ∈ G es:

(i) Identidad a la izquierda de ∗ si e ∗ a = a, cualquiera que sea


a ∈ G.
(ii) Identidad a la derecha de ∗ si a ∗e = a, cualquiera que sea a ∈ G.

Sean e1 y e2 elementos de G tales que e1 es identidad a la izquierda de


∗ y e2 es identidad a la derecha de ∗. Pruebe que e1 = e2 .

3. Compruebe que en:

(i) (ℕ, ∗), con a ∗ b := a, todo elemento de ℕ es identidad a la de-


recha, pero no existe identidad a la izquierda.
Grupos y subgrupos · 21

(ii) (ℕ, ∗), con x ∗ y := máximo común divisor de x e y, no hay


elementos identidad.
(iii) (ℕ, ∗), con a ∗ b := mínimo común múltiplo de a y b, 1 es el
elemento identidad.
(iv) (ℤ, ∗), con a ∗ b := a − b, 0 es identidad a la derecha pero no
posee identidad a la izquierda.

4. Sea G un conjunto dotado de una operación binaria interna ∗ asocia-


tiva, la cual posee elemento identidad e. Para a ∈ G, se dice que:

(i) a posee un inverso a la izquierda (respecto a e) si existe b ∈ G


tal que b ∗ a = e.
(ii) a posee un inverso a la derecha (respecto a e) si existe c ∈ G tal
que a ∗ c = e.

Demuestre que si a posee un inverso a la izquierda b y un inverso a la


derecha c, entonces b = c.

5. Demuestre la proposición 1.2.6.

6. Sean (A, ∗) y (B, Δ) conjuntos con operaciones binarias internas. Una


función f : A −→ B se denomina un homomorfismo si f respeta las
operaciones de los conjuntos A y B, es decir,

f (a1 ∗ a2 ) = f (a1 )Δf (a2 ),

para cualesquiera elementos a1 y a2 de A. Además, si A y B poseen


elementos identidad e y k respectivamente, entonces f debe cumplir
la propiedad adicional f (e) = k. Sea f un homomorfismo de A en
B. Pruebe por inducción que f (a n ) = f (a) n para todo a ∈ A y todo
n ∈ ℕ. Pruebe además que si a es invertible en A, entonces f (a) es
invertible en B y f (a −1 ) = f (a) −1 .

7. Sea f : (A, ∗, e) −→ (B, Δ, k) un homomorfismo de A en B, donde e


y k son los respectivos elementos identidad. Se definen los siguientes
objetos:

(i) El conjunto de imágenes de la función f se llama imagen del


homomorfismo f y se simboliza por Im( f ). Así,

Im( f ) := { f (x) | x ∈ A}.


22 · Grupos y subgrupos

(ii) El conjunto de elementos de A cuya imagen es el elemento iden-


tidad k se llama el núcleo del homomorfismo f y se denota por
ker( f ) (de la palabra alemana kernel). Así,

ker( f ) := {x ∈ A | f (x) = k} .

(iii) Se dice que f es sobreyectivo si la función f es sobreyectiva, es


decir, Im( f ) = B.
(iv) Se dice que f es inyectivo si la función f es inyectiva, es decir,
para cualesquiera elementos x, y ∈ A, la igualdad f (x) = f (y)
implica x = y.
(v) Se dice que f es un isomorfismo si f es sobreyectivo e inyectivo.
(vi) Si los conjuntos A y B coinciden y las operaciones ∗ y Δ también,
entonces un isomorfismo f en este caso se denomina automor-
fismo de A.

Sea X un conjunto y sea P (X) su conjunto de partes. Sea


f : (P (X), ∪) −→ (P (X), ∩) la función que a cada subconjunto V
de X le asigna su complemento: f (V ) = X −V . Determine las identi-
dades en (P (X), ∪) y (P (X), ∩) y demuestre que f es un isomorfismo
(∪ representa la unión de conjuntos y ∩ la intersección).

8. Sea A un conjunto dotado de una operación binaria interna ∗. Su-


pongamos que en A ha sido definida una relación de equivalencia
≡ . Se dice que la relación ≡ es compatible con la operación ∗ si
para cualesquiera a1 , b1 , a2 , b2 ∈ A, a1 ≡ b1 y a2 ≡ b2 , implican
a1 ∗ a2 ≡ b1 ∗ b2 . Denotemos para A el conjunto A/≡ de clases de
equivalencia [a], a ∈ A. Se desea definir en A una operación binaria
inducida por ∗ y ≡. Sean [a] y [b] elementos de A, entonces definimos

[a]∗[b] = [a ∗ b]. (6.1)

(i) Demuestre que (6.1) está bien definida, es decir, muestre que
para otros representantes a1 y b1 de las clases [a] y [b], respec-
tivamente, se cumple que [a1 ]∗[b1 ] = [a]∗[b].
(ii) Demuestre que la función j : (A, ∗) −→ (A, ∗), que asigna a
cada elemento a de A su clase [a], es un homomorfismo sobre-
yectivo.

9. Sea f : (A, ∗) −→ (B, Δ) un homomorfismo sobreyectivo. Definimos


en A la relación ≡ como sigue:
Grupos y subgrupos · 23

a1 ≡ a2 ⇔ f (a1 ) = f (a2 ), para cualesquiera a1 y a2 en A.

(i) Demuestre que ≡ es una relación de equivalencia.


(ii) Demuestre que ≡ es compatible con ∗, es decir, si a1 ≡ a2 y
b1 ≡ b2 , entonces a1 ∗ b1 ≡ a2 ∗ b2 .
(iii) Sean A, ∗ definidos como en el ejercicio anterior. Entonces, de-
muestre que f : (A, ∗) −→ (B, Δ), definido por f ([a]) := f (a),
es un isomorfismo (como toda función definida sobre un conjun-
to cociente, es importante probar como primer paso que f está
bien definida, es decir, que si a1 ≡ a2 , entonces
f ( [a1 ]) = f ( [a2 ])).

10. Sea (G , ·) un semigrupo finito en el cual se cumplen las leyes can-


celativas, es decir, para cualesquiera elementos a, b, c ∈ G, se tiene
que:

ac = bc ⇔ a = b,
ca = cb ⇔ a = b.

Demuestre que (G , ·) es un grupo.

11. Pruebe que si (G , ·) es un semigrupo en el cual las ecuaciones ax = b


y xa = b son solubles para cualesquiera elementos a, b ∈ G, entonces
(G , ·) es un grupo.

12. Demuestre que el conjunto G := {(a, b) | a, b ∈ ℝ, a ≠ 0} con la


operación
(a, b) (c, d) := (ac, ad + b)
es un grupo. ¿G es conmutativo?

13. Sea G un grupo tal que (ab) 2 = a 2 b 2 , para cualesquiera elementos


a, b ∈ G. Pruebe que G es conmutativo.

14. Pruebe que todo grupo finito de tamaño n ≤ 5 es conmutativo.

15. Sea ℝ − {0} el conjunto de reales no nulos con la operación ◦ definida


por
a ◦ b := |a|b.
Pruebe que ◦ es asociativa, que existe elemento identidad al lado iz-
quierdo y que cada elemento tiene inverso al lado derecho respecto a
la identidad de la izquierda. ¿Es G un grupo?
24 · Grupos y subgrupos

16. Cada una de las siguientes tablas define operaciones binarias internas
de las cuales se sabe que son asociativas. Compruebe que ellas definen
grupos:

ℤ4 = {0, 1, 2, 3} V = {e, a, b, c}
+ 0 1 2 3 . e a b c
0 0 1 2 3 e e a b c
1 1 2 3 0 a a e c b
2 2 3 0 1 b b c e a
3 3 0 1 2 c c b a e

¿Es ℤ4 un grupo conmutativo? ¿Es V un grupo conmutativo? ¿Es


{0, 2} ≤ ℤ4 ? ¿Es {e, c} ≤ V ? ¿Es {0, 3} ≤ ℤ4 ? ¿Es {e, a, b} ≤ V ?

17. Sea H un subconjunto finito no vacío de un grupo (G , ·, 1) y sea H


cerrado respecto a la operación, es decir, a, b ∈ H implica ab ∈ H .
Demuestre que H es un subgrupo de G.

18. Sea G un grupo y a un elemento de G. Se define


NG (a) := {x ∈ G | xa = ax}. NG (a) se llama el normalizador de
a en G. Demuestre que NG (a) ≤ G.

19. Sea (G , ·, 1) un grupo abeliano. Pruebe que el conjunto


H := {x ∈ G | x 2 = 1} es un subgrupo de G.

20. Sea Mn (ℝ) el grupo de matrices reales de tamaño n × n, n ≥ 1, con


respecto a la adición, y sea D el conjunto de matrices de Mn (ℝ) que
son diagonales, es decir,

 d1 0  

  


D := diag(d1 , . . . , dn ) := 
 .. 
| d , . . . , d ∈ ℝ


.
  . 
 1 n

0 dn 

 

  
Demuestre que D ≤ Mn (ℝ).

21. Sea GLn (ℝ) el grupo lineal general de orden n sobre los números
reales, es decir, GLn (ℝ) := Mn (ℝ) ∗ es el grupo de elementos inverti-
bles del semigrupo multiplicativo (Mn (ℝ), ·). Entonces,

(i) Sea SLn (ℝ) el subconjunto de GLn (ℝ) constituido por las ma-
trices de determinante 1, es decir,

SLn (ℝ) := {F ∈ GLn (ℝ) | det(F ) = 1} .


Grupos y subgrupos · 25

Demuestre que SLn (ℝ) ≤ GLn (ℝ). SLn (ℝ) se denomina el


grupo especial de orden n sobre ℝ.
(ii) Sea

Dn (ℝ) := {diag(d1 , . . . , dn ) ∈ Mn (ℝ) | d1 · · · dn ≠ 0}.

Demuestre que Dn (ℝ) ≤ GLn (ℝ). Dn (ℝ) se conoce como el


grupo de matrices diagonales de orden n sobre ℝ.
(iii) Sea

Tn (ℝ) := {F ∈ Mn (ℝ) | f11 · · · fnn ≠ 0, fi j = 0 si i > j}.

Demuestre que Tn (ℝ) ≤ GLn (ℝ). Tn (ℝ) se denomina el grupo


de matrices triangulares superiores de orden n sobre ℝ.
(iv) Sea
UTn (ℝ) := {F ∈ Tn (ℝ) | fii = 1, 1 ≤ i ≤ n}.
Demuestre que UTn (ℝ) ≤ Tn (ℝ) ∩ SLn (ℝ). UTn (ℝ) se deno-
mina el grupo de matrices unitriangulares superiores de orden
n sobre ℝ.
(iv) Para 1 ≤ m ≤ n, sea UTnm (ℝ) el conjunto de matrices unitrian-
gulares F = [ fi j ] ∈ UTn (ℝ) tales que fi j = 0, para
i < j < i +m, es decir, las primeras m −1 diagonales consecutivas
por encima de la diagonal principal de F son nulas. Demuestre
que UTnm (ℝ) ≤ UTn (ℝ), y además,

UTn (ℝ) = UTn1 (ℝ) ⊇ UTn2 (ℝ) ⊇ · · · ⊇ UTnn (ℝ) = {E},

con E la matriz idéntica.

22. En el grupo GLn (ℝ) se tienen tres tipos de matrices elementales:

(i) Matrices propiamente elementales o transvecciones:


Ti j (a) := E + aEi j , i ≠ j, a ∈ ℝ, con Ei j ∈ Mn (ℝ) la matriz ca-
nónica que tiene todas sus entradas nulas, salvo la entrada (i , j)
que es 1. Nótese que Ti j (a) ∈ SLn (ℝ).
(ii) Matrices diagonales: Di (d) := diag(1, . . . , d, . . . , 1) ∈ Dn (ℝ),
0 ≠ d ∈ ℝ, 1 ≤ i ≤ n.
(iii) Permutaciones: Pi j = E − Eii − E j j + Ei j + E ji .

Demuestre que:
26 · Grupos y subgrupos

(i) GLn (ℝ) se puede generar por matrices elementales:

GLn (ℝ)
= ⟨Ti j (a), Dn (d) | 1 ≤ i , j ≤ n, i ≠ j, a ∈ ℝ, 0 ≠ d ∈ ℝ⟩.

(ii) SLn (ℝ) = ⟨Ti j (a) | 1 ≤ i , j ≤ n, i ≠ j, a ∈ ℝ⟩.


(iii) Dn (ℝ) = ⟨Di (di ) | 0 ≠ di ∈ ℝ, 1 ≤ i ≤ n⟩.
(iv) Tn (ℝ) = ⟨Ti j (a), Di (di ) | j > i , a ∈ ℝ, 0 ≠ di , 1 ≤ i , j ≤ n⟩.
(iv) UTn (ℝ) = ⟨Ti j (a) | j > i , a ∈ ℝ, 1 ≤ i , j ≤ n⟩.
(v) UTnm (ℝ) = ⟨Ti j (a) | j − i ≥ m, a ∈ ℝ, 1 ≤ i , j ≤ n⟩.
Capítulo
dos
Grupos cíclicos
Grupos cíclicos · 29

Una rama destacada dentro de la teoría de grupos la constituyen los llama-


dos grupos abelianos. Quizá los grupos abelianos más importantes son los
llamados grupos cíclicos ya que los grupos abelianos finitamente generados
son expresables a través de sumas directas de grupos cíclicos. En este capí-
tulo mostraremos las propiedades básicas de los grupos cíclicos finitos. Se
establecerá la relación que guardan los conceptos de periodo de un elemento
y orden. Para grupos cíclicos finitos son demostradas algunas proposiciones
relacionadas con el orden de sus subgrupos y el número de generadores de
dichos grupos. Al final del capítulo hemos incluido una serie de ejercicios
donde se estudian algunas aplicaciones de los grupos cíclicos a teoría ele-
mental de números.

1. Definición
Sea G un grupo cualquiera y sea a un elemento arbitrario de G. El conjunto
de todas las potencias enteras a n , n ∈ ℤ, del elemento a constituye un
subgrupo de G llamado el subgrupo cíclico de G generado por el elemento
a. Como vimos en el capítulo anterior, cuando el grupo G sea aditivo, na,
n ∈ ℤ, representa los múltiplos enteros del elemento a. Recordemos la
nociones de subgrupo y grupo cíclico introducidas en el capítulo anterior.

Definición 2.1.1. Sea G un grupo y sea a un elemento cualquiera de G. El


conjunto

⟨a⟩ = {a n | n ∈ ℤ} = . . . , a−3 , a−2 , a−1 , 1, a, a2 , a3 , . . .




es un subgrupo del grupo G, llamado el subgrupo cíclico de G generado


por el elemento a. Si G es un grupo con notación aditiva escribiremos

⟨a⟩ = {n · a | n ∈ ℤ} = {. . . , −3 · a, −2 · a, −a, 0, a, 2 · a, 3 · a, . . . } .

Es posible que el subgrupo generado por algún elemento a del grupo G


coincida con todo el grupo: ⟨a⟩ = G. Esta situación se presenta por ejemplo
con el entero 1 en el grupo aditivo de los números enteros. Los grupos para
los cuales se tiene este tipo de situación reciben un nombre especial.

Definición 2.1.2. Sea G un grupo cualquiera. Se dice que G es cíclico si G


coincide con uno de sus subgrupos cíclicos, es decir, si existe un elemento a
en G tal que ⟨a⟩ = G. En este caso se dice que a es un generador del grupo
cíclico G.
30 · Grupos cíclicos

Ejemplo 2.1.3. (i) ℤ es un grupo cíclico y todos sus subgrupos son cíclicos
(véase el ejemplo 1.3.10).
(ii) El grupo de raíces complejas de grado n de la unidad, n ≥ 1, es
cíclico: denotemos por Un las soluciones complejas de la ecuación x n = 1,
es decir,
Un := {z ∈ ℂ | z n = 1} ;
afirmamos que Un es un subgrupo de (ℂ∗, ·, 1). En efecto, Un ≠ ∅ ya que
1n = 1 y por lo tanto 1 ∈ Un . Sean z1 y z2 elementos de Un , entonces
(z1 z2 ) n = z1n z2n por ser (ℂ∗ , ·, 1) un grupo abeliano, luego (z1 z2 ) n = 1 y así
z1 z2 ∈ Un . Sea ahora z ∈ Un , entonces (z −1 ) n = z−n = (z n )−1 = 1−1 = 1, es
decir, z−1 ∈ Un , con lo que la afirmación está probada.
Sea z un elemento de Un . Al escribir z en la forma polar
z = r (cos 𝜃 + i sen 𝜃), donde r = |z| es la norma de z, y teniendo en cuenta
que la norma de un producto de complejos es el producto de las normas,
concluimos que |z n | = |z| n = r n = |1| = 1. Puesto que la norma es un real
no negativo entonces r = 1 y z tiene la forma polar z = cos 𝜃 + i sen 𝜃 .
Podemos utilizar el teorema de D’Moivre para determinar la cantidad de
elementos de Un y para demostrar que este subgrupo es cíclico:
z n = cos n𝜃 + i sen n𝜃 = 1 = 1 + i0,
entonces cos n𝜃 = 1 y sen n𝜃 = 0, así n𝜃 = 2k𝜋 , k = 0, 1, 2, . . . . Des-
pejando 𝜃 obtenemos que 𝜃 = 2k𝜋 n , k = 0, 1, 2, . . .. Sin embargo, por la
periodicidad de las funciones cos y sen es suficiente considerar los valores
de k hasta n − 1: 𝜃 = 2k𝜋
n , k = 0, 1, 2, . . . , n − 1. De tal manera que si z ∈ Un
entonces z es de la forma z = cos 2k𝜋 2k𝜋
n + i sen n , con k = 0, 1, . . . , n − 1.
Utilizando la forma exponencial de z podemos demostrar que los complejos
cos 2k𝜋 2k𝜋
n + i sen n , con k = 0, 1, . . . , n − 1 son diferentes: si
2k𝜋 2k𝜋 2k ′ 𝜋 2k ′ 𝜋
cos + i sen = cos + i sen
n n n n
2k𝜋 2k′ 𝜋 ′
entonces e i n = e i n . Así, i 2k𝜋 2k 𝜋
n = i n y por tanto k = k .

De tal manera que


 
2k𝜋 2k𝜋 2k𝜋
Un = e i n = cos + i sen | k = 0, 1, . . . , n − 1
n n
consta de n elementos exactamente (nótese que ℂ∗ es un grupo infinito que
posee subgrupos finitos no triviales: Un , n > 1). Utilizando nuevamente
el teorema de D’Moivre comprobemos que Un es cíclico y generado por
2𝜋
i 2k𝜋
z1 = e i n = cos 2𝜋 2𝜋
n + i sen n . Sea z = e
n un elemento cualquiera de Un ,
2𝜋 2k𝜋
entonces z es la k-ésima potencia de z1 : (z1 ) k = (e i n ) k = e i n = z. Así que,
Un ≤ ⟨z1 ⟩ ⊆ Un , es decir, Un = ⟨z1 ⟩, |Un | = n.
Grupos cíclicos · 31

2. Orden y periodo de un elemento


Consideremos nuevamente un grupo cualquiera G y ⟨a⟩ el subgrupo cíclico
generado por el elemento a de G. Vale la pena preguntar sobre la cantidad
de elementos del subgrupo ⟨a⟩. Descartemos el caso trivial a = 1; en este
caso ⟨1⟩ = {1} y es un subgrupo de un sólo elemento. Sea a ≠ 1 (en notación
aditiva a ≠ 0).
Caso infinito. Si para cada par de enteros diferentes m y n, m ≠ n,
a ≠ a n entonces lógicamente ⟨a⟩ contiene una cantidad infinita de ele-
m

mentos y por tanto el subgrupo cíclico ⟨a⟩ es infinito. La condición que


am ≠ a n para cada par de enteros diferentes m ≠ n es equivalente a la condi-
ción a n ≠ 1 para todo entero n > 0. En efecto, si existe n > 0 tal que a n = 1
entonces a n+1 = a = a1 . Recíprocamente, supóngase que hay enteros m ≠ n
tales que a m = a n , digamos m > n, entonces am a−n = a n a−n , luego a m−n = 1,
donde m − n > 0.

Definición 2.2.1. Sea (G , ·, 1) un grupo y sea a ≠ 1 un elemento cualquie-


ra de G. Se dice que a es de periodo infinito si para cada entero positivo
n > 0, a n ≠ 1. En notación aditiva tendremos que 0 ≠ a ∈ (G , +, 0) es de
periodo infinito si na ≠ 0 para todo n > 0.

Caso finito. Sea G nuevamente un grupo y ⟨a⟩ el subgrupo cíclico ge-


nerado por a. Supóngase que existen enteros m ≠ n tales que am = a n .
Sea m > n, entonces a m−n = 1 con m − n > 0. Considérese el conjunto
A := {k ∈ ℤ+ | ak = 1}, entonces por ser (ℤ+ , ≤) un conjunto bien orde-
nado A tiene primer elemento n, es decir, n es el menor entero positivo tal
que a n = 1.

Definición 2.2.2. Sea (G , ·, 1) un grupo y a un elemento cualquiera de G.


Se dice que a es de periodo finito si existe k > 0 tal que ak = 1. El menor
entero positivo n > 0 tal que a n = 1 se llama el periodo del elemento a. En
notación aditiva, a ∈ (G , +, 0) es de periodo finito n si n es el menor entero
positivo tal que n · a = 0.

Podemos ahora responder a nuestra pregunta sobre el número de ele-


mentos del subgrupo cíclico generado por a.

Proposición 2.2.3. Sea G un grupo y sea a un elemento cualquiera de G. En-


tonces,

(i) El subgrupo cíclico ⟨a⟩ generado por a es infinito si, y sólo si, a es un elemento
de periodo infinito.
32 · Grupos cíclicos

(ii) El subgrupo cíclico ⟨a⟩ generado por a es finito si, y sólo si, a es un elemento
de periodo finito. Además, si n es el periodo del elemento a, entonces el orden
|⟨a⟩| del subgrupo generado por el elemento a es exactamente n, se denomina
el orden del elemento a y se simboliza por |a| . Si a es de periodo infinito se
dice que a es un elemento de orden infinito y se escribe |a| = ∞.
Demostración. (i) ⇒): supongamos que a no es un elemento de periodo infi-
nito. Entonces existe un entero k > 0 tal que a k = 1. Esto quiere decir que a
es de periodo finito. Sea n el periodo del elemento a. Afirmamos que enton-
ces ⟨a⟩ contiene exactamente n elementos diferentes:
2 3 n−1
⟨a⟩ = {1, a, a , a , . . . , a }. Probemos inicialmente que los elementos
1, a, a 2 , a 3 , . . . , a n−1 son diferentes. Si ai = a j con i ≠ j e 1 ≤ i , j ≤ n − 1,
entonces, suponiendo por ejemplo i > j, tendremos que ai− j = 1 con
0 < i − j < n, pero esto contradice el hecho de ser n el periodo de a.
Sea ahora k ∈ ℤ y a k un elemento cualquiera de ⟨a⟩ . Por el algoritmo de
la división tenemos que k = ng + r con 0 ≤ r < n. Entonces a k = a ng y
a r = (a n ) g ar = 1a r = a r . Así pues ak coincide con una de las potencias
a 0 = 1, a, . . . , a n−1 . Esto prueba que ⟨a⟩ es finito. Nótese que cuando a es
de periodo finito n, entonces n = periodo de a = |⟨a⟩| = orden del subgrupo
cíclico generado por a = |a| = orden del elemento a.
⇐): si a es de periodo infinito, entonces a n ≠ 1 para todo n > 0. Como
vimos antes, esto implica que am ≠ a n para cada par de enteros diferentes m
y n, luego lógicamente ⟨a⟩ es infinito.
(ii) ⇒): supongamos que a no es de periodo finito. Entonces a es de
periodo infinito y, como acabamos de ver en (i), ⟨a⟩ es un subgrupo infinito.
⇐): si a es de periodo finito n entonces como se demostró anteriormente
⟨a⟩ contiene n elementos. ✓

Corolario 2.2.4. Sea G un grupo.


(i) Si G es finito, entonces |a| | |G |.

(ii) Sea a un elemento de periodo finito n del grupo G (G no necesariamente


finito) . Si a k = 1, con k ∈ ℤ, entonces n | k. Recíprocamente, si k es un
entero tal que n | k, entonces ak = 1.

(iii) Si G es finito, entonces a |G | = 1.


Demostración. (i) Si G es un grupo finito, entonces ⟨a⟩ es también finito.
Como |⟨a⟩| = |a|, entonces por el teorema de Lagrange |a| | |G | .
(ii) Por el algoritmo de la división, k = ng + r, con 0 ≤ r < n. Entonces
ak = 1 = (a n ) g ar = a r . Por ser n el periodo de a, entonces r = 0, y así, n | k.
Recíprocamente, si k = ns, entonces ak = (a n ) s = 1.
Grupos cíclicos · 33

(iii) Se desprende de (i) y (ii). ✓


Definición 2.2.5. Se dice que G es un grupo sin torsión si cada elemento


a ≠ 1 tiene periodo (orden) infinito. Si cada elemento a de G es de periodo
finito, se dice que G es un grupo periódico. Finalmente, se dice que G es un
grupo mixto si G contiene elementos a ≠ 1 tanto de periodo infinito como
de periodo finito.

3. Ejemplos
Ejemplo 2.3.1 (Grupo sin torsión) . Notemos en primer lugar que todo
grupo sin torsión debe ser infinito. Sea p un número primo. El conjunto de
números racionales  
m
ℚp = n ∈ ℚ | m, n ∈ Z
p
bajo la adición es un grupo abeliano sin torsión y se denomina el grupo de
los p-cocientes racionales: por ser ℚp ⊂ ℚ y por ser la operación definida
en ℚp la inducida por la adición en ℚ, entonces es suficiente probar que
ℚp ≤ ℚ y que ℚp es un grupo sin torsión. En efecto,

m1 m2 m1 .p n2 + m2 .p n1
+ = ∈ ℚp ,
p n1 p n2 p n1 +n2
m −m
− n = n ∈ ℚp .
p p
 
m m
Sea pn ∈ ℚp , supongamos que existe k > 0 tal que k pn = 0, es decir,
km m
pn = 0, entonces km = 0, así m = 0. Por lo tanto, pn = 0.

Ejemplo 2.3.2 (Grupo infinito periódico) . Observemos en primer lugar


que cada grupo finito es necesariamente periódico. Sin embargo, como lo
muestra este ejemplo, la recíproca de la afirmación anterior no es correcta.
Sea p un número primo. El conjunto de números complejos
n
ℂp∞ := z ∈ ℂ | z p = 1, para algún n = 0, 1, 2, . . .


bajo la multiplicación es un grupo abeliano infinito donde cada elemen-


to diferente de 1 tiene periodo finito. Nótese que ℂp∞ consta de las raíces
n
complejas de las ecuaciones x p = 1, con n = 0, 1, 2, . . . . El grupo ℂp∞ se
denomina grupo semicíclico del tipo p ∞ .
Para probar que ℂp∞ es un grupo, es suficiente probar que ℂp∞ es un
subgrupo de ℂ∗ : sean z1 y z2 ∈ ℂp∞ , entonces existen n1 y n2 tales que
34 · Grupos cíclicos

p n1 p n2 pn pn
z1 = 1 y z2 = 1. Si n := n1 + n2 , entonces z1 = 1 y z2 = 1, luego
n
(z1 z2 ) p = 1, es decir, z1 z2 ∈ ℂp∞ .
n
Sea z ∈ ℂp∞ , entonces existe n ≥ 1 tal que z p = 1. Esto quiere decir
 pn
que z ∈ Upn y como Upn ≤ ℂ∗ entonces z−1 ∈ Upn , es decir, z−1 = 1y
así z −1 ∈ ℂp∞ . Notemos que para cada n ≥ 1, Upn ≤ ℂp∞ y, por la misma
definición de ℂp∞ , cada elemento z de ℂp∞ tiene periodo finito. Nótese que
para cada n ≥ 1 Upn ≤ Upn+1 . Denotando por ℂpn el grupo Upn , obtenemos
la cadena de subgrupos de ℂp∞ :
Ø
ℂp ∞ = ℂp k
k≥ 0
{1} = ℂp0 ≤ ℂp ≤ ℂp2 ≤ ℂp3 ≤ · · · ≤ ℂpn ≤ ℂpn+1 ≤ · · ·

Veamos que estos son los únicos subgrupos: sea H un subgrupo propio
de ℂp∞ . Si para cada k ≥ 0, ℂpk ≤ H , entonces H = ℂp∞ , pero este caso
está descartado. Entonces, existe un k ≥ 0 tal que ℂpk no está incluido en H .
Escojamos el menor k tal que ℂpk−1 ≤ H , pero ℂpk no está incluido en H . k
no puede ser 0 ya que ℂp0 ≤ H . Por lo tanto, k ≥ 1. La idea es demostrar
que H = ℂpk−1 . Si esto es así, entonces el n buscado es n = k − 1.
Sabemos que ℂpk−1 ≤ H y supongamos que la inclusión es estricta, es
decir, existe z ∈ H pero z ∉ ℂpk−1 . Como z ∈ ℂp∞ existe un m ≥ 1 mínimo
tal que z ∈ ℂpm pero z ∉ ℂpm−1 . Nótese que m ≥ k porque de lo contario
z ∈ ℂpk−1 . Se tiene que ℂpk ≤ Cpm . Sea ℂpm =< z1 >, entonces z = z1a ,
donde 0 ≤ a ≤ p m − 1, nótese que p no divide al entero a. En efecto, si
m−1 ap m−1 bp m
p|a, entonces a = pb y, en consecuencia, z p = z1 = z1 = 1, pero
esto indica que z ∈ ℂpm−1 , lo cual es falso. Se tiene entonces que a y p m son
primos realtivos, es decir, 1 = ua + vp m , donde u, v son enteros. De aquí
pm
resulta que z1 = (z1a ) u (z1 ) v = zu . Esto implica que ℂpm ≤ ⟨z⟩ ≤ H y se
tendría que ℂpk ≤ H , lo cual es falso. En conclusión, H = ℂpk−1 .
Ejemplo 2.3.3 (Grupo mixto) . El grupo multiplicativo de los números
complejos es mixto ya que hay elementos, como por ejemplo, los enteros di-
ferentes de 1, que son de periodo infinito, y complejos como
z1 = cos 2𝜋 2𝜋
n + i sen n , n ≠ 1, que son de periodo finito.

4. Propiedades
Las siguientes afirmaciones son válidas para grupos cíclicos cualesquiera.
Especialmente importante es la afirmación (iv).
Proposición 2.4.1. (i) Todo grupo cíclico es abeliano.
Grupos cíclicos · 35

(ii) Cada subgrupo de un grupo cíclico es cíclico.

(iii) Si (G , ·, 1) es un grupo cíclico infinito, entonces cada subgrupo de G diferente


de {1} es también infinito.

(iv) Sea G ≠ {1} un grupo. Entonces, G es un grupo cíclico finito de orden primo
si, y sólo si, G no tiene subgrupos diferentes de los triviales.

Demostración. (i) Esta propiedad se deduce de la regla de exponentes


am a n = am+n válida en todo grupo.
(ii) Sea G = ⟨a⟩ un grupo cíclico generado por el elemento a y sea H
un subgrupo de G. Si H = {1}, entonces es cíclico con generador 1. Sea
H ≠ {1}, entonces existe un k ≠ 0 tal que a k ∈ H . Esto indica que H con-
tiene potencias enteras positivas del elemento a. Por el principio de buena
ordenación del conjunto ℤ+ , escogemos el menor entero positivo s tal que
a s ∈ H . Afirmamos que H = ⟨a s ⟩ . Claramente ⟨a s ⟩ ⊆ H . Sea x ∈ H ⊆ G,
entonces existe m ∈ ℤ tal que x = am . Utilizando el algoritmo de la división
encontramos enteros g , r tales que m = gs + r, con 0 ≤ r < s,, de donde
am = (a s ) g ar , por lo que a r = am−sg ∈ H . Por la elección de s concluimos
que r = 0, luego x = (a s ) g ∈ ⟨a s ⟩.
(iii) Sea H ≠ {1} un subgrupo del grupo cíclico infinito ⟨a⟩= G. Según
(ii) existe s > 0 tal que H = ⟨a s ⟩. Si H es finito, entonces eso quiere decir
que el orden de a s es finito, con lo cual a es de periodo finito y ⟨a⟩ es finito,
lo cual contradice la hipótesis. Esto indica que H debe ser infinito.
(iv) ⇒): sea G un grupo finito de orden primo p : |G | = p. Sea H ≤ G,
entonces |H | | |G |, de modo que |H | = 1 ó |H | = p, por lo tanto, H = {1}
ó H = G.
⇐): sea b ≠ 1, b ∈ G. El subgrupo cíclico ⟨b⟩ generado por b es entonces
diferente de {1}, luego ⟨b⟩ = G, lo cual quiere decir que G es cíclico. Pro-
bemos ahora que G es finito. Consideremos el subgrupo cíclico generado
por b 2 . Por la condición de la hipótesis ⟨b 2 ⟩ = {1} ó ⟨b 2 ⟩ = G = ⟨b⟩. En
el primer caso tendremos que b 2 = 1, con lo cual b es de periodo 1 ó 2.
No puede ser de periodo 1 ya que b ≠ 1. Por lo tanto, b es de periodo 2
y ⟨b⟩ = {1, b}, de donde se tiene que G es finito y su orden es el primo 2.
Supongamos que ⟨b 2 ⟩ = G = ⟨b⟩. Existe entonces k ∈ ℤ tal que b = (b 2 ) k , es
decir, b 2k−1 = 1 con lo cual b es de período finito y ⟨b⟩ es finito, es decir, G es
finito. Resta sólo probar que el orden de G es un número primo. Sea p = |G |
el orden del grupo G y sea k ∈ ℤ+ tal que k | p. Consideremos el subgrupo
cíclico generado por b k . Si ⟨b k ⟩ = {1}, entonces b k = 1 y k es un múltiplo
del periodo p, por lo que k = p. Supongamos ahora que ⟨b k ⟩ = G = ⟨b⟩,
entonces existe t ∈ ℤ tal que (b k ) t = b, así, b kt−1 = 1, luego p | kt − 1, es
36 · Grupos cíclicos

decir, existe s ∈ ℤ tal que kt − 1 = ps, pero k | p, entonces existe k ′ ∈ ℤ tal


que p = kk ′; de donde kt − 1 = kk ′ s; así, k(t − k ′ s) = 1, entonces k = 1. Esto
prueba que los únicos divisores de p son p y 1, y de esta forma se tiene que
p es primo. ✓

5. Generadores
Teorema 2.5.1. (i) Sea G un grupo cíclico finito de orden n con generador a.
Entonces, x ∈ G es generador de G ⇔ x = ar , donde m. c. d.(n, r) = 1.
(ii) Sea G un grupo cíclico con generador a y sea H ≠ {1} un subgrupo de G.
Entonces, H = ⟨a s ⟩ , donde s es el menor entero positivo tal que a s ∈ H .
Además, si G es de orden finito n entonces |H | = nd , d = m. c. d.(n, s).
(iii) Sea G un grupo cíclico de orden finito n y sea t ∈ ℤ+ tal que t | n. Entonces
G contiene exactamente un subgrupo de orden t.

Demostración. (i) ⇒): sea x un generador de G = ⟨a⟩. Entonces existe un


r ∈ ℤ tal que x = a r y ⟨x⟩ = ⟨a r ⟩ = ⟨a⟩. De aquí obtenemos que a ∈ ⟨a r ⟩,
es decir, existe k ∈ ℤ tal que a = (a r ) k entonces a rk−1 = 1, así n | rk − 1, es
decir, rk − 1 = sn, con s ∈ ℤ; de lo cual rk − sn = 1, así r y n son primos
relativos y m. c. d.(r , n) = 1.
⇐): sea r ∈ ℤ tal que m. c. d.(n, r) = 1. Lógicamente, ⟨ar ⟩ ⊆ G. Sea
x ∈ G, entonces existe k ∈ ℤ tal que x = a k . Como m. c. d.(n, r) = 1 existen
t, v ∈ ℤ tales que 1 = nt + rv, así k = ntk + rvk, luego
x = a k = a ntk arvk = arvk = (ar ) vk ∈ ⟨a r ⟩.
(ii) La primera parte de esta afirmación fue demostrada en el punto (ii)
de la proposición 2.4.1.
Para la segunda parte, el orden de H es el orden de a s . Sea m := |a s |,
entonces (a s ) m = 1, es decir, a sm = 1, luego n | sm, por lo tanto nd | m, con
n s
d := m. c. d.(n, s). De otra parte, (a s ) d = (a n ) d = 1 entonces m | nd . Por lo
tanto, nd | m y m | nd con lo cual m = nd .
(iii) Existencia: como t | n, entonces n = ts, con s ∈ ℤ, así, |⟨a s ⟩| = t. En
efecto, (a s ) t = 1, entonces |a s | | t. Si |a s | := t0 y t0 < t, entonces a st0 = 1 y
st0 < n, lo cual es una contradicción.
Unicidad: sea H un subgrupo de G de orden t. Sea n = ts y sea k el
menor entero positivo tal que a k ∈ H . Por (ii) sabemos que H = ⟨ak ⟩ y
t = |H | = nd , donde d = m. c. d.(n, k), entonces n = td = ts, de modo que
s = d, así s | k, es decir, k = sw con w ∈ ℤ. Luego, a k = (a s ) w y, por tanto,
H ⊆ ⟨a s ⟩ , pero |H | = |⟨a s ⟩| = t, entonces H = ⟨a s ⟩. ✓

Grupos cíclicos · 37

Ejemplo 2.5.2 (Los enteros módulo n) . Sea n ≥ 2 un entero, entonces el


conjunto ℤn conformado por todos los enteros {0, 1, 2, 3, . . . , n − 1} cons-
tituye un grupo cíclico respecto a la siguiente adición: r +s := t , donde t es el
resíduo de dividir r + s entre n. Nótese que el generador de ℤn es 1. El grupo
ℤn lo consideraremos nuevamente en el capítulo 3 del presente cuaderno.
Por ahora digamos algo más respecto a su definición. También podríamos
haberlo definido usando las ideas previas al teorema de Lagrange, es decir,
se vió que en ℤ se puede definir la relación de equivalencia ≡ respecto al sub-
grupo ⟨n⟩ en la forma a ≡ b si, y sólo si, a − b ∈ ⟨n⟩. Esta relación divide a ℤ
en n clases de equivalencia de la forma [a] = {x ∈ ℤ | a − x ∈ ⟨n⟩} = ⟨n⟩ + a.
Las clases en este caso se denotan mejor en la forma [a] = a, y la suma de
clases se hace como se dijo arriba. Nótese que las clases distintas son exacta-
mente {0, 1, 2, 3, . . . , n − 1}. Queremos ahora calcular todos los subgru-
pos de ℤ24 y todos sus generadores.
Si H ≤ ℤ24 , entonces |H | | 24, de modo que, por el teorema de Lagran-
ge, |H | ∈ {1, 2, 3, 4, 6, 8, 12, 24}.
Para |H | = 1 tenemos H = {0} y para |H | = 24 tenemos H = ℤ24 .
Para cada r = 2, 3, 4, 6, 8, 12 sabemos que ℤ24 contiene solamente
un subgrupo de orden r. Ahora, cada subgrupo H es cíclico y de la forma
H = ⟨s · 1⟩ = ⟨s⟩, donde |H | = r = 24
d , con d = m. c. d.(24, s). Obtenemos:
24
d = 2, entonces d = 12 = s; ⟨12⟩ = {0, 12},
24
d = 3, entonces d = 8 = s; ⟨8⟩ = {0, 8, 16},
24
d = 4, entonces d = 6 = s; ⟨6⟩ = {0, 6, 12, 18},
24
d = 6, entonces d = 4 = s; ⟨4⟩ = {0, 4, 8, 12, 16, 20},
24
d = 8, entonces d = 3 = s; ⟨3⟩ = {0, 3, 6, 9, 12, 15, 18, 21},
24
d = 12, entonces d = 2 = s;

⟨2⟩ = {0, 2, 4, 6, 8, 10, 12, 14, 16, 18, 20, 22}.

Los generadores de ℤ24 son de la forma s, con m. c. d.(s, 24) = 1. En-


tonces, s = 1, 5, 7, 11, 13, 17, 19, 23.

6. Ejercicios
1. Sea G un grupo y sean a, b elementos de G tales que:

(i) ⟨a⟩ ∩ ⟨b⟩ = {1}.


(ii) ab = ba.
(iii) |a| = m, |b| = n.
38 · Grupos cíclicos

Demuestre que |ab| = m. c. m.(|a|, |b|).

2. Sea G un grupo y sean a, b elementos de G tales que:

(i) ab = ba.
(ii) |a| = n, |b| = m.
(iii) m. c. d.(n, m) = 1.

Demuestre que |ab| = nm. Además, ⟨a, b⟩ = ⟨ab⟩.

3. Sea G un grupo y sean a, b elementos de G. Demuestre que:

(i) |a| = |a−1 |.


(ii) |xax −1 | = |a|, para todo x ∈ G.
(iii) |ab| = |ba|.
(iv) Sea |a| = n. Pruebe que a i = a j ⇔ n | i − j.

4. Sea ℤn = {0, 1, 2, 3, . . . , n − 1} el conjunto de los enteros módulo


n. En ℤn definimos la multiplicación mediante la regla r · s := rs.
Demuestre que (ℤn , ·) es un semigrupo conmutativo con elemento
identidad 1 (compruebe inicialmente que la operación · en ℤm está
bien definida). Construya la tabla para n = 8. ¿Es (ℤ8 , ·) un grupo?

5. Sea ℤn el conjunto de los enteros módulo n. Sea ℤ∗n el grupo multi-


plicativo del semigrupo (ℤn , ·) del ejercicio anterior. Demuestre que
[r] ∈ Zn∗ ⇔ m. c. d.(r , n) = 1.

6. La función 𝜑 : ℕ −→ ℕ del conjunto de los números naturales que


asigna a cada natural m el número de enteros positivos menores que
m y que son primos relativos con él es denominada función de Euler.
Por ejemplo, 𝜑(6) = 2, 𝜑(10) = 4. Según el ejercicio anterior, ℤ∗m
tiene 𝜑(m) elementos. Utilice estas observaciones para demostrar los
siguientes teoremas:

(i) Teorema de Euler: Sean a, m enteros, m > 0 y m. c. d.(a, m) =


1. Entonces, a 𝜑 (m) ≡ 1 (módulo m), es decir, m | a 𝜑 (m) − 1.
(ii) Teorema de Fermat: Si p es primo, entonces a p ≡ a (módulo p),
para todo a ∈ ℤ.

7. Sea G un grupo cíclico de orden 60. ¿Cuántos generadores tiene G?

8. Determine el subgrupo cíclico de (ℤ42 , +) generado por 30.


Grupos cíclicos · 39

(1+i)
9. Demuestre que √ es un elemento de periodo finito de ℂ∗ .
2

10. Sean p y q primos diferentes. Calcule el número de generadores del


grupo cíclico (ℤpq , +).

11. Determine todos los subgrupos de ℤ36 y todos sus generadores.

12. Determine todos los subgrupos de ℂ36 y todos sus generadores.


Capítulo
tres
Subgrupos
normales y
homomorfismos
Subgrupos normales y homomorfismos · 43

El objetivo central de este capítulo es mostrar la estrecha relación que guar-


dan los conceptos de subgrupo normal y homomorfismo de grupos. Será
demostrado que, salvo isomorfismo, hay tantos subgrupos normales en un
grupo G como imágenes homomorfas tiene este último. El concepto de
grupos isomorfos permite, entre otras cosas, clasificar los grupos cíclicos:
los infintos que son isomorfos a (ℤ, +) y los finitos de orden n que son iso-
morfos a (ℤn , +). Dentro de los ejemplos hemos incluido un grupo muy
importante como es el grupo óctico correspondiente a las 8 simetrías del
cuadrado.

1. Subgrupos normales
En el capítulo 1 se construyó el grupo de enteros módulo n, ℤn , por medio
de 4 objetos, a saber: el grupo ℤ, el subgrupo ⟨n⟩ de múltiplos de n, la re-
lación de equivalencia en ℤ definida como a ≡ b si, y sólo si, a − b ∈ ⟨n⟩ y
la operación de adición entre clases de equivalencia determinadas por esta
relación: a + b = a + b, a, b ∈ ℤ.
Vale la pena preguntarnos si, dado un grupo G y H un subgrupo cual-
quiera de G, podemos repetir la construcción mencionada anteriormente
con ayuda de la relación de equivalencia en G utilizada para la demostra-
ción del teorema de Lagrange:
a ≡ b ⇔ ab −1 ∈ H .
Puesto que las clases de equivalencia están determinadas por el subgrupo H ,
es lógico preguntarnos que condición debe satisfacer H para que podamos
dar al conjunto de clases de equivalencia una estructura de grupo. Antes
de responder a estas preguntas recordemos cierta terminología introducida
previamente.
Definición 3.1.1. Sea G un grupo y sean A y B subconjuntos no vacíos de
G. Se denomina producto de los conjuntos A y B (en ese orden) al conjunto
de productos de la forma ab, donde a ∈ A y b ∈ B, y se denota por AB. En
otras palabras, AB := {ab | a ∈ A, b ∈ B}.
Proposición 3.1.2. Sea G un grupo y sea H un subgrupo de G. Entonces las
siguientes condiciones son equivalentes:
(i) x −1 hx ∈ H , ∀x ∈ G , ∀h ∈ H .

(ii) x −1 H x = H , ∀x ∈ G.

(iii) xH = H x, ∀x ∈ G.
44 · Subgrupos normales y homomorfismos

(iv) xH yH = xyH , ∀x, y ∈ G.


Demostración. (i) ⇒ (ii): evidentemente x −1 H x ≤ H . Sea ahora h ∈ H ,
entonces h = x −1 (xhx −1 )x; según (i), xhx −1 ∈ H , luego H ≤ x −1 H x.
(ii) ⇒ (iii): sea h ∈ H , entonces xhx −1 ∈ H , luego xhx −1 = h0 ∈ H , con
lo cual xh = h0 x ∈ H x, resulta, xH ≤ H x. Análogamente, H x ≤ xH .
(iii) ⇒ (iv): sean h1 , h2 ∈ H , entonces xh1 yh2 = xyh1′ h2 , donde h1′ ∈ H ,
luego xH yH ≤ xyH . Ahora, si h ∈ H se obtiene que xyh = x1yh ∈ xH yH ,
es decir, xyH ≤ xH yH .
(iv) ⇒ (i): sea x ∈ G, h ∈ H , entonces x −1 hx ∈ x −1 H xH luego
x −1 hx ∈ x −1 xH = H . Esto completa la prueba de la proposición. ✓

Definición 3.1.3. Sea G un grupo y H ≤ G. Se dice que H es un subgru-


po normal de G, lo cual denotamos por H ⊴ G, si H cumple una de las
condiciones de la proposición anterior.
Definición 3.1.4. Sea G ≠ {1} un grupo. Entonces G posee al menos dos
subgrupos normales, llamados los subgrupos normales triviales: {1}, G. Si
G no posee otros subgrupos normales fuera de los triviales se dice que G es
un grupo simple.

2. Grupo cociente
Sea G un grupo y H ⊴ G. En G se tiene la relación
a ≡ b ⇔ ab −1 ∈ H .
Como ya fue demostrado en el capítulo 1, ≡ es una relación de equivalen-
cia la cual determina una partición del grupo G en clases de equivalencia,
llamadas también clases laterales derechas:
[a] = H a
Nótese que la relación ≡ es igual a la relación ≡′ definida por
a ≡′ b ⇔ a −1 b ∈ H . En tal caso [a] = aH . Pero como H ⊴ G enton-
ces las clases laterales derechas e izquierdas de a coinciden.
Podemos definir un producto entre clases de equivalencia, así como se
hizo en ℤn , y dar al conjunto de clases estructura de grupo.
Proposición 3.2.1. Sea (G , ·, 1) un grupo y sea H ⊴ G. Sea ≡′ la relación de
equivalencia de G definida por
a ≡′ b ⇔ a−1 b ∈ H
(de forma equivalente, a ≡ b ⇔ ab −1 ∈ H ) .
Subgrupos normales y homomorfismos · 45

Sea G/H el conjunto de clases de equivalencia (de clases laterales derechas o iz-
quierdas) determinadas por la relacion ≡. Entonces definiendo el producto de clases
de G/H por

aH bH := abH , ∀a, b ∈ G
(a b := ab).

G/H es un grupo. G/H se denomina el grupo cociente de G por H .

La clase con representante a será denotada simplemente por a o aH


en el caso multiplicativo; en notación aditiva a = a + H .

Proposición 3.2.2. Sea G un grupo y H ⊴ G. Entonces,

(i) Si G es abeliano, entonces G/H es también abeliano.

(ii) Si G es cíclico con generador a, entonces G/H es cíclico con generador a.


|G |
(iii) Si G es finito, entonces |G : H | = |G/H | = |H | .

(iv) ℤn = ℤ/⟨n⟩.

(v) Si K ≤ G es tal que H ≤ K, entonces, H ⊴ K.

(vi) Si L ≤ G es tal que |G : L| = 2, entonces L ⊴ G.

Demostración. Las cinco primeras afirmaciones son casi evidentes. Veamos


la prueba de (vi): G queda dividido en sólo dos clases laterales izquierdas:
G = L ∪ (G − L). Sea x ∈ G, h ∈ L, consideremos las siguientes cuatro
posibilidades:
a) x −1 h ∈ L, x −1 ∈ L ⇒ x −1 hx ∈ L.
b) x −1 h ∈ L, x −1 ∉ L, imposible.
c) x −1 h ∉ L, x −1 ∈ L, imposible.
d) x −1 h ∉ L, x −1 ∉ L ⇒ x −1 h ≡ x −1 ⇒ x −1 hx ∈ L ⇒ L ⊴ G.
(vii) Esto se ilustra en el siguiente ejemplo. □✓

Ejemplo 3.2.3 (Grupo diédrico D4 ) . Consideremos un cuadrado cuyos


vértices se numeran sucesivamente en sentido contrario al movimiento de
las manecillas del reloj con los números 1, 2, 3, 4, comenzando en el extre-
mo inferior izquierdo, y consideremos el conjunto D4 de las 8 simetrías de
un cuadrado: cuatro rotaciones en sentido antihorario a través de los ángu-
los 2𝜋k
4 , k = 0, 1, 2, 3; cuatro reflexiones a través de cuatro ejes de simetría
X , Y , 13, 24. Este conjunto posee estructura de grupo bajo la operación de
composición. Nótese que cada simetría permuta los vértices 1, 2, 3, 4; por
46 · Subgrupos normales y homomorfismos

lo tanto el grupo D4 puede ser visto como subgrupo de S4 : la rotación a


través del ángulo 𝜃 = 2𝜋 , k = 1 corresponde a la permutación:
 
1 2 3 4  
f = = 1 2 3 4 .
2 3 4 1

Observemos que las otras tres rotaciones corresponden a potencias de f : f 2 ,


f 3 , f 4 = 1 = rotación de cero grados.
La reflexión a través del eje 13 corresponde a la permutación:
  
1 2 3 4 
g= = 2 4 , g 2 = 1.
1 4 3 2

Las otras tres reflexiones corresponden a productos de f y g:


Reflexión a través del eje Y :
 
1 2 3 4
= f g.
2 1 4 3

Reflexión a través del eje X:


 
1 2 3 4
= f 3 g.
4 3 2 1

Reflexión a través del eje 24:


 
1 2 3 4
= f 2 g.
3 2 1 4

Como dijimos anteriormente, D4 = {1, f , f 2 , f 3 , f g , f 2 g , f 3 g , g } es


un subgrupo de S4 conocido como grupo diédrico de grado 4. Nótese que
H = {1, g } ≤ K = {1, g , f 2 , f 2 g }. Además, K ⊴ D4 ya que
|D4 : K| = 2; H ⊴ K ya que |K : H | = 2, pero H no es subgrupo nor-
mal de D4 : f 3 g ( f 3 ) −1 = f 3 g f = f 2 g ∉ H . Así, la relación de normalidad
no es en general transitiva.

3. Homomorfismos de grupos
En esta sección se presenta el concepto de homomorfismo de grupos, así
como algunas de las propiedades fundamentales de estas funciones. Al fi-
nal, con ayuda del concepto de isomorfismo, se hará una clasificación de los
grupos cíclicos.
Subgrupos normales y homomorfismos · 47

Definición 3.3.1. Sean (G , ·) y (F , ·) dos grupos. Una función 𝜑 : G −→ F


tal que 𝜑(ab) = 𝜑(a) 𝜑(b), ∀a, b ∈ G se denomina un homomorfismo del
grupo G en el grupo F .

Si ambos grupos tienen notación aditiva, entonces la condición anterior


se escribe 𝜑(a + b) = 𝜑(a) + 𝜑(b). Veamos algunos ejemplos.

Ejemplo 3.3.2. Sea G = ℝ el grupo aditivo de los números reales y sea


F = ℝ∗ el grupo multiplicativo de los números reales no nulos. La función
f : ℝ −→ ℝ∗ definida por f (x) := e x es un homomorfismo de ℝ en ℝ∗ .

Ejemplo 3.3.3 (Homomorfismo trivial) . Sea (G , ·, 1) un grupo multipli-


cativo y sea (F , +, 0) un grupo con notación aditiva. La función de G en F
definida por f : G −→ F , f (x) = 0, es un homomorfismo. Además, la fun-
ción g : F −→ G definida por g (x) = 1 es un homomorfismo, denominada
también homomorfismo unitario.

Ejemplo 3.3.4 (Homomorfismo idéntico) . Sea (G , ·) un grupo. La función


iG : G −→ G de G definida por iG (x) := x es un homomorfismo.

Definición 3.3.5. Sea 𝜑 : G −→ F un homomorfismo de grupos.

(i) Sea 1 el elemento identidad del grupo F . El conjunto de elementos


de G cuya imagen es el elemento identidad 1 de F se denomina el
núcleo de 𝜑 y se denota por ker(𝜑):

ker(𝜑) := {g ∈ G | 𝜑(g) = 1}.

(i) Sea A ⊆ G. El conjunto de las imágenes de los elementos del conjunto


A se denomina imagen del conjunto A mediante 𝜑 y se denota por
𝜑(A):
𝜑(A) := {𝜑(a) | a ∈ A}.
En particular, el conjunto 𝜑(G) se denomina la imagen del homo-
morfismo 𝜑 y se simboliza también por Im(𝜑).

(iii) Sea B ⊆ F . El conjunto de elementos de G cuyas imágenes perte-


nencen al conjunto B se denomina imagen inversa de B mediante
𝜑:
𝜑−1 (B) := {g ∈ G | 𝜑(g) ∈ B}.

(iv) Se dice que 𝜑 es un homomorfismo inyectivo si 𝜑 es una función


inyectiva, es decir, para cualesquiera elementos x, y ∈ G se cumple

𝜑(x) = 𝜑(y) ⇔ x = y.
48 · Subgrupos normales y homomorfismos

(v) Se dice que 𝜑 es un homomorfismo sobreyectivo si Im (𝜑) = F .

(vi) Se dice que un grupo F es una imagen homomorfa de un grupo G si


existe un homomorfismo sobreyectivo de G en F .

(vii) Se dice que 𝜑 es un isomorfismo o también que G y F son grupos iso-


morfos, lo cual se denota por G  F , si 𝜑 es inyectivo y sobreyectivo.

Proposición 3.3.6. Sea 𝜑 : G −→ F un homomorfismo, entonces

(i) 𝜑 (1) = 1.

(ii) 𝜑 (x −1 ) = 𝜑(x) −1 , para cada x ∈ G.

(iii) ker(𝜑) ⊴ G.

(iv) La imagen de un subgrupo de G mediante 𝜑 es un subgrupo de F :

H ≤ G ⇒ 𝜑(H ) ≤ F .

(v) La imagen inversa de un subgrupo de F mediante 𝜑 es un subgrupo de G:

K ≤ F ⇒ 𝜑−1 (K) ≤ G.

(vi) La imagen de un subgrupo normal de G mediante 𝜑 es un subgrupo normal


de la imagen de 𝜑:

H ⊴ G ⇒ 𝜑(H ) ⊴ Im(𝜑).

(vii) La imagen inversa de un subgrupo normal de F mediante 𝜑 es un subgrupo


normal de G:
K ⊴ F ⇒ 𝜑−1 (K) ⊴ G.

(viii) 𝜑 es inyectivo ⇔ ker (𝜑) = {1}.

(ix) Sea H ⊴ G. La función j : G −→ G/H definida por j (x) := x = xH es


un homomorfismo sobreyectivo. j se denomina el homomorfismo canónico.

(x) 𝜑 es un isomorfismo si, y sólo si, existe una función 𝜃 : F −→ G tal que

𝜃 𝜑 = iG , 𝜑𝜃 = iF .

Además, 𝜃 es también un homomorfismo. 𝜃 se denomina el homomorfismo


inverso de 𝜑 y se denota por 𝜑−1 .
Subgrupos normales y homomorfismos · 49

(xi) Sea 𝛼 : F −→ M un homomorfismo. Entonces, la función 𝛼 𝜑 : G −→ M


es un homomorfismo.

Demostración. Todas las pruebas se reducen a aplicar directamente las defi-


niciones anteriores. □✓

Teorema 3.3.7. Sea G un grupo cíclico. Entonces,

(i) Si G es infinito, entonces G  ℤ.

(ii) Si G es finito de orden n, entonces G  ℤn .

Demostración. Es un ejercicio sencillo que se deja al lector. ✓


4. Ejercicios
1. Demuestre que en un grupo abeliano todos sus subgrupos son nor-
males.

2. Sea G un grupo y A un subconjunto no vacío de G. Sea x ∈ G el


conjunto:
Ax := x −1 Ax = x −1 ax | a ∈ A .


Ax se denomina el conjugado de A por x. Demuestre que el conju-


gado de un subgrupo de G mediante cualquier elemento x de G es
también un subgrupo de G. Demuestre que ∀x ∈ G, |x −1 Ax| = |A|.

3. Sea G un grupo, H un subgrupo de G y A un subconjunto no vacío


de G. Demuestre que

NH (A) := {x ∈ H | Ax = A} y CH (A) := {x ∈ H | xs = sx, ∀s ∈ A}

son subgrupos de H (NH (A) se llama el normalizador de A en H y


CH (A) se llama el centralizador de A en H ). Compruebe que CH (A) ⊴
NH (A).

4. Sea G un grupo y K ≤ G. Con las definiciones del ejercicio anterior,


NG (K) se denomina el normalizador de K en G y CG (K) el centra-
lizador de K. El centralizador de G se denota por Z (G) y se llama el
centro del grupo G. Demuestre que:

a) K ⊴ NG (K) y Z (G) es un grupo abeliano.


b) K ⊴ G ⇔ G = NG (K).
50 · Subgrupos normales y homomorfismos

c) Sea H ≤ G tal que K ⊴ H . Entonces H ⊆ NG (K).

5. Sea G un grupo, H ≤ G, A ≠ ∅ y A ⊆ G. Denotemos por F a la


familia de subconjuntos de G constituidos por los conjugados de A
con elementos de H , es decir, F := {Ax | x ∈ H }. Demuestre que
|F | = |H : NH (A)|.

6. Sea G un grupo y sea X un conjunto no vacío. Demuestre que


Z [Aplc(X , G)] = Aplc(X , Z (G)).

7. Demuestre que la intersección de dos subgrupos normales es un sub-


grupo normal. Generalice este resultado a una familia no vacía cual-
quiera de subgrupos normales.

8. Sea G un grupo y H ⊴ G. Demuestre que las relaciones de equivalen-


cia ≡1 y ≡2 definidas por a ≡1 b ⇔ ab −1 ∈ H y a ≡2 b ⇔ a −1 b ∈ H ,
son iguales, es decir, ∀a, b ∈ G , a ≡1 b ⇔ a ≡2 b.
Capítulo
cuatro
Teoremas de
estructura
Teoremas de estructura · 53

El concepto de homomorfismo e isomorfismo, así como los teoremas corres-


pondientes, son el objeto del presente capítulo. Por medio de ellos se pue-
den caracterizar las imágenes homomorfas de un grupo los cuales son una
herramienta clave para la clasificación de grupos, en particular, para la cla-
sificación de grupos finitos.

1. Teorema fundamental de homomorfismo


Se mostrará en esta sección que un grupo G tiene tantas imágenes homo-
morfas como grupos cocientes por subgrupos normales. Este es precisa-
mente el contenido del teorema fundamental de homomorfismo.

Teorema 4.1.1 (Teorema fundamental de homomorfismo) . Sea G un gru-


po cualquiera. Entonces, hay tantas imágenes homomorfas de G como subgrupos
normales tiene G (o lo que es lo mismo, como grupos cocientes de G) . Más exacta-
mente, si G ′ es una imagen homomorfa de G entonces existe un subgrupo normal H
de G tal que G ′  G/H . H es precisamente el núcleo del homomorfismo G −→ G ′.
Recíprocamente, dado un subgrupo normal H de G, G/H es una imagen homo-
morfa de G. El homomorfismo sobreyectivo requerido es el homomorfismo canónico
j : G −→ G/H .

Demostración. Sea G ′ una imagen homomorfa de G, con homomorfismo so-


breyectivo h : G −→ G ′, sea ker(h) el núcleo de h y sea j : G −→ G/ker(h) el
homomorfismo canónico de G sobre el grupo cociente G/ker(h). Se define
la función
h : G/ker(h) −→ G ′
mediante h(x) := h(x), donde x = x ker(h) es la clase de equivalencia (clase
lateral izquierda) determinada por el elemento x. h está bien definida, h es
sobre y h es inyectiva. Además, h es un homomorfismo de grupos. Final-
mente, ya se ha visto que la función canónica j es un homomorfismo sobre
de G en G/H . ✓

Corolario 4.1.2. Sea h : G −→ G ′ un homomorfismo de grupos. Entonces,


Im(h)  G/ker(h).

Ejemplo 4.1.3. (i) Determinemos todas las imágenes homomorfas del gru-
po aditivo de los números enteros (ℤ, +): según el teorema fundamental de
homomorfismo las imágenes homomorfas de (ℤ, +) son los subgrupos co-
ciente de ℤ por sus subgrupos normales. De esta manera, debemos deter-
minar todos los subgrupos normales H de ℤ y construir los grupos cociente
54 · Teoremas de estructura

G/H . Como (ℤ, +) es un grupo abeliano entonces cada uno de sus subgru-
pos es normal. Así pues, las imágenes homomorfas de ℤ son de la forma
ℤ/⟨n⟩ con n ≥ 0, es decir las imágenes de (ℤ, +) son ℤn con n ≥ 0.
(ii) Sea (ℝ, +, 0) el grupo de los números reales bajo la adición y sea
(U , ·, 1), con U = {z ∈ ℂ | |z| = 1}, el grupo multiplicativo de los complejos
de módulo 1. Nótese que

U = {cos 𝜃 + i sen 𝜃 | 𝜃 ∈ ℝ} = {e i𝜃 | 𝜃 ∈ ℝ}.

La función 𝜑 : ℝ −→ U definida por 𝜑(𝜃) = ei𝜃 es un homomorfismo: en


efecto, 𝜑(𝜃 1 + 𝜃 2 ) = ei (𝜃 1 +𝜃 2 ) = e i𝜃 1 · ei𝜃 2 . 𝜑 es obviamente un homomorfis-
mo sobreyectivo ya que cada complejo tiene determinado al menos un argu-
mento 𝜃. Según el teorema fundamental de homomorfismo U  ℝ/ker(𝜑);
ker(𝜑) = {𝜃 ∈ ℝ | cos 𝜃 + i sen 𝜃 = 1}; si 𝜃 ∈ ker(𝜑), entonces sen 𝜃 = 0,
luego 𝜃 = 2k𝜋, k ∈ ℤ. Recíprocamente, cada real de forma 𝜃 = 2k𝜋, k ∈ ℤ,
es un elemento de ker(𝜑), por lo tanto, ker(𝜑) = ⟨2𝜋⟩, grupo generado por
2𝜋; así U  ℝ/⟨2𝜋⟩.
(iii) Imágenes homomorfas de S3 : determinamos en primer lugar los
subgrupos de S3 . Puesto que |S3 | = 6 entonces S3 sólo puede tener subgru-
pos de orden 1, 2, 3 y 6: modificando lanotación que habíamos usado en
2 2
el ejemplo 1.2.9, escribamos ahora S3 = 1, f , f , g , f g , f g ,
   
1 2 3 1 2 3
f := = (1 2 3), g := = (2 3),
2 3 1 1 3 2
f 2 = (1 3 2), f g = (1 2), f 2 g = (1 3).

Subgrupos de S3 :
Subgrupos de orden 1: 1 = {1} es el único.
Subgrupos de orden 2: son cíclicos y por lo tanto generados por los ele-
mentos de orden 2: ⟨g⟩, ⟨ f g⟩ y ⟨ f 2 g⟩ son los subgrupos de orden 2.
Subgrupos de orden 3: son necesariamente cíclicos y son generados por
elementos de orden 3: ⟨ f ⟩ es el único subgrupo de orden 3.
Subgrupos de orden 6: S3 es el único.
Subgrupos normales de S3 :
Claramente 1 y S3 son normales. Además, puesto que |S3 : ⟨ f ⟩| = 2,
entonces ⟨ f ⟩ ⊴ S3 .
Para la determinación de subgrupos normales de orden 2 no sobra cons-
truir la tabla del grupo S3 :
Teoremas de estructura · 55

◦ 1 f f2 g fg f 2g
1 1 f f2 g fg f 2g
f f f2 1 fg f 2g g
f2 f2 1 f f 2g g fg
g g f 2g fg 1 f2 f
fg fg g f 2g f 1 f2
f 2g f 2g fg g f2 f 1

⟨g⟩ no es subgrupo normal de S3 ya que f g f −1 = f g f 2 = f 2 g ∉ ⟨g⟩;


⟨ f g⟩ no es subgrupo normal de S3 ya que

f 2 f g ( f 2 ) −1 = f 2 f g f = g f = f 2 g ∉ ⟨ f g⟩;

⟨ f 2 g⟩ no es subgrupo normal de S3 ya que

f f 2 g f −1 = g f 2 = f g ∉ ⟨f 2 g⟩.

En resumen,

S3 no tiene subgrupos normales de orden 2,


1, ⟨ f ⟩, S3 son los subgrupos normales de S3 .

Imágenes homomorfas de S3 : así, las imágenes homomorfas de S3 (salvo


isomorfismo) son S3 /1 = S3 , S3 /⟨f ⟩  ℤ2 (ya que |S3 /⟨f ⟩| = 36 = 2) y
S3 /S3  ℤ1 = {0} (grupo unitario).

2. Teorema de factorización
Definición 4.2.1. Sea 𝛼 : G1 −→ G2 un homomorfismo de grupos. Se dice
que el homomorfismo 𝛼 se puede factorizar a través del homomorfismo
j : G1 −→ G3 (o también a través del grupo G3 ) si existe un homomorfismo
𝜃 : G3 −→ G2 tal que 𝜃 j = 𝛼.

Teorema 4.2.2. Sea 𝛼 : G −→ G ′ un homomorfismo de grupos y sea H un


subgrupo normal de G. Entonces, 𝛼 se puede factorizar de una manera única a
través de G/H si, y sólo si, H ⊆ ker(𝛼).

Demostración. ⇒): sea H ⊴ G tal que 𝛼 se puede factorizar a través de


G/H . Esto quiere decir que existe un homomorfismo 𝜃 : G/H −→ G ′ tal
que 𝜃 j = 𝛼, con j : G −→ G/H el homomorfismo canónico. Sea x ∈ H ,
entonces 𝜃 j (x) = 𝛼 (x), por lo tanto, 𝜃 ( j (x)) = 𝜃 (x) = 𝜃 (1) = 1 = 𝛼 (x), es
decir, x ∈ ker(𝛼) y, de esta manera, H ⊆ ker(𝛼).
56 · Teoremas de estructura

⇐): supongamos que H ⊴ G tal que H ⊆ ker(𝛼). Definimos

𝜃 : G/H −→ G ′ , 𝜃 (x) := 𝛼 (x), con x := xH , x ∈ G.

𝜃 está bien definida: x = y, entonces x −1 y ∈ H , luego x −1 y ∈ ker(𝛼),


es decir, 𝛼 (x −1 y) = 1, con lo cual, 𝛼 (x) −1 𝛼 (y) = 1 y 𝛼 (x) = 𝛼 (y). Luego,
𝜃 (x) = 𝜃 (y).
𝜃 es homomorfismo: 𝜃 (xy) = 𝛼 (xy) = 𝛼 (x)𝛼 (y) = 𝜃 (x)𝜃 (y).
𝜃 j (x) = 𝜃 (x) = 𝛼 (x), para todo x ∈ G, luego 𝜃 j = 𝛼.
𝜃 es única: sea 𝛽 : G/H −→ G ′ un homomorfismo tal que 𝛽 j = 𝛼,
entonces 𝛽 j (x) = 𝛽 (x) = 𝛼 (x) = 𝜃 (x), luego 𝛽 = 𝜃. ✓

Usando la notación del teorema anterior, se tiene el siguiente resultado.

Corolario 4.2.3. (i) 𝜃 es inyectivo si, y sólo si, H = ker(𝛼). Además, 𝜃 es


sobreyectivo si, y sólo si, 𝛼 es sobreyectivo.
𝛼
(ii) Cada homomorfismo sobreyectivo G − → G ′ se puede factorizar de manera
única a través del grupo cociente G/ker(𝛼). Además, en este caso 𝜃 es un
isomorfismo.

Demostración. (i) Supongamos que 𝜃 es un homomorfismo inyectivo y sea


x ∈ ker(𝛼). Entonces 𝛼 (x) = 1 = 𝜃 (x), es decir, x = 1, de donde x ∈ H ,
lo cual prueba que ker(𝛼) ⊆ H , por lo tanto, H = ker(𝛼). Recíprocamente,
sea x ∈ ker(𝜃), entonces 𝜃 (x) = 𝛼 (x) = 1, es decir, x ∈ ker(𝛼), luego x = 1.
Puesto que 𝛼 = 𝜃 ◦ j, entonces, como 𝜃 sobreyectivo, 𝛼 lo es, ya que
j : G −→ G/H es el homomorfismo canónico.
Sea ahora 𝛼 sobreyectivo y sea y ∈ G ′. Entonces, existe x ∈ G tal que
𝛼 (x) = y, luego 𝜃 (x) = 𝛼 (x) = y, es decir, 𝜃 es sobreyectivo.
(ii) Es consecuencia directa del teorema anterior. ✓

Las afirmaciones siguientes evidencian la utilidad del teorema de facto-


rización.

Corolario 4.2.4. Sea 𝛼 : G −→ K un homomorfismo sobreyectivo de grupos y


sea H ⊴ G. Entonces 𝛼 induce el homomorfismo sobreyectivo

𝛼 ′ : G/H −→ K/𝛼 (H )

definido por 𝛼 ′ (x) := 𝛼 (x), donde x = xH y 𝛼 (x) := 𝛼 (x)𝛼 (H ). Además, 𝛼 ′ es


inyectivo (y por lo tanto un isomorfismo) si, y sólo si, ker(𝛼) ⊆ H .

Demostración. Ejercicio para el lector. ✓



Teoremas de estructura · 57

Corolario 4.2.5. Sea 𝛼 : G −→ K un homomorfismo de grupos y sea H un


subgrupo normal de K. Entonces, 𝛼 induce el homomorfismo inyectivo

𝛼 ′ : G/𝛼 −1 (H ) −→ K/H

definido por 𝛼 ′ ( x̃) := 𝛼 (x), x̃ = x𝛼 −1 (H ), 𝛼 (x) := 𝛼 (x)H . Además, si 𝛼 es


sobreyectivo, entonces 𝛼 ′ es un isomorfismo.

Demostración. Se deja como ejercicio al lector. ✓


Corolario 4.2.6. Sea G un grupo y sean H y K subgrupos normales de G tales


que H ⊆ K. Entonces se tiene el homomorfismo sobreyectivo

𝜃 : G/H −→ G/K

definido por 𝜃 (x) := x̃ , donde x := xH y x̃ := xK.

Demostración. Ejercicio para el lector. ✓


3. Teorema de correspondencia
Sea G un grupo y H un subgrupo normal de G. Consideremos el grupo
cociente G/H y el homomorfismo canónico j : G −→ G/H . Sea X un
subconjunto de G que contiene H , H ⊆ X ⊆ G. Según vimos, la imagen de
X mediante j es

j (X) = { j (x) | x ∈ X } = {x | x ∈ X }.

Denotamos este conjunto por X/H . Sea ahora K un subgrupo de G que


contiene H , H ≤ K ≤ G. Entonces,

j (K) = { j (x) | x ∈ K} = {x | x ∈ K} = K/H .

Además, como H ⊴ K, podemos construir el grupo cociente de K por H ,


K/H , por lo tanto, la notación K/H para j (K) es adecuada. Podemos ahora
demostrar el siguiente teorema.

Teorema 4.3.1 (Teorema de correspondencia) . Sea G un grupo y sea H un


subgrupo normal de G. Sea L(G , H ) la familia de subgrupos de G que contienen
H
L(G , H ) := {K ≤ G | H ⊆ K}.
58 · Teoremas de estructura

Sea L(G/H ) la familia de subgrupos de G/H . Entonces, existe una correspondencia


biyectiva entre L(G , H ) y L(G/H ), la cual está dada por
𝜑 : L(G , H ) −→ L(G/H )
𝜑(K) := j (K) = K/H = {x ∈ G/H | x ∈ K}.
Además, si N es un subgrupo normal de G que contiene a H , entonces
𝜑(N ) ⊴ G/H . Por último, si A y B son elementos de L(G , H ) tales que A ≤ B,
en otras palabras, si H ≤ A ≤ B ≤ G, entonces 𝜑(A) ≤ 𝜑(B) y
|B : A| = |𝜑(B) : 𝜑(A)|.
Demostración. Nótese en primer lugar que 𝜑(K) es realmente un subgrupo
de G/H ya que j es un homomorfismo.
𝜑 es una función inyectiva: supongamos que 𝜑(K1 ) = 𝜑(K2 ), entonces
K1 /H = K2 /H . Sea x ∈ K1 , se tiene que x ∈ K1 /H , con lo cual x ∈ K2 /H
y x = y, para algún y ∈ K2 , es decir, x −1 y ∈ H ⊆ K2 , de donde x ∈ K2 . En
total, K1 ⊆ K2 . Análogamente se prueba que K2 ⊆ K1 y entonces K1 = K2 ,
con lo cual 𝜑 es 1 − 1.
𝜑 es una función sobreyectiva: sea M un subgrupo de G/H ; como hemos
visto j −1 (M) es un subgrupo de G. Veamos en primer lugar que
H ≤ j −1 (M): sea x ∈ H , entonces j (x) = x = 0 ∈ M. Así, j −1 (M) es
un elemento de L(G , H ). Finalmente, notemos que j ( j −1 (M)) = M por
ser j una función sobreyectiva. Esto completa la prueba de que 𝜑 es una
función sobreyectiva.
Si N es un subgrupo normal de G que contiene H , entonces según vimos
la imagen de cada subgrupo normal mediante un homomorfismo es nueva-
mente un subgrupo normal en la imagen. Por tanto, 𝜑(N ) = j (N ) ⊴ G/H .
Sea 𝜌 la relación de equivalencia inducida en B por el subgrupo A:
x, y ∈ B : x 𝜌y ⇔ xy −1 ∈ A.
Denotemos por [x] la clase de equivalencia correspondiente al elemento
x ∈ B mediante la relación 𝜌. Sea 𝜃 la relación de equivalencia inducida en
B/H por el subgrupo A/H :
x, y ∈ B/H : x𝜃 y ⇔ x y −1 ∈ A/H .
(x = H x, x ∈ B). Denotemos por [x] la clase de equivalencia determinada
por el elemento x de B/H mediante la relación 𝜃.
Sean C1 = B/ 𝜌 y C2 = (B/H )/𝜃 los respectivos conjuntos cocientes. Se
quiere probar que |C1 | = |C2 |: definimos
F : C1 −→ C2
F ([x]) := [x].
Teoremas de estructura · 59

F está bien definida: [x] = [y] implica xy −1 ∈ A luego xy −1 ∈ A/H , es


decir, x y −1 ∈ A/H , con lo cual [x] = [y] y F ([x]) = F ([y]).
F es inyectiva: F ( [x]) = F ( [y]) implica [x] = [y], de donde
x y −1 ∈ A/H , por lo tanto, xy −1 ∈ A, luego [x] = [y]. F es obviamente
sobreyectiva. ✓

4. Teoremas de isomorfismo
El primer teorema fundamental de isomorfismo combinado con el teorema
de correspondencia permite determinar las imágenes homomorfas de ℤn ,
n ≥ 2.

Teorema 4.4.1 (Primer teorema fundamental de isomorfismo) . Sea G


un grupo y sean H y K subgrupos normales de G tales que H ≤ K. Entonces,
K/H ⊴ G/H y se tiene el isomorfismo

(G/H )/(K/H )  G/K.

Demostración. Podemos aplicar el teorema de factorización y el teorema


fundamental de homomorfismo para demostrar este importante teorema.
En efecto, el homomorfismo canónico j : G −→ G/K se puede factorizar a
través del homomorfismo j1 : G −→ G/H debido a que H ⊆ K = ker( j).
Denotamos los elementos de G/H mediante x := xH y los de G/K por
x̃ := xK, entonces 𝜃 : G/H −→ G/K está definido por 𝜃 (x) := x̃; puesto
que j es sobreyectivo, entonces 𝜃 también lo es, y, según el teorema funda-
mental de homomorfismo, (G/K)  (G/H )/ker(𝜃), pero

ker(𝜃) = {x ∈ G/H | x̃ = 0̃} = {x ∈ G/H | x ∈ K} = K/H .

Así, (G/H )/(K/H )  G/K. ✓


Teorema 4.4.2 (Segundo teorema fundamental de isomorfismo) . Sean G


un grupo, H ≤ G y K ⊴ G. Entonces,

H K/K  H /(H ∩ K).

Demostración. En primer lugar H K = KH : si hk ∈ H K, ya que K ⊴ G, se


tiene que hk = (hkh−1 )h ∈ KH y así, H K ⊆ KH . Sea ahora kh ∈ KH ,
entonces kh = h(h−1 kh) ∈ H K, luego KH ⊆ H K, y en consecuencia,
H K = KH . Esto garantiza que H K es un subgrupo de G. Como K ⊴ G,
60 · Teoremas de estructura

entonces K ⊴ H K y tiene sentido el grupo factor H K/K. Definimos la


función

f : H −→ H K/K
h ↦−→ hK.

Probemos que f es un homomorfismo sobreyectivo con núcleo


ker( f ) = H ∩ K:

f (h1 h2 ) = (h1 h2 )K = h1 Kh2 K = f (h1 ) f (h2 ).

Sea x ∈ H K/K. Entonces x es de la forma x = hkK = hK = f (h). Esto


prueba que f es sobre. Sea x ∈ ker( f ), entonces f (x) = xK = 1K, es decir,
x ∈ K con lo cual x ∈ H ∩ K. Esto establece que ker( f ) = H ∩ K y el
teorema está demostrado. ✓

Ejemplo 4.4.3 (Imágenes homomorfas de ℤn , n ≥ 0) . Para n = 0, ℤ0 = ℤ,


según vimos, las imágenes homomorfas son de la forma ℤn , n ≥ 0. Sea
n = 1, ℤ1 = 0, grupo con un solo elemento. Por tanto, las únicas imágenes
homomorfas de ℤ1 son los grupos unitarios.
Sea n ≥ 2, ℤn = ℤ/⟨n⟩. Las imágenes homomorfas de ℤn según el teo-
rema fundamental de homomorfismo son de la forma ℤn /H , donde H es
subgrupo normal de ℤn . Como ℤn es un grupo abeliano, entonces todos sus
subgrupos son normales. Según el teorema de correspondencia los subgru-
pos de ℤn = ℤ/⟨n⟩ son de la forma K/⟨n⟩, donde K es un subgrupo de ℤ
que contiene al subgrupo ⟨n⟩. Los subgrupos de ℤ son de la forma ⟨m⟩. Así,
los subgrupos de ℤn = ℤ/⟨n⟩ son de la forma ⟨m⟩ /⟨n⟩, donde ⟨m⟩ ⊇ ⟨n⟩.
Nótese que si ⟨n⟩ ⊆ ⟨m⟩, entonces n = km, k ∈ ℤ, es decir, m|n. Recí-
procamente, si m|n entonces ⟨n⟩ ⊆ ⟨m⟩. En conclusión, los subgrupos de
ℤn = ℤ/⟨n⟩ son de la forma ⟨m⟩ /⟨n⟩ con m|n. Por tanto, las imágenes ho-
momorfas de ℤn = ℤ/⟨n⟩ son de la forma ℤ/⟨n⟩ /⟨m⟩ /⟨n⟩  ℤ/⟨m⟩ = ℤm .
Así, las imágenes homomorfas de ℤn son los subgrupos ℤm con m|n. Por
ejemplo, las imágenes homomorfas de ℤ12 son: ℤ1 = 0, ℤ2 , ℤ3 , ℤ4 , ℤ6 ,
ℤ12 .

Ejemplo 4.4.4. Sea G un grupo no unitario y sea H ⊴ G. Se dice que H


es un subgrupo normal maximal de G, si para cualquier K ≤ G se cumple
que

H ≤ K y K ⊴ G ⇔ K = H o K = G,

en otras palabras, los únicos subgrupos normales de G que contienen H


son G y H . Sea ⟨G , ·, 1⟩ un grupo simple, es decir, G es no trivial y los
Teoremas de estructura · 61

únicos subgrupos normales de G son los triviales: {1} y G. Probemos que


H ⊴ G es maximal si, y sólo si, G/H es simple: sea W un subgrupo normal
de G/H , según el teorema de correspondencia existe en G un subgrupo
normal K que contiene H . Por ser H normal maximal K = H o K = G, es
decir W = K/H = H /H o W = G/H , de manera equivalente, los únicos
subgrupos normales de G/H son los triviales. Sea ahora K ≤ G, K ⊴ G,
H ≤ K. Entonces, según el teorema de correspondencia, K/H ⊴ G/H ,
pero como este último es simple, entonces K/H = {1} o K/H = G/H ,
luego K/H = H /H o K/H = G/H , por lo tanto, K = H o K = G, con lo
cual H es maximal normal.

Ejemplo 4.4.5 (Imágenes homomorfas del cuarto grupo de Klein) . El


cuarto grupo de Klein está dado por:

V = {1, a, b, ab}, a 2 = 1, b 2 = 1, ab = ba.

Subgrupos de V : V es un grupo de orden 4. Por tanto, sus subgrupos son


de órdenes 1, 2, 4.
Subgrupo de orden 1: H1 = {1}.
Subgrupos de orden 2: son necesariamente cíclicos: H2 = ⟨a⟩ = {1, a},
K2 = ⟨b⟩ = {1, b}, L2 = ⟨ab⟩ = {1, ab}.
Subgrupos de orden 4: V es el único subgrupo de orden 4.
Imágenes homomorfas deV : de lo anterior obtenemos que todos los subgru-
pos deV son normales. Así, las imágenes homomorfas deV son:V /H1  V ,
V /H2  V /K2  V /L2  ℤ2 , V /V = 1.
(iv) Notemos que V es un grupo abeliano de orden 4 al igual que ℤ4 .
Sin embargo, V no es isomorfo a ℤ4 ya que este último es cíclico. Tene-
mos entonces dos grupos distintos de orden 4. Preguntamos si existen otros
grupos de orden 4 diferentes (no isomorfos) a ℤ4 y V . La respuesta es no:
como V es de orden 4, V es necesariamente abeliano. En efecto, probemos
que si G es un grupo de orden ≤ 5, entonces G es abeliano:
Si |G | = 1, entonces G es un grupo unitario, luego abeliano.
Si |G | = 2, entonces G es un grupo cíclico, luego G  ℤ2 , de donde G es
abeliano.
Si |G | = 3, entonces G es cíclico, luego G  ℤ3 y G es abeliano.
Sea |G | = 4, si G es cíclico, entonces G  ℤ4 es abeliano.
Si |G | = 5, entonces G es un grupo cíclico, luego G  ℤ5 es abeliano.
Volvemos al caso |G | = 4 y G no es cíclico. Entonces, cada elemento de
G es de orden 1 o 2 (no hay elementos de orden 4, ya que de lo contrario
G sería cíclico). De esto concluimos que G = {1, a, b, ab}, a2 = 1, b 2 = 1,
ab = ba, es decir, G es el cuarto grupo de Klein.
62 · Teoremas de estructura

Ejemplo 4.4.6 (Imágenes homomorfas de D4 ) . Recordemos que


D4 = {1, f , f 2 f 3 , g , f g , f 2 g , f 3 g }. La tabla de D4 ayuda a determinar
los subgrupos de D4 (véase el capítulo 3).
Subgrupos de D4 : 1 es el único subgrupo de orden 1. Los subgrupos de
orden 2 son los determinados por las permutaciones de orden 2:

⟨g⟩, ⟨ f 2 ⟩, ⟨ f g⟩, ⟨ f 2 g⟩, ⟨ f 3 g⟩ son los subgrupos de orden 2.

Los subgrupos de orden 4 son de dos tipos, unos isomorfos a ℤ4 y otros


isomorfos a V , el cuarto grupo de Klein. Elementos de orden 4: f , f 3 . Pero
⟨ f ⟩ = ⟨ f 3 ⟩  ℤ4 . Subgrupos isomorfos a V = {1, a, b, ab}, a 2 = 1, b 2 = 1,
ab = ba. a puede tomar los valores f 2 , g , f g , f 2 g , f 3 g; lo mismo ocurre
para b. Se presentan entonces 5·4 2 = 10 combinaciones posibles:
1) a = f , b = g, es decir, K4 = {1, f 2 , g , f 2 g };
2

2) a = f 2 , b = f g, es decir, H4 = {1, f 2 , f g , f 3 g };
3) a = f 2 , b = f 2 g, es decir, K4 ;
4) a = f 2 , b = f 3 g, es decir, H4 ;
5) a = g, b = f g, descartado ya que g ( f g) ≠ ( f g)g;
6) a = g, b = f 2 g, es decir, K4 ;
7) a = g, b = f 3 g, descartado ya que g ( f 3 g) ≠ ( f 3 g)g;
8) a = f g, b = f 2 g, descartado ya que ( f g)( f 2 g) ≠ ( f 2 g)( f g);
9) a = f g, b = f 3 g, es decir, H4 ;
10) a = f 2 g, b = f 3 g, descartado ya que ( f 2 g)( f 3 g) ≠ ( f 3 g)( f 2 g).
Subgrupos de orden 4: isomorfos a ℤ4 : ⟨ f ⟩; isomorfos a V : K4 , H4 .
Único subgrupo de orden 8: D4 .
En resumen se obtiene lo siguiente:

⟨ f ⟩  ℤ4 ; K4  H4  V ;
⟨g⟩  ⟨ f 2 g⟩  ⟨ f 2 ⟩  ⟨f 3 g⟩  ⟨ f g⟩  ℤ2 .

Subgrupos normales de D4 : 1 y D4 son automáticamente subgrupos nor-


males de D4 . Además, K4 , H4 y ⟨ f ⟩ son también normales ya que su índice
en D4 es 2.
⟨g⟩ no es subgrupo normal de D4 ya que f −1 g f = f 3 g f = f 2 g ∉ ⟨g⟩;
⟨ f g⟩ no es subgrupo normal de D4 ya que g −1 ( f g)g = f 3 g ∉ ⟨ f g⟩;
⟨ f 2 g⟩ no es subgrupo normal de D4 ya que f −1 ( f 2 g) f = g ∉ ⟨ f 2 g⟩;
⟨ f 3 g⟩ no es subgrupo normal de D4 ya que f −1 ( f 3 g) f = f g ∉ ⟨ f 3 g⟩;
⟨ f 2 ⟩ ⊴ D4 ya que f −1 f 2 f = f 2 ; ( f 2 ) −1 f 2 f 2 = f 2 ; ( f 3 ) −1 f 2 f 3 = f 2 ;
g f 2 g = f 2;
−1

( f g) −1 f 2 ( f g) = f 2 ; ( f 2 g) −1 f 2 ( f 2 g) = f 2 ; ( f 3 g) −1 f 2 ( f 3 g) = f 2 .
Teoremas de estructura · 63

En resumen, los subgrupos normales de D4 son

1, D4 , ⟨ f 2 ⟩, ⟨ f ⟩, K4 , H4 .

Imágenes homomorfas de D4 : salvo isomorfismo tenemos:

D4 /1 = D4 ; D4 /⟨f ⟩ = ℤ2 ; D4 /K4  D4 /H4  ℤ2 ; D4 /D4 = 1.

Para ⟨ f 2 ⟩ se tiene que D4 /⟨ f 2 ⟩  ℤ4 o D4 /⟨ f 2 ⟩  V . La primera po-


sibilidad es descartada ya que en D4 /⟨f 2 ⟩ no hay elementos de orden 4:
en efecto, en D4 todos los elementos salvo 1, f 2 , f 3 son de orden 2. Ade-
más, para estos últimos se tiene que |1| = 1, | f | = 2, | f 3 | = 2. Por tanto,
D4 /⟨f 2 ⟩  V ; esta es la otra imagen homomorfa de D4 .

Ejemplo 4.4.7 (Imágenes homomorfas de Q8 ) . El grupo de los cuaternio-


nes de Hamilton Q8 es de orden 8 y puede ser definido por las siguientes
relaciones:

Q8 = ⟨a, b | a4 = 1, b 2 = a2 , bab −1 = a −1 ⟩,
Q8 = {1, a, a2 , a3 , b, ab, a2 b, a3 b}.

La tabla para Q8 viene dada por:

◦ 1 a a2 a3 b ab a2b a3b
1 1 a a2 a3 b ab a2b a3b
a a a2 a3 1 ab a2b a3b b
a2 a2 a3 1 a a2b a3b b ab
a3 a3 1 a a2 a3b b ab a2b
b b a3b a2b ab a2 a 1 a3
ab ab b a3b a2b a3 a2 a 1
a2b a2b ab b a3b 1 a3 a2 a
a3b a3b a2b ab b a 1 a3 a2

Adicionalmente,

ba = a −1 b = a 3 b; ba 2 = (ba)a = (a3 b)a = a3 (ba) = a 3 (a 3 b) = a 2 b; etc.

Subgrupos de Q8 : los subgrupos de Q8 tienen orden 1, 2, 4, 8:


Subgrupo de orden 1: {1};
Subgrupo de orden 8: Q8 ;
Subgrupos de orden 2: cíclicos y están generados por los elementos de
orden 2: ⟨a2 ⟩ es el único subgrupo de orden 2;
64 · Teoremas de estructura

Subgrupos de orden 4: cíclicos: ⟨a⟩ = ⟨a 3 ⟩; ⟨b⟩ = ⟨a2 b⟩, ⟨ab⟩ = ⟨a3 b⟩; no
cíclicos: son de la forma V = {1, x, y, xy}, donde x 2 = y 2 = 1, xy = yx. Pero
en Q8 sólo hay un elemento de orden 2. Por tanto, Q8 no tiene subgrupos
de orden 4 no cíclicos.
Subgrupos normales de Q8 : los subgrupos triviales 1 y Q8 son normales.
Los subgrupos de orden 4 ⟨a⟩, ⟨b⟩ y ⟨ab⟩ son también normales por ser de
índice 2.
⟨a2 ⟩ = {a 2 , 1}:

1a 2 1−1 = a2 ; aa2 a−1 = aa 2 a 3 = a 2 ;


a2 a2 a2 = a2 ; a3 a2 (a3 ) −1 = a 3 a 2 a = a2 ;
ba 2 b −1 = a2 ; aba2 (ab) −1 = a 2 ;
a2 ba 2 (a2 b) −1 = a 2 ; a 3 ba 2 (a 3 b) −1 = a2 .

Luego ⟨a2 ⟩ ⊴ Q8 . Así, en Q8 todos sus subgrupos son normales.


Imágenes homomorfas de Q8 :

Q8 /1  Q8 ; Q8 /⟨a⟩  Q8 /⟨b⟩  Q8 /⟨ab⟩  ℤ2 ;


Q8 /Q8  ℤ1 ; Q8 /⟨a2 ⟩  V .

Este último isomorfismo se tiene porque en Q8 /⟨a 2 ⟩ no hay elementos de


orden 4:

|1| = 1; |a| = 2 : a2 = a 2 = 1;
2
|a2 | = 1; |a 3 | = 2 : (a3 ) 2 = a6 = a2 = 1; |b| = 2 : b = b 2 = a 2 = 1,
2
|ab| = 2 : ab = (ab) 2 = a 2 = 1; |a2 b| = 2 : (a2 b) 2 = (a 2 b) 2 = 1;
|a3 b| = 2 : (a 3 b) 2 = (a 3 b) 2 = a2 = 1.

Matricialmente Q8 se puede interpretar como Q8 = ⟨A, B⟩,


  
i 0 0 i
A= , B= ,
0 −i i 0

donde i ∈ ℂ, i 2 = −1, A4 = E, B2 = A2 , BAB−1 = A−1 .


Nótese que Q8 y D4 no son isomorfos, ya que en Q8 hay 6 elementos
diferentes de orden 4: a, a3 , b, a2 b, ab, a 3 b; en cambio en D4 sólo hay 2:
f , f 3 . Otra forma de explicar esto es que todos los subgrupos de Q8 son
normales, mientras que en D4 el subgrupo ⟨g⟩ no es normal.
Teoremas de estructura · 65

Centro de Q8 : a ∉ Z (Q8 ) ya que ab ≠ ba, luego ⟨a⟩ ≠ Z (Q8 );


b ∉ Z (Q8 ), con lo cual Z (Q8 ) ≠ ⟨b⟩; ab ∉ Z (Q8 ) ya que (ab)a ≠ a(ab),
luego Z (Q8 ) ≠ ⟨ab⟩. Según lo anterior, Z (Q8 ) ≠ Q8 . Nótese que

Z (Q8 ) = ⟨a 2 ⟩  ℤ2 .

5. Ejercicios
1. Calcule las imágenes homomorfas del grupo GL2 (ℝ).

2. ¿Cuántos homomorfismos no triviales hay de D4 en ℤp , donde p es


primo?

3. ¿Cuántos homomorfismos no triviales hay de Q8 en ℤp , donde p es


primo?

4. Demuestre el corolario 4.2.4.

5. Demuestre el corolario 4.2.5.

6. Demuestre el corolario 4.2.6.


Capítulo
cinco
Automorfismos
Automorfismos · 69

Los homomorfismos biyectivos de un grupo G en sí mismo se conocen co-


mo los automorfismos de G. Estas funciones conforman un grupo que tiene
información importante relativa al grupo G.

1. Automorfismos interiores
Estudiamos en esta sección la relación entre los automorfismos de un grupo,
sus automorfismos interiores y su centro. Recordemos que si G es un grupo,
su centro simbolizado por Z (G) es un subgrupo normal de G el cual está
definido por
Z (G) := {x ∈ G | xa = ax para cada a ∈ G} .
Notemos que G es abeliano si, y sólo si, G = Z (G).
Antes de demostrar el primer resultado importante de esta sección, de-
finamos los automorfismos y, en particular, los automorfismos interiores de
un grupo.
Definición 5.1.1. Sea (G , ·, 1) un grupo, un automorfismo de G es un
homomorfismo biyectivo de G en sí mismo. Para x ∈ G la función definida
por
fx : G : −→ G
a ↦−→ x −1 ax
es un automorfismo de G y se denomina automorfismo interior de G de-
terminado por x. Aut(G) es la colección de automorfismos de G e Int(G) es
el conjunto de automorfismos interiores de G.
Teorema 5.1.2. Sea (G , ·, 1) un grupo. Entonces,
(i) Aut(G) es un subgrupo del grupo S (G) de funciones biyectivas de G en G.

(ii) Int(G) ⊴ Aut(G).


Demostración. (i) La primera afirmación es evidente.
(ii) Int(G) ≤ Aut(G): Int(G) ≠ ∅ ya que iG = f1 ∈ Int(G). Además, si
x, y ∈ G entonces, fx ◦ fy = fyx , fx−1 = fx−1 .
Int(G) ⊴ Aut(G): sea x ∈ G, h : G −→ G un automorfismo cualquiera
de G. Entonces para cada a ∈ G,
h−1 fx h(a) = h−1 ( fx (h(a))) = h−1 (x −1 h(a)x) = h−1 (x −1 )ah−1 (x)
= (h−1 (x)) −1 ah−1 (x) = fh−1 (x) (a).
Es decir, h−1 fx h = fh−1 (x) ∈ Int(G). ✓

70 · Automorfismos

Teorema 5.1.3. Sea G un grupo cualquiera. Entonces,

G/Z (G)  Int(G).

Demostración. Consideremos la función

𝜑 : G −→ Int(G)
x ↦−→ fx−1 .

𝜑 es un homomorfismo: 𝜑(xy) = f(xy) −1 = fy−1 x−1 = fx−1 ◦ fy−1 = 𝜑(x) ◦ 𝜑(y).


𝜑 es evidentemente sobreyectiva. Por último, veamos que
ker(𝜑) = Z (G): sea x ∈ ker(𝜑), entonces fx−1 = iG , luego xax −1 = a, para
cada a ∈ G, de donde x ∈ Z (G). Recíprocamente, si x ∈ Z (G) entonces
x ∈ ker (𝜑). Por el teorema fundamental de homomorfismo se tiene que
G/Z (G)  Int(G). ✓

Corolario 5.1.4. G es abeliano si, y sólo si, Int(G) = {iG }.

2. Teorema de Cayley
La importancia del teorema de Cayley radica en parte en que determina la
cota superior n!n para el número de grupos finitos no isomorfos de orden


n.

Teorema 5.2.1. Sea G un grupo y sea S (G) el grupo de funciones biyectivas de


G en G. Entonces G es isomorfo a un subgrupo de S (G).

Demostración. Considérese la función

Ψ : G −→ S (G)

definida por Ψ(x) := 𝜚x , donde 𝜚x : G −→ G , 𝜚x (a) := xa. 𝜚x ∈ S (G)


para cada x ∈ G: 𝜚x (a) = 𝜚x (b), por lo tanto, xa = xb, es decir, 𝜚x es 1 − 1.
Sea y ∈ G, entonces y = 𝜚x (x −1 y). Ψ es un homomorfismo: Ψ(xy) = 𝜚xy ,
𝜚xy (a) = xya = 𝜚x ( 𝜚y (a)), luego 𝜚xy = 𝜚x · 𝜚y = Ψ(x)Ψ(y). Ψ es inyectiva:
Ψ(x) = Ψ(y), entonces, x1 = y1, es decir, x = y. ✓

Corolario 5.2.2. Sea n ≥ 1. Entonces, existen a lo sumo n!n grupos no isomór-




ficos de orden n.

Demostración. Sea G un grupo finito de orden n. Entonces, G es isomorfo a


un subgrupo de Sn (recordemos que Sn denota el grupo de funciones biyec-
tivas de {1, 2, . . . , n} en si mismo, véase el ejemplo 1.2.9). Pero Sn tiene
Automorfismos · 71

un número finito de subgrupos de orden n, este número es menor que n!n .




Nótese que el problema de determinar todos los grupos no isomorfos de


orden n se reduciría a determinar todos los subgrupos no isomorfos de Sn
con n elementos. ✓

3. Ejemplos
Ejemplo 5.3.1 (Automorfismos de grupos cíclicos) . (i) Grupo cíclico infi-
nito ℤ: sea f ∈ Aut(ℤ). Como f es un automorfismo, la imagen de cada
generador de ℤ es nuevamente un generador de ℤ. Más generalmente, si
G es un grupo cíclico con generador a y f ∈ Aut (G), entonces f (a) es un
generador de G. En efecto, dado x ∈ G existe y ∈ G tal que x = f (y), luego
x = f (a t ) = f (a) t , con t ∈ ℤ.
Puesto que ℤ tiene sólo dos generadores entonces se presentan dos po-
sibilidades para f , f (1) = 1 ó f (1) = −1. En el primer caso, f (k) = k, en el
segundo, f (k) = −k, para cada k, por lo tanto, Aut(ℤ)  ℤ2 .
(ii) Grupo cíclico finito de orden n, ℤn : recordemos que el grupo ℤn se
obtuvo a partir de ℤ por medio de la relación de equivalencia

a ≡ b ⇔ n|(a − b), a, b ∈ ℤ.

En otras palabras, ℤn es el grupo cociente ℤ/⟨n⟩. En ℤn se puede definir un


producto y convertirlo en un semigrupo multiplicativo:

r s = rs, para 0 ≤ r , s < n.

Es sencillo verificar que el producto está correctamente definido. Además,


este producto es asociativo con elemento neutro 1, luego se tiene el mo-
noide (ℤn , ·, 1). Asociado a todo monoide se tiene su grupo de elementos
invertibles ℤ∗n . Nótese que

ℤ∗n = {r | (r , n) = 1, 1 ≤ r < n} .

En efecto,

r ∈ ℤ∗n ⇔ ∃ s ∈ ℤn tal que r s = 1 ⇔ rs = 1 ⇔ n| (rs − 1)


⇔ rs − 1 = nk, con k ∈ ℤ ⇔ (r , n) = 1.

Con la observación anterior queremos probar que Aut(ℤn )  ℤ∗n : sea


h : ℤn −→ ℤn un automorfismo de ℤn . Como 1 genera a ℤn , entonces
h(1) es un generador de ℤn . Así pues, tenemos tantos automorfismos como
72 · Automorfismos

generadores tiene ℤn . Pero nótese que r genera ℤn si, y sólo si, (r , n) = 1.


Podemos entonces definir

𝜃 : Aut(ℤn ) −→ ℤ∗n
h ↦−→ 𝜃 (h) = r ,

donde r = h(1).
𝜃 es un homomorfismo: sean f y h automorfismos de ℤn tales que
f (1) = r, h(1) = s. Nótese que

𝜃 (h ◦ f ) = (h ◦ f ) (1) = h( f (1)) = h(r) = h(r1) = rh(1)


= rs = rs1 = rs = sr = sr = 𝜃 (h) ◦ 𝜃 ( f ) .

𝜃 es inyectiva: sea h ∈ Aut(ℤn ) con 𝜃 (h) = 1, entonces h(1) = 1 y


h(r) = r, para cada 0 ≤ r < n. Por lo tanto, h = iℤn .
𝜃 es sobre: sea r ∈ ℤ∗n y sea h definido por h(s) := sr. Nótese que h(1) = r
y h ∈ Aut(ℤn ), con lo cual 𝜃 (h) = r.

Ejemplo 5.3.2. El grupo de automorfismos de un grupo finito es finito:


sea G un grupo de orden n. Nótese que Aut(G) ≤ S (G)  Sn , luego
| Aut(G)| | |Sn | = n!. Más exactamente, | Aut(G)| | (n − 1)! ya que para
cada f ∈ Aut(G), f (1) = 1.

Ejemplo 5.3.3. El grupo de automorfismos de un grupo conmutativo pue-


de ser no conmutativo: consideremos el cuarto grupo de Klein
V = {1, a, b, ab}, a2 = 1, b 2 = 1, ab = ba. Según el ejemplo anterior
| Aut(V )| = 1, 2, 3, 6.
Fácilmente se comprueba que las siguientes funciones son automorfis-
mos de V y además diferentes:
   
1 a b ab 1 a b ab
iG = , f := ,
1 a b ab 1 b ab a
   
1 a b ab 1 a b ab
g := , f2 = ,
1 a ab b 1 ab a b
   
1 a b ab 1 a b ab
fg = , f 2g = .
1 b a ab 1 ab b a

Entonces, Aut(V )  S3 .

Ejemplo 5.3.4. Dos grupos no isomorfos pueden tener grupos de auto-


morfismos isomorfos: Aut(ℤ3 )  ℤ2  Aut(ℤ).
Automorfismos · 73

Ejemplo 5.3.5. Aut(D4 ): en el capítulo 6 estudiaremos los automorfismos


del grupo diédrico Dn . Según se verá allá, |D4 | = 4𝜑(4) = 8, Int(D4 )  V y
Aut(D4 )  D4 . Explícitamente los automorfismos de D4 son:

T1,0 : D4 −→ D4
f 𝛼g𝛽 ↦−→ f 𝛼 ( f 0 g) 𝛽 = f 𝛼 g 𝛽
T1,0 = iD4
T1,1 : D4 −→ D4
f 𝛼g𝛽 ↦−→ f 𝛼(fg) 𝛽
f2 f3 g f g f 2g f 3g
 
1 f
T1,1 =
1 f f2 f3 f g f 2g f 3g g
T1,2 : D4 −→ D4
f 𝛼g𝛽 ↦−→ f ( f 2 g) 𝛽
𝛼

f2 f3 g f g f 2g f 3g
 
1 f
T1,2 =
1 f f2 f3 f 2g f 3g g f g
T1,3 : D4 −→ D4
f 𝛼g𝛽 ↦−→ f ( f 3 g) 𝛽
𝛼

f2 f3 g f g f 2g f 3g
 
1 f
T1,3 =
1 f f2 f3 f 3y g f g f 2g
T3,0 : D4 −→ D4
𝛼
f 𝛼g𝛽 ↦−→ f3 ( f 0 g) 𝛽
f f2 f3 f g f 2g f 3g
 
1 g
T3,0 =
1 f3 f2 f g f 3g f 2g f g
T3,1 : D4 −→ D4
𝛼
f 𝛼g𝛽 ↦−→ f3 ( f g) 𝛽
f f2 f3 f 2g f 3g
 
1 g fg
T3,1 =
1 f3 f2 f fg g f 3g f 2g
T3,2 : D4 −→ D4
𝛼
f 𝛼g𝛽 ↦−→ f3 ( f 2 g) 𝛽
f f2 f3 g f g f 2g f 3g
 
1
T3,2 =
1 f3 f2 f f 2g f g g f 3g
T3,3 : D4 −→ D4
𝛼
f 𝛼g𝛽 ↦−→ f3 ( f 3 g) 𝛽
f f2 f3 g f g f 2g f 3g
 
1
T3,3 =
1 f3 f2 f f 3g f 2g f g g
74 · Automorfismos

p0
Ejemplo 5.3.6. Aut(ℚ): sea f ∈ Aut(ℚ) y sea = f (1), (p0 , q0 ) = 1.
      q0  
p 1 p p p
Entonces, f = pf ⇒ qf = p f (1), luego f = f (1).
q q q q q
Note que si f ∈ Aut(ℚ), f (1) ≠ 0 ya que f es 1 − 1. Lo anterior permite
establecer la función

𝜏 : Aut(ℚ) −→ ℚ∗
f ↦−→ f (1).

𝜏 es un homomorfismo de grupos:
 
p1
𝜏 ( f ◦ g) = ( f ◦ g)(1) = f [g (1)] = f ,
q1
 
p1 p0 p1 p1
donde g (1) = . Sea f (1) = , entonces f = f (1), luego
q1 q0 q1 q1
𝜏 ( f ◦ g) = 𝜏 ( f )𝜏 (g).  
  p p p
p
𝜏 es 1 − 1: f (1) = g (1) luego f q = f (1) = g (1) = g , entonces
q q q
f = g.
p0
𝜏 es sobre: sea ≠ 0 un racional. Definimos
q0

f : ℚ −→ ℚ
p p p0
↦−→ .
q q q0
p0 p0
Nótese que f (1) = , es decir, 𝜏 ( f ) = . Veamos que f ∈ Aut(ℚ):
q0 q0
     
p r ps + qr ps + qr p0
f + =f =
q s qs qs q0
 
p p0 r p0 p  r
= + =f +f ;
q q0 s q0 q s
 
p p p0 p
si f = 0, entonces = 0, luego p = 0, con lo cual = 0.
q q q0   q
r r q0 r
Sea ∈ ℚ, entonces f = , es decir, f es sobre, luego
s s p0 s
Aut(ℚ)  ℚ∗ .

Ejemplo 5.3.7. Aut(Q8 ): sea F : Q8 −→ Q8 un automorfismo de Q8 . Pues-


to que en Q8 = ⟨a, b | a 4 = 1, b 2 = a2 , ba = a −1 b⟩ el único elemento de
orden 2 es a2 , entonces F (a2 ) = a 2 , además, F (1) = 1, luego F realmente
Automorfismos · 75

permuta los 6 elementos restantes, a saber: a, a3 , b, ab, a2 b, a 3 b. Esto pa-


rece mostrar una relación de Aut(Q8 ) con el grupo de permutaciones S4 .
En realidad, se verá que Aut(Q8 )  S4 . Cada F viene determinado por su
acción sobre los generadores a, b. Puesto que tanto a como b son de orden
4, entonces F (a) = a, a 3 , b, ab, a 2 b, a 3 b y F (b) = a, a3 , b, ab, a2 b, a3 b. Es-
to genera 36 posibilidades, de las cuales sólo 24 corresponden a funciones
biyectivas:
F (a) = a, F (b) = a: descartada ya que F debe ser biyectiva.
F (a) = a, F (b) = a3 : descartada ya que se tendría F (a3 ) = a3 .
F1 (a) = a, F1 (b) = b:

F1 (a 3 ) = a 3 , F1 (ab) = ab, F1 (a 2 b) = a 2 b, F1 (a 3 b) = a 3 b.

F2 (a) = a, F2 (b) = ab:

F2 (a3 ) = a 3 , F2 (ab) = a2 b, F2 (a 2 b) = a3 b, F2 (a 3 b) = b.

F3 (a) = a, F3 (b) = a 2 b:

F3 (a3 ) = a3 , F3 (ab) = a 3 b, F3 (a2 b) = b, F3 (a3 b) = ab.

F4 (a) = a, F4 (b) = a 3 b:

F4 (a3 ) = a3 , F4 (ab) = b, F4 (a2 b) = ab, F4 (a 3 b) = a2 b.

F (a) = a3 , F (b) = a: descartada ya que F (a3 ) = a.


F (a) = a3 , F (b) = a3 : descartada ya que F debe ser biyectiva.
F5 (a) = a3 , F5 (b) = b:

F (a3 ) = a, F5 (ab) = a 3 b, F5 (a2 b) = a 2 b, F5 (a 3 b) = ab.

F6 (a) = a3 , F6 (b) = ab:

F6 (a3 ) = a, F6 (ab) = b, F6 (a 2 b) = a3 b, F6 (a 3 b) = a2 b.

F7 (a) = a3 , F7 (b) = a2 b:

F7 (a 3 ) = a, F7 (ab) = ab, F7 (a2 b) = b, F7 (a3 b) = a3 b.

F8 (a) = a3 , F8 (b) = a3 b:

F8 (a 3 ) = a, F8 (ab) = a 2 b, F8 (a 2 b) = ab, F8 (a3 b) = b.

F9 (a) = b, F9 (b) = a:

F9 (a3 ) = a2 b, F9 (ab) = a3 b, F9 (a2 b) = a3 , F9 (a 3 b) = ab.


76 · Automorfismos

F10 (a) = b, F10 (b) = a 3 :

F10 (a 3 ) = a 2 b, F10 (ab) = ab, F10 (a2 b) = a, F10 (a3 b) = a3 b.

F (a) = b, F (b) = b: descartada ya que F debe ser biyectiva.


F11 (a) = b, F11 (b) = ab:

F11 (a3 ) = a2 b, F11 (ab) = a, F11 (a 2 b) = a 3 b, F11 (a 3 b) = a3 .

F (a) = b, F (b) = a2 b: descartada ya que F (ba) = 1 = F (a3 b) = F (1).


F12 (a) = b, F12 (b) = a 3 b:

F12 (a 3 ) = a 2 b, F12 (ab) = a 3 , F12 (a 2 b) = ab, F12 (a 3 b) = a.

F13 (a) = ab, F13 (b) = a:

F13 (a 3 ) = a 3 b, F13 (ab) = b, F13 (a 2 b) = a 3 , F13 (a 3 b) = a2 b.

F14 (a) = ab, F14 (b) = a3 :

F14 (a 3 ) = a 3 b, F14 (ab) = a 2 b, F14 (a 2 b) = a, F14 (a3 b) = b.

F15 (a) = ab, F15 (b) = b:

F15 (a3 ) = a3 b, F15 (ab) = a 3 , F15 (a 2 b) = a2 b, F15 (a3 b) = a.

F (a) = ab, F (b) = ab: descartada ya que F es biyectiva.


F16 (a) = ab, F16 (b) = a2 b:

F16 (a 3 ) = a 3 b, F16 (ab) = a, F16 (a2 b) = b, F16 (a3 b) = a3 .

F (a) = ab, F (b) = a 3 b: descartada ya que F (ba) = 1 = F (a3 b) = F (1).


F17 (a) = a2 b, F17 (b) = a:

F17 (a3 ) = b, F17 (ab) = ab, F17 (a2 b) = a3 , F17 (a3 b) = a3 b.

F18 (a) = a 2 b, F18 (b) = a 3 :

F18 (a3 ) = b, F18 (ab) = a 3 b, F18 (a2 b) = a, F18 (a 3 b) = ab.

F (a) = a 2 b, F (b) = b: descartada ya que F (ab) = 1 = F (1).


F19 (a) = a2 b, F19 (b) = ab:

F19 (a 3 ) = b, F19 (ab) = a3 , F19 (a2 b) = a 3 b, F19 (a 3 b) = a.

F (a) = a 2 b, F (b) = a2 b: descartada ya que F es biyectiva.


Automorfismos · 77

F20 (a) = a 2 b, F20 (b) = a3 b:

F20 (a 3 ) = b, F20 (ab) = a, F20 (a2 b) = ab, F20 (a3 b) = a3 .

F21 (a) = a 3 b, F21 (b) = a:

F21 (a 3 ) = ab, F21 (ab) = a2 b, F21 (a 2 b) = a 3 , F21 (a 3 b) = b.

F22 (a) = a 3 b, F22 (b) = a3 :

F22 (a 3 ) = ab, F22 (ab) = b, F22 (a2 b) = a, F22 (a 3 b) = a2 b.

F23 (a) = a 3 b, F23 (b) = b:

F23 (a 3 ) = ab, F23 (ab) = a, F23 (a2 b) = a2 b, F23 (a3 b) = a 3 .

F (a) = a3 b, F (b) = ab: descartada ya que F (ba) = 1 = F (a3 b) = F (1).


F24 (a) = a 3 b, F24 (b) = a 2 b:

F24 (a3 ) = ab, F24 (ab) = a3 , F24 (a2 b) = b, F24 (a3 b) = a.

F (a) = a3 b, F (b) = a 3 b: descartada ya que F es biyectiva.


Ahora sólo falta demostrar que estas 24 funciones biyectivas son homo-
morfismos, es decir, son los únicos automorfismos en Aut(Q8 ). Con esto
tendríamos que las 24 permutaciones de los 6 elementos a, a3 , b, ab, a2 b, a3 b
corresponden a los automorfismos de Q8 , quedando probado de esta ma-
nera que Aut(Q8 )  S4 .
Sólo revisamos la función F24 , pues las otras 22 se revisan de manera
similar (nótese que la función F1 corresponde a la idéntica). Cada elemento
de Q8 es de la forma ar b s , donde 0 ≤ r ≤ 3, 0 ≤ s ≤ 1. Se debe enton-
ces demostrar que F24 (ar b s a p b q ) = F24 (a r b s )F24 (a p b q ). Consideremos dos
casos:
(i) s = 0: entonces, F24 (a r b s a p b q ) = F24 (a r a p b q ) = F24 (ar+p b q ). Si
q = 0, luego F24 (a r b s a p b q ) = F24 (ar+p ). Debemos entonces considerar
16 posibilidades, pero en vista de la simetría de la situación, basta tener
en cuenta sólo los siguientes 10 casos:
r = 0, p = 0 ⇒ F24 (a r b s a p b q ) = 1, F24 (ar b s )F24 (a p b q ) = 1;
r = 0, p = 1 ⇒ F24 (a r b s a p b q ) = a 3 b, F24 (a r b s )F24 (a p b q ) = a 3 b;
r = 0, p = 2 ⇒ F24 (a r b s a p b q ) = a 2 , F24 (a r b s )F24 (a p b q ) = a 2 ;
r = 0, p = 3 ⇒ F24 (a r b s a p b q ) = ab, F24 (ar b s )F24 (a p b q ) = ab;
r = 1, p = 1 ⇒ F24 (a r b s a p b q ) = a 2 , F24 (a r b s )F24 (a p b q ) = aa = a 2 ;
r = 1, p = 2 ⇒ F24 (a r b s a p b q ) = ab, F24 (ar b s )F24 (a p b q ) = a3 ba2 = ab;
r = 1, p = 3 ⇒ F24 (a r b s a p b q ) = 1, F24 (ar b s )F24 (a p b q ) = a 3 bab = 1;
78 · Automorfismos

r = 2, p = 2 ⇒ F24 (a r b s a p b q ) = 1, F24 (ar b s )F24 (a p b q ) = a 2 a 2 = 1;


r = 2, p = 3 ⇒ F24 (a r b s a p b q ) = a 3 b, F24 (a r b s )F24 (a p b q ) = a 2 ab = a 3 b;
r = 3, p = 3 ⇒ F24 (a r b s a p b q ) = a 2 , F24 (a r b s )F24 (a p b q ) = abab = a2 .
Para q = 1, se tiene F24 (ar b s a p b q ) = F24 (a r+p b), y por tanto se presentan
16 posibilidades:
r = 0, p = 0 ⇒ F24 (a r b s a p b q ) = a 2 b, F24 (a r b s )F24 (a p b q ) = a 2 b;
r = 0, p = 1 ⇒ F24 (a r b s a p b q ) = a 3 , F24 (ar b s )F24 (a p b q ) = a 3 ;
r = 0, p = 2 ⇒ F24 (a r b s a p b q ) = b, F24 (a r b s )F24 (a p b q ) = b;
r = 0, p = 3 ⇒ F24 (a r b s a p b q ) = a, F24 (ar b s )F24 (a p b q ) = a;
r = 1, p = 0 ⇒ F24 (a r b s a p b q ) = a 3 , F24 (a r b s )F24 (a p b q ) = a 3 ba2 b = a3 ;
r = 1, p = 1 ⇒ F24 (a r b s a p b q ) = b, F24 (a r b s )F24 (a p b q ) = a 3 ba3 = b;
r = 1, p = 2 ⇒ F24 (a r b s a p b q ) = a, F24 (ar b s )F24 (a p b q ) = a3 bb = a;
r = 1, p = 3 ⇒ F24 (a r b s a p b q ) = a 2 b, F24 (a r b s )F24 (a p b q ) = a 3 ba = a 2 b;
r = 2, p = 0 ⇒ F24 (a r b s a p b q ) = b, F24 (a r b s )F24 (a p b q ) = a 2 a 2 b = b;
r = 2, p = 1 ⇒ F24 (a r b s a p b q ) = a, F24 (ar b s )F24 (a p b q ) = a2 a3 = a;
r = 2, p = 2 ⇒ F24 (a r b s a p b q ) = a 2 b, F24 (a r b s )F24 (a p b q ) = a 2 b;
r = 2, p = 3 ⇒ F24 (a r b s a p b q ) = a 3 , F24 (ar b s )F24 (a p b q ) = a 2 a = a3 ;
r = 3, p = 0 ⇒ F24 (a r b s a p b q ) = a, F24 (ar b s )F24 (a p b q ) = aba2 b = a;
r = 3, p = 1 ⇒ F24 (a r b s a p b q ) = a2 b, F24 (a r b s )F24 (a p b q ) = aba 3 = a2 b;
r = 3, p = 2 ⇒ F24 (a r b s a p b q ) = a3 , F24 (ar b s )F24 (a p b q ) = abb = a3 ;
r = 3, p = 3 ⇒ F24 (a r b s a p b q ) = b, F24 (ar b s )F24 (a p b q ) = aba = b.
(ii) s = 1: entonces, F24 (ar b s a p b q ) = F24 (ar+3p b q+1 ). Al igual que en (i), se
debe considerar por separado los casos q = 0 y q = 1. Revisemos en calidad
de ilustración el caso r = 3, p = 3, q = 1:

F24 (ar b s a p b q ) = F24 (a12 b 2 ) = F24 (a2 ) = a2 , F24 (ar b s )F24 (a p b q ) = aa = a2 .

4. Ejercicios
1. Calcule Aut(S3 ).

2. Calcule Int(S3 ).

3. Calcule Int(V ).

4. Calcule Int(D4 ).

5. Calcule Int(Q8 ).
Capítulo
seis
Grupos de
permutaciones
Grupos de permutaciones · 81

En el capítulo anterior se probó que cada grupo G es isomorfo a un subgru-


po del grupo de permutaciones S (G). Cuando G = {x1 , . . . , xn } es finito, el
grupo de permutaciones se acostumbra a denotar Sn . En este caso los ele-
mentos x1 , . . . , xn pueden ser reemplazados por los naturales 1, . . . , n. Así,
Sn es el grupo de todas las funciones biyectivas del conjunto
In := {1, 2, . . . , n}.
En este capítulo estudiaremos con algún detalle el grupo Sn , denomi-
nado grupo simétrico de grado n. Destacamos en Sn algunos subgrupos
importantes: el grupo alternante An y el grupo diédrico de grado n, Dn .

1. Ciclos
Definición 6.1.1. Sea f un elemento de Sn . Se dice que f es un ciclo de
longitud m, 1 ≤ m ≤ n, si existen a1 , a2 , . . . , am elementos diferentes de
In tales que
(i) f (a1 ) = a2 , f (a2 ) = a3 , . . . , f (am−1 ) = am , f (am ) = a1 ,

(ii) f (x) = x para x ∉ {a1 , . . . , am }.


Se denota a f por

f = (a1 a2 · · · am ) = (a2 a3 · · · am a1 ) = (a3 a4 · · · am a1 a2 )


= · · · = (am a1 a2 · · · am−1 ).

Nótese que un ciclo de longitud 1 es la idéntica de In .


Sean f = (a1 . . . am ) y g = (b1 . . . br ) dos ciclos de Sn . Se dice que f y g
son dos ciclos disyuntos si {a1 , a2 , . . . , am } ∩ {b1 , b2 , . . . , br } = ∅.
Nótese que las siguientes permutaciones f y g de S7 son ciclos disyuntos:
 
1 2 3 4 5 6 7
f = = (1 2 3),
2 3 1 4 5 6 7
 
1 2 3 4 5 6 7
g= = (4 5 7 6).
1 2 3 5 7 4 6

Proposición 6.1.2. En Sn el producto de ciclos disyuntos conmuta.


Demostración. Sean f = (a1 · · · am ) y g = (b1 · · · br ) dos ciclos disyuntos
de Sn . Sean A := {a1 , . . . , am } y B := {b1 , . . . , br }. Sean A1 := In − A y
B1 := In − B. Dado x ∈ In , existen tres posibilidades:
(i) x ∈ A: entonces f (x) ∈ A, f (x) ∉ B, luego g ( f (x)) = f (x); g (x) = x
implica f (g (x)) = f (x) y f g (x) = g f (x).
82 · Grupos de permutaciones

(ii) x ∈ B: es análogo al anterior.

(iii) x ∉ A y x ∉ B, entonces f (x) = x, g (x) = x, de donde


f g (x) = x = g f (x).

De (i), (ii) y (iii) se desprende que f g = g f . ✓


La importancia de la proposición anterior se evidnecia en el siguiente


teorema.

Teorema 6.1.3. Sea Sn el grupo simétrico de grado n.

(i) Si f = (a1 · · · am ) es un ciclo de longitud m, entonces

| f | = m.

(ii) Si f = f1 · · · ft es una permutación de Sn , donde f1 , . . . , ft son ciclos dis-


yuntos de longitudes m1 , . . . , mt , respectivamente, entonces

| f | = m. c. m.(m1 , . . . , mt ).

Demostración. (i) Probemos en primer lugar que f m = 1: si x ∉ {a1 , . . . , am },


entonces f (x) = x, luego f m (x) = x. Sea a j ∈ {a1 , . . . , am }, 1 ≤ j ≤ m, f
se puede expresar también como f = (a j a j+1 · · · am a1 a2 · · · a j−1 ), entonces
f (a j ) = a j+1 ; f 2 (a j ) = a j+2 ; . . .; f m−1 (a j ) = a j−1 ; f m (a j ) = a j , es decir, f m
actúa también como la idéntica sobre los elementos de {a1 , . . . , am }.
El orden de f es el menor entero positivo k tal que f k = 1. Supon-
gamos que existe 1 ≤ k < m tal que f k = 1. Por lo tanto, f (a1 ) = a2 ,
f 2 (a1 ) = a3 , . . . , f k−1 (a1 ) = ak , f k (a1 ) = a1 = f (ak ) = ak+1 , pero esto
es una contradicción ya que los elementos del ciclo f son diferentes. Lo
anterior prueba que | f | = m.
(ii) La demostración se realiza por inducción sobre t.
t = 1: la afirmación es consecuencia de (i).
t = 2: f = f1 f2 , donde f1 y f2 son ciclos disyuntos de longitudes m1
y m2 respectivamente. Según la proposición 6.1.2, f1 f2 = f2 f1 . Además,
⟨ f1 ⟩ ∩ ⟨f2 ⟩ = 1. En efecto, sea g ≠ 1 tal que g = f1s = f2r con 1 ≤ s < m1
y 1 ≤ r < m2 . Sea f1 = (a1 · · · am ). Puesto que g ≠ 1 existe x ∈ In
tal que g (x) ≠ x. Necesariamente x ∈ {a1 , . . . , am }. Sea x = a j , en-
tonces f1s (a j ) ≠ a j , pero f2r (a j ) = a j , contradicción. Así, ⟨ f1 ⟩ ∩ ⟨ f2 ⟩ = 1,
f1 f2 = f2 f1 ⇒ | f1 f2 | = m. c. m.(m1 , m2 ).
Supongamos que la afirmación es cierta para t: sea f = f1 f2 · · · ft ft+1 , don-
de f1 , f2 , . . . , ft , ft+1 son ciclos disyuntos dos a dos y de longitudes
Grupos de permutaciones · 83

m1 , m2 , . . . , mt+1 , respectivamente. Sea f ′ := f1 f2 · · · ft . Entonces,


f = f ′ ft+1 . Nótese que ⟨ f ′⟩ ∩ ⟨ ft+1 ⟩ = 1. Además, f ′ ft+1 = ft+1 f ′, luego

| f | = m. c. m.(| f ′ |, mt+1 ) = m. c. m.(m. c. m.(m1 , . . . , mt ), mt+1 )


= m. c. m.(m1 , . . . , mt+1 ). ✓

Teorema 6.1.4. Cada permutación f de Sn es representable como producto de


ciclos disyuntos dos a dos. Tal representación es única salvo el orden y la inclusión
de ciclos de longitud 1.

Demostración. La prueba de la existencia se realiza por inducción sobre n.


n = 1: S1 sólo posee un elemento, el cual es un ciclo de longitud 1.
Supongamos que la afirmación es válida para toda permutación de un
conjunto de m elementos con m < n. Sea f ∈ Sn . Si f es un ciclo, entonces
no hay nada que probar. Sea f una permutación que no es un ciclo. Esto
en particular implica que f ≠ 1. Existe entonces a1 ∈ In tal que f (a1 ) ≠
a1 . Consideremos la sucesión f (a1 ), f 2 (a1 ), f 3 (a1 ), . . . ; en esta sucesión
se tiene un número finito de elementos diferentes de In debido a que para
cada k ≥ 1, f k (a1 ) ∈ In y In es finito. Por lo tanto, existen r y p enteros
positivos diferentes (por ejemplo r > p) tales que

f p (a1 ) = f r (a1 ), luego f r−p (a1 ) = a1 .

Sea A := {r ∈ ℕ | f r (a1 ) = a1 }. Según lo dicho anteriormente, A ≠ ∅.


Como A ⊂ ℕ y ℕ es bien ordenado, A posee primer elemento k, es decir,
k es el menor entero positivo tal que f k (a1 ) = a1 . Los elementos f (a1 ),
f 2 (a1 ), . . . , f k−1 (a1 ), f k (a1 ) = a1 son diferentes, ya que en caso contrario
existiría un s < k tal que f s (a1 ) = a1 . La permutación f determina el k-ciclo
g = (a1 a2 · · · ak ), donde

a2 = f (a1 ), a3 = f (a2 ) = f 2 (a1 ), . . . , ak = f (ak−1 ) = f k−1 (a1 ),


a1 = f (ak ) = f k (a1 ).

Consideremos la permutación f1 ∈ Sn definida por f1 (ai ) = ai , 1 ≤ i ≤ k,


f1 (x) = f (x), x ∈ In − {a1 , . . . , ak }. Nótese que f = f1 g. En efecto, si
x ∈ {a1 , . . . , ak }, entonces sea x = a j para algún 1 ≤ j ≤ k. Si j < k,
entonces
g (x) = g (a j ) = a j+1 ⇒ f1 g (x) = f1 (a j+1 ) = a j+1 = f (a j ) = f (x).
Si j = k entonces
g (x) = g (ak ) = a1 ⇒ f1 g (x) = f1 (a1 ) = a1 = f (ak ) = f (x).
84 · Grupos de permutaciones

Ahora, si x ∉ {a1 , . . . , ak }, entonces g (x) = x, luego f1 g (x) = f1 (x) = f (x).


Puesto que f1 fija los elementos a1 , . . . , ak , entonces f1 puede conside-
rarse como una permutación del conjunto In − {a1 , . . . , ak }. Por la hipótesis
de inducción, f1 es producto de ciclos disyuntos conformados por los ele-
mentos de In − {a1 , . . . , ak }. En total, f es producto de ciclos disyuntos
conformados por los elementos de In . Esto completa la prueba de la prime-
ra afirmación del teorema.
Probemos ahora la unicidad de la descomposición: sean

f = (a11 a12 · · · a1k1 ) (a21 a22 · · · a2k2 ) · · · (ar1 ar2 · · · arkr )


= (b11 b12 · · · b1m1 ) (b21 b22 · · · b2m2 ) · · · (bs1 bs2 · · · bsms )

dos descomposiciones de f en producto de ciclos disyuntos, 1 ≤ r , s ≤ n.


Estamos considerando que los elementos de In que permanecen fijos bajo f
conforman ciclos de longitud 1, es decir,

1 ≤ ki ≤ n, 1 ≤ i ≤ r; 1 ≤ m j ≤ n, 1 ≤ i ≤ s.

En otras palabras, estamos considerando que

In = {a11 , a12 , . . . , a1k1 ; . . . ; ar1 , ar2 , . . . , arkr }


= {b11 , b12 , . . . , b1m1 ; . . . ; bs1 , bs2 , . . . , bsms }.

El elemento a11 debe aparecer en alguno de los ciclos de la segunda des-


composición. Por la conmutatividad de los factores, podemos asumir que
a11 ∈ {b11 , b12 , . . . , b1m1 }. Reordenando el ciclo (b11 b12 · · · b1m1 ) podemos
considerar sin pérdida de generalidad que a11 = b11 . Según el teorema
6.1.3, k1 es el menor entero positivo tal que f k1 (a11 ) = a11 . Se obtiene
que k1 = m1 , además

f (b11 ) = b12 = f (a11 ) = a12 ; f (b12 ) = b13 = f (a12 ) = a13 , . . . ,


f (b1m1 −1 ) = b1m1 = f (a1k1 −1 ) = a1k1 ; f (b1m1 ) = b11 = f (a1k1 ) = a11 ,

es decir, (a11 a12 · · · a1k1 ) = (b11 b12 · · · b1m1 ). El mismo análisis se puede
aplicar a a21 , a31 , . . . , ar1 demostrando que r ≤ s y la igualdad de ciclos.
En forma similar s ≤ r, lo cual concluye la prueba del teorema. ✓

Ejemplo 6.1.5. Consideremos los siguientes elementos de S9 :


 
1 2 3 4 5 6 7 8 9
f = ,
2 5 3 1 7 6 9 8 4
Grupos de permutaciones · 85

luego f = (125794)(3)(6) = (125794);


 
1 2 3 4 5 6 7 8 9
g= ,
3 6 4 1 2 5 8 7 9

así,

g = (134)(265)(78)(9) = (265)(134)(78) = (78)(134)(265)


= (134)(78)(265) = (78)(265)(134) = (265)(78)(134).

2. El grupo alternante An
Definición 6.2.1. Para n ≥ 2, los ciclos de longitud 2 de Sn se conocen
como transposiciones.

Teorema 6.2.2. Cada permutación de Sn es representable como un producto finito


de transposiciones.

Demostración. Puesto que cada permutacion es representable como un pro-


ducto de ciclos disyuntos, entonces es suficiente demostrar el teorema para
cada ciclo. Sea f = (a1 a2 · · · am ) un m-ciclo. Si m = 1, entonces f = 1 y
f = (a1 a2 )(a1 a2 ). Sea m ≠ 1. Nótese que

(a1 a2 · · · am ) = (am a1 )(am−1 a1 ) · · · (a2 a1 ). ✓


Observación 6.2.3. (i) A diferencia del teorema 6.1.4, la representación


de una permutación en producto de transposiciones no es única:
 
1 2 3 4 5
= (12435) = (51)(31)(41)(21) = (12)(52)(32)(42).
2 4 5 3 1

(ii) Según el teorema anterior, cada permutación f de Sn es representa-


ble como un número finito r de transposiciones, además, se vió que dicha
representación no es única. De tal manera que podría presentarse la posi-
bilidad de que en una descomposición r sea par y en otra r sea impar. Sin
embargo, la siguiente proposición muestra que tal situación es imposible.

Proposición 6.2.4. Sea f ∈ Sn la cual tiene dos descomposiciones en producto de


r y s transposiciones. Entonces, r es par si, y sólo si, s es par.

Demostración. Sea f una permutación de Sn la cual tiene dos descomposi-


ciones en producto de transposiciones f = f1 · · · fr = f1′ · · · fs ′ r ≥ 1, s ≥ 1.
Consideremos el natural p = Π j>i ( j − i), i , j ∈ In (por ejemplo, para n = 4
86 · Grupos de permutaciones

se tiene que p = (4 − 3)(4 − 2)(4 − 1)(3 − 2)(3 − 1)(2 − 1) = 12). Sea f


una permutación cualquiera de Sn . Definamos la acción de f sobre p como
p f = Π j>i ( f ( j) − f (i)).
Nótese que p f es un entero (no necesariamente positivo como p); los
factores ( f ( j) − f (i)) que conforman p f son diferencias de elementos de In ,
además |p f | = p. En efecto, demostraremos que si f = f1 · · · fr , donde cada
fi , 1 ≤ i ≤ r, es una transposición, entonces

p f = (−1) r p.

(a) Sea f = (ab) una transposición con a > b. Los factores ( j − i) de p en


los cuales no intervienen ni a ni b, no cambian al aplicar f . Consideremos
aquellos factores donde aparezcan a o b o ambos. Se presentan entonces las
siguientes posibilidades:
(i) Factores donde aparece a pero no b:

(n − a), ((n − 1) − a), ((n − 2) − a) · · · ((a + 1) − a),


(a − (a − 1)), (a − (a − 2)) · · · (a − (b + 1)), (a − (b − 1)) · · · (a − 1).

Al aplicar f a los factores de la primera fila obtenemos

(n − b), ((n − 1) − b) · · · ((a + 1) − b)

y no hay cambios de signo. Al aplicar f a los factores de la segunda fila


resulta

(b − (a − 1)), (b − (a − 2)) · · · (b − (b + 1))(b − (b − 1)) · · · (b − 1)

y hay a − b − 1 cambios de signo.


(ii) Los factores donde aparece b, pero no a, son:

(n − b), ((n − 1) − b) · · · ((a + 1) − b),


((a − 1) − b), ((a − 2) − b) · · · ((b + 1) − b),
(b − (b − 1)) · · · (b − 1).

Aplicando f a los factores anteriores obtenemos

(n − a), ((n − 1) − a) · · · ((a + 1) − a),


((a − 1) − a), ((a − 2) − a) · · · ((b + 1) − a),
(a − (b − 1)) · · · (a − 1).

Se presentan en este caso a − b − 1 cambios de signo.


Grupos de permutaciones · 87

(iii) Factor donde aparecen a, b y (a − b): al aplicar f obtenemos (b − a)


y hay un cambio de signo.
En total, al aplicar f a p se efectuan 2(a − b − 1) + 1 cambios de signos,
así, p f tiene signo menos.
Nótese que los factores de (i) mediante f se convierten en los factores
de (ii) con algunos signos cambiados, a su vez, los de (ii) en los de (i) con
algunos signos cambiados. De lo anterior se desprende que

p f = −p, f = (ab), a > b.

(b) Si
f = f1 · · · fr
es un producto de r transposiciones, entonces

p f = (p f1 ) f2 · · · fr = (−1) r p.

(c) p f = (−1) r p = (−1) s p, entonces (−1) r = (−1) s si, y sólo si, r y s son
pares o r y s son impares. □✓

Según la proposición anterior se pueden distinguir aquellas permutacio-


nes que son producto de un número par de transposiciones.

Definición 6.2.5. Para n ≥ 2, sea

An := { f ∈ Sn | f es producto de un número par de transposiciones}.

An se denomina el grupo alternante o grupo de permutaciones pares.


n!
Teorema 6.2.6. Sea n ≥ 2. Entonces, An ⊴ Sn y An | = 2.

Demostración. Claramente An ≠ ∅. Además, según la proposición anterior,


el producto de dos permutaciones pares es par y la inversa de una permu-
tación par es también par, con lo cual An ≤ Sn .
Probemos ahora que An es normal en Sn . Consideremos la función signo

sgn : Sn −→ ℤ∗
(
1, si f es par,
sgn( f ) :=
−1, si f es impar.

sgn es un homomorfismo: sean f , g ∈ Sn , entonces se presentan las siguien-


tes posibilidades:
(i) f y g pares: entonces f g es par y así

sgn( f g) = 1 = sgn( f ) sgn(g) = (1)(1).


88 · Grupos de permutaciones

(ii) f es par y g es impar: entonces f g es impar y así

sgn( f g) = −1 = sgn( f ) sgn(g) = 1(−1).

(iii) f es impar y g es par: análogo al anterior.


(iv) f y g impares: entonces f g es par y así

sgn( f g) = 1 = sgn( f ) sgn(g) = (−1)(−1).

sgn es una función sobre:

sgn(1) = 1, sgn(ab) = −1; a, b ∈ In , a ≠ b.

Según el teorema fundamental de homomorfismo

ℤ∗  Sn /ker(sgn),

pero ker(sgn) = An , así, ℤ∗  Sn /An , luego |Sn : An | = 2, con lo cual


An ⊴ Sn . Nótese además que |An | = n!
2.

3. Sistemas de generadores
Ya hemos visto que el subconjunto de todos los ciclos y el conjunto de todas
las transposiciones constituyen sistemas de generadores para Sn . Queremos
ahora mostrar otros sistemas más reducidos de generadores.
Proposición 6.3.1. (i) Sn = ⟨(12), (123 · · · n)⟩.

(ii) Sn = ⟨(12), (13), . . . , (1n)⟩.


Demostración. Es suficiente demostrar la primera afirmación ya que

(123 · · · n) = (1n) · · · (13)(12).

Sea f una permutación de Sn . Entonces, f es producto de ciclos disyuntos;


basta probar que cada ciclo está en el generado por (12) y (123 · · · n). Sea
(a1 a2 · · · am ) un m-ciclo de Sn . Entonces, (a1 a2 · · · am ) = (a1 am ) · · · (a1 a2 ).
Nótese que cada transposición (ab) se puede escribir como

(ab) = (1a)(1b)(1a).

Probemos entonces que para cada a, (1a) ∈ ⟨(12), (123 · · · n)⟩:

a = 1 : (1a) = 1 = (12)(12);
a = 2 : (1a) = (12);
a = 3 : (13) = (21345 · · · n)(12)(21345 · · · n) −1 .
Grupos de permutaciones · 89

Pero nótese que

(21345 · · · n) = (12)(123 · · · n)(12),

por tanto,

(13) = (21345 · · · n) (12)(12)(123 · · · n) −1 (12),


(13) = (12)(123 · · · n)(12)(123 · · · n) −1 (12).

En general, (1a), con a ≥ 3, se puede expresar como

(1a) = (2, 3, . . . , a − 2, a − 1, 1, a, a + 1, a + 2, . . . , n)(1, a − 1)


(2, 3, . . . , a − 2, a − 1, 1, a, a + 1, a + 2, . . . , n) −1 .

Por inducción suponemos que (1b) ∈ ⟨(12), (123 · · · n)⟩, con b < a, en-
tonces resta probar que (2, 3, . . . , a − 2, a − 1, 1, a, a + 1, a + 2, . . . , n) está
en el mencionado subgrupo.

(2, 3, . . . , a − 2, a − 1, 1, a, a + 1, a + 2, . . . , n)
= (1, a − 1)(1, a − 2) · · · (13)(12)(123 · · · n)(12)(13)
· · · (1, a − 2)(1, a − 1).

Según la hipótesis inductiva,

(1, a − 1), (1, a − 2), . . . , (13), (12) ∈ ⟨(12), (123 · · · n)⟩.

Esto completa la demostración de la proposición. ✓


Proposición 6.3.2. Para n ≥ 3, An coincide con el subgrupo generado por los


3-ciclos.

Demostración. Sea f una permutación par. Podemos agrupar las transposi-


ciones de f de dos en dos y probar que cada pareja así constituida es pro-
ducto de 3-ciclos.
Sean pues (a1 a2 ) y (b1 b2 ) dos transposiciones cualesquiera. Considere-
mos dos casos posibles:
(i) {a1 , a2 } ∩ {b1 , b2 } = ∅:

(a1 a2 )(b1 b2 ) = (b1 b2 )(a1 b1 )(a1 b1 )(a1 a2 )


= (b1 b2 )(b1 a1 )(a1 a2 b1 )
= (b1 a1 b2 )(a1 a2 b1 ),

ya que (a1 b1 ) = (b1 a1 ).


90 · Grupos de permutaciones

(ii) {a1 , a2 } ∩ {b1 , b2 } ≠ ∅: tenemos, a su vez, tres casos posibles:


(a) si {a1 , a2 } = {b1 , b2 }, entonces (a1 a2 ) = (b1 b2 ) y por tanto
(a1 a2 ) (b1 b2 ) = 1 = (abc) (abc) (abc); hemos utilizado el hecho de que n ≥ 3.
(b) Si a1 = b1 pero a2 ≠ b2 , entonces

(a1 a2 ) (b1 b2 ) = (a1 a2 ) (a1 b2 ) = (a1 b2 a2 ).

(c) Si a1 = b2 pero a2 ≠ b1 , entonces se obtiene un 3-ciclo como en el


caso anterior. ✓

Proposición 6.3.3 (Teorema de Jordan) . Sea f una permutación cualquiera


de Sn . Entonces, para cada ciclo (a1 a2 · · · am ) se tiene que

f −1 (a1 a2 · · · am ) f = ( f (a1 ) f (a2 ) · · · f (am )).

Demostración. Puesto que cada permutación es producto de transposiciones,


es suficiente suponer que f es una permutación (𝛼 𝛽 ). Consideremos dos
casos posibles:
(i) {𝛼 , 𝛽 } ∩ {a1 , a2 , . . . , am } = ∅:

(𝛼 𝛽 ) (a1 a2 · · · am ) (𝛼 𝛽 ) = (a1 a2 · · · am ) (𝛼 𝛽 )(𝛼 𝛽 ) = (a1 a2 · · · am )


= ( f (a1 ) f (a2 ) · · · f (am )),

ya que f (ai ) = ai para 1 ≤ i ≤ m.


(ii) {𝛼 , 𝛽 } ∩ {a1 , a2 , . . . , am } ≠ ∅: se presentan a su vez dos situaciones:
(a) 𝛼 ∈ {a1 , a2 , . . . , am }, 𝛽 ∉ {a1 , a2 , . . . , am }: sea 𝛼 = a j , 1 ≤ j ≤ m,
entonces

(𝛼 𝛽 ) (a1 · · · a j−1 a j a j+1 · · · am )(𝛼 𝛽 )


= (a1 · · · a j−1 𝛽 a j+1 · · · am )
= ( f (a1 ) · · · f (a j−1 ) f (a j ) f (a j+1 ) · · · f (am )).

(b) 𝛼 , 𝛽 ∈ {a1 , a2 , . . . , am }: sea 𝛼 = a j , 𝛽 = as , s ≠ j, s < m, j < m.


Entonces,

(𝛼 𝛽 )(a1 · · · a j · · · as · · · am )(𝛼 𝛽 )
= (a1 · · · a j−1 as · · · as−1 a j · · · am )
= ( f (a1 ) · · · f (a j−1 ) f (a j ) · · · f (as−1 ) f (as ) · · · f (am )).

Por último, si por ejemplo j = m entonces 𝛼 = am y

(𝛼 𝛽 )(a1 · · · as−1 as · · · am )(𝛼 𝛽 ) = (a1 · · · as−1 am as+1 · · · as )


= ( f (a1 ) f (a2 ) · · · f (as ) · · · f (am )). ✓

Grupos de permutaciones · 91

Ejemplo 6.3.4. Calculemos Z (Sn ) y Z (An ). Para n = 2, S2  ℤ2 , luego


Z (S2 ) = S2 ; Z (A2 ) = A2 .
n ≥ 3 : si n = 3 entonces A3  ℤ3 y Z (A3 ) = A3 . Sea 𝜋 un elemen-
to cualquiera de Sn , 𝜋 ≠ 1. Entonces, 𝜋 es producto de ciclos disyuntos;
como n ≥ 3, existe k ≠ i , j, consideremos la trasposición ( jk); nótese que
𝜋 ( jk) ≠ ( jk)𝜋. En efecto, 𝜋 ( jk)i = j; ( jk)𝜋i = k. Por lo tanto, para cada
𝜋 ≠ 1 en Sn , n ≥ 3, existe un elemento con el cual 𝜋 no conmuta, luego
Z (Sn ) = 1, n ≥ 3.
Sea ahora n ≥ 4 y sea 𝜋 un elemento de An diferente de 1. Sea
l ≠ i, l ≠ j, l ≠ k y k escogido como antes. Entonces, ( jkl) ∈ An y ade-
más 𝜋 ( jkl) ≠ ( jkl)𝜋. En efecto, 𝜋 ( jkl)i = j ≠ k = ( jkl)𝜋i, entonces para
cada 𝜋 ≠ 1 en An , n ≥ 4, existe un elemento con el cual 𝜋 no conmuta, por
lo tanto, Z (An ) = 1, n ≥ 4.

4. El grupo diédrico Dn , n ≥ 3
Consideremos un polígono regular de n ≥ 3 lados. Como ilustración consi-
deremos un pentágono y un hexágono. Por simetrías de un polígono regular
de n lados se entiende el siguiente conjunto de movimientos de este polí-
gono.

(i) n rotaciones en sentido contrario al movimiento de las manecillas del


reloj a través de los ángulos 2𝜋k
n , k = 0, 1, 2, . . . , n − 1.

(ii) n reflexiones correspondientes a los n ejes de simetría.

Para el caso en que n sea par los ejes de simetría son:


n
(a) 2 líneas obtenidas uniendo el centro O del polígono con cada uno de
sus vértices 1, 2, . . . , n.
n
(b) 2 líneas obtenidas uniendo el centro O con los puntos medios de los
n lados del polígono.

Para el caso en que n es impar las n reflexiones corresponden a los n ejes


de simetría obtenidos uniendo el centro O del polígono con sus vértices.
Este conjunto de 2n movimientos constituye un grupo bajo la operación
de composición de movimientos y se denomina el grupo diédrico de grado
n, el cual se denota por Dn .
El grupo diédrico Dn como subgrupo de Sn : sea R1 la rotación a través del
ángulo 𝜃 := 2𝜋
n . Esta rotación corresponde a la permutación de los vértices
92 · Grupos de permutaciones

dada por
 
1 2 3 ··· n
f = = (123 · · · n).
2 3 4 ··· 1

Si denotamos la rotación a través del ángulo 2𝜋k n por Rk , k = 0, 1, 2, . . . , n,


k
entonces a Rk corresponde f . Nótese que R1 es un elemento de Dn de
orden n: R1n = R0 , f n = 1.
Sea R1′ es la reflexión a través del eje de simetría que pasa por el vértice
1. Esta reflexión corresponde a la permutación de los vértices dada por
 
1 2 3 ··· k ··· n−1 n
g= .
1 n n −1 ··· n −k +2 ··· 3 2

Nótese que R1′ tiene orden 2: (R1′ ) 2 = R0 , g 2 = 1.


Por último, observemos que f g es de orden 2, de donde ( f g) 2 = 1, luego

g f g = f −1 .

Generadores y relaciones del grupo diédrico: consideremos la rotación y refle-


xión anteriores las cuales podemos identificar con las permutaciones f y g,
respectivamente. Desde luego que ⟨ f , g⟩ ≤ Dn . Si probamos que
|⟨ f , g⟩| = 2n, entonces tendríamos

Dn = ⟨ f , g⟩, con f n = 1, g 2 = 1, g f g = f −1 .

Sea x ∈ ⟨f , g⟩, entonces x tiene la forma

x = f k1 g l1 f k2 g l2 · · · f km g lm , ki , li ∈ ℤ, 1 ≤ i ≤ m.

Puesto que f es un elemento de orden n y g un elemento de orden 2, po-


demos considerar que

x = f k1 g l1 f k2 g l2 · · · f km g lm , con 0 ≤ ki ≤ n − 1, 0 ≤ li ≤ 1, 1 ≤ i ≤ m.

Como g f = f −1 g, entonces cada elemento x ∈ ⟨ f , g⟩ tiene la forma


x = f k g l , con 0 ≤ k ≤ n − 1, 0 ≤ l ≤ 1. Resultan 2n elementos. Com-
probemos que ellos son diferentes. Sean 0 ≤ k, r ≤ n − 1 y 0 ≤ l , s ≤ 1
tales que f k g l = f r g s , entonces f r−k = g s−l ∈ ⟨f ⟩ ∩ ⟨g⟩ = 1 (de lo contrario
g = f k , con 1 ≤ k ≤ n − 1, luego g f = f k+1 = f −1 g, y de esta forma,
f k+2 = g = f k , es decir, f 2 = 1, lo cual es falso. En consecuencia, n|(r − k).
Para r y k con las condiciones dadas, sólo puede tenerse que r = k, de esto
resulta también que l = s.
Grupos de permutaciones · 93

De lo anterior obtenemos que

Dn = {1, f , f 2 , . . . , f n−1 , g , f g , . . . , f n−1 g }.

De otra parte, sea G un grupo generado por los elementos a y b tales que

a n = 1, es decir, a es de orden n,
b 2 = 1, es decir, b es de orden 2,
bab = a−1 .

Entonces es posible repetir la prueba realizada anteriormente para compro-


bar que G tiene 2n elementos diferentes:

G = {1, a, a2 , . . . , a n−1 , b, ab, . . . , a n−1 b}.

La función 𝜑 : G −→ Dn , definida por 𝜑(a k b l ) = f k g l , 0 ≤ k ≤ n − 1,


0 ≤ l ≤ 1 es un isomorfismo de grupos.
Representación matricial del grupo diédrico: consideremos en GL2 (ℝ) las
matrices    
cos 𝜃 − sin 𝜃 1 0
A := , B := ,
sin 𝜃 cos 𝜃 0 −1
2𝜋
con 𝜃 := n .Nótese que A es de orden n y B es de orden 2. Además,
     
1 0 cos 𝜃 − sin 𝜃 1 0 cos 𝜃 sin 𝜃
= ,
0 −1 sin 𝜃 cos 𝜃 0 −1 − sin 𝜃 cos 𝜃

es decir, BAB = A−1 . Esto indica que ⟨A, B⟩ es isomorfo al grupo diédrico.
La matriz A representa la rotación del sistema de coordenadas xy a través
de un ángulo 𝜃 = 2𝜋
n ; la matriz B representa una reflexión de dicho sistema.
Regla de multiplicación en el grupo diédrico: nótese que en Dn se tiene la
siguiente regla de multiplicación:
 k+k′ m+m′
k m k ′ m′ f g , si m = 0
( f g )( f g ) = k−k ′ m+m′
f g , si m = 1.
Ejemplo 6.4.1 (Algunos subgrupos de Dn ). A partir de los generadores
y las relaciones que definen Dn podemos presentar inmediatamente los si-
guientes subgrupos: de orden 1 el trivial 1 := {1}; de orden 2n el trivial Dn ;
de orden n tenemos al menos a ⟨ f ⟩ (como se observó, en D4 , este no es el
único subgrupo de orden 4). Puesto que ⟨ f ⟩ es cíclico, entonces por cada
divisor de n tendremos al menos un subgrupo de orden k.
Los subgrupos de orden 2 son:
n
⟨ f 2 ⟩ si n es par; ⟨g⟩, ⟨f g⟩, ⟨ f 2 g⟩, . . . , ⟨ f n−1 g⟩.
94 · Grupos de permutaciones

Ejemplo 6.4.2 (Centro de Dn ) . Para 0 ≤ k ≤ n − 1, f k g ∉ Z (Dn ): en


efecto, ( f k g) f = f k−1 g , f ( f k g) = f k+1 g. Si fuese f k−1 g = f k+1 g, entonces
f 2 = 1; pero n ≥ 3 y f n = 1. De lo anterior obtenemos que Z (Dn ) contiene
solamente rotaciones: Sea f k ∈ Z (Dn ), con 0 ≤ k ≤ n − 1. Entonces f k g =
g f k , luego f k g = f −k g y f 2k = 1, de donde n | 2k. Cuando n es impar,
k = 0 y Z (Dn ) = 1. Sea n = 2m par. Como 2m | 2k, entonces existe 𝜆 ≥ 1
tal que 2k = 2m𝜆 , luego k = m𝜆 . Si fuese 𝜆 ≥ 2, entonces m𝜆 ≥ 2m = n,
luego k ≥ n, contradicción, por lo tanto, 𝜆 = 1 y k = n/2. De lo anterior
n
obtenemos que si x ∈ Z (Dn ), entonces x es de la forma x = f 2 . Veamos
n
que realmente en este caso par f 2 ∈ Z (Dn ):
n n n n n
ff 2 = f2f, gf 2 = f − 2 g = f 2 g.
n
Obtenemos que f 2 conmuta con cada elemento de ⟨ f , g⟩ = Dn , es decir,
n
f 2 ∈ Z (Dn ). De lo dicho obtenemos que
(
1, si n es impar,
Z (Dn ) = n n
{1, f 2 } = ⟨ f 2 ⟩, si n es par.

5. Subgrupos normales del grupo Dn , n ≥ 3


Sea N ⊴ Dn . Consideremos los siguientes casos posibles:

(i) n es impar y N no contiene reflexiones: en este caso N ≤ ⟨f ⟩ y existe


entonces un divisor positivo k de n tal que N = ⟨ f k ⟩. Veamos que cada
subgrupo de este tipo es efectivamente normal en Dn :
(
𝛼 𝛽 −1 k j 𝛼 𝛽
f −k j , si 𝛽 = 1,
(f g ) (f ) (f g ) = kj
f , si 𝛽 = 0.

(ii) n es impar y en N hay al menos una reflexión: sea f k g en N , donde


k es fijo y cumple 0 ≤ k ≤ n − 1. Sea 0 ≤ r ≤ n − 1, entonces
( f r ) −1 ( f k g)( f r ) ∈ N , luego f k−2r g ∈ N . Tomando r = k se tiene que
f −k g ∈ N , de donde f −2k ∈ N . Tomemos ahora r = k + 1, entonces
f k−2(k+1) g = f −k−2 g ∈ N , luego f k g f −k−2 g = f 2k+2 ∈ N . De aquí
resulta f 2 ∈ N . Como n es impar, ⟨ f ⟩ = ⟨ f 2 ⟩ ⊆ N , es decir, f ∈ N .
Finalmente, f −k ∈ N , luego g ∈ N . Esto garantiza que N = Dn .

(iii) n es par y N no contiene reflexiones: razonando como en el caso im-


par se obtiene que existe un divisor positivo k de n tal que N = ⟨f k ⟩.
Grupos de permutaciones · 95

(iv) n es par y en N hay al menos una reflexión: sea n = 2t y sea f k g en N ,


donde k es fijo y cumple 0 ≤ k ≤ n − 1. Al igual que en el caso impar
podemos concluir que f 2 ∈ N . Consideremos dos casos posibles:
(a) g ∈ N : entonces el siguiente conjunto de n elementos distintos
está incluido en N : { f 2r g l | 0 ≤ r ≤ 2n − 1, 0 ≤ l ≤ 1}. Si N posee
al menos un elemento adicional, entonces |N | ≥ n + 1, y esto implica
que |N | = 2n. En efecto, |N | divide a 2n y entonces 2n = |N |a; si
a ≥ 2 entonces |N |a ≥ 2|N |, luego 2n ≥ 2n + 2 , lo cual es falso. Así
pues, si N no posee al menos un elemento adicional, entonces N es
exactamente el subgrupo
n
N = { f 2r g l | 0 ≤ r ≤ − 1, 0 ≤ l ≤ 1} = ⟨ f 2 , g⟩  D 2n .
2
En caso contrario, N coincide con Dn .
(b) g ∉ N : veamos que necesariamente f g ∈ N . En efecto, k debe
ser impar, ya que de lo contrario k = 2u, luego ( f 2 ) −u = f −k ∈ N ,
con lo cual f −k f k g = g ∈ N , pero esto es falso. Así, k = 2w + 1 y
esto implica que f −2w f k g = f g ∈ N . Nótese que entonces N con-
tiene al conjunto { f 2k | 0 ≤ k ≤ 2n − 1} y también al conjunto
{ f 2k+1 g | 0 ≤ k ≤ 2n − 1}, la reunión de los cuales tiene n elemen-
tos. Como se vio anteriormente, si N posee al menos un elemento
adicional, entonces N = Dn , en caso contrario N es exactamente la
reunión de estos dos conjuntos. Pero notemos que la reunión de estos
dos conjuntos es ⟨f 2 , f g⟩.
En conclusión, los subgrupos normales de Dn se caracterizan de la siguiente
manera: sea N ⊴ Dn , si n es impar, entonces N = Dn ó N = ⟨ f k ⟩, con k | n;
si n es par, entonces N = Dn ó N = ⟨f k ⟩, con k | n, ó N = ⟨ f 2 , g⟩  D 2n ó
N = ⟨ f 2 , f g⟩  D 2n .

6. Ejercicios
(
Dn , si n es impar,
1. Demuestre que Int(Dn ) =
D 2n , si n es par.
2. Calcule Int(Sn ) para n ≥ 2.
3. Calcule Int(An ) para n ≥ 2.
4. ¿Cuántos subgrupos normales tiene D21 ?
5. ¿Cuántos subgrupos normales tiene D12 ?
Capítulo
siete
Productos y sumas
directas
Productos y sumas directas · 99

El objetivo de este capítulo será presentar la construcción del grupo pro-


ducto cartesiano y su suma directa externa para una familia dada de grupos.
Mostraremos cómo se definen el producto y la suma directa externa en el
caso de una familia infinita. Se dará además la definición de suma directa
interna de una familia finita de subgrupos de un grupo dado, mostrando
la relación que ésta guarda con el producto cartesiano. Las construcciones
presentadas aquí servirán como base teórica para iniciar en el capítulo 10
del presente cuaderno el estudio de los grupos abelianos finitos.

1. Definición
Sea {G1 , . . . , Gn } una colección finita de grupos (tomados con notación
multiplicativa) y sea
n
Ö
Gi := Gi × · · · × Gn := {(xi , . . . , xn ) | xi ∈ Gi , 1 ≤ i ≤ n}
i=1

el producto cartesiano conjuntista de la familia dada. Se pretende definir


În În
en i=1 Gi una operación binaria bajo la cual i=1 Gi tenga estructura de
grupo.
În
Proposición 7.1.1. Sea {G1 , . . . , Gn } una familia finita de grupos y sea i=1 Gi
el producto cartesiano de los conjuntos Gi , 1 ≤ i ≤ n. El producto definido por

(x1 , . . . , xn ) (x1′ , . . . , xn′ ) := (x1 x1′ , . . . , xn xn′ )


În În
da a i=1 Gi una estructura de grupo. La pareja ( i=1 Gi , ·) así constituida se
denomina producto cartesiano de la familia {G1 , . . . , Gn }.
Demostración. En efecto, la asociatividad del producto se desprende de las
respectivas propiedades asociativas de los productos definidos en los grupos
Gi , 1 ≤ i ≤ n. Denotando por 1 el elemento neutro del grupo Gi , entonces
1 := (1, . . . , 1) es el elemento neutro del producto cartesiano. Además, si
xi−1 denota el inverso de xi en Gi entonces el inverso de x = (x1 , . . . , xn ) es
x −1 = (x1−1 , . . . , xn−1 ). ✓

Observación 7.1.2. Si los grupos Gi en el producto cartesiano, 1 ≤ i ≤ n,


presentan notación aditiva, entonces la operación se denota por

(x1 , . . . , xn ) + (x1′ , . . . , xn′ ) = (x1 + x1′ , . . . , xn + xn′ ).

En este caso el neutro y los opuestos toman la forma

0 := (0, . . . , 0) y − (x1 , . . . , xn ) = (−x1 , . . . , −xn ) = −x.


100 · Productos y sumas directas

Ejemplo 7.1.3. (i) Sean G1 = ℤ2 y G2 = ℤ3 . Los elementos de ℤ2 × ℤ3


son
ℤ2 × ℤ3 = {(0, 0), (0, 1), (0, 2), (1, 0), (1, 1), (1, 2)}.
Nótese que |ℤ2 × ℤ3 | = 6 = 2 · 3 = |ℤ2 ||ℤ3 |. Más aún, ℤ6  ℤ2 × ℤ3 :
ℤ2 × ℤ3 es un grupo cíclico con generador (1, 1):

1(1, 1) = (1, 1); 2(1, 1) = (0, 2);


3(1, 1) = (1, 0); 4(1, 1) = (0, 1);
5(1, 1) = (1, 2); 6(1, 1) = (0, 0).

(ii) Sean G1 = G2 = ℤ2 . Los elementos de ℤ2 × ℤ2 son

ℤ2 × ℤ2 = {(0, 0), (0, 1), (1, 0), (1, 1)} .

Observemos que |ℤ2 × ℤ2 | = 4 pero ℤ2 × ℤ2 no es isomorfo a ℤ4 : en efecto,


|(0, 0)| = 1 y |(0, 1)| = |(1, 0)| = |(1, 1)| = 2, luego ℤ2 × ℤ2 no es cíclico.
Por lo tanto, ℤ2 × ℤ2 no es isomorfo a ℤ4 y en cambio ℤ2 × ℤ2  V (el
cuarto grupo de Klein).
Algunas propiedades del producto cartesiano se presentan a continua-
ción.
n
Proposición 7.1.4. Sea {Gi }i=1 una familia de grupos arbitrarios. Entonces,
(i) G1 × G2  G2 × G1 .

(ii) G1 × · · · × Gn  G𝜋 (1) × · · · × G𝜋 (n) , para cada 𝜋 ∈ Sn .

(iii) G1 × G2 × G3  G1 × (G2 × G3 )  (G1 × G2 ) × G3 .

(iv) El producto cartesiano tiene la propiedad asociativa generalizada.

(v) G1 × · · · ×Gn es abeliano si, y sólo si, para cada i , 1 ≤ i ≤ n, Gi es abeliano.


Demostración. Todas las afirmaciones se obtienen en forma inmediata de la
definición de producto cartesiano. □✓
n
Proposición 7.1.5. Sea {Gi }i=1 una familia de grupos finitos. Entonces,

|G1 × · · · × Gn | = |G1 | · · · |Gn |.

Además,
n În
(i) Si {Gi }i=1 es una familia finita de grupos y x = (x1 , . . . , xn ) ∈ i=1 Gi es
tal que xi es de orden finito para cada 1 ≤ i ≤ n, entonces
n .
|x| = m. c. m.{|xi |}i=1
Productos y sumas directas · 101

(ii) Si m y n son enteros positivos primos relativos, entonces ℤm × ℤn  ℤmn .

(iii) Sean m1 , . . . , mk enteros positivos tales que m. c. d.(mi , m j ) = 1 para


i ≠ j, 1 ≤ i , j ≤ n. Entonces,

ℤm1 × · · · × ℤmk  ℤm1 ···mk .

m
(iv) Sea n = p1m1 · · · pk k la descomposición del entero n en producto de factores
primos. Entonces,
ℤpm1 × · · · × ℤpmk  ℤn .
1 k

Demostración. La primera afirmación de la proposición y (i) son triviales.


Para probar (ii) basta encontrar dos elementos a, b ∈ ℤm × ℤn tales que
sus órdenes |a| = m y |b| = n sean primos entre sí; en tal caso ab es de orden
mn y ℤm × ℤn resulta cíclico de orden mn, es decir, ℤm × ℤn  ℤmn . Nótese
que a = (1, 0) y b = (0, 1) son los elementos buscados.
La parte (iii) de esta proposición se prueba usando lo que acabamos de
ver en forma recurrente y la parte (iv) es un caso particular de (iii). □✓

Notemos que para cada 1 ≤ i ≤ n, el grupo Gi se sumerge en el producto


G1 × · · · × Gn , y por lo tanto, puede ser considerado como un subgrupo de
éste.
n
Proposición 7.1.6. Sea {Gi }i=1 una familia finita de grupos. Entonces,

(i) Gi ⊴ G1 × · · · × Gn , para cada 1 ≤ i ≤ n.

(ii) (G1 ×· · ·×Gn )\Gi  G1 ×· · ·×Gi−1 ×Gi+1 ×· · ·×Gn , para cada 1 ≤ i ≤ n.

Demostración. Esto es un sencillo ejercicio para el lector. ✓


2. Producto cartesiano: caso infinito


Î
Sea {Gi }i ∈I una familia cualquiera de grupos. Sea i ∈I Gi el producto car-
tesiano de los conjuntos de la familia dada, es decir,
( )
Ö Ø
Gi := x : I −→ Gi | x(i) ∈ Gi .
i ∈I i ∈I
Î
Definimos en i ∈I Gi el producto de manera análoga a como se hizo en el
caso finito. Sea xi := x(i), luego x = (xi )i ∈I y de esta forma

xy = (xi ) (yi ) := (xi yi ).


102 · Productos y sumas directas

Î
Nótese que este producto da a i ∈I Gi una estructura de grupo, cuyo ele-
mento neutro es 1 := (ei ), donde ei = 1 ∈ Gi , para cada i ∈ I . El inverso
de x = (xi ) es x −1 = (xi−1 ). Cuando I = In = {1, 2 . . . n}, esta definición de
Î
producto i ∈I Gi coincide con la definición de producto cartesiano dada en
la sección anterior.
Las proyecciones canónicas del producto se definen por
Ö
𝜋j : Gi −→ G j , 𝜋 j [(xi )] := x j .

El producto cartesiano junto con sus proyecciones está caracterizado por


la siguiente propiedad universal.

Teorema 7.2.1 (Propiedad universal del producto cartesiano) . Sean


Î
{Gi }i ∈I una familia de grupos, i ∈I Gi su producto cartesiano y
Î
{𝜋 j : i ∈I Gi −→ G j } j ∈I las proyecciones canónicas. Entonces,

(i) Para cada grupo G con homomorfismos {p j : G −→ G j } j ∈I , existe un único


Î
homomorfismo 𝛼 : G −→ i ∈I Gi tal que para cada j ∈ I se tiene que
𝜋j𝛼 = pj.

(ii) Cualquier otro grupo H con homomorfismos {𝜋 j′ : H −→ G j } j ∈I que tenga


la propiedad (i) es isomorfo al producto cartesiano.

Demostración. (i) 𝛼 se define por 𝛼 (y) := (p j (y)) con y ∈ G; claramente 𝛼 es


un homomorfismo de grupos y satisface 𝜋 j 𝛼 = p j para cada j ∈ I. Sea 𝜃 otro
homomorfismo de G en el producto que cumple estas mismas igualdades;
sea 𝜃 (y) := (xi )i ∈I , entonces 𝜋 j 𝜃 (y) = x j = p j (y) para cada j ∈ I, luego
𝜃 (y) = (x j ) = 𝛼 (y).
(ii) Puesto que tanto H como el producto tienen la propiedad (i), enton-
ces para cada j ∈ I resulta 𝜋 j (𝛼 𝛽 ) = 𝜋 j , 𝜋 j′ ( 𝛽 𝛼) = 𝜋 j′, con 𝛽 : ΠGi −→ H
un homomorfismo. Por la unicidad, iH = 𝛽 𝛼 y 𝛼 𝛽 = iΠGi . Esto muestra
que H y ΠGi son isomorfos. ✓

3. Suma directa externa


Î
Sea {Gi }i ∈I una familia de grupos y sea i ∈I Gi su grupo producto. Se de-
nomina soporte de x = (xi ) al subconjunto Ix de I de elementos i tales que
xi ≠ 1. Definimos el conjunto
Ê n Ö o
Gi := x = (xi ) ∈ Gi | x es de soporte finito .
i ∈I
Productos y sumas directas · 103

É
i ∈IGi es un subgrupo del producto y se denomina suma directa ex-
É
terna de la familia dada. En efecto, 1 ∈
É i ∈I Gi , con lo cual la suma directa
externa no es vacía. Sean x, z ∈ i ∈I i con soportes Ix e Iz , respecti-
G
vamente. Entonces, xi zi = 1 para cada i ∈ I − (Ix ∪ Iz ). Esto indica que
sólo para los elementos de un cierto subconjunto finito Iy ⊆ Ix ∪ Iz se tiene
que xi zi ≠ 1. Por lo tanto, si y = (yi ) es el producto de x y z, entonces
−1 ∈
É É É
y∈ i ∈I Gi . Es claro que si x ∈ i ∈I Gi , entonces x i ∈I Gi .
Asociadas a la suma directa externa de una familia de grupos están las
siguientes inyecciones canónicas:
Ê
𝜇 j : G j −→ Gi ,
i ∈I
(
a, si i = j,
𝜇 j (a) := x := (xi ), donde x j :=
1, si i ≠ j.

Evidentemente, estas funciones son homomorfismos inyectivos.


Para la clase de los grupos abelianos, la suma directa externa con sus in-
yecciones canónicas está caracterizada por la siguiente propiedad universal.

Teorema 7.3.1 (Propiedad universal de la suma directa externa) . Sean


É
{Gi }i ∈I una familia de grupos abelianos, i ∈I Gi su suma directa externa y
É
{ 𝜇 j : G j −→ G
i ∈I i } sus inyecciones canónicas. Entonces,

(i) Para cada grupo abeliano G con homomorfismos {t j : G j −→ G}, existe un


É
único homomorfismo 𝛼 : i ∈I Gi −→ G, tal que para cada j ∈ I se tiene
que 𝛼 𝜇 j = t j .

(ii) Cualquier otro grupo abeliano H con homomorfismos { 𝜇 ′j : G j −→ H } j ∈I


que tenga la propiedad (i) es isomorfo a la suma directa externa.

Demostración. (i) Definimos 𝛼 por



j ∈Ix t j (x j ), si x ≠ 1,
𝛼 (x) :=
1, si x = 1.

𝛼 es un homomorfismo: si x = 1 o y = 1, entonces evidentemente


𝛼 (xy) = 𝛼 (x)𝛼 (y). Supongamos que x ≠ 1 y y ≠ 1. Sea z = (zi ) = xy.
Si z = 1, entonces y = x −1 , y así, yi = xi−1 para cada i ∈ I, con lo cual
Î Î
𝛼 (z) = 1 = j ∈Ix t j (x j ) j ∈Iy t j (y j ) = 𝛼 (x)𝛼 (y). Sea entonces z ≠ 1. Ya
104 · Productos y sumas directas

que Iz ⊆ Ix ∪ Iy , se tiene que


Ö Ö Ö
𝛼 (z) = t j (z j ) = t j (z j ) = t j (x j y j )
j ∈Iz j ∈Ix ∪Iy j ∈Ix ∪Iy
Ö Ö Ö Ö
= t j (x j ) t j (y j ) = t j (x j ) t j (y j )
j ∈Ix ∪Iy j ∈Ix ∪Iy j ∈Ix j ∈Iy

= 𝛼 (x)𝛼 (y).
É
Probemos ahora la unicidad de 𝛼: sea 𝜃 otro homomorfismo de i ∈I Gi
en G tal que 𝜃 ◦ 𝜇 j = t j , para cada j ∈ I . Sea x un elemento cualquiera de
É
i ∈I Gi . Si x = 1, entonces necesariamente 𝛼 (1) = 𝜃 (1) = 1. Considérese
pues que x ≠ 1. Entonces,
Ö Ö Ö 
 
𝛼 (x) = t j (x j ) = 𝜃 𝜇 j (x j ) = 𝜃 
 𝜇 j (x j )  = 𝜃 (x),
j ∈Ix j ∈Ix  j ∈Ix



Î
ya que x = j ∈Ix 𝜇 j (x j ).
(ii) La prueba es como en el caso del producto y la dejamos al lector. □ ✓

Observación 7.3.2. Nótese que cuando I = In := {1, 2, . . . , n} es un con-


junto finito, el producto cartesiano G1 × · · · × Gn y la suma directa externa
Én
i=1 Gi de grupos abelianos coinciden, y entonces se usa también la si-
guiente notación: G1 × · · · × Gn = G1 ⊕ · · · ⊕ Gn .

4. Suma directa interna


Sea G un grupo y sean H , K subgrupos de G. Nótese que el conjunto
H K := {hk | h ∈ H , k ∈ K}
es un subgrupo de G si H K = KH . Es posible que para dos subgrupos H
y K de G el producto H K coincida con G. En efecto, considérese el grupo
D4 = {1, f , f 2 , f 3 , g , f g , f 2 g , f 3 g }, con f 4 = 1, g 2 = 1 y g f g = f −1 .
Consideremos los subgrupos K = {1, f 2 , g , f 2 g } y H = {1, f 2 , f g , f 3 g }.
Nótese que KH = H K = D4 . De aquí en particular se desprende que cada
elemento de D4 puede escribirse como producto de un elemento de K y
otro de H . Por ejemplo: f = g ( f 3 g), g ∈ K , f 3 g ∈ H . Sin embargo esta
representación de f no es única: f = ( f 2 g)( f g), f 2 g ∈ K, f g ∈ H . Esta
no unicidad se debe al hecho que H ∩ K ≠ 1.
La suma directa interna de subgrupos de un grupo puede ser definida
para el caso infinito. Nosotros consideramos sólo el caso de una colección
finita de subgrupos.
Productos y sumas directas · 105

Proposición 7.4.1. Sean H1 , . . . , Hn subgrupos normales de G. Entonces,


* n +
Ø
Hi = H1 · · · Hn := {h1 · · · hn | hi ∈ Hi , 1 ≤ i ≤ n}.
i=1

Además, H1 · · · Hn ⊴ G y para cada 𝜋 ∈ Sn , H1 · · · Hn = H𝜋 (1) · · · H𝜋 (n) .


Demostración. Por inducción sobre n.
n = 1: ⟨H1 ⟩ = H1 .
n = 2: evidentemente H1 H2 ⊆ ⟨H1 ∪ H2 ⟩ . Sea x ∈ ⟨H1 ∪ H2 ⟩, entonces
x = x1𝜖 1 · · · xt𝜀t , con xi ∈ H1 ∪ H2 y 𝜀 i = ±1, para 1 ≤ i ≤ t. Se desea
ahora reordenar los elementos x1𝜖 1 . . . xt𝜖 t , de tal manera que aparezcan a la
izquierda sólo elementos de H1 y a la derecha sólo elementos de H2 . Sea i
𝜖 i+1
el menor índice (1 ≤ i ≤ t) tal que xi𝜀i ∈ H2 y xi+1 ∈ H1 . Si i = t, entonces
x ∈ H1 H2 . Sea pues i ≠ t, entonces
𝜀 i+1 𝜖 i+1 𝜖 i −1 𝜖 i 𝜖 i+2
x = x1𝜖 1 · · · xi𝜖 i xi+1 · · · xt𝜖 t = x1𝜖 1 · · · xi𝜖 i xi+1 (xi ) xi xi+2 · · · xt𝜖 t .
𝜖 i+1 𝜖 i −1 𝜖 i+2
Como H1 ⊴ G entonces xi𝜖 i xi+1 (xi ) ∈ H1 . Si xi+2 . . . xt𝜖 t están todos en
′ ′ ′ 𝜖1
H2 , entonces tendremos que x = x1 x2 , con x1 := x1 · · · xi𝜖 i xi+1 𝜖 i+1 𝜖 i −1
(xi ) en
′ 𝜖 i 𝜖 i+2 𝜖t
H1 y x2 := xi xi+2 · · · xt en H2 . En caso contrario, repetimos lo anterior
máximo hasta t. De esto obtenemos que ⟨H1 ∪ H2 ⟩ ⊆ H1 H2 .
Ahora, supongamos que ⟨H1 ∪ · · · ∪ Hn−1 ⟩ = H1 · · · Hn−1 . Nótese que
⟨H1 ∪ · · · ∪ Hn ⟩ = ⟨K ∪ Hn ⟩ , con K = H1 ∪ · · · ∪ Hn−1 , además, K ⊴ G ya
que gH1 · · · Hn−1 g −1 = gH1 g −1 gH2 g −1 g · · · gHn−1 g −1 = H1 · · · Hn−1 . De
acuerdo con el paso n = 2 y con la hipótesis de inducción,

⟨H1 ∪ · · · ∪ Hn ⟩ = KHn = H1 · · · Hn−1 Hn .

Finalmente, la normalidad se acaba de probar y la última afirmación de


Ðn Ðn
la proposición es evidente ya que i=1 Hi = i=1 H𝜋 (i) . ✓

Teorema 7.4.2. Sean G un grupo y H1 , . . . , Hn subgrupos normales de G. Las


siguientes condiciones son equivalentes:
(i) Para cada 1 ≤ j ≤ n, H j ∩ (H1 · · · H j−1 H j+1 · · · Hn ) = 1.

(ii) Cada elemento x ∈ H1 · · · Hn tiene una representación única en la forma

x = h1 · · · h n , hi ∈ Hi , 1 ≤ i ≤ n.

Demostración. (i) ⇒ (ii): sea x ∈ H1 · · · Hn . Por hipótesis, x tiene una repre-


sentación en la forma

x = h1 · · · h n , hi ∈ Hi , 1 ≤ i ≤ n.
106 · Productos y sumas directas

Sean hi′ ∈ Hi , 1 ≤ i ≤ n, tales que

x = h1 · · · hn = h1′ · · · hn′
⇒ (h1′ −1 h1 )h2 · · · hn = h2′ · · · hn′
⇒ h1′ −1 h1 = (h2′ · · · hn′ ) (h2 · · · hn ) −1 ∈ H2 · · · Hn
⇒ h1′ −1 h1 = 1 ⇒ h1′ = h1 ⇒ h2 h3 · · · hn = h2′ h3′ · · · hn′ .

Procediendo de manera análoga encontramos que hi = hi′ para cada


1 ≤ i ≤ n.
(ii) ⇒ (i): sea x ∈ H j , j fijo. Supongamos que x ∈ H1 · · · H j−1 H j+1 · · · Hn ,
entonces existen x1 ∈ H1 , . . . , x j−1 ∈ H j−1 , x j+1 ∈ H j+1 , . . . , xn ∈ Hn tales
que x = x1 · · · x j−1 1x j+1 · · · xn . El elemento x se puede representar también
como x = 1 · · · 1x1 · · · 1, luego x1 = 1, . . . , x j−1 = 1, x = 1, . . . , xn = 1, y
de esta manera H j ∩ (H1 · · · H j−1 H j+1 . . . Hn ) = 1. ✓

Definición 7.4.3. Se dice que el grupo G es suma directa interna de los


subgrupos normales H1 , . . . , Hn si:

(i) G = H1 · · · Hn .

(ii) Se cumple una cualquiera de las condiciones del teorema anterior.

Esta relación entre G y los subgrupos H1 , . . . , Hn se denota por


n
∑︁
G= ⊕Hi = H1 ⊕ · · · ⊕ Hn .
i=1

Proposición 7.4.4. Sean {Gi }i=1 n una colección finita de grupos y


G = G1 × · · · × Gn su producto cartesiano. Sea

Gi′ := 𝜇 i (Gi ) = {(1, . . . , x, . . . , 1) | x ∈ Gi }

la imagen de Gi mediante la inyección canónica 𝜇 i . Entonces, G es suma directa


interna de los subgrupos Gi′,

G = G1′ ⊕ · · · ⊕ Gn′ y Gi′  Gi para 1 ≤ i ≤ n.

Demostración. Claramente Gi′ ⊴ G para cada 1 ≤ i ≤ n. Además, cada


elemento x = (x1 , . . . , xn ) de G tiene la representación única

x = (x1 , 1, . . . , 1) · · · (1, . . . , 1, xn ).

Por ser 𝜇 i inyectivo se tiene que Gi′  Gi . ✓



Productos y sumas directas · 107

Ejemplo 7.4.5. (i) Sea M2 (ℝ el grupo aditivo de las matrices cuadradas


reales de orden 2. Sean
 
ℝ 0
M11 := = {A = [ai j ] | ai j = 0, para i ≠ 1 o j ≠ 1},
0 0
     
0 ℝ 0 0 0 0
M12 := , M21 := , M22 := .
0 0 ℝ 0 0 ℝ
Entonces, M2 (ℝ) = M11 ⊕ M12 ⊕ M21 ⊕ M22 .
(ii) Sea ℂ el grupo aditivo de los números complejos y sean ℝ y iℝ
los subgrupos de números reales e imaginarios, respectivamente. Entonces,
ℂ = ℝ ⊕ iℝ.
(iii) Sea V = {1, a, b, ab}, con a2 = 1 = b 2 y ab = ba, el cuarto grupo
de Klein; V es suma directa de los subgrupos ⟨a⟩ y ⟨b⟩ ya que ambos son
normales en V . Además ⟨a⟩ ∩ ⟨b⟩ = 1, luego V = ⟨a⟩ ⊕ ⟨b⟩.
(iv) Cada grupo G se puede descomponer trivialmente en suma directa
interna: G = G ⊕ 1. Hay grupos para los cuales esta es la única descomposi-
ción posible. Consideremos por ejemplo el grupo diédrico de grado 4, D4 :
los subgrupos normales de D4 son 1, D4 , ⟨ f ⟩, ⟨ f 2 ⟩, K4 = {1, f 2 , g , f 2 g },
H4 = {1, f 2 , f g , f 3 g }. Si D4 es suma directa de dos de sus subgrupos nor-
males, entonces se presentan las siguientes posibilidades:
G = 1 ⊕ D4 , ⟨ f ⟩ ⊕ ⟨ f 2 ⟩, ⟨ f 2 ⟩ ⊕ K4 , ⟨ f 2 ⟩ ⊕ H4 .
Sólo la primera posibilidad tiene lugar ya que ⟨f ⟩ ∩ ⟨ f 2 ⟩ ≠ 1, ⟨ f 2 ⟩ ∩ K4 ≠ 1
y ⟨ f 2 ⟩ ∩ H4 ≠ 1.
(v) Nótese que si un grupo G no se puede descomponer en suma directa
de dos subgrupos no triviales, entonces no se puede descomponer en suma
directa de 3 o más subgrupos no triviales.
(vi) Sea G = G1 × G2 × · · · × Gn y Ai ⊴ Gi , con 1 ≤ i ≤ n. Para
A := A1 × · · · × An ⊴ G, x = (x1 . . . xn ) ∈ G y a = (a1 . . . an ) ∈ A,
entonces
x −1 ax = (x1−1 a1 x1 , · · · , xn−1 an xn ) ∈ A.
Î
El resultado anterior se puede generalizar: sea G = i ∈I Gi y Ai ⊴ Gi ,
Î
con i ∈ I. Si A := i ∈I Ai , entonces A ⊴ G.
Ejemplo 7.4.6. Calculemos Aut(Dn ) y probemos que | Aut(Dn )| = 𝜙(n)n,
para n ≥ 3, con 𝜙 la función de Euler que calcula los enteros positivos
menores que n y primos relativos con él. Recordemos que
Dn = 1, f , f 2 , . . . , f n−1 , g , f g , f 2 g , . . . , f n−1 g


f n = 1, g 2 = 1, g f = f −1 g = f n−1 g.
108 · Productos y sumas directas

Sean

B := g , f g , f 2 g , . . . , f n−1 g ,

A := ⟨ f ⟩,
F := { 𝜇 ∈ Aut(Dn ) | 𝜇( f ) = f } y G := { 𝜇 ∈ Aut(Dn ) | 𝜇(g) = g } .

La solución implica realizar varios pasos.


1. En primer lugar, nótese que F y G son subgrupos de Aut(Dn ).

2. Si 𝜇 ∈ Aut(Dn ), entonces, 𝜇(A) = A y 𝜇(B) = B: puesto que todo


elemento de B es de orden 2 y el orden de 𝜇( f ) es n, entonces 𝜇( f )
es un generador de A, es decir, 𝜇(A) = A. Como 𝜇 es inyectivo,
entonces 𝜇(B) = B.

3. F es un subgrupo normal de Aut(Dn ): sea 𝜇 ∈ Aut(Dn ) y 𝜙 ∈ F ,


entonces 𝜇(A) = A y 𝜙| A = iA. Para f se tiene que

𝜇 ◦ 𝜙 ◦ 𝜇−1 ( f ) = 𝜇 ◦ 𝜙( 𝜇−1 ( f )) = 𝜇( 𝜇−1 ( f )) = f ,

es decir, 𝜇 ◦ 𝜙 ◦ 𝜇−1 ∈ F .

4. Es claro que F ∩ G = iDn .

5. Como F ⊴ Aut(Dn ), entonces FG ≤ Aut(Dn ). Además,


|FG | = |F ||G |. En efecto, ya que F ∩ G = iDn , cada elemento de
FG se puede representar en forma única en la forma xy, con x ∈ F y
y ∈ G. El número de tales elementos es claramente |F ||G |.

6. |G | = 𝜑(n): sea J el conjunto de generadores de A, sabemos que


| J | = 𝜑(n). Vamos a probar que | J | = |G |. Sea 𝜇 ∈ G, entonces 𝜇( f )
debe ser un generador de A, es decir, 𝜇( f ) ∈ J . Definimos

G −→ J
𝜇 ↦−→ 𝜇( f ).

Si 𝜇 1 ( f ) = 𝜇 2 ( f ), entonces 𝜇 1 = 𝜇 2 ya que 𝜇 1 (g) = g = 𝜇 2 (g).


Probemos finalmente que la asignación es sobreyectiva: sea k pri-
mo relativo con n y menor que n, de tal forma que f k ∈ J . De-
finimos la función 𝜇 por 𝜇( f r g s ) := f kr g s , con 0 ≤ r ≤ n − 1,
s = 0, 1. Veamos que 𝜇 es un automorfismo. En efecto, primero
notemos que 𝜇 es un homomorfismo: 𝜇( f r g s f p g q ) = 𝜇( f r+p g q ) si
s = 0, en este caso 𝜇( f r+p g q ) = f kr+kp g q = f kr g s f kp g q , es decir,
𝜇( f r g s f p g q ) = 𝜇( f r g s ) 𝜇( f p g q ). Para s = 1 se tiene que

𝜇( f r g s f p g q ) = 𝜇( f r−p g s+q ) = f kr f −kp g s g q = f kr g s f kp g q ,


Productos y sumas directas · 109

es decir, 𝜇( f r g s f p g q ) = 𝜇( f r g s ) 𝜇( f p g q ). Teniendo en cuenta que


⟨ f ⟩ ∩ ⟨g⟩ = 1, entonces 𝜇 es claramente inyectiva, por lo tanto, biyec-
tiva. Entonces, 𝜇 es la preimagen buscada ya que 𝜇( f ) = f k y 𝜇 ∈ G
por ser 𝜇(g) = g.

7. |F | = n: sea 𝜇 ∈ F , según la parte (2); 𝜇(g) debe ser un elemento de


B, digamos, 𝜇(g) = f k g, con 0 ≤ k ≤ n −1. Así, cada elemento 𝜇 ∈ F
determina un único elemento f k g ∈ B, es decir, definimos

F −→ B
𝜇 ↦−→ 𝜇(g).

Si 𝜇 1 (g) = 𝜇 2 (g), entonces 𝜇 1 = 𝜇 2 ya que 𝜇 1 ( f ) = f = 𝜇 2 ( f ).


Veamos finalmente que la asignación que estamos haciendo es so-
bre: sea f k g ∈ B, con 0 ≤ k ≤ n − 1, definimos la función 𝜇 por
𝜇( f r g s ) := f r+ks g s , con 0 ≤ r ≤ n − 1, s = 0, 1. 𝜇 es un auto-
morfismo: primero observemos que 𝜇 es un homomorfismo, pues
𝜇( f r g s f p g q ) = 𝜇( f r+p g q ) si s = 0, y en este caso

𝜇( f r+p g q ) = f r+p+kq g q = f r+ks g s f p+kq g q ,

es decir, 𝜇( f r g s f p g q ) = 𝜇( f r g s ) 𝜇( f p g q ). Cuando s = 1, se tiene que


𝜇( f r g s f p g q ) = 𝜇( f r−p g s+q ). Consideremos los dos casos posibles: si
q = 0,

𝜇( f r g s f p g q ) = f r−p+ks g s = f r+ks f −p g s = f r+ks g s f p


= f r+ks g s f p+kq g q = 𝜇( f r g s ) 𝜇( f p g q ).

Si q = 1, entonces se tiene que 𝜇( f r g s f p g q ) = 𝜇( f r−p ) = f r−p ; por


otro lado, 𝜇( f r g s ) 𝜇( f p g q ) = f r+k g f p+k g = f r+k−p−k = f r−p . Al igual
que el punto (6), ⟨ f ⟩ ∩ ⟨g⟩ = 1, luego 𝜇 es claramente inyectiva,
por lo tanto biyectiva. Entonces, 𝜇 es la preimagen buscada ya que
𝜇(g) = f k g, y 𝜇 ∈ F debido a que 𝜇( f r ) = f r , para cada 0 ≤ r ≤ n−1.

8. Se tiene que |FG | = |F ||G | = n𝜑(n). De otra parte, si 𝜇 ∈ Aut(Dn ),


por el ítem (2), 𝜇( f ) debe ser un generador de Ay 𝜇(g) ∈ B; esto ha-
ce que | Aut(Dn )| ≤ 𝜑(n)n. Como se probó en (5), FG es un subgrupo
de Aut(Dn ), en consecuencia FG = Aut(Dn ) y | Aut(Dn )| = 𝜑(n)n.
Si G fuera subgrupo normal de Aut(Dn ), Aut(Dn ) sería suma directa
interna de F y G. Pero G no es un subgrupo normal de Aut(Dn ): en
efecto, según (6) y (7), las siguientes funciones son elementos de G y
F , respectivamente: 𝜙( f ) = f k , 𝜙(g) = g, 𝜃 ( f ) = f , 𝜃 (g) = f g, donde
110 · Productos y sumas directas

k es primo relativo con n y distinto de 1. Esta última condición se da


ya que n ≥ 3. Entonces, 𝜃 𝜙𝜃 −1 (g) = 𝜃 𝜙( f n−1 g) = 𝜃 ( f −k g) = f −k+1 g.
Es decir, 𝜃 𝜙𝜃 −1 ∉ G, con lo cual G no es un subgrupo normal de
Aut(Dn ).

Entonces, ¿qué es Aut(Dn ) respecto a F y G?

9. Sean G1 y G2 grupos y 𝜇 un homomorfismo de G2 en Aut(G1 ). En el


conjunto G1 × G2 definimos la operación × 𝜇 , así:

(a, b) × 𝜇 (c, d) = (a 𝜇(b)(c), bd).

Entonces, G1 × G2 con esta operación es un grupo y recibe el nombre


de producto semidirecto de G1 y G2 con respecto a 𝜇. Para el pro-
ducto corriente de grupos en calidad de 𝜇 se toma el homomorfismo
trivial que asigna a cada elemento de G2 el automorfismo idéntico.

10. Sea G un grupo con M y N subgrupos de G tal que M es normal en


G. Si M ∩ N = {1} y M N = G, G es isomorfo al producto semi-
directo de M y N mediante el homomorfismo 𝜇 : N −→ Aut(M)
dado por: 𝜇(n) (m) = nmn −1 . En efecto, como G = M N , entonces
todo elemento g ∈ G se puede escribir en la forma g = mn, m ∈ M,
n ∈ N , además de manera única ya que M ∩ N = {1}. Definimos
f : G −→ M × 𝜇 N de la siguiente manera: f (g) := f (mn) = (m, n);
f está bien definida y es obviamente biyectiva. Veamos que f es un
homomorfismo: sea g1 = m1 n1 , g2 = m2 n2 elementos de G, entonces
g1 g2 = (m1 n1 ) (m2 n2 ) = m1 (n1 m2 n1−1 )n1 n2 = m1 𝜇(n1 )(m2 )n1 n2 , con
m1 𝜇(n1 )m2 ∈ M y n1 n2 ∈ N . Así,

f (g1 g2 ) = f (m1 𝜇(n1 ) (m2 )n1 n2 ) = (m1 𝜇(n1 )(m2 ), n1 n2 )


= (m1 , n1 ) × 𝜇 (m2 , n2 ) = f (g1 ) × 𝜇 f (g2 ).

11. De los puntos anteriores tenemos que Aut(Dn )  F × 𝜇 G, mediante


el homomorfismo 𝜇 : G −→ Aut(F ) dado por 𝜇(y)(x) = y ◦ x ◦ y −1 .

12. Una última observación: de manera más sencilla se define la suma


semidirecta interna de dos subgrupos de un grupo de la siguiente
forma: sea G un grupo y M , N subgrupos de G. Se dice que G es
suma semidirecta interna de M y N (en ese orden) si M es normal en
G, M ∩ N = {1} y G = M N . Uno podría entonces obviar los pasos (9),
(10) y (11) y decir simplemente que Aut(Dn ) es la suma semidirecta
interna de F y G.
Productos y sumas directas · 111

5. Ejercicios
1. Pruebe que S3 sólo tiene la descomposición trivial S3 = 1 ⊕ S3 .

2. Sea G := G1 × · · · × Gn . Demuestre que Z (G) = Z (G1 ) × · · · × Z (Gn ).


Extienda este resultado a una familia cualquiera de grupos, es decir,
pruebe que !
Ö Ö
Z Gi = Z (Gi ).
i∈I i∈I

3. Sean G := G1 × · · · × Gn y Hi ≤ Gi , 1 ≤ i ≤ n. Si H := H1 × · · · × Hn ,
demuestre que

NG (H ) = NG1 (H1 ) × · · · × NGn (Hn ).

Extienda este resultado a una familia cualquiera de grupos.

4. Sean G y H grupos finitos cuyos órdenes son primos relativos. Pruebe


que Aut(G × H )  Aut(G) × Aut(H ).

5. ¿Es cierto que la única descomposición de Q8 es la trivial: Q8 = 1⊕Q8 ?


Capítulo
ocho
G-conjuntos
G-conjuntos · 115

Como fundamento teórico para la demostración de los teoremas de Sylow


aparece el concepto de acción de un grupo sobre un conjunto. Esta noción
es análoga con la de operación binaria externa y será tratada en el presente
capítulo. Se estudiará en particular la acción de conjugación. Además, serán
definidos los grupos transitivos del grupo simétrico Sn . De vital importan-
cia para la demostración de los teoremas de Sylow es la ecuación de clases,
la cual estableceremos en este capítulo. Un tratamiento completo de los G-
conjuntos nos llevará a la teoría de los espacios vectoriales y módulos sobre
anillos (véase [24]). Nosotros nos limitaremos a utilizar los G-conjuntos co-
mo herramienta para comprender mejor la teoría de Sylow.

1. Acción de grupos sobre conjuntos


En esta sección se establecerá la equivalencia entre los conceptos de repre-
sentación de un grupo en un grupo de permutaciones y el concepto de ac-
ción de un grupo sobre un conjunto.
Definición 8.1.1. Sean X un conjunto y (G , ·, 1) un grupo. Una acción
del grupo G sobre el conjunto X se define por una función
𝜙 : G × X −→ X , 𝜙(g , x) := g x
tal que
(i) 𝜙(gh, x) = (gh)x = g (hx) = 𝜙(g , 𝜙(h, x)),

(ii) 𝜙(1, x) = 1x = x,
para cualesquiera elementos g , h de G y cualquier elemento x de X.
Se dice también que X es un G-conjunto o que X tiene a G como grupo
de operadores.
Estrechamente relacionado con el concepto de G-conjunto aparece el
concepto de representación de un grupo.
Definición 8.1.2. Sea X un conjunto no vacío, S (X) el grupo de permu-
taciones de X y (G , ·, 1) un grupo. Por representación de G en S(X) se
entiende cualquier homomorfismo
Φ : G −→ S(X).
Proposición 8.1.3. Sea (G , ·, 1) un grupo y X un conjunto no vacío arbitra-
rio. Entonces, cada representación de G en S(X) determina una acción de G sobre
X, es decir, convierte a X en un G-conjunto. Recíprocamente, cada estructura de
G-conjunto sobre X determina una representación de G en S (X).
116 · G-conjuntos

Demostración. Sea Φ : G −→ S (X) una representación de G en S (X). Defi-


namos la función

𝜙 : G × X −→ X
(g , x) ↦−→ 𝜙(g x) =: Φ g (x),

donde Φ g denota la imagen de g mediante el homomorfismo Φ.


Se debe probar que para cualesquiera elementos g , h ∈ G y cualquier
elemento x ∈ X, (gh)x = g (hx) y 1x = x, donde 1 es el elemento identidad
del grupo G. Tenemos:

(gh)x = Φ gh (x) = Φ(gh) (x) = (Φ(g) ◦ Φ(h))(x)


= (Φ g ◦ Φh ) (x) = Φ g [Φh (x)] = Φ g (hx)
= g (hx).
1x = Φ1 (x) = iX (x) = x.

Sea ahora 𝜙 : G × X −→ X una función que define una estructura de


G-conjunto sobre X. Denotemos la imagen de la pareja (g , x) mediante
𝜙 por g x. La función
Φ : G −→ S (X)
definida por Φ(g) = Φ g , con Φ g (x) := g x, x ∈ X, es un homomorfismo.
En efecto, Φ(gh) = Φ gh , luego

Φ gh (x) = (gh)x = g (hx) = g (Φh (x)) = Φ g [Φh (x)] = (Φ g ◦ Φh )(x),

por lo que Φ gh = Φ g ◦ Φh , es decir, Φ(gh) = Φ(g) ◦ Φ(h). ✓


Definición 8.1.4. Sea 𝜙 : G × X −→ X , 𝜙(g , x) = g x, una acción del


grupo G sobre el conjunto X y Φ : G −→ S (X), Φ(g) = Φ g , Φ g (x) = g x,
la representación de G en S (X) asociada a 𝜙. Se denomina núcleo de la
acción 𝜙 y se denota por ker(𝜙) al núcleo del homomorfismo Φ:

ker(𝜙) := ker(Φ) = {g ∈ G | g x = x, ∀x ∈ X }.

Se dice que G actúa efectivamente sobre X si ker(𝜙) = 1, es decir,


g x = x, ∀x ∈ X si, y sólo si, g = 1.

Directamente de la definición de acción de un grupo sobre un conjunto


se desprenden las siguientes propiedades.

Proposición 8.1.5. Sea X un G-conjunto. Entonces,

(i) X k = X × · · · × X es un G-conjunto.
G-conjuntos · 117

(ii) 2X es un G-conjunto, con 2X el conjunto de partes del conjunto X.

(iii) Sea Y ⊆ X y C (Y ) := {Z ⊆ X | |Z | = |Y |}. Entonces, C (Y ) es un


G-conjunto.

Demostración. Ejercicio para el lector. ✓


2. Órbitas y subgrupos estacionarios


Proposición 8.2.1. Si el grupo G actúa sobre el conjunto X, entonces en X se
define la relacion ∼ por

x ∼ y ⇔ ∃g ∈ G : g x = y;

Entonces ∼ es de equivalencia en X. La clase de equivalencia del elemento x se


denota por G (x) y se llama la G-órbita determinada por x. Para cada x ∈ X

G (x) = {g x | g ∈ G}.

|G (x)| se denomina la longitud de la G-órbita determinada por x.

Demostración. Ejercicio para el lector. ✓


Proposición 8.2.2. Sean X un G-conjunto y x un elemento de X. Se denomina


subgrupo estacionario del punto x en G, y se denota por Gx , al subgrupo de
elementos de G que dejan fijo x:

Gx := {g ∈ G | g x = x}.

Además, |G (x)| = |G : Gx |.

Demostración. Sean g , h ∈ Gx , entonces g x = x, hx = x, luego hg x = hx = x,


es decir, hg ∈ Gx ; g −1 x = g −1 (g x) = x, con lo cual g −1 ∈ Gx . Denotemos
por A el conjunto de clases laterales izquierdas determinadas por el subgru-
po estacionario Gx en G. La correspondencia

Φ : G (x) −→ A,

definida por Φ(g x) = gGx es una biyección. En efecto, Φ(g x) = Φ(hx),


luego gGx = hGx , de donde g −1 h ∈ Gx , y de esta manera g −1 hx = x, es
decir, g x = hx. Φ es evidentemente sobre. ✓

Corolario 8.2.3. Sea X un G-conjunto, con G un grupo finito. Entonces, la lon-


gitud de cualquier G-órbita divide al orden de G, |G (x)| | |G |.
118 · G-conjuntos

Demostración. Consecuencia directa de la proposición anterior y del teorema


de Lagrange. ✓

Proposición 8.2.4. Sea G un grupo que actúa sobre el conjunto X.


(i) Si x, y están en la misma órbita entonces sus grupos estacionarios son conju-
gados:
y = g x ⇒ Gy = gGx g −1 .

(ii) Si G es un grupo finito y X = X1 ∪ · · · ∪ Xr es la partición de X en un


número finito de r órbitas con representantes x1 , . . . , xr , entonces
r
∑︁
|X | = |G : Gxi | (Ecuación de clases).
i=1

Demostración. (i) h ∈ Gy ⇔ hy = y ⇔ hg x = g x ⇔ g −1 hg x = x ⇔
g −1 hg ∈ Gx ⇔ h ∈ gGx g −1 .
(ii) La segunda afirmación de la proposición es debido a que G es finito.
En efecto, si G es finito, entonces para cada x ∈ X , Gx es también finito, con
lo cual |G : Gx | es finito y así cada G (xi ) = Xi es finito. Como X1 ∪ · · · ∪ Xr
es una partición de X entonces la ecuación de clases se cumple. ✓

Algunos de los conceptos estudiados anteriormente como centro, cen-


tralizador, normalizador, etc., pueden ser vistos como consecuencia de ac-
ciones de grupos sobre conjuntos.
Ejemplo 8.2.5 (Acción de conjugación) . Sea G un grupo cualquiera. Con-
sideremos la acción de G sobre sí mismo, es decir, con X = G definida por:

𝜙 : G × G −→ G
(g , x) ↦−→ g xg −1 .

Notemos que el núcleo de 𝜙 es el centro del grupo G:

ker(𝜙) = {g ∈ G | g xg −1 = x, ∀x ∈ G}
= {g ∈ G | g x = xg , ∀x ∈ G} = Z (G).

Sea x un elemento cualquiera de G. La órbita G (x) del elemento x, en este


caso denotada por xG , se denomina la clase de elementos conjugados con
x:
xG = {g xg −1 | g ∈ G}.
Observemos que G ha sido particionado en clases conjugadas. Decir que dos
elementos x, y ∈ G son conjugados significa que están en una misma clase
G-conjuntos · 119

(de equivalencia) conjugada, es decir, existe g ∈ G tal que y = g xg −1 . Sea


x un elemento cualquiera de G. El subgrupo estacionario de x se denomina
en este caso el centralizador de x en G:

CG (x) = {g ∈ G | g xg −1 = x} = {g ∈ G | g x = xg }.

Según la proposición 8.1.5, la acción de conjugación puede ser extendida a


los subconjuntos del grupo G. Sean A, B subconjuntos de G. Decimos que A
y B son conjugados si existe g ∈ G tal que B = g Ag −1 . Notemos que cuando
A es un subgrupo de G, entonces g Ag −1 es también un subgrupo de G, es
decir, la acción de conjugación a subconjuntos de G puede ser restringida
a subgrupos de G. En este caso, dado un subgrupo H de G la órbita de
H , H G , está constituida por los subgrupos de G que son conjugados con
H:
H G = {gH g −1 | g ∈ G}.
Además, el subgrupo estacionario en este caso coincide con el normalizador
de H en G:
NG (H ) = {g ∈ G | gH g −1 = H }.
Nótese que |H G | = |G : NG (H )|, es decir, el número de subgrupos con-
jugados de un subgrupo H de G es igual al índice de su normalizador en
G.

Ejemplo 8.2.6 (Generalización del Teorema de Cayley) . Sea G un grupo


y H un subgrupo cualquiera de G. Denotemos por G/H el conjunto de
clases laterales izquierdas determinadas por H en G. La aplicación definida
por

𝜙 : G × G/H −→ G/H
(x, gH ) ↦−→ xgH ,

determina una acción de G en G/H . En primer lugar, 𝜙 es una función: sean


gH = hH , entonces g −1 h ∈ H , luego g −1 x −1 xh ∈ H , es decir,
xgH = xhH . Además, (1, gh) ↦−→ 1gH = gH y también (xy) · (gH )
= (xy) gH = x(yg)H = x · (y · (gH )). Calculemos ahora el núcleo de 𝜙:

ker(𝜙) = {x ∈ G | xgH = gH , ∀g ∈ G}
= {x ∈ G | g −1 xgH = H , ∀g ∈ G};

de aquí obtenemos que

x ∈ ker(𝜙) ⇔ g −1 xg ∈ H , ∀g ∈ G ⇔ x ∈ gH g −1 , ∀g ∈ G ,
120 · G-conjuntos

es decir,
Ù
ker(𝜙) = gH g −1
g ∈G

= intersección de los subgrupos de G conjugados con H .

Demostremos que g ∈G gH g −1 es el subgrupo normal más grande de


Ñ

G que está contenido en H . En efecto, sea


Ù
x∈ gH g −1 .
g ∈G

Se desea probar que para cada elemento w ∈ G,


Ù
wxw −1 ∈ gH g −1 ,
g ∈G

es decir, que para cada g ∈ G , wxw −1 ∈ gH g −1 . Sea g un elemento


cualquiera de G, entonces: x ∈ w −1 gH g −1w = (w −1 g)H (w −1 g) −1 , lue-
go x = w −1 ghg −1w, con h ∈ H , por lo tanto, wxw −1 = ghg −1 y así
wxw −1 ∈ gH g −1 . Claramente,
Ù
gH g −1 ⊆ 1H 1−1 = H .
g ∈G

Sea K ⊴ G , K ≤ H , entonces para cada g ∈ G , K = gK g −1 ⊆ gH g −1 , por


lo tanto K ⊆ g ∈G gH g −1 .
Ñ

La acción 𝜙 determina desde luego una representación del grupo G en


S(G/H ):

Φ : G −→ S (G/H ) Φx : G/H −→ G/H


Φ(x) ↦−→ Φx gH ↦−→ xgH .

Tomando H = {1} la función Φ es precisamente el isomorfismo del teore-


ma de Cayley. Nótese que cuando H ≠ {1} y ker(𝜙) = ker(Φ) = {1}, G no
es tan “pequeño” con respecto a S (G/H ) como en el teorema de Cayley.

De este segundo ejemplo se obtiene el siguiente resultado:

Proposición 8.2.7. Sea G un grupo finito y H ≤ G un subgrupo de G tal que


|G | no divide a |G : H |!. Entonces, H contiene un subgrupo normal no trivial de
G. En consecuencia, G no es simple.
G-conjuntos · 121

Demostración. Supongamos que el único subgrupo normal de G contenido


en H es {1}. Esto indica que
Ù
ker(𝜙) = gH g −1 = ker(Φ) = {1}.
g ∈G

Por lo tanto Φ es 1 − 1 y así G es isomorfo a un subgrupo de S (G/H ). De


aquí se obtiene que |G | divide a |G : H |!, contradicción. ✓

3. Grupos transitivos
Se dice que el grupo G actúa transitivamente sobre X si G determina en X
solamente una órbita, es decir, para cada par de elementos
i , j ∈ X existe g ∈ G tal que gi = j. Más generalmente, se dice que G actúa
k-transitivamente sobre X, o también que G es un grupo k-transitivo so-
bre X, si para cualesquiera subconjuntos ordenados de k elementos de X
{x1 , . . . , xk } y {y1 , . . . , yk } existe g ∈ G tal que g xi = yi , i = 1, 2, . . . , k.
Esto equivale a decir que G actúa transitivamente sobre el conjunto X [k ] de
subconjuntos ordenados de X de k elementos.
Proposición 8.3.1. Si G actúa k-transitivamente sobre X, con k ≤ |X |, entonces
G actúa s-transitivamente sobre X, para cada s ≤ k.

Demostración. Si s = k entonces no hay nada que probar. Sea s < k y


{x1 , . . . , xs } y {y1 , . . . , ys } subconjuntos ordenados de X de s elementos.
Sean {xs+1 , . . . , xk } ⊆ X − {x1 , . . . , xs } y {ys+1 , . . . , yk } ⊆ X − {y1 , . . . , ys }.
Consideremos ahora los subconjuntos ordenados {x1 , . . . , xs , xs+1 , . . . , xk }
y {y1 , . . . , ys , ys+1 , . . . , yk }. Como G es k-transitivo entonces existe g ∈ G
tal que g xi = yi , i = 1, . . . , s, s + 1, . . . , k; es decir, G es s-transitivo. ✓

Proposición 8.3.2. (i) Sn actúa n-transitivamente sobre In = {1, 2, · · · , n}.

(ii) An actúa (n − 2)-transitivamente sobre In .

Demostración. (i) Sean {x1 , . . . , xn } y {y1 , . . . , yn } dos ordenaciones de In .


Sean 𝜎 , 𝜌 ∈ Sn definidas por 𝜎 (i) = xi y 𝜌(i) = yi , entonces
𝜌(𝜎 −1 (xi )) = yi , ∀i = 1, . . . , n.
(ii) Sean {x1 , . . . , xn−2 } y {y1 , . . . , yn−2 } subconjuntos ordenados de In .
Como Sn es n-transitivo, entonces Sn es (n − 2)-transitivo, es decir, exis-
te 𝜎 ∈ Sn tal que 𝜎 (xi ) = yi ∀i = 1, . . . , n − 2. Si 𝜎 es par, enton-
ces no hay nada que probar. Supongamos entonces que 𝜎 es impar. Sean
z1 , z2 ∈ In − {y1 , . . . , yn−2 }. Entonces Θ = (z1 z2 )𝜎 es par y además
Θ(xi ) = yi para i = 1, . . . , n − 2. ✓

122 · G-conjuntos

Proposición 8.3.3. Sea G ≤ Sn e In = {1, 2, . . . , n}. Si G actúa transitiva-


mente sobre In , sea N (g) el conjunto de puntos de In que quedan fijos bajo g, g ∈ G.
Entonces,

(i)
∑︁
|N (g)| = |G |.
g ∈G

(ii) Si G es 2-transitivo sobre In entonces


∑︁
|N (g)| 2 = 2|G |.
g ∈G

Demostración. (i) Simbolicemos por G1 el subgrupo estacionario del punto


1 ∈ In . Sea i un elemento cualquiera de In , como G actúa transitivamente,
entonces existe gi ∈ G tal que gi (1) = i. Se determinan así n elementos (los
cuales no podemos asegurar por ahora que sean diferentes) g1 = iIn , . . . , gn
de Sn . Considérese el conjunto cociente G/G1 de clases laterales izquierdas
determinadas por G1 (recordemos que las clases se definen por medio de la
relacion de equivalencia g ≡ h (mód G1 ) si, y sólo si, g −1 h ∈ G1 ). Demos-
tremos que
Øn
G= gi G1 (3.1)
i=1

(de ser así, podemos afirmar que los n elementos g1 , . . . , gn son diferentes).
Sea g un elemento cualquiera de G. Sea i ∈ In la imagen de 1 mediante g:
g (1) = i, entonces g (1) = i = gi (1), gi−1 g (1) = 1, luego gi−1 g (1) ∈ G1 , es
Ðn Ðn
decir, g ∈ gi G1 , con lo cual G ⊆ i=1 gi G1 . Obviamente, i=1 gi G1 ⊆ G.
Supongamos que para dos elementos i , j ∈ In se tiene gi G1 ∩ g j G1 ≠ ∅,
entonces gi h = g j g, con h, g ∈ G1 ; como h(1) = 1 = g (1), entonces
gi h(1) = gi (1) = i, luego g j g (1) = g j (1) = j, así i = j, por lo tanto
gi G1 = g j G1 . Esto completa la prueba de la igualdad (3.1).
Sea N (g) el conjunto de puntos de In que permanecen fijos bajo g y sea
{g } × N (g) el producto cartesiano del conjunto unitario {g } y el conjunto
N (g). Nótese que para g ≠ h, {g } × N (g) ∩ {h} × N (h) = ∅. Es posible
además que N (g) = ∅.
Sea G j el subgrupo estacionario del punto j ∈ In . Considérese el pro-
ducto cartesiano G j × { j}. Como antes, para i ≠ j, se tiene que

G j × { j} ∩ Gi × {i} = ∅.
G-conjuntos · 123

Evidentemente,

n
Ø Ø

· {g } × N (g) = · G j × { j} ;

g ∈G i=1

Ø n ∑︁
· {g } × N (g) = |{g } × N (g)|


i=1 g ∈G
∑︁ n
∑︁ n
∑︁
= |N (g)| = G j × { j} = |G j |.
g ∈G j=1 j=1

Ya que g j (1) = j, se tiene que g j−1G j g j = G1 (proposición 8.2.4), entonces,


para cada j ∈ In , |G j | = |G1 |.
Como todas las clases laterales G1 , g2G1 , . . . , gnG1 tienen el mismo car-
dinal, y además, utilizando (3.1), resulta

∑︁ n
∑︁ n
∑︁
|N (g)| = |G j | = n|G1 | = |G1 | + · · · + |G1 |
g ∈G j=1 j=1

= |G1 | + |g2G1 | + · · · + |gnG1 | = |G |.

(ii) Supongamos que el grupo G es 2-transitivo sobre In . Esto impli-


ca que G1 es un grupo transitivo sobre Iˆn = In − {1}. En efecto, sean
x, y ∈ Iˆn . Entonces, existe 𝜎 ∈ G tal que 𝜎{x, 1} = {y, 1}, es decir,
𝜎 (x) = y y 𝜎 (1) = 1. Esto indica que 𝜎 ∈ G1 (observemos que G1 de-
termina en In solo dos órbitas {1} y Iˆn ). Sea N̂ (g) el conjunto de puntos de
Iˆn que quedan fijos bajo g ∈ G1 . Según la parte (i) obtenemos que
∑︁ ∑︁ ∑︁
| N̂ (g)| = |G1 | ⇒ |N (g)| = (1 + | N̂ (g)|).
g ∈G1 g ∈G1 g ∈G1

La última igualdad se debe a que cada g ∈ G1 deja fijo un punto más en In ,


el 1.
De esto resulta
∑︁ ∑︁ ∑︁
|N (g)| = 1+ | N̂ (g)| = |G1 | + |G1 | = 2|G1 |.
g ∈G1 g ∈G1 g ∈G1

Análogamente, para cada j ∈ In resulta


∑︁
|N (g)| = 2|G j | = 2|G1 |.
g ∈G j
124 · G-conjuntos

Por lo tanto,
n ∑︁
∑︁
|N (g)| = 2n|G1 | = 2|G |.
j=1 g ∈G j

Pero
n ∑︁
∑︁ ∑︁
|N (g)| = |N (g)| 2 . ✓

j=1 g ∈G j g ∈G

4. Ejercicios
1. Calcule todas las acciones del grupo ℤ3 sobre el conjunto ℤ2 .

2. Calcule todas las acciones del grupo ℤ2 sobre el conjunto ℤ3 .

3. Sea n ≥ 2. Calcule todas las acciones del grupo ℤn sobre el conjunto


ℤ2 .

4. Sea n ≥ 2. Calcule todas las acciones del grupo ℤ2 sobre el conjunto


ℤn .

5. Demuestre la proposición 8.1.5.

6. Demuestre la proposición 8.2.1.


Capítulo
nueve
Teoremas de
Sylow
Teoremas de Sylow · 127

De fundamental importancia para el estudio de los grupos finitos son los


teoremas probados por el matemático noruego Ludwig Sylow. Es conoci-
do que para los grupos cíclicos finitos es válido el recíproco del teorema de
Lagrange, es decir, si G un grupo cíclico finito de orden n y m divide a n en-
tonces G contiene exactamente un subgrupo de orden m. En este capítulo
se mostrará que la afirmación anterior es válida para grupos finitos cuales-
quiera pero con m una potencia de un primo. Además, la unicidad se da
salvo conjugación. Los resultados de este capítulo ayudarán a describir en
el próximo los grupos abelianos finitos.

1. p-grupos
En el capítulo 2 se definieron los principales conceptos relacionados con la
parte finita de un grupo. Además, se tienen las siguientes nociones:

(i) Periodo (exponente) de un grupo periódico: supongamos que el con-


junto de los periodos de los elementos de un grupo periódico es aco-
tado superiormente. Entonces, el mínimo comun múltiplo de estos
periodos se denomina periodo del grupo periódico G.

(ii) Parte periódica de un grupo abeliano: sea G un grupo abeliano. El


conjunto de elementos de G de periodo finito constituye un subgrupo
de G llamado subgrupo de torsión de G o parte periódica de G.

(iii) p-grupos: sea G un grupo (finito o infinito). Si cada elemento de G


tiene periodo potencia del primo p, se dice que G es un p-grupo.

(iv) p-subgrupo: se dice que H ≤ G es un p-subgrupo de G, si H es un


p-grupo.

(v) Grupos primarios: un grupo G se dice que es primario si G es un


p-grupo para algún primo p. En otras palabras, la colección de los
grupos primarios es la reunión de los p-grupos, donde p recorre los
primos positivos.

(vi) Subgrupo de Sylow: sea G un grupo que tiene p-subgrupos. Un p-


subgrupo H es un p-subgrupo de Sylow de G si H es maximal entre
los p-subgrupos de G.

Ejemplo 9.1.1. Sean (G , ·, 1) un grupo abeliano y P el conjunto de ele-


mentos de G de periodo finito. P ≠ ∅ ya que 1 ∈ P. Sean x, y ∈ P, entonces
existen n, m ∈ Z + tales que x n = 1, y m = 1. Sea k = m. c. m.{n, m}, se tiene
128 · Teoremas de Sylow

que (xy) k = x k y k = 1, luego xy ∈ P; si x ∈ P entonces claramente x −1 ∈ P,


y así, P ≤ G.
Ejemplo 9.1.2. (ℤpn , +, 0), con n ≥ 1, es un p-grupo finito, ℂp∞ es un
p-grupo infinito.
Ejemplo 9.1.3 (Ejemplos de p-subgrupos en un grupo no abeliano) . Sea
GLn (ℝ) el grupo multiplicativo formado por las matrices reales invertibles.
Podemos definir conjuntos de matrices sobre otros
 grupos que tienen, al
igual que sobre ℝ, un producto. Sea M3 (ℤn ) = A = [ai j ] | ai j ∈ ℤn . Se
definen en M3 (ℤn ) dos operaciones:
(i) Adición: para A = [ai j ] , B = [bi j ] ∈ M3 (ℤn ), A + B = [ai j + bi j ].

(ii) Multiplicación: AB = C = [ci j ], con ci j := 3k=1 aik bk j .


Í

Se puede comprobar fácilmente que (M3 (ℤn ), +, 0), donde 0 es la matriz


nula, es un grupo abeliano y que (M3 (ℤn ), ·, E), con E la matriz idénti-
ca, es un monoide. Tomemos en particular n = p primo y sea GL3 (ℤp )
un grupo multiplicativo del monoide M3 (ℤn ). Destacamos en GL3 (ℤp ) el
subconjunto UT3 (ℤp ) definido por:

 1 a b 

   

 

UT3 (ℤp ) := 0 1 c  | a, b, c ∈ ℤp ;
 
 0 0 1 
 

  
UT3 (ℤp ) ≤ GL3 (ℤp ): en efecto, UT3 (ℤp ) ≠ ∅ ya que E ∈ UT3 (ℤp ); ade-
más
1 a b  −1 1 −a ac − b 
   
0 1 c  = 0 1 −c  ,
  
0 0 1 0 0 1 
  
y por último, el producto de dos matrices
de UT
3 (ℤ3 p ) es nuevamente una
matriz de este conjunto. Nótese que UT3 (ℤp ) = p , con lo cual UT3 (ℤp )

es un p-subgrupo de GL3 (ℤp ), el cual no es abeliano:
1 1 1 1 0 1 1 0 1 1 1 1
     
0 1 0 0 1 1 ≠ 0 1 1 0 1 0 .
     
0 0 1 0 0 1 0 0 1 0 0 1
     
Ejemplo 9.1.4. Algunos ejemplos de grupos primarios son ℂp∞ , ℤpn y
UT (3, ℤp ).
Ejemplo 9.1.5. Subgrupos de Sylow de ℤ72 :
2-subgrupos: ℤ1 , ℤ2 , ℤ4 , ℤ8 ; 2-subgrupo de Sylow: ℤ8 ;
3-subgrupos: ℤ1 , ℤ3 , ℤ9 ; 3-subgrupo de Sylow: ℤ9 .
Teoremas de Sylow · 129

Proposición 9.1.6. Sea G un grupo de orden p n , con p primo y n ≥ 1. Entonces,


Z (G) ≠ 1.

Demostración. Sea G un grupo finito cualquiera y sean x1G , . . . , xrG las clases
de equivalencia determinadas por la acción de conjugación:
r
Ø
G= xiG , con xi ∈ G.
i=1

Se tienen clases de un sólo elemento (por ejemplo 1G ). Podemos reordenar


 primeras q clases constan de un único elemen-
los índices y suponer que las
to. Se afirma que Z (G) = x1 , . . . , xq . En efecto, si x ∈ Z (G),
 entonces
g xg −1 = x para cada g ∈ G, luego xG = {x}, y por lo tanto, x ∈ x1 , . . . , xq .

El recíproco es evidente.
La ecuación numérica de clases toma la forma
r
∑︁
|G | = |Z (G)| + |G : CG (xi )| .
i=q+1

Si q = r entonces G es abeliano y, así, Z (G) = G ≠ 1. Sea q < r. Nótese


que |G : CG (xi )| | p n , por lo tanto, p ni = |G : CG (xi )|, con 1 ≤ ni < n,
q + 1 ≤ i ≤ r, de donde p | |Z (G)|, luego Z (G) ≠ 1. ✓

Corolario 9.1.7. Todo grupo de orden p 2 es abeliano.

Demostración. Z (G) es de orden 1, p o p 2 . Según la proposición anterior


Z (G) ≠ 1. Supongamos que |Z (G)| = p. Entonces, |G/Z (G)| = p y
G/Z (G) = ⟨a⟩, a ∈ G. Lógicamente a ∉ Z (G), además, Z (G) ⊂ CG (a).
Ya que a ∉ Z (G) se tiene que |CG (a)| > p, luego |CG (a)| = p 2 , y enton-
ces CG (a) = G, es decir, a ∈ Z (G), lo cual es contradictorio. Por lo tanto,
|Z (G)| = p 2 , es decir, G es abeliano. ✓

Proposición 9.1.8. Sean G un grupo y P , Q ≤ G tales que:

(i) P es un p-subgrupo de G.

(ii) P y Q son conjugados, es decir, existe x ∈ G tal que Q = xP x −1 .

(iii) P normaliza Q, es decir, para cada p ∈ P, pQp −1 = Q.

Entonces PQ es un p-subgrupo de G.
130 · Teoremas de Sylow

Demostración. PQ ≤ G: sea pq ∈ PQ, entonces pqp−1 ∈ Q y pq ∈ QP, con


lo cual PQ ⊆ QP. Análogamente, QP ⊆ PQ, y de esta manera, PQ = QP.
Q ⊴ PQ: sean q ∈ Q y pq0 ∈ PQ, entonces

pq0 q(pq0 ) −1 = pq0 qq0−1 p −1 ∈ Q.

Por el teorema fundamental de isomorfismo tenemos PQ/Q  P/(P ∩ Q).


Nótese que P/(P ∩ Q) es un p-grupo (en general, si G es un p-grupo y
N ⊴ G, entonces G/N es un p-grupo: x ∈ G implica |x| = p 𝛼 , con 𝛼 ≥ 0;
(x) p = x p = 1, luego |x| | p 𝛼 ). Q es un p-grupo ya que los elementos de Q
𝛼 𝛼

tienen el mismo orden que los de P.


PQ es un p-grupo: en general, si G/N es un p-grupo y N es un
p-subgrupo de G, entonces G es un p-grupo. En efecto, si x ∈ G enton-
ces |x| = p 𝛼 , con 𝛼 ≥ 0, por lo tanto, (x) p = 1, es decir, x p ∈ N . Así,
𝛼 𝛼

(x p ) p = 1, con 𝛽 ≥ 0, se tiene entonces que x p


𝛼 𝛽 𝛼+ 𝛽
= 1, lo cual implica que
|x| | p 𝛼+ 𝛽 . Esto completa la prueba. ✓

Proposición 9.1.9. Sean G un grupo y H un p-subgrupo de G. Entonces, xH x −1


es un p-subgrupo de G para cada x ∈ G.

Demostración. Fue probada en la demostración anterior. ✓


2. Preliminares
El siguiente ejemplo ilustra que el recíproco del teorema de Lagrange no es
en general válido.

Ejemplo 9.2.1. En A5 no hay subgrupos de orden 30, aunque


30 | |A5 | = 60. Si existiera H ≤ A5 tal que |H | = 30, entonces
H ⊴ A5 . Pero probaremos que para cada n ≥ 5, An es simple.

Proposición 9.2.2. Para cada n ≥ 5, An es simple.

Demostración. Sea H ⊴ An y H ≠ 1. Sea 1 ≠ 𝜏 ∈ H . Puesto que cada


permutación es producto de ciclos disyuntos entonces 𝜏 tiene alguna de las
siguientes formas:
(a) En la descomposición de 𝜏 hay al menos un ciclo de longitud ≥ 4,
𝜏 = (𝛼1 𝛼2 𝛼3 𝛼4 · · · ) · · · , donde los puntos suspensivos indican otros ele-
mentos u otros ciclos.
(b) Si en 𝜏 todos los ciclos son de longitud ≤ 3, entonces se presentan
dos posibilidades:
Teoremas de Sylow · 131

(b1) 𝜏 es exactamente un ciclo de longitud 3, 𝜏 = (𝛼1 𝛼2 𝛼3 ).


(b2) En 𝜏 hay un ciclo de longitud 3 y otros ciclos de longitud ≤ 3,
𝜏 = (𝛼1 𝛼2 𝛼3 ) (𝛼4 , 𝛼5 · · · ) · · · .
(c) En 𝜏 todos los ciclos son de longitud ≤ 2, es decir, 𝜏 es producto de
transposiciones (al menos 2, ya que H ≤ An ), 𝜏 = · · · (𝛼3 𝛼4 )(𝛼1 𝛼2 ) (si para
cada 𝜏 ∈ H no se presenta ninguna de estas 4 formas, entonces H = 1).
Demostraremos ahora que la existencia en H de un elemento 𝜏 ≠ 1
implica la existencia en H de al menos un ciclo de longitud 3. Estudiaremos
las correspondientes 4 formas posibles:
(a) 𝜏 = (𝛼1 𝛼2 𝛼3 𝛼4 · · · ) · · · ∈ H . Sea 𝜃 = (𝛼1 𝛼2 𝛼3 ), teniendo en cuenta
que 𝜃 = (𝛼1 𝛼2 ) (𝛼1 𝛼3 ) · · · ∈ An y H ⊴ An , entonces (𝜃 𝜏 𝜃 −1 )𝜏 −1 ∈ H , es
decir,

(𝛼1 𝛼2 𝛼3 )(𝛼1 𝛼2 𝛼3 𝛼4 · · · ) · · · (𝛼3 𝛼2 𝛼1 ) · · · (· · · 𝛼4 𝛼3 𝛼2 𝛼1 )


= (𝛼1 𝛼2 𝛼4 ) ∈ H .

(b1) No hay nada que probar.


(b2) 𝜏 = · · · (𝛼4 𝛼5 · · · )(𝛼1 𝛼2 𝛼3 ) ∈ H . Sea 𝜃 = (𝛼1 𝛼2 𝛼4 ) ∈ An , enton-
ces 𝜃 𝜏 𝜃 −1 𝜏 −1 = (𝛼1 𝛼2 𝛼5 𝛼3 𝛼4 ) ∈ H . Esto implica, según (a), que H tiene
un ciclo de longitud 3.
(c) 𝜏 = · · · (𝛼3 𝛼4 )(𝛼1 𝛼2 ) ∈ H ; 𝜃 = (𝛼1 𝛼2 𝛼3 ) ∈ An , luego

𝜃 𝜏 𝜃 −1 𝜏 −1 = (𝛼2 𝛼4 )(𝛼1 𝛼3 ) ∈ H .

Puesto que n ≥ 5, entonces se tiene que

(𝛼1 𝛼2 𝛼5 𝛼3 𝛼4 ) = (𝛼1 𝛼4 )(𝛼1 𝛼3 )(𝛼1 𝛼5 )(𝛼1 𝛼2 ) ∈ An .

De aquí resulta

(𝛼1 𝛼2 𝛼5 𝛼3 𝛼4 )(𝛼2 𝛼4 )(𝛼1 𝛼3 )(𝛼1 𝛼2 𝛼5 𝛼3 𝛼4 ) −1 = (𝛼1 𝛼5 )(𝛼2 𝛼4 ) ∈ H .

Hagamos el producto (𝛼1 𝛼5 )(𝛼4 𝛼2 )(𝛼2 𝛼4 )(𝛼1 𝛼3 ) = (𝛼1 𝛼3 𝛼5 ) ∈ H .


Finalmente, queremos mostrar que si H contine de un ciclo de longitud
3, entonces en H están de todos los 3-ciclos, con lo cual H = An . Sean
(𝛼1 𝛼2 𝛼3 ) un ciclo de H y ( 𝛽 1 𝛽 2 𝛽 3 ) un 3-ciclo cualquiera de An . Pues-
to que n ≥ 5, entonces An es 3-transitivo, luego existe 𝜎 ∈ An tal que
𝜎 ( 𝛽 i ) = 𝛼i , con i = 1, 2, 3. Entonces,

𝜎 −1 (𝛼1 𝛼2 𝛼3 )𝜎 = ( 𝛽 1 𝛽 2 𝛽 3 ) ∈ H . ✓

132 · Teoremas de Sylow

Antes de probar los tres teoremas de Sylow consideremos algunos hechos


elementales de la teoría de números.
Proposición 9.2.3. Sea X un conjunto de n elementos. Entonces, el número de
subconjuntos diferentes de k elementos de X, con 0 ≤ k ≤ n, es
 
n n!
= .
k (n − k)!k!
Demostración. Por inducción sobre n.
n = 1: los posibles valores de k son: k = 0, 10 = 1; k = 1, 11 = 1.
 

Supongamos que la afirmación es cierta para conjuntos de n elementos:


X = {x1 , x2 , . . . , xn }. Consideremos un nuevo elemento xn+1 y veamos
cuántos subconjuntos de k elementos, 0 ≤ k ≤ n, tiene X ′ := X ∪ {xn+1 }.
Podemos considerar que la colección de subconjuntos de X ′ de k elementos
está conformada por aquellos subconjuntos donde xn+1 no aparece y aque-
llos que contienen a xn+1 . Del primer tipo de subconjuntos tenemos, de
acuerdo a la hipótesis inductiva, nk .


Los subconjuntos del segundo tipo se obtienen de la siguiente manera.


En cada uno de los nk subconjuntos de k elementos donde no aparece xn+1


podemos suprimir un elemento y en su lugar colocar xn+1 . Puesto que cada


conjunto tiene k elementos, hacemos con cada uno k sustituciones; en total
obtenemos k nk conjuntos donde aparece xn+1 . Sin embargo, en este proce-


so cada conjunto aparece n +  1 − k veces repetido (en efecto consideremos


el conjunto de k elementos x i1 , . . . , xik ⊂ X, quitamos por ejemplo xi1 y
obtenemos xn+1 , xi2 , . . . , xik . El número de conjuntos iguales en este es
n − 1 +k, obteniendo al cambiar xi1 por los n − k + 1 elementos restantes
de X − xi1 , . . . , xik ). Por lo tanto, el número de conjuntos diferentes de k
k ( nk )
elementos donde aparece xn+1 es n−k+1 . Como conclusión obtenemos que
el número de conjuntos de k elementos de X ′ es

k nk
   !     
n n k n+1
+ = 1+ = .
k n−k+1 k n−k+1 k

Así, hemos probado que el número de subconjuntos de k elementos, con


0 ≤ k ≤ n, de un conjunto de n + 1 elementos es n+1

k . El caso k = n + 1 es
n+1 ✓
evidentemente ya que n+1 = 1. □

La siguiente afirmación es clave en la demostración de los teoremas de


Sylow.
Proposición 9.2.4. Sean p primo, m ∈ ℤ+ , m. c. d.(p, m) = 1, r ≥ 0,
pr m 
0 ≤ k ≤ n. Entonces, la mayor potencia de p que divide a pk es p r−k .
Teoremas de Sylow · 133

Demostración. Nótese en primer lugar que

pr m p r−k m(p r m − 1) · · · (p r m − (p k − 1))


 
= .
pk 1 · 2 · · · (p k − 1)
r
Consideremos el racional p m−i k k
i , con 1 ≤ i ≤ p − 1 < p . Si p es una
j
j k
potencia de p que divide a i, entonces i = p 𝜆 < p , luego j < k ≤ r j, con lo
cual p r m − i = p r− j+ j m − p j 𝜆 = p j (p r− j m − 𝜆 ), y de esta manera, p j | p r m − i,
es decir, p j es también una potencia que divide a p r m − i.
Sea ahora p j una potencia de p que divide a p r m − i , entonces
p r m − i = p j 𝜆 , luego p r m − p j 𝜆 = i y j ≤ r (de lo contrario, p r m − p j−r+r 𝜆 = i,
entonces p r (m − p j−r 𝜆 ) = i, luego i ≥ p r ≥ p k , lo cual es falso).
Por lo tanto, p r+ j− j mp j 𝜆 = i, de donde p j (p r− j m − 𝜆 ) = i, así, p j | i. En
conclusión, como m. c. d.(m, p) = 1, entonces el racional

m(p r m − 1) · · · (p r m − (p k − 1))
1 · 2 · · · (p k − 1)

es libre de potencias de p.
pr m  pr m 
Resta ver que p r−k | pk . Sea c = pk
y

m(p r m − 1) · · · (p r m − p k+1 ) a
= ,
1 · 2 · · · (p k − 1) b

donde esta última fracción ya está libre de factores p en su numerador y


denominador. Entonces, c = p r−k ba , luego cb = p r−k a, es decir, p r−k | c.
pr m 
Nótese que p r−k+1 no divide a pk , ya que de lo contario ba p r−k = p r−k+1 𝜆 ,
y entonces, ba = p𝜆 , lo cual ya probamos no se tiene. ✓

3. Teoremas
Teorema 9.3.1 (Teoremas de Sylow) . Sea G un grupo finito y p un número
primo que divide al orden de G. Entonces,

(i) Existencia: para cada potencia p 𝛼 que divide al orden de G, existe en G


un subgrupo de orden p 𝛼 . Además, si p 𝛼+1 divide también a |G |, entonces
cada subgrupo de orden p 𝛼 está incluido en un subgrupo de orden p 𝛼+1 . En
particular, los p-subgrupos de Sylow de G existen y son los subgrupos de G
de orden p r , donde p r es la máxima potencia de p que divide al orden de G.

(ii) Conjugación: todos los p-subgrupos de Sylow son conjugados en G.


134 · Teoremas de Sylow

(iii) Cantidad: la cantidad de los p-subgrupos de Sylow de G es congruente con 1


módulo p y divide al orden del grupo G.

Demostración. (i) Existencia: sea n el orden del grupo G y p r la máxima po-


tencia de p que divide a n. Sea n := p r m, donde m. c. d.(p, m) = 1. Con-
sideremos el conjunto M de todos los subconjuntos de G que contiene p 𝛼
elementos. Puesto que G actúa sobre sí mismo de la manera trivial

G × G −→ G
(g , x) ↦−→ g x,

se induce entonces una acción de G sobre M . Demostraremos en primer


lugar que la acción de G sobre M determina una órbita de s elementos
{M1 , . . . , Ms } tal que p r−𝛼+1 no divide a s. En efecto, sabemos que

pr m
 
|M | = ;
p𝛼

si la longitud de cada una de las órbitas determinadas en M por el grupo G


es divisible por p r−𝛼+1 , entonces p r−𝛼+1 divide a |M |, debido a la ecuación
de clases, pero esto no es posible según la proposición 9.2.4.
Sea G1 el sugrupo estacionario de M1 . Queremos demostrar que G1
es de orden p 𝛼 . Sea |G1 | = t. De acuerdo con el teorema de Lagrange
|G : G1 ||G1 | = |G |, es decir, st = p r m. Sea pw la mayor potencia de p que di-
vide a s y pv la mayor potencia de p que divide a t, es decir, s = pw a, t = pv b.
Entonces, la mayor potencia de p que divide a st = n es pw+v . Por lo tanto,
w + v = r. Pero como p r−𝛼+1 no divide a s, entonces w < r − 𝛼 + 1, es decir,
w ≤ r − 𝛼, de aquí obtenemos que v = r − w ≥ 𝛼 y por lo tanto p 𝛼 | pv | t.
Así, p 𝛼 | t y con esto t ≥ p 𝛼 .
Sea ahora x ∈ M1 , nótese que G1 x ⊆ M1 . En efecto, sea g ∈ G1 , en-
tonces g x ∈ gM1 = M1 , es decir, g x ∈ M1 , y así obtenemos la inclusión
mencionada. De aquí, |G1 | = |G1 x| ≤ |M1 | = p 𝛼 , es decir, t ≤ p 𝛼 . De t ≥ p 𝛼
y t ≤ p 𝛼 resulta |G1 | = t = p 𝛼 .
Hemos probado que el grupo G contiene necesariamente un subgrupo
de orden p 𝛼 , el subgrupo G1 .
Pasamos ahora a demostrar la segunda afirmación del primer teorema
de Sylow. Supongamos que p 𝛼+1 divide a n = |G | y sea P un subgrupo de
G de orden p 𝛼 . Consideremos la acción de conjugación sobre el conjunto S
de subgrupos de G. Sea C la órbita del subgrupo P, es decir,

C = {gP g −1 | g ∈ G} = P G .
Teoremas de Sylow · 135

Recordemos que |C | = |G : NG (P)|, con NG (P) el normalizador de P en


G (es decir, el grupo estacionario de P mediante la acción de conjugación).
Nótese que
|G |
|C | = , entonces |G | = |C ||NG (P)|.
|NG (P)|
Consideremos 2 posibilidades: si p no divide a |C | y como p 𝛼+1 | |G |, enton-
ces necesariamente p 𝛼+1 | |NG (P)|. Nótese que entonces p divide al orden
del grupo cociente NG (P)/P. Según lo demostrado en la primera parte,
NG (P)/P debe contener un subgrupo de orden p. Según el teorema de co-
rrespondencia, dicho subgrupo es de la forma P ∗ /P, donde P ∗ ≤ G. Por lo
tanto,
|P ∗ | |P ∗ |
|P ∗ /P | = = 𝛼 = p,
|P | P
luego |P ∗ | = p 𝛼+1 , de donde, P ∗ es el subgrupo buscado.
Analicemos ahora la segunda posibilidad: p | |C |. Consideremos nueva-
mente el conjunto C de los subgrupos de G conjugados con P. El subgrupo
P actúa sobre C por conjugación, es decir, si gP g −1 ∈ C con g ∈ G, entonces
x( gP g −1 )x −1 ∈ C, para cada x ∈ P. La longitud de las órbitas determinadas
mediante esta acción divide al orden del grupo P, es decir, dichas longitudes
son de la forma p 𝛼i , con 0 ≤ 𝛼i ≤ 𝛼.
Nótese que uno de los elementos de C es el subgrupo P, luego la ór-
bita determinada por él consta de un sólo elemento, el subgrupo P. Sean
O1 = {P }, O2 , . . . , Os las órbitas que determinan la acción de P sobre C.
Entonces, por la ecuación de clases se tiene que

|C | = 1 + |O2 | + · · · + |Os |.

Puesto que p | |C | y las longitudes de las orbitas O2 , . . . , Os son potencias


de p, entonces debe existir al menos otra órbita con un sólo elemento Q, de
lo contrario p | 1, lo cual es falso. Q es entonces un subgrupo conjugado,
con P tal que xQx −1 = Q para cada x ∈ p, es decir, P normaliza Q.
Así, tenemos en G, subgrupos conjugados P y Q tales que P norma-
liza Q y P es un p-subgrupo de G. Según la proposición 9.1.8, PQ es
un p-subgrupo de G. Como Q es conjugado con P, existe g ∈ G tal que
P = gQ g −1 . En la prueba de la proposición 9.1.8 se vió que Q es subgrupo
normal de PQ. Nótese que en realidad la inclusión es propia: si Q = PQ
entonces P ≤ PQ = Q, luego P ≤ Q, pero |P | = |Q |, por lo tanto, P = Q, lo
cual es falso.
PQ/Q es un p-subgrupo no trivial, entonces p | |PQ/Q |, por lo tanto,
en PQ/Q hay un subgrupo Q ∗ /Q de orden p, luego |Q ∗ | = p|Q | = p 𝛼+1
136 · Teoremas de Sylow

y Q ≤ Q ∗ , con |Q ∗ | = p 𝛼+1 . Se tiene así que g −1 P g = Q ≤ Q ∗ , luego


P ≤ gQ ∗ g −1 y |gQ ∗ g −1 | = p 𝛼+1 .
Para terminar la demostración del primer teorema de Sylow veamons
que los p-subgrupos de Sylow de G son los subgrupos de G de orden p r ,
donde p r es la máxima potencia de p que divide al orden de G.
Demostramos en primer lugar la siguiente afirmación, consecuencia di-
recta del primer teorema de Sylow.
Afirmación. Sea G un grupo finito y H ≤ G un p-subgrupo de G. Enton-
ces, |H | = p n , n ≥ 0.
En efecto, sea H ≠ {1} y q | |H |, q un primo diferente de p. Entonces,
H contiene un subgrupo de orden q, el cual es cíclico, es decir, H contiene
un elemento de orden q. Pero esto contradice que H es un p-grupo. Por lo
tanto, el único primo que divide el orden de H es p, por lo tanto, |H | = p n ,
con n ≥ 0.
Regresamos sobre los p-subgrupos de Sylow de G. Sea H un p-subgrupo
de Sylow de G. Entonces, según la afirmación anterior, |H | = p 𝛼 , con
0 ≤ 𝛼 ≤ r. Si 𝛼 ≠ r, entonces H está incluido en un grupo de orden p 𝛼+1 .
Pero esto contradice la condición de ser H maximal. Por lo tanto, |H | = p r .
Sea ahora K un p-subgrupo de G de orden p r , con p r la máxima potencia
de p que divide al orden de G. Sea H un p-subgrupo de G que contiene a K;
como vimos, |H | = p 𝛼 , pero como p r es la máxima potencia de p que divide
a |G |, entonces 𝛼 = r y así H = K, es decir, K es maximal y, por lo tanto,
K es un p-subgrupo de Sylow de G. Hemos concluido la demostracion del
primer teorema de Sylow.
(ii) Conjugación: sean nuevamente G un grupo de orden n y p r la máxi-
ma potencia de p que divide a n = p r m, con m. c. d.(p, m) = 1. Sea P un
p-subgrupo de Sylow de G, es decir, |P | = p r . Consideremos nuevamente
la acción de conjugación sobre el conjunto S de los subgrupos de G. Sea C
la órbita del subgrupo P, es decir C = {gP g −1 | g ∈ G} = P G , en otras
palabras, C es el conjunto de todos los subgrupos de G conjugados con P.
Sea Q otro p-subgrupo de Sylow de G. Se desea probar que Q ∈ C.
El subgrupo Q actúa nuevamente con la acción de conjugación sobre C,
dividiendo a C en órbitas. La longitud de cada órbita divide al orden de Q,
|Q | = p r . Por lo tanto, la longitud de cada órbita es de la forma p 𝛼 , con
0 ≤ 𝛼 ≤ r. Nótese que
|G |
|C | = ,
|NG (P)|
o también, |C ||NG (P)| = |G | = p r m, como P ≤ NG (P), entonces
|P | = p r | |NG (P)|. Puesto que p r es la máxima potencia de p que divi-
de a n = |G |, entonces p no divide a |C |. Por lo dicho anteriormente, debe
Teoremas de Sylow · 137

existir al menos una órbita de un sólo elemento P ′. Esto implica que para
cada x ∈ Q se tiene que xP ′ x −1 = P ′, es decir, Q normaliza P ′. Además,
como P ′ es conjugado con P, entonces P ′ es un p-subgrupo de Sylow. Te-
nemos que Q/P ′ ∩ Q es un p-grupo. Se tiene el isomorfismo
P ′Q/P ′  Q/P ′ ∩ Q.
Puesto que P ′ es un p-grupo y P ′Q/P ′ también lo es, entonces P ′Q es un
p-subgrupo de G. Nótese que P ′ ≤ P ′Q y Q ≤ P ′Q, como P ′ y Q son
p-subgrupos de Sylow, entonces P ′ = P ′Q = Q.
(iii) Cantidad: como P es un p-subgrupo de Sylow de G todos los
p-subgrupos de Sylow de G están en P G , además, cada subgrupo gP g −1
de P G es un p-subgrupo de Sylow. La primera afirmación fue demostra-
da en (ii) y la segunda se desprende de que |gP g −1 | = |P |. Por lo tanto, el
número de p-subgrupos de Sylow de G es igual al cardinal de P G .
Puesto que |P G ||NG (P)| = |G |, entonces el número de p-subgrupos de
Sylow de G divide el orden de G. P actúa sobre P G mediante la acción
de conjugación determinando al menos una órbita de un sólo elemento:
{P }. Supóngase que P determina otra órbita de un sólo elemento Q, con
Q ≠ P. Entonces, se tiene que P y Q con conjugados, P normaliza Q, P es
un p-subgrupo. De aquí obtenemos que PQ es un p-subgrupo, y además,
P ⊊ PQ. Esto contradice la maximalidad de P. Por lo tanto, P determina
sobre P G sólo una órbita unitaria. Como las longitudes de las órbitas dividen
a p r = |P |, entonces |P G | ≡ 1 (mód p). ✓

4. Aplicaciones
Proposición 9.4.1. Sea G un grupo finito y H un p-subgrupo de Sylow de G.
Entonces, H ⊴ G si, y sólo si, H es único.

Demostración. ⇐): sea x ∈ G, entonces xH x −1 = |H |, luego xH x −1 es
p-subgrupo de Sylow, de donde xH x −1 = H , por lo tanto, H ⊴ G.
⇒): si K es un p-subgrupo de Sylow, entonces K = xH x −1 = H , luego
H es único. ✓

Corolario 9.4.2. Sea G un grupo finito y H el p-subgrupo de Sylow de G tal que


H ⊴ G. Entonces, H = {x ∈ G | |x| es una potencia de p}.
Demostración. Si x ∈ H , como H por definición es p-subgrupo, entonces |x|
es una potencia de p. De otra parte, sea x ∈ G tal que |x| = p 𝛼 , entonces ⟨x⟩
es un p-subgrupo de G, luego ⟨x⟩ está contenido en el único p-subgrupo de
Sylow de G. ✓

138 · Teoremas de Sylow

La proposición anterior sirve para caracterizar todos los subgrupos de


orden pq, con p > q y p, q primos.

Proposición 9.4.3. Sea G un grupo de orden pq con p y q primos y p > q.


Entonces,

(i) G  ℤpq ó

(ii) G es no abeliano y se tiene que

G = Gpq := ⟨a, b | a p = 1, b q = 1, bab −1 = ak ,


con k . 1 (mód p) , k q ≡ 1 (mód p) y p ≡ 1 (mód q) ⟩.

Demostración. G contiene al menos un subgrupo de Sylow H = ⟨a⟩ de orden


p y un subgrupo de Sylow K = ⟨b⟩ de orden q. Sean np y nq el número de
estos subgrupos de Sylow, como p > q entonces np = 1. De aquí se afirma
que H ⊴ G. Para nq se tienen entonces dos posibilidades, nq = 1 ó nq = p.
Caso 1. En G sólo hay un subgrupo de Sylow de orden q. Entonces,
K ⊴ G y aba−1 b −1 ∈ H ∩ K = 1, luego ab = ba, y entonces, G  ℤpq .
Caso 2. En G hay p subgrupos de Sylow de orden q. Entonces, p ≡ 1
(mód q). Veamos que esta situación es descrita por (ii). G no es abeliano, en
caso contrario nq = 1, como H ⊴ G existe 1 < k < p tal que bab −1 = ak y
k . 1(mód p). Si k ≡ 1 (mód p), entonces p | (k − 1), luego ak−1 = 1, con lo
cual ak = a, y así, ab = ba, es decir, G  ℤpq y G sería abeliano.
Nótese que escogiendo k entre 1 y p tal k es único. Observemos que
2
b ab −2 = ak . En efecto,
2

2
(ak ) k = ak = (bab −1 ) k = ba k b −1 = b(bab −1 )b −1 = b 2 ab −2 .

Podemos generalizar esta relación por inducción y probar que


n
b n ab −n = a k , con n ≥ 0. (4.1)
q
Tomando en particular n = q obtenemos que a = ak , luego p | (k q − 1), y
de esta forma, k q ≡ 1(mód p).
Sea ahora W = ⟨a, b⟩ ≤ G y x ∈ W . Entonces, x = a r1 b l1 · · · arm b lm , con
0 ≤ ri ≤ p − 1, 0 ≤ li ≤ q − 1 y 0 ≤ i ≤ m. Consideremos el producto b l ar ,
n
con 0 ≤ l ≤ q − 1 y 0 ≤ r ≤ p − 1. De (4.1) se desprende que b n a r b −n = a rk ,
n
con n ≥ 0 y r ≥ 0. De aquí obtenemos que b n a r = a rk b n , y de esta relación
resulta que cada elemento x ∈ G toma la forma x = ar b l , con 0 ≤ r ≤ p −1 y
0 ≤ l ≤ q − 1. De tales x tenemos máximo pq. Veamos que son exactamente
pq. Sean 0 ≤ r, s ≤ p − 1 y 0 ≤ l, m ≤ q − 1 tales que ar b l = a s b m , entonces
Teoremas de Sylow · 139


b m−l = a r−s ∈ ⟨a⟩ ∩ ⟨b⟩, por lo tanto b m−l | p y b m−l | q, luego b m−l = 1.
Por la condición de m y l se tiene que m = l. Análogamente, r = s.
Así, |W | = pq, con lo cual G = W . Hemos probado que G cumple todas
las condiciones de (ii). Por último, escribamos los elementos de Gpq :

Gpq = {1, a, a2 , . . . , a p−1 ; b, b 2 , . . . , b q−1 ;


ab, ab 2 , . . . , ab q−1 ; . . . ; a p−1 b, . . . , a p−1 b q−1 },

y describamos la regla de multiplicación en Gpq :


l
a r b l a s b m = ar+sk b l+m , con r , l , s, m ≥ 0. ✓

Proposición 9.4.4. Si p es primo impar y G es un grupo de orden 2p, entonces


G  ℤ2p ó G  Dp .

Demostración. Si G es abeliano, entonces G  ℤ2p . En caso contrario, exis-


ten a, b ∈ G, donde |a| = p, |b| = 2, bab −1 = ak , con k . 1(mód p),
k 2 ≡ 1(mód p), y además, p ≡ 1(mód 2), para algún 2 ≤ k ≤ p − 1.
Supongamos que k ≤ p − 2. Como p | (k 2 − 1), entonces p | k + 1 ó
p | k − 1. Por la condición de k, obtenemos una contradicción. Así, k = p − 1
y bab = a p−1 = a −1 . Entonces, G  Dp . ✓

Corolario 9.4.5. Los grupos de orden 6 son ℤ6 y D3  S3 .

Demostración. Consecuencia directa de la proposición anterior. ✓


Proposición 9.4.6. Los grupos no abelianos de orden 8 son D4 y Q8 .

Demostración. Sea G un grupo no abeliano de orden 8. Entonces, en G debe


existir al menos un elemento a de orden 4. En efecto, si todos los elementos
≠ 1 tienen orden 2, entonces G es abeliano. G tampoco posee elementos de
orden 8, ya que en caso contrario sería cíclico y, por lo tanto, abeliano.
Puesto que |G : ⟨a⟩| = 2, entonces ⟨a⟩ ⊴ G. Evidentemente existe al
menos un elemento b en G tal que b ∉ ⟨a⟩ . Nótese que los elementos
1, a, a 2 , a 3 , b, ba, ba 2 , ba 3 son diferentes, con lo cual G = ⟨a, b⟩. Ya que
|G : ⟨a⟩| = 2, entonces b 2 ∈ ⟨a⟩. En efecto, como en G/⟨a⟩ sólo hay dos
clases, entonces b 2 ≠ b (de lo contrario, b = 1, y así, b ∈ ⟨a⟩). Se presentan
entonces las siguientes posibilidades: b 2 = 1, a, a2 , a3 .
Si b 2 = a, entonces b 8 = a4 = 1, luego |b| = 8, falso.
Si b 2 = a3 , entonces b 8 = a12 = 1, luego |b| = 8, falso.
Se tiene entonces que b 2 = 1 ó b 2 = a2 .
De otra parte, como ⟨a⟩ ⊴ G, entonces bab −1 = 1, a, a2 , a3 .
140 · Teoremas de Sylow

Si bab −1 = 1, entonces a = 1, falso.


Si bab −1 = a, entonces ab = ba ⇒ G es abeliano,
falso.
Si bab −1 = a 2 , entonces bab −1 = |a| = a2 = 4 = 2, imposible.
En total, bab −1 = a3 = a−1 .
Así, se tiene que G es un grupo generado por dos elementos a y b para
los cuales a4 = 1, b 2 = 1 y bab −1 = a −1 ó a 4 = 1, b 2 = a 2 y bab −1 = a−1 . En
el primer caso G  D4 , y en el segundo, G  Q8 . ✓

Proposición 9.4.7. Los grupos no abelianos de orden 12 son A4 , D6 y

T := ⟨a, b | a6 = 1, b 2 = a3 , bab −1 = a −1 ⟩.

Demostración. Sea H un subgrupo de Sylow de G con orden 3, H = ⟨c⟩.


Mediante el refinamiento del teorema de Cayley (véase el ejemplo 8.2.6)
podemos definir un homomorfismo

Φ : G −→ S (G/H )  S4 .

Nótese que ker(Φ) ⊆ H (ker(Φ) es el subgrupo normal más grande de G


contenido en H ), luego ker(Φ) = 1 ó ker(Φ) = H . Si ker(Φ) = 1, entonces
G es isomorfo a un subgrupo de S4 de orden 12. Pero se puede probar que
si n ≥ 2, G ≤ Sn y |G | = n! 2 , luego G = An (véase el ejecicio 6 del presente
capítulo).
Supongamos ahora que ker(Φ) = H , entonces H es normal en G y, por
lo tanto, H es el único 3-subgrupo de Sylow. Entonces, en G sólo hay dos
elementos de orden 3, c y c 2 . Puesto que dos elementos conjugados tienen el
mismo orden, entonces |cG | = 1 ó 2, luego |CG (c)| = 12 ó 6. En cualquiera
de los dos casos CG (c) contiene un elemento d de orden 2. Como cd = dc,
sea a := cd, entonces |a| = 6, con lo cual ⟨a⟩ ⊴ G y |G/⟨a⟩| = 2.
Sea b ∈ G con b ∉ ⟨a⟩, entonces b 2 ∈ ⟨a⟩ (véase la prueba de la propo-
sición 9.4.6), luego b 2 = 1, a, a2 , a3 , a4 , a5 . Como bab −1 ∈ ⟨a⟩, entonces
bab −1 = 1, a, a 2 , a 3 , a 4 , a 5 .
Si bab −1 = 1, entonces a = 1, falso.
Si bab −1 = a, entonces ab = ba, luego ⟨a, b⟩ es abeliano, pero este sub-
grupo tiene 12 elementos y, por lo tanto, coincide con G, falso.
Si bab −1 = a2 , entonces (bab −1 ) 3 = 1, luego ba3 b −1 = 1, con lo cual
a 3 = 1, falso.
Si bab −1 = a 3 , entonces (bab −1 ) 2 = 1, luego a 2 = 1, falso.
Si bab −1 = a 4 , entonces (bab −1 ) 3 = 1, luego a 3 = 1, falso.
Si bab −1 = a5 = a −1 , entonces bab −1 = a−1 , es una una condición nece-
saria en G.
Teoremas de Sylow · 141

Consideremos ahora las posibilidades de b 2 :


b 2 = 1 es una posibilidad.
6
Si b 2 = a, entonces b 2 = 1, luego b 12 = 1, con lo cual |b| | 12. Así,
Si |b| = 1, entonces b = 1, falso.
Si |b| = 2, entonces b 2 = 1 = a, falso.
Si |b| = 3, entonces b 2 b = 1, luego ab = 1, con lo cual b ∈ ⟨a⟩, falso.
Si |b| = 4, entonces b 4 = a2 = 1, falso.
Si |b| = 6, entonces b 6 = a3 = 1, falso.
Por lo tanto, |b| = 12 ⇒ G es abeliano, falso.
2
b 2 = a2 : como bab −1 = a −1 , entonces bab −1 = a−2 , luego ba 2 b −1 =
a−2 , con lo cual bb 2 b −1 = a −2 , es decir, b 2 = a−2 = a2 , así a 4 = 1, falso.
b 2 = a 3 es una posibilidad.
4
b 2 = a 4 : como bab −1 = a−4 , entonces ba 4 b −1 = a −4 , luego bb 2 b −1 =
a−4 , con lo cual b 2 = a−4 = a 4 , es deci, a8 = 1, y por tanto 6 | 8, imposible.
6 6
b 2 = a5 : Como b 2 = a5 = 1, entonces b 12 = 1, luego |b| | 12. De
esta manera,
Si |b| = 1, entonces b = 1, falso.
Si |b| = 2, entonces a5 = 1, falso
Si |b| = 3, entonces a15 = 1, luego 6 | 15, falso.
Si |b| = 4, entonces a10 = 1, falso.
Si |b| = 6, entonces a15 = 1, falso.
Si |b| = 12, entonces G es abeliano, falso.
Resumiendo los resultados anteriores obtenemos que si G es un grupo
no abeliano de orden 12, entonces G = A4 , ó en G se tienen dos elementos
a y b tales que a6 = 1, b 2 = 1 y bab −1 = a−1 , ó en G hay dos elementos a y
b tales que a 6 = 1, b 2 = a 3 y bab −1 = a −1 .
Veamos que en los dos últimos casos G = ⟨a, b⟩. En ambas situaciones
consideremos el conjunto

C := {ak b m | 0 ≤ k ≤ 5 y 0 ≤ m ≤ 1},

y sean 0 ≤ k1 , k2 ≤ 5 y 0 ≤ m1 , m2 ≤ 1 tales que a k1 b m1 = a k2 b m2 , entonces


ak1 −k2 = b m2 −m1 . Supongamos que m2 ≠ m1 , por ejemplo m2 > m1 , entonces
ak1 −k2 = b ∈ ⟨a⟩, lo cual es falso, luego m2 = m1 y k1 = k2 .
Así, en A hay 12 elementos y, en consecuencia, G = ⟨a, b⟩. En total
obtenemos que si G es un grupo no abeliano de orden 12, entonces G es
alguno de los siguientes grupos:

A4 ; D6 = ⟨a, b | a6 = 1, b 2 = 1, bab −1 = a−1 ⟩;


T = ⟨a, b | a6 = 1, b 2 = a3 , bab −1 = a −1 ⟩. ✓

142 · Teoremas de Sylow

5. Ejercicios
1. Sea G un grupo formado por dos elementos x y y tales que:

(i) x p = 1 (es decir, x es de orden p);


(ii) y q = 1 (es decir, y es de orden q < p);
(iii) Existe 1 < k0 < p, k0 . 1(mód p) tal que yxy −1 = x k0 ;
q
(iv) k0 ≡ 1 (mód p);
(v) p ≡ 1 (mód q).

Pruebe que G  Gpq .

2. Demuestre que ningún grupo de orden pq es simple, con p y q primos.

3. Demuestre que todo grupo de orden 15 es cíclico.

4. Demuestre que todo grupo de orden 35 es cíclico.

5. Demuestre que todo grupo de orden 77 es cíclico.


n!
6. Demuestre que si n ≥ 2, H ≤ Sn y |H | = 2, entonces H = An (véase
la demostración de la proposición 9.4.7).

7. Calcule todos los 3-subgrupos de Sylow del grupo T .

8. Calcule el grupo Aut(T ).

9. Calcule el grupo Aut(Gpq ).


Capítulo
diez
Grupos abelianos
finitos
Grupos abelianos finitos · 145

El objetivo central de este capítulo es describir para un entero positivo n


todos los grupos abelianos de orden n (salvo isomorfismo). La descripción
se hará en términos de p-grupos cíclicos, los cuales, como veremos, son
indescomponibles. Se establecerá además un criterio para la unicidad de
dicha descomposición.

1. p-grupos abelianos finitos


r
Comenzamos probando que todo grupo finito G de orden n = p1r1 · · · pkk
es suma directa de sus subgrupos de Sylow si, y sólo si, estos son norma-
les. Cuando G es abeliano esta condición se tiene y podemos enunciar el
siguiente teorema.

Teorema 10.1.1. Sea G un grupo finito de orden n,


r
|G | = n = p1r1 · · · pkk , p1 , . . . , pk primos diferentes y r1 , . . . , rk ≥ 1.

Entonces, G es suma directa de sus subgrupos de Sylow si, y sólo si, estos son normales
en G:
G = P1 ⊕ · · · ⊕ Pk , (1.1)
con Pi el pi -subgrupo de Sylow de G, 1 ≤ i ≤ k. En particular, si G es abeliano,
entonces G es suma directa interna de sus subgrupos de Sylow.

Demostración. ⇒): si G es suma directa de sus subgrupos de Sylow, entonces


por la definición de suma directa, cada sumando es subgrupo normal de G.
⇐): para 1 ≤ i ≤ k, sea Pi un pi -subgrupo de Sylow de G tal que Pi es
un subgrupo normal de G. Entonces, Pi es único. Probaremos que (1.1) se
cumple. Veremos que cada elemento x ∈ G tiene una representación única
en la forma x = x1 · · · xk , con xi ∈ Pi , 1 ≤ i ≤ k.
(a) Por razones de orden de sus elementos, para i ≠ j se tiene que
Pi ∩ P j = 1.
(b) A partir de (a) se obtiene que para i ≠ j, los elementos de Pi conmu-
tan con los de P j .
(c) El neutro 1 de G tiene representación única: sean xi ∈ Pi , 1 ≤ i ≤ k
tales que 1 = x1 · · · xk . Sea si = |xi |, entonces si = pi𝛼i , 0 ≤ 𝛼i ≤ ri . Sea
s = s1 · · · si−1 si+1 · · · sk , entonces 1s = xis , luego si |s y
𝛼i−1 𝛼i+1 𝛼
pi𝛼i |p1𝛼1 c · · · pi−1 pi+1 · · · pk k .

Esto implica que 𝛼i = 0, luego si = 1, es decir, xi = 1, para cada 1 ≥ i ≥ k.


146 · Grupos abelianos finitos

(d) Cada elemento x ∈ G se puede representar en la forma única anun-


s
ciada: sea x ∈ G de orden r de tal forma que r |n y r = p1s1 . . . pkk , donde
0 ≤ si ≤ ri con 1 ≤ i ≤ k. Sea ui = rsi , entonces m. c. d.(u1 , . . . , uk ) = 1.
pi
Existen enteros t1 , . . . , tk tales que 1 = t1 u1 + · · · + tk uk , sea xi = x ti ui ,
1 ≥ i ≥ k. Nótese que
s
pi si si
xi i = (x ti ui ) pi = x ti ui pi = x ti r = 1,

luego xi ∈ Pi . Se tiene que x1 · · · xk = x t1 u1 · · · x tk uk = x t1 u1 +···+tk uk = x 1 = x.


A partir de (b) y (c) se obtiene que esta representación es única. ✓

r
Corolario 10.1.2. Sea n = p1r1 · · · pkk . Entonces,

ℤ n  ℤ p r1 × · · · × ℤ p rk .
1 k

Demostración. Consecuencia inmediata del teorema anterior. ✓


El propósito principal para la descripción de los grupos abelianos fini-


tos consiste en expresar G como suma directa de subgrupos de estructura
simple y conocida, como por ejemplo a tráves de subgrupos cíclicos. Desde
luego que sobre estos subgrupos habrá que colocar alguna restricción ya que
de lo contrario la descomposición no sería única. Nótese por ejemplo que
ℤ6  ℤ2 × ℤ3 .
Nuestro objetivo inmediato es estudiar los p-grupos abelianos finitos, es
decir, los grupos abelianos cuyo orden es de la forma p n con n ≥ 0.

Proposición 10.1.3. Si G es un grupo cíclico de orden p n , entonces G no se


puede descomponer en suma directa de subgrupos cíclicos de orden menor, es decir,
G es irreducible.

Demostración. Sabemos que G  ℤpn  ℂpn . Probemos inicialmente que los


únicos subgrupos de ℂpn son los subgrupos de la cadena

{1} = ℂp0 ⊂ ℂp1 ⊂ ℂp2 ⊂ · · · ⊂ ℂpn−1 ⊂ ℂpn .

Sea K ≤ ℂpn , entonces |K| | p n , luego |K| = p 𝛼 , 0 ≤ 𝛼 ≤ n; sea x 𝜖 K,


entonces x p = 1, de donde K ≤ ℂp𝛼 y K = ℂp𝛼 .
𝛼

Ahora, si existieran H , K en ℂpn tales que ℂpn = H ⊕ K, entonces


H = ℂp𝛼 , K = ℂp 𝛽 y H ∩ K = {1}. Para 𝛼 y 𝛽 dados se tiene que 𝛼 ≤ 𝛽 ó
𝛽 ≤ 𝛼. En el primer caso, H ≤ K y H ∩ K = H = {1}, luego 𝛼 = 0 y 𝛽 = n.
En el segundo caso K ≤ H , H ∩ K = K = {1}, y entonces, 𝛼 = n, 𝛽 = 0.

En total, la única descomposición de ℂpn es la trivial: ℂpn = {1} ⊕ ℂpn . □
Grupos abelianos finitos · 147

Ejemplo 10.1.4. ℤ4 y ℤ2 ⊕ ℤ2 no son isomorfos. ℤ9 y ℤ3 ⊕ ℤ3 no son


isomorfos.

Teorema 10.1.5. Cada p-grupo abeliano finito G es suma directa de subgrupos


cíclicos.

Demostración. Sea G un p-grupo abeliano finito, entonces |G | = p n , con n ≥


0. La prueba se realiza por inducción sobre n.
Si n = 0 ó n = 1, entonces G es cíclico y no hay nada más que demostrar.
Sea n ≥ 2. Suponemos que el teorema ya ha sido probado para grupos
de orden p 𝛼 con 0 ≤ 𝛼 < n. Sea G de orden p n . Si G es cíclico, entonces
según la proposición anterior la única descomposición de G es la trivial:
G = {1} ⊕ G.
Supongamos que G no es cíclico. Cada elemento a de G, a ≠ 1, tiene
orden de la forma |a| = p 𝛽 con 0 < 𝛽 < n. Escojamos un a ≠ 1 que tenga
orden maximal p m (esto quiere decir que no existe y en G tal que |y| = p m+1 ).
n
Consideremos el grupo cociente G = G/⟨a⟩. Puesto que |G | = ppm = p n−m
y 0 < n − m < n, entonces según la hipótesis inductiva

G = G1 ⊕ · · · ⊕ Gr ,

donde cada G i es un subgrupo cíclico de G de orden |Gi | = p mi ,


1 ≤ mi ≤ n − m, 1 ≤ i ≤ r; además,

m1 + m2 + · · · + mr = n − m.

Sea G i = ⟨𝛿 i ⟩, 𝛿 i = 𝛿i ⟨a⟩, 𝛿i 𝜖 G, 1 ≤ i ≤ r. Parece lógico pensar que


G = ⟨𝛿1 ⟩ ⊕ · · · ⊕ ⟨𝛿r ⟩ ⊕ ⟨a⟩. Sin embargo no es este el caso, pero con ayuda
de los elementos 𝛿1 , . . . , 𝛿r construiremos otros elementos a1 , . . . , ar , y
para ellos demostraremos que G = ⟨a1 ⟩ ⊕ ⟨a2 ⟩ ⊕ · · · ⊕ ⟨ar ⟩ ⊕ ⟨a⟩.
m p mi
Nótese que para cada 1 ≤ i ≤ r, (𝛿 i ) p i = 𝛿i = 1, por lo tanto,
m
p i p mi s m
𝛿i ∈ ⟨a⟩, y entonces, 𝛿i = a , con 0 ≤ si < p . Sea |bi | = p 𝛼i con
i

p mi 𝛼
1 ≤ 𝛼i ≤ m, entonces (bi ) p i = (a si ) p i , luego 1 = a si p i , con lo cual
𝛼 𝛼

p m |si p 𝛼i y existe ti tal que si = ti p m−𝛼i . Definimos

ai =: 𝛿i a−ti , con 1 ≤ i ≤ r.

Nótese que para cada 1 ≤ i ≤ r, ai = 𝛿 i : en efecto, ai = ai ⟨a⟩ = 𝛿i ⟨a⟩ = 𝛿 i


ya que ai 𝛿i−1 = a−ti ∈ ⟨a⟩. De aquí obtenemos que ⟨a i ⟩ = ⟨𝛿 i ⟩ = G i ,
1 ≤ i ≤ r. Por lo tanto,
G = ⟨a i ⟩ ⊕ · · · ⊕ ⟨a r ⟩.
148 · Grupos abelianos finitos

Sea x un elemento cualquiera de G. Entonces, x = x 1 · · · x r , con


x i ∈ ⟨ai ⟩, 1 ≤ i ≤ r. Resulta x i = ai ki , 0 ≤ ki < p mi , luego x i = aiki , y
entonces, x = a1k1 · · · arkr , es decir, x(a1k1 · · · arkr ) −1 = ak ∈ ⟨a⟩, con lo cual
x = a1k1 · · · arkr a k .
Se ha probado que cada elemento x de G se expresa como producto de
elementos de ⟨a1 ⟩ · · · ⟨ar ⟩ y ⟨a⟩. Queda por demostrar que la representación
es única. Para esto es suficiente demostrar la unicidad de la representación
del elemento identidad 1. Sea

1 = a1k1 · · · arkr ak , con 0 ≤ ki < p mi , 0 ≤ k < p m .

Mediante el homomorfismo G −→ G /⟨a⟩ obtenemos 1 = a1k1 · · · arkr , luego


a1k1 = 1 · · · arkr = 1 ya que G = G1 ⊕ · · · ⊕ Gr y aiki 𝜖Gi , 1 ≤ i ≤ r, por lo
tanto, aiki 𝜖 ⟨a⟩, 1 ≤ i ≤ r, y entonces, aiki = a z , con 0 ≤ z < p m . Se tiene que
𝛿iki a −ti ki = a z , luego 𝛿iki = a z+ti ki , es decir, 𝛿iki = a z+ti ki = 1, luego (𝛿i ) ki = 1.
Como |𝛿i | = p mi y 0 ≤ ki < p mi , entonces ki = 0, 1 ≤ i ≤ r, y de esta forma,
1 = ak . Como 0 ≤ k < p m y |a| = p m , resulta k = 0. ✓

El teorema anterior ha probado que cada grupo abeliano finito de orden


p n se descompone en suma directa de subgrupos cíclicos

G = G1 ⊕ · · · ⊕ Gr ,

donde |Gi | = p mi , con 1 ≤ mi ≤ n, 1 ≤ i ≤ r, m1 + · · · + mr = n y 1 ≤ r ≤ n


(Nótese que aquí se ha incluido el caso trivial en el que G es cíclico y r = 1).
Vale la pena entonces preguntar sobre la unicidad de la descomposición
anterior.

Teorema 10.1.6. Si un grupo abeliano finito G se descompone en dos formas en


producto de subgrupos cíclicos

G = G1 ⊕ · · · ⊕ Gr = H1 ⊕ · · · ⊕ Hs ,

entonces r = s y los órdenes |Gi | coinciden con los órdenes |H j | después de una
reordenación de índices.

Demostración. Este resultado se puede enunciar y probar de una manera más


general usando teoría de módulos; omitimos su demostración e invitamos
al lector a consultar [24]. ✓

Grupos abelianos finitos · 149

2. Sistemas de invariantes
Según el teorema 10.1.5, cada p-grupo abeliano finito G , |G | = p n , deter-
mina un arreglo ordenado (p m1 , . . . , p mr ) conformado por los órdenes de
los subgrupos cíclicos de su descomposición:

G = G1 ⊕ · · · ⊕ Gr , |Gi | = p mi .

La suma directa se puede reordenar de tal forma que


m1 ≥ m2 ≥ · · · ≥ mr ≥ 1, 1 ≤ r ≤ n (se ha incluido el caso trivial cuando G
es cíclico y r = 1). Según el teorema 10.1.6, la longitud r del arreglo así co-
mo sus componentes p m1 , . . . , p mr , están determinadas unívocamente por
el grupo G. Esta primera observación permite dar la siguiente definición.

Definición 10.2.1. Sea G un p-grupo abeliano finito, |G | = p n .

(i) Se dice que G es del tipo (p m1 , . . . , p mr ) si G es suma directa de sub-


grupos cíclicos de órdenes p mi , con 1 ≤ i ≤ r, m1 ≥ m2 ≥ · · · ≥ mr ,
1 ≤ r ≤ n y m1 + · · · + mr = n. Los componentes p m1 , . . . , p mr se
denominan divisores elementales del grupo G.

(ii) Sean A y B dos p-grupos abelianos finitos con el mismo sistema de


divisores elementales (p m1 , . . . , p mr ). Entonces, A = A1 × · · · × Ar ,
B = B1 × · · · × Br , con Ai  ℤpmi  Bi . El sistema de isomorfismos 𝜑i
induce el isomorfismo

𝜑 : A −→ B
𝜑(a1 , . . . , ar ) := (𝜑1 (a1 ), . . . , 𝜑r (ar )).

Hemos probado entonces la siguiente proposición.

Proposición 10.2.2. Con sus divisores elementales, cada p-grupo abeliano finito
queda determinado unívocamente salvo isomorfismo.

Veamos con un ejemplo la ilustración de los resultados anteriores.

Ejemplo 10.2.3. Sea p un primo cualquiera y n = 4. Determinemos todos


los posibles grupos abelianos de orden p 4 . Los divisores elementales posi-
bles son: (p 4 ), (p 3 , p), (p 2 , p 2 ), (p 2 , p, p), (p, p, p, p). Salvo isomorfismo,
únicamente se tienen los siguientes grupos distintos de orden p 4 :

ℤp 4 , ℤp 3 ⊕ ℤp , ℤp 2 ⊕ ℤp 2 , ℤp 2 ⊕ ℤp ⊕ ℤp y ℤp ⊕ ℤp ⊕ ℤp ⊕ ℤp .

El ejemplo anterior permite la siguiente generalización.


150 · Grupos abelianos finitos

Definición 10.2.4. Sea n un entero positivo. Una sucesión de enteros po-


sitivos (m1 , . . . , mr ), con m1 ≥ m2 ≥ · · · ≥ mr ≥ 1 y m1 + · · · + mr = n se
denomina una partición de n. Sea p(n) el número de particiones de n.

Ejemplo 10.2.5. Para n = 4, se tiene entonces (4), (3, 1), (2, 2), (2, 1, 1),
(1, 1, 1, 1), es decir, p(4) = 5.

Proposición 10.2.6. Sea F la clase de todos los grupos abelianos no isomorfos


de orden p n , n ≥ 1, y sea P el conjunto de todas las particiones de n. Existe una
correspondencia biunívoca entre F y P, es decir, el número de grupos abelianos no
isomorfos de orden p n es finito e igual a p(n).

Demostración. Según hemos visto, cada elemento G de F determina unívo-


camente su tipo (p m1 , . . . , p mr ), con m1 ≥ m2 ≥ · · · ≥ mr y m1 + · · · + mr = n.
Tenemos entonces la función

h : F −→ Ph(G) := (m1 , . . . , mr ).

Cada partición (m1 , . . . , mr ) determina un único grupo (salvo isomorfismo)


con sistema de divisores elementales (p m1 , . . . , p mr ). Así, h es 1 − 1. Ahora,
h es sobre: (m1 , . . . , mr ) determina (p1m1 , . . . , p mr ) y ℤpm1 ⊕ · · · ⊕ ℤpmr es la
preimagen. □✓

Ejemplo 10.2.7. (i) Determinemos todos los subgrupos abelianos de orden


4: 4 = 22 , por lo que en este caso p = 2, n = 2, luego tenemos (4) y (2, 2)
y, así, los subgrupos son ℤ4 y ℤ2 ⊕ ℤ2  V (el cuarto grupo de Klein).
(ii) Determinemos todos los grupos abelianos de orden 125: p = 5,
n = 3, luego (53 ), (52 , 5) y (5, 5, 5) y, así, los grupos son ℤ125 , ℤ25 ⊕ ℤ5 y
ℤ5 ⊕ ℤ5 ⊕ ℤ5 .

Definición 10.2.8. Un grupo abeliano de orden p n con sistema de divisores


elementales (p, . . . , p) (es decir, isomorfo a ℤp ⊕ · · · ⊕ ℤp ) se denomina
grupo abeliano elemental.

3. Grupos abelianos finitos


De los resultados de las secciones anteriores obtenemos las siguientes con-
clusiones.

Teorema 10.3.1. Cada grupo abeliano finito es suma directa de p-subgrupos cí-
clicos. Dos descomposiciones difieren sólo en el orden de disposición de los sumandos.
Grupos abelianos finitos · 151

Demostración. Sea G un grupo abeliano finito de orden n y


n
|G | = p1n1 · · · pk k , con p1 , . . . , pk primos diferentes.

Entonces, según el teorema 10.1.1, G tiene una descomposición única en


suma directa de sus subgrupos de Sylow (sus componentes primarias),

G = P1 ⊕ · · · ⊕ Pk .

Por el teorema 10.1.5, cada componente primaria Pi , 1 ≤ i ≤ k, se descom-


pone en suma directa de subgrupos cíclicos (componetes primarias cíclicas).
Además, según el teorema 10.1.6, cada componente primaria Pi determina
unívocamente el número y orden de sus subgrupos cíclicos:

P1 = G11 ⊕ · · · ⊕ Gt11 , P2 = G12 ⊕ · · · ⊕ Gt22 , . . . , Pk = G1k ⊕ · · · ⊕ Gtkk ,

donde los G ij son pi -subgrupos cíclicos. Entonces,

G = G11 ⊕ · · · ⊕ Gt11 ⊕ G12 ⊕ · · · ⊕ Gt22 ⊕ · · · ⊕ G1k ⊕ · · · ⊕ Gtkk .

Si G tiene otra descomposición en suma directa de subgrupos primarios


cíclicos G = H1 ⊕H2 ⊕· · ·⊕Hl , entonces podemos ordenar dichos sumandos
de tal forma que colocamos todos los p1 -grupos a la izquierda, los p2 -grupos
enseguida a la derecha, y así sucesivamente. Según el primer teorema de
Sylow, en esta nueva descomposición de G deben aparecer pi -grupos para
cada primo pi , 1 ≤ i ≤ k.
Además, según el segundo teorema de Sylow, los pi -sumandos confor-
man el pi -subgrupo de Sylow de G. Luego según el teorema 10.1.6, los pi
sumandos de la nueva descomposición deben ser tantos como ti , 1 ≤ i ≤ k,
además, los órdenes deben coincidir con los órdenes de G1i , . . . , Gtii . ✓

El teorema anterior describe de manera completa los grupos abelianos


finitos en términos de grupos primarios cíclicos.

Corolario 10.3.2. El número de grupos abelianos no isomorfos de orden


n
n = p1n1 · · · pk k , con p1 , . . . , pk primos diferentes,

es p(n1 )p(n2 ) · · · p(nk ), donde p(ni ) es el número de particiones del entero positivo
ni , 1 ≤ i ≤ k.

Demostración. Consecuencia directa del teorema anterior y de la proposición


10.2.6. □✓
152 · Grupos abelianos finitos

Proposición 10.3.3 (Recíproco del teorema de Lagrange para grupos


abelianos finitos) . Sea G un grupo abeliano finito y sea m ∈ ℤ+ tal que m | |G |.
Entonces G contiene al menos un subgrupo de orden m.
n m
Demostración. Sea |G | = n = p1n1 · · · pk k y sea m|n, m = p1m1 · · · pk k con
0 ≤ mi ≤ ni , 1 ≤ i ≤ k. Existen en G subgrupos H1 , . . . , Hk de órdenes
|Hi | = pimi , 1 ≤ i ≤ k. Como G es abeliano H1 · · · Hk ≤ G. Veamos que
|H1 · · · Hk | = m. Para ello probemos que H j ∩ (H1 · · · H j−1 H j+1 · · · Hk ) = 1,
para cada 1 ≤ j ≤ k.
Si x ∈ H j ∩ (H1 · · · H j−1 H j+1 · · · Hk ), entonces
mj m m m
|x| | p j y |x| | p1m1 · · · p j−1
j−1
p j1j+1 · · · pk k ,
m m m m
luego |x| | d, donde d = m. c. d.(p j j ; p1m1 · · · p j−1
j−1 j+1
p j+1 · · · pk k ) = 1. Se tiene
entonces que |x| = 1, es decir, x = 1. ✓

Ejemplo 10.3.4. (i) Determinemos todos los grupos abelianos de orden


1440: como 1440 = 25 × 5 × 32 , luego las opciones son:
p(5): (5), (4, 1), (3, 2), (3, 1, 1), (2, 2, 1), (2, 1, 1, 1), (1, 1, 1, 1, 1);
p(1): (1);
p(2): (2), (1, 1).
Por lo tanto, todos los grupos abelianos de orden 1440 son:

ℤ32 ⊕ ℤ5 ⊕ ℤ9 ; ℤ32 ⊕ ℤ5 ⊕ ℤ3 ⊕ ℤ3 ;
ℤ16 ⊕ ℤ2 ⊕ ℤ5 ⊕ ℤ9 ; ℤ16 ⊕ ℤ2 ⊕ ℤ5 ⊕ ℤ3 ⊕ ℤ3 ;
ℤ8 ⊕ ℤ4 ⊕ ℤ5 ⊕ ℤ9 ; ℤ8 ⊕ ℤ4 ⊕ ℤ5 ⊕ ℤ3 ⊕ ℤ3 ;
ℤ8 ⊕ ℤ2 ⊕ ℤ2 ⊕ ℤ5 ⊕ ℤ9 ; ℤ8 ⊕ ℤ2 ⊕ ℤ2 ⊕ ℤ5 ⊕ ℤ3 ⊕ ℤ3 ;
ℤ4 ⊕ ℤ4 ⊕ ℤ2 ⊕ ℤ5 ⊕ ℤ9 ; ℤ4 ⊕ ℤ4 ⊕ ℤ2 ⊕ ℤ5 ⊕ ℤ3 ⊕ ℤ3 ;
ℤ4 ⊕ ℤ2 ⊕ ℤ2 ⊕ ℤ2 ⊕ ℤ5 ⊕ ℤ9 ; ℤ4 ⊕ ℤ2 ⊕ ℤ2 ⊕ ℤ2 ⊕ ℤ5 ⊕ ℤ3 ⊕ ℤ3 ;
ℤ2 ⊕ ℤ2 ⊕ ℤ2 ⊕ ℤ2 ⊕ ℤ2 ⊕ ℤ5 ⊕ ℤ9 ;
ℤ2 ⊕ ℤ2 ⊕ ℤ2 ⊕ ℤ2 ⊕ ℤ2 ⊕ ℤ5 ⊕ ℤ3 ⊕ ℤ3 .

(ii) Veamos que ℤ72 ⊕ ℤ84  ℤ36 ⊕ ℤ168 : en efecto,

ℤ72 ⊕ ℤ84  ℤ8 ⊕ ℤ9 ⊕ ℤ4 ⊕ ℤ3 ⊕ ℤ7  ℤ9 ⊕ ℤ4 ⊕ ℤ8 ⊕ ℤ3 ⊕ ℤ7  ℤ36 ⊕ ℤ168 .

(iii) ¿Son ℤ72 ⊕ ℤ12 y ℤ18 ⊕ ℤ48 isomorfos?

ℤ72 ⊕ ℤ12  ℤ8 ⊕ ℤ9 ⊕ ℤ4 ⊕ ℤ3  ℤ8 ⊕ ℤ4 ⊕ ℤ9 ⊕ ℤ3 ,

luego tenemos (23 , 22 , 32 , 31 ); por otro lado

ℤ18 ⊕ ℤ48  ℤ9 ⊕ ℤ2 ⊕ ℤ16 ⊕ ℤ3  ℤ16 ⊕ ℤ2 ⊕ ℤ9 ⊕ ℤ3 ,


Grupos abelianos finitos · 153

y en este caso, (24 , 21 , 32 , 31 ). Puesto que los sistemas de divisores elemen-


tales son distintos, entonces los grupos no son isomorfos.

4. Grupos de orden ≤ 15
Con la información obtenida en este capítulo y en el anterior, podemos
determinar (salvo isomorfismo) todos los grupos de orden n ≤ 15.
n Abelianos No abelianos
1 1
2 ℤ2
3 ℤ3
ℤ4
4
V = ⟨a, b | a 2 = 1 = b 2 , ab = ba⟩
5 ℤ5
6 ℤ6 D3 = S3
7 ℤ7
ℤ8
D4
8 ℤ4 ⊕ ℤ2
Q8
ℤ2 ⊕ ℤ2 ⊕ ℤ2
ℤ9
9
ℤ3 ⊕ ℤ3
10 ℤ10 D5
11 ℤ11
A4
ℤ12
12 D6
ℤ6 ⊕ ℤ2
T = ⟨a, b | a 6 = 1, b 2 = a3 , bab −1 = a −1 ⟩
13 ℤ13
14 ℤ14 D7
15 ℤ15

5. Ejercicios
1. Determine todos los grupos abelianos de orden 81.

2. Determine todos los grupos abelianos de orden 1024.

3. ¿Son ℤ30 ⊕ ℤ20 y ℤ10 ⊕ ℤ60 isomorfos?

4. Sean G , H grupos abelianos finitos tales que G × G  H × H . De-


muestre que G  H .

5. Sean G y H grupos abelianos finitos tales que para cada entero positivo
m, ambos tienen el mismo número de elementos de orden m. Pruebe
que G  H .
154 · Grupos abelianos finitos

6. Sea G un grupo abeliano que tiene 8 elementos de orden 3, 18 ele-


mentos de orden 9 y el elemento identidad. Encuentre la descompo-
sición de G como producto de grupos cíclicos.
Capítulo
once
Grupos solubles
Grupos solubles · 157

En los capítulos anteriores hemos tratado con grupos abelianos y grupos fi-
nitos. Un grupo cualquiera no necesariamente pertenece a alguna de estas
clases, sin embargo, siempre se puede relacionar de alguna manera con ellas
y estudiar por este camino el grupo. Una de las generalizaciones más impor-
tantes de la conmutatividad es la solubilidad, de la cual nos ocupamos en este
capítulo. Es importante anotar que la solubilidad en grupos está estrecha-
mente ligada con la solubilidad por radicales de las ecuaciones algebraicas
(véase [26]). La solubilidad, será estudiada a través de los conmutadores y
el conmutante de un grupo.

1. Centro de un grupo
Uno de los parámetros que indica el grado de conmutatividad de un grupo
es la aproximación de él con su centro. A continuación repasaremos algunas
nociones y propiedades introducidas en capítulos anteriores.

Proposición 11.1.1. Sea G un grupo, H un subgrupo de G y A un subconjunto


no vacío de G. Sean

NH (A) := {x ∈ H | Ax := xAx −1 = A},


CH (A) := {x ∈ H | a x := xax −1 = a, para cada a ∈ A},

el normalizador y centralizador de A en H , respectivamente. Entonces,

CH (A) ⊴ NH (A) ≤ H .

Demostración. Nótese que NH (A) ≠ ∅ ya que 1 ∈ NH (A). Sean


x, y ∈ NH (A), entonces Axy = (Ax ) y = Ay = A, luego xy ∈ NH (A); además,
−1
Ax = A, es decir, x −1 ∈ NH (A). Esto indica que NH (A) ≤ H . De manera
análoga se prueba que CH (A) ≤ H . Evidentemente CH (A) ≤ NH (A). Sean
a ∈ A, x ∈ NH (A) y sea y ∈ CH (A), entonces

xyx −1 a(xyx −1 ) −1 = xyx −1 axy −1 x −1 = xya0 y −1 x −1 ,

con a0 := x −1 ax ∈ A, luego xya0 y −1 x −1 = xa0 x −1 = a, es decir,


xyx −1 ∈ CH (A). ✓

Consideremos ahora el caso en el cual H = G y A = K es un subgrupo


de G.

Proposición 11.1.2. Sea G un grupo y K ≤ G. Entonces,


158 · Grupos solubles

(i) K ⊴ NG (K) y NG (K) es el subgrupo más grande de G en el cual K es


normal.

(ii) K ⊴ G ⇔ NG (K) = G.

Demostración. (i) La primera parte es consecuencia de la definición de nor-


malizador.
(ii) Es una consecuencia directa de (i). ✓

Recordemos que si G es un grupo su centro se define como el centra-


lizador de G en G y se denota por Z (G), es decir,

Z (G) := {x ∈ G | a x = a para cada a ∈ G}.

Proposición 11.1.3. Sea G un grupo. Entonces,

(i) Z (G) es un grupo abeliano.

(ii) Z (G) ⊴ G.

(iii) G es abeliano ⇔ G = Z (G).

Demostración. Consecuencia directa de la definición de centro. ✓


2. Conmutante de un grupo
Además del centro, otro de los parámetros que permite establecer la “dis-
tancia"de un grupo a la conmutatividad es su conmutante. Definimos en esta
lección el conmutante de dos subconjuntos cualesquiera de un grupo.

Definición 11.2.1. Sea G un grupo cualquiera y sean a, b elementos de G.


Se denomina conmutador de los elementos a y b al elemento [a, b] de G
definido por
[a, b] := a −1 b −1 ab.
Se denomina conmutante de G o subgrupo derivado de G al subgrupo
generado por los conmutadores y se denota por G ′ o también por [G , G]:

G ′ = [G , G] := ⟨[a, b] | a ∈ G , b ∈ G⟩ .

Más generalmente, sean L, M ⊆ G no vacíos. Se denomina conmutante


mutuo, o sencillamente conmutante de L y M, al subgrupo

[L, M] := ⟨[a, b] | a ∈ L, b ∈ M⟩ .
Grupos solubles · 159

Proposición 11.2.2. Sea G un grupo y sean L, M ⊴ G. Entonces, [L, M] ⊴ G.


En particular, G ′ ⊴ G.

Demostración. Cada elemento z de [L, M] es de la forma z = z1 · · · zk , donde


cada zi , 1 ≤ i ≤ k, es de la forma [a, b] o [a, b] −1 , con a ∈ L, b ∈ M. Sea x
un elemento cualquiera de G. Entonces, z x = x −1 zx = z1x · · · zkx . Pero

[a, b] x = [a x , b x ] y a x ∈ L, b x ∈ M ,
([a, b] −1 ) x = ([a, b] x ) −1 = [a x , b x ] −1 .

Se obtiene entonces que z x ∈ [L, M] , es decir, [L, M] ⊴ G. ✓


Proposición 11.2.3. Sea G un grupo. G es abeliano si, y sólo si, G ′ = 1.

Demostración. Evidente. ✓

Proposición 11.2.4. Sea G un grupo. Si G ′ ≤ K ≤ G, entonces K ⊴ G.


Además, G/G ′ es un grupo abeliano y G ′ está contenido en cada subgrupo normal
K de G tal que G/K sea abeliano. En particular, el máximo cardinal de G/K, con
este último abeliano, es igual a |G : G ′ |.

Demostración. Sea K tal que G ′ ≤ K ≤ G. Sea x ∈ G y a un elemento


cualquiera de K. Entonces, (x −1 ax)a−1 ∈ G ′ ≤ K, así x −1 ax ∈ K, es decir,
K ⊴ G. Sean x, y ∈ G. Entonces, x −1 y −1 x y = x −1 y −1 xy = 1, es decir,
x y = y x, y así, G/G ′ es abeliano.
Sea ahora K ⊴ G tal que G/K es abeliano. Sea z = z1 · · · zk un ele-
mento cualquiera de G ′. Cada zi es de la forma [a, b] = a −1 b −1 ab o de
la forma [a, b] −1 = [b, a] = b −1 a −1 ab, con a, b ∈ G. Consideremos la
clase de a−1 b −1 ab en el cociente G/K: a−1 b −1 ab = a −1 b −1 ab = 1, o sea
que (a −1 b −1 ab) −1 ∈ K. De lo anterior se desprende que z ∈ K, y en total,
G ′ ≤ K. Además, |G | = |G : K||K| ≥ |G : K||G ′ |, luego

|G : G ′ ||G ′ | = |G | ≥ |G : K||G ′ |,

por lo tanto, |G : G ′ | ≥ |G : K |. ✓

Consideremos ahora algunas propiedades de los conmutadores y con-


mutantes.

Proposición 11.2.5. Sea G un grupo tal que G/Z (G) es cíclico. Entonces, G es
abeliano.
160 · Grupos solubles

Demostración. Sea x un elemento de G. Entonces, x = xZ (G) ∈ G/Z (G).


Como este cociente es cíclico, existe a ∈ G tal que x = a k , para algún k ∈ ℤ,
por lo tanto, x −1 ak ∈ Z (G), es decir, existe z ∈ Z (G) tal que x −1 a k = z,
luego x = a k z−1 , es decir, x es de la forma x = ak 𝜔, con 𝜔 ∈ Z (G).
Sean x y y elementos cualesquiera de G. Entonces,

[x, y] = x −1 y −1 xy = (ak1 w1 ) −1 (a k2 w2 ) −1 ak1 w1 ak2 w2 ,

donde k1 , k2 ∈ ℤ y w1 , w2 ∈ Z (G); luego,

[x, y] = w1−1 a−k1 w2−1 a−k2 ak1 w1 ak2 w2 = a −k1 −k2 +k1 +k2 = 1,

es decir, x y y conmutan. Lo anterior implica que G es abeliano. ✓


Proposición 11.2.6. Sea G un grupo de orden pq, con p y q primos diferentes,


tal que Z (G) ≠ 1. Entonces, G  ℤpq .
Demostración. Puesto que Z (G) ≤ G, entonces |Z (G)| = p, q, pq. Si
|Z (G)| = pq, entonces es abeliano e isomorfo a ℤpq . Si |Z (G)| = p, en-
tonces |G/Z (G)| = q, y en consecuencia, G/Z (G) es cíclico. Según vimos G
es abeliano y, nuevamente, G  ℤpq . Análogamente, si |Z (G)| = q. ✓

Ejemplo 11.2.7. (i) ℤ′ = 0; ℤn′ = 0, para n ≥ 1; ℚ ′ = 0, ℝ′ = 0, ℂ′ = 0,


(ℤ∗ ) ′ = 1, (ℚ∗ ) ′ = 1, (ℝ∗ ) ′ = 1, (ℂ∗ ) ′ = 1, (ℂp∞ ) ′ = 1, (ℚp ) ′ = 0.
(ii) Sn′ = An : en efecto, para n = 1, S1′ = 1 = S1 = A1 .
Para n = 2, S2′ = 1 = A2 ya que S2 es abeliano.
Veamos la prueba para n ≥ 3. Probemos en primer lugar que An ⊆ Sn′ :
puesto que An está generado por los ciclos de longitud 3, basta probar que
cada ciclo (abc) de longitud 3 está en Sn′ : sean a, b, c diferentes, entonces
(abc) = [(ab), (ac)], en efecto

[(ab), (ac)] = (ab) −1 (ac) −1 (ab)(ac) = (ab)(ac)(ab)(ac) = (abc).

Sn′ ⊆ An : sean 𝛼 , 𝛽 ∈ Sn . Entonces, [𝛼 , 𝛽 ] = 𝛼 −1 𝛽 −1 𝛼 𝛽 es una permu-


tación par.
(iii) Calculemos ahora An′ . Para n = 1: A1′ = 1; para n = 2: A2′ = 1; para
n = 3: A3′ = 1 ya que A3 es abeliano.
Para n = 4: probemos que A4′ = {1, (12)(34), (13)(24), (14)(23)}, es
decir, A4′  V (el cuarto grupo de Klein). Sea

L := {1, (12)(34), (13)(24), (14)(23)},

veamos que L ⊴ An : denotando por a = (12)(34), b = (13)(24), entonces


a 2 = 1 = b 2 , ab = (14)(23) = ba, esto prueba que el conjunto mencionado
Grupos solubles · 161

es realmente un subgrupo de An , y además, que es isomorfo al cuarto grupo


de Klein.
Nótese que en L están todos los productos de dos transposiciones dis-
yuntas. Sea 𝜋 ∈ Sn una permutación cualquiera de Sn y sea (𝛼1 𝛼2 )( 𝛽 1 𝛽 2 )
uno cualquiera de tales productos. Entonces,

𝜋 −1 (𝛼1 𝛼2 ) ( 𝛽 1 𝛽 2 )𝜋 = 𝜋 −1 (𝛼1 𝛼2 )𝜋 𝜋 −1 ( 𝛽 1 𝛽 2 )𝜋
= (𝜋 (𝛼1 ), 𝜋 (𝛼2 ))(𝜋 ( 𝛽 1 ), 𝜋 ( 𝛽 2 )) ∈ L.

Lo anterior prueba que L ⊴ Sn , en particular, L ⊴ An .


A4′ ⊆ L: teniendo en cuenta que An está generado por ciclos de longitud
3, L ⊴ An y por las fórmulas del ejercicio 4 de este capítulo, es suficiente
probar que el conmutador de dos 3-ciclos está en L. Sean i , j, k, l elementos
diferentes de In (en particular, si n = 4). Entonces,

[(i jk), (i jl)] = (i j)(kl) ∈ L,


[(i jk), (il j)] = (il)( jk) ∈ L.

Nótese que el conmutador [(i jk), (li j)] coincide con el primero;
[(i jk), ( jli)] también coincide con el primero.
L ⊆ An′ : las relaciones anteriores demuestran esta inclusión ya que ade-
más (ik)( jl) = (il)( jk)(i j)(kl).
Para n ≥ 5: An′ = An , n ≥ 5. En efecto, sean i , j, k, l , m elementos
diferentes de In . Entonces, (i jk) = [(ikl), (i jm)] y esto prueba que An ⊆ An′ ,
y en consecuencia, An′ = An .
Cerramos esta sección con otras propiedades de los conmutantes.
Proposición 11.2.8. Sea G un grupo, A, B ≤ G y H := ⟨A, B⟩. Entonces,
(i) [A, B] , A[A, B] , B[A, B] ⊴ H .

(ii) A[A, B]B[A, B] = H .


Demostración. (i) [A, B] ⊴ H : sean y ∈ [A, B] y x ∈ H . Queremos mostrar
que x −1 yx ∈ H . Notemos que y es de la forma

y = [a1, b1 ] 𝜀1 · · · [an , bn ] 𝜀 n , (2.1)

con ai ∈ A, bi ∈ B, 𝜀 i = ±1, 1 ≤ i ≤ n; x es de la forma

x = x1𝜆 1 · · · xm𝜆 m , con xi ∈ A ∪ B, 𝜆 i = ±1, 1 ≤ i ≤ m. (2.2)

Basta entonces considerar los productos de la forma x −1 [a, b]x, x −1 [a, b] −1 x,


con a ∈ A, b ∈ B y x ∈ A ∪ B.
162 · Grupos solubles

Veamos que x ∈ A: nótese que x −1 [a, b]x = [ax, b] [x, b] −1 ∈ [A, B]


(véase el ejercicio 4). Así. x −1 [a, b] −1 x = (x −1 [a, b]x) −1 ∈ [A, B].
Además, x ∈ B:

x −1 [a, b]x = x −1 [b, a] −1 x


= (x −1 [b, a]x) −1
= ([bx, a] [x, a] −1 ) −1 (véase el ejercicio 4)
−1
= [x, a] [bx, a]
= [a, x] −1 [a, bx] ∈ [A, B].

Ahora, x −1 [a, b] −1 x = (x −1 [a, b]x) −1 ∈ [A, B].


Finalmente A[A, B] ⊴ H : sea y ∈ [A, B] un elemento como en (2.1) y
x ∈ H un elemento como en (2.2) ; sea además a ∈ A. Es suficiente entonces
considerar un producto de la forma

x −1 ayx, conx ∈ A ∪ B.

Pero x −1 ayx = x −1 axx −1 yx; según lo probado, x −1 yx ∈ [A, B]. Además, si


x ∈ A, entonces x −1 ax ∈ A y así x −1 ayx ∈ A[A, B]. Si x ∈ B, entonces
x −1 ax = x −1 axa −1 a = [x, a−1 ]a = [a−1 , x] −1 a ∈ [A, B]A = A[A, B] (la úl-
tima igualdad se tiene ya que A normaliza [A, B]), y así, x −1 ayx ∈ A[A, B].
B[A, B] ⊴ H : análogo al caso anterior, pero considerando el producto
−1
x byx, con b ∈ B, y ∈ [A, B].
(ii) A[A, B]B[A, B] = H : según (i), A[A, B]B[A, B] ≤ H . Puesto que
H = ⟨A, B⟩, sea x ∈ A ó x ∈ B. Entonces, x = x · 1 · 1 · 1 ∈ A[A, B]B[A, B]
ó x = 1 · 1 · x · 1 ∈ A[A, B]B[A, B]. ✓

Proposición 11.2.9. Sea G = A × B. Entonces, [G , G] = [A, A] × [B, B].


Este resultado se puede extender a un producto finito de grupos.

Demostración. Sean x := [a1 , b1 ] , y := [a2 , b2 ] ∈ G. Se tiene entonces la


identidad

[x, y] = ([a1 , a2 ] , [b1 , b2 ]),

la cual inmediatamente da la inclusión de izquierda a derecha.


Para la otra inclusión, observemos que cada elemento de [A, A] × [B, B]
es de la forma [c1 · · · cm , d1 · · · dl ], donde ci son conmutadores de A y d j
conmutadores de B. Se puede suponer, sin pérdida de generalidad, que
m = l, luego se tiene [c1 , d1 ] · · · [cm , dm ], resta aplicar otra vez la identidad
de arriba. ✓

Grupos solubles · 163

Ejemplo 11.2.10. Recordemos que


Q8 = ⟨a, b | a 4 = 1, b 2 = a 2 , bab −1 = a−1 ⟩.
Calculemos [Q8 , Q8 ]: como b −1 = a2 b, ba = a3 b entonces
[a k b i , a r b j ] = (ak b i ) −1 (ar b j ) −1 a k b i a r b j
= b −i a−k b − j a −r ak b i a r b j = b −i a −k b − j ak−r b i ar b j ;
Consideramos los distintos casos:
(a) i = 0, j = 0: a−k ak−r ar = 1.
(b) i = 0, j = 1: a −k b −1 a k−r a r b = a −k a2 ba k b = a −k+2 a−k b 2 = a 2 a2 = 1.
(c) i = 1, j = 0:
b −1 a−k ak−r ba r = a2 ba −r a3r b = a 2 ba 2r b = a 2 a 6r b 2
= a2 a 6r a2 = a6r = (a2 ) 3r ∈ ⟨a 2 ⟩.
(d) i = 1, j = 1: b −1 a−k b −1 ak−r ba r b = (a 2 ) 9r+3k ∈ ⟨a2 ⟩.
Entonces [Q8 , Q8 ] = ⟨a2 ⟩ ya que tomando r = 1 en (c) tenemos que
a2 ∈ [Q8 , Q8 ].
Ejemplo 11.2.11. Calculemos Z (T ) y Z (Gpq ): comencemos realizando la
tabla del grupo T a partir de las relaciones que definen este grupo, a saber,
a6 = 1, b 2 = a3 y ba = a−1 b:
· 1 a a2 a3 a4 a5 b ab a2b a3b a4b a5b
1 1 a a2 a3 a4 a5 b ab a2b a3b a4b a5b
a a a2 a3 a4 a5 1 ab a2b a3b a4b a5b b
a2 a2 a3 a4 a5 1 a a2b a3b a4b a5b b ab
a3 a3 a4 a5 1 a a2 a3b a4b a5b b ab a2b
a4 a4 a5 1 a a2 a3 a4b a5b b ab a2b a3b
a5 a5 1 a a2 a3 a4 a5b b ab a2b a3b a4b
b b a5b a4b a3b a2b ab a3 a2 a 1 a5 a4
ab ab b a5b a4b a3b a2b a4 a3 a2 a 1 a5
a2b a2b ab b a5b a4b a3b a5 a4 a3 a2 a 1
a3b a3b a2b ab b a5b a4b 1 a5 a4 a3 a2 a
a4b a4b a3b a2b ab b a5b a 1 a5 a4 a3 a2
a5b a5b a4b a3b a2b ab b a2 a 1 a5 a4 a3
A partir de la tabla se observa que el centro de T es {1, a 3 }  ℤ2 . De
otra parte, Gpq es el grupo no abeliano de orden pq, con p, q primos distin-
tos. Esto implica que Gpq /Z (Gpq ) no puede ser cíclico (véase la proposición
11.2.5). En consecuencia, el único orden posible de Z (Gpq ) es 1, es decir,
Z (Gpq ) = 1.
164 · Grupos solubles

Ejemplo 11.2.12. Veamos que los grupos A4 , D6 y T no son isomorfos.


En el capítulo 6 se demostró que Z (D6 ) = ℤ2 y también que Z (An ) = 1,
para n ≥ 4. Esto ilustra que D6 y A4 no son isomorfos. De igual forma,
vimos en el ejemplo anterior que Z (T ) = ⟨a3 ⟩  ℤ2 ; de esto se deduce que
An y T no son isomorfos. Finalmente, de la tabla de T se concluye que en
este grupo b es un elemento de orden 4, en cambio, D6 no tiene elementos
de este orden. Esto prueba que T y D6 no son isomorfos.

3. Cadenas normales
Nuestro objetivo central ahora es probar los teoremas de Jordan-Hölder y
Schreier sobre refinamientos isomorfos de cadenas subnormales y norma-
les.

Definición 11.3.1. Se denomina cadena de un grupo G a una sucesión fini-


ta totalmente ordenada de subgrupos de G comenzando en 1 y terminando
en G:
1 = H0 ≤ H1 ≤ · · · ≤ Hn = G. (3.1)
La cadena (3.1) se denomina subnormal si

Hi ⊴ Hi+1 , para cada 0 ≤ i ≤ n − 1.

La cadena (3.1) se denomina normal si

Hi ⊴ G , para 0 ≤ i ≤ n.

Se dice que un subgrupo H de un grupo G es subnormal en G, lo cual


denotamos por H ⊴⊴ G, si H es miembro de una cadena subnormal de G.
Los cocientes Hi+1 /Hi , 0 ≤ i ≤ n − 1, se denominan secciones de la
cadena subnormal (3.1) .

Observación 11.3.2. Para los grupos abelianos, los conceptos de cadena,


cadena subnormal y normal coinciden. Evidentemente, en el caso general
toda cadena normal es subnormal.

Ejemplo 11.3.3. (i) 0 < 6ℤ < 3ℤ < ℤ y 0 < 45ℤ < 15ℤ < 3ℤ < ℤ
son cadenas de ℤ con secciones 6ℤ/0  ℤ, 3ℤ/6ℤ  ℤ2 , ℤ/3ℤ = ℤ3 y
45ℤ/0  ℤ, 15ℤ/45ℤ  ℤ3 , 3ℤ/15ℤ  ℤ5 , ℤ/3ℤ = ℤ3 respectivamente.
(ii) 1 < 2ℤ < ℤ < ℚp es una cadena de ℚp con secciones 2ℤ/1  ℤ,
ℤ/2ℤ  ℤ2 , ℚp /ℤ = ℂp∞ .
(iii) 1 < ℂp < ℂp2 < · · · < ℂpn es una cadena de ℂpn con secciones
isomorfas a ℂp .
Grupos solubles · 165

(iv) 1 < ⟨g⟩ < K = 1, f 2 , g , f 2 g < D4 es una cadena subnormal no




normal de D4 con secciones isomorfas a ℤ2 .


(v) 1 < ⟨a2 ⟩ < ⟨b⟩ < Q8 ; 1 < ⟨a2 ⟩ < ⟨a⟩ < Q8 ; 1 < ⟨a 2 ⟩ < ⟨ab⟩ < Q8
son cadenas normales de Q8 con secciones isomorfas a ℤ2 . Nótese que en
Q8 toda cadena es normal ya que todos sus subgrupos son normales.
(vi) La siguiente es una cadena subnormal no normal de A4 :

1 < {1, (12)(34)} < A4′ = {1, (12)(34), (13)(24), (14)(23)} < A4 ;

sus secciones ℤ2 , ℤ2 , ℤ3 . En efecto, {1, (12)(34)} no es normal en A4 :


(123) −1 (12)(34)(123) = (13)(24).

Definición 11.3.4. Sean

1 = H0 ≤ H1 ≤ · · · ≤ Hn = G , (3.2)
1 = K0 ≤ K1 ≤ · · · ≤ Km = G , (3.3)

cadenas del grupo G.

(i) (3.3) es un refinamiento de (3.2) si {H0 , . . . , Hn } ⊆ {K0 , . . . , Km }.

(ii) Sean (3.2) y (3.3) cadenas subnormales (normales) de G. Se dice que


ellas son isomorfas si n = m y existe 𝜋 ∈ Sn tal que

Hi+1 /Hi  K 𝜋 (i)+1 /K 𝜋 (i) , 0 ≤ i ≤ n − 1.

Ejemplo 11.3.5. (i) 0 < ℤ2 < ℤ6 < ℤ12 < ℤ24 < ℤ48 es un refinamiento
de la cadena 0 < ℤ2 < ℤ12 < ℤ48 .
(ii) 0 < ℤ2 < ℤ6 < ℤ24 y 0 < ℤ4 < ℤ12 < ℤ24 son cadenas normales
isomorfas de ℤ24 :

ℤ2 /0  ℤ2  ℤ24 /ℤ12 ,
ℤ24 /ℤ6  ℤ4  ℤ4 /0,
ℤ6 /ℤ2  ℤ3  ℤ12 /ℤ4 .

Una última definición para luego probar los principales resultados de esta
sección.

Definición 11.3.6. Sea (3.1) una cadena subnormal del grupo G. Se dice
que (3.1) es una cadena de composición de G si

Hi+1 /Hi es simple, para cada 0 ≤ i ≤ n − 1.

Si (3.1) es normal se dirá entonces que es una cadena principal de G.


166 · Grupos solubles

Proposición 11.3.7. Sea G un grupo con cadena subnormal (normal)


1 = H0 ≤ H1 ≤ · · · ≤ Hn = G.
Sea K ≤ G. Entonces,
(i) 1 = K0 ≤ K1 ≤ · · · ≤ Kn = K, con Ki = Hi ∩ K es una cadena subnormal
(normal) de K. Además, Ki+1 /Ki ↩→ Hi+1 /Hi , 0 ≤ i ≤ n − 1.

(ii) Si K ⊴ G, entonces
1 = H0 ≤ H1 ≤ · · · ≤ Hn = G/K , con Hi = Hi K/K
es una cadena subnormal (normal) de G/K. También, la sección Hi+1 /Hi es
una imagen homomorfa de Hi+1 /Hi , 0 ≤ i ≤ n − 1.
Demostración. (i) Sea Hi ⊴ Hi+1 y Ki = Hi ∩ K, con K ≤ G. Entonces,
Ki ⊴ Ki+1 . En efecto, sea x ∈ Ki+1 , a ∈ Ki , entonces x ∈ Hi+1 ∩ K y
a ∈ Hi ∩ K, x −1 ax ∈ Hi ∩ K = Ki (caso subnormal).
Sea Hi ⊴ G y x ∈ K, b ∈ Ki = Hi ∩ K. Entonces, x −1 bx ∈ Hi ∩ K = Ki
(caso normal). Evidentemente, K0 = 1 y Kn = K. Ahora,
Ki+1 Ki+1 Ki+1 Hi Hi+1
=  ≤ .
Ki Ki+1 ∩ Hi Hi Hi
(ii) Nótese que Hi es la imagen de Hi mediante el homomorfismo canó-
nico
j : G −→ G/K,
por lo tanto, como Hi ⊴ Hi+1 , entonces j (Hi ) = Hi ⊴ j (Hi+1 ) = Hi+1 . Por
ser j sobre y Hi ⊴ G, entonces j (Hi ) = Hi ⊴ G/K. Evidentemente, H0 = 1
y Hn = G/K. Ahora,
Hi+1 K Hi+1
Hi+1 K Hi+1 K Hi+1 Hi
=    . ✓

Hi K Hi K Hi (Hi+1 ∩ K) Hi (Hi+1 ∩K)
Hi K Hi

En la demostración anterior se usó la siguiente forma generalizada del


teorema de isomorfismo:
BH B
si A ⊴ B ≤ G , H ⊴ G , entonces  .
AH A(B ∩ H )
En efecto, BH = H B ya que H ⊴ G; AH = H A ya que H ⊴ G; evidente-
mente AH ≤ BH y AH ⊴ BH ya que A ⊴ B y H ⊴ G. Consideremos el
homomorfismo natural
𝛼 : B −→ BH −→ BH /AH
b ↦−→ b ↦−→ b := bAH
Grupos solubles · 167

Nótese que 𝛼 es sobre y que ker(𝛼) = B∩ AH . En efecto, sea bh ∈ BH /AH .


Entonces, 𝛼 (b) = bh ya que b = bh (bhb −1 ∈ H ≤ AH ); 𝛼 (b) = 1, luego
b ∈ AH y b ∈ B∩AH . Resta probar que B∩AH = A(B∩H ). Sea x ∈ B∩AH ,
entonces x = ah; nótese que h = a−1 x ∈ B ya que x ∈ B y a−1 ∈ A ≤ B,
por lo tanto, x ∈ A(B ∩ H ). Sea ahora z ∈ A(B ∩ H ), entonces z = ah, con
h ∈ B ∩ H , luego z ∈ AH y z ∈ B. Esto demuestra la afirmación.

Lema 11.3.8 (Lema de Zassenhaus) . Sea G un grupo, H ,K ≤ G, H ∗ ⊴ H


y K ∗ ⊴ K. Entonces,

(i) H ∗ (H ∩ K ∗ ) ⊴ H ∗ (H ∩ K).

(ii) K ∗ (H ∗ ∩ K) ⊴ K ∗ (H ∩ K).

(iii)

H ∗ (H ∩ K)/H ∗ (H ∩ K ∗ )  K ∗ (H ∩ K)/K ∗ (H ∗ ∩ K)
 (H ∩ K)/[(H ∗ ∩ K)(H ∩ K ∗ )].

Demostración. Probemos inicialmente que los productos de subgrupos indi-


cados son realmente grupos.
(a) H ∗ (H ∩ K) es un grupo: ya que H ∗ ⊴ H , entonces
H ∗ (H ∩ K) = (H ∩ K)H ∗ .
(b) K ∗ (H ∩ K) es un grupo: como K ∗ ⊴ K, se obtiene
K ∗ (H ∩ K) = (H ∩ K)K ∗ .
(c) H ∗ (H ∩ K ∗ ) es un grupo puesto que H ∗ ⊴ H .
(d) K ∗ (H ∗ ∩ K) es un grupo ya que K ∗ ⊴ K.
(e) (H ∗ ∩ K)(H ∩ K ∗ ) es un grupo: nótese que H ∗ ∩ K , H ∩ K ∗ ⊴ H ∩ K,
por lo tanto, (H ∗ ∩ K)(H ∩ K ∗ ) ⊴ H ∩ K.
Podemos ya probar las afirmaciones del lema.
(i) H ∗ (H ∩ K ∗ ) ⊴ H ∗ (H ∩ K): consideremos la función

𝜃 : H ∗ (H ∩ K) −→ (H ∩ K)/[(H ∗ ∩ K)(H ∩ K ∗ )]
𝜃 (hx) := xL,

con L := [(H ∗ ∩ K)(H ∩ K ∗ )] , h ∈ H ∗ , x ∈ H ∩ K.


𝜃 está bien definida: sean h1 , h2 ∈ H ∗ , x1 , x2 ∈ H ∩ K tales que
h1 x1 = h2 x2 , entonces 𝜃 (h1 x1 ) = x1 L, 𝜃 (h2 x2 ) = x2 L. Por lo tanto,

x1 x2−1 = h1−1 h2 ∈ H ∗ ∩ (H ∩ K) = H ∗ ∩ K ⊆ L,

luego x1 L = x2 L y 𝜃 (h1 x1 ) = 𝜃 (h2 x2 ).


168 · Grupos solubles

𝜃 es un homomorfismo: como H ∗ ⊴ H , entonces x1 H ∗ = H x1∗ para


x1 ∈ H ∩ K, por lo tanto,

𝜃 (h1 x1 h2 x2 ) = 𝜃 (h1 h3 x1 x2 ) = x1 x2 L = x1 Lx2 L = 𝜃 (h1 x1 )𝜃 (h2 x2 ).

𝜃 es evidentemente sobre. Para el núcleo de 𝜃 se tiene que

𝜃 (hx) = L ⇔ xL = L ⇔ x ∈ L ⇔ hx ∈ H ∗ L
⇔ hx ∈ H ∗ (H ∗ ∩ K) (H ∩ K ∗ ) = H ∗ (H ∩ K ∗ ),

luego ker(𝜃) = H ∗ (H ∩K ∗ ). Hemos probado que H ∗ (H ∩K ∗ ) ⊴ H ∗ (H ∩K),


y además,
H ∗ (H ∩ K) (H ∩ K)
∗ ∗
 .
H (H ∩ K ) L
(ii) Se prueba como (i) y se establece la última parte de (iii). ✓

Teorema 11.3.9 (Teorema de Schreier) . Cualesquiera dos cadenas subnor-


males (normales) de un grupo tienen refinamientos isomorfos.
Demostración. Sea G un grupo y sean

1 = H0 ≤ H1 ≤ H2 ≤ · · · ≤ Hn = G , (3.4)
1 = K0 ≤ K1 ≤ K2 ≤ · · · ≤ Km = G , (3.5)

dos cadenas subnormales de G. Para cada 0 ≤ i ≤ n −1, insertamos entre Hi


y Hi+1 una sucesión ordenada de subgrupos (no necesariamente diferentes)

Hi = Hi (Hi+1 ∩ K0 ) ≤ Hi (Hi+1 ∩ K1 ) ≤ · · · ≤ Hi (Hi+1 ∩ Km ) = Hi+1 .

Sea Hi , j = Hi (Hi+1 ∩ K j ), con 0 ≤ i ≤ n − 1, 0 ≤ j ≤ m. Nótese que


Hi ,m = Hi+1 = H1+i ,0 . Según el lema de Zassenhaus se obtiene una nueva
cadena subnormal de G que es refinamiento de (3.4) :
1 = H0,0 ≤ H0,1 ≤ · · · ≤ H0,m−1 ≤ H1,0 ≤ H1,1 ≤ · · · ≤ H1,m−1
≤ H2,0 ≤ H2,1 ≤ · · · ≤ H2,m−1 ≤ H3,0 ≤ · · · ≤ Hn−1,0 (3.6)
≤ Hn−1,2 ≤ · · · ≤ Hn−1,m−1 ≤ Hn = G.
Nótese que esta nueva cadena subnormal tiene nm + 1 subgrupos (no nece-
sariamente diferentes). Lo mismo podemos hacer con la cadena (3.5) ob-
teniéndose la cadena subnormal (3.7) que es refinamiento de (3.5) y que
contiene también nm + 1 subgrupos (no necesariamente diferentes):
1 = K0,0 ≤ K0,1 ≤ · · · ≤ K0,n−1 ≤ K1,0 ≤ K1,1 ≤ · · · ≤ K1,n−1
≤ K2,0 ≤ K2,2 ≤ · · · ≤ K2,n−1 ≤ K3,0 ≤ · · · ≤ Km−1,0 (3.7)
≤ Km−1,2 ≤ · · · ≤ Km−1,n−1 ≤ Km = G ,
Grupos solubles · 169

donde K j,i = K j (K j+1 ∩ Hi ), con 0 ≤ j ≤ m − 1, 0 ≤ i ≤ n, y


K j+1,0 = K j,n = K j+1 para 0 ≤ j ≤ m −1. Nótese que para cada 0 ≤ i ≤ n −1
y 0 ≤ j ≤ m − 1,
Hi , j+1 K j,i+1
 . (3.8)
Hi , j K j,i
En efecto,
Hi , j+1 Hi (Hi+1 ∩ K j+1 ) K j (K j+1 ∩ Hi+1 )
=  ;
Hi , j Hi (Hi+1 ∩ K j ) K j (K j+1 ∩ Hi )
el último isomorfismo es debido al lema de Zassenhaus.
Sean

I = {(i , j) | 0 ≤ i ≤ n − 1, 0 ≤ j ≤ m − 1} ∪ {(n, 0)} ,


J = {(r , s) | 0 ≤ r ≤ m − 1, 0 ≤ s ≤ n − 1} ∪ {(m, 0)}

los conjuntos que indizan (3.6) y (3.7) , respectivamente. Sea

I ′ := {k ∈ ℤ | 0 ≤ k ≤ nm}. (3.9)

Nótese que I , J , I ′ son equipotentes: |I | = | J | = |I ′ | = nm + 1. Podemos


entonces indizar (3.6) y (3.7) por medio de I ′:

I −→ I ′ J −→ I ′
(i , j) ↦−→ im + j (r , s) ↦−→ rn + s
(n, 0) ↦−→ nm (m, 0) ↦−→ mn
0 ≤ i ≤ n−1 0 ≤ r ≤ m−1
0 ≤ j ≤ m−1 0 ≤ s ≤ n − 1.

En la nueva notación:

Hi , j = Him+ j , Hn,0 = Hnm , 0 ≤ i ≤ n − 1, 0 ≤ j ≤ m − 1;


Kr , s = Krm+s , Km,0 = Kmn , 0 ≤ r ≤ m − 1, 0 ≤ s ≤ n − 1.

Sea ahora Snm el conjunto de permutaciones del conjunto


I0 := {0, 1, . . . , nm − 1}. Entonces, la función

I0 −→ I0
𝜋 : k = im + j ↦−→ jn + i , con 0 ≤ i ≤ n − 1 y 0 ≤ j ≤ m − 1

es tal que 𝜋 ∈ Snm , y además

Hk+1 /Hk = Him+ j+1 /Him+ j = Hi , j+1 /Hi , j ,


K 𝜋 (k)+1 /K 𝜋 (k) = K jn+i+1 /K jn+i = K j,i+1 /K j,i ;
170 · Grupos solubles

según (3.8) , Hk+1 /Hk  K 𝜋 (k)+1 /K 𝜋 (k) , k ∈ I0 .


Con esto termina la prueba del teorema para el caso subnormal. Para el
caso normal basta observar que Hi ⊴ G, con 0 ≤ i ≤ n y K j ⊴ G, para
0 ≤ j ≤ m, luego Hi , j ⊴ G , K j,i ⊴ G. □✓

Teorema 11.3.10 (Teorema de Jordan-Hölder) . Cualesquiera dos cadenas


de composición (principales) de un grupo son isomorfas.

Demostración. Sean {Hi } y K j dos series de composición (principales) del
grupo G. Según el teorema 11.3.9, ambos tienen refinamientos isomorfos.
Pero como Hi es maximal en Hi+1 , con 0 ≤ i ≤ n − 1, y K j es maximal
en K j+1 para 0 ≤ j ≤ m − 1, entonces los refinamientos coinciden con las
cadenas iniciales. ✓

Corolario 11.3.11. Si el grupo G tiene una cadena de composición (principal) y


N es un subgrupo normal propio de G, entonces G tiene una cadena de composición
(principal) que contiene a N .

Demostración. La cadena 1 < N < G es subnormal y normal en G. Consi-


deremos inicialmente el caso subnormal. Sea {Hi } una cadena de compo-
sición de G. Según el teorema 11.3.10, 1 < N < G tiene un refinamien-
to subnormal isomorfo a un refinamiento de {Hi }. Pero como {Hi } es de
composición, entonces dicho refinamiento de 1 < N < G es una serie de
composición. De manera análoga se argumenta el caso principal. ✓

4. Grupos solubles
Teorema 11.4.1. Sea G un grupo. Entonces, las siguientes condiciones son equi-
valentes:

(i) G posee una cadena subnormal con secciones abelianas.

(ii) La cadena de conmutantes

G ≥ G (1) ≥ G (2) ≥ · · · ≥ G (m) ≥ · · ·

del grupo G se estabiliza en 1 después de un número finito de pasos, con

G (k) := [G (k−1) , G (k−1) ] , k ≥ 1; G (0) := G.

(iii) G posee una cadena normal con secciones abelianas.


Grupos solubles · 171

Demostración. (i) ⇒(ii): supongamos que

1 = H0 ≤ H1 ≤ · · · ≤ Hn = G

es una cadena subnormal de G con secciones abelianas. Puesto que


Hn−1 ⊴ G y G/Hn−1 es abeliano, entonces, de acuerdo con la proposición
11.2.4, G ′ ≤ Hn−1 . Supongamos inductivamente que G (k) ≤ Hn−k , para
1 ≤ k ≤ n. De nuevo, como Hn−k−1 ⊴ Hn−k y Hn−k /Hn−k−1 es abeliano,
(Hn−k ) ′ ≤ Hn−k−1 , pero (G (k) ) ′ ≤ (Hn−k ) ′, luego G (k+1) ≤ Hn−k−1 . Así, por
inducción, G (n) ≤ Hn−n = 1 y entonces G (n) = 1.
(ii) ⇒(iii): según la proposición 11.2.2, G (k) ⊴ G, para cada 1 ≤ k ≤ n.
(iii) ⇒(i): evidente. ✓

Definición 11.4.2. Un grupo G se dice que es soluble si satisface una cual-


quiera de las condiciones del teorema anterior.

Corolario 11.4.3. (i) Si G es soluble, entonces cada subgrupo de G es soluble


y cada imagen homomórfica de G es soluble.

(ii) G1 × · · · × Gn es soluble si, y sólo si, Gi es soluble, para cada 1 ≤ i ≤ n.

Demostración. (i) Es consecuencia directa de la proposición 11.3.7.


(ii) ⇒): consecuencia de (i).
⇐): sea k := máx{ki }1≤i ≤n , donde ki es el grado de solubilidad de Gi , es
decir, el menor entero positivo k tal que G (k) = 1. Como

[G1 × · · · × Gn , G1 × · · · × Gn ] = [G1 , G1 ] × · · · × [Gn , Gn ],

luego G1 × · · · × Gn es soluble de grado k. ✓


Ejemplo 11.4.4. (i) Todo grupo abeliano es soluble. El concepto de solu-


bilidad tiene entonces interés para los grupos no abelianos.
(ii) S3 es soluble: [S3 , S3 ] = A3 , [A3 , A3 ] = 1.
(iii) S4 es soluble: [S4 , S4 ] = A4 , [A4 , A4 ] = V , [V , V ] = 1.
(iv) Sn no es soluble para n ≥ 5: [Sn , Sn ] = An , [An , An ] = An .
(iv) Q8 es soluble: [Q8 , Q8 ] = ⟨a 2 ⟩, [⟨a2 ⟩, ⟨a 2 ⟩] = 1.

5. Ejercicios
1. Sean G un grupo y L, M ⊆ G no vacíos. Pruebe que [L, M] = [M , L].

2. Sea G un grupo y K ⊴ G. Pruebe que el conmutante K ′ de K es


normal en G.
172 · Grupos solubles

3. Sea 𝜑 : G1 −→ G2 un homomorfismo de grupos. Pruebe que


′ ′
𝜑(G1 ) ⊆ G2′ . Además, si 𝜑 es sobre entonces 𝜑(G1 ) = G2′ .

4. Demuestre las siguientes fórmulas:

b −1 [a, c]b = [ab, c] [b, c] −1 ,


a[b, a] a−1 = [a −1 , b] ,
[a, b] −1 = [b, a].

5. Sean A, B y C subgrupos normales de G. Pruebe que


[AB, C] = [A, C] [B, C].

6. Calcule [D4, D4 ] , [Dn , Dn ] , [Gpq , Gpq ] y [T , T ].

7. Calcule refinamientos isomorfos de las cadenas normales

0 < 60ℤ < 20ℤ < ℤ y


0 < 45ℤ < 90ℤ < ℤ.

8. Calcule todas las cadenas de composición de ℤ60 y muestre que son


isomorfas.

9. Compruebe que todas las cadenas de composición de S3 × ℤ2 son


isomorfas.

10. Determine si los siguientes grupos son solubles: D4 , Dn y Gpq .


· 1

Cuaderno II

Anillos
Dedicado a Lukas, mi hijo
Presentación

El presente cuaderno ofrece una introducción a la teoría general de anillos.


Los anillos, junto con los grupos, son posiblemente los objetos algebraicos
más importantes. En efecto, la teoría general de anillos es el lenguaje funda-
mental para la mayoría de las corrientes contemporáneas del álgebra, entre
las cuales podemos mencionar la teoría algebraica de números, la teoría de
representación de grupos y álgebras, el álgebra homológica y el álgebra con-
mutativa con sus aplicaciones. Estudiaremos en este cuaderno los conceptos
y propiedades básicas de los anillos; este estudio comprende tres partes fun-
damentales: en primer lugar, se introducen las nociones de anillo, subanillo,
ideal, anillo cociente y homomorfismo, las cuales se relacionan estructural-
mente por medio de los teoremas de homomorfismo, isomorfismo y co-
rrespondencia. En segundo lugar, se realizan las construcciones clásicas de
un anillo a partir de otro dado, como por ejemplo, los anillos de matrices,
los anillos de polinomios y los anillos de fracciones (incluyendo el proceso
de localización por ideales primos). La tercera parte consiste en un estudio
introductorio de los tres tipos de dominios de integridad más importantes,
a saber: los dominios euclidianos, los dominios de ideales principales y los
dominios de factorización única. Estas tres partes se conjugan en el teorema
de Gauss el cual establece que el anillo de polinomios R[x] es un dominio
de factorización única, si y sólo si, R es un dominio de factorización única.
Otras fuentes fuertemente recomendadas al lector para complementar
los temas aquí tratados son [10], [15], [21].
Los anillos aquí considerados son asociativos, con unidad, pero no ne-
cesariamente conmutativos. Si f es un homomorfismo de anillos, entonces
f (1) = 1. Salvo que se advierta lo contrario, un anillo arbitrario será deno-
tado con la letra A, un anillo conmutativo por R y un dominio de integridad
mediante la letra D.
Para una mejor comprensión de los temas tratados en el presente cua-
derno asumimos que el lector está familiarizado con las nociones básicas de
la teoría de grupos y el álgebra lineal elemental (véase, por ejemplo, [20] y
[22]).
Capítulo
uno
Anillos y
subanillos
Anillos y subanillos · 3

Posiblemente, junto con los grupos y los espacios vectoriales, los anillos son
los objetos algebraicos más importantes. En este capítulo presentamos su
definición, así como, algunos de los ejemplos más conocidos de tal estruc-
tura.

1. Definición y ejemplos
Definición 1.1.1. Sea A un conjunto no vacío. Se dice que A tiene estruc-
tura de anillo, o simplemente que A es un anillo, si en A han sido definidas
dos operaciones binarias internas notadas + y · tales que:

(i) (A, +) es un grupo abeliano.

(ii) (A, ·) es un semigrupo con elemento identidad 1.

(iii) La multiplicación es distributiva con respecto a la adición, es decir,


para cualesquiera a, b, c, d ∈ A,

a · (b + c) = a · b + a · c,
(b + c) · d = b · d + c · d.

Si además la multiplicación es conmutativa, es decir,

a · b = b · a,

para cualesquiera a, b ∈ A, se dice entonces que (A, +, ·) es un anillo con-


mutativo.

Observación 1.1.2. En adelante A denotará un anillo no necesariamente


conmutativo, R un anillo conmutativo, 0 el elemento nulo de la adición,
también denominado el cero de A, −a el opuesto aditivo de a ∈ A. Salvo
en casos necesarios, omitiremos el punto de la multiplicación. El elemento
identidad 1 también se denomina el uno de A.

Los siguientes ejemplos ponen de manifiesto la gran variedad de anillos


(conmutativos y no conmutativos) que podemos encontrar.

Ejemplo 1.1.3 (Anillos numéricos) . Los números enteros ℤ, los racio-


nales ℚ, los reales ℝ y los complejos ℂ, con sus operaciones habituales de
adición y multiplicación, constituyen ejemplos de anillos. Los denotaremos
por (ℤ, +, ·), (ℚ, +, ·), (ℝ, +, ·) y (ℂ, +, ·).
4 · Anillos y subanillos

Ejemplo 1.1.4 (Anillo de endomorfismos de un grupo abeliano) . Dado


un grupo abeliano (G , +), denotamos por End(G) a su conjunto de endo-
morfismos:

End(G) := { f : G −→ G | f (a + b) = f (a) + f (b)}.

Consideremos en End(G) las siguientes operaciones:


Adición: si f , g ∈ End(G),

f + g : G −→ G
a ↦−→ ( f + g) (a) := f (a) + g (a).

Multiplicación: si f , g ∈ End(G),

f ◦ g : G −→ G
a ↦−→ ( f ◦ g) (a) := f (g (a)) .

Es fácil comprobar que End(G) bajo estas operaciones constituye un anillo


en el cual su elemento nulo es el endomorfismo nulo,

0 : G −→ G
a ↦−→ 0,

y su elemento identidad es la función idéntica de G,

iG : G −→ G
a ↦−→ a.

El siguiente ejemplo muestra que en general End(G) no es conmutativo:


basta considerar el grupo V definido por

V := {e, a, b, ab}, a2 = b 2 = e, ab = ba,

y los siguiente endomorfismos f y g, para los cuales se tiene f ◦ g ≠ g ◦ f :

f g
G −→ G G −→ G
e ↦−→ e e ↦−→ e
a ↦−→ a a ↦−→ b
b ↦−→ ab b ↦−→ a
ab ↦−→ b ab ↦−→ ab
Anillos y subanillos · 5

Ejemplo 1.1.5 (Anillo de matrices de orden n ≥ 1 sobre un anillo A) .


Denotaremos por Mn (A) al conjunto de todas las matrices cuadradas de
tamaño n × n, n ≥ 1, con elementos en un anillo A,

Mn (A) := {A = [ai j ] | ai j ∈ A, 1 ≤ i , j ≤ n}.

Definimos en Mn (A) la adición y multiplicación de la manera habitual: da-


das H = [hi j ] y B = [bi j ] en Mn (A), se define

H + B = C = [ci j ] , con ci j := hi j + bi j ,
n
∑︁
H B = D = [di j ], con di j := hik bk j .
k=1

Notemos que tanto la suma hi j + bi j como el producto hik bk j son operaciones


en A. Veamos que (Mn (A), +, ·) es un anillo: la asociatividad de la adición
de matrices se deduce de la propiedad asociativa de la adición en A. El ele-
mento neutro para la adición en Mn (A) es la matriz nula notada por 0 y
definida por 0 = [0i j ] donde 0i j := 0 para cada 1 ≤ i , j ≤ n , es decir, los
elementos de la matriz nula son todos iguales al cero en el anillo A. Cada
matriz H = [hi j ] tiene su opuesta aditiva denotada por −H y definida por
−H := [−hi j ], con −hi j es el opuesto del elemento hi j en A. La conmutativi-
dad de la adición de matrices se deduce de la conmutatividad de la adición
en A. Demostraremos que la multiplicación de matrices es una operación
asociativa, es decir, dadas H = [hi j ], B = [bi j ], C = [ci j ] ∈ Mn (A) se cumple
que (H B)C = H (BC). En efecto, sea D = [di j ] = H B y F = [ fi j ] = DC,
entonces
n n n n ∑︁n
!
∑︁ ∑︁ ∑︁ ∑︁
fi j = dik ck j = him bmk ck j = (him bmk )ck j
k=1 k=1 m=1 k=1 m=1
n
n ∑︁ n n
!
∑︁ ∑︁ ∑︁
= him (bmk ck j ) = him bmk ck j .
m=1 k=1 m=1 k=1

La suma del último paréntesis representa el término (m, j) de la matriz BC


y la suma
n n
!
∑︁ ∑︁
him bmk ck j
m=1 k=1
representa el término (i , j) de la matriz H (BC), lo cual demuestra la igual-
dad de las matrices (H B)C = H (BC). La matriz denotada por E := [ei j ],
con (
1, si i = j,
ei j :=
0, si i ≠ j,
6 · Anillos y subanillos

es el elemento identidad para la multiplicación en Mn (A) y se conoce co-


mo la matriz idéntica. Las propiedades distributivas de la multiplicación
respecto a la adición en Mn (A) se deducen de las respectivas propiedades
distributivas en el anillo A. El anillo Mn (A) es no conmutativo salvo cuando
A es un anillo conmutativo y n = 1.
Ejemplo 1.1.6 (Aplicaciones de un conjunto no vacío en un anillo) . Sea
(A, +, ·, 1) un anillo y sea X un conjunto no vacío cualquiera. Denotemos
por AX el conjunto de todas las funciones con dominio X y codominio A.
Las siguientes operaciones dan a AX estructura de anillo: sean f : X −→ A
y g : X −→ A funciones de X en A, entonces se definen:
Adición:

f + g : X −→ A
x ↦−→ ( f + g) (x) := f (x) + g (x).

Multiplicación:

f · g : X −→ A
x ↦−→ ( f · g) (x) := f (x) · g (x).

El cero de AX es la función, denotada por 0, que asigna a cada elemento de


X el cero del anillo A; el elemento identidad, denotado por 1, es la función
que asigna a cada elemento de X el 1 del anillo A. Notemos que AX es
conmutativo si, y sólo si, A es conmutativo. Si X = ℕ y A = ℝ, ℝℕ es el
anillo de sucesiones reales.
Ejemplo 1.1.7 (Anillo de los enteros módulo n ≥ 2) . Consideremos el
grupo abeliano (ℤn , +) de enteros módulo n, donde

ℤn = ℤ/⟨n⟩ := {0, 1, 2, . . . , n − 1}.

En ℤn se define la multiplicación de clases por

r s := rs, r , s ∈ ℤ,

es decir, en términos del producto del anillo ℤ. Esta operación está bien de-
finida, ya que si r = r ′ y s = s ′, entonces rs = r ′ s ′. Es inmediato que (ℤn , ·, 1)
es un semigrupo con elemento identidad 1. La distributividad de la multi-
plicación respecto a la adición en ℤn es consecuencia directa de la distribu-
tividad de la multiplicación respecto a la adición en el anillo ℤ; lo mismo
podemos decir para la conmutatividad de la multiplicación. Así, (ℤn , +, ·)
es un anillo conmutativo. Si n = 0, entonces

ℤ0 = ℤ/⟨0⟩ = {r = {r } | r ∈ ℤ},
Anillos y subanillos · 7

y podemos considerar que ℤ0 es el mismo anillo ℤ; cuando n = 1, entonces


ℤ1 = ℤ/⟨1⟩ = ℤ/ℤ = {0}. En este último caso el anillo ℤ1 consta de un solo
elemento: la clase cero. Obsérvese que en este anillo el elemento neutro de
la adición coincide con el elemento identidad de la multiplicación.

Observación 1.1.8. Un anillo A se dice que es trivial, o también que es


nulo, si posee un único elemento. Una condición necesaria y suficiente para
que un anillo sea trivial es que su elemento nulo coincida con su elemen-
to identidad. En adelante, si no se advierte lo contrario, la palabra anillo
indicará anillo no nulo.

Definición 1.1.9. Sea A un anillo y a ∈ A. Se dice que a es un elemento


invertible del anillo A si existe en A un elemento (único) denotado por a−1
tal que aa−1 = 1 = a−1 a. El conjunto de todos los elementos invertibles de
un anillo A se denota A∗ , es decir, A∗ := {a ∈ A | a es invertible}.

Proposición 1.1.10. Si (A, +, ·) es un anillo, (A∗ , ·) es un grupo, denominado


el grupo multiplicativo del anillo A, o también, el grupo de los elementos
invertibles de A.

Demostración. Se deja como ejercicio al lector. ✓


Definición 1.1.11. Sea A un anillo no nulo. Se dice que A es un anillo de


división si todos los elementos no nulos de A son invertibles, es decir, si
A∗ = A − {0}. Un cuerpo es un anillo de división conmutativo.

Ejemplo 1.1.12. Para los anillos considerados en los ejemplos anteriores


se tiene lo siguiente:

(i) Grupos multiplicativos:

ℤ∗ = {1, −1}; ℚ∗ = ℚ − {0}; ℝ∗ = ℝ − {0};


ℂ∗ = ℂ − {0}; ℤ∗n = {x | m. c. d.(x, n) = 1};
End(G) ∗ = Aut(G) := grupo de automorfismos de G;
Mn (A) ∗ = GLn (A) := grupo lineal de orden n sobre A;
(AX ) ∗ = { f : X −→ A | f (X) ⊆ A∗ }.

(ii) Anillos de la parte (i) que son cuerpos.

(a) ℤ no es un cuerpo.
(b) ℚ es cuerpo.
(c) ℝ es cuerpo.
8 · Anillos y subanillos

(d) ℂ es cuerpo.
(e) ℤn es cuerpo si, y sólo si, n es un número primo.
(f) End(G) no es cuerpo por ser no conmutativo; en general, tam-
poco es un anillo de división. Por ejemplo, para el grupo abe-
liano ℤ, la función h : ℤ −→ ℤ, definida por h(k) = 2k, es un
elemento de End(ℤ), con h ≠ 0, pero h ∉ Aut(G).
(g) Mn (A) no es un cuerpo por no ser conmutativo; tampoco es ani-
llo de división a menos que A lo sea y n = 1.
(h) Si |X | ≥ 2, AX no es un anillo de división.

Si (A, +, ·) es un anillo podemos utilizar todas las propiedades del grupo


aditivo (A, +) y las del semigrupo (A, ·). En particular, utilizaremos la po-
tenciación de este último. Sea a un elemento de A, definimos inductiva-
mente las potencias enteras de a como sigue:

a 1 := a, a n := a n−1 a, n ≥ 2;
para a ≠ 0, a0 := 1;
para a ∈ A∗ , a −n := (a −1 ) n , n ≥ 1.

Recordemos además cómo se definen los múltiplos enteros en el grupo


(A, +):

1 · a := a,
k · a := (k − 1)a + a, k ≥ 2,

0 · a := 0
∀a ∈ A, ∀k ∈ ℤ+ .
(−k) · a := −(ka)

Proposición 1.1.13. Dado (A, +, ·, 1) un anillo y a, b, c elementos cualesquiera


de A, entonces
(i) a · 0 = 0.

(ii) a(−b) = (−a)b = −(ab).

(iii) (−a)(−b) = ab.

(iv) a(b − c) = ab − ac.

(v) (b − c)a = ba − ca.

(vi) Si m y n son enteros ≥ 1, entonces

(a n ) m = a mn .
Anillos y subanillos · 9

(vii) Si A = R es conmutativo, entonces para cada n ≥ 1,


(ab) n = a n b n .

Demostración. Ejercicio para el lector. ✓


Existen anillos en los cuales el producto de elementos no nulos es nulo.


Así, por ejemplo, en ℤ6 , 2 · 3 = 0 con 2 ≠ 0 y 3 ≠ 0.
Definición 1.1.14. Se dice que un anillo A es un anillo sin divisores de
cero si para cualesquiera elementos a, b ∈ A se cumple
ab = 0 ⇔ a = 0, o, b = 0.
El elemento a ∈ A es un divisor de cero a la derecha si existe b ≠ 0, b ∈ A,
tal que ba = 0. De manera análoga se define un divisor de cero a izquierda.
a ∈ A es un divisor de cero si a es divisor de cero a la izquierda o a la
derecha. Un anillo sin divisores de cero se denomina dominio; si además es
conmutativo, se conoce como dominio de integridad (DI).
Definición 1.1.15. Sea A un anillo no nulo. Se dice que A cumple la ley
cancelativa a derecha si para cualesquiera b, c ∈ A y cualquier a ≠ 0 en A
se cumple
ba = ca ⇔ b = c.
De manera análoga se define la ley cancelativa a izquierda.
Proposición 1.1.16. Sea A un anillo. Entonces,
(i) A es un dominio si, y sólo si, A cumple las dos propiedades cancelativas.

(ii) Todo anillo de división es un dominio.

(iii) Todo dominio finito es un anillo de división.

(iv) ℤn es dominio de integridad si, y sólo si, n es primo.


Demostración. Las dos primeras propiedades son evidentes.
(iii) Sea D un dominio finito. Veamos que D∗ = D − {0}. Puesto que D
es finito, D está constituido por n elementos distintos, a1 , a2 , . . . , an . Dado
a no nulo en D, se puede afirmar que los siguientes elementos de D son
distintos: a1 · a, a2 · a, . . . , an · a, ya que si ai · a = a j · a, para i ≠ j, entonces

ai − a j · a = 0, y como D es un dominio, se tendrá que ai = a j . Entonces,
todo elemento de D debe ser de la forma ai · a, para algún ai ; en particular,
1 = ai · a para algún ai , y así, a tiene inverso a izquierda. De manera similar
se prueba que a tiene inverso a derecha, luego a ∈ D∗ .
(iv) Consecuencia de (i) y (ii). ✓

10 · Anillos y subanillos

2. Subanillos
Definición 1.2.1. Dado (A, +, ·, 1) un anillo y ∅ ≠ S ⊆ A, se dice que S es
subanillo de A si (S, +, ·, 1) tiene estructura de anillo. Un subanillo S de A
tal que S ≠ A se denomina subanillo propio de A.
Es fácil comprobar que S es subanillo de A si, y sólo si, 1 ∈ S y para
cualesquiera a, b ∈ S, se cumple que a − b y ab ∈ S. El anillo A tiene como
subanillo trivial a A.
Ejemplo 1.2.2. (a) ℤ no tiene subanillos propios.
(b) ℤ es subanillo propio de ℚ, ℝ y ℂ.
(c) ℚ es un subanillo propio de ℝ y ℂ.
(d) ℝ es subanillo propio de ℂ.
Ejemplo 1.2.3. Sean End(G) el anillo de endomorfismos de un grupo abe-
liano G y H un subgrupo de G. El conjunto S de endomorfismos f de G
tales que f (H ) ⊆ H , es un subanillo de End(G).
Ejemplo 1.2.4. Sea Mn (A) el anillo de matrices de orden n sobre un anillo
A; si denotamos por D(A) al conjunto de las matrices diagonales en Mn (A),
es decir,

D (A) := {D = [di j ] ∈ Mn (A) | di j = 0, para i ≠ j},

entonces D(A) es un subanillo de Mn (A). El grupo de elementos invertibles


del anillo D(A) se denota por Dn (A).
Ejemplo 1.2.5. Dado un anillo cualquiera, el conjunto Z (A) de elementos
de A que conmutan (respecto al producto) con todos los elementos de A, es
decir,
Z (A) := {a ∈ A | ab = ba, para todo b ∈ A}
es un subanillo de A y se denomina el centro de A. Nótese que A es con-
mutativo si, y sólo si, Z (A) = A.
Ejemplo 1.2.6. Sea AX el anillo de funciones del conjunto X en el anillo
A y sea S un subanillo de A. Entonces, S ′ := { f ∈ A | f (X) ⊆ S} es un
subanillo de AX .
Ejemplo 1.2.7 (Cuaterniones de Hamilton) . Consideremos en el anillo
de las matrices de orden 2 sobre el cuerpo de losnúmeros complejos el sub-
conjunto   
z w
ℍ := | z, w ∈ ℂ ⊆ M2 (ℂ),
−w z
Anillos y subanillos · 11

donde z = a − bi denota el conjugado del complejo z = a + bi con a, b ∈ ℝ.


ℍ es un subanillo de M2 (ℂ):
     
z1 w1 z2 w2 z1 − z2 w1 − w2
− = ∈ ℍ,
−w1 z1 −w2 z2 −w1 − w2 z1 − z2
   " #
z1 w1 z2 w2 z1 z2 − w1w2 z1w2 + w1 z2
= ∈ ℍ,
−w1 z1 −w2 z2 −z1w2 + w1 z2 z1 z2 − w1w2
 
1 0
∈ ℍ.
0 1

Nótese que ℍ no es conmutativo:


     
i 0 0 i 0 i i 0
≠ .
0 −i i 0 i 0 0 −i

Cada elemento no nulo de ℍ es invertible y su inverso está en ℍ, con lo cual


ℍ resulta ser anillo de división. En efecto, sea
 
z w
A= , z = a1 + b1 i , w = a2 + b2 i ,
−w z

una matriz no nula en ℍ. Entonces, al menos uno de los números reales a1 ,


b1 , a2 o b2 es no nulo. Esto hace que el determinante de la matriz A sea no
nulo:

d = det A = a12 + b12 + a22 + b22 ≠ 0,


 z −w 
−1
A = wd d
z ∈ ℍ.
d d

Ejemplo 1.2.8 (Dominio de enteros gaussianos) . El anillo de los enteros


es un ejemplo de dominio de integridad que no es un cuerpo. Presentamos
aquí otro ejemplo. El conjunto ℤ[i] de los números complejos definido por

ℤ[i] := {a + bi | a, b ∈ ℤ}

es un subanillo de ℂ; por tal razón ℤ[i] es conmutativo y no posee di-


visores de cero. Sin embargo, ℤ[i] no es cuerpo ya que 2 ∈ ℤ[i], pero
2−1 = 21 ∉ ℤ[i].

Ejemplo 1.2.9. Si A es un anillo, es claro que la intersección de cualquier


colección no vacía de subanillos de A es un subanillo de A. Sea a ∈ A.
La intersección de todos los subanillos de A que contienen a se denomina
subanillo generado por a, el cual denotamos por ℤ[a], y es el subanillo más
12 · Anillos y subanillos

pequeño de A que contiene a a. Queremos presentar los elementos de ℤ[a]


de una manera explícita. Supongamos inicialmente que a ≠ 0. Puesto que
0, 1 ∈ ℤ[a], entonces en el grupo (ℤ[a] , +, 0) se tiene

k · 1 = 1 + 1 + · · · + 1 := k ∈ ℤ[a] 


| {z } 



k-veces con k ∈ ℤ+ y 1, 0 ∈ A.
0 · 1 = 0 := 0 ∈ ℤ[a]; 0 ∈ ℤ 


(−k) · 1 = −(k · 1) := −k ∈ ℤ[a] 


Además, como las potencias enteras no negativas de a están en ℤ[a], en-
tonces estarán las combinaciones enteras de estas potencias, es decir, el con-
junto ( n )
∑︁
S := ki ai | ki ∈ ℤ, n ≥ 1 ⊆ ℤ[a].
i=0

De otra parte, S es un subanillo de A que contiene a. En efecto, la suma de


dos elementos de S está en S, 1 = 1 · 1 ∈ S, y la propiedad distributiva en
A, junto con la relación

(ki ai )(k j a j ) = ki k j ai+ j ,

da que el producto de dos elementos de S está en S. Es claro que a ∈ S. De


lo anterior se desprende que
( n )
∑︁
ℤ[a] = ki ai | ki ∈ ℤ, n ≥ 1 , a ≠ 0,
i=0
ℤ[0] = ℤ[1] = {k · 1 = k | k ∈ ℤ},

y se denomina subanillo primo de A.

Ejemplo 1.2.10. El ejemplo anterior puede ser ampliado a dos o más ele-
mentos a1 , . . . , an de tal forma que ℤ[a1 , . . . , an ] es el menor subanillo
de A que contiene a los elementos a1 , . . . , an , y consta de todas las sumas
finitas con sumandos de la forma

ka1i11 a2i12 · · · ani1n a1i21 a2i22 · · · ani2n · · · a1ir1 a2ir2 · · · anirn ,

con k ∈ ℤ, r ≥ 1 y iuv ≥ 0. Notemos que los elementos a1 , . . . , an no


necesariamente conmutan ya que A no es conmutativo.
De otra parte, si B es un subanillo de A y a1 , . . . , an ∈ A, entonces pode-
mos repetir las ideas expuestas anteriormente y construir el menor subanillo
de A que contenga al subanillo B y a los elementos a1 , . . . , an ; este anillo se
Anillos y subanillos · 13

denota por B[a1 , . . . , an ] y consta de todas las sumas finitas con sumandos
de la forma

k1 a1i11 a2i12 · · · ani1n k2 a1i21 a2i22 · · · ani2n · · · kr a1ir1 a2ir2 · · · anirn ,

con k j ∈ B, 1 ≤ j ≤ r. Este subanillo se denomina el subanillo de A ge-


nerado por B y a1 , . . . , an . Notemos que si kai = ai k y ai a j = a j ai , para
1 ≤ i , j ≤ n y todo k ∈ B, entonces cada elemento de B[a1 , . . . , an ] es una
suma finita de sumandos de la forma ka1i1 a2i2 · · · anin , con k ∈ B e iu ≥ 0, es
decir, expresiones polinómicas en a1 , . . . , an con coeficientes en B.

3. Ejercicios
1. Demuestre la proposición 1.1.10.

2. Demuestre que ℤn es cuerpo si, y sólo si, n es un número primo.

3. Sea A un anillo. Demuestre que si |X | ≥ 2, entonces AX no es un


anillo de división.

4. Demuestre la proposición 1.1.13.

5. Sean X un conjunto finito no vacío y 2X su conjunto de partes. Sea


Δ la diferencia simétrica de conjuntos y ∩ la intersección. Demuestre
que (2X , Δ, ∩) es un anillo conmutativo.
√ √
6. Sea ℚ[ −3] := {a + b −3 | a, b ∈ ℚ}, √ donde ℚ es el anillo de los
números racionales. Considérense en ℚ[ −3] las operaciones habi-
tuales de suma y multiplicación
√ de complejos. Demuestre que bajo
estas operaciones ℚ[ −3] es un cuerpo.

7. Si R es un anillo conmutativo, demuestre que para cada n ≥ 1,


n    
n
∑︁ n k n−k n n!
(a + b) = ab , = , con a, b ∈ R.
k k (n − k)!k!
k=0

8. Sea p ∈ ℤ no nulo. Demuestre que


 
a
ℚp := k | a ∈ ℤ, k ≥ 0
p
h i
es un subanillo de ℚ y coincide con ℤ 1p .
14 · Anillos y subanillos

9. Sean (A, +, ·, 1) un anillo y Q el anillo de endomorfismos del grupo


abeliano (A, +). Para cada x ∈ A, se define la función

fx : A −→ A
a ↦−→ xa.

Compruebe que para cada x ∈ A, fx ∈ Q. Si F := { fx | x ∈ A}, pruebe


además que F es un subanillo de Q isomorfo a A (véase el capítulo 3).

10. Calcule el centro del anillo de cuaterniones.

11. Sea A un anillo y n ≥ 2. Calcule el centro del anillo de matrices


Mn (A).

12. Sean X un conjunto no vacío, A un anillo y f : X −→ A una función


biyectiva. Demuestre que las siguientes operaciones convierten a X
en un anillo:

x + y := f −1 ( f (x) + f (y)),
xy := f −1 ( f (x) f (y)).

13. Sea A un anillo que satisface la siguiente condición: dado a ∈ A no


nulo existe un único b ∈ A tal que aba = a. Demuestre que:

(i) bab = b.
(ii) A es un anillo de división.
Capítulo
dos
Ideales
Ideales · 17

En teoría de anillos se tiene un concepto correspondiente al de subgrupo


normal de la teoría de grupos, el de ideal bilátero. Con ideales biláteros se
construyen los anillos cociente de manera similar a como se hace en grupos
con subgrupos normales. La definición y las operaciones entre ideales serán
presentadas en este capítulo.

1. Definición y ejemplos
Definición 2.1.1. Dados A un anillo e I un subconjunto no vacío de A, se
dice que:

(i) I es un ideal izquierdo de A si x + y ∈ I para todo x, y ∈ I, y además,


ax ∈ I para todo a ∈ A y todo x ∈ I.

(ii) I es un ideal derecho de A si x + y ∈ I para todo x, y ∈ I, y además,


xa ∈ I para todo x ∈ I y todo a ∈ A.

(iii) I es un ideal bilátero de A, o simplemente ideal de A, si I es un ideal


izquierdo y derecho de A.

Observación 2.1.2. (i) En un anillo conmutativo R los conceptos anteriores


coinciden y diremos simplemente que I es un ideal de R.
(ii) En un anillo A, tanto A como el conjunto 0 := {0} son ideales bilá-
teros de A, denominados los ideales biláteros triviales del anillo A.

Proposición 2.1.3. Sea A un anillo e I un ideal derecho (izquierdo, bilátero) que


contiene un elemento invertible de A, entonces I = A.

Demostración. Sea x ∈ A∗ ∩ I, entonces xx −1 = 1 ∈ I; de aquí se obtiene que


para todo y ∈ A, 1y = y ∈ I, es decir, A ⊆ I, y por lo tanto, I = A. ✓

Corolario 2.1.4. Si A es un anillo de división, entonces los únicos ideales derechos


(izquierdos, biláteros) de A son los triviales. Recíprocamente, si un anillo A posee
sólo dos ideales derechos (o también, sólo dos ideales izquierdos) , entonces A es un
anillo de división.

Demostración. Sea I un ideal derecho no nulo del anillo de división A, en-


tonces existe x ∈ I ⊆ A, x ≠ 0; esto indica que x ∈ I es invertible y, por la
proposición 2.1.3, I = A. La demostración para ideales izquierdos es idén-
tica. La afirmación para ideales biláteros es consecuencia de lo anterior.
Sea ahora A un anillo cuyos únicos ideales derechos son los triviales.
Para x ≠ 0 en A, el conjunto xA : ={xa | a ∈ A} es un ideal derecho de
A; además, este ideal es no nulo y, por lo tanto, xA = A. Se obtiene que
18 · Ideales

1 ∈ A ⊆ xA; esto significa que existe x ′ ∈ A tal que xx ′ = 1. Obsérvese


que x ′ es no nulo y, además, x ′ A = A. Existe x ′′ ∈ A tal que x ′ x ′′ = 1 y
xx ′ x ′′ = x, lo cual implica que x ′′ = x, es decir, x ∈ A∗ . Se ha probado que
cada elemento no nulo de A es invertible, luego A es un anillo de división.
La demostración para ideales izquierdos es análoga. ✓

Observación 2.1.5. Si un anillo A tiene sólo dos ideales biláteros no se


puede afirmar que A sea un anillo de división, como se verá a continuación.

Ejemplo 2.1.6 (Ideales del anillo de matrices Mn (A)) . Sean A un anillo


y Mn (A) su anillo de matrices de orden n. Para I, un ideal bilátero de A, el
conjunto
Mn (I) := {F = [ai j ] | ai j ∈ I }
es un ideal bilátero de Mn (A). En efecto, Mn (I) ≠ ∅ ya que 0 ∈ Mn (I);
dadas H = [hi j ], B = [bi j ] ∈ Mn (I), entonces H + B = C = [ci j ] ∈ Mn (I),
ya que ci j = hi j +bi j está en I, para cualesquiera i , j con 1 ≤ i, j ≤ n. Además,
para H ∈ Mn (I) y D = [di j ] ∈ Mn (A) se cumple que
H D = F = [ fi j ] ∈ Mn (I). En efecto,
n
∑︁
fi j = hik dk j ∈ I;
k=1

dado que I es un ideal derecho, hik dk j ∈ I para cada k, con 1 ≤ k ≤ n, por


tanto, la suma fi j ∈ I. Análogamente, DH ∈ Mn (I).
Se ha probado que cada ideal bilátero I del anillo A determina en Mn (A)
el ideal bilátero Mn (I). Probemos ahora el recíproco, es decir, que cada
ideal bilátero J de Mn (A) determina en A un ideal bilátero I tal que J es
precisamente Mn (I). En efecto, consideremos el conjunto

Ii j := {a ∈ A | Ei j a ∈ J },

donde Ei j a denota la matriz de orden n cuya única entrada no nula es la


correspondiente a la intersección de la fila i y la columna j, en la cual está
el elemento a. Si a = 1, dicha matriz se denota simplemente por Ei j . Para
este tipo de matrices es fácil demostrar que
(
0, si j ≠ l,
Ei j aElk b =
Eik ab, si j = l.

Veamos que Ii j es un ideal bilátero de A: Ii j ≠ ∅ ya que 0 ∈ J ; dados


x, y ∈ Ii j se tiene Ei j x, Ei j y ∈ J , pero como J es ideal bilátero, entonces
Ei j x + Ei j y = Ei j (x + y) ∈ J , de donde x + y ∈ Ii j . De otra parte, para
Ideales · 19

a ∈ A y x ∈ Ii j , se tiene que Ei j x ∈ J , E j j a, Eii a ∈ Mn (A), y por lo


tanto, Ei j xE j j a = Ei j xa ∈ J ; también, Eii aEi j x = Ei j ax ∈ J , de donde xa,
ax ∈ Ii j .
Probemos ahora que

J = {H = [hi j ] | hi j ∈ Ii j }.

Sea H = [hi j ] tal que hi j ∈ Ii j , para cada par de índices 1 ≤ i , j ≤ n, H


puede escribirse de la forma
n
∑︁
H= Ei j hi j ,
i , j=1

donde se tiene que Ei j hi j ∈ J , luego H ∈ J . De otro lado, dada


H = [hi j ] ∈ J , mostraremos que una entrada cualquiera hlk de H está en
Ilk . En efecto,
Ell H Ekk = Elk hlk ∈ J ,
de donde hlk ∈ Ilk .
Se desea mostrar finalmente que todos los ideales Ii j , con 1 ≤ i, j ≤ n,
coinciden. Fijemos dos índices i, j y probemos que Ii j = Iir para todo r.
Dado x ∈ Ii j , se cumple que Ei j x ∈ J , por lo tanto, Ei j xE jr = Eir x ∈ J ,
luego x ∈ Iir , es decir, Ii j ⊆ Iir . Simétricamente, Iir ⊆ Ii j . En forma análoga,
Is j = Ii j para 1 ≤ s ≤ n. Resulta, Ii j = I y

J = {H = [hi j ] | hi j ∈ Ii j } = Mn (I).

Se ha demostrado así que los ideales biláteros de Mn (A) son de la forma


Mn (I), donde I es un ideal bilátero de A.

Ejemplo 2.1.7 (Ideales biláteros del anillo de matrices sobre un anillo de


división A) . Para n ≥ 2, sea Mn (A) el anillo de matrices sobre un anillo de
división A. Según el ejemplo 2.1.6, Mn (A) tiene sólo dos ideales biláteros:
los triviales Mn (0) = 0 y Mn (A). Sin embargo, Mn (A) no es un anillo de
división ya que la matriz E11 es no nula y no es invertible.

Definición 2.1.8. Un anillo A se dice simple si los únicos ideales biláteros


de A son los triviales, 0 y A.

Corolario 2.1.9. Sea R un anillo conmutativo. R es un cuerpo si, y sólo si, R es


simple.

Demostración. Consecuencia directa del corolario 2.1.4. ✓



20 · Ideales

Ejemplo 2.1.10 (Ideales del anillo ℤ) . Si I es un ideal de ℤ, entonces I es


un subgrupo de (ℤ, +, 0) y, por lo tanto, está conformado por los múltiplos
de algún entero no negativo n, es decir, I es de la forma nℤ. Es claro que
cada uno de estos conjuntos es un ideal de ℤ.
Ejemplo 2.1.11 (Ideales de los anillos ℚ, ℝ y ℂ) . Puesto que ℚ, ℝ y ℂ
son cuerpos, sus únicos ideales son los triviales.
Ejemplo 2.1.12. Sean A un anillo, Mn (A) su anillo de matrices y

J := {H = [hi j ] | hi j = 0, para j ≠ 1}.

Entonces J es un ideal izquierdo no derecho de Mn (A). Con i ≠ 1 se cons-


truye en forma similar un ideal derecho no izquierdo.
Ejemplo 2.1.13. Sean AX el anillo de funciones de X en un anillo A e I
un ideal bilátero (izquierdo, derecho) de A. Entonces,

I X := { f ∈ AX | f (X) ⊆ I }

es un ideal bilátero (izquierdo, derecho) de AX .

2. Operaciones con ideales


Como se hace en teoría de grupos con los subgrupos de un grupo, es posible
definir operaciones entre los ideales de un anillo.
Definición 2.2.1. Si A es un anillo e {Ii }i ∈ C es una familia de ideales iz-
Ñ
quierdos de A, la intersección i ∈ C Ii es un ideal izquierdo de A, el cual se
denomina ideal intersección. De manera análoga se define la intersección
de ideales derechos y biláteros.
Proposición 2.2.2. Sean A un anillo y ∅ ≠ S ⊆ A. El ideal izquierdo más
pequeño de A que contiene al subconjunto S es la intersección de todos los ideales
izquierdos de A que contienen a S y se denota por ⟨S}, es decir,
Ù
⟨S} := I .
S ⊆I
I es ideal izquierdo de A

Demostración. Evidente a partir de la noción de intersección. ✓


Definición 2.2.3. Dados A un anillo y ∅ ≠ S ⊆ A, al ideal ⟨S} se le deno-


mina el ideal izquierdo generado por S. El ideal izquierdo I de A se dice
que es finitamente generado si existe un subconjunto finito S en A tal que
⟨S} = I. Además, ⟨∅} := 0.
Ideales · 21

De manera análoga se define el ideal derecho generado por S, el ideal


bilátero generado por S, denotados por {S⟩ y ⟨S⟩, respectivamente.

Proposición 2.2.4. Sean A un anillo y ∅ ≠ S ⊆ A. El ideal izquierdo generado


por S coincide con el conjunto de sumas finitas de productos de elementos de A con
elementos de S.

Demostración. Denotemos por B al conjunto de las sumas finitas de produc-


tos de elementos de A con elementos de S,

n
( )
∑︁
B= ak sk | ak ∈ A, sk ∈ S, n ≥ 1 ;
k=1

probemos que ⟨S} = B. En efecto, es inmediato que si x, y ∈ B se tiene que


x + y ∈ B, y si a ∈ A entonces ax ∈ B, es decir, B es un ideal izquierdo de
A. Además, nótese que S ⊆ B, de donde se deduce que ⟨S} ⊆ B.
Sea ahora I un ideal izquierdo de A que contiene a S, entonces I debe
Ín
contener cada suma de la forma k=1 ak sk , con ak ∈ A, sk ∈ S y n ≥ 1, es
decir, B ⊆ I. Como esto es válido para todo ideal izquierdo que contenga a
S, entonces
Ù
B⊆ I = ⟨S}. ✓

S ⊆I
I es ideal izquierdo de A

Proposición 2.2.5. (i) Sean A un anillo y S ⊆ A, con S ≠ ∅. Entonces,

n
( )
∑︁
{S⟩ = sk ak | ak ∈ A, sk ∈ S, n ≥ 1 ,
k=1
n
( )
∑︁
⟨S⟩ = ak sk ak′ | ak′ , ak ∈ A, sk ∈ S, n ≥ 1 .
k=1

(ii) Si R un anillo conmutativo, entonces

⟨S} = {S⟩ = ⟨S⟩.

Demostración. La demostración de estas afirmaciones es completamente aná-


loga a la de la proposición 2.2.4. ✓

22 · Ideales

Corolario 2.2.6. Dados A un anillo y S = {s1 , . . . , sn } ⊆ A, entonces


( n )
∑︁
⟨s1 , . . . , sn } = ak sk | ak ∈ A ,
k=1
n
( )
∑︁
{s1 , . . . , sn ⟩ = sk ak | ak ∈ A ,
k=1
m
( )
∑︁
⟨s1 , . . . , sn ⟩ = ak sik ak′ | ak′ , ak ∈ A, sik ∈ S, m ≥ 1 .
k=1

En particular,
⟨x} = Ax = {ax | a ∈ A},
{x⟩ = xA = {xa | a ∈ A},
( n )
∑︁
⟨x⟩ = ak xak′ | ak′ , ak ∈ A, n ≥ 1 ,
k=1

los cuales se denominan ideal principal izquierdo, derecho y bilátero, respec-


tivamente. Cuando A es un anillo conmutativo, estos ideales coinciden.
Definición 2.2.7. Se dice que A es un anillo de ideales principales dere-
chos si todos los ideales derechos de A son principales. De manera similar se
definen los anillos de ideales principales izquierdos y los anillos de idea-
les principales biláteros. Si D es un DI, se dice que D es un dominio de
ideales principales (DIP) si cada ideal de D es principal.
Ejemplo 2.2.8. ℤ es un dominio de ideales principales.
Ejemplo 2.2.9. Todo cuerpo es dominio de ideales principales.
Podemos ahora definir una segunda operación entre ideales izquierdos,
derechos y biláteros.
Definición 2.2.10. Sea A un anillo y {Ii }i ∈ C una familia de ideales izquier-
Í
dos de A. Se define la suma de la familia {Ii }i ∈ C, y se simboliza por i ∈ C Ii ,
Ð
al ideal generado por el conjunto i ∈ C Ii .
Según la proposición 2.2.4,
( n )
∑︁ ∑︁ Ø
Ii = ak | ak ∈ Ii , n ≥ 1 .
i∈C k=1 i∈C

En particular,
n
( )
∑︁
I1 + · · · + In = ak | ak ∈ Ik .
k=1
Ideales · 23

Observación 2.2.11. (i) Nótese que si s1 , . . . , sn ∈ A, entonces

⟨s1 , . . . , sn } = As1 + · · · + Asn .

(ii) La suma de una familia de ideales derechos se define en forma análoga,


así como también la suma de ideales biláteros.
Í
(iii) i ∈ C Ii es el ideal izquierdo (derecho, bilátero) más pequeño de A
que contiene a cada uno de los ideales izquierdos (derechos, biláteros) de la
familia {Ii }i ∈ C.

Definición 2.2.12. Si {I1 , . . . , In } es una familia finita de ideales izquier-


dos de un anillo A, se define su producto, y se denota por I1 I2 · · · In , al ideal
izquierdo generado por el conjunto

{x1 · · · xn | xi ∈ Ii , 1 ≤ i ≤ n}.

De acuerdo con la proposición 2.2.4,


( m )
∑︁
I1 I2 · · · In = x1k · · · xnk | xik ∈ Ii , 1 ≤ i ≤ n, m ≥ 1 .
k=1

Observación 2.2.13. (i) El producto de una familia de ideales derechos o


biláteros se define de manera análoga.
(ii) Nótese que cuando I1 , . . . , In son ideales izquierdos, entonces el pro-
ducto I1 · · · In está contenido en In ; cuando I1 , . . . , In son ideales derechos,
el producto I1 · · · In está contenido en I1 ; cuando I1 , . . . , In son ideales bi-
láteros, el producto I1 · · · In está contenido en cada ideal Ii , i = 1, 2, . . . , n.

Definición 2.2.14. Sea A un anillo e I un ideal izquierdo no nulo de A. Se


define

I 0 := A,
I 1 := I ,
..
.
I n := I n−1 I , n ≥ 2.

Observación 2.2.15. La definición anterior es aplicable también a ideales


derechos y biláteros no nulos de A. Si I = 0 entonces 0n = 0, para cada
n ≥ 1.

Proposición 2.2.16. Sea A un anillo.


24 · Ideales

(i) Dados I y J ideales izquierdos de A, el conjunto definido por

(I : J ) := {a ∈ A | a J ⊆ I }

es un ideal bilátero de A y se denomina el cociente de I por J .

(ii) Dados I y J ideales derechos del anillo A, el conjunto definido por

(I : J ) := {a ∈ A | J a ⊆ I }

es un ideal bilátero de A y se denomina el cociente de I por J .

(iii) En particular, si I es un ideal izquierdo (derecho) de A,

Ann(I) := (0 : I)

es un ideal bilátero de A y se denomina el anulador de I.

Demostración. Realizamos sólo la prueba de (i). La demostración de las otras


dos afirmaciones quedan como ejercicio para el lector. (I : J ) ≠ ∅ ya que
0 J = 0 ⊆ I. Si a, a ′ ∈ (I : J ) y x ∈ A, entonces

(a + a ′) J ⊆ a J + a ′ J ⊆ I , xa J ⊆ xI ⊆ I , ax J ⊆ a J ⊆ I . ✓

Proposición 2.2.17. Sea R un anillo conmutativo y sea I un ideal de R. Se define


el radical de I por

I := {r ∈ R | r n ∈ I para algún n ≥ 1}.

Entonces, I es un ideal de R.

Demostración. La prueba la dejamos al lector. ✓


Presentamos a continuación algunas propiedades de las operaciones de-


finidas.

Proposición 2.2.18. Sean J , I1 , . . . , In ideales derechos (izquierdos, biláteros)


de A, entonces

J (I1 + · · · + In ) = J I1 + · · · + J In
(I1 + · · · + In ) J = I1 J + · · · + In J .
Ideales · 25

Demostración. Probamos sólo la primera identidad. Sea x ∈ J (I1 + · · · + In ),


entonces x es de la forma
m
∑︁
x= bk (a1k + · · · + ank )
k=1
m
∑︁
= bk a1k + · · · + bk ank ,
k=1

lo cual significa que x pertenece a J I1 + · · · + J In , es decir,

J (I1 + · · · + In ) ⊆ J I1 + · · · + J In .

De otra parte, puesto que para cada 1 ≤ j ≤ n,

I j ⊆ I1 + · · · + In ,

entonces
J I j ⊆ J (I1 + · · · + In ),
de donde
n
∑︁
J I j ⊆ J (I1 + · · · + In ). ✓

j=1

Proposición 2.2.19. Sea R un anillo conmutativo y sean I , J ideales de R.


Entonces,

(i) I ⊆ I.
√︁√ √
(ii) I = I.
√ √
(iii) Si I ⊆ J , entonces I ⊆ J .
√ √ √ √
(iv) I J = I ∩ J = I ∩ J .

(v) I = R ⇔ I = R.
√ √︁√ √
(vi) I + J = I + J.
√ √
(vii) I n = I, para cada entero n ≥ 1.
√ √
(viii) I + J = R ⇔ I + J = R.

Demostración. La prueba se plantea como ejercicio al lector. ✓


El siguiente ejemplo ilustra en el anillo ℤ las operaciones definidas en la


presente sección.
26 · Ideales

Ejemplo 2.2.20. Sean m y n enteros, entonces:


(i) ⟨m⟩ ∩ ⟨n⟩ = ⟨m. c. m.(m, n)⟩, en donde m. c. m. denota el míni-
mo común múltiplo: en efecto, si x ∈ ⟨m⟩ ∩ ⟨n⟩, entonces x es múltiplo
de m y n simultáneamente; por lo tanto, x es múltiplo del mínimo co-
mún múltiplo de ellos, es decir, x ∈ ⟨m. c. m.(m, n)⟩. Recíprocamente, si
x ∈ ⟨m. c. m.(m, n)⟩, x ∈ ⟨m⟩ y x ∈ ⟨n⟩, de donde x ∈ ⟨m⟩ ∩ ⟨n⟩.
(ii) ⟨m⟩ + ⟨n⟩ = ⟨m. c. d.(m, n)⟩, en donde m. c. d. denota el máximo
común divisor. Dado x ∈ ⟨m⟩ + ⟨n⟩ entonces x = a +b, con a ∈ ⟨m⟩ y b ∈ ⟨n⟩,
es decir, x = km + pn, con k, p ∈ ℤ. Sea d := m. c. d.(m, n), entonces

d | m y d | n, luego d | x,

y así, x = ds, con s ∈ ℤ, es decir, x ∈ ⟨d⟩. Recíprocamente, sea x = ds,


como d es combinación lineal de m y n, digamos d = wm + zn, con w, z ∈ ℤ,
entonces
x = wms + zns ∈ ⟨m⟩ + ⟨n⟩.

(iii) ⟨m⟩⟨n⟩ = ⟨mn⟩: sea x ∈ ⟨m⟩⟨n⟩, entonces x = a1 b1 + · · · + at bt , donde


ai ∈ ⟨m⟩ y bi ∈ ⟨n⟩, con i = 1, 2, . . . , t. Entonces, x = k1 ms1 n + · · · + kt mst n,
con ki , si ∈ ℤ y por lo tanto, x ∈ ⟨mn⟩. Recíprocamente, si x ∈ ⟨mn⟩,
entonces x = kmn, con k ∈ ℤ, de donde x = kmn ∈ ⟨m⟩⟨n⟩.
(iv) ⟨m⟩ k = ⟨m k ⟩, m ≠ 0, k ≥ 0: esto es consecuencia directa de (iii).
(v) (⟨m⟩ : ⟨n⟩): Si n = 0, entonces (⟨m⟩ : 0) = ℤ. Sea n ≠ 0. Si m = 0,
entonces claramente (0 : ⟨n⟩) = 0. Consideremos entonces que también
m ≠ 0. En este caso probaremos que (⟨m⟩ : ⟨n⟩) = ⟨ md ⟩, donde d = (m, n).
Sabemos que d es combinación entera de m y n, es decir, existen k1 , k2 ∈ ℤ
tales que d = k1 m + k2 n. Sea x ∈ (⟨m⟩ : ⟨n⟩), entonces xn ∈ ⟨m⟩ y existe
t ∈ ℤ, tal que xn = tm. Resulta,

dx = k1 mx + k2 nx = m(k1 x + k2 t),

m
y de aquí, x = d (k1 x + k2 t) ∈ ⟨ md ⟩. De otra parte,
DmE D mn E DnE
⟨n⟩ = = ⟨m⟩ ⊆ ⟨m⟩.
d d d
Hemos entonces probado la igualdad (⟨m⟩ : ⟨n⟩) = ⟨ md ⟩.
√︁ √ √
(vi) ⟨n⟩: si n = 0, entonces 0 = 0; para n = 1, ℤ = ℤ. Sea n ≥ 2,
entonces sea n = p1r1 · · · ptrt la descomposición de n en factores primos; se
√︁ √︁ √︁
tiene que ⟨n⟩ = ⟨p1 ⟩ ∩ · · · ∩ ⟨pt ⟩ = ⟨p1 ⟩ ∩ · · · ∩ ⟨pt ⟩ = ⟨p1 · · · pt ⟩.
Ideales · 27

Ejemplo 2.2.21. Sea A = Mn (ℤ) el anillo de matrices de orden n ≥ 2


sobre ℤ. A es un anillo no conmutativo con divisores de cero cuyos idea-
les biláteros son todos principales: para la notación que utilizaremos en la
prueba de estas afirmaciones remitimos al lector al ejemplo 2.1.6. E11 ≠ 0,
E12 ≠ 0 y E11 E12 = E12 ≠ E12 E11 = 0. Sea J un ideal bilátero de A. Sa-
bemos que J = Mn (I), donde I es un ideal de ℤ; según el ejemplo 2.1.10,
I = ⟨m⟩, para algún entero m ≥ 0. Nótese que J es el ideal generado por la
matriz
m 0 · · · 0
 
 0 0 · · · 0
E11 m =  . . .
 
. . . .
. 
. .
 . . 
 0 0 · · · 0
 
En efecto, puesto que E11 m ∈ J , entonces ⟨E11 m⟩ ⊆ J . Sea B = [bi j ] una
matriz de J ; B se puede escribir en la forma B = in, j=1 Ei j bi j , con bi j ∈ ⟨m⟩,
Í

1 ≤ i , j ≤ n. Para B se tiene entonces que


n
∑︁
B= Ei j ki j m,
i , j=1

con ki j ∈ ℤ, luego
n
∑︁
B= (Ei1 ki j )(E11 m)E1 j ,
i , j=1

y, según el corolario 2.2.6, B ∈ ⟨E11 m⟩. En resumen, J = ⟨E11 m⟩ y J es


principal.

3. Ejercicios
1. Demuestre la afirmación del ejemplo 2.1.12.

2. Demuestre la proposición 2.2.5.

3. Complete la demostración de la proposición 2.2.16.

4. Demuestre la proposición 2.2.19.

5. En el anillo ℤ de los números enteros calcule (⟨m⟩ + ⟨n⟩)(⟨m⟩ : ⟨n⟩).

6. Sean X un conjunto finito no vacío y 2X su anillo de partes (véase la


sección de ejercicios del capítulo 1). Determine un ideal propio y un
subanillo propio de 2X . ¿Cuál es su grupo de invertibles? ¿Es 2X un
anillo de ideales principales?
28 · Ideales

7. Sea A un anillo y S = {x1 , . . . , xn } un subconjunto finito no vacío de


A. Demuestre que:

⟨x1 , . . . , xn } = ⟨x1 } + · · · + ⟨xn },


{x1 , . . . , xn ⟩ = {x1 ⟩ + · · · + {xn ⟩,
⟨x1 , . . . , xn ⟩ = ⟨x1 ⟩ + · · · + ⟨xn ⟩.

Generalice estos resultados para un conjunto no vacío cualquiera S de


A.

8. Sean A un anillo e I1 , I2 , I3 ideales izquierdos (derechos, biláteros)


de A. Demuestre que:

(i) I1 ∩ I1 = I1 .
(ii) I1 ∩ I2 = I2 ∩ I1 .
(iii) (I1 ∩ I2 ) ∩ I3 = I1 ∩ (I2 ∩ I3 ).
(iv) I1 + I1 = I1 .
(v) I1 + I2 = I2 + I1 .
(vi) (I1 + I2 ) + I3 = I1 + (I2 + I3 ).
(vii) I1 + (I1 ∩ I2 ) = I1 .
(viii) I1 ∩ (I1 + I2 ) = I1 .

9. Dé un ejemplo de anillo A y elemento x ∈ A tales que Ax ⊊ xA.

10. En el anillo de matrices M3 (ℤ), calcule:

(i) M3 (⟨4⟩) ∩ M3 (⟨6⟩).


(ii) M3 (⟨5⟩) + M3 (⟨7⟩).
(iii) M3 (⟨2⟩)M3 (⟨9⟩).
(iv) M3 (⟨11⟩) 2 .
(v) (M3 (⟨4⟩) : M3 (⟨6⟩)).

Generalice los resultados anteriores al anillo Mn (ℤ), n ≥ 2.

11. Sea R = ℝℕ el anillo de sucesiones reales. ¿Son las sucesiones conver-


gentes un subanillo de R? ¿Son las sucesiones convergentes un ideal
de R?
Ideales · 29

12. Demuestre que el conjunto


  
a b
A := | a, b, c ∈ ℤ
0 c

de las matrices triangulares superiores es un subanillo de M2 (ℤ). Des-


criba los ideales biláteros de A y generalice los resultados obtenidos a
Mn (R), donde R es un anillo conmutativo cualquiera, n ≥ 2.

13. Sea R un anillo conmutativo y sean I , J ideales de R tales que


I + J = R. Demuestre que I J = I ∩ J .

14. Sea A el conjunto de todas las funciones reales infinitamente diferen-


ciables definidas sobre el intervalo [−1, 1]. Demuestre que A es un
anillo y que para cada n ≥ 1 el conjunto

Jn := { f ∈ A | Dk ( f )(0) = 0, 0 ≤ k ≤ n}

es un ideal bilátero de A, donde Dk denota la derivada k-ésima.


Capítulo
tres
Anillo cociente y
homomorfismos
Anillo cociente y homomorfismos · 33

Este capítulo está dedicado a los teoremas básicos de estructura de la teo-


ría de anillos: el teorema fundamental de homomorfismo, el teorema de
correspondencia y los dos teoremas de isomorfismo.

1. Definiciones y ejemplos
Sean A un anillo e I un ideal bilátero propio de A. Las estructuras aditivas de
estos dos conjuntos permiten definir el grupo cociente A/I, cuyos elementos
son las clases
a := a + I := {a + x | x ∈ I }, a ∈ A

las cuales operan con la siguiente regla:

a1 + a2 := a1 + a2 , a1 , a2 ∈ A.

A continuación, se define una segunda operación sobre A/I de tal forma


que adquiere estructura de anillo.

Proposición 3.1.1. Dados A un anillo e I un ideal bilátero propio de A, las ope-


raciones + y · definidas a continuación dotan al conjunto cociente A/I de estructura
de anillo, esto es, para cualesquiera a1 , a2 ∈ A,

a1 + a2 := a1 + a2 ,
a1 · a2 := a1 · a2 .

Además, si A = R es un anillo conmutativo, entonces R/I es un anillo conmutativo.


El anillo (A/I , +, ·) se denomina anillo cociente de A por I.

Demostración. Sabemos que la adición definida en el enunciado de la pro-


posición establece en el conjunto cociente una estructura de grupo abeliano
con elemento nulo 0 = 0 + I, 0 ∈ A. Verifiquemos que el producto es-
tá correctamente definido: si a1 = a2 y b1 = b2 , entonces a1 − a2 ∈ I
y b1 − b2 ∈ I, de donde (a1 − a2 )b1 ∈ I y a2 (b1 − b2 ) ∈ I, por lo tan-
to, a1 b1 − a2 b1 + a2 b1 − a2 b2 ∈ I, es decir, a1 b1 − a2 b2 ∈ I, con lo cual
a1 b1 = a2 b2 .
No es difícil verificar que 1 = 1 + I es el elemento identidad de A/I
(como I ≠ A, entonces 1 ≠ 0). La propiedad asociativa y la distributiva se
siguen de las correspondientes propiedades del producto en A. ✓

Ejemplo 3.1.2. El anillo ℤn de los enteros módulo n corresponde al co-


ciente de ℤ por el ideal principal ⟨n⟩ (véase el ejemplo 1.1.7).
34 · Anillo cociente y homomorfismos

Definición 3.1.3. Sean A1 y A2 dos anillos. Una función f : A1 −→ A2 se


dice que es un homomorfismo del anillo A1 en el anillo A2 si se cumplen las
siguientes condiciones:

(i) f (a1 + a2 ) = f (a1 ) + f (a2 ),

(ii) f (a1 a2 ) = f (a1 ) f (a2 ),

(iii) f (1) = 1,

para cualesquiera a1 , a2 ∈ A1 .

Proposición 3.1.4. Para todo homomorfismo de anillos f : A1 −→ A2 se cum-


plen las siguientes propiedades:

(i) f (0) = 0.

(ii) f (−a) = −f (a), ∀a ∈ A1 .

(iii) f (a1 − a2 ) = f (a1 ) − f (a2 ), ∀a1 , a2 ∈ A1 .

(iv) Si a ∈ A1∗ entonces f (a) ∈ A2∗ . Además, f (a−1 ) = f (a) −1 .

Demostración. Ejercicio para el lector. ✓


Ejemplo 3.1.5. El homomorfismo idéntico: sea A un anillo, la función

iA : A −→ A
a ↦−→ a

es un homomorfismo de anillos.

Ejemplo 3.1.6 (Homomorfismo canónico) . Dados A un anillo, I un ideal


bilátero propio y A/I el anillo cociente de A por I, la siguiente función es
un homomorfismo de anillos:

j : A −→ A/I ,
j (a) := a = a + I , a ∈ A.

Ejemplo 3.1.7. Dados A un anillo y Mn (A) su anillo de matrices, se tiene


el homomorfismo

f : A −→ Mn (A),
f (a) = H = [hi j ] ,

donde hii = a, para i = 1, 2, . . . , n, y hi j = 0 si i ≠ j.


Anillo cociente y homomorfismos · 35

Ejemplo 3.1.8 (Inclusión canónica) . Dado A′ un subanillo de A, la fun-


ción definida por 𝜄 : A′ −→ A, 𝜄(a) = a, para cada a ∈ A′, es un homomor-
fismo de anillos.

Ejemplo 3.1.9 (Homomorfismos de ℤm en ℤn ) . Consideremos los dife-


rentes casos posibles:
(i) Homomorfismos de ℤ en ℤ (m = 0, n = 0): si f : ℤ −→ ℤ es un homo-
morfismo de anillos, entonces f (1) = 1, con lo cual f (k) = k, para k ∈ ℤ+ ,
f (0) = 0, f (−k) = −k, para k ∈ ℤ+ . Por lo tanto, el único homomorfismo
de anillos de ℤ en ℤ es el idéntico.
(ii) Homomorfismos de ℤ en ℤn (m = 0, n ≥ 2): si f : ℤ −→ ℤn es un
homomorfismo de anillos, entonces f (1) = 1; dado k ∈ ℤ+ existen enteros
q, r tales que k = q · n + r, 0 ≤ r < n, por lo tanto

f (k) = f (q · n + r) = f (q) · f (n) + f (r) = f (q) · 0 + f (r) = f (r) = r = k;

además, f (0) = 0 y, dado k ∈ ℤ+ , f (−k) = −f (k) = −k = −k. Por lo tanto,


el único homomorfismo de ℤ en ℤn es el canónico: j : ℤ −→ ℤn , j (k) = k.
(iii) Homomorfismos de ℤm en ℤ (m ≥ 2, n = 0): si f : ℤm −→ ℤ es un
homomorfismo de anillos, entonces f (1) = 1,

f (m) = f (0) = 0 = f (1 + · · · + 1) = 1 + · · · + 1 = m;

esta contradicción conduce a que no existe ningún homomorfismo de anillos


de ℤm en ℤ.
(iv) Homomorfismos de ℤm en ℤn (m ≥ 2, n ≥ 2): si f : ℤm −→ ℤn es un
homomorfismo, entonces f (1) = 1,

f (m) = 0 = f (1 + · · · + 1) = 1 + · · · + 1 = m;

esto implica que n debe dividir a m. Es decir, si existe un homomorfismo


de ℤm en ℤn , entonces n | m. El homomorfismo f es único y definido por
f (k) = k.

Definición 3.1.10. Sea f : A1 −→ A2 un homomorfismo de anillos.

(i) El subconjunto de A1 definido por

ker( f ) := {a ∈ A1 | f (a) = 0}

se denomina el núcleo del homomorfismo f .


36 · Anillo cociente y homomorfismos

(ii) El subconjunto de A2 definido por

Im( f ) := { f (a) | a ∈ A1 }

se denomina la imagen del homomorfismo f .

(iii) Si X ⊆ A1 , entonces

f (X) := { f (x) | x ∈ X }

se denomina la imagen de X mediante f.

(iv) Si Y ⊆ A2 , entonces

f −1 (Y ) := {a ∈ A1 | f (a) ∈ Y }

se denomina la imagen inversa de Y mediante f.

(v) Se dice que f es inyectivo si

f (a1 ) = f (a2 ) ⇔ a1 = a2 ,

para cualesquiera a1 , a2 ∈ A1 .

(vi) Se dice que f es sobreyectivo si Im( f ) = A2 .

(vii) Se dice que f es un isomorfismo de anillos si f es un homomorfismo


inyectivo y sobreyectivo. En tal caso se dice que A1 es isomorfo a A2 ,
lo cual se escribe A1  A2 .

Las siguientes afirmaciones son consecuencia directa de la definición an-


terior.

Proposición 3.1.11. Sea f : A1 −→ A2 un homomorfismo de anillos. Entonces,

(i) ker( f ) = f −1 (0) es un ideal bilátero propio de A1 .

(ii) Im( f ) = f (A1 ) es un subanillo de A2 .

(iii) f es inyectivo ⇔ ker( f ) = 0.

(iv) Si g : A2 −→ A3 es un homomorfismo de anillos, entonces la función com-


puesta g f : A1 −→ A3 es también un homomorfismo de anillos.

(v) f es un isomorfismo si, y sólo si, existe g : A2 −→ A1 tal que g f = iA1 y


f g = iA2 . Además, g es único para f y es también un isomorfismo; g es el
isomorfismo inverso de f y se denota por f −1 .
Anillo cociente y homomorfismos · 37

Demostración. Ejercicio para el lector. ✓


Ejemplo 3.1.12. No existe ningún homomorfismo de ℝ en ℤ. Probemos


algo más general: todo homomorfismo de anillos f : K −→ A, donde K es
un anillo de división y A es un anillo, debe ser inyectivo. En efecto, según la
proposición 3.1.11, ker( f ) es un ideal de K y como f (1) = 1 ≠ 0, entonces
ker( f ) = 0, con lo cual f es inyectivo.
En particular si f : ℝ −→ ℤ es un homomorfismo, entonces Im( f ) es
un subanillo de ℤ, pero como ℤ no tiene subanillos propios, luego f es un
isomorfismo, en contradicción con el hecho de que ℤ no es un cuerpo.

Observación 3.1.13. El concepto de isomorfismo en álgebra, y en parti-


cular en teoría de anillos, es fundamental. Su importancia radica en que si
A1 y A2 son dos anillos isomorfos, entonces todas las propiedades del anillo
A1 que dependen de sus operaciones son válidas en A2 . Dos anillos iso-
morfos serán entonces considerados como iguales; la función que establece
el isomorfismo se podrá considerar como un duplicador de propiedades.
Observemos además que la relación de isomorfía es una relación de equi-
valencia.

Concluimos esta sección con la propiedad universal del anillo cociente y


la propiedad universal del anillo de matrices.

Teorema 3.1.14 (Propiedad universal del anillo cociente) . Sea A un anillo,


I un ideal bilátero propio de A y j : A −→ A/I el homomorfismo canónico. Sea
g : A −→ A0 un homomorfismo de anillos tal que I ⊆ ker(g). Entonces, existe un
único homomorfismo g : A/I −→ A0 tal que g ◦ j = g:
j
A - A/I
pp
pp
g pp
pp
?
A0

Además, si g es sobreyectivo, entonces g también es sobreyectivo.

Demostración. La demostración es un sencillo ejercicio para el lector. ✓


Teorema 3.1.15 (Propiedad universal del anillo de matrices) . Sea A un


anillo y n ≥ 2. Sea A0 un anillo que satisface las siguientes condiciones:

(i) Existe un homomorfismo de anillos g : A −→ A0 .

(ii) Existen en A0 elementos ei j , 1 ≤ i , j ≤ n, tales que:


38 · Anillo cociente y homomorfismos

(a) 1 = e11 + · · · + enn .


(b) Para cualesquiera x, y ∈ A,
(
0 si j ≠ l,
ei j g (x)elk g (y) =
eik g (x) g (y) si j = l.

Entonces, existe un único homomorfismo de anillos g : Mn (A) −→ A0 tal que


gd = g y g (Ei j ) = ei j , 1 ≤ i , j ≤ n, con d : A −→ Mn (A) el homomorfismo
definido por d(x) := E11 x + · · · + Enn x:

d-
A Mn (A)
p pp
pp
g
p pp
pp
g
?
A0

Además, si g es sobreyectivo, entonces g es sobreyectivo.

Demostración. Cada elemento F := [ fi j ] ∈ Mn (A) se puede representar de


manera única en la forma F := in, j Ei j fi j , luego definimos
Í

n
∑︁
g (F ) := ei j g ( fi j ).
i, j

Es claro que g es aditiva, luego por (a), g (E) = e11 + · · · + enn = 1. De la aditi-
vidad de g, de (b) y teniendo en cuenta que g es multiplicativa, obtenemos
que g es multiplicativa. Ahora, sea x ∈ A, entonces

gd(x) = g (E11 x + · · · + Enn x) = e11 g (x) + · · · + enn g (x)


= (e11 + · · · + enn ) g (x) = g (x),

es decir, gd = g. Para la unicidad, sea h : Mn (A) −→ A0 otro homomorfis-


mo tal que hd = g y h(Ei j ) = ei j , 1 ≤ i , j ≤ n, entonces

h(Ei j fi j ) = h(Ei j (E11 fi j + · · · + Enn fi j )) = h(Ei j )h(E11 fi j + · · · + Enn fi j )


= h(Ei j )hd( fi j ) = ei j g ( fi j ) = g (Ei j fi j ),

luego h(F ) = g (F ) para cada matriz F , es decir, h = g.


Por último, dado z ∈ A0 , existe x ∈ A tal que g (x) = z, entonces
z = gd(x), es decir, g es sobreyectivo. ✓

Anillo cociente y homomorfismos · 39

2. Teoremas de homomorfismo e
isomorfismo
Definición 3.2.1. Se dice que el anillo A2 es una imagen homomorfa del
anillo A1 si existe un homomorfismo sobreyectivo de A1 en A2 .

El siguiente teorema permite caraterizar las imágenes homomorfas de


un anillo.

Teorema 3.2.2 (Teorema fundamental de homomorfismo) . Sean A un


anillo y A0 una imagen homomorfa de A. Entonces, existe un ideal bilátero propio
I de A tal que

A0  A/I.

Recíprocamente, para cada ideal bilátero propio I de A el cociente A/I es una ima-
gen homomorfa de A.

Demostración. Sea f : A −→ A0 un homomorfismo sobreyectivo y sea I =


ker( f ) su núcleo. Entonces, la correspondencia

f : A/I −→ A0
a = a + I ↦−→ f (a)

es un isomorfismo de anillos. En efecto, f es una función ya que si a y b


son elementos de A tales que a = b entonces (a −b) ∈ I = ker( f ), con lo cual
f (a) = f (b). f es un homomorfismo de anillos ya que
f (a + b) = f (a) + f (b), f (ab) = f (a) f (b) y f (1) = 1, para cualesquie-
ra a, b ∈ A. f resulta sobreyectivo ya que f lo es. Nótese finalmente que
a ∈ ker( f ) si, y sólo si, f (a) = 0 si, y sólo si, f (a) = 0 si, y sólo si, a ∈ ker( f )
si, y sólo si, a = 0. Tenemos entonces que ker( f ) = {0} = 0. La segun-
da afirmación es consecuencia del hecho que el homomorfismo canónico j
definido en el ejemplo 3.1.6 es sobreyectivo. ✓

Ejemplo 3.2.3 (Imágenes homomorfas de ℤ) . Como los ideales de ℤ son


de la forma ⟨n⟩, con n ≥ 0, entonces las imágenes homomorfas de ℤ, salvo
isomorfismos, son ℤ y ℤn , con n ≥ 2.

Ejemplo 3.2.4 (Imágenes homomorfas del anillo de matrices Mn (A), n ≥ 2) .


Según el teorema fundamental de homomorfismo, las imágenes homomor-
fas de Mn (A) son de la forma Mn (A)/ J , donde J es un ideal bilátero propio
40 · Anillo cociente y homomorfismos

de Mn (A); pero tales ideales son de la forma Mn (I), con I ideal bilátero pro-
pio de A. Probaremos ahora que

Mn (A)/Mn (I)  Mn (A/I).

La función

f : Mn (A) −→ Mn (A/I)
F = [ fi j ] ↦−→ F = [ fi j ]

donde fi j := fi j + I, con 1 ≤ i , j ≤ n, es claramente un homomorfismo


sobreyectivo de anillos. Además, la matriz F = [ fi j ] está en el núcleo de f
si, y sólo si, fi j = 0, para cualesquiera i , j; es decir, si, y sólo si, fi j ∈ I, con
1 ≤ i , j ≤ n. Esto muestra que ker( f ) = Mn (I). Resta aplicar el teorema
fundamental de homomorfismo.

En la prueba del teorema de correspondencia haremos uso del punto (ii)


de la siguiente proposición.

Proposición 3.2.5. Sea f : A1 −→ A2 un homomorfismo de anillos.

(i) Si A1′ es un subanillo de A1 , entonces f (A1′ ) es un subanillo de A2 . También,


si A2′ es un subanillo de A2 , entonces f −1 (A2′ ) es un subanillo de A1 .

(ii) Si I es un ideal bilátero de A1 , f (I) es un ideal bilátero de Im( f ). También,


si J es un ideal bilátero de A2 , entonces f −1 ( J ) es un ideal bilátero de A1
que contiene el núcleo ker( f ).

(iii) Si I es un ideal bilátero de A1 que contiene a ker( f ), entonces


I = f −1 ( f (I)).

(iv) Las afirmaciones de los puntos (ii) y (iii) son válidas para los ideales izquierdos
y derechos.

Demostración. Realizamos sólo la prueba de la primera parte de (ii) y (iii),


las otras aseveraciones están a cargo del lector.
(ii) Como f (0) = 0, entonces f (I) no es vacío. Sean x, y ∈ f (I) y
z ∈ Im( f ). Entonces, x = f (a), y = f (b), z = f (k) con a, b ∈ I y
k ∈ A1 ; de aquí resulta x + y = f (a + b), zx = f (ka), xz = f (ak), con lo
cual x + y, zx, xz ∈ f (I).
(iii) Veamos solamente que f −1 ( f (I)) ⊆ I, ya que la otra inclusión siem-
pre se tiene. Sea a ∈ f −1 ( f (I)), entonces f (a) ∈ f (I), es decir, existe
b ∈ I tal que f (a) = f (b), de donde f (a − b) = 0, lo cual significa que
a − b ∈ ker( f ) ⊆ I, es decir, a − b ∈ I con b ∈ I, por lo tanto a ∈ I. □✓
Anillo cociente y homomorfismos · 41

Ejemplo 3.2.6. Consideremos la inclusión canónica de ℤ en ℚ:

𝜄 : ℤ −→ ℚ
m ↦−→ m

ℤ es ideal en ℤ pero 𝜄 (ℤ) = ℤ no es ideal en ℚ. Según (ii) de la proposición


anterior, la cuestión radica en que ℚ ≠ Im (𝜄).

Teorema 3.2.7 (Teorema de correspondencia) . Sean A un anillo y A0 una


imagen homomorfa de A mediante el homomorfismo sobreyectivo f : A −→ A0 .
Entonces, existe una correspondencia biyectiva entre los ideales biláteros del anillo
A que contienen al núcleo de f y los ideales biláteros del anillo A0 .

Demostración. Sean f : A −→ A0 un homomorfismo sobreyectivo, I la


colección de todos los ideales biláteros de A que contienen al núcleo e I0 la
colección de todos los ideales biláteros de A0 , es decir,

I := {I | I es un ideal bilátero de A, ker( f ) ⊆ I }


I0 := { J | J es un ideal bilátero de A0 },

entonces la correspondencia

f : I −→ I0
e

I ↦−→ e
f (I) := f (I)

es una biyección. En efecto, sean I1 e I2 ideales biláteros de A tales que


ker( f ) ⊆ I1 , ker( f ) ⊆ I2 y e
f (I1 ) = e
f (I2 ), entonces

I1 = f −1 ( f (I1 )) = f −1 ( f (I2 )) = I2 .

f es sobreyectiva, ya que J es un ideal bilátero de A0 , f −1 ( J ) es un ideal de


e
A que contiene a ker( f ); además, como f es sobreyectivo f ( f −1 ( J )) = J ,
f ( f −1 ( J )) = J . Una última observación: si I1 , I2 ∈ I, entonces
es decir, e

I1 ⊆ I2 ⇔ f (I1 ) ⊆ f (I2 ).

Esto completa la prueba del teorema. ✓


Corolario 3.2.8. Sean A un anillo e I un ideal bilátero propio de A. Enton-


ces, existe una correspondencia biyectiva entre los ideales biláteros del anillo A que
contienen al ideal I y los ideales biláteros del anillo cociente A/I.
42 · Anillo cociente y homomorfismos

Demostración. Sea j : A −→ A/I el homomorfismo canónico. Por el teore-


ma de correspondencia, existe una biyección entre la colección I de biláte-
ros ideales de A que contienen a I y la colección I0 de ideales biláteros del
cociente A/I, dada por

j : I −→ I0
e
I1 ↦−→ e
j (I1 )

con ej (I1 ) := j (I1 ) = {a | a ∈ I1 }. Este ideal bilátero también se denota por


I1 /I. ✓

Teorema 3.2.9 (Primer teorema de isomorfismo) . Sean A un anillo y


f : A −→ A0 un homomorfismo sobreyectivo. Si J es un ideal bilátero propio
de A0 e I = f −1 ( J ), entonces

A/I  A0 / J .

Demostración. Sean f : A −→ A0 un homomorfismo sobreyectivo y


j : A0 −→ A0 / J el homomorfismo canónico. Considérese el homomor-
fismo compuesto f = j ◦ f ; nótese que ker( f ) = ker( j ◦ f ) = I; además,
como f es sobreyectivo, entonces por el teorema fundamental de homo-
morfismo se tiene que
A/I  A0 / J . □✓

Corolario 3.2.10. Sea A un anillo y sean I y J ideales biláteros de A tales que


I ⊆ J ≠ A. Entonces,
A/ J  (A/I)/( J /I).

Demostración. Sea j : A −→ A/I el homomorfismo canónico, entonces


j ( J ) = J /I es un ideal propio de A/I, además J = j −1 ( J /I). Según el
teorema anterior,
A/ J  (A/I)/( J /I). ✓

Ejemplo 3.2.11 (Imágenes homomorfas de ℤm , m ≥ 2) . De acuerdo con


el teorema fundamental de homomorfismo, las imágenes homomorfas de
ℤm son de la forma ℤm /I, donde I es un ideal propio de ℤm = ℤ/⟨m⟩. Según
el teorema de correspondencia, I = ⟨n⟩/⟨m⟩, donde ⟨n⟩ ⊇ ⟨m⟩, n ≠ 1, es
decir, I = ⟨n⟩, donde n ≠ 1 divide a m. El primer teorema de isomorfismo
da entonces la forma final de las imágenes homomorfas

ℤm /I = (ℤ/⟨m⟩)/(⟨n⟩/⟨m⟩)  ℤ/⟨n⟩ = ℤn ,

donde n es un divisor de m, n ≠ 1.
Anillo cociente y homomorfismos · 43

Ilustremos el resultado para m = 6. Divisores de 6: 1, 2, 3, 6; ideales de


ℤ6 :

⟨1⟩/⟨6⟩ = ℤ/⟨6⟩ = ⟨1⟩,


⟨2⟩/⟨6⟩ = {0, 2, 4} = ⟨2⟩,
⟨3⟩/⟨6⟩ = {0, 3} = ⟨3⟩,
⟨6⟩/⟨6⟩ = {0} = ⟨0⟩.

Así, las imágenes homomorfas de ℤ6 son:

(ℤ/⟨6⟩)/(⟨2⟩/⟨6⟩)  ℤ2 ,
(ℤ/⟨6⟩)/(⟨3⟩/⟨6⟩)  ℤ3 ,
(ℤ/⟨6⟩)/(⟨6⟩/⟨6⟩)  ℤ6 .

Por lo expuesto al principio se observa que ℤm es un anillo conmutativo,


eventualmente con divisores de cero, cuyos ideales son todos principales.

Teorema 3.2.12 (Segundo teorema de isomorfismo) . Sean A un anillo, S


un subanillo de A e I un ideal bilátero propio de A. Entonces,

(i) S ∩ I es un ideal bilátero propio de S.

(ii) S + I := {s + a | s ∈ S, a ∈ I } es un subanillo de A que contiene a I como


ideal bilátero propio.

(iii) S (S ∩ I)  (S + I)/I .

Demostración. (i) y (ii) son verificables de manera inmediata.


(iii) Consideremos el homomorfismo

f : S −→ (S + I)/I
s ↦−→ f (s) := s = s + I .

Se puede comprobar que f es sobreyectivo y que ker( f ) = S ∩ I, de donde,


por el teorema fundamental de homomorfismos, se concluye que

S/(S ∩ I)  (S + I)/I . ✓

Cerramos este capítulo con el concepto de característica de un anillo.

Ejemplo 3.2.13 (Característica de un anillo) . Sea A un anillo cualquiera


y
ℤ[1] = {k · 1 | k ∈ ℤ, 1 ∈ A}
44 · Anillo cociente y homomorfismos

el subanillo primo de A. La función

f : ℤ −→ A
k ↦−→ k · 1

es un homomorfismo de anillos con imagen ℤ[1]. Se dice que A es de ca-


racterística cero si ker( f ) = 0, es decir, k · 1 = 0 si, y sólo si, k = 0. En
otras palabras, A es de característica 0 si, y sólo si, el subanillo primo de
A es isomorfo a ℤ. Si ker( f ) = ⟨n⟩, n ≥ 2, entonces se dice que A es de
característica n, es decir, k · 1 = 0 si, y sólo si, n | k. Así, A es de caracterís-
tica n si, y sólo si, el subanillo primo de A es isomorfo a ℤn . Nótese que ℤ,
ℚ, ℝ y ℂ son de característica cero y ℤm es de característica m, m ≥ 2. La
característica de un anillo A se denota por char(A).

3. Ejercicios
1. Demuestre la proposición 3.1.4.

2. Demuestre la proposición 3.1.11.

3. Demuestre el teorema 3.1.14.

4. Sea f : A1 −→ A2 un homomorfismo de anillos y sean {Ii }i ∈ C,


{ J j } j ∈ D familias de ideales izquierdos (derechos, biláteros) de A1 y
A2 , respectivamente. Demuestre que:

∑︁ © ∑︁ ª
f −1 J j ⊆ f −1 ­

(i) J j ® . Además, si J j ⊆ Im( f ), para cada
j∈D « j ∈ D ¬
j ∈ D, la igualdad se cumple.
!
∑︁ ∑︁
(ii) f (Ii ) = f Ii .
i∈C i∈C

© Ù ª Ù −1
(iii) f −1 ­

Jj ® = f Jj .
«j∈D ¬ j∈D
!
Ù Ù
(iv) f Ii ⊆ f (Ii ). Además, si ker( f ) ⊆ Ii , para cada i ∈ C,
i∈C i∈C
se tiene la igualdad.

5. Sean R, S anillos conmutativos y f : R −→ S un homomorfismo de


anillos. Sean I1 , I2 ideales de R y J1 , J2 ideales de S. Nótese que la
Anillo cociente y homomorfismos · 45

imagen de I1 a través de f no es siempre un ideal de S. Sea por tanto


I1e = ⟨ f (I1 )⟩ = S f (I1 ) el ideal en S generado por f (I1 ); se dice que I1e
es la extensión del ideal I1 en S. De otra parte, sabemos que f −1 ( J1 )
es un ideal de R; se denomina la contracción de J1 en R y se denota
por J1c . Demuestre las siguientes propiedades:

(a) I1ec ⊇ I1 , J1ce ⊆ J1 .


(b) I1ece = I1e , J1cec = J1c .
(c) (I1 + I2 ) e = I1e + I2e , ( J1 + J2 ) c ⊇ J1c + J2c .
(d) (I1 ∩ I2 ) e ⊆ I1e ∩ I2e , ( J1 ∩ J2 ) c = J1c ∩ J2c .
(e) (I1 I2 ) e = I1e I2e , ( J1 J2 ) c ⊇ J1c J2c .
(f) (I1 : I2 ) e ⊆ (I1e : I2e ), ( J1 : J2 ) c ⊆ ( J1c : J2c ).
√ √
(g) ( I1 ) e ⊆ I1e , ( J1 ) c = J1c .
√︁ √︁

6. Determine (en caso de que existan) todos los homomorfismos de ani-


llos de:

(i) ℤ en ℚ, ℝ, ℂ, ℍ.
(ii) ℚ en ℤ, ℚ, ℝ, ℂ, ℍ, ℤn , n ≥ 2.
(iii) ℝ en ℤ, ℚ, ℤn , n ≥ 2.
(iv) ℂ en ℤ, ℚ, ℝ, ℤn , n ≥ 2.
(v) ℍ en ℤ, ℚ, ℝ, ℂ, ℤn , n ≥ 2.
(vi) ℤn , n ≥ 2, en ℚ, ℝ, ℂ, ℍ.

7. Demuestre que si A es un anillo sin divisores de cero, entonces char(A)


es cero o un primo p.

8. Si B es un subanillo de A. Demuestre que ambos tienen la misma


característica.

9. Demuestre que char(AX ) = char(A) = char(Mn (AX )), para cada ani-
llo A, X ≠ ∅ y n ≥ 1.

10. Calcule todas las imágenes homomorfas de Mn (ℤm ), n ≥ 2, con m = 0


ó m ≥ 2.
Capítulo
cuatro
Producto de
anillos
Producto de anillos · 49

En el capítulo anterior vimos una de las construcciones más elementales


de la teoría de anillos, el anillo cociente por un ideal bilátero propio. Ve-
remos ahora otra de tales construcciones: el producto de una familia finita
de anillos. Probaremos además el teorema chino de residuos para anillos
arbitrarios.

1. Definición y propiedades elementales


Dada una familia finita de anillos {A1 , . . . , An }, podemos definir sobre el
conjunto producto cartesiano A1 ×· · ·×An una estructura de anillo a partir de
las estructuras aditiva y multiplicativa de A1 , . . . , An . En efecto, el conjunto
A1 × · · · × An consta de n-tuplas (a1 , . . . , an ) de elementos con ai ∈ Ai ,
1 ≤ i ≤ n; dos de tales n-tuplas (a1 , . . . , an ) y (b1 , . . . , bn ) son iguales si, y
sólo si, ai = bi para cada 1 ≤ i ≤ n. La adición y multiplicación se definen
por componentes:

(a1 , . . . , an ) + (b1 , . . . , bn ) := (a1 + b1 , . . . , an + bn ),


(a1 , . . . , an )(b1 , . . . , bn ) := (a1 b1 , . . . , an bn ),

en donde las sumas y productos de la derecha son en general diferentes y se


realizan en los respectivos anillos A1 , . . . , An .
Dejamos al lector la comprobación de que las operaciones definidas ante-
riormente dan al producto una estructura de anillo. Este anillo es denotado
În
por A1 ×· · ·× An , o por i=1 Ai , y se denomina anillo producto de la familia
{A1 , . . . , An }, n ≥ 1. Notemos que el elemento cero del anillo producto es
la n-tupla
0 := (0, . . . , 0).

Análogamente, el uno es la n-tupla

1 := (1, . . . , 1).

Algunas propiedades inmediatas del anillo producto son las siguientes.

Proposición 4.1.1. Sea {A1 , . . . , An } una colección finita de anillos arbitrarios,


n ≥ 1. Entonces,
În
(i) i=1 Ai es conmutativo si, y sólo si, Ai es conmutativo, para cada 1 ≤ i ≤ n.
În ∗
(ii) (a1 , . . . , an ) ∈ i=1 Ai si, y sólo si, ai ∈ Ai∗ , para cada 1 ≤ i ≤ n.
50 · Producto de anillos

(iii) Se tiene el isomofismo de grupos


n
!∗
Ö
Ai  A1∗ × · · · × An∗ .
i1

În
(iv) Para n ≥ 2, el anillo producto i=1 Ai siempre tiene divisores de cero.

Demostración. Ejercicio para el lector. ✓


Proposición 4.1.2. Sea {A1 , . . . , An }, n ≥ 1, una colección de anillos. Enton-


ces,
În
(i) Los ideales izquierdos (derechos, biláteros) del anillo producto i=1 Ai son
de la forma

I1 × · · · × In := {(a1 , . . . , an ) | ai ∈ Ii },

donde cada Ii es un ideal izquierdo (derecho, bilátero) del anillo Ai .

(ii) Si I1 , . . . , In son ideales biláteros propios de A1 , . . . , An respectivamente,


entonces

(A1 × · · · × An )/(I1 × · · · × In )  (A1 /I1 ) × · · · × (An /In ).

(iii) Si para cada 1 ≤ i ≤ n, Ai es un anillo de ideales izquierdos (derechos, bi-


În
láteros) principales, entonces i=1 Ai es un anillo de ideales izquierdos (de-
rechos, biláteros) principales.

Demostración. Probaremos solo la parte (iii) para el caso bilátero; las demás
pruebas quedan como ejercicio para el lector. Si cada Ai es un anillo de
În
ideales biláteros principales, sea I un bilátero de i=1 Ai . Según (i), I es de
la forma I = I1 × · · · × In = ⟨a1 ⟩ × · · · × ⟨an ⟩, luego

I = ⟨(a1 , . . . , an )⟩.

En efecto, cada x ∈ ⟨a1 ⟩ × · · · × ⟨an ⟩ es de la forma


m1 mn
!
∑︁ ∑︁
(1) (1) (n) (n)
x= bk a 1 c k , . . . , bk an ck , con bk(i) , ck(i) ∈ Ai .
k=1 k=1

Sin pérdida de generalidad podemos suponer que m1 = m2 = · · · = mn = m,


de donde
m 
∑︁   
x= bi(1) , . . . , bi(n) (a1 , . . . , an ) ci(1) , . . . , ci(n) ∈ ⟨(a1 , . . . , an )⟩. □

i=1
Producto de anillos · 51

În
Sea {A1 , . . . , An } una familia finita de anillos y i=1 Ai su anillo pro-
ducto. Para cada 1 ≤ i ≤ n, la proyección
n
Ö
𝜋i : Ai −→ Ai
i=1
(a1 , . . . , an ) ↦−→ ai

es un homomorfismo sobreyectivo de anillos. El siguiente teorema establece


la propiedad universal del anillo producto.

Teorema 4.1.3 (Propiedad universal del anillo producto) . Sea A0 un ani-


llo con homomorfismos pi : A0 −→ Ai , 1 ≤ i ≤ n. Entonces, existe un único
În
homomorfismo p : A0 −→ i=1 Ai tal que 𝜋i p = pi para cada 1 ≤ i ≤ n.

Demostración. La prueba es un ejercicio sencillo que dejamos al lector. ✓


Observación 4.1.4. El producto de anillos se puede extender a una familia


arbitraria no vacía de anillos definiendo las operaciones por componentes;
en particular, nótese que el anillo producto de una familia de anillos iguales
{Ai }i ∈ C, Ai := A, coincide con el anillo de funciones de C en A, es decir,
Ö
Ai = A C = { f : C −→ A | f es una función}.
i∈C

2. Teorema chino de residuos


Para n ≥ 2, sea
r
n = p1r1 · · · pkk , con pi primo, ri ≥ 1, 1 ≤ i ≤ k,

la descomposición de n en producto de primos. Se tiene el isomorfismo de


grupos
ℤn  ℤpr1 × · · · × ℤprk .
1 k

Puesto que ℤn es realmente un anillo, preguntamos si el isomorfismo an-


terior es válido también considerando los objetos como anillos. Por medio
del teorema chino de residuos, daremos una respuesta afirmativa a esta pre-
gunta.

Teorema 4.2.1 (Teorema chino de residuos) . Sea A un anillo y sean


I1 , . . . , In , n ≥ 2, ideales biláteros de A tales que Ii + I j = A, para cualesquiera
índices i ≠ j. Entonces, dada una familia finita de elementos a1 , . . . , an ∈ A,
existe un elemento a ∈ A tal que a − ai ∈ Ii para cada 1 ≤ i ≤ n.
52 · Producto de anillos

Demostración. Sean I1 , I2 ideales de A tales que I1 + I2 = A, y sean a1 , a2


elementos cualesquiera de A. Existen elementos b1 ∈ I1 , b2 ∈ I2 tales que
1 = b1 + b2 . El elemento a := a2 b1 + a1 b2 satisface la condición pedida. En
efecto,

a − a1 = a2 b1 + a1 (b2 − 1) = a2 b1 + a1 (−b1 ) = (a2 − a1 )b1 ∈ I1 .

Análogamente, a − a2 ∈ I2 .
Sean I1 , . . . , In y a1 , . . . , an ideales y elementos de A que satisfacen
las hipótesis del teorema. Para i ≥ 2 existen xi ∈ I1 , bi ∈ Ii tales que
În
xi + bi = 1. Resulta entonces que i=2 (xi + bi ) = 1, y este producto está en el
În
ideal I1 + i=2 Ii . Por lo demostrado para dos ideales, existe z1 ∈ A tal que
În În
z1 − 1 ∈ I1 y z1 − 0 ∈ i=2 Ii . Pero como i=2 Ii ⊆ Ii para cada 2 ≤ i ≤ n,
entonces z1 −1 ∈ I1 y z1 ∈ Ii , para i ≥ 2. Podemos repetir la prueba para las
Î Î
parejas de ideales (I2 , i≠2 Ii ), . . . , (In , i≠n Ii ), y encontramos elementos
z2 , . . . , zn ∈ A tales que z j − 1 ∈ I j y z j ∈ Ii , para i ≠ j.
Comprobemos que el elemento a := a1 z1 + · · · + an zn satisface la condi-
ción exigida:

a − ai = a1 z1 + · · · + ai−1 zi−1 + ai (zi − 1) + ai+1 zi+1 + · · · + an zn .



Como z j ∈ Ii para i ≠ j y zi −1 ∈ Ii , entonces a−ai ∈ Ii , para 1 ≤ i ≤ n. □

Corolario 4.2.2. Sean A e I1 , . . . , In biláteros propios con las condiciones del


enunciado del teorema anterior. Entonces,
(i) La función definida por

n
Ö
f : A −→ A/Ii
i=1
a ↦−→ f (a) := (a, . . . , a), con a := a + Ii

es un homomorfismo sobreyectivo de anillos.


Ñn
(ii) ker( f ) = i=1 Ii .
Ñn În
(iii) A/ i=1 Ii  i=1 A/Ii .
Demostración. Ejercicio para el lector. ✓

r
Ejemplo 4.2.3. Sea n = p1r1 · · · pkk , pi primo, ri ≥ 1, 1 ≤ i ≤ k. Se tiene
entonces el isomorfismo de anillos

ℤn  ℤpr1 × · · · × ℤprk .
1 k
Producto de anillos · 53

En efecto, basta considerar en el corolario anterior

Ii := ⟨piri ⟩, 1 ≤ i ≤ k,

entonces
n
Ù
Ii = ⟨m. c. m.{piri }ki=1 ⟩ = ⟨n⟩.
i=1

3. Ejercicios
1. Demuestre la proposición 4.1.1.

2. Demuestre el teorema 4.1.3.

3. Demuestre el corolario 4.2.2.

4. Si A1 y A2 son anillos de característica n1 ≠ 0, n2 ≠ 0, respectiva-


mente, entonces char(A1 × A2 ) es el mínimo común múltiplo de n1
y n2 . De otra parte, si n1 = 0 o n2 = 0, entonces la característica del
anillo producto es cero.

5. Sean A, A1 , . . . , Ak anillos tales que

A  A1 × · · · × Ak .

Pruebe el isomorfismo

Mn (A)  Mn (A1 ) × · · · × Mn (Ak ) , n ≥ 1.

6. Determine todos los ideales de ℚ × ℤn , n ≥ 2.


Capítulo
cinco
Ideales primos y
maximales
Ideales primos y maximales · 57

En la colección de ideales biláteros de un anillo se destacan los ideales ma-


ximales y los primos. Veremos en el presente capítulo su definición y com-
portamiento a través de homomorfismos.

1. Definiciones y ejemplos
Aunque los conceptos que se introducen a continuación se estudian por lo
general para anillos conmutativos, aquí se analizarán en el caso general no
conmutativo.

Definición 5.1.1. Sean A un anillo e I un ideal bilátero propio de A.

(i) Se dice que I es un ideal maximal de A si para cada ideal bilátero J


de A se tiene que

I ⊆ J ⇔ J = I , o, J = A.

(ii) Se dice que I es un ideal completamente primo de A si para cuales-


quiera a, b ∈ A se cumple que

ab ∈ I ⇔ a ∈ I , o, b ∈ I .

(iii) Se dice que I es un ideal primo de A si para cualesquiera I1 e I2 ideales


biláteros de A se tiene que

I1 I2 ⊆ I ⇔ I1 ⊆ I , o, I2 ⊆ I .

Proposición 5.1.2. Sean A un anillo e I un ideal bilátero propio de A.

(i) Si I es completamente primo, entonces I es primo. Además, si A = R es


conmutativo, la afirmación recíproca es válida.

(ii) I es completamente primo si, y sólo si, A/I no posee divisores de cero. Si
A = R es conmutativo, se cumple que

I es primo si, y sólo si, R/I es un dominio de integridad.

(iii) I es maximal si, y sólo si, A/I es un anillo simple. Si A = R es conmutativo,


se cumple que

I es maximal si, y sólo si, R/I es un cuerpo.


58 · Ideales primos y maximales

(iv) El ideal nulo 0 es completamente primo si, y sólo si, A es anillo sin divisores
de cero. En el caso conmutativo,
0 es primo si, y sólo si, R es un dominio de integridad.

(v) El ideal nulo es maximal si, y sólo si, A es un anillo simple. En el caso con-
mutativo se tiene que
0 es maximal si, y sólo si, R es un cuerpo.

(vi) Si I es un ideal maximal de A, entonces I es primo.


(vii) En un dominio de ideales principales todo ideal primo no nulo es maximal.
Demostración. (i) Sean I completamente primo en A e I1 , I2 ideales de A
tales que I1 I2 ⊆ I. Supongamos que I1 no está contenido en I , es decir,
existe a ∈ I1 , con a ∉ I. Sea b un elemento cualquiera de I2 , puesto que
ab ∈ I1 I2 ⊆ I, entonces b ∈ I. De aquí obtenemos que I2 ⊆ I .
Sea ahora R un anillo conmutativo y sean a, b ∈ R tales que ab ∈ I.
Entonces, ⟨ab⟩ = ⟨a⟩⟨b⟩ ⊆ I , con lo cual ⟨a⟩ ⊆ I, o, ⟨b⟩ ⊆ I, es decir, a ∈ I,
o, b ∈ I.
(ii) Sean a = a + I, b = b + I en A/I. Entonces, ab = 0 implica que ab ∈ I ,
con lo cual, a ∈ I, o, b ∈ I, es decir, a = 0, o, b = 0. Recíprocamente, si
a, b ∈ A son tales que ab ∈ I, entonces ab = 0, o equivalentemente, ab = 0.
Resulta así que a ∈ I, o, b ∈ I. El caso conmutativo es consecuencia directa
de que R/I es conmutativo.
(iii) Se obtiene del teorema de correspondencia (véase el teorema 3.2.7).
En el caso conmutativo, anillo simple y cuerpo son conceptos equivalentes.
(iv) Es consecuencia directa de (ii).
(v) Se obtiene de (iii).
(vi) Sea L un ideal maximal de A y sean I , J ideales biláteros de A tales
que I J ⊆ L. Supongamos que I ⊈ L, entonces existe x ∈ I tal que x ∉ L. El
ideal bilátero L + ⟨x⟩ contiene propiamente a L, luego A = L + ⟨x⟩. Existen
y ∈ L y z ∈ ⟨x⟩ tales que 1 = y + z. Sea w ∈ J , entonces w = yw + zw, con
yw ∈ L y zw ∈ I J ⊆ L, por tanto w ∈ L. Esto prueba que J ⊆ L, con lo
cual L es primo.
(vii) Sea I un ideal primo no nulo de R. Existe a ≠ 0 en R tal que I = ⟨a⟩ .
Sea J un ideal de R tal que I ⊆ J ; J es también de la forma J = ⟨b⟩, b ∈ R,
b ≠ 0. Resulta entonces que a = bc, con c ∈ R, es decir, bc ∈ ⟨a⟩. De aquí
obtenemos que b ∈ ⟨a⟩, o, c ∈ ⟨a⟩, con lo cual ⟨b⟩ = ⟨a⟩, o, c = aa ′, a ′ ∈ R.
En la segunda posibilidad, c = bca ′, es decir, c(1 − ba ′) = 0. Como c ≠ 0,
entonces b ∈ R ∗ y ⟨b⟩ = R. Así, J = I, o, J = R, e I resulta maximal. ✓

Ideales primos y maximales · 59

Ejemplo 5.1.3 (Ideales maximales y primos de ℤ) . En ℤ los ideales pri-


mos no nulos y los maximales coinciden. Ellos son de la forma ⟨p⟩, con p
primo. 0 es ideal primo en ℤ, pero no es maximal.

Ejemplo 5.1.4 (Ideales maximales y primos de ℤm , m ≥ 2) . Sea m ≥ 2


no primo. Según el ejemplo 3.2.11, los ideales de ℤm son de la forma ⟨n⟩
con n | m. Del punto (iii) de la proposición anterior resulta que los ideales
maximales de ℤm son de la forma ⟨p⟩, p | m, p primo, y según (ii) de la
misma proposición, estos son también los ideales primos.
Si m es primo, 0 es el único ideal maximal y el único ideal primo de ℤm .

Ejemplo 5.1.5 (Ideales maximales y primos de Mn (A), n ≥ 2) . Los idea-


les maximales del anillo de matrices Mn (A), con n ≥ 2, son de la forma
Mn (I), donde I es un ideal maximal de A. Esto es consecuencia del ejem-
plo 2.1.6.

Ejemplo 5.1.6 (Ideales maximales y primos de Mn (ℤ), n ≥ 2) . De los


ejemplos 5.1.3 y 5.1.5 obtenemos que los ideales maximales de Mn (ℤ) son
de la forma Mn (⟨p⟩), con p primo. Observemos que el ideal nulo de Mn (ℤ)
es primo y, sin embargo, no es maximal. En efecto, sean Mn (⟨r⟩), Mn (⟨s⟩)
ideales biláteros de Mn (ℤ) tales que Mn (⟨r⟩)Mn (⟨s⟩) ⊆ 0. Teniendo en
cuenta que
Mn (⟨r⟩)Mn (⟨s⟩) = Mn (⟨rs⟩),
resulta ⟨rs⟩ = 0, con lo cual ⟨r⟩ = 0, o, ⟨s⟩ = 0.
Mostremos ahora que los ideales primos no nulos coinciden con los ma-
ximales: sabemos ya que todo maximal es primo; de otra parte, si p no es
primo, existen r , s ∈ ℤ+ , con 1 < r , s < p, tales que p = rs. Se tiene en-
tonces que Mn (⟨r⟩)Mn (⟨s⟩) = Mn (⟨p⟩), pero ni Mn (⟨r⟩) ni Mn (⟨s⟩) están
contenidos en Mn (⟨p⟩). En efecto, rE11 ∈ Mn (⟨r⟩), pero rE11 ∉ Mn (⟨p⟩);
sE11 ∈ Mn (⟨s⟩) y sE11 ∉ Mn (⟨p⟩). Resulta entonces que Mn (⟨p⟩) no es
primo.

Ejemplo 5.1.7 (Ideales maximales y primos de Mn (ℤm ), n, m ≥ 2) . Su-


pongamos inicialmente que m no es primo. De los ejemplos 5.1.4 y 5.1.5
obtenemos que los ideales maximales de Mn (ℤm ) son de la forma Mn (⟨p⟩),
con p | m, p primo. Estos ideales coinciden con los primos. En efecto, como
todo maximal es primo, veamos que estos son los únicos ideales primos de
Mn (ℤm ): sea Mn (⟨k⟩) un ideal de Mn (ℤm ), con k no primo. Existen enton-
ces 1 < r , s < k tales que k = rs; nótese que Mn (⟨r⟩)Mn (⟨s⟩) = Mn (⟨k⟩), sin
embargo, ni Mn (⟨r⟩) ni Mn (⟨s⟩) están contenidos en Mn (⟨k⟩). En efecto,
notemos que rE11 ∉ Mn (⟨k⟩) y sE11 ∉ Mn (⟨k⟩) (en caso contrario r = t · k,
60 · Ideales primos y maximales

0 ≤ t ≤ m − 1, con lo cual m | (rst − r), y como k | m, existiría w ∈ ℤ


tal que rst − r = wrs; de aquí resultaría que s | 1, lo cual es contradictorio.
De manera análoga se establece que sE11 ∉ Mn (⟨k⟩)). Esto demuestra que
Mn (⟨k⟩) no es primo. Resta observar que el ideal nulo no es primo ya que
m no es primo.
Si m es primo, 0 es el único ideal primo y el único ideal maximal en
Mn (ℤm ). Compárense estos resultados con el ejemplo 5.1.4.
Ejemplo 5.1.8. Ideal primo no completamente primo: sean A un anillo y
Mn (A) su anillo de matrices de orden n ≥ 2. Nótese que Mn (A) no posee
ideales completamente primos. En efecto, si I ≠ A es un ideal bilátero de A
tal que Mn (I) es completamente primo, entonces
Mn (A)/Mn (I)  Mn (A/I) no posee divisores de cero, pero cualquier anillo
de matrices de orden n ≥ 2 posee divisores de cero. Considerando en par-
ticular A = ℤ, resulta que 0 es primo en Mn (ℤ), pero no es completamente
primo.
Ejemplo 5.1.9. Ideal maximal no complementamente primo: sean n ≥ 2
y p un primo cualquiera. Según el ejemplo 5.1.6, Mn (⟨p⟩) es maximal de
Mn (ℤ), sin embargo, como acabamos de ver, no es completamente primo.

2. Comportamiento a través de
homomorfismos
Queremos estudiar ahora el comportamiento de los ideales completamente
primos, primos y maximales a través de homomorfismos.
Proposición 5.2.1. Sea f : A1 −→ A2 un homomorfismo de anillos y sean I y
J ideales biláteros propios de A1 y A2 , respectivamente.
(i) Si f es sobreyectivo, entonces

J es maximal ⇒ f −1 ( J ) es maximal.

(ii) Si f es sobreyectivo y ker( f ) ⊆ I, entonces

I es maximal ⇒ f (I) es maximal.

(iii) J es completamente primo, entonces f −1 ( J ) es completamente primo.

(iv) Si f es sobreyectivo y ker( f ) ⊆ I, entonces

I es completamente primo ⇒ f (I) es completamente primo.


Ideales primos y maximales · 61

(v) Si f es sobreyectivo, entonces

J es primo ⇒ f −1 ( J ) es primo.

(vi) Si f es sobreyectivo y ker( f ) ⊆ I, entonces

I es primo ⇒ f (I) es primo.

Demostración. Nótese inicialmente que f −1 ( J ) y f (I) son propios.


(i) Considérese el homomorfismo compuesto j f :
f j
A1 −→ A2 −→ A2 / J ,

donde j es el homomorfismo canónico, j f es sobreyectivo y con núcleo


f −1 ( J ). El isomorfismo

A2 / J  A1 /f −1 ( J )

garantiza que A1 /f −1 ( J ) es simple y, en consecuencia, f −1 ( J ) es maximal.


(ii) El homomorfismo sobreyectivo j f tiene por núcleo I:
f j
A1 −→ A2 −→ A2 /f (I) ,

De esto obtenemos que A1 /I  A2 /f (I), y así f (I) es maximal.


(iii) Si ab ∈ f −1 ( J ), entonces f (a) f (b) ∈ J , esto es, f (a) ∈ J , o,
f (b) ∈ J , y por tanto, a ∈ f −1 ( J ), o, b ∈ f −1 ( J ).
(iv) Análogo al punto (ii).
(v) Sean I1 , I2 ideales biláteros de A1 tales que I1 I2 ⊆ f −1 ( J ). Entonces,
por la sobreyectividad de f se tiene que f (I1 ) f (I2 ) ⊆ J , y f (I1 ), f (I2 ) son
ideales biláteros de A2 . Como J es primo, f (I1 ) ⊆ J , o, f (I2 ) ⊆ J . De
aquí resulta

I1 ⊆ f −1 ( f (I1 )) ⊆ f −1 ( J ), o, I2 ⊆ f −1 ( f (I2 )) ⊆ f −1 ( J ).

(vi) Sean J1 , J2 ideales biláteros de A2 tales que J1 J2 ⊆ f (I), entonces


f −1 ( J1 J2 )
⊆ f −1 ( f (I)). Pero f −1 ( f (I)) = I. Además,

f −1 ( J1 ) f −1 ( J2 ) ⊆ f −1 ( J1 J2 ) ⊆ I ,

y como I es primo, entonces f −1 ( J1 ) ⊆ I, o, f −1 ( J2 ) ⊆ I. Nuevamente, por


la sobreyectividad de f se tiene que J1 ⊆ f (I), o, J2 ⊆ f (I). Esto completa
la prueba del punto (vi) y de la proposición. ✓

62 · Ideales primos y maximales

Ejemplo 5.2.2. Las restricciones de la proposición anterior sobre sobreyec-


tividad y la inclusión del núcleo son sustanciales: consideremos la inclusión
canónica de

𝜄 : ℤ −→ ℚ
k ↦−→ k,

0 es maximal en ℚ, pero 𝜄−1 (0) = 0 no es maximal en ℤ. De otra parte,


nótese que para el homomorfismo canónico

𝜄 : ℤ −→ ℤ8
k ↦−→ k = k + ⟨8⟩

⟨7⟩ es maximal en ℤ, pero 𝜄(⟨7⟩) = ℤ8 . Obsérvese que ker(𝜄) = ⟨8⟩ no está


contenido en ⟨7⟩.

El ejemplo 5.1.8 puso de manifiesto que no todo anillo posee ideales


completamente primos; no ocurre así con los maximales. La prueba de este
importante hecho se apoya en uno de los supuestos de la teoría de conjuntos
conocido como el lema de Zorn.

Lema 5.2.3 (Lema de Zorn) . Sea (P , ≤) un conjunto parcialmente ordena-


do. Si cada subconjunto no vacío y totalmente ordenado de P tiene cota superior,
entonces en P existe al menos un elemento maximal.

Teorema 5.2.4. Cada anillo posee al menos un ideal maximal.

Demostración. Sea A un anillo y P el conjunto de ideales biláteros propios de


A; P ≠ ∅ ya que 0 ∈ P. Respecto a la relación de inclusión ⊆, P es un con-
junto parcialmente ordenado. Sea S un subconjunto totalmente ordenado
de P y consideremos Ø
I0 := J
J ∈S

la reunión de todos los ideales de S. I0 es un ideal bilátero propio de A.


En efecto, si a, b ∈ I0 entonces existen ideales biláteros J1 , J2 ∈ S tales
que a ∈ J1 , b ∈ J2 ; por el orden total, podemos suponer por ejemplo que
J1 ⊆ J2 , con lo cual a + b ∈ J2 ⊆ I0 . Análogamente, si a ∈ I0 y x ∈ A,
existe J ∈ S tal que a ∈ J , de aquí obtenemos que ax, xa ∈ J ⊆ I0 . I0 es
propio debido a la escogencia de los elementos de P. Evidentemente I0 es
cota superior de S. Por el lema de Zorn, existe un ideal bilátero I en P que
es elemento maximal respecto a la inclusión. Puesto que la maximalidad se

definió en términos de la relación de inclusión, I es ideal maximal de A. □
Ideales primos y maximales · 63

Corolario 5.2.5. Sea A un anillo. Entonces,

(i) Cada ideal bilátero propio de A está contenido en un ideal maximal.

(ii) Si A = R es conmutativo, cada elemento no invertible de R está contenido en


un ideal maximal.

Demostración. (i) Sea I un ideal bilátero propio de A y A/I el anillo cociente


determinado por I. Sea J un ideal maximal de A/I. De acuerdo con la
proposición 3.2.5 y la proposición 5.2.1, j −1 ( J ) es un ideal maximal de A
que contiene a I, donde j : A −→ A/ J es el homomorfismo canónico.
(ii) Sea x un elemento no invertible de R, entonces ⟨x⟩ ≠ R y, por el
numeral anterior, ⟨x⟩ está contenido en un ideal maximal de R. ✓

Ejemplo 5.2.6. El anillo de matrices Mn (𝕂) de orden n ≥ 2 sobre un


cuerpo 𝕂 muestra que el punto (ii) del corolario anterior no es válido para
anillos no conmutativos. En efecto, la matriz E11 no es invertible y el único
ideal maximal de Mn (𝕂) es el nulo.

Ejemplo 5.2.7 (Anillos conmutativos locales) . Un anillo conmutativo R se


dice que es local si tiene exactamente un ideal maximal. Si J es dicho ideal,
se cumple entonces que J = R − R ∗ , donde R ∗ es el grupo de elementos
invertibles del anillo R. La igualdad anterior caracteriza a los anillos locales.
Más exactamente, si R es un anillo conmutativo,

R es local si, y sólo si, R − R ∗ es un ideal.

En efecto, sea J el maximal de R y sea x ∈ J , entonces x ∉ R ∗ luego


x ∈ R − R ∗ ; recíprocamente, si x ∈ R − R ∗ , entonces x ∉ R ∗ , y en conse-
cuencia, x pertenece a algún ideal maximal, pero el único es J , luego x ∈ J .
Hemos probado que J = R − R ∗ . Supongamos ahora que R − R ∗ es un ideal
y veamos que R es local: sea I un maximal de R, entonces I ⊆ R − R ∗ , pero
como R − R ∗ es un ideal propio, se tiene que I = R − R ∗ , es decir, R − R ∗ es
el único maximal de R.

Ejemplo 5.2.8. De los ejemplos 5.1.4 y 5.2.7 obtenemos que ℤm , m ≥ 2,


es local si, y sólo si, m es de la forma m = p k , k ≥ 1, con p primo. El ideal
maximal es J = ⟨p⟩. Ilustremos estos resultados con p = 2, k = 3:

ℤ∗8 = {1, 3, 5, 7}, ℤ − ℤ∗8 = {0, 2, 4, 6} = ⟨2⟩.


64 · Ideales primos y maximales

Ejemplo 5.2.9 (Ideales maximales del anillo producto) . Sea {A1 , . . . , An }


În
una familia finita de anillos y i=1 Ai su anillo producto. Para cada
1 ≤ i ≤ n, consideremos la proyección
n
Ö
𝜋i : Ai −→ Ai
i=1
(a1 , . . . , an ) ↦−→ ai

Fijemos el índice i y sea Ii un ideal maximal de Ai . Entonces,


𝜋i−1 (Ii ) = A1 × · · · × Ii × · · · × An , y según la proposición 5.2.1, este úl-
În
timo producto es un ideal maximal de i=1 Ai . Recíprocamente, sea J un
În
ideal maximal de i=1 Ai . Según la proposición 4.1.2, J = I1 × · · · × In ,
donde Ii es un ideal bilátero de Ai , 1 ≤ i ≤ n. Existe algún i, 1 ≤ i ≤ n, tal
que Ii ≠ Ai , ya que en caso contrario J no sería propio. Nótese que nece-
sariamente I j = A j para cada j ≠ i, es decir, J = A1 × · · · × Ii × · · · × An . En
efecto, si para algún j ≠ i, I j ≠ A j , entonces
n
Ö
J ⊊ A1 × · · · × Ai × · · · × I j × · · · × An ⊊ Ai
i=1

y J no sería maximal. Por último, J ⊇ ker(𝜋i ) = A1 × · · · × 0 × · · · × An


y, según la proposición 5.2.1, 𝜋i ( J ) = Ii es maximal en Ai . Esto completa
la prueba de la descripción de los ideales maximales del anillo producto.
Obsérvese que

A1 × · · · × An /A1 × · · · × Ii × · · · × An  Ai /Ii ,

para cada ideal propio Ii de Ai , 1 ≤ i ≤ n.


Si tomamos en particular una colección finita de cuerpos T1 , . . . , Tn ,
În
entonces i=1 Ti tiene n ideales maximales: 0×T2 ×· · ·×Tn , T1 ×0×· · ·×Tn ,
. . ., T1 × T2 × · · · × 0; la intersección de los cuales es nula.

Un anillo A se dice semilocal si su colección de ideales maximales es


finita.

3. Ejercicios
1. Sean A un anillo y P un ideal bilátero propio de A. Demuestre que P
es primo si, y sólo si, para cada par de elementos a, b ∈ A se cumple

aAb ⊆ P ⇔ a ∈ P , o, b ∈ P .
Ideales primos y maximales · 65

2. Sean A un anillo y P un ideal bilátero propio de A. Demuestre que P


es primo si, y sólo si, para cada par de ideales derechos I , J de A se
tiene que
I J ⊆ P ⇔ I ⊆ P , o, J ⊆ P .
Demuestre esta misma propiedad para ideales izquierdos.

3. Sean A un anillo y P un ideal bilátero propio de A. Pruebe que P es


primo si, y sólo si, para cada par de ideales biláteros I , J de A que
contengan propiamente a P se tiene que I J ⊈ P.

4. Un anillo A es primo si el ideal nulo es primo. Sea I un ideal propio


de A. Demuestre que I es primo si, y sólo si, A/I es un anillo primo.

5. Sea R un anillo conmutativo y sean P1 , . . . , Pn ideales primos de R.


Ðn
(i) Suponga que I es un ideal de R contenido en i=1 Pi . Pruebe
que existe i tal que I ⊆ Pi .
(ii) Sean I1 , . . . , It ideales de R y sea P un ideal primo de R que
contiene a tj=1 I j . Pruebe que existe j tal que P ⊇ I j .
Ñ

(iii) Si P = tj=1 I j , entonces pruebe que existe j tal que P = I j .


Ñ

6. Sea R un anillo conmutativo en el que cada elemento x satisface la


condición x n = x, para algún n > 1 (dependiente de x). Demuestre
que todo ideal primo de R es maximal.

7. Sea R un anillo conmutativo. El radical primo de R es la intersección


de todos los ideales primos de R, y se denota por rad(R). Demuestre
que rad(R) coincide con la colección de elementos nilpotentes de R
(un elemento r ∈ R se dice nilpotente si existe n ≥ 1 tal que r n = 0).

Sea R un anillo conmutativo y sea I un ideal de R. Demuestre que


8. √
I coincide con la intersección de todos los ideales primos de R que
contienen I.
Capítulo
seis
Dominios de
integridad
Dominios de integridad · 69

Entre los dominios de integridad comunmente encontrados en álgebra se


destacan los dominios euclidianos, los dominios de ideales principales y los
dominios gaussianos (también conocidos como dominios de factorización
única). Su importancia radica en la aritmética que se puede desarrollar so-
bre ellos, conformándose así un área interesante de estudio. Nosotros nos
limitaremos a presentarlos y a estudiar algunas de sus propiedades más im-
portantes.

1. Definiciones y ejemplos
Definición 6.1.1. Sea R un dominio de integridad y sean a, b ∈ R con
a ≠ 0. Se dice que a divide b, o que b es múltiplo de a, lo cual denotaremos
por a | b, si existe c ∈ R tal que b = ac. En este caso, también diremos que
a es un divisor de b.

Ejemplo 6.1.2. En ℤ, 2 | 6, 2 ∤ 5. En ℤ7 , 2 | 6 y 2 | 5 ya que 6 = 2 · 3 y


5 = 2 · 6.

Definición 6.1.3. Sea R un dominio de integridad (DI) y sean a, b elemen-


tos de R. Se dice que a y b son asociados, lo cual escribimos como a ∼ b, si
existe u ∈ R ∗ tal que a = bu.

Ejemplo 6.1.4 (Divisores triviales) . Sea R un DI y a un elemento cual-


quiera de R. Los elementos invertibles de R y los elementos asociados con
a son divisores de a, conocidos como los divisores triviales de a.

Definición 6.1.5. Sea R un DI. Un elemento a no nulo y no invertible de


R se dice irreducible si sus únicos divisores son los triviales.

Ejemplo 6.1.6. En ℤ, 2 es irreducible mientras que 6 no lo es. En un anillo


de división, por definición, no hay elementos irreducibles. Así, en ℚ, ℝ y ℂ
no hay elementos irreducibles.

Ejemplo 6.1.7. Consideremos el subconjunto de números complejos de la


forma √ √
ℤ[ −3] := {a + b −3 | a, b ∈ ℤ}.

ℤ[ −3] es un dominio de integridad con las operaciones usuales de√adi-
ción y multiplicación de complejos. Definimos la norma de z = a + b −3,
a, b ∈ ℤ por
√ √
N (z) := zz = (a + b −3)(a − b −3) = a 2 + 3b 2 ;
70 · Dominios de integridad

podemos observar que

N (z1 z2 ) = N (z1 )N (z2 ),



para cualesquiera√z1 , z2 ∈ ℤ[ −3]. Esto
√ permite √ determinar los elementos

invertibles de ℤ[ −3]: sea z = a + b −3 ∈ ℤ[ −3] , entonces

N (zz −1 ) = N (1) = 1 = N (z)N (z−1 );

como N (z) es un√ entero no negativo se obtiene que a2 + 3b 2 = 1, con lo


cual z = ±1 y ℤ[ −3] ∗ = {1, −1}. √
Nótese√ que 2 es un elemento irreducible de ℤ[ −3], pero 7 no lo es: sea
z = a + b √−3, a, b ∈ ℤ,√tal que z | 2. Existen entonces a0 , b0 ∈ ℤ tales que
2 = (a + b −3)(a0 + b0 −3). De aquí obtenemos 4 = (a2 + 3b 2 )(a02 + 3b02 ).
Se presentan entonces tres casos:

a2 + 3b 2 = 4, a02 + 3b02 = 1;
a2 + 3b 2 = 1, a02 + 3b02 = 4;
a2 + 3b 2 = 2, a02 + 3b02 = 2.

Los dos primeros casos son análogos y veremos sólo el primero. El tercero
no tiene soluciones en ℤ. Considerando las posibles formas de descomponer
4 y 1 en suma de enteros no negativos, obtenemos que a = ±1, b = ±1,
a0 = ±1, b0 = 0; o también, a = ±2, b = 0, a0 = 1, b0 = 0, a = −2, b = 0,
a0 = −1, b0 = 0, es decir, los
√ únicos divisores
√ de 2 son
√ los triviales.

Por otro lado, 7 = (2 + −3)(2 − −3), pero 2 + −3 y 2 − −3 no son
divisores triviales de 7.
Definición 6.1.8. Diremos que el elemento no nulo a de R es primo si ⟨a⟩
es un ideal primo.
Proposición 6.1.9. Sea R un DI y a primo, entonces a es irreducible.
Demostración. En efecto, si ⟨a⟩ es primo entonces ⟨a⟩ ≠ R y así a ∉ R ∗ . Sea
m ∈ R un divisor de a, entonces a = mn, n ∈ R, y en el cociente R/⟨a⟩
resulta 0 = m · n, con lo cual m = 0, o, n = 0, es decir, m ∈ ⟨a⟩, o, n ∈ ⟨a⟩.
Se tiene entonces que m = r a, con r ∈ R, o, n = sa, con s ∈ R. En el primer
caso, a = r an, de donde n ∈ R ∗ . En el segundo caso, m ∈ R ∗ . Así, a es
irreducible. ✓

Ejemplo 6.1.10. Observemos que el recíproco de lo afirmado en la pro-


posición anterior no√siempre es cierto, como lo muestra el ejemplo 6.1.7: 2
es irreducible en ℤ[ −3], pero ⟨2⟩ no es un ideal primo:
√ √ √ √
(1 + −3)(1 − −3) = 4 ∈ ⟨2⟩, pero (1 + −3), (1 − −3) ∉ ⟨2⟩.
Dominios de integridad · 71

2. Dominios gaussianos
Existen dominios como el de los enteros donde es posible efectuar divisio-
nes con residuo. Este tipo de dominio de integridad conforma una subclase
de una clase más amplia con propiedades aritméticas importantes como es
la clase de los dominios gaussianos.
Definición 6.2.1. Sea R un DI. Se dice que R es un dominio euclidiano
(DE) si existe una función d definida sobre los elementos no nulos de R y
tomando valores enteros no negativos d : R − {0} −→ ℕ ∪ {0} tal que:
(i) Para cualesquiera elementos no nulos a, b ∈ R, d (ab) ≥ d (a).

(ii) División con residuo: para cada elemento a ∈ R y cada elemento no


nulo b ∈ R, existen elementos q, r ∈ R tales que:

a = bq + r , donde r = 0, ó, d(r) < d(b).

Ejemplo 6.2.2. Los números enteros ℤ junto con la función valor absolu-
to d = | | constituyen un dominio euclidiano: sean a, b enteros no nulos.
Entonces, |b| ≥ 1, |a||b| ≥ |a| y |a| ≤ |ab|, verificándose así la primera
condición de la definición anterior. Sean ahora a, b enteros con b ≠ 0. Dis-
tinguiremos dos casos:
Caso 1. b > 0. Consideremos los conjuntos

M := {a − bx | x ∈ ℤ} y M + := {z ∈ M | z ≥ 0}.

Nótese que M + ≠ ∅. En efecto, si a ≥ 0 entonces a ∈ M + . Si a < 0 entonces


a ≤ −1, −a ≥ 1, a (−a) ≤ a. Además, como b > 0, entonces −b < 0,
(−b) −a 2 ≥ −ba, de donde a − b −a 2 ≥ a − ba = a (1 − b) ≥ 0 (la última
 

desigualdad es cierta ya que b > 0 implica b ≥ 1, 1 − b ≤ 0, a (1 − b) ≥ 0).


Tomando x = −a2 , resulta también en este caso a − b −a 2 ∈ M + .


Como el conjunto de los enteros no negativos es bien ordenado, conclui-


mos que M + tiene un primer elemento r0 . Sea q0 ∈ ℤ tal que r0 = a − bq0 .
Tenemos entonces que a = bq0 + r0 con r0 ≥ 0. Supongamos que r0 ≥ b.
Entonces, a − bq0 ≥ b, es decir, a − b(q0 + 1) ≥ 0, y así, a − b(q0 + 1) ∈ M + .
Por la condición de r0 , a − b(q0 + 1) ≥ r0 = a − bq0 , con lo cual −b ≥ 0 y se
obtiene una contradicción. Así,

a = bq0 + r0 , donde r0 = 0, ó, 0 < r0 < b.

Caso 2. b < 0. Consideremos los conjuntos

N := {bx − a | x ∈ ℤ} y N + := {z ∈ N | z ≥ 0}.
72 · Dominios de integridad

N + es un conjunto no vacío: si a < 0 entonces −a > 0 y −a ∈ N + . Sea a ≥ 0,


como b < 0, entonces b ≤ −1, b(−a2 ) ≥ (−1) · (−a 2 ) = a2 , b(−a2 ) ≥ 0.
Tomando x = −a2 encontramos que b(−a2 ) − a ∈ N + . Sea t1 el primer
elemento de N + y q1 ∈ ℤ tal que t1 = bq1 −a. Resulta de aquí que a = bq1 −t1 ,
con −t1 ≤ 0. Supongamos que −t1 ≤ b, entonces, t1 ≥ −b, bq1 − a ≥ −b,
b (q1 + 1) − a ∈ N + y, por la escogencia de t1 , b(q1 + 1) − a ≥ t1 = bq1 − a,
es decir, b ≥ 0, lo cual es una contradicción. Se tienen en este segundo caso
enteros q1 , t1 tales que

a = bq1 + (−t1 ), donde − t1 = 0, ó, b < −t1 < 0.

De los dos casos considerados resulta que, dados a, b ∈ ℤ, con b ≠ 0, existen


q, r ∈ ℤ tales que:

a = bq + r , con r = 0, ó, |r | < |b|,

cumpliéndose así la segunda condición de la definición 6.2.1.


Definición 6.2.3. Sea R un DI y sean a, b elementos no nulos de R.
(i) El máximo común divisor de a y b es un elemento d ∈ R tal que:

(a) d | a y d | b.
(b) Cada elemento c ∈ R tal que c | a y c | b cumple c | d.

Este elemento se denota por d := m. c. d.(a, b).

(i) El mínimo común múltiplo de a y b es un elemento c ∈ R tal que:

(a) a | c y b | c.
(b) Cada elemento f ∈ R tal que a | f y b | f cumple c | f .

Este elemento se denota por c := m. c. m. (a, b).


Los conceptos de máximo común divisor y elemento irreducible cobran
especial importancia en los dominios de ideales principales (DIP).
Proposición 6.2.4. Sea R un DIP. Entonces,
(i) Cada par de elementos no nulos a, b ∈ R tienen un máximo común divisor
d, el cual se puede expresar en la forma

d = r a + sb, con r , s ∈ R.

(ii) El elemento a ≠ 0 de R es irreducible si, y sólo si, ⟨a⟩ es maximal. En


consecuencia, cada irreducible es primo.
Dominios de integridad · 73

(iii) Para cada elemento irreducible p ∈ R y cualesquiera elementos a, b ∈ R se


cumple
p | ab ⇒ p | a, o, p | b.

Demostración. (i) Como R es un DIP, entonces el ideal generado por los ele-
mentos a y b es principal, y generado por un elemento d ∈ R:
⟨a, b⟩ = ⟨d⟩. Veamos que d = m. c. d.(a, b). a, b ∈ ⟨d⟩ implica que d | a,
d | b; como d ∈ ⟨a, b⟩, existen r , s ∈ R tales que d = r a + sb. Si c ∈ R es tal
que c | a, c | b, entonces claramente c | d.
(ii) ⇒): por definición de irreducible, a ∉ R ∗ , con lo cual ⟨a⟩ ≠ R. Sea I
un ideal de R que contiene a ⟨a⟩, existe entonces b ∈ R tal que I = ⟨b⟩ ⊇ ⟨a⟩.
Resulta entonces que b | a y, por ser a irreducible, b ∈ R ∗ o bien b ∼ a. En
el primer caso, ⟨b⟩ = R, y en el segundo, ⟨b⟩ = ⟨a⟩. Esto prueba que a es
maximal.
⇐): sea a ≠ 0 tal que ⟨a⟩ es maximal. Entonces, a ∉ R ∗ ; si c ∈ R es tal
que c | a, entonces ⟨c⟩ ⊇ ⟨a⟩. La maximalidad de ⟨a⟩ implica que ⟨c⟩ = R, ó,
⟨c⟩ = ⟨a⟩. En el primer caso, c ∈ R ∗ , y en el segundo, c ∼ a. Esto garantiza
que a es irreducible.
(iii) Sean p un irreducible de R y a, b ∈ R tales que p | ab; según (ii), ⟨p⟩
es primo con ⟨a⟩⟨b⟩ = ⟨ab⟩ ⊆ ⟨p⟩, es decir, p | a, o, p | b. ✓

Definición 6.2.5. Sea R un DI. Se dice que R es un dominio gaussiano


(DG) si cada elemento no nulo y no invertible a ∈ R cumple las siguientes
condiciones:
(i) a tiene una descomposición en producto de elementos irreducibles de
R:
a = p1 · · · pn , pi irreducible de R, 1 ≤ i ≤ n.

(ii) Si a posee otra descomposición en irreducibles

a = q1 · · · qm , qi irreducible de R, 1 ≤ i ≤ m,

entonces m = n y, después de una reordenación de índices, pi ∼ qi ,


1 ≤ i ≤ n.
Observación 6.2.6. De la definición anterior se desprende que en un DG
dos descomposiciones del elemento a sólo difieren en un factor invertible.
En efecto, según (i) y (ii) de la definición,

qi = pi ui , con ui ∈ R ∗ , 1 ≤ i ≤ n;

de aquí resulta entonces que a = q1 · · · qm = p1 u1 · · · pn un = (p1 · · · pn ) u,


donde u = u1 · · · un ∈ R ∗ .
74 · Dominios de integridad

Proposición 6.2.7. Sea R un DI en el cual se cumplen la condición (i) de la


definición anterior y la condición (iii) de la proposición 6.2.4. Entonces, R es un
DG. Recíprocamente, en todo DG se cumple la propiedad (iii) de la proposición
mencionada.

Demostración. La prueba de la primera parte la realizamos por inducción so-


bre el número n de factores irreducibles que intervienen en la descomposi-
ción de un elemento a ∈ R, a ≠ 0 y a ∉ R ∗ . Para n = 1, sea a = p = q1 · · · qm ,
donde p, q1 · · · qm son irreducibles de R. Si m ≥ 2, entonces por la irreduci-
bilidad de p se debe tener que q1 = pu, con u ∈ R ∗ . Ya que R es un DI, resulta
entonces que 1 = uq2 . . . qm , con lo cual q2 ∈ R ∗ . Pero esto es contradictorio,
ya que por hipótesis q2 es irreducible. Así, m = 1 y p ∼ q1 .
Supóngase ahora que la condición (ii) de la definición de DG se cumple
para todos los elementos R en cuya descomposición aparecen menos de n
factores irreducibles, n ≥ 2. Sea a ∈ R descompuesto en dos formas en
producto de irreducibles

a = p1 · · · pn = q1 · · · qm , con p j , q j irreducibles, 1 ≤ i ≤ n, 1 ≤ j ≤ m.

Como p1 | q1 (q2 . . . qm ), entonces p1 | q1 , o, p1 | q2 · · · qm . Resulta entonces


que p1 ∼ qi , para algún 1 ≤ i ≤ m. Podemos reordenar los irreducibles
q1 , . . . , qm y considerar que p1 ∼ q1 . Entonces, p1 · · · pn = (p1 u)q2 · · · qm ,
p2 · · · pn = (uq2 ) · · · qm , con u ∈ R ∗ . Puesto que uq2 , · · · , qm son irreducibles,
entonces, aplicando la hipótesis inductiva, encontramos que n − 1 = m − 1
y p2 ∼ uq2 , . . . , pn ∼ qn . En total p1 ∼ q1 , . . . , pn ∼ qn , y la primera parte
de la proposición está probada.
Sea ahora R un DG y sean p, a, b ∈ R tales que p es irreducible y p | ab.
Si a = 0, o, b = 0, entonces p | a o p | b y no hay nada más que probar.
Si a, b son no nulos, podemos asumir también que a ∉ R ∗ , b ∉ R ∗ . Sean
a = p1 . . . pn , b = q1 . . . qm , m, n ≥ 1, las descomposiciones irreducibles de
a y b, respectivamente. Entonces, p1 · · · pn q1 · · · qm = pc, con c ∈ R. Por la
unicidad de las descomposiciones irreducibles existe pi , o, q j tal que p ∼ pi ,
o, p ∼ q j , es decir, p | a o p | b. □✓

Establecemos ahora la relación existente entre los tres tipos de dominios


de integridad anteriormente definidos.

Teorema 6.2.8. Todo DE es un DIP.

Demostración. Sea R un DE con función d y sea I un ideal no nulo de R.


Sea
d(I) := {d(a) | a ∈ I , a ≠ 0}.
Dominios de integridad · 75

Puesto que d(I) es un conjunto de enteros no negativos, entonces d(I) tiene


un primer elemento d(a0 ), a0 ∈ I, a0 ≠ 0. Sea a un elemento cualquiera
de I. Entonces, a = ma0 + r, con m, r ∈ R, r = 0, ó, d(r) < d(a0 ). Por la
escogencia de a0 , r debe ser nulo, y así, a = ma0 . Esto prueba que I = ⟨a0 ⟩.
Si I = 0, entonces I = ⟨0⟩. Resulta pues que R es un DIP. ✓

Teorema 6.2.9. Todo DIP es un DG.

Demostración. Teniendo en cuenta las proposiciones 6.2.4 y 6.2.7, proba-


remos sólo la parte (i) de la definición de DG. Nótese en primer lugar, que
si R es un DIP, entonces cada cadena ascendente de ideales de R

⟨a1 ⟩ ⊆ ⟨a2 ⟩ ⊆ · · · ⊆ ⟨an ⟩ ⊆ · · ·

se detiene, es decir, existe un n natural tal que ⟨ak ⟩ = ⟨an ⟩, para cada k ≥ n.
Ð
En efecto, la reunión i ∈ℕ ⟨ai ⟩ es un ideal de R, y por tanto, generado por
Ð
un cierto elemento a ∈ R, i ∈ℕ ⟨ai ⟩ = ⟨a⟩. Existe entonces un n ∈ ℕ tal
Ð
que a ∈ ⟨an ⟩; de aquí resulta que ⟨a⟩ ⊆ ⟨an ⟩ ⊆ ⟨a⟩ y i ∈ℕ ⟨ai ⟩ = ⟨an ⟩. Para
k ≥ n, ⟨ak ⟩ ⊇ ⟨an ⟩ ⊇ ⟨ak ⟩, es decir, ⟨ak ⟩ = ⟨an ⟩, con k ≥ n.
Supongamos ahora que existe en R un elemento no nulo y no inverti-
ble a que no tiene descomposición en producto de elementos irreducibles.
Lógicamente a no es irreducible (en caso contrario, se tendría la descom-
posición trivial a = a). Existen entonces a1 , b1 ∈ R no nulos y no invertibles
tales que a = a1 b1 . Nótese que ⟨a⟩ está contenido propiamente en ⟨a1 ⟩. Al
menos uno de a1 , b1 no es producto de elementos irreducibles, por ejemplo,
a1 . Aplicando al elemento a1 el mismo razonamiento que para a resulta una
cadena infinita de ideales

⟨a⟩ ⊊ ⟨a1 ⟩ ⊊ ⟨a2 ⟩ ⊊ . . .

la cual no se detiene, contradiciendo lo probado al principio de esta demos-


tración. ✓

La finitud de las cadenas ascendentes de ideales principales introduci-


da en la prueba del teorema 6.2.9 puede ser caracterizada en términos de
maximalidad, como veremos a continuación.

Proposición 6.2.10. Sea R un anillo conmutativo. Entonces, en R cada cadena


ascendente de ideales se detiene si, y sólo si, en cada colección no vacía de ideales de
R hay un elemento maximal.

Demostración. ⇒): sean C una colección no vacía de ideales de R e I1 ∈ C.


Si I1 es maximal en C, no hay nada que probar. Sea entonces I2 ∈ C tal que
76 · Dominios de integridad

I1 ⊂ I2 . Si I2 es maximal en C, el proceso de búsqueda se detiene. En caso


contrario, continuamos y obtenemos una cadena ascendente de ideales de
R. Según la hipótesis, el proceso debe detenerse, y en C hay un elemento
maximal.
⇐): si existe una cadena ascendente de ideales de R que no se detiene

I1 ⊊ I2 ⊊ · · · ⊊ In ⊊ In+1 ⊊ · · ·

entonces en la colección C := {Ii }i ∈ℕ no hay un elemento maximal, con-


tradicción. ✓

Los DG se pueden caracterizar en términos de los elementos primos.

Proposición 6.2.11. (i) En un DG cada irreducible p es primo, es decir, pri-


mos e irreducibles coinciden.

(ii) Sea R es un DI. R es un DG si, y sólo si, cada elemento no nulo y no invertible
de R es producto finito de elementos primos de R.

Demostración. (i) Sean a, b ∈ R tales que ab ∈ ⟨p⟩. Entonces, ab = pm,


m ∈ R; descomponiendo a, b, m en factores irreducibles y teniendo en
cuenta la unicidad de la descomposición encontramos que p | a, o, p | b, en
otras palabras, p es primo.
(ii) ⇒): esto es consecuencia directa de (i).
⇐): puesto que todo primo es irreducible, sólo se debe probar la unicidad
de cada descomposición irreducible. Pero de acuerdo con la proposición
6.2.7, esto es equivalente a la condición (iii) de la propósición 6.2.4. Sean
p irreducible y a, b ∈ R tales que p | ab; si a = 0, o, b = 0, no hay nada que
probar. Además, a ∉ R ∗ y b ∉ R ∗ . Sea m ∈ R tal que ab = pm. Podemos
descomponer a y b en factores primos a1 · · · an b1 · · · bl = pm. Entonces,
pm ∈ ⟨a1 ⟩, con lo cual p ∈ ⟨a1 ⟩, o, m ∈ ⟨a1 ⟩. En el primer caso, como p es
irreducible, a1 ∼ p y p | a1 . En el segundo, existe n1 ∈ R tal que m = a1 n1 ,
de donde a2 · · · an b1 · · · bl = pn1 . Podemos repetir el razonamiento anterior
hasta concluir que p | a, o, p | b. Esto completa la prueba. ✓

Ejemplo 6.2.12. Según los resultados de la presente sección, se tienen las


siguientes relaciones:

DE ⊊ DIP ⊊ DG ⊊ DI ⊊ Anillos conmutativos.

Además,

(i) Si n ≥ 2 y n no es primo, entonces ℤn es un anillo conmutativo que


no es DI.
Dominios de integridad · 77


(ii) ℤ[ −3] es un DI que no es DG:
√ √
4 = 2 · 2 = (1 + −3)(1 − −3);
√ √ √
2, 1 + −3 y 1 − −3 son irreducibles no asociados de ℤ[ −3] (véase
el ejemplo 6.1.7).

(iii) Más adelante se mostrará que el anillo de polinomios con coeficientes


enteros, ℤ[x], es un DG que no es DIP.

(iv) Los ejemplos de DIP que no son DE no son de fácil construcción.


Uno de tales ejemplos puede ser consultado en [4].

3. Ejercicios

1. Demuestre que ℤ[ −5] no es un DIP.

2. Un dominio de integridad R se dice que es GCD si cada par de ele-


mentos no nulos tiene máximo común divisor. Sea R un dominio
GCD y sean a, b elementos no nulos de R tales que m. c. d.(a, b) = 1.
Demuestre que m. c. m.(a, b) existe y coincide con ab.

3. Demuestre que en un DG cada par de elementos no nulos tiene máxi-


mo común divisor y mínimo común múltiplo. En consecuencia, todo
DG es GCD.

4. Sea R un dominio GCD y sean a, b, d, x, y ∈ R tales que d = m. c. d.(a, b),


a = dx, b = dy. Demuestre que m. c. d.(x, y) = 1.

5. Sea R un DI. Demuestre que R es GCD si, y sólo si, para cada par de
elementos a, b ∈ R se tiene que ⟨a⟩ ∩ ⟨b⟩ es principal.
Capítulo
siete
Anillos de
fracciones: caso
conmutativo
Anillos de fracciones: caso conmutativo · 81

La construcción del cuerpo ℚ de los números racionales por medio de una


relación de equivalencia definida sobre el producto cartesiano ℤ × (ℤ − {0})
puede ser generalizada a un DI arbitrario R, resultando el llamado cuerpo
de fracciones del dominio R. Esta situación puede ser ampliada a anillos
conmutativos, no siendo necesariamente el nuevo objeto un cuerpo. En este
capítulo nos ocuparemos de tal construcción.

1. Construcción y propiedades
Definición 7.1.1. Sean R un anillo conmutativo y S un subconjunto no
vacío de R. Se dice que S es un subconjunto multiplicativo de R si:

(i) Para cualesquiera elementos s, t ∈ S su producto st está en S.

(ii) 0 ∉ S.

(iii) 1 ∈ S.

Proposición 7.1.2. Sea R un anillo conmutativo y S un subconjunto multiplica-


tivo de R. La relación ≡ definida en el conjunto R × S por

(a, s) ≡ (b, t) ⇔ (∃u ∈ S)(atu = bsu) (1.1)

con a, b ∈ R, s, t ∈ S, es de equivalencia.

Demostración. Las propiedades reflexiva y simétrica de ≡ son evidentes. Sean


(a, s), (b, t), (c, r) ∈ R × S tales que (a, s) ≡ (b, t) y (b, t) ≡ (c, r). Existen
entonces elementos u, v ∈ S tales que atu = bsu y brv = ctv. De estas igual-
dades resultan aturv = bsurv y brvus = ctvus; en vista de la conmutatividad
obtenemos ar (vtu) = cs(vtu), con lo cual (a, s) ≡ (c, r) ya que vtu ∈ S. □ ✓

La relación determina una partición del conjunto R ×S en clases de equi-


valencia. Denotemos por as la clase que contiene a la pareja (a, s) y mediante
RS −1 al conjunto de todas las clases así conformadas.

Teorema 7.1.3. En el conjunto RS −1 las operaciones

a b at + bs
+ := , (1.2)
s t st
ab ab
:= (1.3)
st st
definen una estructura de anillo conmutativo, denominado anillo de fracciones
de R respecto a S.
82 · Anillos de fracciones: caso conmutativo

Demostración. Teniendo en cuenta que estamos trabajando con clases de


equivalencia, debemos verificar inicialmente que las operaciones están de-
finidas correctamente. Sean
a1 a2 b1 b2 a1 a2 b1 b2
, , , ∈ RS −1 tales que = y = .
s1 s2 t1 t2 s1 s2 t1 t2

Entonces existen elementos u, v ∈ S tales que a1 s2 u = a2 s1 u, b1 t2v = b2 t1v.


De aquí resulta va1 s2 ut1 t2 = va2 s1 ut1 t2 y ub1 t2vs1 s2 = ub2 t1vs1 s2 ; sumando
obtenemos (a1 t1 s2 t2 + b1 t2 s1 s2 )vu = (a2 s1 t1 t2 + b2 t1 s1 s2 )vu, con lo cual

a 1 b1 a 2 b2
+ = + ,
s1 t1 s2 t2

ya que vu ∈ S. De manera similar se establece que as11 bt11 = as22 bt22 .


De otra parte, las propiedades asociativa, conmutativa y distributiva de
las operaciones definidas en (1.2) -(1.3) , se desprenden de las respectivas
propiedades de las operaciones del anillo R. La verificación completa de
dichas propiedades queda a cargo del lector. Nótese que el cero y el uno del
anillo RS −1 son las fracciones 01 y 11 , respectivamente. Por último, obsérvese
que − as = −a
s .

De la construcción anterior se obtienen las siguientes propiedades.

Corolario 7.1.4. La función

𝜓 : R −→ RS −1 (1.4)
a
a ↦−→
1
cumple las siguientes propiedades:

(i) 𝜓 es un homomorfismo de anillos.

(ii) 𝜓 (S) ⊆ (RS −1 ) ∗ .

(iii) 𝜓 (a) = 0 ⇔ au = 0, para algún u ∈ S.

(iv) Cada elemento de RS −1 tiene la forma

𝜓 (a)𝜓 (s) −1 , con a ∈ R, s ∈ S.

(v) 𝜓 es inyectiva ⇔ S no posee divisores de cero.

(vi) 𝜓 es biyectiva ⇔ S ⊆ R ∗ .
Anillos de fracciones: caso conmutativo · 83

Demostración. (i) Tenemos


a+b a b
𝜓 (a + b) = = + = 𝜓 (a) + 𝜓 (b);
1 1 1
ab a b
𝜓 (ab) = = = 𝜓 (a)𝜓 (b);
1 11
1
𝜓 (1) = .
1
(ii) Sea s ∈ S. Luego 𝜓 (s) = 1s y 1s 1s = 11 , es decir, 𝜓 (s) ∈ (RS −1 ) ∗ , con
𝜓 (s) −1 = 1s .
(iii) 𝜓 (a) = 0 ⇔ 1a = 01 ⇔ au = 01 = 0, para algún u ∈ S.
(iv) Sea as ∈ RS −1 , entonces as = 1a 1s = 𝜓 (a)𝜓 (s) −1 .
(v) Es equivalente a (iii).
(vi) Evidente. □✓

Según el corolario anterior, no se puede considerar en general que R se


sumerja en el anillo de fracciones RS −1 . De otra parte, vale la pena pregun-
tarse sobre la unicidad del anillo construido. Respondemos a esta pregunta
con las siguientes propiedades.

Teorema 7.1.5 (Propiedad universal del anillo de fracciones) . Sea


g : R −→ R0 un homomorfismo de anillos tal que g (S) ⊆ R0∗ . Entonces, exis-
te un único homomorfismo h : RS −1 −→ R0 tal que h ◦ 𝜓 = g. Además, si g es
inyectivo, entonces h también es inyectivo.

Demostración. Existencia: definimos


a
h := g (a) g (s) −1 , con a ∈ R, s ∈ S.
s
Veamos primero que h está bien definida. Si as11 = as22 , entonces existe u ∈ S
tal que a1 s2 u = a2 s1 u, de aquí resulta g (a1 )g (s2 ) = g (a2 ) g (s1 ), ya que
g (u) ∈ R0∗ . Podemos entonces escribir g (a1 ) g (s1 ) −1 = g (a2 ) g (s2 ) −1 , es de-
   
cir, h as11 = h as22 .
h es un homomorfismo de anillos:
   
a b at + bs
h + =h = g (at + bs) g (st) −1
s t st
= (g (a) g (t) + g (b) g (s)) g (s) −1 g (t) −1
= g (a) g (s) −1 + g (b) g (t) −1
a  
b
=h +h ;
s t
84 · Anillos de fracciones: caso conmutativo

 
ab
h = g (a) g (b) g (s) −1 g (t) −1
st
 a  b 
=h h ;
s t
 
1
h = g (1) g (1) −1 = 1.
1

Sea ahora a ∈ R; h ◦ 𝜓 (a) = h 1a = g (a),es decir, h ◦ 𝜓 = g.




Unicidad: sea f : RS −1 −→ R0 un homomorfismo tal que f ◦ 𝜓 = g.


Sea x un elemento de RS −1 , entonces x = 𝜓 (a)𝜓 (s) −1 , con a ∈ R, s ∈ S.
De aquí resulta f (x) = f (𝜓 (a)) f (𝜓 (s) −1 ) = g (a) g (s) −1 = h( as ) = h(x), así,
f = h.
Por último, notemos que si h as = 0, entonces g (a) g (s) −1 = 0, es decir,


g (a) = 0; como g es inyectiva, a = 0 y as = 0. ✓


Corolario 7.1.6. Si el anillo R puede sumergirse en el anillo de fracciones RS −1


(es decir, R ⊆ RS −1 ), entonces RS −1 es el menor anillo que contiene R en el cual
todos los elementos de S son invertibles.

Demostración. Consecuencia directa del teorema anterior. ✓


Corolario 7.1.7. Sean R0 un anillo y g : R −→ R0 un homomorfismo tal que


g (S) ⊆ R0∗ y R0 también cumple la propiedad universal del teorema 7.1.5. Enton-
ces, R0  RS −1 .

Demostración. Como RS −1 tiene la propiedad universal, existe un homo-


morfismo h : RS −1 −→ R0 tal que h𝜓 = g (teorema 7.1.5). De igual manera,
como R0 también tiene la propiedad universal, entonces existe un homo-
morfismo t : R0 −→ RS −1 tal que tg = 𝜓. De esta manera se tiene que
(ht)g = g y (th)𝜓 = 𝜓, luego por la unicidad en la propiedad universal
resulta ht = iR0 y th = iRS −1 , es decir, h es un isomorfismo. ✓

Observación 7.1.8. Los anillos de fracciones pueden presentarse en el or-


den inverso al dado aquí. Más exactamente, sean R un anillo conmutativo
y S un subconjunto multiplicativo de R. Se dice que R tiene un anillo de
fracciones respecto de S si existe un anillo conmutativo B y una función
𝜓 : R −→ B tal que se cumplen las condiciones (i)-(iv) del corolario 7.1.4.
En tal caso se dice que B es un anillo de fracciones de R con respecto a S.
El teorema 7.1.3 y el siguiente resultado prueban la existencia y unicidad
de tales anillos de fracciones.

Teorema 7.1.9. Sean R0 un anillo y g : R −→ R0 una función que satisface


las condiciones (i)-(iv) del corolario 7.1.4. Entonces, existe un único isomorfismo
Anillos de fracciones: caso conmutativo · 85

h : RS −1 −→ R0 tal que h ◦ 𝜓 = g, donde 𝜓 es el homomorfismo definido en


(1.4) .
Demostración. Por el teorema 7.1.5, existe un único homomorfismo
h : RS −1 −→ R0 tal que h ◦ 𝜓 = g. Resta ver que h es un isomorfismo.
Sean a ∈ R y s ∈ S tales que h as = 0. Entonces, g (a) g (s) −1 = 0, y así,


g (a) = 0. Existe entonces u ∈ S tal que au = 0 y as = 01 . Sea ahora x ∈ R0 ,


x se puede escribir de la forma x = g (a)g (s) −1 , con a ∈ R y s ∈ S. De aquí
resulta  a  1 a
−1
x = h ◦ 𝜓 (a) (h ◦ 𝜓 (s)) = h h =h ,
1 s s
con lo cual h es biyectivo. ✓

2. Ejemplos
Terminamos este capítulo ilustrando con ejemplos la construcción realiza-
da.
Ejemplo 7.2.1 (Anillo total de fracciones) . Sean R un anillo conmutativo
y
S0 := {a ∈ R | a no es divisor de cero}; (2.1)
nótese que S0 es un subconjunto multiplicativo de R y, según el corolario
7.1.4, R se puede sumergir en Q (R) := RS0−1 . Q (R) se denomina el anillo
total de fracciones, o también, anillo clásico de fracciones del anillo R, y,
según el corolario 7.1.6, es el menor anillo que contiene a R en el cual todos
los elementos de S0 son invertibles.
Ejemplo 7.2.2 (Cuerpo de fracciones de un DI) . Si R es un dominio de
integridad, entonces el conjunto S0 definido en (2.1) es S0 = R − {0}. El
anillo clásico de fracciones Q (R) en este caso es un cuerpo. Nótese además
que Q (R) es el menor cuerpo que contiene a R. En particular, Q (ℤ) = ℚ.
Resulta entonces de lo dicho que, salvo isomorfismo, ℚ es el menor cuerpo
que contiene a ℤ. Por último, obsérvese que si R es un DI y S0 = R − {0},
por lo que en la relación (1.1) podemos suprimir u, y escribir sencillamente
at = bs.
Ejemplo 7.2.3 (Lozalización por ideales primos) . Sean R un anillo con-
mutativo y P un ideal primo de R. El conjunto S := R −P es un subconjunto
multiplicativo de R y podemos construir el anillo de fracciones, el cual de-
notaremos por RP : na o
RP = | a ∈ R, s ∉ P .
s
86 · Anillos de fracciones: caso conmutativo

El anillo de fracciones RP es local (véase el ejemplo 5.2.7). En efecto, el


conjunto na o
PRP := | a ∈ P, s ∉ P
s
es un ideal de RP que cumple PRP = RP − RP∗ .
Como PRP es maximal, RP /PRP es un cuerpo, el cual es isomorfo al
cuerpo de fracciones del dominio R/P. En efecto, la función definida por

g : R/P −→ RP /PRP
r
r ↦−→
1
r r
con r = r + P, 1 = 1 + PRP y r ∈ R, cumple las condiciones del teorema
7.1.9.

Ejemplo 7.2.4 (Ideales de RS−1 ) . Sean R un anillo conmutativo, S un


subconjunto multiplicativo de R y RS −1 el anillo de fracciones de R respecto
de S. Entonces, los ideales de RS −1 son de la forma
na o
IS −1 := ∈ RS −1 | a ∈ I , s ∈ S (2.2)
s
donde I es un ideal de R: es evidente que si I es un ideal de R, entonces el
conjunto IS −1 es un ideal de RS −1 . De otra parte, si J es un ideal de RS −1 ,
entonces n a o
I := a ∈ RS −1 | ∈ J (2.3)
1
es un ideal de R tal que J = IS −1 . En efecto, I es claramente un ideal; sea
a a s a a −1
b ∈ J , entonces s 1 = 1 ∈ J , con lo cual a ∈ I y s ∈ IS . Recíprocamente,
si as ∈ IS −1 con a ∈ I, entonces 1a ∈ J , 1a 1s ∈ J , es decir, as ∈ J , y la igualdad
está probada.
Notemos adicionalmente que IS −1 es propio si, y sólo si, I ∩ S = ∅;
además, si I1 ⊆ I2 , entonces I1 S −1 ⊆ I2 S −1 .
Si R es un DI, entonces RS −1 es un DI; también, si R es un DIP, entonces
RS −1 es un DIP: DaE
IS −1 = ⟨a⟩S −1 = .
1
Ejemplo 7.2.5. Sean R un anillo conmutativo, S un subconjunto multipli-
cativo de R e I un ideal de R tal que I ∩ S = ∅. Entonces, IS −1 definido
como en (2.2) es un ideal propio de RS −1 . Nótese que entonces se tiene el
isomorfismo
−1
RS −1 /IS −1  R S , (2.4)
Anillos de fracciones: caso conmutativo · 87

con R := R/I y S := {x = x + I | x ∈ S}. En efecto, obsérvese que S es un


subconjunto multiplicativo de R; además, la correspondencia

g : R −→ RS −1 /IS −1
a
a ↦−→ ,
1

con a = a + I, 1a = 1a + IS −1 y a ∈ R, satisface las hipótesis del teorema 7.1.9,


resultando así el isomorfismo (2.4) .

Ejemplo 7.2.6 (Ideales primos de RS−1 ) . Existe una correspondencia bi-


yectiva entre los ideales primos de RS −1 y los ideales primos de R que tie-
nen intersección vacía con S. En efecto, sea P un ideal primo de R tal que
P ∩ S = ∅, sabemos que PS −1 es propio; además, sean ra , bs ∈ RS −1 ta-
les que ra bs ∈ PS −1 , entonces ab c
rs = t , con c ∈ P, y existe u ∈ S tal que
abtu = crsu ∈ P. De aquí resulta ab ∈ P, o, tu ∈ P, pero como tu ∈ S, en-
tonces ab ∈ P, con lo cual a ∈ P, o, b ∈ P, es decir, ra ∈ PS −1 , o, bs ∈ PS −1 .
Resulta así que PS −1 es primo. De otra parte, si P1 , P2 son ideales primos de
R tales que P1 ∩ S = ∅ = P2 ∩ S, con P1 S −1 = P2 S −1 , entonces P1 = P2 . En
efecto, si a ∈ P1 , entonces 1a ∈ P1 S −1 = P2 S −1 ; existe b ∈ P2 , s ∈ S tales que
a b
1 = s , de donde asu = bu, para un cierto u ∈ S. Resulta entonces asu ∈ P2 y,
por ser este último primo y tener intersección vacía con S, entonces a ∈ P2 ,
y así, P1 ⊆ P2 . La otra inclusión se prueba de manera análoga.
Resta demostrar que cada ideal primo de RS −1 es de la forma PS −1 ,
con P primo de R y P ∩ S = ∅. Sea J un ideal primo de RS −1 ; según lo
establecido en el ejemplo 7.2.4, J es de la forma PS −1 , donde P es como en
(2.3) . Notemos que P ∩ S = ∅, ya que en caso contrario J no sería propio.
Sean a, b ∈ R tales que ab ∈ P, entonces ab a b
1 ∈ J , es decir, 1 ∈ J , o, 1 ∈ J ,
con lo cual a ∈ P, o, b ∈ P, y de esta manera P primo. Esto completa la
prueba sobre la correspondencia biyectiva.

Ejemplo 7.2.7. Sean R1 , . . . , Rn anillos conmutativos con sistemas multi-


plicativos S1 , . . . , Sn , respectivamente. Entonces, S := S1 × · · · × Sn es un
sistema multiplicativo de R := R1 × · · · × Rn , y además

RS −1  R1 S1−1 × · · · × Rn Sn−1 .

Consideremos en particular que, para cada 1 ≤ i ≤ n, Ri es un DI. Entonces,


para Si := Ri −0, 1 ≤ i ≤ n, se tiene que S1 ×· · ·×Sn coincide con el conjunto
de elementos de R que no son divisores de cero y, por lo tanto,

Q (R1 × · · · × Rn )  Q (R1 ) × · · · × Q (Rn ),


88 · Anillos de fracciones: caso conmutativo

donde Q (Ri ) es el cuerpo de fracciones de Ri , 1 ≤ i ≤ n. Así, por ejemplo,

Q (ℤ × · · · × ℤ)  ℚ × · · · × ℚ.

Ejemplo 7.2.8. Sean R un anillo conmutativo, X un conjunto no vacío y


R X el anillo de funciones definido en el ejemplo 1.1.6. Sea además S un
subconjunto multiplicativo de R. Entonces, el conjunto

S X := { f ∈ R X | f (X) ⊆ S}

es un subconjunto multiplicativo de R X tal que

R X (S X ) −1  (RS −1 ) X .tion∗

La verificación de estas afirmaciones es rutinaria y se deja a cargo del lector.


Consideremos en particular el anillo clásico de fracciones R X cuando R es
DI. Si S0 = R − 0, entonces S0X es el conjunto de los elementos de R X que
no son divisores de cero y, por lo tanto,

Q (R X )  Q (R) X ,

donde Q (R) es el cuerpo de fracciones de R. En particular,

Q (ℤℕ )  ℚℕ , Q (ℚℕ )  ℚℕ , Q (ℝℕ )  ℝℕ , Q (ℂℕ )  ℂℕ .


√ √
Ejemplo 7.2.9 (Cuerpo de fracciones de ℤ[ −3]) . El anillo ℤ[ −3] fue
definido en el ejemplo 6.1.7, y se probó que es un DI. Su cuerpo de frac-
ciones es el conjunto
√ √
ℚ[ −3] = {x + y −3 | x, y ∈ ℚ}.

En efecto, consideremos la función


√ √
g : ℤ[ −3] −→ ℚ[ −3]
√ a b√
a + b −3 ↦−→ + −3
1 1

g es claramente un homomorfismo inyectivo de√anillos; además, para cua-


lesquiera enteros no nulos a, b, el complejo 1a + 1b −3 es no nulo y su inverso
satisface
a b √ √
+ −3 ∈ ℚ[ −3].
a2 + 3b 2 a2 + 3b 2
Anillos de fracciones: caso conmutativo · 89

√ √
Por último obsérvese que cada elemento ra + bs −3 ∈ ℚ[ −3] se escribe en
la forma
a b√ as − 3 · rb as + br √ rs rs √  −1
 
+ −3 = + −3 + −3 ,
r s 1 1 1 1
a b√  √   √   √  −1
+ −3 = g as − br −3 + as + br −3 g rs + rs −3 .
r s

Así,√según el teorema 7.1.9 ℚ[ −3] es isomorfo al cuerpo de fracciones de
ℤ[ −3].

Ejemplo 7.2.10 (Anillo clásico de fracciones de ℤn , n ≥ 2) . Nótese que


en ℤn el sistema S0 definido en (2.1) coincide con ℤ∗n . En efecto, es claro
que si x ∈ ℤ∗n entonces x ∈ S0 . Recíprocamente, si x ∉ ℤ∗n , entonces según
el ejemplo 1.1.12 existe 2 ≤ d ≤ n tal que d divide a x y d divide a n. Sean
entonces 1 ≤ r , s ≤ n − 1, x = dr, n = ds. Resulta de aquí que xs = 0 y
x ∉ S0 .
La función idéntica iℤn : ℤn −→ ℤn satisface las hipótesis del teorema
7.1.9, y por lo tanto, Q (ℤn )  ℤn .

3. Ejercicios
1. Sea R un DI y sea 𝕂 su cuerpo de fracciones. Sea P un ideal primo
de R. Demuestre que el cuerpo de fracciones de RP es isomorfo a 𝕂.

2. Sean R un anillo conmutativo, Spec(R) la colección de ideales primos


de R, denominada el espectro primo de R, S un sistema multiplicativo
de R y P ∈ Spec(R) tal que P ∩ S = ∅. Entonces, (RS −1 )PS −1  RP .

3. Sean S y T dos sistemas multiplicativos de un dominio de integri-


dad R. Demuestre que ST := {st | s ∈ S, t ∈ T } es un sistema
multiplicativo de R y que R(ST ) −1  (RS −1 )T −1 , considerando la
imagen natural de T en RS −1 . En particular, si S ⊆ T , entonces
(RS −1 )T −1  RT −1 . Además, si Q ⊆ P son dos ideales primos de
R, entonces RQ  (RP )QRP , donde QRP := { ua | a ∈ Q , u ∉ P } es un
ideal primo de RP .

4. Sean I , J ideales de un anillo conmutativo R y sea S un sistema mul-


tiplicativo de R. Demuestre que:

(i) (I + J )S −1 = IS −1 + J S −1 .
(ii) (I ∩ J )S −1 = IS −1 ∩ J S −1 .
90 · Anillos de fracciones: caso conmutativo

(iii) (I J )S −1 = IS −1 J S −1 .
(iv) Si J es finitamente generado, (I : J )S −1 = (IS −1 : J S −1 ).

5. Sea R un dominio de integridad y sea Q (R) su cuerpo de fracciones.


Demuestre que si f : R −→ R un automorfismo del anillo R, es decir,
un isomorfismo de R en R, entonces f se extiende de manera única a
un automorfismo de Q (R).

6. Sea R un dominio de integridad y sea Q (R) su cuerpo de fracciones.


Demuestre que:

(i) Si P es un ideal maximal de R, entonces el anillo local RP se


puede sumergir en Q (R).
Ù
(ii) RP = R.
P maximal de R
Capítulo
ocho
Polinomios y
series
Polinomios y series · 93

En los cursos elementales de álgebra los polinomios son considerados como


“expresiones algebraicas” en la forma

a (x) = a0 + a1 x + · · · + an x n ,

donde a0 , . . . , an son, por ejemplo, números reales o complejos. Apren-


dimos a sumar y multiplicar polinomios con reglas sencillas: la suma de
dos polinomios p(x) y q(x) da como resultado un tercer polinomio, cuyos
coeficientes se determinan sumando los coeficientes de p(x) y q(x) corres-
pondientes a términos en x con igual exponente. Así por ejemplo,

p(x) = 5 + 4x + x 3 , q(x) = −4 + 3x + x 2 + 5x 3
p(x) + q(x) = (5 − 4) + (4 + 3)x + (0 + 1)x 2 + (1 + 5)x 3
= 1 + 7x + x 2 + 6x 3 .

Para la multiplicación es utilizada una propiedad distributiva y una regla


simple de exponentes x k x t = x k+t . Además, para efectos de cálculo se su-
pone que la “indeterminada” x conmuta con los coeficientes: ax = xa. Esta
manera de efectuar operaciones con polinomios y de hablar de distributivi-
dad, conmutatividad, potenciación, etc., hace pensar sobre la posibilidad de
estudiar los polinomios desde un punto de vista estructural.

1. El anillo de series
Proposición 8.1.1. Sean A un anillo y S el conjunto de sucesiones en A,

S := {(a0 , a1 , a2 , . . .) := (ai ) | ai ∈ A, i = 0, 1, 2, . . .}.

Entonces, las operaciones de adición y multiplicación definidas en S por:

a = (ai ) , b = (bi ) ,
a + b := c = (ci ), ci := ai + bi , i = 0, 1, 2, . . . ,
∑︁
ab := d = (di ), di := a j bk , i = 0, 1, 2, . . . ,
j+k=i

dan a S una estructura de anillo (dos sucesiones son iguales si, y sólo si, ai = bi , para
cada i = 0, 1, 2, . . .).
Demostración. La asociatividad de la adición de sucesiones formales es con-
secuencia de la asociatividad de la adición en A. El cero de S es la sucesión
nula
0 := (0, 0, . . .).
94 · Polinomios y series

La sucesión opuesta de a = (ai ) es −a := (−ai ). Sean ahora a = (ai ), b = (bi ),


c = (ci ) elementos cualesquiera de S. Entonces, (ab)c = dc = f donde
∑︁ ∑︁
d = (d j ), d j = ar bs , f = ( fi ), fi = d j ck ,
j=r+s i= j+k

es decir,
∑︁ ∑︁ ∑︁
fi = (ar bs )ck = ar (bs ck ) = ar bs ck .
i=r+s+k i=r+s+k i=r+s+k

De otra parte, a(bc) = ag = h donde


∑︁ ∑︁
g = (gl ), gl = bm c n , h = (hi ), hi = at gl ,
l=m+n i=t+l

es decir, ∑︁ ∑︁
hi = at (bm cn ) = at bm cn .
i=t+m+n i=t+m+n
Esto muestra que (ab)c = a(bc).
Es fácil comprobar que el uno de S es la sucesión

1 := (1, 0, 0, . . .)

y que el producto se distribuye sobre la adición. ✓


Definición 8.1.2. El anillo S de la proposición anterior se denomina anillo


de sucesiones formales en A.
Sea ℕ0 := {0, 1, 2, 3, . . .}. Los elementos de S coinciden con los del
anillo Aℕ0 definido en el capítulo 1. Sin embargo, los productos considera-
dos en cada caso son diferentes y dichos anillos son por lo tanto distintos.
Corolario 8.1.3. El anillo S de sucesiones formales es conmutativo si, y sólo si, A
es un anillo conmutativo.
Demostración. ⇒): sean z y u elementos de A. Entonces,

(z, 0, 0, . . .) (u, 0, 0, . . .) = (u, 0, 0, . . .)(z, 0, 0, . . .), es decir,


(zu, 0, 0, . . .) = (uz, 0, 0, . . .),

luego zu = uz.
⇐): sean a = (ai ) y b = (bi ) sucesiones de S. Entonces,
∑︁ ∑︁
ab = c = (ci ), ci = a j bk = bk a j = di ,
j+k=i j+k=i

donde d = (di ) = ba, es decir, ab = ba. ✓



Polinomios y series · 95

La prueba anterior pone de manifiesto que el anillo A puede sumergirse


en su anillo de sucesiones formales.

Corolario 8.1.4. La función

𝜄 : A −→ S
a ↦−→ (a, 0, 0, . . .)

es un homomorfismo inyectivo.

Demostración. Evidente. ✓

2. El anillo de polinomios
En el anillo S se destacan de manera especial las sucesiones que tienen un
número finito de términos no nulos.

Definición 8.2.1. Se dice que la sucesión a = (a0 , a1 , a2 , . . .) es un poli-


nomio si existe un entero n tal que ai = 0 para i > n. Sea a un polinomio no
nulo, se denomina grado del polinomio a al mayor entero n tal que an ≠ 0,
y se denota por gr(a). Los polinomios de grado 0 se denominan constantes.

Observación 8.2.2. La sucesión nula es un polinomio sin grado. Si a es un


polinomio de grado n, entonces an+k = 0 para k ≥ 1:

a = (a0 , a1 , . . . , an , 0, . . .).

Los elementos a0 , a1 , . . . , an se denominan coeficientes del polinomio a; a0


se denomina coeficiente independiente de a. El elemento an se denomina
el coeficiente principal de a y se denota por lc(a).

Proposición 8.2.3. Sea S el anillo de sucesiones formales en el anillo A. El con-


junto P de polinomios de S es un subanillo de S.

Demostración. 1 = (1, 0, 0, . . .) ∈ P; si a = (ai ) y b = (bi ) son polinomios,


entonces existen enteros m y k tales que ai = 0, para i > m, y bi = 0 para
i > k. Sean c := a + b y d := ab. Entonces, ci = 0, para i > máx{m, k}, y
di = 0, para i > m + n, es decir, c, d ∈ P. ✓

Veamos ahora los polinomios en su forma habitual como sumas finitas.


Si x denota la sucesión
x := (0, 1, 0, . . .),
96 · Polinomios y series

entonces

x 2 = (0, 0, 1, 0, . . .),
x 3 = (0, 0, 0, 1, 0, . . .),
..
.
x n = (0, . . . , 0, 1, 0 . . .).

Además, podemos identificar los polinomios constantes en la forma

(a0 , 0, . . .) := a0 con a0 ∈ A,

y un polinomio de grado n se escribirá de manera única en la forma

a(x) := (a0 , a1 , . . . , an , 0, . . .) = a0 + a1 x + · · · + an x n .

El conjunto P de los polinomios en x con coeficientes en A será denotado


por A[x]. Al anillo S de sucesiones lo denotaremos por A[[x]].

Observación 8.2.4. (i) Las reglas del álgebra elemental a través de las cuales
aprendimos a sumar y multiplicar polinomios pueden ser ahora plenamente
justificadas. Por ejemplo, para cada a ∈ A:

ax = (a, 0, . . .) (0, 1, 0, . . .) = (0, a, 0, . . .) = xa.

De otra parte, nótese que la letra x para el polinomio (0, 1, 0, . . .) puede


ser cambiada por otra. La función del corolario 8.1.4 puede redefinirse de
A en A[x], es decir,
A ↩→ A[x] ↩→ A[[x]]. (2.1)
Notemos que cada elemento a = (ai ) ∈ A[[x]] puede escribirse como
una serie a = a((x)) = ∞ i
Í
i=0 ai x , y las operaciones que hemos definido
en A[[x]] corresponden a la suma y producto de series que se estudian en
los cursos de cálculo. Por esta razón, A[[x]] se conoce también como el
anillo de series formales en A.
(ii) Los anillos de series y polinomios en varias variables se pueden de-
finir en forma recurrente de la siguiente manera:

A[[x, y]] := A[[x]] [[y]] ,


A[[x1 , . . . , xn ]] := A[[x1 , . . . , xn−1 ]] [[xn ]] ,
A[x, y] := A[x] [y],
A[x1 , . . . , xn ] := A[x1 , . . . , xn−1 ] [xn ].
Polinomios y series · 97

Concluimos esta sección con la propiedad universal del anillo de polino-


mios.
Teorema 8.2.5 (Propiedad universal del anillo de polinomios) . Sea A0
un anillo y g : A −→ A0 un homomorfismo de anillos tales que existe y ∈ A0 que
satisface yg (a) = g (a)y para cada a ∈ A. Entonces, existe un único homomorfismo
de anillos g : A[x] −→ A0 tal que g (x) = y, y además g (a) = g (a), para cada
a ∈ A, es decir, el siguiente diagrama es conmutativo:
𝜄 - A[x]
A
pp
pp p
g
p p
pp
?
g

A0

donde 𝜄 es la inclusión de A en A[x].


Demostración. Cada elemento a(x) ∈ A[x] se puede representar de manera
única en la forma a(x) = a0 + a1 x + · · · + an x n , entonces definimos
g (a(x)) := g (a0 ) + g (a1 )y + · · · + g (an )y n .
Es claro que g es aditiva y g (1) = 1. Teniendo en cuenta que g es aditiva,
para probar que g es multiplicativa basta observar que para k, l ≥ 0 y ak , bl ∈
A,
g (ak x k bl x l ) = g (ak bl x k+l ) = g (ak bl )y k+l = g (ak )y k g (bl )y l = g (ak x k )g (bl x l ).
Es claro que g (x) = y y gl = g. Sea h : A[x] −→ A0 otro homomorfismo
que cumple las dos condiciones anteriores, entonces h(a(x)) = g (a(x)) para
cada polinomio a(x) ∈ A[x], es decir, h = g. ✓

3. Propiedades elementales
Proposición 8.3.1. Sea A un anillo cualquiera. Entonces,
(i) Dados dos polinomios no nulos a(x).b(x) ∈ A[x] tales que a(x) +b(x) ≠ 0,
se cumple que:
gr(a(x) + b(x)) ≤ máx{gr(a(x)), gr(b(x))}.
Si a(x)b(x) ≠ 0, se tiene también que
gr(a(x)b(x)) ≤ gr(a(x)) + gr(b(x)).
Si A no tiene divisores de cero, entonces en la última relación se cumple la
igualdad.
98 · Polinomios y series

(ii) A es un dominio si, y sólo si, A[[x]] es un dominio si, y sólo si, A[x] es un
dominio.

(iii) Si A es un dominio, A[x] ∗ = A∗ .

(iv) A[[x]] ∗ = {a = (a0 , a1 , . . .) | a0 ∈ A∗ }.


Demostración. (i) Basta repetir las ideas expuestas en la prueba de la proposi-
ción 8.2.3. Sean n = gr(a(x)) y m = gr(b(x)), entonces para i > máx{m, n},
ai + bi = 0, con lo cual se establece la primera desigualdad. Análogamente,
Í
para i > m + n, di = 0, con d = (di ) = ab, di = j+k=i a j bk . Con esto se
prueba la segunda desigualdad. Nótese que si A no posee divisores de cero,
entonces dn+m = an bm ≠ 0, con lo cual queda probado el punto (i).
(ii) Sean a = (a0 , a1 , . . .) y b = (b0 , b1 , . . .), sucesiones no nulas de
A[[x]]. Sea r el menor entero tal que ar ≠ 0 y sea s el menor entero tal que
bs ≠ 0. Sea c = (ci ) = ab, entonces
∑︁
cr+s = a j bk = ar bs ≠ 0,
j+k=r+s

es decir, ab ≠ 0. Es claro que si A[[x]] no tiene divisores de cero, entonces


A[x] tampoco tiene divisores de cero, por ser subanillo. De igual manera,
si A[x] no tiene divisores de cero, entonces A no posee divisores de cero ya
que A está sumergido en A[x].
(iii) Sea a(x) = a0 + a1 x + . . . + an x n ∈ A[x] ∗ . Entonces, existe un
polinomio
b(x) = b0 + b1 x + · · · + bm x m ∈ A[x]
tal que a(x)b(x) = 1. Del punto (i) resulta que gr(a(x)) = 0 = gr(b(x)),
con lo cual a(x) = a0 , b(x) = b0 , a0 b0 = 1 = b0 a0 , teniendo en cuenta la
observación 8.2.4, podemos decir que a(x) ∈ A∗ . Ahora, si a ∈ A∗ , entonces
a, considerado como polinomio constante, está en A[x] ∗ .
(iv) Sea a = (a0 , a1 , . . .) ∈ A[[x]] ∗ , existe b = (b0 , b1 , . . .) ∈ A[[x]]
tal que ab = 1 = (1, 0, 0, . . .) = ba, luego a0 b0 = 1 = b0 a0 y a0 ∈ A∗ .
Recíprocamente, sea a = (a0 , a1 , . . .), con a0 ∈ A∗ . Buscamos un elemento
b = (b0 , b1 , . . .) ∈ A[[x]] tal que ab = 1 = (1, 0, 0, . . .) = ba. La condición
ab = 1 puede expresarse también en la forma
(
1, si i = 0,
a0 bi + a1 bi−1 + · · · + ai b0 = (3.1)
0, si i ≥ 1.

Puesto que a0 ∈ A∗ , definimos

b0 := a0−1 . (3.2)
Polinomios y series · 99

El elemento b1 debe ser tal que a0 b1 + a1 b0 = 0, con lo cual

b0 a0 b1 + b0 a1 b0 = 0, es decir, b1 = −b0 a1 b0 .

Un paso más antes de obtener la fórmula para calcular bi . Para i = 2, tene-


mos
a0 b2 + a1 b1 + a2 b0 = 0,
luego
b2 = −b0 (a1 b1 + a2 b0 ).
Teniendo ya definidos todos los bl , l < i, hacemos
i
∑︁
bi := −b0 a j bi− j , i ≥ 1. (3.3)
j=1

Entonces, a0 bi + ij=1 a j bi− j = 0, es decir, ij=1 a j bi− j = 0 para i ≥ 1. Por lo


Í Í

tanto, la sucesión definida por (3.2) y (3.3) cumple (3.1) , y a tiene inverso
a la derecha. En forma similar se puede construir una sucesión c tal que
ca = 1, es decir, a ∈ A[[x]] ∗ . ✓

Ejemplo 8.3.2. Según el punto (iii) de la proposición anterior, el polino-


mio 2x + 1 ∈ ℤ[x] no es invertible. Sin embargo, considerado como ele-
mento de ℤ[[x]],
2x + 1 = (1, 2, 0, . . .)
es invertible y su inverso es

b = (1, −2, 4, −8, . . .), es decir, bi = (−2) i , i ≥ 0.

Ejemplo 8.3.3. El polinomio 2x + 1 ∈ ℤ4 [x] es invertible:

(2x + 1)(2x + 1) = 4x 2 + 4x + 1 = 1.

Es claro que como elemento de ℤ4 [[x]] su inverso sigue siendo 2x + 1.

Ejemplo 8.3.4. El polinomio x + 2 no es invertible en ninguno de los si-


guientes anillos:

ℤ[x] , ℤ[[x]] , ℤ4 [x] , ℤ4 [[x]].

Ejemplo 8.3.5. Sea R un anillo conmutativo. En este ejemplo describire-


mos todos los ideales maximales del anillo R [[x]] y probaremos que R [[x]]
es local si, y sólo si, R es local.
100 · Polinomios y series

Existe una correspondencia biyectiva entre los ideales maximales de


R[[x]] y los maximales de R de tal manera que los ideales maximales de
R[[x]] son de la forma

P ′ = {(ai ) | a0 ∈ P , P maximal de R} = ⟨P , x⟩ = P + xR[[x]].

En efecto, veamos en primer lugar que si P es maximal de R, entonces P ′ es


un ideal maximal de R [[x]]. Claramente, P ′ es ideal propio de R [[x]]. Sea
L un ideal de R [[x]] tal que P ′ ⊊ L, luego existe (bi ) ∈ L tal que (bi ) ∉ P ′;
b0 ∉ P , ya que de lo contrario (bi ) ∈ P ′. Resulta, P + ⟨b0 ⟩ = R, luego
1 = p + b0 r, con r ∈ R, p ∈ P, y así,

1 − (bi )r = (1 − b0 r , −b1 r , −b2 r , . . . ) = (p, −b1 r , −b2 r , . . . ) ∈ P ′ ⊆ L,

pero como (bi )r ∈ L, entonces 1 ∈ L, por lo tanto L = R [[x]].


Sea ahora P ′ un ideal maximal de R[[x]]. Definimos

P := {a0 ∈ R | a0 es el término constante de algún (ai ) ∈ P ′ }.

P es claramente un ideal de R. Además, es propio ya que de lo contrario P ′


contendría invertibles, en contradicción con el hecho de que P ′ es propio.
P es maximal: sea Q ideal de R tal que P ⊊ Q, existe q ∈ Q tal que q ∉ P,
entonces (q, 0, . . . ) ∉ P ′, de donde P ′ + ⟨(q, 0, . . . )⟩ = R [[x]], luego

1 = p ′ + (q, 0, . . . ) (bi ) = (p0′ , p1′ , . . . ) + (qb0 , qb1 , qb2 , . . . )


= (p0′ + qb0 , p1′ + qb1 , . . . ).

Por lo tanto, 1 = p0′ + qb0 , pero p0′ ∈ P ⊊ Q, de donde, 1 ∈ Q, es decir,


Q = R.
Veamos ahora que P ′ = ⟨P , x⟩. En efecto, si (bi ) ∈ P ′, entonces b0 ∈ P
y (bi ) = (b0 , 0, . . . ) + (0, b1 , b2 , . . . ) = b0 + x(b1 , b2 , b3 , . . . ) ∈ ⟨P , x⟩, es
decir, P ′ ⊆ ⟨P , x⟩, pero como P ′ es maximal y ⟨P , x⟩ es propio, entonces
P ′ = ⟨P , x⟩.
Hemos ya probado que la correspondencia P ↦−→ P ′ es sobreyectiva. Pa-
ra terminar, veamos que esta correspondencia es 1 − 1: si ⟨P1 , x⟩ = ⟨P2 , x⟩,
entonces dado a ∈ P1 se tiene que a = b + (ci )x, con b ∈ P2 , luego a = b y
a ∈ P2 , es decir, P1 ⊆ P2 . Simétricamente, P2 ⊆ P1 .
La correspondencia anterior garantiza que R es local si, y sólo si, R [[x]]
es local. Además, notemos que si R es local con ideal maximal J , entonces

R/ J  R[[x]]/⟨ J , x⟩.
Polinomios y series · 101

Ejemplo 8.3.6. ℤ es un DIP pero ℤ[x] no lo es: supóngamos que existe


un polinomio p(x) ∈ ℤ[x] tal que ⟨3, x⟩ = ⟨p(x)⟩. Entonces, 3 = q(x)p(x),
para algún polinomio q(x) con coeficientes enteros. Teniendo en cuenta
el grado resulta que p(x) = ±1, ±3. Se obtendría que ⟨3, x⟩ = ℤ[x], o,
⟨3, x⟩ = ⟨3⟩. En el primer caso existirían k(x), m(x) ∈ ℤ[x] tales que:

1 = 3k(x) + xm(x),

de donde 1 = 3k0 con k0 ∈ ℤ, resultando una contradicción. En el segundo


caso x = 3a(x), a(x) ∈ ℤ[x], lo cual también es imposible. Así, ⟨3, x⟩ no es
principal.

De lo probado se desprende que aunque ℤ es un DIP el anillos de poli-


nomios ℤ[x] no lo es.

Proposición 8.3.7. Si 𝕂 es un cuerpo entonces 𝕂 [x] es un DE.

Demostración. Según la parte (ii) de la proposición 8.3.1, 𝕂 [x] es un DI.


Escogemos la función d como la función de grado:

gr : 𝕂 [x] − {0} −→ ℕ ∪ {0}


p(x) ↦−→ gr(p(x)).

Sean a(x) y b(x) polinomios no nulos de 𝕂 [x]. Como gr(b(x)) ≥ 0, enton-


ces

gr(a(x)) + gr(b(x)) ≥ gr(a(x)), es decir, gr(a(x)b(x)) ≥ gr(a(x)),

y la primera condición para la función gr se satisface. Sean ahora a(x) y


b(x) polinomios cualesquiera, con b(x) ≠ 0 y gr(b(x)) = m. Consideramos
dos casos:
Caso 1. Si m = 0, entonces, b(x) es constante no nulo, b(x) = b0 . Si

a(x) = a0 + a1 x + · · · + an x n ,

hacemos q(x) = a0 b0−1 + a1 b0−1 x + · · · + an b0−1 x n y r (x) = 0, y obtenemos la


relación
a(x) = b(x)q(x) + r (x). (3.4)
Caso 2. Si m > 0, sea M := {a(x) − b(x)m(x) | m(x) ∈ 𝕂 [x]}. Si
existe m(x) ∈ 𝕂 [x] tal que a(x) − b(x)m(x) = 0, entonces (3.4) se cum-
ple con q(x) = m(x) y r (x) = 0. Supóngase que para cada m(x) ∈ 𝕂 [x],
a(x) − b(x)m(x) ≠ 0. Sea r (x) ∈ M un polinomio que tenga grado mínimo
t en M, t ≥ 0, sea q(x) un polinomio a través del cual se obtuvo r (x), es
102 · Polinomios y series

decir, r (x) = a(x) − b(x)q(x). Si t = 0, entonces no hay nada que probar.


Sea t > 0 y supongamos que t ≥ m. Sean r (x) = r0 + r1 x + · · · + rt x t y
b(x) = b0 + b1 x + · · · + bm x m , entonces

s(x) = a(x) − b(x) (q(x) + rt bm−1 x t−m ) ∈ M ,

con gr(s(x)) ≤ gr(r (x)) = t. Pero lo anterior contradice la escogencia de


r (x), así t ≤ m y la proposición está probada. ✓

4. Teorema de Gauss
Podemos preguntarnos si el anillo de polinomios sobre un DG tiene tam-
bién esta propiedad. La respuesta es afirmativa y nos proponemos demos-
trarlo siguiendo las elegantes ideas expuestas en [2].
Sea R un anillo conmutativo cualquiera y S un subconjunto multiplica-
tivo de R. Nótese que S puede considerarse también como un subconjunto
multiplicativo de R [x]. Se obtiene entonces el siguiente resultado:

Proposición 8.4.1. Sean R un anillo conmutativo y S un subconjunto multipli-


cativo de R. Entonces,
R [x]S −1  (RS −1 ) [x].

Demostración. Sea a(x) = a0 + a1 x + · · · + an x n un polinomio cualquiera de


R[x] y sea g la función definida por

g : R[x] −→ (RS −1 ) [x]


a0 a1 an
a(x) ↦−→ + x + · · · + xn .
1 1 1
Es fácil verificar que g es un homomorfismo de anillos que satisface las con-
diciones del teorema 7.1.9, de donde resulta el isomorfismo postulado. □ ✓

Sean ahora R un DI, P el conjunto de todos los elementos primos de R


y S definido por

S := {1} ∪ {a1 · · · an | ai ∈ P , 1 ≤ i ≤ n, n ≥ 1}, (4.1)

es decir, S es el subconjunto conformado por 1 y todos los productos finitos


de elementos primos de R. Nótese que S es un sistema multiplicativo de R.

Proposición 8.4.2. Sean R un DI y S definido como en (4.1) . Entonces,

R es un DG si, y sólo si, RS −1 es un cuerpo.


Polinomios y series · 103

a
Demostración. ⇒): sea s un elemento no nulo de RS −1 , luego a ≠ 0; si
a ∈ R ∗ , entonces
a a −1 s 1 a
= y ∈ (RS −1 ) ∗ .
s 1 1 s
Supongamos que a ∉ R ∗ . Entonces, a es producto finito de irreducibles de
R:
a = a1 · · · an , ai irreducible, 1 ≤ i ≤ n.
De la proposición 6.2.7 se desprende fácilmente que en un DG cada irre-
ducible es primo. Por lo tanto, a ∈ S y as as = 11 , con lo cual as ∈ (RS −1 ) ∗ .
⇐): asumamos que R no es un DG, entonces existe un elemento nu-
lo y no invertible a de R tal que a no es un producto finito de primos, es
decir, a ∉ S. De aquí ⟨a⟩ ∩ S = ∅. En efecto, sea ba ∈ ⟨a⟩; supongamos
que ba = p1 · · · pn es producto finito de primos, entonces a sería también
producto finito de primos, contradiciendo el hecho que a ∉ S. La prueba de
esta afirmación se realiza por inducción sobre n: si p1 es primo y ba = p1 ,
entonces, por ser p1 irreducible y a ∉ R ∗ , se tiene que a ∼ p1 , es decir, a es
primo. Suponemos el enunciado válido para una descomposición en n − 1
primos y sea ba = p1 · · · pn , con p1 , . . . , pn primos. Resulta, ba = ⟨p1 ⟩, con
lo cual b ∈ ⟨p1 ⟩, o, a ∈ ⟨p1 ⟩. En el primer caso

b = b1 p 1 , b1 ∈ R y b1 a = p 2 . . . p n ,

de donde por inducción a es producto finito de primos. En el segundo caso

a = a1 p1 , a1 ∈ R y ba1 = p2 · · · pn ,

y otra vez por inducción a1 es producto finito de primos, con lo cual a es


también producto finito de primos.

la prueba. Teniendo en cuenta que ⟨a⟩ ∩ S = ∅ y
Podemos ya terminar
que a ≠ 0, entonces 1a es un ideal propio no nulo de RS −1 , es decir, RS −1
no es un cuerpo. ✓

Sea R un DI, P el conjunto de todos los elementos primos de R, P ′


cualquier subconjunto no vacío de P y

M := {1} ∪ {a1 . . . an | ai ∈ P ′ , 1 ≤ i ≤ n, n ≥ 1}, (4.2)

es decir, M es el subconjunto formado por 1 y todos los productos finitos


de elementos primos de P ′.
Proposición 8.4.3. Sea R un DI tal que cada cadena ascendente de ideales prin-
cipales se detiene (véase la prueba del teorema 6.2.9). Sea M definido como en (4.2) .
Si RM −1 es un DG, R también lo es.
104 · Polinomios y series

Demostración. Sea S definido como en (4.1) y sea T generado por 11 y to-


dos los primos de RM −1 . Según la proposición 8.4.2, 𝕂 := (RM −1 )T −1 es
un cuerpo. Si probamos que RS −1  𝕂, entonces de la proposición 8.4.2
concluímos que R es un DG, y la proposición estaría probada.
Consideremos la función

g : R −→ 𝕂
a
1
a ↦−→ 1
.
1

Evidentemente g es un homomorfismo de anillos. Veamos que g cumple


las condiciones del teorema 7.1.9:
(i) g (S) ⊆ 𝕂 ∗ . Sea s ∈ S; si s = 1, no hay nada que probar; si s incluye
sólo primos de P ′, entonces s ∈ M, con lo cual 1s ∈ (RM −1 ) ∗ y g (s) ∈ 𝕂 ∗ .
Supongamos que s es de la forma s = ms ′, con m ∈ M y tal que s ′ no incluye
primos de P ′. Puesto que g (s) = g (m) g (s ′), entonces se debe probar que
g (s ′) ∈ 𝕂 ∗ . Es suficiente probar que g (p) ∈ 𝕂 ∗ para cada primo p ∉ P ′ (ya
que s ′ es producto finito de tales primos). Si ⟨p⟩ ∩ M ≠ ∅, entonces existe
a ∈ R tal que ap ∈ M y ap −1 ∗ p
1 ∈ (RM ) . De aquí se sigue que 1 ∈ (RM )
−1 ∗

y g (p) ∈ 𝕂 ∗ . Si
por el contrario ⟨p⟩ ∩ M = ∅, entonces, de acuerdo con el
ejemplo 7.2.5, 1p es un ideal primo de RM −1 , es decir, 1p ∈ T , con lo cual
g (p) ∈ 𝕂 ∗ .
(ii) Sea, por otra parte, a ∈ R tal que g (a) = 0. Existe mn ∈ T tal que
am 0 m
1 n = 1 , de donde amu = 0 para cierto u ∈ M. n es producto de primos de
RM :−1
m r1 ri rj
= · · · , con primo de RM −1 , 1 ≤ j ≤ i.
n s1 si sj
Por la última igualdad, existe t ∈ M tal que

ms1 · · · si t = nr1 . . . ri t.

Nótese que u, t, n ∈ M ⊆ S. Obtenemos que

amus1 · · · si t = a(nr1 · · · ri t) = 0.
rj sj
Queremos probar que r1 , . . . , ri ∈ S. Como sj es primo y 1 ∈ (RM −1 ) ∗ ,
r
entonces 1j es primo; reducimos la prueba a la verificación de la siguiente
afirmación: sea r ∈ R tal que 1r es primo en RM −1 , entonces

r r ∈ S. Supon-
gamos contrariamente que existe un r ∈ R, r ∉ S, tal que 1 es primo en
RM −1 ; sea
n Dr E o
C := ⟨r⟩ ⊆ R | r ∉ S, es primo en RM −1 .
1
Polinomios y series · 105

Según lo supuesto, C es una colección no vacía de ideales principales. Por


la hipótesis de la proposición,

r0 C contiene un elemento maximal ⟨r0 ⟩. Por
la construcción

r0 de C, 1 es un ideal primo en RM −1 . Según el ejemplo
7.2.5, 1 = IM −1 , con I ideal primo de R e I ∩ M = ∅. Veamos que
I = ⟨r0 ⟩. Por el ejemplo 7.2.4,
n a D r0 Eo
I= a∈R| ∈ .
1 1
Evidentemente ⟨r0 ⟩ ⊆ I. Sea a ∈ I; 1a = mb r10 , con b ∈ R y m ∈ M. Existe
m ′ ∈ M tal que amm ′ = bm ′r0 . Como R es un DI, entonces am = br0 y así
m | br0 . m es un producto finito de primos de P ′, o, m = 1. En el último
caso, a ∈ ⟨r0 ⟩. Consideremos el primer caso:
m = p1 · · · pn , p j primo de P ′ , 1 ≤ j ≤ n y br0 = p1 · · · pn l , con l ∈ R.
Supongamos que algún p j | r0 , entonces r0 = p j w, con w ∈ R.D Obsérvese
E
que w ∉ S, ya que de lo contrario r0 ∈ S. También, w1 = rp0j = r10


por estar p j ∈ M. Así, w1 es primo. Se sigue entonces que ⟨w⟩ ∈ C y



⟨r0 ⟩ ⊆ ⟨w⟩; por la escogencia de ⟨r0 ⟩ se tiene que ⟨r0 ⟩ = ⟨w⟩, es decir,
w = r0v, con v ∈ R. Resulta r0 = r0 p j v, 1 = p j v, en contradicción con el
hecho que p j es primo (r0 ≠ 0 ya que r10 es primo no nulo de RM −1 ).
Así, p j no divide a r0 , para cada 1 ≤ j ≤ n, con lo cual p j | b, para cada
1 ≤ j ≤ n. Esto, junto con am = br0 , da que a ∈ ⟨r0 ⟩, completando la
prueba de ⟨r0 ⟩ = I. Se tiene entonces que r0 es primo de R, contradiciendo
el hecho que r0 ∉ S. Hemos completado la prueba de la condición (ii).
(iii) Sea xz un elemento cualquiera de 𝕂. Entonces, x ∈ RM −1 y z ∈ T ;
x y z son de la forma
a r1 rj
x= yz= ··· ,
m s1 sj
rj
con a ∈ R, m ∈ M ⊆ S y sj primo de RM −1 , 1 ≤ j ≤ i. Así,
a a 1 a 1 1 a 1 1 1
x m m 1 1m 1 1 m 1 1
= r1 ...r j = 1 r1 ...r j
= 1 r1 ...r j 1
= 1 1 r1 ...r j 1
.
z s1 ...s j 1 s1 ...s j 1 1 s1 ...s j 1 1 1 s1 ...s j

Razonando como en (ii), vemos que r1 · · · r j ∈ S. De aquí resulta


x
= g (a) g (m) −1 g (r1 · · · r j ) −1 g (s1 · · · s j ),
z
es decir,
x
= g (as1 · · · s j ) g (mr1 · · · r j ) −1 ,
z
con as1 . . . s j ∈ R, mr1 . . . r j ∈ S. En consecuencia, la proposición está pro-
bada. ✓

106 · Polinomios y series

Proposición 8.4.4. Si R es un DI tal que cada cadena ascendente de ideales


principales se detiene, entonces R [x] tiene también dicha propiedad.

Demostración. Consideremos en R[x] la cadena ascendente de ideales prin-


cipales
⟨a1 (x)⟩ ⊆ ⟨a2 (x)⟩ ⊆ · · · ⊆ ⟨an (x)⟩ ⊆ · · · .
Puesto que ai+1 (x) | ai (x), i ≥ 1, entonces resulta la cadena descendente de
enteros no negativos

gr(a1 (x)) ≥ gr(a2 (x)) ≥ · · · ≥ gr(an (x)) ≥ · · · ,

la cual necesariamente se detiene. Sea n tal que

gr(ai (x)) = gr(an (x)), para todo i ≥ n.

Denotando por ai el coeficiente principal del polinomio ai (x), entonces re-


sulta en R la cadena ascendente de ideales principales,

⟨an ⟩ ⊆ ⟨an+1 ⟩ ⊆ · · · ⊆ ⟨an+m ⟩ ⊆ · · · .

Por la hipótesis de la afirmación existe un entero positivo m tal que

⟨an+i ⟩ = ⟨an+m ⟩, para todo i ≥ m.

Si i ≥ m, como ⟨an+m (x)⟩ ⊆ ⟨an+i (x)⟩, entonces an+m (x) = an+i (x)bi , con
bi ∈ R. Resulta an+m = an+i bi , lo cual combinado con ⟨an+i ⟩ = ⟨an+m ⟩ da que
bi ∈ R ∗ , luego
⟨an+m (x)⟩ = ⟨an+i (x)⟩,
completando la prueba de la proposición. ✓

Tenemos ya todas las herramientas para probar el siguiente teorema.

Teorema 8.4.5 (Teorema de Gauss) . R es un DG si, y sólo si, R[x] es un DG.

Demostración. ⇒): mostremos inicialmente que cada primo de R es primo


en R[x]. Sea a un elemento primo de R, y sea ⟨a⟩ el ideal principal de R ge-
nerado por a. Entonces, R/⟨a⟩ es un DI, con lo cual el anillo de polinomios
(R/⟨a⟩) [x] también lo es. De otra parte, la correspondencia

f
R[x] −→ (R/⟨a⟩) [x]
a0 + a1 x + · · · + an x ↦−→ a0 + a1 x + · · · + an x n
n
Polinomios y series · 107

con ai = ai + ⟨a⟩, 1 ≤ i ≤ n, es un homomorfismo sobreyectivo de anillos


con núcleo
{ah(x) | h(x) ∈ R[x]},
es decir, el núcleo de f es el ideal principal de R [x] generado por el elemen-
to a, de lo cual se desprende que este último ideal es primo y a es elemento
primo de R[x].
Sea ahora S en R definido como en (4.1) . Entonces, S es un sistema mul-
tiplicativo de R [x]. De otra parte, según la proposición 8.4.2, RS −1 es un
cuerpo, con lo cual RS −1 [x] es un DG. Por la proposición 8.4.1, R [x]S −1
es un DG. Para aplicar la proposición 8.4.3, y concluir la prueba, necesita-
mos mostrar que en R[x] cada cadena ascendente de ideales principales se
detiene. Según la proposición 8.4.4 es suficiente probar esto para R. Sea

⟨a1 ⟩ ⊆ ⟨a2 ⟩ ⊆ · · · ⊆ ⟨an ⟩ ⊆ · · ·

una cadena de ideales principales de R. Podemos suponer sin pérdida de


generalidad que ai ≠ 0, ai ∉ R ∗ para cada i ≥ 1. Sea n(ai ), i ≥ 1, el número
de factores irreducibles en la descomposición de ai . Puesto que ai+1 | ai ,
para cada i ≥ 1, entonces

n(a1 ) ≥ n(a2 ) ≥ · · · ≥ n(an ) ≥ · · ·

es una sucesión de enteros positivos que debe, por lo tanto, detenerse. Existe
j entero positivo tal que n(a j+1 ) = n(a j ), para cada i ≥ 1. Nuevamente,
como a j+1 | a j , entonces las descomposiciones irreducibles de a j+1 y a j
coinciden salvo en un invertible, es decir, ⟨a j+1 ⟩ = ⟨a j ⟩, i ≥ 1.
⇐): esta implicación es evidente si se tiene en cuenta el grado de los
polinomios y que R esta sumergido en R[x]. ✓

Ejemplo 8.4.6. ℤ[x], ℚ[x], ℝ[x] y ℂ[x] son dominios gaussianos. Nótese
que según el ejemplo 8.3.6, ℤ[x], es un DG, pero no es un DIP. El teorema
8.4.5 y el presente ejemplo permiten plantear la siguiente pregunta: si R es
un DI, ¿bajo qué condición (necesaria y suficiente) el anillo de polinomios
R[x] es un DIP?. La proposición 8.3.7 da una condición suficiente: si 𝕂
es un cuerpo, 𝕂 [x] es un DE, y por tanto, un DIP. Veamos que ésta a su
vez es una condición necesaria. Sea a un elemento no nulo de R. Entonces,
existe p(x) ∈ R[x] tal que ⟨a, x⟩ = ⟨p(x)⟩. Por condiciones de grado, p(x)
es una constante invertible. Existen entonces polinomios b(x) y c(x) tales
que 1 = ab(x) + xc(x), esto implica que a ∈ R ∗ . Así hemos probado que, si
R es un DI, se tiene que:

R[x] es un DE si, y sólo si, R [x] es un DIP si, y sólo si, R es un cuerpo.
108 · Polinomios y series

5. Ejercicios
1. Sea A un anillo arbitrario. Calcule el centro del anillo de polinomios
A[x].

2. Sea R un DI con cuerpo de fracciones 𝕂. Demuestre que el cuerpo


de fracciones de R [x] es isomorfo al cuerpo de fracciones de 𝕂 [x].

3. Sea 𝕂 un cuerpo y f (x) ∈ 𝕂 [x] un polinomio de grado n ≥ 0. De-


muestre que f (x) tiene a lo sumo n raíces en 𝕂, es decir, existen a lo
sumo n elementos distintos a1 , . . . , an ∈ 𝕂 tales que f (ai ) = 0, para
1 ≤ i ≤ n. Además, demuestre que para cada raíz a ∈ 𝕂 se tiene que
x − a divide f (x).

4. Sea R un anillo conmutativo. En el anillo de polinomios R[x, y], de-


muestre que ⟨x + y, x⟩ = ⟨x, y⟩ = ⟨x + xy, x 2 , y 2 , y + xy⟩.

5. Sea 𝕂 un cuerpo y sean a, b ∈ 𝕂. Demuestre que ⟨x − a, y − b⟩ es un


ideal maximal de 𝕂 [x, y].

6. Sea R un anillo conmutativo y sean I y J dos ideales de R[x1 , . . . , xn ].


Sea y una nueva variable. Demuestre que

I ∩ J = ⟨yI , (1 − y) J ⟩ ∩ R [x1 , . . . , xn ].

7. Sea A un anillo. Demuestre que A[x1 , . . . , xn ] es un DIP si, y sólo si,


n = 1 y A es un cuerpo.

8. Sea A un anillo. Demuestre que A[[x1 , . . . , xn ]] es un DIP si, y sólo


si, n = 1 y A es un cuerpo.

9. Sean 𝕂 un cuerpo y f : 𝕂 [x] −→ 𝕂 [x] un automorfismo del anillo


de polinomios 𝕂 [x] tal que la restricción de f a 𝕂 es la idéntica. De-
muestre que existen elementos a, b ∈ 𝕂, a ≠ 0 tales que f (x) = ax +b.

10. Sea A un anillo. Demuestre que Mn (A[x])  Mn (A) [x], para cada
n ≥ 1.

11. Sea A un anillo. Demuestre que Mn (A[[x]])  Mn (A) [[x]], para


cada n ≥ 1.
· 1

Cuaderno III

Módulos
Dedicado a Andreita, mi hija
Presentación

Los grupos abelianos, las álgebras asociativas y los espacios vectoriales pue-
den ser considerados como estructuras particulares de la teoría general de
módulos. Aunque históricamente las tres estructuras mencionadas prece-
dieron a la teoría de módulos sobre anillos, esta última las generaliza y les
sirve de soporte teórico. Para señalar solo un caso, en los últimos años se ha
estudiado con bastante intensidad el álgebra lineal sobre anillos, la cual se
fundamenta primordialmente en la teoría de módulos sobre anillos conmu-
tativos (véase por ejemplo [33]). El propósito de este cuaderno es presentar
los conceptos y resultados elementales concernientes a módulos sobre ani-
llos arbitrarios. Se destacan especialmente los teoremas de homomorfismo,
correspondencia e isomorfismo. El lema 4.1.3 (lema de Schur) describe los
anillos de endomorfismos de módulos simples. En el capítulo 7 se caracte-
rizan los módulos libres como sumas directas externas de copias del anillo
A (teorema 7.2.5), o bien, a través de funciones extendibles de manera úni-
ca a homomorfismos (teorema 7.3.1). El estudio detallado de los módulos
finitamente generados sobre dominios de ideales principales se realiza en
el último capítulo. Esto permite probar en forma rigurosa el teorema de
estructura de los grupos abelianos finitamente generados, y con el teorema
5.3.6, calcular su grupo de endomorfismos.
Hemos procurado presentar una gran variedad de ejemplos que comple-
mentan la teoría. En particular, se destacan Rp∞ y ℚℤ . El primero corres-
ponde a un módulo irreducible no cíclico pero en el cual todos sus submó-
dulos propios son cíclicos; el segundo es también un módulo irreducible,
pero sin submódulos maximales ni minimales.
Otras fuentes fuertemente recomendadas a los lectores para comple-
mentar los temas aquí tratados son [17], [19] y [20].
La teoría de módulos que desarrollaremos en el presente cuaderno, y que
usaremos posteriormente en otros cuadernos de la colección, se hará por el
lado derecho, es decir, salvo que se advierta lo contrario, todo módulo será
con escalares a derecha. Los anillos aquí considerados son asociativos, con
unidad, pero no necesariamente conmutativos. Si f es un homomorfismo
de anillos, entonces f (1) = 1. Salvo que se advierta lo contrario, un anillo
ii · Presentación

arbitrario será denotado con la letra A, un anillo conmutativo por R y un


dominio de integridad mediante la letra D. Para n ≥ 1, Mn (A) es el anillo
de matrices cuadradas de tamaño n × n y GLn (A) denota el grupo lineal
general de orden n sobre A. En denotará la matriz idéntica de tamaño n × n.
Capítulo
uno
Módulos,
submódulos y
cocientes
Módulos, submódulos y cocientes · 3

En este primer capítulo presentamos la noción de módulo sobre un anillo,


la cual será ilustrada con una cantidad suficiente de ejemplos. Veremos que
los grupos abelianos y los espacios vectoriales son casos particulares de esta
estructura algebraica. Se introducirán, además, los conceptos de bimódulo
y álgebra asociativa sobre un anillo conmutativo.

1. Definición y ejemplos
Definición 1.1.1. Sean (M , +) un grupo abeliano y (A, +, ·, 1) un anillo.
Se dice que M tiene una estructura de módulo a la derecha sobre el anillo
A si se ha definido un producto a derecha entre elementos de M y de A, es
decir, una función

M × A −→ M
(m, a) ↦−→ m · a

para la cual se cumplen las siguientes condiciones:

(i) (m1 + m2 ) · a = m1 · a + m2 · a

(ii) m · (a1 + a2 ) = m · a1 + m · a2

(iii) m · (a1 a2 ) = (m · a1 ) · a2

(iv) m · 1 = m

con m, m1 , m2 ∈ M y a, a1 , a2 ∈ A.

De manera similar se definen los módulos a izquierda sobre el anillo A,


de tal manera que se puede desarrollar toda la teoría de módulos trabajando
a izquierda. En adelante, si no se advierte lo contrario, la palabra módulo
denotará módulo a la derecha. Un módulo a la derecha sobre A será de-
notado por MA , o simplemente por M si es claro el anillo sobre el cual se
define la estructura de módulo. También se dirá que M es un A-módulo.
Tanto el elemento nulo del grupo (M , +) como el elemento nulo del anillo
(A, +, ·, 1) serán denotados por 0. Siguiendo la terminología usada en es-
pacios vectoriales, los elementos del grupo M se denominan vectores y los
del anillo A escalares.
4 · Módulos, submódulos y cocientes

Ejemplo 1.1.2. Sea (M , +, 0) un grupo abeliano. Los múltiplos enteros de


elementos de M se definen inductivamente:
m · 1 := m 




m · k := m · (k − 1) + m, k ≥ 2 


m ∈ M , k ∈ ℤ+ ;
m · 0 := 0 



m · (−k) := (−m) · k



Es fácil probar que M es un ℤ-módulo; en otras palabras, cada grupo abe-
liano es un ℤ-módulo.
Ejemplo 1.1.3. Cada grupo abeliano (M , +) es módulo a la izquierda sobre
su anillo de endomorfismos, End(M), respecto a la siguiente operación:
f · m := f (m), m ∈ M , f ∈ End(M).
Ejemplo 1.1.4. Si T es un anillo de división, entonces cada espacio vecto-
rial sobre T es un T -módulo a izquierda (para los espacios vectoriales los
escalares son dispuestos habitualmente a izquierda). Así, el álgebra lineal
puede ser considerada como una rama particular de la teoría de módulos.
Ejemplo 1.1.5. Sea A un anillo y sea Mn (A) su anillo de matrices cuadradas
de orden n. El producto
a · F := a · [ fi j ] = [a fi j ] , F = [ fi j ] ∈ Mn (A), a ∈ A,
da a Mn (A) estructura de A-módulo a izquierda. En forma análoga se define
la estructura de A-módulo por el lado derecho.
Ejemplo 1.1.6. Sea A un anillo. El anillo de sucesiones formales A [[x]]
(véase [23]) tiene estructura de A-módulo:
(a0 , a1 , a2 , . . .) · a := (a0 a, a1 a, . . .), a ∈ A.
De igual manera, el anillo de polinomios A [x] es un A-módulo:
(a0 + a1 x + · · · + an x n ) · a := a0 a + a1 ax + · · · + an ax n , a ∈ A.
Las estructuras de A-módulo por el lado izquierdo se definen en forma si-
milar.
Ejemplo 1.1.7. Cada anillo A tiene estructuras naturales de A-módulo iz-
quierdo y A-módulo derecho:
a · x := ax, x · a := xa, para cualesquiera a, x ∈ A.
A presenta diferentes propiedades bajo estas dos estructuras, que denotare-
mos por A A y AA , respectivamente.
Módulos, submódulos y cocientes · 5

Ejemplo 1.1.8. Si A es un anillo e I es un ideal derecho de A, entonces el


grupo abeliano cociente A/I tiene una estructura natural de A-módulo:

x · a := xa, donde x =: x + I , con x, a ∈ A.

La estructura izquierda resulta al considerar un ideal izquierdo. Este ejem-


plo será generalizado mediante la definición 1.3.1.

Ejemplo 1.1.9. Si A es un anillo, entonces el grupo aditivo del anillo pro-


ducto An = A × · · · × A, conformado por todos los vectores columna de
longitud n con entradas en A, es un A-módulo con la operación
 a1   a1 a
 ..   . 
   
 .  · a :=  ..  , a ∈ A.
   
 an   an a 
   
El conjunto de vectores fila de longitud n con entradas en A se denota por
A1×n , y tiene estructura natural de A-módulo izquierdo dada por

a · (a1 , . . . , an ) := (aa1 , . . . , aan ), a ∈ A.

En los ejemplos anteriores hemos considerado tanto módulos izquierdos


como derechos. Es por lo tanto oportuno hacer la siguiente aclaración.

Observación 1.1.10. Sea A un anillo. Dado un módulo izquierdo (dere-


cho) M sobre A, no siempre se puede convertir a M en módulo derecho
(izquierdo) con sólo cambiar el lado de la acción de los escalares. En efecto,
sea V el grupo abeliano definido por

V := {e, a, b, ab} con a2 = b 2 = e, ab = ba,

y consideremos las funciones


f g
G −→ G G −→ G
e ↦−→ e e ↦−→ e
a ↦−→ a a ↦−→ b
b ↦−→ ab b ↦−→ a
ab ↦−→ b ab ↦−→ ab

que resultan ser endomorfismos para los cuales se tiene que f ◦ g ≠ g ◦ f .


Sea A = End(V ) su anillo de endomorfismos. Según el ejemplo 1.1.3, el
producto
h · m := h(m), para h ∈ A, m ∈ V ,
6 · Módulos, submódulos y cocientes

convierte a V en A-módulo izquierdo. Definimos

m × h := h · m = h(m), con h ∈ A, m ∈ V .

Nótese que a × ( f g) ≠ (a × f ) × g, con lo cual este producto no da a V una


estructura de A-módulo derecho.
Sin embargo, si R es un anillo conmutativo y M es un R-módulo dere-
cho, entonces el producto

r · m := m · r , para m ∈ M , r ∈ R,

sí convierte a M en un R-módulo izquierdo:

1 · m = m · 1 = m;
(r1 + r2 ) · m = m · (r1 + r2 ) = m · r1 + m · r2
= r1 · m + r2 · m;
(m1 + m2 ) · r = r · (m1 + m2 ) = r · m1 + r · m2
= m1 · r + m2 · r;
(r1 · r2 ) · m = m · (r1 · r2 ) = m · (r2 · r1 ) = (m · r2 ) · r1
= (r2 · m) · r1 = r1 · (r2 · m).

En resumen, la teoría abstracta de módulos se puede desarrollar por la iz-


quierda o por la derecha. Sin embargo, un ejemplo particular de A-módulo
derecho no siempre es un A-módulo izquierdo.

De manera inmediata se tienen las siguientes propiedades elementales.

Proposición 1.1.11. Sea A un anillo y M un A-módulo. Entonces,

(i) Para cada m ∈ M y a ∈ A,

0 · a = 0,
(−m) · a = −(m · a) = m · (−a),
m · 0 = 0,
(−m) · (−a) = m · a.

(ii) Si f : A′ −→ A es un homomorfismo de anillos, entonces el producto

m · a ′ := m · f (a ′), con a ′ ∈ A′ , m ∈ M ,

convierte a M en A′-módulo.
Módulos, submódulos y cocientes · 7

Demostración. La dejamos como ejercicio al lector. ✓


Es posible considerar a ambos lados dos estructuras de módulo sobre un


mismo grupo abeliano.
Definición 1.1.12. Sean A1 y A2 anillos. Se dice que el grupo abeliano M
es un A1 -A2 -bimódulo si:
(i) M es un A1 -módulo izquierdo,

(ii) M es un A2 -módulo derecho,

(iii) (a · m) · b = a · (m · b), para cualesquiera a ∈ A1 , b ∈ A2 , m ∈ M.


Ejemplo 1.1.13. Todo grupo abeliano M es un End(M)-ℤ-bimódulo:

f · (m · k) = f (m · k) = f (m + · · · + m) = f (m) + · · · + f (m)
= f (m) · k = ( f · m) · k

para todo f ∈ End(M), m ∈ M, k ∈ ℤ+ . Para k = 0, ó, (−k) ∈ ℤ+ , se


establece análogamente que f · (m · k) = ( f · m) · k.
Ejemplo 1.1.14. Cada anillo A es un A-A-bimódulo. Si R es un anillo
conmutativo, cada R-módulo es un R-R-bimódulo.
Ejemplo 1.1.15. Cada A-módulo derecho es un ℤ-A-bimódulo. Análoga-
mente, cada A-módulo izquierdo es un A-ℤ-bimódulo.
Ejemplo 1.1.16. Mn (A) es un A-Mn (A)-bimódulo. También, A[[x]] es
un A[[x]]-A-bimódulo.
Según los ejemplos 1.1.2 y 1.1.4, los grupos abelianos y los espacios vec-
toriales son casos particulares de módulos. La teoría de módulos es también
generalización de las llamadas álgebras asociativas, como veremos a conti-
nuación.
Definición 1.1.17. Sea R un anillo conmutativo. Se dice que el anillo A es
una R-álgebra si A tiene estructura de R-módulo y, además,

(ab) · r = a(b · r) = (a · r)b, para cada a, b ∈ A y r ∈ R.

Ejemplo 1.1.18. (i) Sea R un anillo conmutativo. Entonces, Mn (R), R[[x]]


y R [x] son R-álgebras.
(ii) Todo anillo A es una ℤ-álgebra.
(iii) Si 𝕂 es un cuerpo y V es un 𝕂-espacio vectorial, entonces el anillo
de transformaciones lineales de V , End𝕂 (V ), es una 𝕂-álgebra. Este es un
caso particular de la proposición 4.1.1(iv) que veremos más adelante.
8 · Módulos, submódulos y cocientes

2. Submódulos
Definición 1.2.1. Sea M un A-módulo y N un subconjunto no vacío de M.
Se dice que N es un A-submódulo de M, o simplemente, un submódulo de
M, si N es un subgrupo del grupo (M , +), y además

n · a ∈ N, para cada n ∈ N y cada a ∈ A.

En este caso escribimos N ≤ M. Los submódulos triviales de M son


0 = {0} y M. Un submódulo de M que no coincide con él se dice propio.
El módulo M ≠ 0 se dice simple si sus únicos submódulos son los triviales.
Un submódulo propio N se dice maximal en M si

N ⊆ N ′ ⇔ N ′ = N , ó, N ′ = M ,

para cada submódulo N ′ de M. Un submódulo N ≠ 0 se dice minimal en


M si
N ′ ⊆ N ⇔ N ′ = N , ó, N ′ = 0,
para cada submódulo N ′ de M.

Observación 1.2.2. En la colección de submódulos de un módulo M la


relación “ser submódulo” es reflexiva, antisimétrica y transitiva. Además, si
N y N ′ son submódulos de M, se tiene que

N ⊆ N ′ ↔ N ≤ N ′.

Ejemplo 1.2.3. Sea M un A-módulo y m ∈ M. El conjunto

{m⟩ := {m · a | a ∈ A} = m · A,

es un submódulo de M llamado submódulo cíclico generado por m. Di-


remos además que M es cíclico si existe m ∈ M tal que {m⟩ = M. Para
módulos a izquierda usaremos la notación ⟨m}.

Ejemplo 1.2.4. Considerando A como A-módulo derecho, sus submódu-


los son precisamente sus ideales derechos; los ideales izquierdos correspon-
den a la estructura izquierda (véase el ejemplo 1.1.7).

Ejemplo 1.2.5. Los submódulos de un grupo abeliano son sus subgrupos.


Así, los submódulos de ℤ son de la forma ⟨n⟩, n ≥ 0; es decir, coinciden
con sus subgrupos y con sus ideales. Además,

⟨p⟩ es maximal ⇔ p es primo.


Módulos, submódulos y cocientes · 9

ℤ no tiene submódulos minimales: ⟨2n⟩ ⊊ ⟨n⟩, n ≠ 0. Aprovechamos este


ejemplo para hacer la siguiente observación: todo anillo A puede ser con-
siderado como grupo abeliano, como A-módulo o como anillo, según con-
venga.

Ejemplo 1.2.6. Si 𝕂 es un cuerpo y V un 𝕂-espacio vectorial, los sub-


módulos de V son sus subespacios. Si V es de dimensión finita n, entonces
sus submódulos maximales son los subespacios de dimensión n − 1, y los
minimales los de dimensión 1. Si V es de dimensión infinita con base X,
entonces para cada x ∈ X, sea Yx := X − {x}. Nótese que ⟨Yx ⟩ es maximal.
Los subespacios minimales son como en el caso finito.

Ejemplo 1.2.7. En el ejemplo 1.1.6, A[x] es un A-submódulo de A[[x]].

Ejemplo 1.2.8. Sean T un anillo de división y Mn (T ), n ≥ 2, el anillo


de matrices de orden n sobre T . Se conoce que Mn (T ) es un anillo simple
(véase [23]), es decir, Mn (T ) posee sólo dos ideales biláteros. Sin embargo,
Mn (T ) como módulo sobre T no es simple. En efecto, si

Mr := {A = [ai j ] ∈ Mn (T ) | ai j = 0, para i ≠ r },

es decir,

 0 

Mr = T ··· T  (fila r-ésima) ,

 0 

entonces:

(i) Mr es un T -submódulo no minimal de Mn (T ).

(ii) Mr es un ideal minimal derecho de Mn (T ).

Veamos la demostración:
(i) Claramente Mr es un T -submódulo de Mn (T ). Sea ahora M1r el con-
junto de matrices A = [ai j ] ∈ Mn (T ) tales que ai j = 0, para i ≠ r, o, j ≠ 1,
es decir,

 0 

M1r = T 0 · · · 0 .


 0 

Es claro que 0 ⊊ M1r ⊊ Mr (ya que n ≥ 2), luego Mr no es minimal en
Mn (T ).
(ii) Dados A = [ai j ] ∈ Mr y B = [bi j ] ∈ Mn (T ), sea C = AB = [ci j ],
Ín
donde ci j = k=1 aik bk j . Para i ≠ r, aik = 0, con lo cual ci j = 0, de donde
C ∈ Mr , y por lo tanto, Mr es un ideal derecho de Mn (T ).
10 · Módulos, submódulos y cocientes

Sea ahora I un ideal derecho no nulo de Mn (T ) incluido en Mr . Si A =


[ai j ] ≠ 0 es un elemento de I, entonces arq ≠ 0 para algún q, 1 ≤ q ≤ n, y
para cada j se tiene que
n
!
∑︁
AEq j = Erk · ark Eq j = Er j · arq ∈ I ,
k=1

donde Ei j es la matriz cuya única entrada no nula es 1 y está en la intersec-


ción de la fila i con la columna j, 1 ≤ i , j ≤ n (véase [23]). Si B = [bi j ] es
un elemento cualquiera de Mr , entonces
−1
(Er j · arq )(E j j · arq br j ) = Er j · br j ∈ I ,

para cada 1 ≤ j ≤ n, de donde B ∈ I. Por lo tanto, Mr = I y Mr es minimal


derecho en Mn (T ).

Proposición 1.2.9. Sea M un A-módulo. Entonces,

(i) M es simple si, y sólo si, M ≠ 0 y para cada elemento no nulo m ∈ M se


cumple M = {m⟩.

(ii) Sea N un submódulo no nulo de M. N es minimal en M si, y sólo si, N es


simple.

Demostración. (i) ⇒): por definición M ≠ 0. Sea m ≠ 0, entonces


0 ≠ {m⟩ ≤ M, con lo cual M = {m⟩.
⇐): sea 0 ≠ N ≤ M; existe entonces n ≠ 0 en N , y por la hipótesis,
{n⟩ = M, de aquí M = N .
(ii) Evidente. ✓

3. Módulo cociente
Dados un módulo M y un submódulo N de M, construimos el grupo co-
ciente M/N al cual le damos estructura de A-módulo como sigue:

m · a := m · a, con m := m + N , m ∈ M , a ∈ A. (3.1)

La verificación de los axiomas que definen la estructura de módulo es sen-


cilla.

Definición 1.3.1. El módulo definido por el producto (3.1) se denomina


módulo cociente de M por N y se denota por M/N .
Módulos, submódulos y cocientes · 11

Ejemplo 1.3.2. Si M = ℤ y N = ⟨n⟩, entonces

M/N = ℤ/⟨n⟩ = ℤn , n ≥ 0.

Nótese que ℤn puede ser considerado como anillo cociente, grupo cociente
o módulo cociente.

Dados un módulo M sobre un anillo A y un ideal bilátero propio I de A,


es interesante saber bajo qué condición se puede definir sobre el grupo M
una estructura natural de A/I-módulo.

Proposición 1.3.3. Sea M un módulo sobre el anillo A e I un ideal bilátero propio


de A, la multiplicación

m · a := m · a, con a := a + I ∈ A/I , para m ∈ M , a ∈ A, (3.2)

define una estructura de A/I-módulo sobre M si, y sólo si, el conjunto


( n )
∑︁
M · I := mi · ai | mi ∈ M , ai ∈ I , n ≥ 1
i=1

es nulo.

Demostración. Nótese en primer lugar que M ·I es en realidad un submódulo


de M.
Ín
⇒): si x = i=1 mi · ai ∈ M · I, entonces, según (3.2) ,
n
∑︁ n
∑︁
x= mi · a i = mi · 0 = 0,
i=1 i=1

ya que ai ∈ I, 1 ≤ i ≤ n.
⇐): verificamos que el producto en (3.2) está bien definido: sea a = a 0 ,
con a, a0 ∈ A, entonces a − a0 ∈ I, y así, m · (a − a0 ) ∈ M · I, es decir,
m· (a−a0 ) = 0, para cada m ∈ M. Resulta, m·a = m·a0 , es decir, m·a = m·a0 .
Las propiedades que definen sobre M una estructura de A/I-módulo se
verifican inmediatamente.
Como observación final, notemos que la condición M · I = 0 es equiva-
lente a m · a = 0, para cada cada m ∈ M y cada a ∈ I. ✓

Ejemplo 1.3.4. Si n ≥ 2, no existe estructura de ℤn -módulo para ℤ: en


efecto, si existiera tal estructura, entonces necesariamente

m · 1 = m = m · 1,
12 · Módulos, submódulos y cocientes

para cada m ∈ ℤ. De aquí obtendríamos entonces que m · k = m · k, para cada


k ∈ ℤn . Pero, según la proposición anterior, este producto define una estruc-
tura de ℤn -módulo para ℤ si, y sólo si, ℤ · ⟨n⟩ = 0, lo cual evidentemente
no es cierto.
Ejemplo 1.3.5. Si n, m ≥ 2, ℤm es ℤn -módulo si, y sólo si, m | n. Al igual
que en el ejemplo anterior, si existe una estructura de ℤn -módulo sobre ℤm ,
entonces necesariamente x · k = x · k, para cada k ∈ ℤn y cada x ∈ ℤm . Según
la proposición 1.3.3, esto ocurre si, y sólo si, ℤm · ⟨n⟩ = 0, es decir, si, y
sólo si, 1 · n = n = 0, lo cual es equivalente a m | n. Esta última condición
garantiza, junto con (3.1) y (3.2) , que ℤm es un ℤn -módulo.
Ejemplo 1.3.6. Dados un grupo abeliano M y un anillo A, es posible defi-
nir, en algunos casos, dos estructuras diferentes de A-módulo sobre M. Por
ejemplo, si R es un anillo conmutativo de característica 2 (véase [23]) y M
es un R-módulo con el producto m · r, entonces el producto definido por

m × r := m · r 2 , m ∈ M, r ∈ R

da a M otra estructura de R-módulo. En efecto,

m × (r1 + r2 ) = m · (r1 + r2 ) 2 = m · (r12 + 2r1 r2 + r22 )


= m · r12 + m · r22 = m × r1 + m × r2 ;
(m1 + m2 ) × r = (m1 + m2 ) · r 2 = m1 · r 2 + m2 · r 2
= m1 × r + m2 × r;
m × (r1 · r2 ) = m · (r1 · r2 ) 2 = m · (r12 r22 )
= (m · r12 ) · r22 = (m × r1 ) × r2 ;
m × 1 = m.

Si M = ℤ2 [x] = R es el anillo de polinomios sobre ℤ2 y p(x)q(x) es el


producto usual de polinomios, entonces

(1 + x) × (1 + x) = (1 + x) (1 + x) 2 = (1 + x)(1 + x 2 ) = 1 + x 2 + x + x 3 ;
(1 + x) (1 + x) = 1 + x 2 .

Es decir, resultan dos estructuras diferentes de módulo sobre el mismo ani-


llo.

4. Ejercicios
1. Demuestre la proposición 1.1.11.
Módulos, submódulos y cocientes · 13

2. Demuestre que (3.1) define una estructura de módulo sobre M/N .

3. En la proposición 1.3.3, demuestre que M · I es un submódulo de M.

4. Sean A un anillo cualquiera, n, m ≥ 1 y Mm×n (A) el conjunto de


matrices de m filas y n columnas con entradas en A. Demuestre que
Mm×n (A) es un Mm (A)-Mn (A)-bimódulo.

5. Defina sobre ℤ4 [x] tres estructuras diferentes de módulo.

6. Demuestre que ℤ no posee ninguna estructura de espacio vectorial


sobre ℚ.

7. Sean A un anillo y F una matriz rectangular de tamaño m × n con


componentes en A. Demuestre que la colección de vectores X ∈ An
tales que F X = 0 es un submódulo de An .

8. Ilustre con un ejemplo que la unión de dos submódulos de un módulo


no es siempre un submódulo.

9. Sea f : A −→ B un homomorfismo de anillos. Demuestre que B tiene


estructura natural de A-A-bimódulo.

10. Considere el conjunto A de matrices cuadradas de la forma


 
ℚ ℝ
.
0 ℝ

Demuestre que A es una ℚ-álgebra.

11. Sea C un anillo y sean A, B, M ⊆ C tales que A y B son anillos y M


un A-B-bimódulo. Demuestre que
 
A M
0 B

tiene una estructura natural de anillo.


Capítulo
dos
Módulos
finitamente
generados
Módulos finitamente generados · 17

En la teoría general de módulos un lugar muy importante lo ocupan los mó-


dulos que se pueden generar con un número finito de elementos. Veremos
en capítulo 8 que para tales módulos sobre dominios de ideales principales
se pueden generalizar algunos resultados de la teoría de grupos abelianos.

1. Operaciones con submódulos


Algunas de las operaciones definidas para los ideales de un anillo pueden
formularse también para submódulos (véase [23]). Así, por ejemplo, si es
{Mi }i ∈ C una colección no vacía de submódulos de un módulo M, la inter-
Ñ
sección i ∈ C Mi de dicha colección es claramente un submódulo de M y es,
desde luego, el submódulo más grande de M contenido simultáneamente
en cada Mi , i ∈ C.
Para definir la suma necesitamos considerar primero la generación de
submódulos por subconjuntos. Si S es un subconjunto del A-módulo M,
denotamos por {S⟩ la intersección de todos los submódulos de M que con-
tienen a S, es decir, Ù
{S⟩ = N.
S ⊆N ≤M

Evidentemente, {S⟩ es el menor submódulo de M que contiene a S. Nótese


que, {∅⟩ = 0. Decimos que {S⟩ es el submódulo generado por S; si además
{S⟩ = M, se dirá que S es un sistema de generadores para M. Si A = R
es un anillo conmutativo escribiremos, ⟨S⟩. Decimos que M es un módulo
finitamente generado si existe un subconjunto finito S en M tal que {S⟩ =
M. M es cíclico si existe s ∈ M tal que {s⟩ = M.

Proposición 2.1.1. Sea M un A-módulo y ∅ ≠ S ⊆ M. Entonces,


( n )
∑︁
{S⟩ = si · ai | si ∈ S, ai ∈ A, n ≥ 1 . (1.1)
i=1

Demostración. La prueba es análoga a la de ideales (véase [23], capítulo 2) y


dejamos los detalles al lector. ✓

Si S = {s1 , . . . , sk } es un conjunto finito, entonces


( k )
∑︁
{S⟩ = si · ai | ai ∈ A, 1 ≤ i ≤ k ,
i=1

en particular, si S = {s} es unitario, {S⟩ es el submódulo cíclico generado


por s, es decir, {s⟩ = s · A.
18 · Módulos finitamente generados

Ejemplo 2.1.2. Para cada n ≥ 0, ℤn es un módulo cíclico,

ℤ0 = ℤ = ⟨1⟩,
ℤ1 = 0 = ⟨0⟩,
..
.
ℤn = ⟨1⟩, n ≥ 2.

En general, sea N ≤ M y S un sistema de generadores de M. Entonces,

S := {s + N | s ∈ S}

es un sistema de generadores de M/N .

Ejemplo 2.1.3. AA y AA son cíclicos.

Ejemplo 2.1.4. Mn (A) es finitamente generado:

{Ei j | 1 ≤ i , j ≤ n⟩ = Mn (A), n ≥ 1.

Ejemplo 2.1.5. Sea An [x], n ≥ 0, el conjunto de polinomios de grado


menor o igual que n con coeficientes en A. Este conjunto es claramente un
A-submódulo de A[x] y es finitamente generado:

{1, x, x 2 , . . . , x n ⟩ = An [x].

A su vez, el conjunto {x k }∞
k=0
es un sistema de generadores para A[x].

Ejemplo 2.1.6. Sea An = A × . . . × A el módulo del ejemplo 1.1.9. Si

ei := (0, . . . , 1, . . . , 0)T , 1 ≤ i ≤ n,

entonces {e1 , . . . , en ⟩ = An .

Si {Mi }i ∈ C es una colección no vacía de submódulos de un módulo, se


Í
denomina suma de la familia dada, y se denota por i ∈ C Mi , al submódulo
Ð
generado por el conjunto i ∈ C Mi . Según la proposición 2.1.1,

∑︁ 
 n
 ∑︁
 Ø 



Mi = mj | mj ∈ Mi , n ≥ 1 .
 
i∈C  j=1 i∈C 
 
Í
i ∈ C Mi es claramente el submódulo más pequeño de M que contiene si-
multáneamente a cada Mi , i ∈ C. Si la familia es vacía, es decir, C = ∅,
Í
entonces i ∈∅ Mi = 0.
Módulos finitamente generados · 19

Para una familia finita se tiene



 n
 ∑︁





M1 + · · · + Mn = mj | mj ∈ Mj , 1 ≤ j ≤ n .

 j=1 

 
En general, la igualdad (1.1) puede escribirse en la forma
∑︁
{S⟩ = s · A.
s ∈S

Es de gran utilidad la siguiente relación entre las operaciones de suma e


intersección.

Proposición 2.1.7 (Ley de modularidad) . Sea M un módulo y sean N , P , L


submódulos de M tales que P ≤ L. Entonces,

(N + P) ∩ L = (N ∩ L) + P .

Demostración. Sea x ∈ (N + P) ∩ L, entonces x = n + p, n ∈ N , p ∈ P. Como


P ≤ L y x ∈ L, entonces n = x − p ∈ L, es decir, x ∈ (N ∩ L) + P.
Recíprocamente, si x = n + p ∈ (N ∩ L) + P, entonces x ∈ (N + P) ∩ L,
ya que n, p ∈ L. ✓

2. Submódulos maximales
Proposición 2.2.1. Sea N un submódulo propio del A-módulo M. Entonces,

N es maximal ⇔ M = N + m · A, para cada m ∈ M − N .

Demostración. ⇒): evidente a partir de la maximalidad de N .


⇐): sea N ⪇ N ′ ≤ M y sea m ∈ N ′ − N . Entonces, M = N + m· A ≤ N ′,
con lo cual N ′ = M, y así, N es maximal. ✓

Ejemplo 2.2.2. En el ejemplo 1.2.5 vimos que todo espacio vectorial finito
dimensional posee subespacios maximales y minimales. El presente ejem-
plo muestra que esto no es en general cierto para módulos sobre anillos ar-
bitrarios. Consideremos el ℤ-módulo ℚ; este módulo no posee submódulos
minimales. En efecto, para cada racional no nulo r se tiene que ⟨r · 2⟩ ⪇ ⟨r⟩.
De otra parte, el módulo ℚ tiene una propiedad bastante particular de la
cual se desprende la carencia de submódulos maximales: de cualquier sistema
de generadores de ℚℤ se puede suprimir un elemento y el nuevo sistema también
genera a ℚ. En efecto, sea S un sistema de generadores para ℚℤ y sea a ∈ S.
20 · Módulos finitamente generados

Consideremos el conjunto S0 := S −{a}. Si se prueba que a ∈ ⟨S0 ⟩, entonces


queda demostrado que ⟨S⟩ = ⟨S0 ⟩ = ℚℤ . Puesto que ⟨S⟩ = ℚℤ , entonces
n
a ∑︁
= a · k0 + ai · ki , con ai ∈ S0 , k0 , ki ∈ ℤ, 1 ≤ i ≤ n.
2
i=1

Resulta
n
∑︁
a = a · (2k0 ) + ai · (2ki ),
i=1
n
∑︁
a · (1 − 2k0 ) = ai · (2ki ),
i=1
n
∑︁
a·m = ai · (2ki ),
i=1

a
donde m := 1 − 2k0 ≠ 0 es entero. Consideremos ahora el racional m:

t
a ∑︁
= a · k0′ + bi · ki′ con bi ∈ S0 , ki′ ∈ ℤ, 1 ≤ i ≤ t;
m
i=1
t
∑︁ n
∑︁ t
∑︁
a = a · mk0′ + bi · mki′ = ai · 2k0′ ki + bi · mki′ , con ai , bi ∈ S0 ,
i=1 i=1 i=1

con lo cual a ∈ ⟨S0 ⟩.


De esta propiedad se sigue que ℚℤ no es finitamente generado. Probe-
mos por último la no existencia de submódulos maximales: si N ≠ ℚ un
submódulo maximal de ℚℤ , entonces existe x ∈ ℚ − N tal que N + ⟨x⟩ = ℚ,
lo cual indica que N ∪ {x} es un sistema de generadores para ℚℤ . Por la
propiedad demostrada se obtiene que ⟨N ⟩ = ℚ = N , lo cual es una contra-
dicción. Por lo tanto, ℚℤ no tiene submódulos maximales.

Es conocido que todo anillo tiene ideales biláteros maximales (véase [23]).
Dicha prueba es válida para ideales izquierdos o derechos, como se muestra
en la siguiente generalización.

Teorema 2.2.3. Cada módulo no nulo finitamente generado tiene un submódulo


maximal.

Demostración. Sea M no nulo y {m1 , . . . , mk } un conjunto de generadores


para M. Sea
P := {N ≤ M | N ≠ M }.
Módulos finitamente generados · 21

P es no vacío (0 ∈ P) y parcialmente ordenado por la inclusión. Sea T un


subconjunto totalmente ordenado de P y sea
Ø
N1 := N.
N ∈T

N1 es un submódulo de M y es una cota superior para T . Además, N1 ∈ P


ya que si suponemos N1 = M = {m1 , . . . , mk ⟩, entonces para cada mi ,
1 ≤ i ≤ k, se encuentra Ni ∈ T con mi ∈ Ni ; como T es totalmente or-
denado, existe i0 , 1 ≤ i0 ≤ k, tal que Ni ≤ Ni0 , para cada 1 ≤ i ≤ k, pero
entonces M = Ni0 ∈ T , lo cual es contradictorio. Por el lema de Zorn (véa-
se [20]), P tiene elemento maximal N0 , el cual obviamente es submódulo
maximal de M. ✓

Corolario 2.2.4. Todo anillo posee ideales maximales derechos e ideales maxima-
les izquierdos.

Demostración. Consecuencia directa del teorema anterior. ✓


Proposición 2.2.5. Sea N un submódulo de M tal que N y M/N son finitamente


generados. Entonces, M es finitamente generado.

Demostración. Si {m1 , . . . , mk }, mi ∈ M, 1 ≤ i ≤ k, es un sistema de gene-


radores de M/N y {n1 , . . . , nt } es un conjunto generador de N , entonces
el conjunto {n1 , . . . , nt , m1 , . . . , mk } genera a M. ✓

Ejemplo 2.2.6. De la proposición anterior se obtiene que el cociente ℚℤ


no es finitamente generado.

3. Ejemplos
Ejemplo 2.3.1. Los submódulos de un módulo finitamente generado no
son necesariamente finitamente generados: sea A un anillo cualquiera y
B := Aℕ el anillo de sucesiones en A. BB es finitamente generado (véase
el ejemplo 2.1.3). Sea

I := { f ∈ B | f (k) = 0, para casi todo k ∈ ℕ};

nótese que I es un submódulo de B (en realidad, I es un ideal bilátero de


B). Supóngase que I es finitamente generado, es decir, existen { f1 , . . . , fn }
en I tales que { f1 , . . . , fn ⟩ = I. Sea

Xi := {k ∈ ℕ | fi (k) ≠ 0}, 1 ≤ i ≤ n;
22 · Módulos finitamente generados

por definición cada Xi es finito. Entonces, X := X1 ∪ · · · ∪ Xn es finito. Sean


m ∈ ℕ−X y (
1, si k = m,
f (k) :=
0, si k ≠ m.
Así, f ∈ I y existen g1 , . . . , gn ∈ B tales que f = f1 · g1 + · · · + fn · gn . Resulta
una contradicción:

1 = f (m) = f1 (m) · g1 (m) + · · · + fn (m) · gn (m) = 0.

En consecuencia, I no es finitamente generado.

Mostramos ahora un módulo que no es finitamente generado, pero con


todos sus submódulos propios cíclicos.

Ejemplo 2.3.2. Sea R un dominio de ideales principales y sea 𝕂 := Q (R)


su cuerpo de fracciones (véase [23]). Sea p un elemento irreducible de R y
 
a
𝕂 p := k | a ∈ R, k ≥ 0 .
p
Claramente 𝕂 p es un R-submódulo de 𝕂 que contiene a R. Nótese que 𝕂 p
es la reunión de la cadena infinita de submódulos cíclicos:
    ∞  
1 1 Ø 1
R⪇ ⪇ 2 ⪇ · · · , 𝕂p = . (3.1)
p p k=0
pk
D E D E D E D E
Además, para cada k ≥ 0, p1k es maximal en pk+1
1
: en efecto, p1k ≠ pk+1
1

ya que en caso contrario encontraríamos a ∈ R tal que


1 1
= · a,
p k+1 pk
D E
a
obteniéndose la contradicción p | 1. Sea pk+1 ∉ p1k , entonces el máximo
común divisor de a y p es 1 y existen r , s ∈ R tales que 1 = ar + ps.
Para completarD la prueba
E de la maximalidad aplicaremos la proposición
b 1
2.2.1. Sea pk+1 ∈ pk+1 . Tenemos que b = arb + psb, de donde
   
b arb sb a 1
= k+1 + k ∈ k+1 + k ,
p k+1 p p p p
es decir,      
1 a 1
= + k .
p k+1 p k+1 p
Módulos finitamente generados · 23

Denotemos por Rp∞ := 𝕂 p /R; (3.1) induce la siguiente cadena de submó-


dulos cíclicos de Rp∞ :
* + * + ∞
* +
1 1 Ø 1
0⪇ ⪇ 2 ⪇ . . . , Rp ∞ = . (3.2)
p p pk k=0
D E
Como antes, es posible probar que, para cada k ≥ 0, p1k es maximal en
D E
1
p k+1 . Se tiene entonces que Rp∞ no es finitamente generado.
Mostraremos por último que los submódulos propios de Rp∞ son los de
1
la cadena (3.2) : si 0 ≠ N ⪇ Rp∞ , existe entonces m ≥ 1 tal que pm ∉ N ; sea
m el mínimo que cumple tal condición, es decir,

1 1
∈ N pero ∉ N.
p m−1 pm

Resulta, * +
1
≤ N.
p m−1
Veamos que en esta relación se daD la igualdad:
E supongamos contrariamente
a 1
que existe pr en N que no está en pm−1 , entonces r ≥ m y podemos suponer
sin pérdida de generalidad que el máximo común divisor de a y p r es 1.
Luego existen l , t ∈ R tales que 1 = p r l + at. Tenemos que

1 at 1 at a
r
= l + r , es decir, r = r = t r ∈ N ,
p p p p p
D E D E
y se obtiene la contradicción p1m ∈ p1m ⊆ p1r ⊆ N .
Si tomamos en particular R = ℤ, obtenemos
* + * + ∞
* +
1 1 Ø 1
0⪇ ⪇ 2 ⪇ . . . , ℤp ∞ = . (3.3)
p p k=0
pk

ℤp∞ es un grupo no cíclico donde todos sus grupos propios son cíclicos.

4. Ejercicios
1. Demuestre la proposición 2.1.1.

2. Complete los detalles de la demostración de la proposición 2.2.5.


24 · Módulos finitamente generados

3. Pruebe que la suma finita de submódulos finitamente generados en


un submódulo finitamente generado.
4. Sea M un A-módulo derecho y ∅ ≠ X ⊆ M. Se denomina anulador
de X al subconjunto
Ann(X) := {a ∈ A | x · a = 0, para cada x ∈ X }.
Pruebe que:
(i) Ann(X) es un ideal derecho de A.
(ii) Si X es un submódulo de M, Ann(X) es un ideal bilátero.
Ñ
(iii) Ann(M) = m ∈M Ann(m).
(iv) Si N , P ≤ M, entonces Ann(N + P) = Ann(N ) ∩ Ann(P).
(v) M tiene estructura de A/Ann(M)-módulo.
5. Se dice que un A-módulo M es exacto con respecto a A si
Ann(M) = 0. Pruebe que si M es un A-módulo, entonces M es exacto
con respecto a A/Ann(M).
6. Denotamos por Aop el anillo opuesto de A, siendo A con la misma
adición pero con producto dado por a · b := ba, para todo a, b ∈ A.
Demuestre que A/Ann(M) es isomorfo a un subanillo de Endℤ (M) op
(si M es un A-módulo a izquierda se tiene el isomorfismo con un
subanillo de Endℤ (M)).
7. Sean N , P ≤ M. Se denomina cociente de N por P al subconjunto
(N : P) := {a ∈ A | P · a ⊆ N }.
Pruebe que (N : P) es un ideal bilátero de A. También pruebe que
(0 : M) = Ann(M) y (N : P) = Ann((N + P)/N ).
8. Sea R un anillo conmutativo local, es decir, tal que R tiene un único
ideal maximal J . Sea MR un módulo finitamente generado tal que
M J = M. Demuestre que M = 0.
9. Sea R un anillo conmutativo local con ideal maximal J . Sea MR un
módulo finitamente generado y sea N un submódulo de M. Demues-
tre que M J + N = M si, y sólo si, N = M.
10. Sean R, J y M como en el ejercicio anterior. Demuestre que si
{x1 , . . . , xn } es un sistema minimal de generadores de M, entonces
{x1 , . . . , xn } es un sistema minimal de generadores del R/ J -módulo
M/M J .
Capítulo
tres
Homomorfismos
Homomorfismos · 27

Al igual que en grupos y anillos, es posible definir funciones entre módulos


que sean compatibles con las operaciones, dando de esta manera origen a
los homomorfismos de módulos. Debido a la analogía que guarda este tema
con el correspondiente de anillos (véase [23]), omitiremos algunas pruebas,
las cuales quedan a cargo del lector.

1. Definición y propiedades básicas


Definición 3.1.1. Sean M y N A-módulos. Una función f : M −→ N se
dice que es un A-homomorfismo, o también un homomorfismo de módulos,
si
(i) f (m + m ′) = f (m) + f (m ′),

(ii) f (m · a) = f (m) · a,
para cualesquiera elementos m, m ′ ∈ M y a ∈ A.
Los conceptos de núcleo, imagen, homomorfismo inyectivo, homomor-
fismo sobreyectivo, isomorfismo y endomorfismo de módulos, se definen
como en el caso de anillos (véase [23], capítulo 3). Notemos en particular
que
ker( f ) := {m ∈ M | f (m) = 0}
es un submódulo de M e

Im( f ) := { f (m) | m ∈ M }

es un submódulo de N . El homomorfismo idéntico es iM : M −→ M,


m ↦→ m y el homomorfismo nulo se define por 0 : M −→ N , m ↦→ 0. Si f
es un homomorfismo sobreyectivo, entonces se dice que N es una imagen
homomorfa de M. Si M ′ es un submódulo de M, entonces el homomorfis-
mo canónico j : M −→ M/M ′ se define por j (m) := m, para cada m ∈ M.
Los cocientes

coker( f ) := N /Im( f ),
coIm( f ) := M/ker( f ),

se denominan conúcleo y coimagen de f , respectivamente.


Proposición 3.1.2. Sea f : M −→ N un homomorfismo de módulos.
(i) Si M ′ ≤ M, entonces f (M ′) ≤ N . Además,

f −1 ( f (M ′)) = M ′ + ker( f ).
28 · Homomorfismos

(ii) Si N ′ ≤ N , entonces ker( f ) ≤ f −1 (N ′) ≤ M. Además,

f ( f −1 (N ′)) = N ′ ∩ Im( f ).

(iii) Si ker( f ) ≤ M ′ ≤ M, entonces f −1 ( f (M ′)) = M ′. Si N ′ ≤ Im( f ),


entonces f ( f −1 (N ′)) = N ′.

(iv) Si f es sobreyectivo y N ′ ≤ N es maximal, entonces f −1 (N ′) es maximal en


M.

(v) Sea f es sobreyectivo y ker( f ) ≤ M ′. Si M ′ es maximal en M, entonces


f (M ′) es maximal en N .

Demostración. Dejamos al lector las pruebas de las partes (i)-(iii).


(iv) Sea f −1 (N ′) ≤ M ′ ≤ M. Entonces, teniendo en cuenta la sobreyec-
tividad de f y (iii), se tiene que f ( f −1 (N ′)) = N ′ ≤ f (M ′) ≤ f (M) = N .
Por la maximalidad de N ′, f (M ′) = N , o, f (M ′) = N ′. Según (iii),

f −1 ( f (M ′)) = M ′ = f −1 (N ) = M , o, M ′ = f −1 (N ′).

(v) Sea f (M ′) ≤ N ′ ≤ N . Según (iii),

f −1 ( f (M ′)) = M ′ ≤ f −1 (N ′) ≤ f −1 (N ) = M .

Por la sobreyectividad de f y la maximalidad de M ′,

f ( f −1 (N ′)) = N ′ = f (M) = N , o, N ′ = f (M ′). ✓


Proposición 3.1.3. La composición de homomorfismos inyectivos (sobreyectivos)


es un homomorfismo inyectivo (sobreyectivo). Si f y g son homomorfismos tales que
f g existe y es inyectivo (sobreyectivo), entonces g es inyectivo ( f es sobreyectivo).

Demostración. Ejercicio para el lector. ✓


Proposición 3.1.4. Sean f : M −→ N , g : N −→ P y h : M −→ P


homomorfismos tales que h = g f . Entonces,

(i) ker(h) = f −1 (ker(g)), Im(h) = g (Im ( f )).

(ii) Im( f ) + ker(g) = g −1 (Im(h)). Si h es sobreyectivo, Im( f ) + ker(g) = N .

(iii) Im( f ) ∩ ker(g) = f (ker(h)). Si h es inyectivo, Im( f ) ∩ ker(g) = 0.

Demostración. Las pruebas son consecuencia directa de las definiciones, y


por tanto, quedan a cargo del lector. ✓

Homomorfismos · 29

Una última afirmación sobre el comportamiento de sumas e interseccio-


nes a través de homomorfismos. La prueba queda a cargo del lector.

Proposición 3.1.5. Sea f : M −→ N un homomorfismo y sean {Mi }i ∈ C,


{N j } j ∈ D familias de submódulos en M y N , respectivamente. Entonces,
!
∑︁ ∑︁
(i) f Mi = f (Mi ).
i∈C i∈C
!
Ù Ù
(ii) f Mi ≤ f (Mi ). Si ker( f ) ⊆ Mi , para cada i ∈ C, entonces se
i∈C i∈C
verifica la igualdad.

∑︁ © ∑︁ ª
(iii) f −1 (N j ) ≤ f −1 ­ N j ®. Si N j ⊆ Im( f ), para cada j ∈ D, entonces
j∈D « j ∈ D ¬
se verifica la igualdad.

© Ù ª Ù −1
(iv) f −1 ­ Nj ® = f (N j ).
« j ∈ D ¬ j ∈ D

2. Teoremas de homomorfismo e
isomorfismo
Los teoremas de homomorfismo, correspondencia e isomorfismo para mó-
dulos se enuncian y demuestran en forma completamente análoga a como
se hace en anillos (véase [23], capítulo 3).

Teorema 3.2.1 (Teorema de homomorfismo) . Sea M un módulo y M ′ una


imagen homomorfa de M. Entonces, existe un submódulo N de M tal que M/N 
M ′. Recíprocamente, cada cociente de M es una imagen homomorfa de M.

Teorema 3.2.2 (Teorema de correspondencia) . Sea M un módulo y N un


submódulo de M. Sea I la colección de submódulos de M que contienen a N e I0 la
colección de los submódulos de M/N . Existe entonces una correspondencia biyectiva
entre I e I0 definida por

j : I −→ I0
e
K ↦−→ j (K)
30 · Homomorfismos

donde j (K) es la imagen del submódulo K mediante el homomorfismo canónico


j : M −→ M/N . Es decir,
j (K) = {k ∈ M/N | k ∈ K} := K/N .
Además, para K1 , K2 ∈ I se tiene
K1 ≤ K2 ⇔ j (K1 ) ≤ j (K2 ).
Teorema 3.2.3 (Teoremas de isomorfismo) . Sea M un módulo y L, K sub-
módulos de M. Entonces,
(i) Si K ⊆ L, entonces (M/K)/(L/K)  M/L.

(ii) (L + K)/K  L/(L ∩ K).


Los teoremas precedentes pueden ser utilizados para caracterizar los mó-
dulos cíclicos y simples sobre un anillo A.
Corolario 3.2.4. Sea A un anillo.
(i) Los módulos cíclicos sobre A son de la forma A/I, donde I es un ideal derecho
de A.

(ii) Sea M un A-módulo y N ⪇ M. Entonces, N es maximal en M si, y sólo si,


M/N es simple.

(iii) Los módulos simples sobre A son de la forma A/I, donde I es un ideal maxi-
mal derecho de A.

(iv) Cada submódulo propio de un módulo finitamente generado está contenido en


un submódulo maximal.
Demostración. (i) Claramente A/I = {1⟩ es cíclico. Sea M = m · A el sub-
módulo cíclico generado por m ∈ M. La función
f : A −→ M
a ↦−→ m · a
es un homomorfismo sobreyectivo. Según el teorema 3.2.1, M  A/I, don-
de I es un submódulo de AA , es decir, I es un ideal derecho de A.
(ii) ⇒): sea K ≤ M/N . Según el teorema de correspondencia, K es de
la forma J = M ′/N , con N ≤ M ′ ≤ M. Por la maximalidad de N se tiene
que M ′ = M, o, M ′ = N , es decir, K = M/N , o, K = 0. En otras palabras,
M/N es simple.
⇐): similar a la prueba anterior.
(iii) Se sigue de (i) y (ii) y del hecho que todo módulo simple es cíclico.
(iv) Basta aplicar los teoremas 2.2.3 y 3.2.2. ✓

Homomorfismos · 31

3. Ejemplos
Ejemplo 3.3.1. Calculemos las imágenes homomorfas del ℤ-módulo ℤm ,
m ≥ 0. Comencemos considerando por separado tres casos:
Caso 1, m = 0: ℤ0 = ℤ/⟨0⟩  ℤ. Según el teorema 3.2.1, las imágenes
son ℤ/⟨n⟩ = ℤn , n ≥ 0 (nótese adicionalmente que ℤ es isomorfo a cada
uno de sus submódulos no nulos: ℤ  n · ℤ).
Caso 2, m = 1: ℤ1 = ℤ/⟨1⟩ = ℤ/ℤ  0, en este caso la única imagen
homomorfa es el ℤ-módulo nulo 0.
Caso 3, m ≥ 2: ℤm = ℤ/⟨m⟩. De acuerdo con el teorema de correspon-
dencia, los submódulos de ℤm son

⟨n⟩/⟨m⟩ = ⟨n⟩, n | m.

De los teoremas 3.2.1 y 3.2.3 obtenemos que las imágenes homomorfas de


ℤm , para m ≥ 2, están dadas por

(ℤ/⟨m⟩)/(⟨n⟩/⟨m⟩)  ℤ/⟨n⟩ = ℤn , con n | m.

Adicionalmente, notemos que los módulos ⟨n⟩/⟨m⟩, con n | m, y ℤ mn , son


isomorfos. En efecto, como ⟨n⟩/⟨m⟩ = ⟨n⟩ es cíclico, entonces considerando
el homomorfismo sobreyectivo

f : ℤ −→ ⟨n⟩ = n · ℤ
k ↦−→ n · k

m
encontramos que ker( f ) = n . Resta aplicar el teorema fundamental de
homomorfismo.
Ejemplo 3.3.2. El ejemplo anterior admite la siguiente generalización a
un dominio de ideales principales R: los submódulos de RR son de la forma
⟨m⟩, m ∈ R, y las imágenes homomorfas son

Rm = R/⟨m⟩, m ∈ R.

Como en ℤ, R es isomorfo a cada uno de sus submódulos no nulos,


R  m · R, m ≠ 0.
Para m, n ∈ R, se tiene ⟨m⟩ ≤ ⟨n⟩ si, y sólo si, n | m. Para m ∈ R, los
submódulos de Rm son de la forma

⟨n⟩/⟨m⟩ = ⟨n⟩, n | m,

y las imágenes homomorfas son de la forma

(R/⟨m⟩)/(⟨n⟩/⟨m⟩)  R/⟨n⟩ = Rn , n | m.
32 · Homomorfismos

Se tiene además el R-isomorfismo ⟨n⟩/⟨m⟩ = Rd , n ≠ 0, donde d ∈ R es tal


que m = nd (nótese que d es único en R: si m = nd ′, entonces d = d ′).
D E
Ejemplo 3.3.3. Sean R un DIP y p un elemento irreducible de R. Sea p1k
D E
uno de los eslabones de la cadena (3.2) . Entonces, p1k  Rpk :
* +
1 1
g : R −→ k = k · R
p p
1
r ↦−→ ·r
pk
g es claramente un R-homomorfismo sobreyectivo, y además,
r
r ∈ ker(g) ⇔ k ∈ R ⇔ r ∈ ⟨p k ⟩.
p
Las cadenas (3.2) y (3.3) se pueden ahora escribir de la siguiente forma

Ø
0 ≨ Rp ≨ Rp 2 ≨ . . . ; Rp ∞ = Rp k ,
k=0
Ø∞
0 ≨ ℤp ≨ ℤp 2 ≨ . . . ; ℤp ∞ = ℤp k .
k=0

4. Ejercicios
1. Complete la demostración de la proposición 3.1.2.
2. Demuestre la proposición 3.1.3.
3. Demuestre la proposición 3.1.4.
4. Demuestre la proposición 3.1.5.
5. Demuestre los teoremas 3.2.1, 3.2.2 y 3.2.3.
6. Demuestre que la relación de isomorfismo en la colección de todos
los A-módulos es de equivalencia.
7. Sea f : M −→ N un A-homomorfismo y M ′ ≤ M. Demuestre que
f : M/M ′ −→ N /f (M ′)
m ↦−→ f (m)

es un A-homomorfismo. Además, f es inyectivo si, y sólo si,


ker( f ) ≤ M ′; f es sobreyectivo si, y sólo si, f es sobreyectivo.
Homomorfismos · 33

8. Sean f , M y N como en el ejercicio anterior. Si N ′ ≤ N , pruebe que


se induce el homomorfismo inyectivo

f : M/f −1 (N ′) −→ N /N ′
m ↦−→ f (m)

Si además f es sobreyectivo, entonces f es un isomorfismo.

9. Sean M1 y M2 submódulos de un módulo M, con M1 ≤ M2 . De-


muestre que

M/M1 −→ M/M2
m ↦−→ m

es un homomorfismo sobreyectivo.

10. Sean G y H dos grupos abelianos y f : G −→ H un isomorfismo de


grupos. Demuestre que si G es un A-módulo, entonces H tiene una
estructura natural de A-módulo y, además, G y H son A-módulos
isomorfos.

11. Calcule, salvo isomorfismo, todos los ℤ-módulos simples.

12. Sean A un anillo y Ila colección de todos los ideales maximales dere-
chos de A y S la colección de todos los A-módulos derechos simples.
Demuestre que Ù Ù
I= Ann(MA ).
I ∈I MA ∈S

13. Sean f : M −→ N y g : M −→ L A-homomorfismos. Se dice que


f se puede factorizar a través de g si existe un homomorfismo de
módulos h : L −→ N tal que hg = f . Demuestre que si f : M −→ N
es un homomorfismo y K ≤ M, entonces f se puede factorizar de
manera única a través de j : M −→ M/K (homomorfismo canónico)
si, y sólo si, K ≤ ker( f ).

14. Un homomorfismo de módulos f : M −→ N se dice cancelable a


derecha si
g ◦ f = h ◦ f ⇔ g = h,

donde g , h : N −→ L son homomorfismos de módulos. Demuestre


que f es cancelable a derecha si, y sólo si, f es sobreyectivo.
34 · Homomorfismos

15. Un homomorfismo de módulos f : M −→ N se dice cancelable a


izquierda si
f ◦ g = f ◦ h ⇔ g = h,
donde g , h : L −→ M son homomorfismos de módulos. Demuestre
que f es cancelable a izquierda si, y sólo si, f es inyectivo.
Capítulo
cuatro
Hom
Hom · 37

El presente, y los tres capítulos siguientes, constituyen una introducción a


una rama del álgebra conocida como álgebra homológica (véase [29]). La idea
es estudiar la estructura de la colección de homomorfismos entre dos A-
módulos.

1. El grupo HomA (M , N )
Es conocido que el conjunto de endomorfismos de un grupo abeliano M es
un anillo en el cual la adición de dos endomorfismos f , g : M −→ M se
define por ( f + g) (m) = f (m) + g (m), m ∈ M (véase [23]). Considerando
dos grupos abelianos M y N se prueba, definiendo la adición como antes,
que el conjunto Hom(M , N ) de homomorfismos de M en N es un grupo
abeliano. Además, si M, N y L son grupos abelianos y f , g : M −→ N ,
h : N −→ L son homomorfismos de grupos, entonces se cumple que

h( f + g) = h f + hg.

En efecto, para cada m ∈ M se tiene que

(h( f + g)) (m) = h(( f + g) (m)) = h( f (m) + g (m)) = h f (m) + hg (m).

Desde luego que para homomorfismos compatibles la distributiva por el


lado derecho también se cumple.
Como corresponde al tema que nos ocupa, consideraremos que M y N
son además A-módulos. Es claro que cada A-homomorfismo de M en N es
un homomorfismo de grupos.

Proposición 4.1.1. Sean M y N módulos sobre un anillo A y HomA (M , N ) el


conjunto de A-homomorfismos de M en N . Entonces,

(i) HomA (M , N ) es un subgrupo de Hom(M , N ).

(ii) Si A = R es un anillo conmutativo, entonces HomR (M , N ) es además un


R-módulo.

(iii) Si M = N , entonces EndA (M) := HomA (M , M) es un subanillo del anillo


End(M) de endomorfismos del grupo abeliano M.

(iv) Si A = R es un anillo conmutativo, entonces EndR (M) es una R-álgebra.

Demostración. (i) HomA (M , N ) es no vacío ya que contiene por lo menos el


homorfismo nulo. Como vimos al inicio de la sección,
38 · Hom

HomA (M , N ) ⊆ Hom(M , N ). Además, si f , g son A-homomorfismos, en-


tonces f − g es un A-homomorfismo: en efecto,

( f − g) (m · a) = f (m · a) − g (m · a) = f (m) · a − g (m) · a = ( f − g)(m) · a,

para cada m ∈ M y a ∈ A.
(ii) Para cada f ∈ HomR (M , N ) y r ∈ R definimos

( f · r) (m) := f (m) · r , con m ∈ M ,

f · r es un R-homomorfismo:

( f · r) (m1 + m2 ) = f (m1 + m2 ) · r = f (m1 ) · r + f (m2 ) · r


= ( f · r) (m1 ) + ( f · r)(m2 );
( f · r) (m · s) = f (m · s) · r = ( f (m) · s) · r = f (m) · (s · r)
= f (m) · (r · s) = ( f (m) · r) · s = ( f · r)(m) · s,

con m, m1 , m2 ∈ M; r , s ∈ R. Encomendamos al lector la verificación de las


propiedades restantes de R-módulo.
(iii) Se desprende del hecho que la suma y composición de A-endomor-
fismos es un A-endomorfismo. Además, el homomorfismo idéntico está en
EndA (M).
(iv) Por (ii)-(iii), sólo basta observar que ( f g) · r = f (g · r) = ( f · r) g,
donde f , g ∈ EndA (M), r ∈ R:

(( f g) · r) (m) = ( f g) (m) · r = f (g (m)) · r = f (g (m) · r)


= f (g · r (m)) = ( f (g · r)) (m) ,

con m ∈ M, es decir, la primera igualdad está probada. Además,

(( f g) · r) (m) = f (g (m)) · r = ( f · r) (g (m))


= (( f · r) g) (m) ,

con lo cual hemos probado que ( f g) · r = ( f · r)g. ✓


Corolario 4.1.2. Sea M un A-módulo. Entonces, M es un EndA (M)-A-bimó-


dulo.

Demostración. Ya habíamos observado en el ejemplo 1.1.3 que M es un


End(M)-módulo a la izquierda. El resultado se obtiene entonces de (iii)
de la proposición anterior y de la proposición 1.1.11(ii). □✓

Consideremos un par de situaciones particulares.


Hom · 39

Lema 4.1.3 (Lema de Schur) . Sea M un A-módulo simple. Entonces,


EndA (M) es un anillo de división.
Demostración. Sea f un endomorfismo no nulo del módulo M. Entonces,
Im( f ) es un submódulo no nulo de M, y así, Im( f ) = M. De otra parte,
como f ≠ 0, entonces ker( f ) ≠ M, y así, ker( f ) = 0. f es entonces un
isomorfismo, de donde f es un invertible del anillo EndA (M). □✓

Proposición 4.1.4. Sea A un anillo, entonces

EndA (AA )  A (isomorfismo de anillos).

Demostración. Si definimos

h : A −→ EndA (AA ) ha : A −→ A
a ↦−→ ha b ↦−→ ab

es fácil probar que ha es un A-homomorfismo, para cada a ∈ A, y que h


es un homomorfismo de anillos. ker(h) = 0: si h(a) = 0, entonces ab = 0
para cada b ∈ A, en particular a · 1 = 0 = a. h es sobreyectivo: en efecto, si
f ∈ EndA (AA ), entonces h f (1) = f . □✓

Observación 4.1.5. Para A A se tiene el isomorfismo

EndA (A A)  Aop (isomorfismo de anillos) ,

donde Aop es el anillo opuesto de A definido como A con la misma adición


pero con producto dado por a · b := ba, para cualesquiera a, b ∈ A.

2. Ejemplos
Calcularemos ahora los homomorfismos de ℤm en ℤn considerados como
ℤ-módulos, es decir, como grupos abelianos (véase el capítulo 3 de [23] para
este mismo cálculo, pero interpretándolos como anillos). Para ello, proba-
mos primero el siguiente hecho más general (véase [11]).
Proposición 4.2.1. Sea R un anillo conmutativo y sean I , J ideales de R. En-
tonces, se tiene el R-isomomorfismo

HomR (R/I , R/ J )  ( J : I)/ J ,

donde
( J : I) := {x ∈ R | I x ⊆ J } ⊇ J
es el ideal cociente de J por I.
40 · Hom

Demostración. Se definen h y hx de la siguiente manera:

h : ( J : I) −→ HomR (R/I , R/ J ) hx : R/I −→ R/ J


x ↦−→ hx r ↦−→ xr

donde r = r + I y xr = xr + J . El lector puede probar, a partir de estas


definiciones, que para cada x ∈ ( J : I), hx es un R-homomorfismo correc-
tamente definido y que h es un R-homomorfismo sobreyectivo con núcleo
J. ✓

Ejemplo 4.2.2. Sean M y N grupos cíclicos y consideremos el grupo


Hom(M , N ). Nótese que en general para grupos abelianos cualesquiera se
tiene que
Hom(M , N ) = Homℤ (M , N ).

Teniendo en cuenta que salvo isomorfismo los grupos cíclicos son de la for-
ma ℤm , m ≥ 0 (véase [22], capítulo 3), el problema se reduce a calcular
Homℤ (ℤm , ℤn ) mediante la proposición 4.2.1:
Caso 1, m = n = 0: Homℤ (ℤ, ℤ)  (0 : 0)/0 = ℤ/0 = ℤ. Así,

Homℤ (ℤ, ℤ)  ℤ.

Caso 2, m = 1, o, n = 1: teniendo en cuenta que ℤ1 = 0, entonces obvia-


mente

Homℤ (0, ℤn ) = 0, para cada n ≥ 0,


Homℤ (ℤm , 0) = 0, para cada m ≥ 0.

Caso 3, m = 0, n ≥ 2:

Homℤ (ℤ, ℤn )  (⟨n⟩ : 0)/⟨n⟩ = ℤn .

Caso 4, m ≥ 2, n = 0:

Homℤ (ℤm , ℤ)  (0 : ⟨m⟩)/0 = 0/0 = 0.

Caso 5, m, n ≥ 2:

Homℤ (ℤm , ℤn )  (⟨n⟩ : ⟨m⟩)/⟨n⟩ = ⟨n/d⟩/⟨n⟩ = ℤd ,

donde d = m. c. d.(m, n).


Hom · 41

Ejemplo 4.2.3. Endℤ (ℤm ) = Endℤm (ℤm )  ℤm , con m = 0, o, m ≥ 2: se-


gún la proposición 4.1.1(iii), Endℤm (ℤm ) es un subanillo de
End(ℤm ) = Endℤ (ℤm ). Recíprocamente, si f un ℤ-endomorfismo de ℤm ,
entonces f es un ℤm -endomorfismo: sean a, r ∈ ℤm , entonces

f (ar) = f (ar) = f (a)r = f (a)r.

Ejemplo 4.2.4. Endℤ (ℚ) = Endℚ (ℚ)  ℚ: por la proposición 4.1.1, se


 ⊆ Endℤ (ℚ). Sea f un ℤ-endomorfismo de ℚ y sean
tiene que Endℚ (ℚ)
a p ap m
b , q ∈ ℚ, con f b q = n . Entonces,
 a  mq a
f p = =f p,
b n b
con lo cual
m a p
=f ,
n b q
y de esta manera f es un ℚ-endomorfismo. Esto prueba que
Endℚ (ℚ) ⊆ Endℤ (ℚ).

Ejemplo 4.2.5. Vamos a describir1 el anillo A := Endℤ (ℤp∞ ): sean


0≠ 𝜑∈ Ay ( ! )
1
n = mı́n k ≥ 1 | 𝜑 k ≠ 0 .
p
 
Veamos que 𝜑 p1n = apn , para algún an ∈ ℤ − 0, con m. c. d.(an , p) = 1:
 
existen an ∈ ℤ − 0 y s ≥ 1, con m. c. d.(an , p) = 1, tales que 𝜑 p1n = apns ; si
s > 1, entonces
! ! !
1 1 1 an
𝜑 n−1 = 𝜑 p · n = p · 𝜑 n = s−1 ≠ 0,
p p p p

lo cual contradice la minimalidad de n. Así,


!
1 an p n−1 an
𝜑 n = = .
p p pn

De igual manera, para cada k ≥ n se tiene que


!
1 a
𝜑 k = nk ,
p p k
1 Este ejemplo corresponde a un ejercicio resuelto por Brian Andrés Zambrano Luna, es-

tudiante de la Carrera de Matemáticas de la Universidad Nacional de Colombia, sede Bogotá.


42 · Hom

con m. c. d.(ak , p) = 1 y ak ∈ ℤ − 0, luego


! !
1 1 1 ak
𝜑 n = 𝜑 p k−n · k = p k−n ak · n = n −k+n ≠ 0,
p p p k p k

por lo tanto, nk − k + n ≥ 1; si nk − k + n > 1, entonces


!
1 ak ak
𝜑 n−1 = p · n −k+n = n −k+n−1 ≠ 0,
p p k p k

pero esto contradice la minimalidad de n. Así, nk = k + (1 − n), y de esta


manera, para cada k ≥ n se tiene que
!
1 p n−1 ak
𝜑 k = , con (ak , p) = 1 y algún ak ∈ ℤ − 0.
p pk

Hemos probado que cada 𝜑 ∈ A induce una sucesión


(0, 0, . . . , p n−1 an , p n−1 an+1 , . . . )
Î
en el anillo producto i ≥1 ℤpi ; definimos entonces la función
Ö
𝛼 : A −→ ℤp i
i ≥1

𝜑 ↦−→ (0, 0, . . . , p n−1 an , p n−1 an+1 , . . . )


Veamos que 𝛼 es un homomorfismo inyectivo de anillos: se tiene
𝛼 (iℤp∞ ) = (1, 1, 1, . . . ) ya que n = 1 y ak = 1, para cada k ≥ 1; si 𝜑, 𝜙 ∈ A,
con 𝛼 (𝜑) = (0, 0, . . . , p n−1 an , . . . ), 𝛼 (𝜙) = (0, 0, . . . , p m−1 bm , . . . ), en-
tonces para cada k ≥ 1 se tiene que
! ! !
1 1 1 p n−1 ak + p m−1 bk
(𝜑 + 𝜙) k = 𝜑 k + 𝜙 k = ,
p p p pk

con lo cual 𝛼 (𝜑 + 𝜙) = (0, 0, . . . , p n−1 ak + p m−1 bk , . . . ) = 𝛼 (𝜑) + 𝛼 (𝜙);


𝛼 (𝜑 ◦ 𝜙) = 𝛼 (𝜑)𝛼 (𝜙) ya que
!! !
1 bk p m−1 m−1 1 m−1 ak p
n−1 bk p m−1 ak p n−1
𝜑 𝜙 k =𝜑 = b k p ·𝜑( ) = b k p · = ;
p pk pk pk pk

sea 𝜑 ≠ 0 con 𝛼 (𝜑) = 0, entonces en particular p n−1 an = 0 en ℤpn , de donde


p | an , falso.
Î
Se ha demostrado así que A es isomorfo a un subanillo de i ≥1 ℤpi (se
puede probar que este subanillo es el anillo de enteros p-ádicos ℤp (véase el
ejercicio 10)).
Hom · 43

3. Bimódulos
A continuación veremos que el Hom entre bimódulos tiene estructura de
bimódulo. Las pruebas son rutinarias y las encomendamos al lector.

Proposición 4.3.1. Sean B, C y D anillos, M un B -C-bimódulo y N un


D-C-bimódulo. Entonces, el grupo HomC (M , N ) de C-homomorfismos es un D-
B-bimódulo con los productos dados por

(d · f ) (m) := d · f (m), (3.1)


( f · b) (m) := f (b · m), (3.2)

donde d ∈ D, f ∈ HomC (M , N ), b ∈ B, m ∈ M.

Proposición 4.3.2. Sean B, C y D anillos, M un C-B-bimódulo y N un


C-D-bimódulo. Entonces, el grupo HomC (M , N ) de C-homomorfismos es un B-
D-bimódulo con los productos dados por

(b · f ) (m) = f (m · b), (3.3)


( f · d) (m) = f (m) · d, (3.4)

donde b ∈ B, d ∈ D, f ∈ HomC (M , N ), m ∈ M.

Definición 4.3.3. Los bimódulos A MB y A NB se dice que son isomorfos


si existe una función biyectiva f : M −→ N tal que para cualesquiera m1 ,
m2 ∈ M, a ∈ A y b ∈ B se cumple

f (m1 + m2 ) = f (m1 ) + f (m2 ),


f (a · m1 ) = a · f (m1 ),
f (m1 · b) = f (m1 ) · b.

Proposición 4.3.4. Sea M un B-A-bimódulo. Entonces, se tiene el siguiente B-


A-isomorfismo
HomA (A, M)  M . (3.5)
Si M es un A-B-bimódulo, se tiene el A-B-isomorfismo

HomA (A, M)  M . (3.6)

Demostración. Basta con mostrar que la siguiente función h establece el iso-


morfismo (3.5) , lo demás es rutinario:

h : HomA (A, M) −→ M
f ↦−→ f (1) ✓

44 · Hom

Ejemplo 4.3.5. La proposición 4.3.1 y la relación (3.5) permiten probar


el isomorfismo Homℤ (ℤ, ℚ)  ℚ: tomando A = ℤ y M = ℚ podemos
aplicar (3.5) y obtener lo anunciado.

A medida que avancemos en el estudio de los módulos nos iremos intro-


duciendo en el ámbito de las categorías (véase [28]) y del álgebra homoló-
gica (véase [29]); muestra de ello lo constituyen las afirmaciones anteriores
y el homomorfismo que presentamos a continuación. Este isomorfismo se-
rá utilizado al final del capítulo 7 para establecer la dimensionalidad de los
anillos conmutativos.

Proposición 4.3.6. Sea f : C MA −→ C NA un C-A-isomorfismo y sea P un


B-A-bimódulo. Entonces,

f ∗ : HomA (N , P) −→ HomA (M , P)
h ↦−→ h f

es un B-C-isomorfismo.

Demostración. Según la proposición 4.3.1, HomA (N , P) y HomA (M , P)


son B-C-bimódulos. Sean h1 , h2 ∈ HomA (N , P) y b ∈ B. Entonces,

f ∗ (h1 + h2 ) = (h1 + h2 ) f = h1 f + h2 f = f ∗ (h1 ) + f ∗ (h2 );


f ∗ (b · h1 ) = (b · h1 ) f ,

y, para todo m ∈ M, se tiene

((b · h1 ) f ) (m) = (b · h1 ) ( f (m)) = b · (h1 ( f (m)))


= b · ((h1 f ) (m)) = (b · (h1 f ))(m),

con lo cual f ∗ (b · h1 ) = b · f ∗ (h1 ). De manera similar se prueba que f ∗ es un


C-homomorfismo.
De otra parte, si f ∗ (h1 ) = f ∗ (h2 ), se tiene h1 f = h2 f , con lo cual
h1 f f −1 = h2 f f −1 , y así, h1 = h2 , es decir, f ∗ es inyectivo. Por último, sea
g ∈ HomA (M , P). Entonces, f ∗ g f −1 = g f −1 f = g, y así, f ∗ es sobreyec-


tivo. □✓

4. Ejercicios
1. Complete la demostración de la proposición 4.2.1.

2. Demuestre las proposiciones 4.3.1 y 4.3.2.


Hom · 45

3. Sea f : C MA −→ C NA un C-A-isomorfismo y sea P un B-A-bimó-


dulo. Entonces,

f∗ : HomA (P , M) −→ HomA (P , N )
h ↦−→ f h

es un C-B-isomorfismo.

4. Sea f : C MA −→ C NA un C-A-homomorfismo sobreyectivo y sea P


un B-A-bimódulo. Demuestre que

f ∗ : HomA (N , P) −→ HomA (M , P)
h ↦−→ h f

es un B-C-homomorfismo inyectivo.

5. Sea f : C MA −→ C NA un C-A-homomorfismo inyectivo y sea P un


B-A-bimódulo. Entonces,

f∗ : HomA (P , M) −→ HomA (P , N )
h ↦−→ f h

es un C-B-homomorfismo inyectivo.

6. Sean M y N A-módulos. Demuestre que HomA (M , N ) es un C-B-


bimódulo, donde B = EndA (M) y C = EndA (N ).

7. Calcule Homℤ (ℚ, ℤ) y Homℤ (ℚ, ℤn ), para n ≥ 2 (sugerencia: su-


ponga que existe un homomorfismo no nulo y recuerde que ℚ no
tiene submódulos maximales).

8. Calcule Homℤ (ℤ, ℤp∞ ) y Homℤ (ℤp∞ , ℤ).

9. Demuestre que ℤp∞  ℤq∞ si, y sólo si, p = q, donde p y q son primos.

10. Sea p un irreducible de ℤ. El anillo de enteros p-ádicos es el subanillo


Î
del anillo producto i ≥1 ℤpi definido por
( )
Ö
ℤp := (xi ) ∈ ℤpi | 𝛼i j (x j ) = xi , i ≤ j ,
i ≥1

con 𝛼i j : ℤp j −→ ℤpi , x ↦−→ x (ℤ-homomorfismo canónico). De-


muestre que Endℤ (ℤp∞ )  ℤp (sugerencia: demuestre que el subani-
llo del ejemplo 4.2.5 coincide con ℤp ).
46 · Hom

11. Sean A un anillo e I un ideal derecho de A. Se define el idealizador


de I (en inglés, idealizer) por 𝕀(I) := {a ∈ A | aI ⊆ I }. Demuestre
que:

(i) 𝕀(I) es el mayor subanillo de A en el cual I es un ideal bilátero.


(ii) Si I es propio, note que I ≠ 𝕀(I). Demuestre el isomorfismo
de anillos 𝕀(I)/I  EndA (A/I) (el anillo 𝕀(I)/I se denomina el
anillo propio de I (en inglés, eigenring, véase [32])).
(iii) Si R es un anillo conmutativo, demuestre que 𝕀(I) = R e
𝕀(I)/I = R/I.
Capítulo
cinco
Producto y suma
directa
Producto y suma directa · 49

Este capítulo está dedicado a realizar dos construcciones universales clásicas


del álgebra en el caso de los módulos: el producto y la suma directa externa,
esta última conocida también como coproducto.

1. Producto
Sean C un conjunto no vacío, A y B anillos, {Mi }i ∈ C una familia no vacía
Î
de B-A-bimódulos y i ∈ C Mi el producto de la familia dada, es decir,
( )
Ö Ø
Mi = f : C −→ Mi | f (i) ∈ Mi , para cada i ∈ C .
i∈C i∈C
Al escribir fi := f (i), para cada i ∈ C, los elementos del producto cartesiano
pueden ser denotados más sencillamente como f = ( fi )i ∈ C, o simplemen-
Î
te, f = ( fi ). i ∈ C Mi tiene una estructura natural de B-A-bimódulo de la
siguiente manera:
Î
Suma: dados f = ( fi ), g = (gi ) ∈ i ∈ C Mi , definimos
f + g = ( fi + gi ).
Î
Producto escalar: dados f = ( fi ) ∈ i ∈ C Mi , a ∈ A y b ∈ B, definimos
b · f = (b · fi ),
f · a = ( fi · a).
Î
Proposición 5.1.1. Las operaciones anteriores definen en i ∈ C Mi una estruc-
tura de B-A-bimódulo, y se denomina el producto cartesiano de la familia de
B-A-bimódulos {Mi }i ∈ C.
Demostración. Las propiedades de B-A-bimódulo de cada Mi inducen la es-
tructura sobre el producto cartesiano. ✓

Observación 5.1.2. El producto de una familia vacía de bimódulos, es de-


cir, cuando C = ∅, es por definición nulo. Si B = ℤ, entonces la cons-
trucción anterior puede interpretarse como el producto de una familia de
A-módulos derechos.
Proposición 5.1.3. Las proyecciones del producto cartesiano definidas por
Ö
𝜋j : Mi −→ M j ,
i∈C
𝜋 j ( f ) := f j
son B-A-homomorfismos sobreyectivos, con f := ( fi ).
Demostración. La extracción de la j-ésima componente respeta las sumas y
el producto por escalares. ✓

50 · Producto y suma directa

2. Suma directa externa


Î
Sea f = ( fi ) ∈ i ∈ C Mi , se define el soporte de f por Cf := {i ∈ C | fi ≠ 0}.
Î É
Consideremos entonces en i ∈ C Mi el subconjunto i ∈ C Mi constituido
por los elementos f = ( fi ) tales que Cf es finito. Es decir,
( )
Ê Ö
Mi := f ∈ Mi | Cf es finito .
i∈C i∈C
É Î
Proposición 5.2.1. i ∈ C Mi es un sub-bimódulo de i ∈ C Mi , llamado la su-
ma directa externa de la familia {Mi }i ∈ C.
É É
Demostración. i∈CM ≠ ∅ ya que 0 ∈ i ∈ C Mi (en efecto, C0 = ∅). Para
Éi
f = ( fi ), g = (gi ) ∈ M
i∈C i ; sea h = f + g, entonces Ch ⊆ Cf ∪ Cg es
É
finito, luego h ∈ i ∈ C Mi .
De otra parte, si a ∈ A, sea k := f · a, entonces Ck ⊆ Cf , y por tanto,
É É
k∈ i ∈ C Mi . En forma similar, si b ∈ B, entonces b · f ∈ i ∈ C Mi .

Proposición 5.2.2. Las inyecciones de la suma directa externa definidas por


Ê
𝜇 j : M j −→ Mi ,
i∈C
𝜇 j (m) := f = ( fi ),

con m ∈ M j y
(
0, si i ≠ j,
fi :=
m, si i = j,
son B-A-homomorfismos inyectivos.

Demostración. Ejercicio para el lector. ✓


Observación 5.2.3. (i) Nótese que para una familia finita de bimódulos se
tiene la igualdad
Ön Ên
Mi = Mi ,
i=1 i=1

es decir, el producto cartesiano y la suma directa externa coinciden. Este


producto finito se denota por M1 × M2 × . . . × Mn , y sus elementos por
medio de n-tuplas,

M1 × M2 × . . . × Mn = {(m1 , . . . , mn ) | mi ∈ Mi , 1 ≤ i ≤ n}.
Producto y suma directa · 51

(ii) Cuando todos los elementos de la familia dada {Mi }i ∈ C son un mis-
mo bimódulo M, entonces el producto se denota por M C y la suma directa
externa por M ( C) . Si C es finito y | C| = n, se escribe simplemente M n .
(iii) Como ya se mencionó en la observación 5.1.2, si C = ∅, entonces
Î É
por definición i ∈∅ Mi = 0 y i ∈∅ Mi = 0.
É
(iv) Cada elemento no nulo f = ( fi ) ∈ i ∈ C Mi se puede escribir en la
forma ∑︁
f = ( fi ) = 𝜇 i ( fi ),
i ∈ Cf

donde los 𝜇 i son las inyecciones de la suma.

3. Propiedades
Î
Lema 5.3.1. Dada {Mi }i ∈ C una familia de B-A-bimódulos, i ∈ C Mi su pro-
É
ducto cartesiano, i ∈ C Mi su suma directa externa, {𝜋 j } j ∈ C las proyecciones y
{ 𝜇 j } j ∈ C las inyecciones, entonces

(i) (Propiedad universal del producto) Para cada B-A-bimódulo M y ca-


da familia de B-A-homomorfismos {p j : M −→ M j } j ∈ C, existe un único
Î
B-A-homomorfismo p : M −→ i ∈ C Mi tal que 𝜋 j p = p j , para cada
j ∈ C.

(ii) (Propiedad universal de la suma) Para cada B-A-bimódulo M y ca-


da familia de B-A-homomorfismos {v j : M j −→ M } j ∈ C, existe un único
É
B-A-homomorfismo v : i ∈ C Mi −→ M tal que v 𝜇 j = v j , para cada
j ∈ C.
Î
Demostración. (i) Para m ∈ M, se define p : M −→ i ∈ C Mi por
p(m) := (p j (m)). Es inmediato que p es un B-A-homomorfismo para el
cual se cumple la relación 𝜋 j p = p j , para cada j ∈ C.
p es único con esta condición: en efecto, sea p ′ : M −→ i ∈ C Mi otro
Î

B-A-homomorfismo tal que 𝜋 j p ′ = p j , para cada j ∈ C. Entonces, dado


m ∈ M,
(𝜋 j p ′)(m) = 𝜋 j (p ′ (m)) = 𝜋 j ((g j )),
donde p ′ (m) := g = (gi ) ∈ i ∈ C Mi . Resulta, (𝜋 j p ′)(m) = g j = p j (m), es
Î

decir, g = (p j (m)), y por tanto, p ′ (m) = p(m).


É
(ii) Para f = ( fi ) ∈ i ∈ C Mi , se define v de la siguiente manera:
(
0, si f = 0,
v( f ) := Í
j ∈ Cf v j ( f j ), si f ≠ 0.
52 · Producto y suma directa

É
v es un B-A-homomorfismo: en efecto, sean f = ( fi ), g = (gi ) ∈ i ∈ C Mi .
Si f = 0, o, g = 0, entonces v( f + g) = v( f ) + v(g). Supongamos que f ≠ 0
y g ≠ 0, y sea h = (hi ) = f + g. Si h = 0, entonces gi = −fi , para cada i ∈ C,
luego ∑︁ ∑︁
v(h) = 0 = v j ( fj ) + v j (g j ) = v( f ) + v(g).
j ∈ Cf j ∈ Cg

Sea h ≠ 0. Ya que Ch ⊆ Cf ∪ Cg , entonces


∑︁ ∑︁
v(h) = v j (h j ) = v j (h j ).
j ∈ Ch j ∈ Cf ∪ Cg

Resulta,
∑︁ ∑︁ ∑︁
v (h) = v j ( fj + gj ) = v j ( fj ) + v j (g j )
j ∈ Cf ∪ Cg j ∈ Cf ∪ Cg j ∈ Cf ∪ Cg
∑︁ ∑︁
= v j ( fj ) + v j (g j ) = v( f ) + v(g).
j ∈ Cf j ∈ Cg
É
De manera análoga se prueba que para f ∈ i ∈ C Mi , a ∈ A y b ∈ B,
v( f · a) = v( f ) · a, v(b · f ) = b · v( f ).
Sea ahora m ∈ M j , entonces (v 𝜇 j ) (m) = v( f ), donde f = ( fi ), con
f j = m, y fi = 0, para i ≠ j. De aquí, v( f ) = v j ( f j ), es decir, v 𝜇 j = v j , para
cada j ∈ C.
Probemos ahora la unicidad del homomorfismo v. Sea v ′ un B-A-homo-
morfismo de i ∈ C Mi en M tal que v ′ 𝜇 j = v j , para cada j ∈ C; sea f = ( fi )
É

É
en i ∈ C Mi . Si f = 0, entonces v ( f ) = v( f ) = 0. Si f ≠ 0, entonces
∑︁ ∑︁
v( f ) = v j ( fj ) = (v ′ 𝜇 j )( f j )
j ∈ Cf j ∈ Cf
∑︁ ∑︁
= v ′ ( 𝜇 j ( f j )) = v ′ ( 𝜇 j ( f j )) = v ′ ( f ). ✓

j ∈ Cf j ∈ Cf

Corolario 5.3.2. Dada {Mi }i ∈ C una familia de bimódulos, su producto y su suma


directa externa están caracterizados unívocamente, salvo isomorfismo, por sus res-
pectivas propiedades universales.

Demostración. Sea P un B-A-bimódulo y p j : P −→ M j , j ∈ C, homo-


morfismos con la propiedad universal (i) del lema anterior; existen homo-
morfismos p y p ′ tales que, para cada j ∈ C, 𝜋 j p = p j y p j p ′ = 𝜋 j . De aquí
obtenemos las relaciones

𝜋 j (pp ′) = 𝜋 j , p j (p ′ p) = p j , j ∈ C.
Producto y suma directa · 53

Î
Aplicando nuevamente la propiedad universal para i ∈ C Mi y P, encontra-
mos necesariamente que

iÎi∈ C Mi = pp ′ e iP = p ′ p,
Î
es decir, P  i ∈ C Mi .
La propiedad para la suma se demuestra de manera análoga. ✓

Otra consecuencia inmediata del lema 5.3.1 es el siguiente corolario.

Corolario 5.3.3. Sea 𝜃 : C −→ C una función biyectiva. Entonces,


Ö Ö
Mi  M𝜃 (i) ,
i∈C i∈C
Ê Ê
Mi  M𝜃 (i) .
i∈C i∈C

Demostración. Ejercicio para el lector. ✓


Las dos proposiciones siguientes establecen relaciones entre sumas, pro-


ductos y B-A-homomorfismos. Las pruebas de ellas constituyen un intere-
sante ejercicio que queda a cargo del lector.
Î
Proposición 5.3.4. Sea {Mi }i ∈ C una familia de B-A-módulos, i ∈ C Mi su
É
producto y i ∈ C Mi su suma directa externa junto con las proyecciones {𝜋 j } j ∈ C e
inyecciones { 𝜇 j } j ∈ C. Entonces,
(
0, si i ≠ j,
(i) 𝜋i 𝜇 j =
iM j , si i = j.

(ii) ( 𝜇 j 𝜋 j ) 2 = 𝜇 j 𝜋 j , para cada j ∈ C.


É Î
(iii) Existe un único B-A-homomorfismo 𝛿 : i ∈ C Mi −→ i ∈ C Mi tal que
(
0, si i ≠ j,
𝜋i 𝛿 𝜇 j = 𝛿i j =
iM j , si i = j.

(iv) Si C := {1, 2, . . . , n}, entonces 𝛿 = iM1 ×M2 ×...×Mn , y además,


n
∑︁
𝜇 j 𝜋 j = iM1 ×M2 ×···×Mn .
j=1

Demostración. Ejercicio para el lector. ✓



54 · Producto y suma directa

Proposición 5.3.5. Dadas {Mi }i ∈ C y {Ni }i ∈ C dos familias de B-A-bimódulos


(indizadas por un mismo conjunto C), y {𝛼i : Mi −→ Ni }i ∈ C, una familia de
B-A-homomorfismos, entonces
Î Î Î
(i) Existe un único B-A-homomorfismo i ∈ C 𝛼i : i ∈ C Mi −→ i ∈ C Ni ,
denominado producto cartesiano de la familia de homomorfismos {𝛼i }i ∈ C,
tal que para cada i ∈ C el diagrama
Ö Î Ö
Mi i∈ C 𝛼i
- Ni
i∈C i∈C

𝜋i 𝜋i

? ?
Mi 𝛼i
- Ni

es conmutativo.
É É É
(ii) Existe un único B-A-homomorfismo i ∈ C 𝛼i : i ∈ C Mi −→ i ∈ C Ni ,
denominado suma directa externa de la familia de homomorfismos {𝛼i }i ∈ C,
tal que para cada i ∈ C el diagrama
Ê É Ê
Mi i∈ C 𝛼i
- Ni
i∈C i∈C
6 6
𝜇i 𝜇i

Mi 𝛼i
- Ni

es conmutativo.
Î
(iii) (a) i ∈ C 𝛼i Ées inyectivo si, y sólo si, para cada i ∈ C, 𝛼i es inyectivo si,
y sólo si, i ∈ C 𝛼i es inyectivo.
Î
(b) i ∈ C 𝛼i es sobreyectivo
É
si, y sólo si, para cada i ∈ C, 𝛼i es sobreyectivo
si, y sólo si, i ∈ C 𝛼i es sobreyectivo.
Î
(c) i ∈ C 𝛼i es isomorfismo
É
si, y sólo si, para cada i ∈ C, 𝛼i es isomorfismo
si, y sólo si, i ∈ C 𝛼i es isomorfismo.
Î Î
(iv) (a) ker ( i ∈ C 𝛼i ) = i ∈ C ker(𝛼i ).
É  É
(b) ker i ∈ C 𝛼i = i ∈ C ker(𝛼i ).
Î Î
(v) (a) Im ( i ∈ C 𝛼i ) = i ∈ C Im (𝛼i ).
Producto y suma directa · 55

É  É
(b) Im i ∈ C 𝛼i = i ∈ C Im (𝛼i ).

Demostración. Ejercicio para el lector. ✓


El teorema que presentamos a continuación habitualmente se prueba


para familias de A-módulos, donde el isomorfismo resultante es de grupos
abelianos. Nosotros lo demostramos en una forma más general para bimó-
dulos.

Teorema 5.3.6. Si {Mi }i ∈ C y {N j } j ∈ D son familias de B-A-bimódulos y


C-A-bimódulos, respectivamente, entonces se tiene el C-B-isomorfismo

©Ê Ö ª Ö
HomA ­ Mi , Nj ®  HomA (Mi , N j ).
« i ∈ C j ∈ D ¬ (i , j) ∈ C× D

En particular, se tienen los C-B-isomorfismos

Ö ª Ö
HomA ­M , Nj ®  HomA (M , N j ),
©

« j∈D ¬ j∈D
y !
Ê Ö
HomA Mi , N  HomA (Mi , N ),
i∈C i∈C

donde M es un B-A-bimódulo y N un C-A-bimódulo.

Demostración. Simplificamos la notación y escribimos

©Ê Ö ª
H := HomA ­ Mi , Nj ® ,
i ∈ C j ∈ D
Ö « ¬
P := HomA (Mi , N j ).
(i , j) ∈ C× D

Por la proposición 4.3.1, H y P son C-B-módulos. Para (i , j) ∈ C × D


fijo y f ∈ H se induce una función de Mi en N j por medio del siguiente
diagrama:
Ê Ö
Mi f Nj
-
i∈C j∈D

6
𝜇i 𝜋j

?
Mi - Nj
𝜋 j f 𝜇i
56 · Producto y suma directa

Puesto que 𝜇 i , f y 𝜋 j son A-homomorfismos, entonces 𝜇 i f 𝜋 j es también


un A-homomorfismo. Definimos entonces

𝛼 : H ↦−→ P ,
𝛼 ( f ) := (𝜋 j f 𝜇 i ).

Veamos ahora que 𝛼 es un C-B-homomorfismo. En efecto, sean f1 , f2 ∈ H ,


entonces

𝛼 ( f1 + f2 ) = (𝜋 j ( f1 + f2 ) 𝜇 i )
= (𝜋 j f1 𝜇 i + 𝜋 j f2 𝜇 i )
= 𝛼 ( f1 ) + 𝛼 ( f2 ).

Dados f ∈ H y c ∈ C se tiene que 𝛼 (c · f ) = (𝜋 j (c · f ) 𝜇 i ). Si m ∈ Mi ,


entonces

[𝜋 j (c · f ) 𝜇 i ] (m) = [𝜋 j (c · f )] ( 𝜇 i (m)) = 𝜋 j [(c · f )( 𝜇 i (m))]


= 𝜋 j [c · ( f ( 𝜇 i (m)))] = c · [𝜋 j ( f ( 𝜇 i (m)))]
= c · [(𝜋 j f 𝜇 i ) (m)] = [c · (𝜋 j f 𝜇 i )] (m),

con lo cual 𝜋 j (c· f ) 𝜇 i = c·(𝜋 j f 𝜇 i ), es decir, 𝛼 (c· f ) = c·𝛼 ( f ). Análogamente,


𝛼 ( f · b) = 𝛼 ( f ) · b, para todo b ∈ B.
Falta mostrar que 𝛼 es inyectiva y sobreyectiva. Si f1 , f2 ∈ H son tales
que 𝛼 ( f1 ) = 𝛼 ( f2 ), entonces se tiene que 𝜋 j f1 𝜇 i = 𝜋 j f2 𝜇 i , para cada i ∈ C
y cada j ∈ D. Por la propiedad universal del producto resulta f1 𝜇 i = f2 𝜇 i ,
y por la propiedad universal de la suma, f1 = f2 .
Para ver que 𝛼 es sobreyectiva, sea w = (wi j ) ∈ P. Fijando i ∈ C, consi-
deremos la familia de A-homomorfismos wi j , j ∈ D. La propiedad univer-
Î
sal del producto j ∈ D N j , considerado como A-módulo, garantiza la exis-
Î
tencia de un único A-homomorfismo 𝛾i : Mi −→ j ∈ D N j tal que 𝜋 j 𝛾i =
wi j , para cada j ∈ D. Como lo anterior es válido para cada i ∈ C, entonces
É
la propiedad universal de la suma i ∈ C Mi , considerada
É
como A-módulo,
Î
garantiza la existencia de un A-homomorfismo f : i ∈ C Mi −→ j ∈ D Nj
tal que f 𝜇 i = 𝛾i , para cada i ∈ C. Resulta entonces que 𝜋 j f 𝜇 i = wi j , para
cada (i , j) ∈ C × D, es decir, 𝛼 ( f ) = (𝜋 j f 𝜇 i ) = (wi j ) = w. ✓

Finalizamos esta sección con un resultado técnico sobre anillos conmu-


tativos, el cual usaremos en el capítulo 8. Sean R un anillo conmutativo, I
un ideal de R y r ∈ R. El conjunto

(I : r) := {s ∈ R | rs ∈ I }
Producto y suma directa · 57

es un ideal de R (en efecto, (I : r) = (I : ⟨r⟩)), y por tanto se puede conside-


rar el R-módulo cociente R/(I : r). De otra parte, (R/I) · r := {s · r | s ∈ R}
es un R-módulo. Tenemos entonces el R-isomorfismo

R/(I : r)  (R/I) · r , (3.1)

inducido por el homomorfismo sobreyectivo f : R −→ (R/I) · r, definido


por f (s) := s · r, y con núcleo (I : r).
Proposición 5.3.7. Sean R un anillo conmutativo e I1 , I2 , . . . , It ;
J1 , J2 , . . . , Jr ideales propios de R tales que
(i) I1 ≥ I2 ≥ · · · ≥ It ; J1 ≥ J2 ≥ · · · ≥ Jr .

(ii) R/I1 ⊕ · · · ⊕ R/It  R/ J1 ⊕ · · · ⊕ R/ Jr (R-isomorfismo).


Entonces, t = r e Ii = Ji , para cada 1 ≤ i ≤ t.
Demostración. Sea I un ideal maximal de R que contiene a I1 . Como
1 ∈ (I : Ii ), entonces (I : Ii ) = R, para cada 1 ≤ i ≤ t. Aplicamos
HomR (−, R/I) a (ii), y obtenemos el R/I-isomorfismo
t
Ê r
Ê
HomR (R/Ii , R/I)  HomR (R/ Ji , R/I).
i=1 i=1

Según la proposición 4.2.1 se tienen los siguientes R-isomorfismos

HomR (R/Ii , R/I)  (I : Ii )/I , 1 ≤ i ≤ t, (3.2)


HomR (R/ J j , R/I)  (I : J j )/I , 1 ≤ j ≤ r. (3.3)

Recordemos cómo están definidos estos isomorfismos: para 1 ≤ j ≤ t,

fi : (I : Ii )/I −→ HomR (R/Ii , R/I) fx : R/Ii −→ R/I


x ↦→ fx r ↦→ xr

Como ((I : Ii )/I) · I = 0, entonces (I : Ii )/I es un R/I-módulo mediante


el producto x · r := xr, con x ∈ (I : Ii ) y r ∈ R. Nótese que entonces cada fi
es también un R/I-isomorfismo:

fi (x · s) = fi (xs) = fxs ,
fxs (r) = xsr = xr · s = fx (r) · s = ( fx · s)(r),

es decir, fi (x · s) = fi (x) · s. De manera análoga se establece que en (3.3) se


tienen R/I-isomorfismos. De (3.2) obtenemos el R/I-isomorfismo
r
Ê
(R/I) t  (I : J j )/I . (3.4)
j=1
58 · Producto y suma directa

Puesto que I es maximal y, para cada 1 ≤ j ≤ r, I ⊆ (I : J j ), resulta


(I : J j ) = R ó (I : J j ) = I. De (3.4) se obtiene entonces el R/I-isomorfismo

(R/I) t  (R/I) s , s ≤ r.

Teniendo en cuenta la dimensionalidad del cuerpo R/I, obtenemos


t = s ≤ r. Por la simetría del problema, r ≤ t, es decir, t = r.
Supongamos ahora que existe un i tal que Ii ≠ Ji y sea i0 mínimo con
dicha propiedad. Sea a ∈ Ii0 , a ∉ Ji0 . Entonces,

(Ik : a) = R, para k ≤ i0 ;
( Jk : a) = R, para k < i0 , ya que Ik = Jk ;
( Jk : a) ≠ R, para k ≥ i0 .
Ét Ét
Sean M := i=1 R/Ii y N := i=1 R/ Ji . Como M  N , entonces
M · a  N · a; aplicando el isomorfismo de (3.1) encontramos

R/(Ii0 +1 : a) ⊕ · · · ⊕ R/(It : a)  R/( Ji0 : a) ⊕ · · · ⊕ R/( Jt : a), (3.5)

además, ( Ji0 : a) ≥ ( Ji0 +1 : a) ≥ · · · ≥ ( Jt : a) son ideales propios de R, ya


que el primero de ellos es propio. También,

(Ii0 +1 : a) ≥ (Ii0 +2 : a) ≥ · · · ≥ (It : a)

son ideales de R, posiblemente no todos propios; pero de todos modos el


número de sumandos en la parte izquierda de (3.5) es estrictamente menor
que en la derecha, lo cual contradice lo establecido en (i). En consecuencia
Ii = Ji , para 1 ≤ i ≤ t. ✓

4. Ejercicios
1. Demuestre la proposición 5.2.2.

2. Demuestre el corolario 5.3.3.

3. Demuestre la proposición 5.3.4.

4. Demuestre la proposición 5.3.5.

5. Calcule Homℤ (ℤ3 , ℤ6 ⊕ ℤ15 ), Homℤ (ℤ6 ⊕ ℤ15 , ℤ3 ) y


Homℤ (ℤ6 ⊕ ℤ15 , ℤ6 ⊕ ℤ15 ).

6. Calcule Homℤ (ℤ ⊕ ℤp∞ , ℤ).


Producto y suma directa · 59

7. Sean A un anillo y An [x] el conjunto de polinomios con coeficientes


en A de grado ≤ n. Considere a An [x] como módulo sobre A. Calcule
HomA (An [x] , A).

8. Calcule Homℤ (ℤn [x] , ℤp∞ ).

9. Sean A un anillo y A[x] el conjunto de polinomios con coeficientes en


A. Considere a A[x] como módulo sobre A. Calcule HomA (A[x] , A).

10. Calcule Homℤ (ℤ[x] , ℤp∞ ).


Capítulo
seis
Suma directa
interna
Suma directa interna · 63

En este capítulo se estudia la suma directa de una familia de submódulos de


un módulo dado y su relación con la suma externa de módulos. Este estudio
será útil en el próximo capítulo para la descripción de los módulos libres.

1. Definición y caracterizaciones
Definición 6.1.1. Sean M un A-módulo y {Mi }i ∈ C una familia de submó-
dulos de M. Se dice que M es suma directa interna de la familia si
Í
(i) M = i ∈ C Mi .
Í 
(ii) i≠ j Mi ∩ M j = 0, para cada j ∈ C.

En tal caso se denota ∑︁


M= ⊕Mi .
i∈C

Si C = {1, . . . , n} es finito, se escribe M = M1 ⊕ · · · ⊕ Mn .

Proposición 6.1.2. Sea {Mi }i ∈ C una familia de submódulos del módulo M tal
Í
que M = i ∈ C Mi . Las siguientes condiciones son equivalentes:
Í
(i) M = i ∈ C ⊕Mi .

(ii) Para cada subconjunto finito {i1 , . . . , in } de índices diferentes en C se cum-


ple
mi1 + · · · + min = 0 ⇔ mik = 0,
con mik ∈ Mik , 1 ≤ k ≤ n.

(iii) Para cada subconjunto finito {i1 , . . . , in } de índices diferentes en C se cum-


ple
mi1 + · · · + min = mi′1 + · · · + mi′n ⇔ mik = mi′k , (1.1)
con mik , mi′ ∈ Mik , 1 ≤ k ≤ n.
k

Demostración. (i) ⇒(ii): sea {i1 , . . . , in } un subconjunto de índices diferentes


de C tales que mi1 + · · · + min = 0, donde mik ∈ Mik , para cada 1 ≤ k ≤ n.
Fijando el subíndice k, se tiene

mik = −mi1 − mi2 − · · · − mik−1 − mik+1 − · · · − min ,


Í
luego mik ∈ Mik ∩ j≠ik Mi , de donde, mik = 0, para cada 1 ≤ k ≤ n.
Recíprocamente, si se da esta última condición se cumple que
mi1 + · · · + min = 0.
64 · Suma directa interna

(ii) ⇒(iii): sea {i1 , . . . , in } un subconjunto de índices diferentes de C ta-


les que se cumple (1.1) . Entonces, (mi1 − mi′1 ) + · · · + (min − mi′n ) = 0, y por
(ii) obtenemos mik = mi′ , para cada 1 ≤ k ≤ n.
k
Recíprocamente, si se da esta última condición, entonces

mi1 + · · · + min = mi′1 + · · · + mi′n .


Í
(iii) ⇒(i): sea j ∈ C un índice fijo, y sea m ∈ M j ∩ i≠ j Mi ; entonces exis-
ten índices diferentes i1 , . . . , in ∈ C, tales que j ∉ {i1 , . . . , in }, y además,

m = mi1 + · · · + mim , donde mik ∈ Mik , para cada 1 ≤ k ≤ m.

La igualdad anterior se puede escribir como

mi′1 + · · · + mi′n + m = mi1 + · · · + mim + m j ,

donde mi′ = 0, para cada 1 ≤ k ≤ m y m j = 0. Según (iii), m = m j , por lo


k

Í
tanto, M j ∩ i≠ j Mi = 0. □

Corolario 6.1.3. Sea {Mi }i ∈ C una familia de submódulos del A-módulo M, M


es suma directa interna de la familia si, y sólo si, cada elemento m ∈ M tiene una
representación única (salvo sumandos nulos) en la forma

m = mi1 + · · · + min , (1.2)

donde mik ∈ Mik , 1 ≤ k ≤ n, y los índices i1 , . . . , in son diferentes.

Demostración. Esto es consecuencia directa de la proposición anterior. □ ✓


É
Proposición 6.1.4. Sea {Mi }i ∈ C una familia de A-módulos y M = i ∈ C Mi
su suma directa externa. Si Mi′ := 𝜇 i (Mi ) es la imagen de Mi mediante la inyección
canónica 𝜇 i , entonces

(i) M = i ∈ C ⊕Mi′.
Í

(ii) Mi′  Mi , para cada i ∈ C.

Demostración. Teniendo en cuenta que 𝜇 i es un A-homomorfismo inyectivo


para cada i ∈ C, entonces la afirmación (ii) es evidente.
Sea m = (mi ) ∈ M. Si m = 0, entonces m ∈ i ∈ C Mi′. Si m ≠ 0, entonces
Í

∑︁ ∑︁
m= 𝜇 j (m j ) ∈ Mi′ ,
j ∈ Cm i∈C

es decir, M =
Í ′
i ∈ C Mi .
Suma directa interna · 65

Sea {i1 , . . . , in } un subconjunto de índices diferentes en C, y

mi′1 ∈ Mi′1 , . . . , mi′n ∈ Mi′n ,

tales que mi′1 + · · · + mi′n = 0. Entonces, existen mi1 ∈ Mi1 , . . . , min ∈ Min
tales que mi′ = 𝜇 ik (mik ), 1 ≤ k ≤ n. Resulta, 𝜇 i1 (mi1 ) + · · · + 𝜇 in (min ) = 0.
k É
Consideremos en M = i ∈ C Mi el elemento m = (m j ), donde
(
0, si j ∉ Cm = {i1 , . . . , in },
mj =
mik si j = ik , 1 ≤ k ≤ n.
Í
Entonces, m = j ∈ Cm 𝜇 j (m j ) = 0, de donde se desprende que m j = 0, para
cada j ∈ C; en particular, mik = 0, para cada 1 ≤ k ≤ n. Esto implica que
mi′ = 0, para cada 1 ≤ k ≤ n, y así, la suma es directa. ✓

k

Observación 6.1.5. Si C = In := {1, 2, . . . , n}, entonces

Mi′ = {(0, . . . , mi , . . . , 0) | mi ∈ Mi }, 1 ≤ i ≤ n.

La siguiente proposición es en cierto sentido el recíproco de la proposi-


cón 6.1.4.

Proposición 6.1.6. Si {Mi }i ∈ C es una familia de submódulos de M tales que


Í
M = i ∈ C ⊕Mi , entonces Ê
M Mi .
i∈C

Demostración. La idea central es aplicar la propiedad universal de la suma


directa externa. Los detalles quedan a cargo del lector. ✓

Proposición 6.1.7. Sea {Mi }i ∈ C una familia de A-módulos. Entonces, para cada
j∈ C !
Ê Ê
Mi /M j  Mi .
i∈C i≠ j
Ð É
Demostración. Asignando a cada elemento f : C −→ i ∈ C Mi de i ∈ C Mi
su restricción a C − { j}, obtenemos un A-homomorfismo sobreyectivo de
É É
i ∈ C Mi en i≠ j Mi con núcleo M j .

2. Sumando directo
De particular importancia en la teoría de módulos es el concepto de irredu-
cibilidad que presentamos a continuación.
66 · Suma directa interna

Definición 6.2.1. Sean M un A-módulo y N un submódulo de M.

(i) Se dice que N es un sumando directo de M si existe un submódulo


N ′ de M tal que M = N ⊕ N ′.

(ii) Se dice que M es irreducible (o indescomponible) si 0 y M son sus


únicos sumandos directos. M es reducible si no es irreducible. El mó-
dulo nulo por definición es irreducible.

Ejemplo 6.2.2. Evidentemente todo módulo simple es irreducible. La afir-


mación recíproca no es cierta, tal como lo ilustran los siguientes ejemplos:

(i) ℤ es irreducible: en efecto, sean ⟨m⟩ y ⟨n⟩ subgrupos de ℤ tales que


ℤ = ⟨m⟩ ⊕ ⟨n⟩. Puesto que mn ∈ ⟨m⟩ ∩ ⟨n⟩ = 0, entonces m = 0, o,
n = 0.

(ii) Sea R un DIP y p un irreducible de R. Según el ejemplo 2.3.2, Rp∞


es un R-módulo irreducible.

Ejemplo 6.2.3. Sea m ≥ 2 y ℤm el grupo de los enteros módulo m. Según


el ejemplo 3.3.1, los subgrupos de ℤm son de la forma ℤr con r | m. Veamos
que  m
ℤr es sumando directo de ℤm ⇔ m. c. d. r , = 1.
r
⇒): existe s | m tal que ℤm = ℤr ⊕ ℤs . Por razones de cardinalidad m = rs.
Sea d = m. c. d.(r , s). Entonces, d | r, d | s, y tanto en ℤr como en ℤs , hay
un subgrupo de orden d. Pero ℤr ∩ ℤs = 0 y en ℤm sólo hay un subgrupo
de orden d. Resulta entonces que d = 1.
⇐): sean r y s positivos tales que m. c. d.(r , s) = 1 y rs = m. Entonces,

⟨s⟩ ⊕ ⟨r⟩ = ℤm .

En efecto, de m. c. d.(r , s) = 1 resulta ℤm = ⟨s⟩+⟨r⟩. Como rs = m, entonces


el mínimo común múltiplo de r y s es m, por tanto, ⟨r⟩ ∩ ⟨s⟩ = 0.
Nótese que ℤm es irreducible si, y sólo si, m es potencia de un primo.

Definición 6.2.4. Sea f : M1 −→ M2 un A-homomorfismo.

(i) Si f es inyectivo, se dice que f es hendido si Im( f ) es un sumando


directo de M2 .

(ii) Si f es sobreyectivo, se dice que f es hendido si ker( f ) es un sumando


directo de M1 .

Proposición 6.2.5. Sea f : M1 −→ M2 un A-homomorfismo. Entonces,


Suma directa interna · 67

(i) f es inyectivo hendido si, y sólo si, existe un homomorfismo de módulos


g : M2 −→ M1 tal que g f = iM1 .

(ii) f es sobreyectivo hendido si, y sólo si, existe un homomorfismo de módulos


g : M2 −→ M1 tal que f g = iM2 .
Demostración. (i) ⇒): sea M2′ un submódulo de M2 tal que
M2 = M2′ ⊕ Im( f ). Cada elemento m ∈ M2 tiene una representación única
en la forma m = m ′ + y, donde m ′ ∈ M2′ y y ∈ Im( f ). Como f es inyectivo,
existe un único x ∈ M1 tal que f (x) = y, luego m = m ′ + f (x), donde x está
unívocamente determinado por m. Se define

g : M2 −→ M1
m ↦−→ g (m) := x,

el cual, por lo que se acaba de decir, es evidentemente un A-homomorfismo.


Para w ∈ M1 se tiene que (g f ) (w) = g (0) + g f (w) = w, con lo cual g f = iM1 .
⇐): según la proposición 3.1.3, f es inyectivo. Veamos ahora que

M2 = ker(g) ⊕ Im( f ).

Sea y ∈ M2 , entonces y = y − ( f g)(y) + ( f g)(y), donde


( f g) (y) = f (g (y)) ∈ Im( f ), y además, y − f (g (y)) ∈ ker(g) ya que

g (y − f (g (y))) = g (y) − (g f )(g (y)) = g (y) − g (y) = 0.

Se tiene así que M2 = ker(g) + Im( f ). Supongamos ahora que


y ∈ ker(g) ∩ Im( f ), entonces g (y) = 0 y y = f (x) para algún x ∈ M1 ,
luego g ( f (x)) = x = g (y) = 0, de donde y = 0.
(ii) ⇒): sea M1′ un submódulo de M1 tal que M1 = M1′ ⊕ ker( f ). Dado
m ∈ M2 , existe x ∈ M1 tal que f (x) = m; x determina unívocamente ele-
mentos x1 ∈ M1′ y x2 ∈ ker( f ) tales que x = x1 + x2 . Se define

g : M2 −→ M1
m ↦−→ g (m) := x1 .

Veamos que g está correctamente definido. Sea x ′ ∈ M1 tal que f (x ′) = m;


para x ′ := x1′ + x2′ , con x1′ ∈ M1′ y x2′ ∈ ker( f ); se tiene que f (x − x ′) = 0,
con lo cual x − x ′ ∈ ker( f ), y entonces, x = x ′ + s, con s ∈ ker( f ). Resulta,
x = (x1′ + x2′ ) + s = x1′ + (x2′ + s) = x1 + x2 , y por la unicidad, x1 = x1′ ,
lo cual demuestra que g está correctamente definida. Claramente g es un
A-homomorfismo. De otra parte,

( f g)(m) = f (g (m)) = f (x1 ) = f (x − x2 ) = f (x) − f (x2 ) = f (x) = m,


68 · Suma directa interna

es decir, f g = iM2 .
⇐): de la proposición 3.1.3 se desprende que f es sobreyectivo. Resta
probar que ker( f ) es sumando directo de M1 , para lo cual se demostrará
que
M1 = ker( f ) ⊕ Im(g).

Dado x ∈ M1 , entonces m = m − (g f )(m) + (g f )(m), donde


(g f ) (m) ∈ Im(g) y m − (g f ) (m) ∈ ker( f ). Esto demuestra que
M1 = ker( f ) + Im(g). Sea x ∈ M1 = ker( f ) ∩ Im(g), entonces x = g (z), con
z ∈ M2 , y además, f (x) = 0, luego f (g (z)) = 0, de donde x = 0. □✓

Corolario 6.2.6. Sean M un A-módulo y N un submódulo de M. Entonces, N


es sumando directo de M si, y sólo si, existe un endomorfismo 𝜋 : M −→ M tal que
𝜋 2 = 𝜋 y 𝜋 (M) = N .

Demostración. ⇒): sea N ′ submódulo de M tal que M = N ⊕ N ′. Consi-


dérese en la primera parte de la proposición anterior f := 𝜇, donde 𝜇 es
el homomorfismo que sumerge a N en M; 𝜇 es un A-homomorfismo in-
yectivo hendido y existe entonces g : M −→ N tal que g f = iN . Según la
demostración de la proposición anterior, g es sencillamente la proyección
de M sobre N . Dado que m ∈ M, se tiene que m = n + n ′, con n ∈ N y
n ′ ∈ N ′, luego g (m) = n. Tomando 𝜋 := 𝜇g, resulta

(𝜋 𝜋)(m) = 𝜋 (𝜋 (m)) = 𝜋 (n) = 𝜋 (n + 0) = n = 𝜋 (m)

, es decir, 𝜋 2 = 𝜋. Además, 𝜋 (M) = N .


⇐): sean 𝜇 : N −→ M la inclusión de N en M y 𝜋 : M −→ M tal que
𝜋 (M) = N y 𝜋 2 = 𝜋. Para g : M −→ N definida por g (m) := 𝜋 (m), se tiene
que g 𝜇 = iN . En efecto, para n ∈ N existe m ∈ M tal que n = 𝜋 (m), luego
𝜇(n) = 𝜋 (m), de donde

g ( 𝜇(n)) = g (𝜋 (m)) = 𝜋 (𝜋 (m)) = 𝜋 (m) = n.

Entonces, 𝜇 es hendido con imagen N . ✓


Ejemplo 6.2.7. ℚℤ es irreducible: en efecto, sea N un sumando directo


de ℚℤ . Según el corolario 6.2.6, existe un endomorfismo 𝜋 de ℚℤ tal que
𝜋 2 = 𝜋 y 𝜋 (ℚ) = N . Pero, por el ejemplo 4.2.4, 𝜋 = 1, ó, 𝜋 = 0, con lo cual
N = ℚ, o, N = 0.
Suma directa interna · 69

3. Ejercicios
1. Demuestre la proposición 6.1.6.

2. Sea R un DIP. Demuestre que R es un R-módulo irreducible.

3. Sea R un dominio de integridad y sea Q (R) su cuerpo de fracciones


(véase [23], capítulo 7); demuestre que Q (R) es un R-módulo irre-
ducible.

4. Sean A un anillo y e un idempotente de A. Demuestre que


A = eA ⊕ (1 − e)A.

5. Sea A un anillo. Demuestre que las siguientes condiciones son equi-


valentes:

(i) AA es irreducible.
(ii) AA es irreducible.
(iii) Los únicos idempotentes de A son los triviales.

6. Sean M un A-módulo y B := EndA (M). Demuestre que las siguientes


condiciones son equivalentes:

(i) MA es irreducible.
(ii) BB es irreducible.
(iii) BB es irreducible.
(iv) 0 y 1 son los únicos idempotentes de B.

7. Sea A un anillo y Mn (A) el conjunto de matrices cuadradas de orden


n, n ≥ 2. Muestre que Mn (A) es reducible como A-módulo y como
Mn (A)-módulo.

8. Un módulo N es inyectivo si para cada homomorfismo inyectivo


f y cada homomorfismo g : M −→ N existe un homomorfismo
h : L −→ N tal que el siguiente diagrama conmuta:

N
p
6Ip p h
g pp
pp
M f
- L

Demuestre que cada sumando directo de un módulo inyectivo es in-


yectivo.
70 · Suma directa interna

9. Sea {Ni }i ∈ C una familia de A-módulos. Si Ni es inyectivo para cada


Î
i, entonces i ∈ C Ni es inyectivo.

10. Un módulo P es proyectivo si para cada homomorfismo sobreyecti-


vo f y cada homomorfismo g : P −→ N existe un homomorfismo
h : P −→ M tal que el siguiente diagrama conmuta:

p pP
pp
pp
h
g
pp
?
M f
- N

Demuestre que si {Pi }i ∈ C una familia de A-módulos, entonces


Ê
Pi es proyectivo ⇔ ∀i ∈ C, Pi es proyectivo.
i∈C
Capítulo
siete
Módulos libres
Módulos libres · 73

Estudiaremos ahora los conceptos de independencia lineal y base para mó-


dulos, advirtiendo que varias propiedades de las bases de los espacios vec-
toriales no se conservan en este caso. Veremos que no todo módulo posee
una base, dos bases finitas pueden tener diferente número de elementos y
que no todo submódulo de un módulo libre es libre.

1. Definición y caracterizaciones
Definición 7.1.1. Sea M un módulo sobre el anillo A y X = {x1 , . . . , xk }
un subconjunto finito de M. Se dice que X (los elementos de X) es (son)
linealmente dependiente(s) si existen a1 , . . . , ak ∈ A no todos nulos tales
que
x1 · a1 + · · · + xk · ak = 0.

En caso contrario, se dirá que X es linealmente independiente, es decir,


para cualesquiera elementos a1 , . . . , ak de A se cumple

k
∑︁
xi · ai = 0 ⇔ ai = 0, para cada 1 ≤ i ≤ k.
i=1

Un subconjunto arbitrario no vacío X de M se dice linealmente dependien-


te si contiene al menos un subconjunto finito linealmente dependiente. Se
dirá que X es linealmente independiente si cada subconjunto finito de X es
linealmente independiente. El conjunto vacío es linealmente independien-
te. Sea ∅ ≠ X ⊂ M se dice que X es una base de M si X es linealmente
independiente y {X⟩ = M. Se dice que M es libre si posee al menos una
base.

0 es libre con base ∅ y notemos que el anillo A es libre con base X = {1}.

Proposición 7.1.2. Sea M no nulo y ∅ ≠ X ⊂ M. X es una base de M si, y sólo


si, cada elemento m de M tiene una representación única en la forma

m = x1 · a1 + · · · + xk · ak , (1.1)

con xi ∈ X, ai ∈ A, 1 ≤ i ≤ k.

Demostración. ⇒): la existencia de una representación es consecuencia di-


recta del concepto de base. Supongamos que m tiene otra representación en
la forma
m = y1 · b1 + · · · + yt · bt ,
74 · Módulos libres

con yi ∈ X, b j ∈ A, 1 ≤ j ≤ t. Sin pérdida de generalidad (completando


con sumandos nulos) podemos suponer que {x1 , . . . , xk } = {y1 , . . . , yt };
también podemos asumir que xi = yi , 1 ≤ i ≤ k. Resulta entonces

0 = x1 · (a1 − b1 ) + · · · + xk · (ak − bk ),

y, por la independencia lineal, se tiene que ai = bi para 1 ≤ i ≤ k.


⇐): la existencia de representaciones como en (1.1) implica {X⟩ = M.
La unicidad garantiza la independencia lineal. □✓

Proposición 7.1.3. Sean M un módulo no nulo y ∅ ≠ X ⊂ M. X es una base


de M si, y sólo si,
∑︁
M= ⊕{x⟩ y Ann(x) := {a ∈ A | x · a = 0} = 0, para todo x ∈ X .
x ∈X

Demostración. ⇒): del corolario 6.1.3 y la proposición 7.1.2 se obtiene que


Í
M = x ∈X ⊕{x⟩. En vista de la independencia de X, la igualdad x · a = 0,
con x ∈ X y a ∈ A, implica a = 0.
Í
⇐): la igualdad M = x ∈X ⊕{x⟩ implica {X⟩ = M. Sean x1 , . . . , xk
elementos diferentes de X y a1 , . . . , ak ∈ A tales que x1 · a1 + · · · + xk · ak = 0.
Supóngamos que algún ai ≠ 0. Sin pérdida de generalidad asumamos que
a1 ≠ 0. Entonces, ∑︁
x1 · a1 ∈ {x1 ⟩ ∩ {x⟩.
x ∈X
x≠x1

Resulta, x1 · a1 = 0, es decir, a1 ∈ Ann(x1 ), lo cual es contradictorio. Así,


a1 = · · · = ak = 0, y X es una base de M. ✓

Los siguientes ejemplos muestran la diferencia entre los espacios vecto-


riales sobre cuerpos y los módulos sobre anillos.

Ejemplo 7.1.4. ℚℤ no es libre. Supóngase contrariamente que ∅ ≠ X ⊂ ℚ


es una base. Sea x0 ∈ X. De acuerdo con el ejemplo 3.1.7, ℚ = ⟨X0 ⟩,
X0 = X − {x0 }. Existen entonces k1 , . . . , kn ∈ ℤ y x1 , . . . , xn ∈ X0 tales
que x0 + x1 · k1 + · · · + xn · kn = 0, de donde {x0 , x1 , . . . , xn } es linealmente
dependiente, lo cual es contradictorio.

Ejemplo 7.1.5. No todo submódulo de un módulo libre es libre. En efecto,


según vimos, A es un A-módulo libre con base {1}. En particular, ℤ4 es
ℤ4 -libre. Nótese que N = {0, 2} ≤ ℤ4 no posee base.
Módulos libres · 75

2. Cardinalidad de las bases


En la sección anterior vimos que no todo módulo tiene base. Ahora, si M es
un módulo no nulo libre con base X, entonces cambiando algún elemento
x ∈ X por x · a, con a ∈ A∗ , el nuevo conjunto es también una base de M; así,
si A∗ es infinito, M tiene infinitas bases distintas. Con esto queda claro que
no tiene sentido estudiar la unicidad de las bases, en cambio es interesante
revisar el problema del tamaño de cada una de ellas.

Proposición 7.2.1. Todo módulo libre finitamente generado posee una base finita.

Demostración. La proposición se cumple evidentemente para módulos nu-


los. Sean M ≠ 0, X una base de M y M = {m1 , . . . , mk ⟩. Cada elemento
m ∈ M es una combinación lineal de los generadores m1 , . . . , mk . A su vez,
cada mi determina un subconjunto finito Xi ⊂ X tal que mi ∈ {Xi ⟩. Resulta
entonces M = { ki=1 Xi ⟩, con lo cual ki=1 Xi es una base finita de M. ✓
Ð Ð

Corolario 7.2.2. En un módulo libre, o todas las bases son finitas o todas son
infinitas.

Demostración. El caso M = 0 es trivial. Sea M ≠ 0 y X una base finita de M.


Según la prueba de la proposición 7.2.1, para cualquier otra base Y de M,
existe Y0 ⊂ Y finito tal que Y0 es base. Resulta entonces Y0 = Y . □✓

El contenido de la siguiente proposición es conocido para espacios vec-


toriales sobre anillos de división. Como veremos a continuación, la prueba
es válida para anillos arbitrarios.

Proposición 7.2.3. Sea M un módulo libre sobre A con bases infinitas X y Y .


Entonces, |X | = |Y |.

Demostración. Cada elemento z de Y es representable mediante una combi-


nación lineal finita de elementos de X. Además, dado x ∈ X, existe z ∈ Y
tal que x está en la representación de z. En efecto, sea

x = z1 · 𝛼 1 + · · · + zm · 𝛼 m (2.1)

la representación de x en términos de elementos de Y . Cada elemento zi ,


1 ≤ i ≤ m, es representable como combinación lineal de elementos de
X. Si suponemos que x no aparece en la representación de ninguno de los
elementos de Y , entonces x no aparece en la representación de ninguno de
76 · Módulos libres

los elementos zi , 1 ≤ i ≤ m. Sea Xi el conjunto (finito) de elementos de X


que intervienen en la representación de zi y sea
m
Ø
X0 = Xi .
i=1

Claramente X0 es finito y x ∉ X0 . De (2.1) se desprende que el subconjunto


finito
X0′ := X0 ∪ {x}

es linealmente dependiente, lo cual contradice el hecho de ser X una base


para M. Así, dado x ∈ X, existe al menos un z ∈ Y tal que x está en la
representación de z. Con ayuda del axioma de elección definimos la función

𝜙 : X −→ Y

mediante la regla 𝜙(x) := z, donde z es un elemento de Y tal que x está en


la representación de z. Sea Y ′ := 𝜙(X) y sea z ′ ∈ Y ′. 𝜙−1 (z ′) es el conjunto
(finito) de elementos de X que intervienen en la representación de z ′. Esto
permite establecer una correspondencia entre Y ′ y el conjunto de partes
finitas de X:

𝜙∗ : Y ′ −→ X
z ′ ↦→ 𝜙−1 (z ′).

𝜙∗ es una función inyectiva: en efecto, sea 𝜙−1 (z ′) = 𝜙−1 (z ′′), con


z ′ , z ′′ ∈ Y ′. Sea x ∈ 𝜙−1 (z ′). Entonces, 𝜙(x) = z ′ = z ′′. Nótese además
que para elementos diferentes z ′ y z ′′ de Y ′ se cumple que

𝜙−1 (z ′) ∩ 𝜙−1 (z ′′) = ∅. (2.2)

Sea Γ := Im(𝜙∗ ). Puesto que 𝜙∗ es inyectiva, entonces |Γ| = |Y ′ |.


Queremos ahora probar que Γ es una partición del conjunto X. Por lo
que anotamos en (2.2) , basta probar que
Ø
X= 𝜙−1 (z ′).
z′ ∈Y ′

𝜙−1 (z ′) ⊆ X. Sea x ∈ X. Entonces, 𝜙(x) = z ′ ∈ Y ′ y,


Ð
Evidentemente z′ ∈Y ′
por lo tanto, Ø
x ∈ 𝜙−1 (z ′) ⊆ 𝜙−1 (z ′).
z′ ∈Y ′
Módulos libres · 77

Puesto que X es infinito, entonces Γ es también infinito. En total, se tiene


que Γ es una partición infinita de partes finitas del conjunto infinito X, de
donde
|X = |Γ| = |Y ′ | ≤ |Y |.

De manera simétrica se establece que |Y | ≤ |X |. Por el teorema de Cantor-


Bernstein-Schröder de la teoría de conjuntos concluimos que |X | = |Y |
(véase [7]). ✓

Al final del capítulo mostraremos que la proposición 7.2.3 no es siempre


cierta para el caso de bases finitas.

Proposición 7.2.4. Sean X un conjunto no vacío y A (X) la suma directa externa


de la familia {Mx } x ∈X , con cada Mx := AA . Entonces, A (X) es libre con una base
canónica de cardinalidad igual a la de X.

Demostración. Para cada x ∈ X consideremos la inyección canónica

𝜇 x : A −→ A (X) .

Probaremos que { 𝜇 x (1)} x ∈X es una base para A (X) . En primer lugar, es


claro que 𝜇 x (1) ≠ 𝜇 x′ (1) para x ≠ x ′ en X. Sea z = (zx ) x ∈X un elemento de
A (X) . Si z = 0, entonces z ∈ { 𝜇 x (1) | x ∈ X⟩. Si z ≠ 0 existe un subconjunto
Ín
finito Xz = {x1 , . . . , xn } ⊂ X tal que z = i=1 𝜇 xi (ai ), con a1 , . . . , an ∈ A.
Entonces,
∑︁n
z= 𝜇 xi (1) · ai ∈ { 𝜇 x (1) | x ∈ X⟩.
i=1

Sean ahora X0 = {x1 , . . . , xm } un subconjunto finito de X y a1 , . . . , am ∈ A


tales que
𝜇 x1 (1) · a1 + · · · + 𝜇 xm (1) · am = 0.

Entonces, el elemento z = (zx ) ∈ A (X) es nulo, donde


(
0, si x ∉ X0 ,
zx =
ai si x = xi , 1 ≤ i ≤ m.

Esto implica que ai = 0, para cada 1 ≤ i ≤ m, de donde { 𝜇 x (1)} x ∈X es


linealmente independiente. ✓

Teorema 7.2.5. Sea M un A-módulo libre con base X. Entonces, M  A (X) .


78 · Módulos libres

Í
Demostración. Según la proposición 7.1.3, M = x ∈X ⊕{x⟩ y Ann(x) = 0,
para cada x ∈ X. Se tiene además la familia de isomorfismos

fx : A −→ {x⟩
a ↦→ x · a

la cual, de acuerdo con las proposiciones 5.3.5 y 6.1.6, induce el isomorfis-


mo Ê ∑︁
A (X)  {x⟩  ⊕{x⟩ = M .
x ∈X x ∈X


Corolario 7.2.6. An es libre con base canónica {e1 , . . . , en }, con

ei := (0, . . . , 1, . . . , 0)T ,

donde 1 está en la i-ésima posición, 1 ≤ i ≤ n. Recíprocamente, sean A un anillo


y M un A-módulo libre con una base de n ≥ 1 elementos. Entonces, M  An .

Observación 7.2.7. De acuerdo con el teorema 7.2.5, los módulos libres


sobre A no son más que sumas directas externas de AA . Además, podemos
complementar el corolario 7.2.6 y definir A (∅) := A0 := 0.

3. Módulos libres y homomorfismos


Es posible caracterizar los módulos libres a través de homomorfismos.

Teorema 7.3.1. Sea M un A-módulo no nulo y sea ∅ ≠ X ⊂ M. Entonces, M


es libre con base X si, y sólo si, para cada módulo N y cada función 𝜓 : X −→ N
existe un único A-homomorfismo 𝜓 : M −→ N tal que 𝜓 (x) = 𝜓 (x), para cada
x ∈ X.

Demostración. ⇒): m ∈ M tiene una única representación en la forma


m = x1 · a1 + · · · + xk · ak , con xi ∈ X y ai ∈ A, 1 ≤ i ≤ k. La aplica-
ción 𝜓 : M −→ N , definida por

𝜓 (m) := 𝜓 (x1 ) · a1 + · · · + 𝜓 (xk ) · ak ,

es claramente un A-homomorfismo que satisface 𝜓 (x) = 𝜓 (x), para cada


x ∈ X. Otro A-homomorfismo que cumpla esta condición coincide con 𝜓.
⇐): nótese que si M es un módulo libre con base X y N es un módulo
con isomorfismo 𝛼 : M −→ N , entonces N es libre con base {𝛼 (x)} x ∈X .
Módulos libres · 79

Sea M un A-módulo y X un subconjunto no vacío de M que cumple la


propiedad del enunciado del teorema. Según la proposición 7.2.4, A (X) es
libre con base X ′ := { 𝜇 x (1)} x ∈X , donde 𝜇 x : A −→ A (X) es la inyección
canónica correspondiente a x ∈ X. La función

𝜓 : X −→ A (X)
x ↦−→ 𝜇 x (1)

induce el A-homomorfismo

𝜓 : M −→ A (X) 𝜓 (x) := 𝜓 (x) = 𝜇 x (1),

para cada x ∈ X. La función

𝜃 : X ′ −→ M
𝜇 x (1) ↦−→ x

induce el A-homomorfismo

𝜃 : A (X) −→ M
𝜃 ( 𝜇 x (1)) = 𝜃 ( 𝜇 x (1)) = x,

para cada x ∈ X. Se tiene así el homomorfismo

𝜃 ◦ 𝜓 : M −→ M
𝜃 ◦ 𝜓 (x) = x,

para cada x ∈ X. Nuevamente, por hipótesis, la función

i : X −→ M
x ↦−→ x

induce un único A-homomorfismo

i : M −→ M
i (x) = x,

para cada x ∈ X. Pero tanto iM como 𝜃 ◦ 𝜓 cumplen esta condición, por lo


que iM = i = 𝜃 ◦𝜓. Análogamente, apoyándonos en la primera parte ya pro-
bada, y teniendo en cuenta que A (X) es libre, obtenemos que
𝜓 ◦ 𝜃 = iA (X ) . Así, 𝜃 es un isomorfismo, con lo cual M es libre con base
X = 𝜃 (X ′). ✓

80 · Módulos libres

Corolario 7.3.2. Sean M y N módulos libres con bases X y Y respectivamente,


con |X | = |Y |. Entonces, M  N .

Demostración. Sea 𝜓 : X −→ Y una función biyectiva de X en Y . Según el


teorema anterior, existe un único A-homomorfismo

𝜓 : M −→ N
𝜓 (x) = 𝜓 (x),

para cada x ∈ X. Análogamente, existe un único A-homomorfismo

𝜃 : N −→ M
𝜃 (y) = 𝜓 −1 (y),

para cada y ∈ Y . Se tiene que 𝜃 ◦ 𝜓 (x) = x, para cada x ∈ X. De otra


parte, la idéntica iX : X −→ X se extiende de manera única, con lo cual
necesariamente 𝜃 ◦ 𝜓 = iM . Por simetría, 𝜓 ◦ 𝜃 = iN , con lo cual 𝜓 es un
isomorfismo. □✓

Corolario 7.3.3. Sea M un módulo libre con base X. Entonces,

(i) Si 𝜃 : M −→ N es un A-homomorfismo tal que 𝜃 (x) = 0 para cada x ∈ X,


entonces 𝜃 = 0.

(ii) Si 𝜃 , 𝛼 : M −→ N son A-homomorfismos que coinciden en los elementos de


X, entonces 𝜃 = 𝛼.

(iii) Si 𝜃 : M −→ M es tal que 𝜃 (x) = x para cada x ∈ X, entonces 𝜃 = iM .

(iv) Si 𝜃 : N −→ M es un homomorfismo sobreyectivo, entonces existe un homo-


morfismo inyectivo 𝛼 : M −→ N tal que N = ker(𝜃) ⊕ Im(𝛼), es decir, 𝜃
es hendido.

Demostración. Las tres primeras afirmaciones son consecuencia directa del


teorema 7.3.1.
(iv) Por ser 𝜃 una función sobreyectiva, podemos, mediante el axio-
ma de elección, definir una función 𝛼 ′ : X −→ N tal que 𝛼 ′ (x) = n si
𝜃 (n) = x. Puesto que M es libre con base X, existe un único A-homo-
morfismo 𝛼 : M −→ N tal que 𝛼 (x) = 𝛼 ′ (x), para cada x ∈ X. Como la
inclusión de X en M se extiende de manera única a la idéntica y 𝜃 ◦𝛼 (x) = x,
entonces necesariamente 𝜃 ◦ 𝛼 = iM . De la proposición 6.2.5 resulta que 𝛼
es inyectivo hendido y N = ker(𝜃) ⊕ Im(𝛼). ✓

Módulos libres · 81

La siguiente proposición muestra que todo módulo puede “cubrirse” con


un módulo libre.
Proposición 7.3.4. Todo módulo es imagen de un módulo lire.
Demostración. Sea M un A-módulo. Si M = 0, entonces no hay nada que
probar. Sea M un módulo no nulo. Según la proposición 7.2.4, A (M) es un
módulo libre y X = { 𝜇 m (1)}m ∈M es una base, donde
𝜇 m : A −→ A (M)
es la inyección canónica correspondiente a m. Se tiene entonces la función
𝜓 : X −→ M
𝜇 m (1) ↦−→ m
(nótese que si 𝜇 m (1) = 𝜇 m′ (1), entonces m = m ′). La función 𝜓 se puede ex-
tender a un homomorfismo 𝜓 : A (M) −→ M. Puesto que 𝜓 es sobreyectiva
(más aún, biyectiva), entonces 𝜓 es sobreyectivo. ✓

Corolario 7.3.5. Cada módulo finitamente generado es imagen de un módulo libre


de bases finitas.
Demostración. Si M = 0, entonces M es imagen de A0 = 0. Sea M un mó-
dulo no nulo generado por el subconjunto finito Y = {y1 , . . . , yn }. Sea An
la suma directa externa de n copias del módulo AA con la base canónica
X = {e1 , . . . , en } definida en el corolario 7.2.6. Se tiene entonces la fun-
ción
𝜓 : X −→ M
ei ↦−→ yi ,
la cual puede ser extendida hasta un homomorfismo 𝜓 : An −→ M. Nótese
que 𝜓 es en realidad sobreyectivo. En efecto, sea m ∈ M; existen a1 , . . . , an
en A tales que
m = y1 · a1 + · · · + yn · an = 𝜓 (x1 ) · a1 + · · · + 𝜓 (xn ) · an
= 𝜓 (x1 ) · a1 + · · · + 𝜓 (xn ) · an = 𝜓 (x1 · a1 + · · · + xn · an ).
Así, M es la imagen de An . ✓

Terminamos el capítulo presentando el concepto de dimensionalidad.


La proposición 7.2.3 puso en claro que para un anillo arbitrario A y un
módulo libre M de bases infinitas podemos definir la dimensión de M como
el cardinal de una cualquiera de sus bases. Para bases finitas la situación
puede cambiar, como lo ilustra el siguiente ejemplo.
82 · Módulos libres

Ejemplo 7.3.6. Sea M un módulo libre sobre un anillo B con base nu-
merable X = {xi }∞ i=1
, y sea A = EndB (M) su anillo de endomorfismos.
Consideremos la estructura natural de A-módulo a izquierda sobre A. A es
libre con base {1}. Construimos una base de A con dos elementos: sean f ,
g funciones definidas por
f , g : X −→ M
(
xn , si i = 2n,
f (xi ) =
0, si i = 2n − 1,
(
0, si i = 2n,
g (xi ) =
xn , si i = 2n − 1.
Como M es libre, f y g pueden ser extendidas a B-endomorfismos de M,
f y g, respectivamente. Veamos que { f , g } es una base de A. Sea h ∈ A y
consideremos las funciones
t j : X −→ M , j = 1, 2.t1 (xi ) = h(x2i )
t2 (xi ) = h(x2i−1 ),
para cada i = 1, 2, . . . . Sean t1 y t2 los B-endomorfismos inducidos por t1 y
t2 , respectivamente. Nótese que h = t1 f + t2 g. En efecto, si i = 2n, entonces
(t1 f + t2 g) (xi ) = t1 ( f (xi )) + t2 (g (xi )) = t1 (xn ) + t2 (0)
= t1 (xn ) = h(x2n ) = h(xi ).
Si i = 2n − 1, entonces
(t1 f + t2 g) (xi ) = t1 ( f (xi )) + t2 (g (xi )) = t1 (0) + t2 (xn )
= t2 (xn ) = h(x2n−1 ) = h(xi ).

Consideremos por último la independencia lineal: sean h1 , h2 ∈ A tales que


h1 f + h2 g = 0.
Entonces, para cada i = 1, 2, . . ., se tiene
(h1 f + h2 g) (xi ) = 0,
en particular,
(h1 f + h2 g) (x2i ) = h1 ( f (x2i )) = h1 (xi ) = 0,
(h1 f + h2 g) (x2i−1 ) = h2 (g (x2i−1 )) = h2 (xi ) = 0,

es decir, h1 = h2 = 0.
Según el corolario 7.2.6 se tiene la curiosa relación A  A2 .
Módulos libres · 83

Definición 7.3.7. El anillo A se dice dimensional si para cualesquiera en-


teros positivos m y n se cumple

Am  An ⇔ m = n.

Si A es dimensional y M es un A-módulo libre de bases finitas, se define la


dimensión de M, y se denota por dim(M), como el cardinal de una cual-
quiera de sus bases.
En la literatura los anillos dimensionales se conocen también como ani-
llos IBN (Invariant Basis Number). En [30] se puede consultar un estudio
recopilativo de los anillos dimensionales. Demostraremos a continuación
que los anillos conmutativos son dimensionales, apoyándonos en la propo-
sición 4.3.6.
Proposición 7.3.8. Si R es un anillo conmutativo, entonces R es dimensional.
Demostración. Sean R un anillo conmutativo y m, n enteros tales que
R m  R n . Sean I un ideal maximal de R y R := R/I el respectivo cuerpo re-
sidual. Se tiene entonces el R-isomorfismo HomR (R n , R)  HomR (R m , R).
El teorema 5.3.6 garantiza el R-isomorfismo

[HomR (R, R)] n  [HomR (R, R)] m .


n m
Según (3.4) , R R y, puesto que los cuerpos son dimensionales (véase
[20]), entonces m = n. ✓

4. Ejercicios
1. Demuestre que los vectores v1 := (1, 2)T , v2 := (3, 4)T ∈ ℤ2 son
linealmente independientes pero no constituyen una base de ℤ2 .

2. Sea A un anillo. Calcule dos bases distintas del A-módulo A[x].

3. Sea A un anillo. Calcule dos bases distintas del A-módulo Mn (A), con
n ≥ 1.

4. Demuestre que los anillos finitos son dimensionales.

5. Demuestre que todo módulo sobre un anillo de división es libre.

6. Demuestre que los anillos de división son dimensionales.

7. Demuestre que cada sistema minimal de generadores de un módulo


libre de dimensión finita sobre un anillo de división es una base.
84 · Módulos libres

8. Sea A un anillo y sea J un ideal propio de A tal que A/ J es un anillo


dimensional. Demuestre que A es también un anillo dimensional.

9. Sea A un anillo. Demuestre que las siguientes condiciones son equi-


valentes:

a) A es dimensional.
b) Para cualesquiera m, n ≥ 1, dadas dos matrices F ∈ Mm×n (A),
G ∈ Mn×m (A), con FG = Em , GF = En , se tiene que m = n (Em
es la matriz idéntica de orden m, véase [23]).

10. Ilustre con un ejemplo que si un módulo MA es libre y M ′ es un su-


mando directo de M, entonces no necesariamente M ′ es libre.

11. Sea R un anillo conmutativo y sean M , N módulos libres de bases


finitas. Demuestre que HomR (M , N ) es libre. Calcule su dimensión.

12. Sea R un anillo conmutativo y sea M un R-módulo libre de dimensión


2. Demuestre que no existe ningún R-homomorfismo sobreyectivo
de R en M.
Capítulo
ocho
Módulos
finitamente
generados sobre
DIPs
Módulos finitamente generados sobre DIPs · 87

El tema central del presente capítulo es el estudio de los módulos finita-


mente generados sobre DIPs (dominios de ideales principales, véase [23])
y, como aplicación de esta teoría general, demostrar el teorema de estructu-
ra de los grupos abelianos finitamente generados. A pesar que la mayoría de
las definiciones y propiedades presentadas en este capítulo son válidas para
dominios de integridad arbitrarios, si no se advierte lo contrario, R denotará
un DIP.

1. Módulos de torsión
Sea 𝕂 el cuerpo de fracciones de R y sea M un R-módulo. Nótese que si
V es un 𝕂-espacio y v ∈ V y k ∈ 𝕂 son tales que v · k = 0, entonces
necesariamente v = 0 ó k = 0. Sin embargo en módulos sobre anillos tal
situación no es siempre cierta.
Definición 8.1.1. Sean M un R-módulo y m ∈ M. Se dice que m es un
elemento de torsión si existe r ≠ 0 en R tal que m · r = 0. La colección de
todos los elementos de torsión de M se denota por T (M). Se dice que M es
un módulo de torsión si T (M) = M, y que M es sin torsión si T (M) = 0.
El módulo nulo, por definición, es un módulo sin torsión.
Proposición 8.1.2. Sea M un R-módulo. Entonces,
(i) T (M) es un submódulo de M.

(ii) M/T (M) es sin torsión.

(iii) Si M es un módulo sin torsión y N ≤ M, entonces N es sin torsión.


Demostración. Todas las afirmaciones son consecuencia directa de las defi-
niciones. □✓

Ejemplo 8.1.3. (i) R como R-módulo es sin torsión.


(ii) 𝕂 como R-módulo es sin torsión. En cambio, 𝕂/R es de torsión.
(iii) Sea p un elemento irreducible de R y sea
 
a
𝕂 p := n | a ∈ R, n ≥ 0 .
p
Nótese que 𝕂 p es un R-módulo sin torsión; en cambio Rp∞ := 𝕂 p /R es de
torsión (véase el ejemplo 2.3.2).
Sea P la colección de elementos irreducibles de R (recordemos que en
un DIP, P coincide con la colección de elementos primos (véase [23], ca-
pítulo 6)).
88 · Módulos finitamente generados sobre DIPs

Definición 8.1.4. Sea M un R-módulo y sea p ∈ P. Se dice que M es un


módulo p-primario si para cada m ∈ M existe n ≥ 0 tal que m · p n = 0.
Sea M un R-módulo y sea p ∈ P, definimos

M (p) := {m ∈ M | m · p n = 0, para algún n ≥ 0}.

M (p) se denomina la componente p-primaria de M.


Proposición 8.1.5. Sea M un R-módulo y sea p ∈ P, entonces M (p) ≤ T (M).
Demostración. La prueba es un sencillo ejercicio que dejamos al lector. ✓

Teorema 8.1.6. Sea M un R-módulo de torsión. Entonces, M es suma directa


de sus componentes primarias, es decir,

⊕M (p) .
Í
M=
p ∈P

Demostración. Sea 0 ≠ m ∈ M (si m = 0, claramente m ∈ p ∈P M (p) ). Como


Í

M es de torsión, existe r ≠ 0 en R − R ∗ tal que m · r = 0. Como R es un


DFU, r tiene una (única) descomposición en producto de irreducibles

r = p1k1 · · · ptkt , p j ∈ P, k j ≥ 1, pi ≠ p j , para i ≠ j, 1 ≤ i , j ≤ t.

Sea
k k
r j := p1k1 · · · p j−1
j−1 j+1
p j+1 · · · ptkt , 1 ≤ j ≤ t.
Claramente m. c. d.(r1 , . . . , rt ) = 1, y por tanto, existen s1 , . . . , st ∈ R tales
que
r1 s1 + · · · + rt st = 1.
De esta manera m = m · r1 s1 + · · · + m · rt st , donde claramente m · r j s j ∈ M (p j ) ,
para 1 ≤ j ≤ t, es decir, m ∈ p ∈P M (p) . Sea ahora q un elemento fijo de
Í

P y sea m ∈ M (q) ∩ p≠q M (p) . Existen p1 , . . . , pr irreducibles distintos y


Í

diferentes de q, n ≥ 0, y m j ∈ M (p j ) , 1 ≤ j ≤ r, tales que

m · q n = 0, m = m1 + · · · + mr .
n n
Sea p j j tal que m j · p j j = 0, para cierto n j ≥ 0, 1 ≤ j ≤ r. Entonces,

m · p1n1 · · · prnr = m1 · p1n1 · · · prnr + · · · + mr · p1n1 · · · prnr = 0.

Como el m. c. d. entre q n y p1n1 · · · prnr es 1, existen a, b ∈ R tales que


1 = p1n1 · · · prnr a + q n b. De esta igualdad tenemos

m = m · p1n1 · · · prnr a + m · q n b = 0.

Esto muestra que la suma p ∈P M (p) es directa. ✓


Í

Módulos finitamente generados sobre DIPs · 89

Corolario 8.1.7. Sea M un R-módulo de torsión finitamente generado. Entonces


M es suma directa finita de sus componentes primarias no nulas.

Demostración. Sea M = ⟨x1 , . . . , xm ⟩, entonces la descomposición de cada


xi determina un subconjunto finito Pi ⊆ P de tal forma que
∑︁
M⊆ ⊕M (p) ,
p ∈PM

donde PM := P1 ∪ · · · ∪ Pm y M (p) ≠ 0, para p ∈ PM . Pero como la suma


total es directa, entonces M (p) = 0 para p ∉ PM , y de esta forma,
∑︁
M= ⊕M (p) . ✓

p ∈PM

2. Módulos sin torsión


Ahora estudiaremos los R-módulos finitamente generados sin torsión.

Proposición 8.2.1. Cada R-módulo libre es sin torsión.

Demostración. En efecto, sea M libre; si M = 0, entonces M es sin torsión.


Sea M ≠ 0, y sea X una base de M. Sea m ∈ M y sea r ≠ 0 en R tal que
m · r = 0, entonces m = x1 · r1 + · · · + xk · rk , con ri ∈ R y xi ∈ X, 1 ≤ i ≤ k.
Luego, m · r = x1 · r1 r + · · · + xk · rk r, y entonces, ri r = 0 para cada i, de
donde ri = 0 ya que R es un dominio de integridad. Esto implica que m = 0
(notemos que en esta prueba R puede ser cualquier DI). ✓

Proposición 8.2.2. Sea M un R-módulo libre de dimensión finita y sea N ≤ M.


Entonces, N es libre y dim(N ) ≤ dim(M).

Demostración. Si M = 0, entonces N = 0 es libre de dimensión 0. Sea M no


nulo; sea X = {x1 , . . . , xn } una base de M, para cada 1 ≤ k ≤ n, definimos

Nk := N ∩ ⟨x1 , . . . , xk ⟩.

Demostremos que Nk es libre con dimensión ≤ k. De esto resulta, en par-


ticular, que Nn = N ∩ ⟨x1 , . . . , xn ⟩ = N ∩ M = N es libre con dimensión
≤ n. Para k = 1 tenemos que N1 = N ∩ ⟨x1 ⟩; definimos

I1 := (N : x1 ) = {r ∈ R | x1 · r ∈ N }.

Nótese que I1 es un ideal de R, y por tanto, I1 = ⟨a1 ⟩. Además, N1 = ⟨x1 ·a1 ⟩:


en efecto, sea x ∈ N1 , entonces x = x1 · r ∈ N , luego r ∈ I1 , y de esta forma,
90 · Módulos finitamente generados sobre DIPs

r = a1 s. Esto garantiza que x = (x1 · a1 ) · s ∈ ⟨x1 · a1 ⟩, es decir, N1 ⊆ ⟨x1 · a1 ⟩.


De otra parte, por definición x1 · a1 ∈ N , es decir, x1 · a1 ∈ N ∩ ⟨x1 ⟩ = N1 ,
de donde ⟨x1 · a1 ⟩ ⊆ N1 . Notemos que N1 es libre con dimensión ≤ 1.
Suponemos ahora que Nk es libre de dimensión ≤ k, y consideremos el
caso k + 1. Sea
Ik+1 := (N + ⟨x1 , . . . , xk ⟩ : xk+1 ) = {r ∈ R | xk+1 · r ∈ N + ⟨x1 , . . . , xk ⟩}.
Existe entonces ak+1 ∈ R tal que Ik+1 = ⟨ak+1 ⟩. Se tiene entonces que
xk+1 · ak+1 = z + x1 · b1 + · · · + xk · bk ,
con z ∈ N y bi ∈ R, 1 ≤ i ≤ k. Vamos a mostrar que
Nk+1 = Nk + ⟨z⟩. (2.1)
En efecto, sea x ∈ Nk+1 , entonces x ∈ N y x = x1 · c1 + · · · + xk+1 · ck+1 , esto
implica que
xk+1 · ck+1 = x − (x1 · c1 + · · · + xk · ck ) ∈ N + ⟨x1 , . . . , xk ⟩,
o sea que ck+1 ∈ Ik+1 , por tanto, ck+1 = ak+1 d. De esta forma,
x = x1 · c1 + · · · + xk · ck + xk+1 · ak+1 d
= x1 · c1 + · · · + xk · ck + z · d + x1 · b1 d + · · · + xk · bk d
= x1 · c1 + · · · + xk · ck + x1 · b1 d + · · · + xk · bk d + z · d ∈ Nk + ⟨z⟩
ya que
x1 · c1 + · · · + xk · ck + x1 · b1 d + · · · + xk · bk d = x − z · d ∈ ⟨x1 , . . . , xk ⟩ ∩ N .
Es decir, Nk+1 ⊆ Nk + ⟨z⟩. Recíprocamente, como Nk ⊆ Nk+1 y
z ∈ N ∩ ⟨x1 , . . . , xk+1 ⟩, entonces z ∈ Nk+1 , y de esta forma, también Nk +
⟨z⟩ ⊆ Nk+1 . Esto completa la prueba de (2.1) .
Si z = 0, Nk+1 = Nk , y así, dim Nk+1 = dim Nk ≤ k < k + 1. Sea z ≠ 0;
si ak+1 = 0, entonces z ∈ N ∩ ⟨x1 , . . . , xk ⟩ = Nk , y nuevamente, Nk+1 = Nk .
Sea ak+1 ≠ 0, veamos que en este caso la suma es directa. Sea x ∈ Nk ∩ ⟨z⟩,
entonces x = x1 · c1 + · · · + xk · ck ∈ N y x = z · c, luego
x = x1 · c1 + · · · + xk · ck
= (xk+1 · ak+1 ) · c − (x1 · b1 + · · · + xk · bk ) · c,
y por la independencia lineal se tiene que ak+1 c = 0. Como ak+1 ≠ 0, enton-
ces c = 0, y de esta forma, x = 0. Se tiene entonces que Nk+1 = Nk ⊕ ⟨z⟩, con
z ≠ 0. Si Y es una base de Nk , entonces Y ∪ {z} es una base de Nk+1 (como
M es libre, entonces M es un módulo sin torsión, luego Ann(z) = 0). Esto
implica que dim(Nk+1 ) ≤ k + 1. □✓
Módulos finitamente generados sobre DIPs · 91

Observación 8.2.3. Se puede demostrar (véase [29]) que la condición de


finitud puede ser eliminada en la proposición 8.2.2, es decir, en DIPs cada
submódulo de un módulo libre es libre.

Teorema 8.2.4. Sea M un R-módulo sin torsión finitamente generado. Entonces,


M es libre.

Demostración. El módulo nulo es por definición libre. Sea M no nulo gene-


rado por un subconjunto finito X = {x1 , . . . , xm } de elementos no nulos de
M. Sea L la colección de subconjuntos de X no vacíos y linealmente inde-
pendientes. Como M es sin torsión, los subconjuntos unitarios de X están
en L, con lo cual este último no es vacío. Sea X0 = {x1 , . . . , xn }, n ≤ m,
uno de los elementos de L de cardinalidad máxima (se reordenan los ín-
dices si es necesario). Para cada x ∈ X, el subconjunto {x1 , . . . , xn , x} es
linealmente dependiente. Por tanto, para cada x ∈ X, existen elementos no
todos nulos rx , r1 , . . . , rn ∈ R tales que

x · rx + x1 · r1 + · · · + xn · rn = 0. (2.2)

rx es no nulo, ya que de lo contrario X0 sería linealmente dependiente. Sea


r := rx1 · · · rxm , entonces r ≠ 0 y definimos M · r := {m · r | m ∈ M }; nótese
que M  M · r, y además, M · r ⊆ ⟨X0 ⟩. Esto último se tiene ya que

m · r = (x1 · a1 + · · · + xm · am ) · r = x1 · a1 rx1 · · · rxm + · · · + xm · am rx1 · · · rxm ,

pero según (2.2) , cada sumando está en ⟨X0 ⟩. El resultado se desprende


entonces de la proposición 8.2.2. ✓

Ejemplo 8.2.5. Sin la condición de finitud el teorema anterior es falso: ℚℤ .

3. Rango
Basados en el siguiente resultado, definiremos el rango de un R-módulo
finitamente generado.

Teorema 8.3.1. Sea M un R-módulo finitamente generado. Entonces,

(i) Existe N ≤ M libre tal que

M = T (M) ⊕ N . (3.1)

(ii) Sean N , N ′ ≤ M tales que M = T (M) ⊕ N = T (M) ⊕ N ′, entonces N y


N ′ son libres e isomorfos.
92 · Módulos finitamente generados sobre DIPs

Demostración. (i) Sabemos que M/T (M) es un módulo sin torsión, además,
como M es finitamente generado, entonces M/T (M) es también finitamen-
te generado. Según el teorema 8.2.4, M/T (M) es libre (de dimensión fini-
ta). Entonces, el homomorfismo canónico j : M −→ M/T (M) es hendi-
do (corolario 7.3.3), esto implica que M = ker( j) ⊕ N , con N ≤ M, pero
ker( j) = T (M), luego, M = T (M) ⊕ N . Nótese entonces que N  M/T (M)
es libre de dimensión finita.
(ii) Si M = T (M) ⊕ N = T (M) ⊕ N ′, entonces N  M/T (M)  N ′. □ ✓

El teorema anterior divide el estudio de los R-módulos finitamente ge-


nerados sobre DIPs en dos partes: los módulos de torsión y los que no tienen
torsión. Estos últimos son libres; además, la parte libre N de M es única, sal-
vo isomorfismo, y es finitamente generada, por tanto, N es un módulo de
dimensión finita, digamos r. Así, N  R r y r es un invariante para M.
Definición 8.3.2. Sea M un R-módulo finitamente generado sobre un DIP.
Se denomina rango de M, y se denota por rank(M), a la dimensión de la
parte libre de M.
Según la proposición 8.2.1, si M es libre, entonces T (M) = 0 y
rank(M) = dim(M).

4. Componentes primarias
La parte de torsión T (M) en la descomposición (3.1) es única para M y
agrupa los elementos de torsión de M. Según el teorema 8.1.6, T (M) es
suma directa finita de sus componentes primarias. La idea ahora es estudiar
cada componente primaria. Para la prueba del teorema 8.4.2 necesitamos
el siguiente resultado válido en DIPs.
Proposición 8.4.1. Sea M un R-módulo finitamente generado. En M cada ca-
dena ascendente de submódulos se detiene, es decir, dada la cadena de submódulos

M1 ≤ M2 ≤ M3 ≤ · · ·

existe n ≥ 1 tal que Mn+k = Mn , para todo k ≥ 0.


Demostración. Como R es un DIP, cada cadena ascendente de ideales de R
se detiene (véase [23]). Aplicando el teorema de correspondencia (teorema
3.2.2), se obtiene inmediatamente que en R/I, con I un ideal de R, cada
cadena ascendente de R-submódulos se detiene. Sea

M = ⟨x1 , . . . , xn ⟩ = x1 · R + · · · + xn · R.
Módulos finitamente generados sobre DIPs · 93

Para cada 1 ≤ i ≤ n se tiene el R-isomorfismo R/Ann(xi )  xi · R. Por


tanto, cada xi · R tiene la propiedad exigida.
Resta probar que si M1 y M2 son submódulos de M que tienen la pro-
piedad requerida, entonces M1 + M2 también la tiene

(M1 + M2 )/M2  M1 /(M1 ∩ M2 );

como M1 cumple la condición de cadena ascendente, entonces claramente


M1 /M1 ∩ M2 satisface también dicha condición y, en consecuencia,
(M1 + M2 )/M2 goza también de la propiedad mencionada. El problema
se reduce ahora a demostrar que si N /L y L son módulos con la condición,
entonces N es un módulo con condición de cadena asecendente: en efecto,
sea N1 ⊆ N2 ⊆ · · · una cadena ascendente de submódulos de N ; resultan
en L y N /L las cadenas ascendentes

N1 ∩ L ⊆ N2 ∩ L ⊆ · · · ,
(N1 + L)/L ⊆ (N2 + L)/L ⊆ · · · .

Por consiguiente, existen k, l tales que

Nk ∩ L = Nk+i ∩ L y (Nl + L)/L = (Nl+i + L)/L,

para todo i ≥ 0, luego Nl + L = Nl+i + L, para i ≥ 0. Sea n = máx{l , k},


entonces Nn + L = Nn+i + L y Nn ∩ L = Nn+i ∩ L, para i ≥ 0. Resulta,
(Nn + L) ∩ Nn+i = (Nn+i + L) ∩ Nn+i , de donde Nn + (L ∩ Nn+i ) = Nn+i ,
por tanto, Nn + (L ∩ Nn ) = Nn+i , y en consecuencia, Nn = Nn+i , para todo
i ≥ 0. □✓

Teorema 8.4.2. Sea M un R-módulo p-primario finitamente generado. Enton-


ces, M es suma directa finita de submódulos cíclicos.

Demostración. Si M es cíclico, el resultado se tiene trivialmente. Suponga-


mos que M no es cíclico.
Paso 1. Sea M = ⟨x1 , . . . , xm ⟩, xi ≠ 0, 1 ≤ i ≤ m, entonces existen
n1 , . . . , nm ≥ 1, mínimos, tales que xi · p ni = 0, 1 ≤ i ≤ m. Nótese que
Ann(xi ) = ⟨p ni ⟩: en efecto, sea Ann(xi ) = ⟨r⟩, como xi · p ni = 0, entonces
p ni ∈ ⟨r⟩, de donde r | p ni , es decir, r = p si , con si ≤ ni ; pero como ni es
mínimo, entonces si = ni . Sin pérdida de generalidad podemos asumir que
n1 ≥ ni , para cada 1 ≤ i ≤ m. Entonces, Ann(x1 ) = ⟨p n1 ⟩ = Ann(M).
Paso 2. Vamos a probar que ⟨x1 ⟩ es sumando directo de M. Puesto que
M no es cíclico, se tiene que M ≠ ⟨x1 ⟩.
94 · Módulos finitamente generados sobre DIPs

Paso 2.1. Probemos que existe 0 ≠ y ∈ M tal que

⟨x1 ⟩ ∩ ⟨y⟩ = 0. (4.1)

Sea z ∈ M − ⟨x1 ⟩; existe un entero mínimo j ≥ 1 tal que z · p j ∈ ⟨x1 ⟩


(sabemos que z · p n1 = 0 ∈ ⟨x1 ⟩), luego z · p j = x1 · a, a ∈ R, n1 ≥ j. Sea p k la
mayor potencia de p que divide a, es decir, a = p k b, con m. c. d.(b, p) = 1.
Veamos que k ≥ 1:

0 = z · p n1 = (z · p j ) · p n1 − j = (x1 · a) · p n1 − j = (x1 · p k b) · p n1 − j ,

de donde p k bp n1 − j ∈ Ann(x1 ) = ⟨p n1 ⟩, luego p n1 − j+k b = p n1 c, y como p no


divide a b, entonces k − j ≥ 0, de donde k ≥ j ≥ 1. Definimos

y := z · p j−1 − x1 · bpk−1 .

Nótese que y ≠ 0 (de lo contrario z · p j−1 ∈ ⟨x1 ⟩). Probemos entonces que
⟨x1 ⟩ ∩ ⟨y⟩ = 0: sea y · s = x1 · d; si p ∤ s, entonces m. c. d. (p n1 , s) = 1, con lo
cual 1 = f s + ep n1 , y de esto se obtiene que

y = y · f s + y · ep n1 = y · f s + 0 = y · ds ∈ ⟨x1 ⟩,

resultando z · p j−1 = y + x1 · bp k−1 ∈ ⟨x1 ⟩, lo cual es falso. Por lo tanto, p | s,


y entonces s = pt, luego

y · s = y · pt = (z · p j−1 − x1 · bpk−1 ) · pt = z · p j t − x1 · bpk t = x1 · at − x1 · at = 0

(si en el razonamiento anterior a = 0, entonces z · p j = 0, y y := z · p j−1


satisface y ≠ 0 y ⟨x1 ⟩ ∩ ⟨y⟩ = 0).
Paso 2.2. Sea L la colección de submódulos no nulos N de M tales
que ⟨x1 ⟩ ∩ N = 0; según (4.1) , L ≠ ∅, y por el lema de Zorn, exis-
te un submódulo no nulo N en M que es maximal para esta propiedad.
Vamos a mostrar que M = ⟨x1 ⟩ + N . Consideremos el cociente M/N ,
notemos que 0 ≠ x1 ∈ M/N y probemos que M/N = ⟨x1 ⟩. Suponga-
mos lo contrario; puesto que M/N es p-primario finitamente generado y
Ann(x1 ) = ⟨p n1 ⟩ = Ann(M/N ), entonces, por lo probado antes, existe 0 ≠ y
en M/N tal que ⟨y⟩ ∩ ⟨x1 ⟩ = 0, luego (⟨y⟩ + N ) ∩ ⟨x1 ⟩ = 0 (en efecto, si
y · s + q = x1 · r, con q ∈ N , entonces y · s + q = x1 · r, luego y · s = x1 · r, de
donde x1 · r = 0. Resulta, x1 · r ∈ ⟨x1 ⟩ ∩ N = 0). Pero ⟨y⟩ + N ⊋ N ya que
y ∉ N , lo cual contradice la maximalidad de N .
Paso 2.3. En total se obtiene que M/N = ⟨x1 ⟩. Sea x ∈ M, entonces
x = x1 · r, luego x − x1 · r ∈ N , de donde M = ⟨x1 ⟩ + N , y por la construcción,
M = ⟨x1 ⟩ ⊕ N .
Módulos finitamente generados sobre DIPs · 95

Paso 3. Podemos ahora completar la prueba del teorema. Denotemos


z1 := x1 y N1 := N ; según vimos en el paso 2, M = ⟨z1 ⟩ ⊕ N1 . Nótese que
N1 satisface las mismas hipótesis que M. Si N1 es cíclico, hemos termina-
do. Supongamos que N1 no es cíclico. Entonces, N1 = ⟨z2 ⟩ ⊕ N2 , donde
Ann(z2 ) = ⟨p n2 ⟩. Nótese que n1 ≥ n2 ya que N1 · p n1 = 0. De esta forma
podemos continuar y obtener una cadena ⟨z1 ⟩ ⊊ ⟨z1 ⟩ ⊕ ⟨z2 ⟩ ⊊ · · · . Pero,
en vista de la proposición 8.4.1, esta cadena debe detenerse, es decir, para
algún t, Nt es cíclico y Nt+1 = 0, luego M = ⟨z1 ⟩ ⊕ ⟨z2 ⟩ ⊕ · · · ⊕ ⟨zt ⟩ es una
suma directa finita de submódulos cíclicos. ✓

En la demostración del teorema 8.4.2 vimos que

M = ⟨z1 ⟩ ⊕ ⟨z2 ⟩ ⊕ · · · ⊕ ⟨zt ⟩,

además, Ann(zi ) = ⟨p ni ⟩ y n1 ≥ n2 ≥ · · · ≥ nt ≥ 1. Pero nótese que


⟨zi ⟩  R/Ann(zi ) = R/⟨p ni ⟩ = Rpni . Hemos probado el siguiente resultado.
Corolario 8.4.3. Sea M un R-módulo p-primario finitamente generado. Enton-
ces, existen enteros 1 ≤ n1 ≤ n2 ≤ · · · ≤ nt tales que

M  R p n1 ⊕ · · · ⊕ R p nt . (4.2)

Demostración. Basta renombrar los exponentes y tener en cuenta que la su-


ma directa externa es conmutativa. ✓

Veamos ahora la unicidad de la descomposición (4.2) .


Corolario 8.4.4. Sea p un irreducible de R y sean 1 ≤ n1 ≤ n2 ≤ · · · ≤ nt ;
1 ≤ l1 ≤ l2 ≤ · · · ≤ lr enteros positivos tales que se tiene el siguiente R-isomorfismo

Rpn1 ⊕ · · · ⊕ Rpnt  Rpl1 ⊕ · · · ⊕ Rplr .

Entonces, r = t y ni = li , para 1 ≤ i ≤ t.
Demostración. Basta aplicar la proposición 5.3.7 con Ii = ⟨p ni ⟩, J j = ⟨pl j ⟩,
1 ≤ i ≤ t, 1 ≤ j ≤ r. □✓

5. Divisores elementales y factores


invariantes
Sea M un R-módulo p-primario finitamente generado. El invariante de M
definido por los corolarios 8.4.3 y 8.4.4 se denota por

(n1 , . . . , nt ) p , 1 ≤ n1 ≤ · · · ≤ nt .
96 · Módulos finitamente generados sobre DIPs

Recordemos que si M es un R-módulo finitamente generado y de torsión,


el conjunto PM , definido por

PM := {p ∈ P | M (p) ≠ 0},

es finito y único para M, donde P es la colección de irreducibles de R y


M (p) es la componente p-primaria de M (véase la demostración del corola-
rio 8.1.7).

Definición 8.5.1. Sea M un R-módulo finitamente generado y de torsión.


La colección
{(n1 , . . . , nt ) p | 1 ≤ n1 ≤ · · · ≤ nt } p ∈PM
definida por las componentes primarias de M se denomina sistema de di-
visores elementales de M.

Los resultados de las secciones precedentes se pueden resumir en el si-


guiente teorema de estructura de los módulos finitamente generados sobre
dominios de ideales principales.

Teorema 8.5.2. Sea M un R-módulo finitamente generado. Entonces, M se des-


compone en suma directa de su submódulo de torsión T (M) y un submódulo libre
N:
M = T (M) ⊕ N .
La parte libre N está unívocamente determinada salvo isomorfismo. Más exacta-
mente, existe un único entero r ≥ 0 tal que N  R r (si M es de torsión r = 0 y
N = 0). La parte de torsión T (M) es única y está conformada por los elementos de
torsión de M; además T (M) es suma directa finita de sus componentes primarias,
es decir, existe un conjunto finito p1 , . . . , ps de elementos irreducibles de R, únicos
para M, tales que

T (M) = T (M) (p1 ) ⊕ · · · ⊕ T (M) (ps ) .

A su vez, cada componente primaria T (M) (p) es una suma directa finita de submó-
dulos cíclicos
T (M) (p)  Rpn1 ⊕ · · · ⊕ Rpnt ,
con 1 ≤ n1 ≤ · · · ≤ nt . De esta forma T (M) (p) está unívocamente determina-
do por (n1 , . . . , nt ) p , y a su vez, T (M) está unívocamente determinado por sus
divisores elementales:
(n11 , · · · , n1t1 ) p1 , 1 ≤ n11 ≤ · · · ≤ n1t1
.. ..
. .
(ns1 , · · · , nsts ) ps , 1 ≤ ns1 ≤ · · · ≤ nsts .
Módulos finitamente generados sobre DIPs · 97

Demostración. La demostración se sustenta con todos los resultados prece-


dentes. ✓

Sea M un R-módulo finitamente generado y de torsión; reordenando las


componentes primarias de M se obtiene una versión alterna del teorema de
estructura a través de los llamados factores invariantes de M. Sean
(n11 , · · · , n1t1 ) p1 , 1 ≤ n11 ≤ · · · ≤ n1t1
.. ..
. .
(ns1 , · · · , nsts ) ps , 1 ≤ ns1 ≤ · · · ≤ nsts

los divisores elementales de M; completando con ceros desde la izquierda en


cada fila y reindizando, podemos suponer que t1 = · · · = ts = m y construir
la matriz
n11 · · · n1 j · · · n1m 
 .. .. ..  ,
 
 . . . 

 ns1 · · · ns j · · · nsm 
 
con 0 ≤ ni1 ≤ · · · ≤ nim , 1 ≤ i ≤ s. Nótese que cada columna tiene por lo
menos un elemento no nulo.

Definición 8.5.3. Se denomina j-ésimo factor invariante de M al ele-


mento a j ∈ R definido por
s
n
Ö
a j := pi i j , 1 ≤ j ≤ m.
i=1

Nótese que a j ≠ 0 y a j ∉ R ∗ para cada 1 ≤ j ≤ m, y además,

a j | ak , para j ≤ k. (5.1)

De otra parte, para cada 1 ≤ j ≤ m se tiene el R-isomorfismo

R a j  R p n1 j ⊕ · · · ⊕ R p n s j .
1 s

En efecto, la función
n n
f j : R −→ R/⟨p11 j ⟩ ⊕ · · · ⊕ R/⟨ps s j ⟩
r ↦−→ (r , . . . , r)

es un R-homomorfismo con núcleo


s
n n n
Ù
ker( f j ) = ⟨pi i j ⟩ = ⟨p11 j · · · ps s j ⟩ = ⟨a j ⟩.
i=1
98 · Módulos finitamente generados sobre DIPs

Por el teorema chino de residuos, f j es sobreyectivo (véase [23]). Ya que los


sumandos de una suma directa son permutables, los isomorfismos anterio-
res inducen a su vez el isomorfismo

M  Ra1 ⊕ · · · ⊕ Ram . (5.2)

Por la proposición 5.3.7, los factores invariantes a1 , . . . , am de M son úni-


cos salvo invertibles de R, es decir, si b1 , . . . , bn son elementos no nulos y
no invertibles de R que satisfacen (5.1) y (5.2) , entonces n = m, y ade-
más, a j = b j u j , con ui ∈ R ∗ , 1 ≤ j ≤ m. Hemos demostrado la siguiente
proposición.

Proposición 8.5.4. Sea M un R-módulo finitamente generado y de torsión. En-


tonces, existen elementos a1 , . . . , am ∈ R, no nulos y no invertibles, tales que

ai | a j , para 1 ≤ i ≤ j ≤ m

y
M  Ra1 ⊕ · · · ⊕ Ram .
Salvo factores invertibles, la sucesión (a1 , . . . , am ) es única para M (los factores
invariantes de M).

Queremos extender el resultado anterior a cualquier módulo finitamente


generado. Para esto necesitamos algunos conceptos y resultados de álgebra
lineal sobre anillos (véase [25]). Recordemos que Mn (R) denota el anillo
de matrices cuadradas sobre R de tamaño n × n. La equivalencia de dos
matrices F , G ∈ Mn (R) se define por

G = DFC , con D, C ∈ GLn (R),

donde GLn (R) = Mn (R) ∗ = grupo de matrices invertibles de Mn (R). Exis-


te un isomorfismo de R-módulos entre HomR (R n , R n ) y Mn (R) que a cada
homomorfismo f le asigna una matriz F calculada en la base canónica de
R n . Notemos que Im( f ) coincide con el R-submódulo de R n generado por
las columnas de F . Además, dos matrices F y G de Mn (R) son equivalen-
tes si, y sólo si, representan el mismo homomorfismo f pero en diferentes
bases. Finalmente, en GLn (R) se tienen tres tipos de matrices elementales,
correspondientes a la realización de operaciones elementales sobre las filas
y columnas de matrices de Mn (R):

(i) Las permutaciones, es decir, matrices de la forma

Pi j := E − Eii − E j j + Ei j + E ji .
Módulos finitamente generados sobre DIPs · 99

(ii) Las diagonales

Di (r) := diag(1, . . . , 1, r , 1, . . . , 1) = E + Eii · (r − 1),

con r ∈ R ∗ en la i-ésima componente.

(iii) Las propiamente elementales, también llamadas transvecciones,

Ti j (a) := E + Ei j · a,

con a ∈ R, i ≠ j.

Teorema 8.5.5 (Forma normal de Smith) . Sea F ∈ Mn (R). Entonces existen


elementos d1 , . . . , dn ∈ R tales que F es equivalente a una matriz diagonal
d1 0 

 .. ,


 . 
0
 dn 

en la cual, si i ≤ j y di ≠ 0, entonces di | d j .

Demostración. La prueba se efectuará por inducción sobre n.


Para n = 1 no hay nada que mostrar.
Sea n ≥ 2. Supongamos la afirmación cierta para todas las matrices de
orden n − 1 y sea F = [ai j ] ∈ Mn (R). Si F = 0, no hay más que establecer.
Sea F ≠ 0. Multiplicando por matrices de permutación, si es necesario,
podemos suponer que a11 ≠ 0. Consideremos entonces tres casos posibles.
Caso 1, a11 ∈ R ∗ : multiplicando por una matriz diagonal y por matrices
propiamente elementales, F resulta equivalente a una matriz de la forma
 
1 0
,
0 B

con B ∈ Mn−1 (R). Aplicando inducción y el homomorfismo natural de gru-


pos

GLn−1 (R) −→ GLn (R) (5.3)

se obtiene el resultado pedido.


Caso 2, a11 ∉ R ∗ , pero a11 | a1 j y a11 | ai1 , para todo 1 ≤ i , j ≤ n:
multiplicando por matrices propiamente elementales, F es equivalente a
una matriz de la forma  
a11 0
,
0 B
100 · Módulos finitamente generados sobre DIPs

con B ∈ Mn−1 (R). Aplicando inducción y el homomorfismo (5.3) , F resulta


equivalente a una matriz de la forma

 a11 
 
 d2 
, (5.4)
 
 ..

 . 


 dn 

donde di | d j , para 2 ≤ i ≤ j, di ≠ 0. Si a11 | d2 la prueba ha terminado. En


caso contrario, la matriz de (5.4) resulta equivalente a la matriz

 a11 d2 · · · 0 

 0 d2 
(5.5)
 
 .. 

 . 

 0
 dn 

y podemos proceder como en el siguiente caso 3.


Caso 3, a11 ∉ R ∗ y existe al menos un elemento no diagonal en la primera fila o
en la primera columna de F al cual a11 no divide: consideremos la primera po-
sibilidad (la segunda es de tratamiento análogo). Utilizando permutaciones,
si ello es necesario, podemos suponer que a11 ∤ a12 . Sea

a11 =: m. c. d.(a11 , a12 );
′ ⟩ (de ser iguales se tendría que a
notemos que ⟨a11 ⟩ ⪇ ⟨a11 11 | a12 , lo cual

es falso). Existen r , s ∈ R tales que a11 = r a11 + sa12 , r , s ∈ R; sean, además,
r ′ , s ′ ∈ R tales que a11 = a11
′ r ′, a ′ ′ ′ ′ ′ ′ ′
12 = a11 s . Entonces, a11 = r a11 r + sa11 s ,
1 = rr ′ + ss ′ y la matriz

 r −s ′ 0
s r′


 
C := 
 1  ∈ GLn (R).

 .. 

 . 

0 1

Así, multiplicando la matriz F por C a la derecha, resulta F equivalente a la


matriz
 a ′ 0 ∗ · · · ∗
 11 
 ∗ 
,
 
 ..
 . ∗ 
 
 ∗ 
 
Módulos finitamente generados sobre DIPs · 101

donde ∗ indica entradas con elementos de R. Si a11 ′ ∈ R ∗ , regresamos al


′ ∉ R ∗ podemos repetir el razonamiento
caso 1 y la prueba termina. Si a11
de los casos 2 y 3. Sin embargo, notemos que el proceso termina al cabo
de un número finito de pasos, ya que lo contrario se obtendría la sucesión
′ ⟩ ⪇ ⟨a ′′ ⟩ ⪇ ⟨a ′′′ ⟩ ⪇ · · · , lo cual
infinita ascendente de ideales ⟨a11 ⟩ ⪇ ⟨a11 11 11
es imposible (véase [23]). ✓

Si se observa con detalle la prueba efectuada, esta se puede aplicar tam-


bién a matrices rectangulares. Los elementos d1 , . . . , dn se denominan los
factores invariantes de F .
Proposición 8.5.6. Los factores invariantes de una matriz F ∈ Mn (R) son
únicos, salvo factores invertibles.
Demostración. Sean P , Q , H y G matrices invertibles tales que
d1 0   p1 0 
 
P FQ = 
 .. ,

H FG = 
 .. .

 .   . 
0
 dn  0
 pn 
Sea f : R n −→ R n el R-homomorfismo defindo por F , es decir,

f [r1 , . . . , rn ]T := F [r1 , . . . , rn ]T ;

notemos que P FQ y H FG son equivalentes, luego definen el mismo ho-


momorfismo f (simplemente en diferentes bases de R n , véase [25]). Por lo
tanto,

Im( f ) = ⟨[d1 , . . . , 0]T , . . . , [0, . . . , dn ]T ⟩


= ⟨[p1 , . . . , 0]T , . . . , [0, . . . , pn ]T ⟩,

y de esta manera,

[0, . . . , di , . . . , 0]T = [p1 , . . . , 0]T · u1 + · · · + [0, . . . , pi , . . . , 0]T · ui


+ · · · + [0, . . . , pn ]T · un ,

con ui ∈ R. Resulta, di = pi ui . Simétricamente, pi = di zi , con zi ∈ R. De esta


forma, di = di zi ui , y entonces, para cada 1 ≤ i ≤ n se tiene que di = 0 = pi
ó pi = di zi , con zi ∈ R ∗ . ✓

Proposición 8.5.7 (Teorema de las bases simultáneas) . Sea M un R-módulo


libre de dimensión finita n ≥ 1 y sea 0 ≠ N ≤ M, con m = dim(N ). Entonces,
existe una base X = {x1 , . . . , xn } en M y elementos d1 , . . . , dn ∈ R de tal forma
que {x1 · d1 , . . . , xm · dm } es una base de N , y para 1 ≤ i ≤ j ≤ n, con di ≠ 0,
se tiene que di | d j .
102 · Módulos finitamente generados sobre DIPs

Demostración. Sea X ′ = {x1′ , . . . , xn′ } una base de M. Según la proposición


8.2.2, N tiene una base Y = {w1′ , . . . , wm′ }, con 1 ≤ m ≤ n, m = dim(N ).
Expresamos cada w ′j a través de X ′:
n
∑︁
w ′j = xi′ · bi j , i ≤ j ≤ m.
i=1

Con notación matricial las relaciones anteriores se pueden escribir de la si-


guiente manera:
[w1′ , . . . , wm′ , 0, . . . , 0] = [x1′ , . . . , xn′ ]B,
con
b11 · · · b1m 0 · · · 0
 
b21 · · · b2m 0 · · · 0
B= . ..  ∈ Mn (R).
 
 .. .. ..
 . . .
b · · · b 0 · · · 0 
 n1 nm 
Por el teorema 8.5.5, existen matrices invertibles H y G de orden n y ele-
mentos d1 , . . . , dn ∈ R tales que
D := H BG = diag(d1 , . . . , dn ),
y además, si i ≤ j y di ≠ 0, entonces di | d j . Resulta
[w1′ , . . . , wm′ , 0, . . . , 0]G = [x1′ , . . . , xn′ ]BG
= [x1′ , . . . , xn′ ]H −1 D.
Sean
[w1 , . . . , wn ] := [w1′ , . . . , wm′ , 0, . . . , 0]G
y
[x1 , . . . , xn ] := [x1′ , . . . , xn′ ]H −1 .
Observemos que {x1 , . . . , xn } es una base de M y
[w1 , . . . , wn ] = [x1 , . . . , xn ]D = [x1 · d1 , . . . , xn · dn ],
es decir, w j = x j · d j , 1 ≤ j ≤ n. Nótese que
[w1′ , . . . , wm′ , 0, . . . , 0] = [w1 , . . . , wn ]G −1 ,
luego N = ⟨w1′ , . . . , wm′ ⟩ = ⟨w1 , . . . , wn ⟩ ⊆ N , es decir,
⟨x1 · d1 , . . . , xn · dn ⟩ = N .
Reordenando, y conservando la divisibilidad, sea {d1 , . . . , dp } la colección
de elementos no nulos en el sistema {d1 , . . . , dn }. Así, {x1 · d1 , . . . , xp · dp }
es una base de N y p = m. ✓

Módulos finitamente generados sobre DIPs · 103

Estamos ya en condiciones de presentar la versión general de la propo-


sición 8.5.4.

Teorema 8.5.8. Sea M un R-módulo finitamente generado. Entonces, existe un


conjunto finito de elementos d1 , . . . , dn ∈ R tales que

M  Rd1 ⊕ · · · ⊕ Rdn , (5.6)

y, para 1 ≤ i ≤ j ≤ n, si di ≠ 0 entonces di | d j . Los elementos d1 , . . . , dn que


cumplen (5.6) son únicos para M, salvo invertibles, y se denominan los factores
invariantes de M.

Demostración. Si M = 0, entonces M = R1 . Sea M no nulo. Existen L libre


de dimensión finita n ≥ 1 y f : L −→ M un homomorfismo sobreyecti-
vo. Sea N := ker( f ); si N = 0, M es libre y sus factores invariantes son
d1 = · · · = dn = 0. Si N ≠ 0, según la proposición 8.5.7, existe una base
X = {x1 , . . . , xn } en L y d1 , . . . , dn ∈ R tales que {x1 · d1 , . . . , xm · dm } es
una base de N , con m = dim(N ). De este modo,
x1 · R ⊕ · · · ⊕ xm · R ⊕ xm+1 · R ⊕ · · · ⊕ xn · R
M  L/N = .
x1 d1 · R ⊕ · · · ⊕ xm dm · R
Veamos por último que este cociente es isomorfo a

Rd1 ⊕ · · · ⊕ Rdm ⊕ R ⊕ · · · ⊕ R , (5.7)


| {z }
n−m

completando así la prueba de (5.6) con factores invariantes


(d1 , . . . , dm , 0, . . . , 0). Para esto basta considerar el homomorfismo sobre-
yectivo

g : x1 · R ⊕ · · · ⊕ xm · R ⊕ xm+1 · R ⊕ · · · ⊕ xn · R −→ Rd1 ⊕ · · · ⊕ Rdm ⊕ R ⊕ · · · ⊕ R

dado por

g (x1 · r1 + · · · + xm · rm + xm+1 · rm+1 + · · · + xn · rn ) := (r1 , . . . , rm , rm+1 , . . . , rn ),

cuyo núcleo es precisamente N . La unicidad de los factores invariantes es


consecuencia de la proposición 5.3.7. ✓

6. Grupos abelianos finitamente generados


Las definiciones y resultados del presente capítulo pueden ser aplicados al
caso particular de los ℤ-módulos, es decir, de los grupos abelianos.
104 · Módulos finitamente generados sobre DIPs

Proposición 8.6.1. Sea G un grupo abeliano. Entonces,

(i) G (p) es la componente p-primaria de G.

(ii) Si G es finito, entonces G (p) es el p-subgrupo de Sylow de G.

(iii) Si G es de torsión, entonces G es suma directa de sus componentes primarias.

(iv) Si G es de torsión finitamente generado, entonces G es finito y es suma directa


finita de sus componentes primarias, es decir, G es suma directa finita de sus
subgrupos de Sylow.

Demostración. Consecuencia directa de la definción de componente prima-


ria, del concepto de subgrupo de Sylow (véase [22]) y de los resultados de
las secciones anteriores. ✓

Podemos ahora complementar las propiedades de la proposición 8.6.1


y probar el teorema de estructura de los grupos abelianos finitamente gene-
rados.

Teorema 8.6.2. Sea G un grupo abeliano finitamente generado.

(i) Si G es p-primario, entonces G es suma directa de subgrupos cíclicos en la


forma
G  ℤ p n1 ⊕ · · · ⊕ ℤ p nt ,
donde 1 ≤ n1 ≤ n2 ≤ · · · ≤ nt . En consecuencia, G es finito.

(ii) G es suma directa finita de subgrupos cíclicos. Más exactamente, existen irre-
ducibles p1 , . . . , pr y enteros no negativos n11 ≤ · · · ≤ n1t1 ; . . . ;
nr1 ≤ · · · ≤ nrtr y n tales que

G  ℤpn11 ⊕ · · · ⊕ ℤ n1t
1
⊕ · · · ⊕ ℤprnr1 ⊕ · · · ⊕ ℤprnrtr ⊕ ℤn .
1 p1

Demostración. (i) Esta parte es consecuencia directa del corolario 8.4.3.


(ii) Según el teorema 8.3.1, G  T (G) ⊕ ℤn , donde n = rank(G). Si G es
de torsión, entonces n = 0 y G = T (G). Si G es libre, entonces T (G) = 0 y
G  ℤn . Si G no es libre y no es de torsión, por el teorema 8.1.6 se tiene que
G  G (p1 ) ⊕ · · · ⊕G (pr ) ⊕ ℤn . Ahora aplicamos la parte (i) a cada componente
G (pi ) . ✓

Ejemplo 8.6.3. Con los resultados del presente capítulo, podemos calcular
(salvo isomorfismo) todos los grupos abelianos finitos de un orden dado n.
(i) Los grupos abelianos de orden p m con p irreducible y m ≥ 1 son
ℤpk1 ⊕ · · · ⊕ ℤpkt con 1 ≤ k1 ≤ · · · ≤ kt , k1 + · · · + kt = m. Así, por ejemplo,
Módulos finitamente generados sobre DIPs · 105

si p = 5 y m = 4, entonces tenemos 5 grupos abelianos (no isomorfos) de


orden 54 = 625:

ℤ5 ⊕ ℤ5 ⊕ ℤ5 ⊕ ℤ5 , ℤ5 ⊕ ℤ5 ⊕ ℤ52 , ℤ5 ⊕ ℤ53 = ℤ5 ⊕ ℤ125 ,


ℤ52 ⊕ ℤ52 = ℤ25 ⊕ ℤ25 , ℤ54 = ℤ625 .

(ii) Con ayuda de los divisores elementales, calculemos todos los grupos
abelianos (no isomorfos) de orden 1440 = 25 · 32 · 5:

(1, 1, 1, 1, 1)2 , (1, 1, 1, 2)2 , (1, 1, 3)2 , (1, 2, 2)2 , (1, 4)2 , (2, 3)2 , (5)2 ;
(1, 1)3 , (2)3 ;
(1)5 .

Se presentan entonces 14 grupos:

ℤ2 ⊕ ℤ2 ⊕ ℤ2 ⊕ ℤ2 ⊕ ℤ2 ⊕ ℤ3 ⊕ ℤ3 ⊕ ℤ5 ;
ℤ2 ⊕ ℤ2 ⊕ ℤ2 ⊕ ℤ2 ⊕ ℤ2 ⊕ ℤ9 ⊕ ℤ5 ;
ℤ2 ⊕ ℤ2 ⊕ ℤ2 ⊕ ℤ4 ⊕ ℤ3 ⊕ ℤ3 ⊕ ℤ5 ;
ℤ2 ⊕ ℤ2 ⊕ ℤ2 ⊕ ℤ4 ⊕ ℤ9 ⊕ ℤ5 ;
ℤ2 ⊕ ℤ2 ⊕ ℤ8 ⊕ ℤ3 ⊕ ℤ3 ⊕ ℤ5 ;
ℤ2 ⊕ ℤ2 ⊕ ℤ8 ⊕ ℤ9 ⊕ ℤ5 ;
ℤ2 ⊕ ℤ4 ⊕ ℤ4 ⊕ ℤ3 ⊕ ℤ3 ⊕ ℤ5 ;
ℤ2 ⊕ ℤ4 ⊕ ℤ4 ⊕ ℤ9 ⊕ ℤ5 ;
ℤ2 ⊕ ℤ16 ⊕ ℤ3 ⊕ ℤ3 ⊕ ℤ5 ;
ℤ2 ⊕ ℤ16 ⊕ ℤ9 ⊕ ℤ5 ;
ℤ4 ⊕ ℤ8 ⊕ ℤ3 ⊕ ℤ3 ⊕ ℤ5 ;
ℤ4 ⊕ ℤ8 ⊕ ℤ9 ⊕ ℤ5 ;
ℤ32 ⊕ ℤ3 ⊕ ℤ3 ⊕ ℤ5 ;
ℤ32 ⊕ ℤ9 ⊕ ℤ5 .

Para cada uno de los grupos anteriores, se puede calcular con ayuda de la
definición 8.5.3 su descomposición única en factores invariantes; veamos,
por ejemplo, el primero, el sexto y el último: las matrices a las cuales se hace
referencia en el párrafo que precede a la mencionada definición son:

1 1 1 1 1 1 1 3 5
     
0 0 0 1 1 , 0 0 2 , 2 .
     
0 0 0 0 1 0 0 1 1
     
106 · Módulos finitamente generados sobre DIPs

Así, las respectivas descomposiciones en factores invariantes son

ℤ2 ⊕ ℤ2 ⊕ ℤ2 ⊕ ℤ6 ⊕ ℤ30 ,
ℤ2 ⊕ ℤ2 ⊕ ℤ360 ,
ℤ1440 .

Ejemplo 8.6.4. En el ejemplo 4.2.2 calculamos los grupos de homomor-


fismos entre grupos cíclicos. Ahora, con el teorema anterior y el teorema
5.3.6, podemos calcular los grupos de homomorfismos entre grupos abe-
lianos finitamente generados. En efecto, sean G y H dos grupos abelianos
finitamente generados con descomposiciones

G = T (G) ⊕ ℤn y H = T (H ) ⊕ ℤm ,
T (G) = ℤpn11 ⊕ · · · ⊕ ℤ n1t
1
⊕ · · · ⊕ ℤprnr1 ⊕ · · · ⊕ ℤprnrtr
1 p1

T (H ) = ℤqm11 ⊕ · · · ⊕ ℤ m1k
1
⊕ · · · ⊕ ℤqms1 ⊕ · · · ⊕ ℤqmsks .
1 q1 s s

Entonces, para calcular Hom(G , H ) = Homℤ (G , H ) debemos realizar por


separado los siguientes cálculos:

(i) Homℤ (T (G), T (H )): en este caso, el problema se reduce a calcular


todos los grupos de la forma Homℤ (ℤp𝛼 , ℤq 𝛽 ), y luego a realizar el
producto cartesiano. Pero sabemos que

Homℤ (ℤp𝛼 , ℤq 𝛽 )  ℤd ,

con d = m. c. d.(p 𝛼 , q 𝛽 ).

(ii) Homℤ (T (G), ℤm ) = 0.

(iii) Si n ≥ 1, Homℤ (ℤn , T (H ))  T (H ) n .

(iv) Si n = 0, Homℤ (ℤn , T (H )) = 0.

(v) Si n, m ≥ 1,

Homℤ (ℤn , ℤm )  Homℤ (ℤ, ℤ) ⊕ · · · ⊕ Homℤ (ℤ, ℤ)  ℤnm .


| {z }
nm-veces

(vi) Si n = 0 o m = 0, Homℤ (ℤn , ℤm ) = 0.

En particular, hemos probado que si G y H son grupos abelianos finitamente


generados de rangos n y m respectivamente, entonces Hom (G , H ) es un
grupo abeliano finitamente generado de rango nm.
Módulos finitamente generados sobre DIPs · 107

7. Ejercicios
1. Demuestre la proposición 8.1.2.

2. Demuestre la proposición 8.1.5.

3. Calcule Homℤ (ℤ2 ⊕ ℤ8 ⊕ ℤ9 ⊕ ℤ2 , ℤ4 ⊕ ℤ5 ⊕ ℤ25 ⊕ ℤ).

4. Calcule el rango y los divisores elementales del grupo abeliano del


ejercicio anterior.

5. Demuestre que ℤ72 ⊕ ℤ84  ℤ36 ⊕ ℤ168 .

6. ¿Son ℤ72 ⊕ ℤ12 y ℤ18 ⊕ ℤ48 isomorfos?

7. Sea R un DIP y sean M , N dos R-módulos finitamente generados.


Demuestre que HomR (M , N ) es finitamente generado.

8. Calcule la forma normal de Smith y los factores invariantes de la si-


guiente matriz con entradas en ℤ:

1 2 4
 
4 1 2 .
 
4 4 3
 

9. Calcule la forma normal de Smith y los factores invariantes de la si-


guiente matriz con entradas en ℝ[x] (recuerde que ℝ[x] es un DIP,
véase [23]):
1 + x −x 1 − x 2 
 
 −x
 x 1 + x 2  .
 −x 3 x 2 x − 1 
 
10. Sea R un DIP y sea M un R-módulo libre de dimensión n ≥ 1. Sea
0 ≠ x ∈ M. Demuestre que las siguientes condiciones son equivalen-
tes:

(i) x es parte de una base de M.


(ii) Si x · r = x ′ · r ′, con x ′ ∈ M, r , r ′ ∈ R, r ≠ 0, entonces r es
múltiplo de r ′.
(iii) Si x = x ′ · r, con r ∈ R y x ′ ∈ M, entonces r ∈ R ∗ .
(iv) El ideal generado por las coordenadas de x en una base X de M
coincide con R (las coordenadas de x son los coeficientes de R
en la expansión de x a través de la base X).
108 · Módulos finitamente generados sobre DIPs

(v) El ideal generado por las coordenadas de x en toda base X de M


coincide con R.
(vi) Existe f ∈ HomR (M , R) tal que f (x) = 1.

11. Sean R un DIP, M un R-módulo y 0 ≠ r ∈ R. El elemento m ∈ M


se dice divisible por r si existe m ′ ∈ M tal que m = m ′ · r. M es
divisible por r si cada elemento de M es divisible por r. Se dice que
M es divisible si es divisible por cada r ≠ 0, r ∈ R. Demuestre que:

(i) Si 0 ≠ r ∈ R, el conjunto de elementos de M divisibles por r


constituyen un submódulo de M.
(ii) El conjunto de elementos de M divisibles por cada r ≠ 0, r ∈ R,
es un submódulo de M.
(iii) Existe un submódulo divisible d(M) en M el cual es máximo en
la colección de submódulos divisibles de M, respecto a la inclu-
sión: ∑︁
d(M) = W,
W ∈C
donde C es la colección de submódulos divisibles de M.
(iv) M es divisible ⇔ d(M) = M.
(v) El cuerpo 𝕂 de fracciones de R es divisible. ℚ es divisible.
(vi) Si M es divisible y f : M −→ N es un homomorfismo, entonces
Im( f ) es divisible.
(vii) Cada sumando directo de un módulo divisible es divisible.
(viii) El producto y suma directa de divisibles es divisible.
(ix) Para cada irreducible p en R, Rp∞ es divisible.
(x) Sea I un ideal de R y sea f : I −→ P un R-homomorfismo
con P un R-módulo divisible. Demuestre que f se extiende a
un homomorfismo e f : R −→ P.

12. Sean 𝕂 un cuerpo, V un 𝕂-espacio vectorial, T : V −→ V una trans-


formación lineal, la cual fijamos, y sea 𝕂 [x] el anillo de polinomios
con coeficientes en 𝕂. Entonces,

(i) Demuestre que el siguiente producto convierte a V en un mó-


dulo sobre 𝕂 [x]:
a(x) · v :=(a0 · iV + a1 · T + · · · + an · T n )(v)
=a0 · v + a1 · T (v) + · · · + an · T n (v) = a(T )(v),
con v ∈ V y a(x) := a0 + a1 x + · · · + an x n ∈ 𝕂 [x].
Módulos finitamente generados sobre DIPs · 109

(ii) Denotemos por V e el 𝕂 [x]-módulo del punto anterior. Demues-


tre que si V es de dimensión finita sobre 𝕂, entonces Ve es fini-
tamente generado y de torsión.
(iii) Sea V de dimensión finita como en el punto anterior. Sea p(x)
un polinomio mónico irreducible de 𝕂 [x]. Demuestre que la
componente p(x)-primaria de V e es no nula si, y sólo si, p(x) |
qT (x), con qT (x) el polinomio mínimo de la transformación T
(es decir, el polinomio mónico no nulo qT (x) de menor grado
tal que qT (T ) = 0, véase [25]).
(iv) Sean V y qT (x) como en el punto anterior. Demuestre que exis-
ten vectores no nulos v1 , . . . , vr ∈ V e y polinomios mónicos no
nulos q1 (x), . . . , qr (x) ∈ 𝕂 [x] tales que:
(a) V
e = ⟨v1 ⟩ ⊕ · · · ⊕ ⟨vr ⟩.
(b) Si i ≤ j, entonces qi (x) | q j (x).
(c) q1 (x) = qT (x).
· 1

Cuaderno IV

Álgebra lineal
Dedicado a Toñita, mi madre
Presentación

El presente cuaderno está dedicado al estudio del álgebra lineal generaliza-


da, es decir, al estudio de los espacios vectoriales, los operadores lineales,
las matrices y las formas, pero consideradas sobre anillos dimensionales ar-
bitratrarios, es decir, anillos para los cuales un espacio libre de bases finitas
tiene dimensión. El álgebra lineal sobre anillos ha sido tratada también por
otros autores; por ejemplo en las monografías [3] y [33] se estudia el álgebra
lineal sobre anillos conmutativos. Los tres capítulos finales de este cuaderno
corresponden a temas de álgebra lineal avanzada, a saber: el producto ten-
sorial y exterior de espacios, las formas canónicas de operadores y matrices
estudiadas desde la teoría de módulos y el estudio de los grupos de matrices,
incluidos los grupos clásicos.
Otras fuentes fuertemente recomendadas a los lectores para comple-
mentar los temas aquí tratados son [3], [16] y [33].
Para aprovechar mejor el material del presente cuaderno es convenien-
te que el lector haya estudiado previamente un curso elemental de álgebra
lineal clásica, es decir, de álgebra lineal sobre cuerpos, y un curso básico
de anillos y módulos (véase [23] y [24]). A denotará un anillo no necesa-
riamente conmutativo y con unidad 1. A∗ es el grupo multiplicativo de los
elementos invertibles del anillo A. Si f es un homomorfismo de anillos,
entonces f (1) = 1.
Capítulo
uno
Matrices
Matrices · 3

El estudio de los espacios vectoriales sobre anillos, desde la perspectiva ma-


tricial, tensorial y de las formas canónicas y sesquilineales que estudiaremos
en el presente cuaderno, constituye la denominada álgebra lineal generali-
zada, también llamada álgebra lineal sobre anillos. Desde luego esta área se
puede considerar como una rama de la teoría de módulos (véase [24]). La
teoría que desarrollaremos se hará sobre anillos arbitrarios (principalmente
conmutativos); sin embargo, los ejemplos estarán centrados en los siguien-
tes anillos particulares: un cuerpo cualquiera 𝕂, el anillo ℤ de los números
enteros, el anillo ℤn de los enteros módulo n ≥ 2 y el anillo 𝕂 [x] de los
polinomios en una indeterminada con coeficientes en el cuerpo 𝕂.

1. Estructuras algebraicas básicas


La primera sección de este capítulo es de caracter introductorio y permite
repasar algunos conceptos de anillos y módulos; sin embargo, invitamos al
lector a recordar la teoría básica (véanse [23] y [24]), la cual emplearemos
libremente durante todos los desarrollos del presente ejemplar.

Definición 1.1.1. Sea G un conjunto no vacío. Una operación binaria in-


terna en G es una función ∗ con dominio el producto cartesiano G × G y
codominio G

∗ : G × G −→ G
(a, b) ↦−→ a ∗ b.

Si la operación ∗ es asociativa en el sentido que

(a ∗ b) ∗ c = a ∗ (b ∗ c),

para cualesquiera elementos a, b, c ∈ G, entonces se dice que (G , ∗) es un


semigrupo. Si en el conjunto G del semigrupo (G , ∗) existe un elemento e
tal que
e ∗ a = a = a ∗ e,
para cada a ∈ G, se dice que (G , ∗) es un monoide con elemento neutro e.
Si (G , ∗) es un monoide y cada elemento a ∈ G tiene un inverso, es decir,
existe a ′ ∈ G tal que
a ∗ a ′ = e = a ′ ∗ a,
entonces se dice que (G , ∗, e) es un grupo. Si además la operación ∗ es
conmutativa, es decir,
a ∗ b = b ∗ a,
4 · Matrices

para cualesquiera elementos a, b ∈ G, entonces se dice que el grupo (G , ∗, e)


es conmutativo (también llamado abeliano).
Los semigrupos, monoides y grupos se acostumbran a denotar simple-
mente por su conjunto de elementos, de tal manera que, por ejemplo, el
grupo (G , ∗, e) se denotará por G.
Ejemplo 1.1.2. El conjunto ℕ = {0, 1, 2, . . . } de los números naturales es
un monoide conmutativo respecto a la adición usual y tiene como elemento
neutro al natural 0. De igual manera, el conjunto de los números enteros
ℤ = {. . . , −2, −1, 0, 1, 2, . . . } es un grupo abeliano con la adición usual.
Proposición 1.1.3. En cualquier grupo el elemento neutro y el inverso de un
elemento son únicos.
Demostración. Consecuencia directa de las definiciones. ✓

Notemos que el conjunto ℤ posee dos operaciones, la adición y el pro-


ducto, de tal forma que respecto de la primera es un grupo abeliano, mien-
tras que con la segunda es un monoide. Conjuntos con tal condición con-
forman los llamados anillos.
Definición 1.1.4. Un anillo es un conjunto A, con dos operaciones + y ·
llamadas adición y producto, tal que
(i) (A, +) es un grupo conmutativo.

(ii) (A, ·) es un monoide.

(iii) El producto se distribuye sobre la adición, es decir,

a · (b + c) = a · b + a · c,
(a + b) · c = a · c + b · c.

El anillo A es conmutativo si el producto es conmutativo. Un elemento


a ∈ A es invertible si tiene inverso respecto al producto.
Observación 1.1.5. (i) Todos los anillos tendrán elemento neutro respecto
al producto, que será denotado por 1. El neutro respecto a la adición será
denotado por 0.
(ii) Si a ∈ A, entonces el inverso de a respecto de la adición se denomi-
nará en adelante el opuesto de a, y se denotará por −a.
(iii) El producto a · b será simbolizado simplemente como ab, es decir,
omitiremos el punto para el producto de dos elementos.
(iv) Si a ∈ A es invertible, el inverso de a es único y se denota por a −1 .
Matrices · 5

Ejemplo 1.1.6. (i) El conjunto ℤ de los números enteros es un anillo con-


mutativo respecto a las operaciones usuales de adición y producto. El neutro
aditivo es 0 y el neutro del producto es 1.
(ii) Si restringimos el conjunto de los enteros a los 8 primeros enteros no
negativos, es decir, ℤ8 = {0, 1, 2, 3, 4, 5, 6, 7}, y realizamos las operacio-
nes tomando residuos respecto a 8, obtenemos el llamado anillo de enteros
módulo 8 (véase [20]). El neutro aditivo es nuevamente el 0 y el neutro mul-
tiplicativo es 1. Este ejemplo por supuesto se puede generalizar a cualquier
entero positivo n ≥ 2 (véase [23] y [31]).
(iii) El conjunto de todos los polinomios en la variable x con coeficientes
reales constituyen otro ejemplo de anillo conmutativo, el cual se denota por
ℝ[x]. El neutro aditivo es el polinomio nulo y el neutro multiplicativo es el
polinomio constante 1 (véanse [20], [23] y [31]).

Ejemplo 1.1.7. Es posible que el lector esté familiarizado con el conjunto


de las matrices cuadradas reales de tamaño 2 × 2, M2 (ℝ) (véase [20], [31]
y [23], o la definición 1.2.1 más adelante). Estas matrices conforman un
anillo respecto a la adición y multiplicación habituales; el neutro aditivo es
la matriz nula y el neutro multiplicativo es la matriz idéntica. Notemos que
     
1 0 0 1 0 1 1 0
≠ ,
0 0 0 0 0 0 0 0

luego el anillo M2 (ℝ) no es conmutativo.

En la definición de anillo no se exige que cada elemento no nulo tenga


inverso respecto al producto. Así por ejemplo, ℤ es un anillo en el cual no
existe entero x tal que 2x = 1. Sin embargo, existen anillos en los cuales
este tipo de ecuaciones tiene solución; tal es el caso del anillo de los núme-
ros racionales ℚ con las operaciones habituales. Esta observación permite
definir el siguiente tipo de anillo.

Definición 1.1.8. Un anillo A es de división si cada elemento no nulo es


invertible. Si además A es conmutativo, entonces se dice que A es un cuerpo.

Proposición 1.1.9. Sea A un anillo. El conjunto A∗ conformado por los elementos


invertibles de A es un grupo respecto al producto y se denomina el grupo de elementos
invertibles de A.

Demostración. Ejercicio para el lector. ✓


Según la proposición anterior, A es un anillo de división si, y sólo si,


A∗ = A − {0}.
6 · Matrices

Ejemplo 1.1.10. (i) Los números racionales ℚ, los números reales ℝ y los
números complejos ℂ, con sus operaciones habituales, son cuerpos.
(ii) ℤ no es un cuerpo, pues ℤ∗ = {1, −1}.
(iii) M2 (ℝ) no es un anillo de división, pues, M2 (ℝ) ∗ consta de las ma-
trices invertibles, es decir, aquellas que tienen determinante no nulo. Este
grupo se denomina grupo lineal general de orden 2 sobre ℝ y se deno-
ta por GL2 (ℝ). Sobre estos grupos de matrices invertibles volveremos más
adelante.
Un tipo de estructura más compleja que las definidas anteriormente la
constituyen los llamados espacios vectoriales, también denominados mó-
dulos, los cuales conforman los objetos en que se basa el álgebra lineal ge-
neralizada.
Definición 1.1.11. Un espacio vectorial es una tripla conformada por:
(a) Un grupo abeliano V cuyos elementos llamaremos vectores.

(b) Un anillo A cuyos elementos llamaremos escalares.

(c) Una operación externa entre escalares y vectores


V × A −→ V
(v, a) ↦−→ v · a

que satisface las siguientes condiciones para cualesquiera elementos


a, b ∈ A, v, u ∈ V :
(i) (v + u) · a = v · a + u · a.

(ii) v · (a + b) = v · a + v · b.

(iii) v · (ab) = (v · a) · b.

(iv) v · 1 = v.
Si no hay lugar a confusión, el espacio vectorial (V , A, ·) será denotado
simplemente por V y se dirá que V es un espacio vectorial sobre A, o que V
es un A-espacio. Cuando los escalares operan al lado izquierdo, se dice que
V es un A-espacio a izquierda; sin embargo, es necesario aclarar que la teoría
de álgebra lineal desarrollada a izquierda es completamente equivalente a
la desarrollada a derecha. Si no se advierte lo contrario, todos los espacios
vectoriales del presente cuaderno son espacios vectoriales a derecha. Los
espacios vectoriales sobre anillos se les denomina también módulos (véase
[24]). Así, en teoría de anillos y módulos se dice que V es un A-módulo
derecho.
Matrices · 7

Observación 1.1.12. Es importante señalar que si A es un anillo no con-


mutativo y V es un espacio vectorial izquierdo, entonces no basta con cam-
biar de lado los escalares, pero manteniendo la asignación del literal (c) de
la definción anterior, para obtener un espacio vectorial a derecha. En efecto,
si V es un A-espacio a izquierda y definimos v × a := a · v, entonces notemos
que (v×a)×b = b·(a·v), pero v×(ab) = (ab)·v = a·(b·v), y los dos resultados
anteriores pueden ser distintos (véase [24] y [31]). Claramente para anillos
conmutativos los escalares pueden ser dispuestos indistintamente a derecha
o izquierda, según resulte más conveniente. En adelante, salvo que sea ne-
cesario algo distinto, los escalares para módulos sobre anillos conmutativos
serán dispuestos por el lado izquierdo.

Ejemplo 1.1.13. Sean A un anillo y n ≥ 1 un entero. El conjunto An con-


formado por todos los vectores columna de n componentes (a1 , . . . , an )T ,
ai ∈ A, 1 ≤ i ≤ n, constituye un espacio vectorial sobre el anillo A respecto
a las siguientes operaciones:

[a1 , . . . , an ]T + [b1 , . . . , bn ]T = [a1 + b1 , . . . , an + bn ]T ,


[a1 , . . . , an ]T · c = [a1 c, . . . , an c]T ,

con c ∈ A. An se conoce como el n-espacio vectorial canónico sobre el


anillo A (para la notación de la traspuesta de un vector veáse más adelante la
definición 1.2.1). Dos casos particulares destacados son el n-espacio vecto-
rial canónico real ℝn y el n-espacio vectorial canónico entero ℤn . Tomando
n = 1, es decir, A1 = A, se obtiene que el anillo A tiene estructura de espacio
vectorial sobre sí mismo: la suma de vectores es la suma en el anillo A y el
producto entre vectores y escalares es el producto del anillo A.

Observación 1.1.14. El conjunto de vectores fila de n componentes se


acostumbra a denotar por A1×n y usualmente se le da estructura de
A-espacio a izquierda: c · (a1 , . . . , an ) := (ca1 , . . . , can ). Sin embargo, con
el propósito de ahorrar espacio y simplificar la notación, en adelante, a me-
nudo escribiremos los elementos del espacio An como vectores fila, siempre
y cuando esto no represente confusión.

Como anotamos al principio, toda la teoría de espacios vectoriales y


transformaciones lineales sobre anillos desarrollada en [24] será usada en
adelante. No sobra resaltar algunos resultados, definiciones y observacio-
nes.

Teorema 1.1.15. Todo espacio vectorial sobre un anillo de división es libre, es


decir, posee una base. En particular, todo espacio vectorial sobre un cuerpo es libre.
8 · Matrices

Demostración. Sea V un espacio vectorial sobre un anillo de división A y


sea L la colección de subconjuntos de V que son linealmente independien-
tes; L es no vacío y es ordenado respecto a la inclusión de conjuntos. Sea
C un subconjunto no vacío de L totalmente ordenado y sea C la reunión
de los conjuntos que conforman a C. Vamos a demostrar que C ∈ L. Sea
{x1 , . . . , xn } un subconjunto finito de C, existen entonces C1 , . . . , Cn ∈ C
tales que xi ∈ Ci , 1 ≤ i ≤ n. Como C es totalmente ordenado podemos
suponer que xi ∈ Cn para cada 1 ≤ i ≤ n, luego {x1 , . . . , xn } es linealmente
independiente ya que Cn también lo es. Esto muestra que C es linealmente
independiente. Así, C es una cota superior para C en L; aplicamos el le-
ma de Zorn y encontramos en L un elemento maximal X. Basta entonces
demostrar que ⟨X⟩ = V (recordemos que ⟨X⟩ denota la envolvente lineal
de X conformada por todas las combinaciones lineales de elementos de X
con coeficientes de A, véase [24]). Sea v ∈ V . Si v ∈ X entonces v ∈ ⟨X⟩;
si v ∉ X, entonces por la maximalidad de X se tiene que X ∪ {v} es lineal-
mente dependiente y existen escalares no todos nulos a, a1 , . . . , an ∈ A y
vectores x1 , . . . , xn ∈ X tales que

v · a + x1 · a1 + · · · + xn · an = 0.

No es posible que a = 0, ya que de lo contrario, X sería linealmente depen-


diente. Por lo tanto, v = −(x1 · a1 a −1 + · · · + xn · an a −1 ) ∈ ⟨X⟩. ✓

Definición 1.1.16. Sean V y W dos espacios vectoriales sobre un anillo


A. Una transformación lineal de V en W es una función f : V −→ W
que satisface las siguientes condiciones para cualesquiera vectores u, v ∈ V
y cualquier escalar a ∈ A:

(i) f (u + v) = f (u) + f (v).

(ii) f (v · a) = f (v) · a.

Se dice también que f es un operador lineal o un A-homomorfismo.

Ejemplo 1.1.17. La función

An −→ Am
(a1 , . . . , an ) ↦−→ (b1 a1 + c1 an , b2 a1 + c2 an , . . . , bm a1 + cm an ),

donde b1 , c1 . . . bm , cm son escalares fijos de A, es una transformación lineal


de An en Am .
Matrices · 9

Ejemplo 1.1.18. La transformación lineal nula denotada por 0 se define


por:

0 : V −→ W
v ↦−→ 0.

De igual manera, la transformación lineal idéntica de V se denota por iV y


se define por:

iV : V −→ V
v ↦−→ v.

En álgebra lineal, como en cualquier rama del álgebra, es de vital impor-


tancia el concepto de isomorfismo.

Definición 1.1.19. Dos espacios vectoriales V y W se dicen isomorfos si


entre ellos existe una transformación lineal biyectiva, denominada isomor-
fismo. En tal caso se escribeV  W . Una transformación lineal f : V −→ W
es invertible si existe una función g : W −→ V tal que f g = iW y g f = iV .

Es fácil verificar que la función g de la definición anterior es también una


transformación lineal y que f es un isomorfismo si, y sólo si, f es invertible.
Pasamos ahora a recordar la estructura algebraica del conjunto de todas
las transformaciones lineales de un espacio V en otro W .

Definición 1.1.20. Sean V y W dos A-espacios. Se definen

HomA (V , W ) := { f : V −→ W | f es una transformación lineal},


EndA (V ) := HomA (V , V ).

Proposición 1.1.21. Sea A un anillo y sean V , W dos A-espacios. Entonces,

(i) HomA (V , W ) es un grupo abeliano.

(ii) EndA (V ) es un anillo.

(iii) Si R es un anillo conmutativo, entonces HomR (V , W ) es un R-espacio.

Demostración. Véase [24]. ✓


Notemos que en general el anillo EndA (V ) no es conmutativo; basta,


por ejemplo, tener en cuenta el caso particular Endℝ (ℝ2 ). El grupo de ele-
mentos invertibles del anillo EndA (V ) juega un papel muy importante en el
álgebra lineal generalizada, en particular, cuando V es de dimensión finita.
10 · Matrices

Definición 1.1.22. Sea V un A-espacio. AutA (V ) := EndA (V ) ∗ es el grupo


lineal general sobre A.

Notemos también que si R es conmutativo, EndR (V ) posee dos estruc-


turas: una de anillo y otra de R-espacio. Este tipo de estructuras se conoce
como R-álgebras, en el sentido de la siguiente definición.

Definición 1.1.23. Sea R un anillo conmutativo y sea A un conjunto no


vacío. Se dice que A es una R-álgebra si

(i) A es un anillo.

(ii) A es un R-espacio respecto a la adición definida en A.

(iii) (ab) · r = a(b · r) = (a · r)b, para cualesquiera a, b ∈ A y cada r ∈ R.

A es un álgebra conmutativa si A es un anillo conmutativo.

Ejemplo 1.1.24. Si R es un anillo conmutativo y V es un R-espacio, en-


tonces EndR (V ) es una R-álgebra, no necesariamente conmutativa.

Ejemplo 1.1.25. Si R es un anillo conmutativo entonces el conjunto R[x]


de todos los polinomios con coeficientes en R es una R-álgebra conmutativa.

2. Matrices sobre anillos


Definición 1.2.1. Sea A un anillo y sean m, n enteros positivos. Una matriz
de tamaño m × n es una tabla ordenada de m filas y n columnas conformada
por elementos de A en la forma
 b11 · · · b1n 
B =  ... ..  .


 . 
bm1 · · · bmn 

Los elementos b11 , . . . , bmn se denominan las componentes o entradas de
B. La entrada que está en la intersección de la i-ésima fila con la j-ésima
columna se denota por bi j , y la matriz B también se simboliza por B = [bi j ].
La i-ésima fila de B se denota por Bi := [bi1 , . . . , bin ] mientras que la j-
ésima columna se denota por
 b1 j 
:=  ...  .
 
B ( j)
 
 
bm j 
 
Matrices · 11

La matriz BT = [bi′j ] de tamaño n × m definida por bi′j := b ji , para cada i


y cada j, se denomina la traspuesta de B. La matriz B se dice cuadrada si
m = n.

Proposición 1.2.2. El conjunto Mm×n (A) de todas las matrices de tamaño


m × n con entradas en el anillo A es un A-espacio vectorial respecto a las siguientes
operaciones: si B = [bi j ], C = [ci j ] ∈ Mm×n (A) y a ∈ A, entonces

B + C := [bi j + ci j ] ,
B · a := [bi j a].

Además, Mm×n (A) es libre con base canónica {Ei j }m,n


i=1, j=1
, donde

 .. 
0 . 0 

Ei j := · · · 1 · · · ,

0 .. 
 . 0 

es decir, en la matriz Ei j la única entrada no nula corresponde a la intersección de


la i-ésima fila con la j-ésima columna en donde está ubicado el elemento 1. Además,
estas matrices satisfacen la siguiente regla para el producto:
(
Eiq , si j = p
Ei j Epq =
0, si j ≠ p.

Demostración. Dejamos los detalles de la prueba al lector. Indiquemos sola-


mente la notación para la matriz nula y la representación de cualquier matriz
B de Mm×n (A) en términos de la base canónica:

0 · · · 0
0 =  ... . . . .. 
 ∑︁

.  y B= Ei j · bi j . ✓


0 · · · i, j
 0

Definición 1.2.3. Sean B = [bi j ] ∈ Mm×n (A) y C = [ci j ] ∈ Mn×p (A). Se


define el producto de B y C por
n
∑︁
BC := D = [di j ] , donde di j := bik ck j , 1 ≤ i ≤ m, 1 ≤ j ≤ p.
i=1

Notemos que el producto de matrices se define con la siguiente condición


de compatibilidad: el número de columnas del primer factor coincide con
el número de filas del segundo factor.
12 · Matrices

Para cada n ≥ 1 se define la matriz idéntica de tamaño n × n sobre el


anillo A por
1 0 (

.. 1, si i = j
E = [ei j ] :=  , ei j :=
 
.

0
 0, si i ≠ j.
 1

Proposición 1.2.4. Sean B, C y D matrices con entradas en el anillo A compa-


tibles para las operaciones indicadas. Entonces,

(i) (BC)D = B(CD).

(ii) B(C + D) = BC + BD; (B + C)D = BD + CD.

(iii) Si A = R es un anillo conmutativo, entonces, para cada r ∈ R, se tiene que


(B · r)C = (BC) · r = B(C · r).

(iv) BC = [BC (1) · · · BC (p) ]; BC = [B1 C · · · Bm C]T .

(v) Para cada matriz F ∈ Mm×n (A) se tiene que

EF = F y FE = F,

donde la primera idéntica E es aquella de tamaño m × m y la segunda E es


la de tamaño n × n.

(vi) Para cada n ≥ 1, Mn (A) es un anillo. Si A = R es un anillo conmutativo,


entonces Mn (R) es una R-álgebra.

Demostración. Todas las afirmaciones de esta proposición son consecuencia


directa de las definiciones, dejamos su prueba al lector. ✓

Las matrices constituyen un lenguaje computacional para el álgebra li-


neal tal como lo ilustra el siguiente teorema, en el cual mostraremos la re-
presentación de transformaciones lineales por medio de matrices. Para el
teorema necesitamos las siguientes nociones (véase [22], [23] y [24]).

Definición 1.2.5. (i) Sean G y H dos grupos. Se dice que G es isomorfo


a H , lo cual se denota por G  H , si existe una función biyectiva
f : G −→ H tal que

f (g ∗ g ′) = f (g) ∗ f (g ′),

para cualesquiera elementos g , g ′ ∈ G. Dicha función f se denomina


isomorfismo entre G y H .
Matrices · 13

(ii) Sean A, B dos anillos. Se dice que A es isomorfo a B, lo cual se denota


por A  B, si existe una función biyectiva f : A −→ B tal que

f (a + a ′) = f (a) + f (a ′),
f (aa ′) = f (a) f (a ′),
f (1) = 1,

para cualesquiera elementos a, a ′ ∈ A. Dicha función f se denomina


isomorfismo entre A y B.

(iii) Sea R un anillo conmutativo y sean K y L dos R-álgebras. Se dice que


K es isomorfa a L, lo cual se denota por K  L, si existe una función
biyectiva f : K −→ L tal que

f (k + k ′) = f (k) + f (k ′),
f (k · r) = f (k) · r ,
f (kk ′) = f (k) f (k ′),
f (1) = 1,

para cualesquiera elementos k, k ′ ∈ K, r ∈ R. Dicha función f se


denomina isomorfismo entre K y L.
Teorema 1.2.6. Sea A un anillo arbitrario.
(i) Si V es un A-espacio libre con una base de n ≥ 1 elementos y W es un
A-espacio libre con una base de m ≥ 1 elementos, entonces

HomA (V , W )  Mm×n (A) (isomorfismo de grupos).

Si A = R es un anillo conmutativo, entonces el isomorfismo anterior es de


espacios vectoriales.

(ii) EndA (V )  Mn (A) (isomorfismo de anillos).

(iii) Si A = R es un anillo conmutativo, entonces EndR (V )  Mn (R) (isomor-


fismo de álgebras).
Demostración. La idea central de la prueba del teorema es asignar a cada
transformación lineal una matriz y, recíprocamente, definir con cada matriz
una transformación lineal.
Matriz asociada a una transformación lineal: sean X = {x1 , . . . , xn }
una base de V , Y = {y1 , . . . , ym } una base de W y f : V −→ W una trans-
formación lineal. Entonces f determina una única matriz

mX ,Y ( f ) := F := [ fi j ] ∈ Mm×n (A),
14 · Matrices

llamada la matriz de la transformación f en las bases X , Y , y definida por


m
∑︁
f (x j ) := yi · fi j , 1 ≤ j ≤ n. (2.1)
i=1

Transformación lineal definida por una matriz: dada una matriz


F = [ fi j ] ∈ Mm×n (A), ésta determina una única transformación lineal
f : V −→ W definida como en (2.1) . Si en particular V = An y W = Am ,
entonces f se puede presentar matricialmente en la siguiente forma:

f : An −→ Am
a := [a1 , . . . , an ]T ↦−→ F a = F [a1 , . . . , an ]T = F (1) · a1 + · · · + F (n) · an .

(i) Por lo anterior es claro que la función

mX ,Y : HomA (V , W ) −→ Mm×n (A)


f ↦−→ mX ,Y ( f )

es un isomorfismo de grupos. Si A = R es un anillo conmutativo, la función


mX ,Y es un isomorfismo de espacios vectoriales.
(ii) Sean U un A-espacio libre con una base Z = {z1 , . . . , zp } de p ele-
mentos y g : W −→ U otra transformación lineal; veamos entonces que

mX ,Z (g f ) = mY ,Z (g)mX ,Y ( f ). (2.2)

Sean F = mX ,Y ( f ), G = mY ,Z (g) y H = mX ,Z (g f ). Se tiene que


p m
!
∑︁ ∑︁
(g f ) (x j ) = zk · hk j = g ( f (x j )) = g yl · fl j
k=1 l=1
p
m ∑︁ p m
! !
∑︁ ∑︁ ∑︁
= zk · gkl · fl j = zk · gkl fl j ,
l=1 k=1 k=1 l=1
Ím
luego hk j = l=1 gkl fl j , es decir, H = GF .
Tomando V = W = U y X = Y = Z en (2.2) , y considerando lo probado
en (i), se obtiene que EndA (V ) y Mn (A) son anillos isomorfos. Notemos
que mX , X (iV ) := mX (iV ) = E.
(iii) Esto es consecuencia directa de (i) y (ii). ✓

Observación 1.2.7. (i) Al considerar espacios vectoriales a izquierda, algu-


nos autores acostumbran a disponer por filas los coeficientes de la expansión
a través de una base. En forma más precisa, sean X = {x1 , . . . , xn } una base
Matrices · 15

de V , Y = {y1 , . . . , ym } una base de W y f : V −→ W una transformación


lineal. Entonces f determina una única matriz mX ,Y ( f ) := [ fi j ] ∈ Mn×m (A),
denominada también la matriz de la transformación f en las bases X , Y , y
definida por
m
∑︁
f (xi ) := fi j · y j , 1 ≤ i ≤ n.
j=1

La identidad (2.2) se convierte en

mX ,Z (g f ) = mX ,Y ( f )mY ,Z (g).

En efecto, usando la notación de la demostración del teorema 1.2.6 tenemos


que
p
∑︁
g (y j ) = g jk · zk , 1 ≤ j ≤ m.
k=1

Si mY ,Z (g) := [gi j ] ∈ Mm×p (A), entonces

m
∑︁ p
m ∑︁
∑︁
(g f )(xi ) = fi j · g (y j ) = fi j g jk · zk .
j=1 j=1 k=1

Si utilizáramos también notación izquierda para funciones, es decir, en lugar


f g
de f (x) escribiéramos x f , entonces la compuesta V → − W → − U debería de-
notarse f g, en cuyo caso se tendría la relación mX ,Z ( f g) = mX ,Y ( f )mY ,Z (g).
Con esta notación tendríamos, en particular, el isomorfismo de anillos
EndA (AV )  Mn (A). Sin embargo, la notación a izquierda para funcio-
nes es muy poco usada, lo que además trae como consecuencia que en el
teorema 1.2.6 los anillos EndA (AV ) y Mn (A) sean anti-isomorfos. Pero si
consideramos el anillo opuesto de Mn (A) (véase [24]), entonces tendremos
el isomorfismo de anillos

EndA (AV )  Mn (A) op .

Notemos adicionalmente que una matriz F := [ fi j ] ∈ Mn×m (A) define una


transformación lineal dada por

f : A1×n −→ A1×m
(a1 , . . . , an ) ↦−→ (a1 , . . . , an )F , (2.3)

y la matriz de f en las bases canónicas coincide con F .


16 · Matrices

(ii) Otra alternativa para los espacios a izquierda es disponer nuevamente


los coeficientes de la expansión por columnas y mantener la notación usual
de funciones a derecha. En tal caso resulta
m p
m ∑︁
!
∑︁ ∑︁
(g f ) (x j ) = g fi j · yi = fi j gki · zk ;
i=1 i=1 k=1

si cambiamos el anillo A por su anillo opuesto Aop , entonces tendríamos


mX ,Z (g f ) = mY ,Z (g)mX ,Y ( f ), y en consecuencia, el isomorfismo

EndA (AV )  Mn (Aop ).

Otra variante de esta alternativa es no usar el anillo opuesto, convirtiendo


la identidad anterior en:

mX ,Z (g f ) = (mX ,Y ( f )T mY ,Z (g)T )T . (2.4)

La matriz F ∈ Mr×s (S) define un homomorfismo

f : S s −→ S r
a ↦−→ (aT F T )T , (2.5)

y su matriz en las bases canónicas coincide con F . Así, f : S r −→ S r es


un isomorfismo si, y sólo si, F T ∈ GLr (S). Finalmente, sea C ∈ Mr (S); las
columnas de C constituyen una base de S r si, y sólo si, CT ∈ GLr (S) (véase
el corolario 1.3.5 más adelante).
(iii) Notemos de todos modos que los valores asignados por la función f
en cada una de las dos opciones anteriores coinciden ya que la matriz F en
(2.3) es precisamente F T en (2.5) .
(iv) Finalmente, si A = R es un anillo conmutativo, entonces la relación
(2.4) coincide con (2.2) y también se tiene que (aT F T )T = F a.

3. Inversa de una matriz y cambio de base


Definición 1.3.1. Sea B ∈ Mn×m (A). Se dice que B es semi-invertible
si existe otra matriz B ′ ∈ Mm×n (A) tal que BB ′ = E y B ′B = E. En tal
caso se dice que B ′ es la semi-inversa de B. Si n = m se dice simplemente
que B es invertible y B−1 := B ′ es la inversa de B. El grupo de elementos
invertibles del anillo Mn (A) se denota por GLn (A) y se denomina el grupo
lineal general de orden n sobre el anillo A.
Matrices · 17

Notemos que la semi-inversa de una matriz es única. Además, si


C ∈ Mm×p (A) es también semi-invertible, entonces BC es semi-invertible
con semi-inversa C ′B ′.
El siguiente resultado relaciona las definiciones 1.1.22 y 1.3.1.

Corolario 1.3.2. Sea V un A-espacio libre con una base de n ≥ 1 elementos.


Entonces,
AutA (V )  GLn (A) (isomorfismo de grupos).

Demostración. Esto es consecuencia del teorema anterior y los detalles de la


prueba los dejamos al lector. □✓

El grupo GLn (A) y varios de sus subgrupos más destacados serán es-
tudiados en forma detallada en el capítulo 5. Pasamos ahora a estudiar los
cambios de bases en los espacios libres y a entender su efecto en las repre-
sentaciones matriciales de las transformaciones lineales.

Proposición 1.3.3. Sean V un espacio libre con base X = {x1 , . . . , xn } y


B = [bi j ] ∈ Mn×m (A). Entonces, el conjunto
n
( )
∑︁
Y := y j = x i · bi j | 1 ≤ j ≤ m (3.1)
i=1

es una base de V si, y sólo si, B es semi-invertible.

Demostración. Para simplificar la prueba utilizaremos notación matricial de


tal forma que la igualdad (3.1) la escribiremos como

[Y ] = [X]B,

con [Y ] := [y1 , . . . , ym ].
⇒): si Y es una base de V , cada elemento de X es combinación lineal
de los elementos de Y ; resulta entonces una matriz B ′ ∈ Mm×n (A) tal que
[X] = [Y ]B ′. Por lo tanto, [Y ] = [X]B = [Y ]B ′B, y por la independencia
lineal de Y , se tiene que B ′B = E. Por la simetría del problema, BB ′ = E.
⇐): [X] = [X]E = [X]BB ′ = [Y ]B ′, luego V = ⟨X⟩ ⊆ ⟨Y ⟩ y entonces
V = ⟨Y ⟩. Sean a1 , . . . , am ∈ A tales que y1 · a1 + · · · + ym · am = 0; se tiene
entonces que [Y ]F = 0, donde F ∈ Mm (A) es una matriz en la cual cada
columna es el vector [a1 , . . . , am ]T . Resulta así [X]BF = 0, pero como X
es linealmente independiente entonces BF = 0, luego B ′BF = 0, es decir,
F = 0, con lo cual a1 = · · · = am = 0. ✓

Definición 1.3.4. La matriz B de la proposición 1.3.3 es la matriz de cam-


bio de la base X a la base Y .
18 · Matrices

En la prueba de la proporción 1.3.3, la matriz B ′ es la matriz de cambio


de Y a X; notemos que B ′ es semi-invertible. Esta situación se presenta so-
lamente en los anillos no dimensionales (véase [23] y la observación 1.3.10
más adelante). Para anillos dimensionales n = m y la matriz de cambio B es
invertible.
Corolario 1.3.5. Sea B ∈ Mn×m (A). B es semi-invertible si, y sólo si, las co-
lumnas de B constituyen una base de Am . Si m = n, B es invertible si, y sólo si, las
columnas de B constituyen una base de An .
Demostración. Basta tomar V = An y X la base canónica de An en la prueba
de la proposición 1.3.3. ✓

Ejemplo 1.3.6. La sola independencia de las columnas de una matriz no


garantiza que sea semi-invertible. Consideremos por ejemplo la matriz cua-
drada  
1 2
B= ∈ M2 (ℤ),
3 4
notemos que B no es invertible como matriz con coeficientes enteros, ya
que su inversa como matriz real es
 
−2 1
B−1 = 3 ∈ M2 (ℤ);
2 − 12

observemos además que las columnas de B son linealmente independientes.


Definición 1.3.7. Dos matrices P ∈ Mp×q (A) y Q ∈ Mm×n (A) son semi-
equivalentes si existen matrices semi-invertibles D ∈ Mp×m (A) y
C ∈ Mq×n (A) tales que
Q = D ′PC.
Si p = m y q = n se dice que P y Q son equivalentes si existen matrices
invertibles D ∈ GLm (A) y C ∈ GLn (A) tales que Q = D−1 PC, lo cual
denotaremos por P ∼ Q. Si p = m = q = n, se dice que P y Q son similares
si existe una matriz invertible C ∈ GLn (A) tal que Q = C −1 PC, lo cual se
denota por P ≈ Q.
Todas las relaciones de la definición anterior son de equivalencia.
Proposición 1.3.8. Sea f : V −→ W una transformación lineal, donde V es
libre con bases X = {x1 , . . . , xn }, X ′ = {x1′ , . . . , xq′ } y W es libre con bases
Y = {y1 , . . . , ym }, Y ′ = {y1′ , . . . , yp′ }. Sean P = mX ,Y ( f ), Q = mX ′ ,Y ′ ( f ), C la
matriz de cambio de X a X ′ y D la matriz de cambio de Y a Y ′. Entonces,

Q = D ′PC.
Matrices · 19

Si q = n y p = m entonces Q = D−1 PC. Si V = W , Y = X y Y ′ = X ′, entonces


Q = C −1 PC.

Demostración. Tenemos que


m
∑︁
f (x j ) = y k · pk j , 1 ≤ j ≤ n;
k=1
p
∑︁
f (xt′) = yr′ · qrt , 1 ≤ t ≤ q, 1 ≤ r ≤ p;
r=1
n
∑︁ m
∑︁
xt′ = x j · c jt , yr′ = yk · dkr , 1 ≤ t ≤ q, 1 ≤ r ≤ p.
j=1 k=1

Luego

n n m n m
!
∑︁ ∑︁ ∑︁ ©∑︁ ∑︁
f (xt′) = f (x j ) · c jt = yk · pk j · c jt =
yk · ­ pk j c jt ® ;
ª
j=1 j=1 k=1 k=1 « j=1 ¬
p m m p
! !
∑︁ ∑︁ ∑︁ ∑︁
f (xt′) = yk · dkr · qrt = yk · dkr qrt .
r=1 k=1 k=1 r=1

Puesto que, Y es linealmente independiente, entonces PC = DQ, es decir,


Q = D ′PC. ✓

Proposición 1.3.9. Dos matrices P ∈ Mp×q (A) y Q ∈ Mm×n (A) son semi-
equivalentes si, y sólo si, representan la misma transformación lineal. Si q = n y
p = m, entonces P , Q ∈ Mm×n (A) son equivalentes si, y sólo si, representan la
misma transformación lineal. Si q = n = p = m, entonces P , Q ∈ Mn (A) son
similares si, y sólo si, representan la misma transformación lineal.

Demostración. ⇒): sea Q = D ′PC con D ∈ Mp×m (A) y C ∈ Mq×n (A) semi-
invertibles; P representa una transformación lineal f : Aq −→ Ap en las
bases canónicas X de Aq y Y de Ap . Sea [Y ′] := [Y ]D; como D es semi-
invertible, entonces Y ′ es también una base de Ap (notemos que Y ′ está
conformada por las m columnas de D, luego Ap  Am ). De igual manera,
sea [X ′] := [X]C; X ′ es también una base de Aq (X ′ está conformada por las
n columnas de C, luego Aq  An ). De otra parte, Q también representa una
transformación lineal g : Aq −→ Ap en las bases X ′ , Y ′; se tiene entonces
que mX ,Y ( f ) = P y mX ′ ,Y ′ (g) = Q, de donde mX ′ ,Y ′ ( f ) = D ′mX ,Y ( f )C =
D ′PC = Q = mX ′ ,Y ′ (g), y por lo tanto, f = g.
⇐): esta parte corresponde a la proposición 1.3.8. □✓
20 · Matrices

Observación 1.3.10. (i) Un punto donde el álgebra lineal sobre anillos se


aparta del álgebra lineal clásica es en la existencia y tamaño de las bases.
En [24] se demuestra que el ℤ-espacio de los números racionales ℚ no es
libre. En cuanto a la unicidad de las bases, en general, podemos afirmar que
en un espacio vectorial libre existen infinitas bases. Por ejemplo, en ℝn el
conjunto Xa = {e1 · a, . . . , en }, con a ∈ ℝ− {0}, es una base. En ℤ2 se tienen
las siguientes bases
{(1, 0), (0, 1)}, {(−1, 0), (0, −1)}, {(1, 0), (0, −1)},
{(−1, 0), (0, 1)}, {(1, 1), (1, 2)}.
En el siguiente capítulo veremos que {(a, b), (c, d)} es una base de ℤ2 si, y
sólo si, ad−bc = ±1. El problema de la unicidad entonces es mejor plantearlo
en términos del tamaño de las bases. En [24] se prueba que todo espacio
vectorial libre finitamente generado posee una base finita, y también que, en
un espacio vectorial libre todas las bases son finitas o bien todas son infinitas.
Además, para espacios de bases infinitas no hay problema con el tamaño de
las bases, pues todas tienen la misma cantidad de elementos. Sin embargo,
existen anillos A para los cuales se tiene la siguiente propiedad: si V es un
A-espacio de bases finitas, no todas las bases de V tienen el mismo número
de elementos. Un ejemplo puede ser consultado en [24].
(ii) Sea V un A-espacio libre. Se dice que V es dimensional si todas las
bases de V tienen el mismo número de elementos. Este número se deno-
mina la dimensión de V y se denota por dimA (V ). Se dice que A es un
anillo dimensional si todos sus A-espacios libres son dimensionales (en in-
glés IBN, Invariant Basis Number). La mayoría de los anillos estudiados en
álgebra son dimensionales (véase [6] y [30]). Por ejemplo, los anillos de di-
visión son dimensionales: en efecto, sean X y X ′ dos bases de tamaños n y
n ′, respectivamente, de un espacio vectorial V sobre un anillo de división
A; si n > n ′, entonces, tal como se prueba en espacios vectoriales sobre
cuerpos (sin usar conmutatividad), n ′ + 1 vectores de X son linealmente
dependientes, lo cual es falso ya que X es linealmente independiente. Los
anillos conmutativos también son dimensionales (esto lo probaremos más
adelante).
(iii) Notemos que un anillo A es dimensional si, y sólo si, las únicas ma-
trices semi-invertibles sobre A son las matrices cuadradas (en cuyo caso son
invertibles). Esto hace que si A es un anillo dimensional, entonces todos los
A-espacios vectoriales libres izquierdos sean dimensionales, es decir, A es
dimensional a derecha si, y sólo si, A es dimensional a izquierda. Además,
en anillos dimensionales,
semi-invertible = invertible ysemi-equivalente = equivalente.
Matrices · 21

(iv) En adelante en el presente cuaderno asumiremos que A es un anillo


dimensional.

4. Matrices y operaciones elementales


En el grupo GLn (A) se tienen tres tipos importantes de matrices que permi-
ten realizar cambios sobre las filas y/o columnas de una matriz. Definimos
en esta sección estas matrices invertibles especiales.

Definición 1.4.1. Sea n ≥ 2. Se definen los siguientes tipos de matrices


elementales.

(i) Matrices propiamente elementales:


1 
 
 .. 

 . a 

Ti j (a) := E + Ei j · a = 
 ..  , a ∈ A, i ≠ j.

 . 
 .. 
 . 
 

 1

(ii) Permutaciones:

Pi j := E − Eii − E j j + Ei j + E ji .

(iii) Diagonales:
Di (a) := E + Eii · (a − 1), a ∈ A∗ .

Proposición 1.4.2. Las matrices elementales son invertibles,

Ti j (a) −1 = Ti j (−a),
Pi−1
j = Pi j ,
Di (a) −1 = Di (a−1 ).

Demostración. Ejercicio para el lector. ✓


Definición 1.4.3. El subgrupo de GLn (A) generado por todas las matri-
ces propiamente elementales se denomina grupo elemental y se denota por
En (A).

Las matrices elementales inducen las llamadas operaciones elementales


sobre las filas y columnas de una matriz F ∈ Mm×n (A), m, n ≥ 2:
22 · Matrices

(i) El efecto de multiplicar F a la derecha por Ti j (a) ∈ GLn (A) es sumar


a la j-ésima columna de F la i-ésima columna multiplicada a derecha
por a. Análogamente, el efecto de multiplicar F a la izquierda por
Ti j (a) ∈ GLm (A) es sumar a la i-ésima fila la j-ésima fila multiplicada
a izquierda por a.

(ii) El producto F Pi j , con Pi j ∈ GLn (A), intercambia las columnas


i-ésima y j-ésima de F . Similarmente, Pi j F , con Pi j ∈ GLm (A), efec-
túa el correspondiente intercambio de filas.

(iii) La matriz F Di (a), con Di (a) ∈ GLn (A), se obtiene multiplicando la


i-ésima columna de F a la derecha por a. De igual manera, Di (a)F ,
con Di (a) ∈ GLm (A), se obtiene multiplicando la i-ésima fila de F
por a a la izquierda.

Teniendo en cuenta que el producto de matrices invertibles es invertible,


obtenemos inmediatamente el siguiente resultado.

Corolario 1.4.4. Si la matriz G ∈ Mm×n (A) se obtuvo de F ∈ Mm×n (A) por


medio de operaciones elementales sobre las filas o columnas de F , entonces G es
equivalente a F .

5. Ejercicios
1. Determine 10 bases diferentes en ℤ2 distintas de la base canónica.

2. Determine 10 conjuntos diferentes en ℤ2 , cada uno de 2 elementos


y linealmente dependientes.

3. Sea 𝕂 un cuerpo y sea V un 𝕂-espacio. Si x1 , . . . , xn son vectores


linealmente independientes de V , demuestre que cada conjunto de
n + 1 vectores de ⟨x1 , . . . , xn ⟩ es linealmente dependiente.

4. Demuestre que todo cuerpo 𝕂 es un anillo dimensional.

5. Sea n ≥ 1 entero y sea ℝn [x] el conjunto de polinomios reales de


grado menor o igual a n. Demuestre que ℝn [x] es un ℝ-espacio de
dimensión n + 1.

6. Con la notación del ejercicio anterior, sea X un subconjunto de ℝn [x]


que contiene, para cada k = 0, 1, . . . , n, un único polinomio de grado
k. Demuestre que X es una base de ℝn [x].
Matrices · 23

7. Demuestre la afirmación del ejemplo 1.1.17.


8. Sea f : V −→ W una transformación lineal para la cual existe una
función g : W −→ V tal que f g = iW y g f = iV . Demuestre que g es
también una transformación lineal.
9. Compruebe que Endℝ (ℝ2 ) no es un anillo conmutativo.
10. Demuestre que M2 (ℝ) es una ℝ-álgebra no conmutativa.
11. Sea R un anillo conmutativo y R[x1 , . . . , xn ] el conjunto de poli-
nomios en n indeterminadas con coeficientes en R. Demuestre que
R[x1 , . . . , xn ] es una R-álgebra conmutativa.
12. Demuestre el corolario 1.3.2.
13. Demuestre que las columnas de la matriz B del ejemplo 1.2.11 son
linealmente independientes.
14. Demuestre que las relaciones de la definición 1.3.7 son de equivalen-
cia.
15. Sea A un anillo; un subconjunto no vacío I de A es un ideal derecho
de A si x + y ∈ I y xa ∈ I para cada x ∈ I y cada a ∈ A. De manera
similar se definen los ideales izquierdos de A. Para cada 1 ≤ r ≤ n −1,
demuestre que el conjunto
 
0
I= ,
A
conformado por todas las matrices en las cuales las primeras r filas son
nulas es un ideal derecho de Mn (A) (véase [3], pág. 17). De igual ma-
nera, demuestre que el conjunto de matrices de Mn (A) conformado
por todas las matrices en las cuales las primeras r columnas son nulas
es un ideal izquierdo de Mn (A).
16. Sea V un A-espacio y sea v ∈ V . Se define
AnnA (v) := {a ∈ A | v · a = 0}.
Demuestre que AnnA (v) es un ideal derecho de A. Además, si
AnnA (V ) := {a ∈ A | v · a = 0, para cada v ∈ V },
entonces AnnA (V ) es un ideal bilátero de A, es decir, AnnA (V ) es un
ideal izquierdo y derecho de A que, además, cumple
Ù
AnnA (V ) = AnnA (v).
v ∈V
24 · Matrices

17. Sean V1 y V2 dos subespacios de un A-espacio V . Demuestre que

V1 + V2 := {vi + v2 | v1 ∈ V1 , v2 ∈ V2 }

es un subespacio de V y que AnnA (V1 +V2 ) = AnnA (V1 ) ∩ AnnA (V2 ).

18. Sea V un A-espacio libre con una base de n elementos. Sea


f : V −→ V una transformación lineal. Muestre con un ejemplo que
la sobreyectividad de f y la inyectividad no son condiciones equiva-
lentes.

19. Demuestre la proposición 1.4.2.

20. Sea A un anillo y sea B ∈ Mn (A). Se dice que B es simétrica si BT = B


y antisimétrica si BT = −B. Demuestre que B +BT es simétrica y que
B − BT es antisimétrica, para cualquier matriz B ∈ Mn (A). Además,
si 2 := 1 + 1 ∈ A∗ , entonces demuestre que B siempre es suma de una
matriz simétrica y una matriz antisimétrica.

21. Sean P y Q matrices rectangulares o cuadradas, según corresponda,


sobre un anillo conmutativo R. Demuestre que

(P + Q)T = P T + QT ,
(PQ)T = QT P T ,
(P −1 )T = (P T ) −1 .

22. Sean A1 , . . . , An anillos. Demuestre que el producto cartesiano

A1 × · · · × An := {(a1 , . . . , an ) | ai ∈ Ai , 1 ≤ i ≤ n},

bajo las operaciones definidas por componentes, tiene estructura de


anillo. Demuestre además los siguientes isomorfismos de anillos y
grupos, respectivamente:

Mn (A1 × · · · × An )  Mn (A1 ) × · · · × Mn (An ),


GLn (A1 × · · · × An )  GLn (A1 ) × · · · × GLn (An ).

23. Sean R un anillo conmutativo y B = [bi j ] ∈ Mn (R). Se define la traza


de B por Tr(B) := b11 +· · ·+bnn . Demuestre las siguientes propiedades:

(i) Tr(BC) = Tr(CB).


(ii) Tr(B + C) = Tr(B) + Tr(C).
Matrices · 25

(iii) Tr(B · r) = Tr(B)r, r ∈ R.


(iv) La traza es una transformación lineal sobreyectiva de Mn (R) en
R.
(v) ker(Tr) = ⟨X⟩, donde X = {Ei j | i ≠ j} ∪ {E11 − Eii | i ≠ 1}.
(vi) Tr(BT ) = Tr(B).
(vii) Tr(P −1 BP) = Tr(B), para cada P ∈ GLn (R).
(viii) ker(Tr) = ⟨Y ⟩, con Y = {BC − CB | B, C ∈ Mn (R)}.
Capítulo
dos
Determinantes y
sistemas de
ecuaciones
lineales
Determinantes y sistemas de ecuaciones lineales · 29

En este capítulo presentaremos la teoría de determinantes sobre anillos con-


mutativos arbitrarios y la usaremos para estudiar sistemas de ecuaciones li-
neales sobre estos anillos. Si no se advierte lo contrario R denotará un anillo
conmutativo.

1. Determinantes
El enfoque que daremos a la función determinante utiliza el grupo de per-
mutaciones de un conjunto finito, el cual trataremos a continuación.

Definición 2.1.1. Para cada n ≥ 1 sea Sn el conjunto de todas las funciones


biyectivas del conjunto In := {1, 2, . . . , n}. Cada una de tales funciones se
denomina permutación del conjunto In . Bajo la operación de composición
de funciones, Sn es claramente un grupo y se le denomina grupo simé-
trico de grado n. Una permutación 𝜋 ∈ Sn se llama ciclo de longitud m,
1 ≤ m ≤ n, si existen m elementos diferentes 𝛼1 , . . . , 𝛼m ∈ In tales que
𝜋 (𝛼i ) = 𝛼i+1 para cada 1 ≤ i ≤ m − 1, 𝜋 (𝛼m ) = 𝛼1 y 𝜋 (𝛼) = 𝛼 pa-
ra 𝛼 ∈ In \ {𝛼1 , . . . , 𝛼m }. Un ciclo de longitud 2 se denomina trasposi-
ción. Dos ciclos 𝜋 = (𝛼1 · · · 𝛼m ) y 𝜃 = ( 𝛽 1 · · · 𝛽 r ) se dicen disyuntos si
{𝛼1 · · · 𝛼m } ∩ { 𝛽 1 · · · 𝛽 r } = ∅.

Enunciamos a continuación algunas de las propiedades más importantes


del grupo Sn y sus ciclos. Las demostraciones pueden ser consultadas en
[20] y [22].

(i) Los ciclos disyuntos conmutan.

(ii) Cada permutación de Sn es el producto de ciclos disyuntos. La repre-


sentación es única salvo el orden.

(iii) Cada permutación en Sn es producto de trasposiciones.

(iv) Si una permutación 𝜋 ∈ Sn tiene dos descomposiciones en productos


de r y s trasposiciones, entonces r es par si, y sólo si, s es par.

(v) Una permutación 𝜋 ∈ Sn se denomina par si se descompone en un


número par de trasposiciones. El conjunto An de las trasposiciones
pares de Sn tiene las siguientes propiedades:

(a) El producto de permutaciones pares es par.


(b) La permutación idéntica es par.
(c) La inversa de una permutación par es par.
30 · Determinantes y sistemas de ecuaciones lineales

En otras palabras, An bajo la composición es un grupo (subgrupo de


Sn ), llamado el grupo alternante de grado n.

n!
(vi) Sn tiene n! elementos, mientras que An posee 2.

Definición 2.1.2. Sea n ≥ 1. Para cada B = [bi j ] ∈ Mn (R), se define su


determinante como el elemento de R dado por
∑︁
det B := (−1) 𝜋 b1𝜋 (1) · · · bn𝜋 (n) , (1.1)
𝜋 ∈Sn

donde (−1) 𝜋 es 1 ó −1, dependiendo si 𝜋 es par ó impar, respectivamente.

A partir de (1.1) se pueden demostrar las principales propiedades de la fun-


ción determinante

det : Mn (R) −→ R
B ↦−→ det B.

Proposición 2.1.3. Sea B = [bi j ] ∈ Mn (R). Entonces,

det[B1 , . . . , aBi , . . . , Bn ]T = a det B, a ∈ R.

Demostración. Sea C = [ci j ] la matriz obtenida de B multiplicando la i-ésima


fila por a ∈ R. Entonces,
∑︁
det C = (−1) 𝜋 c1𝜋 (1) · · · ci 𝜋 (i) · · · cn𝜋 (n)
𝜋 ∈Sn
∑︁
= (−1) 𝜋 b1𝜋 (1) · · · abi 𝜋 (i) · · · bn𝜋 (n)
𝜋 ∈Sn

= a det B.

Nótese la aplicación de la propiedad conmutativa. ✓


Proposición 2.1.4. Sea B = [bi j ] ∈ Mn (R) y (a1 . . . , an ) ∈ R n . Entonces,


 b11 · · · b1n 

b · · · b 
 11 1n 
   
   
det bi1 + a1 · · · bin + an  = det B + det  a1 · · · an  .
   
   
   
   

 bn1 · · · bnn 

bn1 · · · bnn 
 
Determinantes y sistemas de ecuaciones lineales · 31

Demostración. Sea C = [ci j ] ∈ Mn , con


(
brs , si r ≠ i,
crs =
bis + as , si r = i.

Entonces,
∑︁
det C = (−1) 𝜋 b1𝜋 (1) · · · (bi 𝜋 (i) + a 𝜋 (i) ) · · · bn𝜋 (n)
𝜋 ∈Sn
b · · · b 
 11 1n 
 
 
= det B + det  a1 · · · an  .
  ✓

 
 
 
bn1 · · · bnn 
 
Proposición 2.1.5. Si dos filas de una matriz son iguales, entonces su determi-
nante es nulo.

Demostración. Sea B = [bi j ] ∈ Mn (R) tal que Br = Bs , con r ≠ s. Sea


𝜏 = (rs) ∈ Sn y An el grupo de permutaciones pares. Sea

An 𝜏 := {𝜋𝜏 | 𝜋 ∈ An }.

Nótese que |An 𝜏 | = n!


2 y que cada permutación de An 𝜏 es impar. Resulta
entonces Sn = An ∪· An 𝜏, con lo cual podemos desarrollar el determinante
de B de la siguiente manera:
∑︁ ∑︁
det B = (−1) 𝜋 b1𝜋 (1) · · · bn𝜋 (n) + (−1) 𝜋𝜏 b1𝜋𝜏 (1) · · · bn𝜋𝜏 (n)
𝜋 ∈An 𝜋 ∈An
∑︁
= [(−1) b1𝜋 (1) · · · bn𝜋 (n) + (−1) 𝜋𝜏 b1𝜋𝜏 (1) · · · bn𝜋𝜏 (n) ].
𝜋

𝜋 ∈An

Observemos con mayor detalle cada término de la anterior suma:

(−1) 𝜋 b1𝜋 (1) · · · br 𝜋 (r) · · · bs𝜋 (s) · · · bn𝜋 (n)


+ (−1) 𝜋𝜏 b1𝜋𝜏 (1) · · · br 𝜋𝜏 (r) · · · bs𝜋𝜏 (s) · · · bn𝜋𝜏 (n) (1.2)

Para i ≠ r , s, bi 𝜋 (i) = bi 𝜋𝜏 (i) ; br 𝜋 (r) = bs𝜋 (r) = bs𝜋𝜏 (s) ; bs𝜋 (s) = br 𝜋 (s) = br 𝜋𝜏 (r) ;
(−1) 𝜋 y (−1) 𝜋𝜏 tienen signo diferente. Por lo tanto, la suma de (1.2) es nula
y se obtiene que det B = 0. □✓

Proposición 2.1.6. Si en una matriz se intercambian dos filas, el determinante


cambia de signo.
32 · Determinantes y sistemas de ecuaciones lineales

Demostración. Sean B, C ∈ Mn (R), con Cr = Bs , Cs = Br para r ≠ s, y


Ci = Bi para i ≠ r , s. Consideremos la matriz

D = [B1 , . . . , Br + Bs , . . . , Bs + Br , . . . , Bn ]T .

Según la proposición 2.1.5, det D = 0, pero por la proposición 2.1.4 se


tiene que

0 = det D = det[B1 , . . . , Br , . . . , Bs + Br , . . . , Bn ]T
+ det[B1 , . . . , Bs , . . . , Bs + Br , . . . , Bn ]T
= det[B1 , . . . , Br , . . . , Bs , . . . , Bn ]T
+ det[B1 , . . . , Br , . . . , Br , . . . , Bn ]T
+ det[B1 , . . . , Bs , . . . , Bs , . . . , Bn ]T
+ det[B1 , . . . , Bs , . . . , Br , . . . , Bn ]T
= det B + det C. ✓

Corolario 2.1.7. Si la matriz C ∈ Mn (R) se obtuvo de B ∈ Mn (R) mediante


una permutación 𝜋 de filas, entonces det C = (−1) 𝜋 det B.

Demostración. Consecuencia directa de la proposición 2.1.6. ✓


Proposición 2.1.8. Sea B ∈ Mn (R). Entonces,

det[B1 , . . . , Br + aBs , . . . , Bs , . . . , Bn ]T = det B, con a ∈ R, r ≠ s.

En consecuencia, si una fila es nula el determinante es nulo.

Demostración. Consecuencia de las proposiciones 2.1.3, 2.1.4 y 2.1.5. ✓


De la definición y propiedades establecidas se obtienen los siguientes re-


sultados:

(i) det E = 1.

(ii) det Di (a) = a, a ∈ R.

(iii) det Pi j = −1, para i ≠ j.

(iv) detTi j (a) = 1, a ∈ R.

Teorema 2.1.9. Para B, C ∈ Mn (R) se cumple que

det(BC) = (det B) (det C).


Determinantes y sistemas de ecuaciones lineales · 33

Demostración. Consideremos la matriz D ∈ Mn (R) cuyas filas se definen por

Di := bi1 C1 + · · · + bin Cn , 1 ≤ i ≤ n.

Aplicando las proposiciones 2.1.3 y 2.1.4 a la primera fila de D obtenemos


n
∑︁
det D = bi j det[C j , b21 C1 + · · · + b2n Cn , . . . , bn1 C1 + · · · + bnn Cn ]T .
j=1

Procediendo de manera análoga con las demás filas resulta


∑︁
det D = b1 j1 b2 j2 · · · bn jn det[C j1 , . . . , C jn ]T , (1.3)
j1 ,..., jn

donde j1 , . . . , jn recorren independientemente los valores de 1 a n. Para


valores iguales de dos índices, el determinante det[C j1 , . . . , C jn ] es nulo.
Así, en (1.3) podemos suponer que los subíndices j1 , . . . , jn son diferentes.
Esto hace que tengamos una correspondencia biyectiva entre Sn y las n-
tuplas ( j1 , . . . , jn ) de entradas diferentes entre sí. Resulta entonces
∑︁
det D = b1𝜋 (1) · · · bn𝜋 (n) det[C𝜋 (1) , . . . , C𝜋 (n) ]T .
𝜋 ∈Sn

Aplicando el corolario 2.1.7 tenemos


∑︁
det D = (−1) 𝜋 b1𝜋 (1) · · · bn𝜋 (n) det[C1 , . . . , Cn ]T ,
𝜋 ∈Sn

es decir, det D = (det B) (det C). ✓


De este teorema se desprenden algunas conclusiones importantes.

Corolario 2.1.10. (i) Si B ∈ GLn (R), entonces det B ∈ R ∗ y además

det B−1 = (det B) −1 .

(ii) Matrices similares tienen el mismo determinante.

(iii) Los anillos conmutativos son dimensionales.

Demostración. Las dos primeras afirmaciones son evidentes.


(iii) Sea V un R-espacio libre con bases X = {x1 , . . . , xn } y
Y = {y1 , . . . , ym }. Supongamos que m ≠ n, por ejemplo m > n. Sea
B ∈ Mn×m (R) la matriz de cambio de X a Y . Por la proposición 1.3.3,
existe B ′ ∈ Mm×n (R) tal que B ′B = E, siendo E la idéntica de orden m.
34 · Determinantes y sistemas de ecuaciones lineales

Sean B,e Be′ ∈ Mm (R) las matrices obtenidas de B y B ′ adjuntando columnas


y filas nulas respectivamente. Entonces Be′B
e = E, pero así,

e′ det B
1 = det E = det B e = 0,

ya que B
e tiene filas nulas. Esto es una contradicción, por lo que necesaria-
mente m = n. ✓

El punto (ii) del corolario anterior induce la siguiente definición.

Definición 2.1.11. Si f : V −→ V es una transformación lineal de un


espacio de dimensión finita, entonces se define el determinante de f como
el determinante de la matriz de f en cualquier base.

La función determinante ha sido introducida a través de las filas de las


matrices. Para mostrar que el tratamiento por columnas es análogo, basta
probar que para cada B ∈ Mn (R) se tiene que

det B = det BT . (1.4)

En efecto, sea BT = [bi′j ] con bi′j = bi j . Nótese que 𝜋 ∈ Sn es par sí, y sólo
si, 𝜋 −1 ∈ Sn lo es; además, cuando 𝜋 recorre Sn , 𝜋 −1 también lo hace. Por
tanto,
∑︁ ∑︁
det B = (−1) 𝜋 b1𝜋 (1) · · · bn𝜋 (n) = (−1) 𝜋 b 𝜋′ (1)1 · · · b 𝜋′ (n)n .
𝜋 ∈Sn 𝜋 ∈Sn

Sea 𝜋 (i1 ) = 1, 𝜋 (i2 ) = 2, . . . , 𝜋 (in ) = n; reordenando el producto


b 𝜋′ (1)1 · · · b 𝜋′ (n)n se tiene que
∑︁
det B = (−1) 𝜋 b 𝜋′ (i1 )i1 · · · b 𝜋′ (in )in
𝜋 ∈Sn
∑︁
′ ′
= (−1) 𝜋 b1𝜋 −1 (1) · · · bn𝜋 −1 (n)
𝜋 ∈Sn
∑︁
′ ′
= (−1) 𝜋 b1𝜋 −1 (1) · · · bn𝜋 −1 (n) .
𝜋 −1 ∈Sn

En total,
∑︁
′ ′ T
det B = (−1) 𝜃 b1𝜃 (1) · · · bn𝜃 (n) = det B .
𝜃 ∈Sn
Determinantes y sistemas de ecuaciones lineales · 35

2. Determinantes y funciones multilineales


Consideramos en seguida la caracterización de los determinantes a través
de cuatro propiedades básicas.
Definición 2.2.1. Sea V un R-espacio y n ≥ 1. Una función multilineal
sobre V de n argumentos es una aplicación
D : V × · · · × V −→ R
que es lineal en cada uno de sus argumentos, es decir,
(i) Para cada 1 ≤ i ≤ n,

D(vi , . . . , vi + vi′ , . . . , vn )
= D(v1 , . . . , vi , . . . , vn ) + D(v1 , . . . , vi′ , . . . , vn ).

(ii) Para cada 1 ≤ i ≤ n y cada a ∈ R,


D(v1 , . . . , vi · a, . . . , vn ) = D(v1 , . . . , vi , . . . , vn )a.

La función se dice alternada si para vi = vi+1 y cada 1 ≤ i ≤ n − 1,


D(v1 , . . . , vi , vi+1 , . . . , vn ) = 0;
y antisimétrica si para cada 1 ≤ i ≤ n,
D(v1 , . . . , vi , vi+1 , . . . , vn ) = −D(v1 , . . . , vi+1 , vi , . . . , vn ). (2.1)
Proposición 2.2.2. Toda función multilineal alternada es antisimétrica. Si
2 := 1 + 1 R ∗ , entonces el recíproco es válido.
Demostración. Por ser alternada, D(v1 , . . . , vi + vi+1 , vi + vi+1 , . . . , vn ) = 0,
pero también,
D(v1 , . . . , vi + vi+1 , vi + vi+1 , . . . , vn )
= D(v1 , . . . , vi , vi + vi+1 , . . . , vn ) + D(v1 , . . . , vi+1 , vi + vi+1 , . . . , vn )
= D(v1 , . . . , vi , vi , . . . , vn ) + D(v1 , . . . , vi , vi+1 , . . . , vn )
+ D(v1 , . . . , vi+1 , vi , . . . , vn ) + D(v1 , . . . , vi+1 , vi+1 , . . . , vn ),
de donde
D(v1 , . . . , vi , vi+1 , . . . , vn ) = −D(v1 , . . . , vi+1 , vi , . . . , vn ).
Para el recíproco basta considerar
D(v1 , . . . , vi , vi , . . . , vn ) = −D(v1 , . . . , vi , vi , . . . , vn ),
de donde 2 D(v1 , . . . , vi , vi , . . . , vn ) = 0. ✓

36 · Determinantes y sistemas de ecuaciones lineales

Proposición 2.2.3. La función determinante definida en (1.1) es una función


multilineal alternada de sus filas (y columnas).

Demostración. Consecuencia de las proposiciones 2.1.3, 2.1.4 y 2.1.6. ✓


Teorema 2.2.4. Si D : Mn (R) −→ R es una función multilineal y alternada


respecto a las filas tal que D(E) = 1, entonces D = det.

Demostración. Sean B, C ∈ Mn (R) tales Cr = Bs , Cs = Br , para r ≠ s y


Ci = Bi para i ≠ r , s. Entonces, D(C) = −D(B): en efecto, suponga-
mos por ejemplo que s > r. La matriz C es el resultado de intercambiar la
r-ésima y s-ésima filas de B. Nótese que este intercambio se logra aplican-
do 2(s − r) − 1 veces la propiedad (2.1) , la cual podemos usar en virtud
de la proposición 2.2.2. Puesto que toda permutación 𝜋 ∈ Sn es producto
de transposiciones, entonces de lo demostrado antes se obtiene: si la matriz
C ∈ Mn (R) se obtuvo de B ∈ Mn (R) mediante una permutación 𝜋 de sus
filas, entonces D(C) = (−1) 𝜋 D(B).
Antes de emprender la prueba propiamente, nótese que si la matriz B
tiene dos filas iguales, entonces D(B) = 0: si las filas son consecutivas no
hay nada por mostrar. De no ser así, aplicamos una permutación adecuada
para que lo sean, y entonces usamos lo probado anteriormente.
Sea B = [bi j ] ∈ Mn (R) y ei = (0, . . . , 1, . . . , 0), para 1 ≤ i ≤ n. B
puede ser considerado como una elemento de R n × · · · × R n teniendo en
cuenta que
 n n
∑︁ ∑︁ 

B =  b1 j · e j , . . . ,
 bn j · e j  .
 j=1 j=1 
 
De esto se sigue que

 n n n n
∑︁ ∑︁  ∑︁  ∑︁ 
  
D(B) = D  b1 j · e j , . . . ,
 bn j · e j  =
 b1 j D  e j , . . . ,
 bn j · e j 
 j=1 j=1  j=1  j=1 
 ∑︁   
= ··· = b1 j1 · · · bn jn D[e j1 , . . . , e jn ],
j1 ,..., jn

donde j1 , . . . , jn recorren independientemente todos los valores de 1 a n.


El resto de la prueba es similar a la demostración del teorema 2.1.9. ✓

La proposición 2.2.3 y el teorema 2.2.4 garantizan la existencia y unici-


dad de una función determinante.
Determinantes y sistemas de ecuaciones lineales · 37

Presentaremos a continuación un resultado clásico relativo a determi-


nantes con aplicaciones recientes. Sea A ∈ Mm×n (R) y
 
i1 , . . . , ik
A
j1 , . . . , jk

la submatriz de A de orden k × k, conformada por las filas i1 , . . . , ik y las


columnas j1 , . . . , jk . Se tiene entonces la siguiente fórmula.

Proposición 2.2.5 (Fórmula de Cauchy-Binet) . Sean A ∈ Mm×n (R) y


B ∈ Mn×p (R) matrices sobre R, y C ∈ Mm×p (R) su producto. Entonces,
  ∑︁    
i1 , . . . , ik i1 , . . . , ik r1 , . . . , rk
det C = det A det B ,
j1 , . . . , jk r1 , . . . , rk j1 , . . . , jk

donde la suma se extiende a todos los subconjuntos {r1 , . . . , rk } de


In = {1, 2, . . . , n} tales que 1 ≤ r1 < r2 < · · · < rk ≤ n.

Demostración. Ejercicio para el lector. ✓


3. Menores y cofactores
La teoría de determinantes puede ser emprendida por medio de los llama-
dos menores de las matrices. La construcción en este caso la efectuamos por
inducción sobre el tamaño n de las matrices. Apoyándonos en el teorema
2.2.4, estableceremos que la nueva definición coincide con la dada en (1.1) .

Definición 2.3.1. Definimos inductivamente una función

D : Mn (R) −→ R

de la siguiente manera:
Paso 1: sea

D1 : M1 (R) −→ R
a ↦−→ D1 (a) := a.

Paso 2: sea

D2 : M2 (R) −→ R
 
b11 b12
↦−→ b11 D1 (b22 ) − b21 D1 (b12 ) = b11 b22 − b21 b12 .
b21 b22
38 · Determinantes y sistemas de ecuaciones lineales

Paso 3: se supone, para n ≥ 1, definida una función

Dn−1 : Mn−1 (R) −→ R


B ↦−→ Dn−1 (B)

Paso 4: sea B = [bi j ] ∈ Mn (R). Se denomina menor del elemento bi j a


la imagen mediante Dn−1 de la matriz obtenida eliminando la i-ésima fila y
la j-ésima columna de B. A este menor lo denotaremos por Mi j . Definimos
entonces

D : Mn (R) −→ R
n
∑︁
B ↦−→ (−1) i+1 bi1 Mi1 . (3.1)
i=1

Se dice que la función D se ha definido por medio de los menores de la


primera columna.

Proposición 2.3.2. La función D de la definición 2.3.1 es multilineal y alternada


de sus filas. Además, D(E) = 1.

Demostración. La prueba de las cuatro propiedades requeridas se hace por


inducción sobre n.
Los casos n = 1, 2 se demuestran directamente a partir de las definicio-
nes de D1 y D2 .
Supóngase entonces que Dn−1 satisface las cuatro propiedades. Sea
E = [ei j ] la idéntica de orden n. Puesto que ei j = 0 para i ≠ 1, de (3.1)
resulta D(E) = e11 M11 . Pero M11 = Dn−1 (En−1 ), donde En−1 denota la
idéntica de tamaño n − 1. Por inducción D(E) = 1.
Sea ahora B = [bi j ] ∈ Mn (R), v = (a1 , . . . , an ) ∈ R n y

C = [ci j ] = (B1 , . . . , Br + v, . . . , Bn )T .
Ín
Por (3.1) , D(C) = i=1 (−1) i+1 ci1 Mi1
′ , donde M ′ es el menor de c . Po-
i1 i1
demos escribir entonces
n
∑︁
D(C) = (−1) i+1 ci1 Mi1

+ (−1) r+1 (br1 + a1 )Mr1
i=1
i≠r
n
∑︁
= (−1) i+1 bi1 [Mi1 + Dn−1 (F )] + (−1) r+1 (br1 + a1 )Mr1 ,
i=1
i≠r
Determinantes y sistemas de ecuaciones lineales · 39

donde F es la matriz obtenida de C suprimiendo la primera columna y la


i-ésima fila. Resulta entonces

D(C) = D(B) + D[B1 , . . . , v, . . . , Bn ].

Sean ahora B = [bi j ] ∈ Mn (R) y C = [ci j ] = [B1 , . . . , aBr , . . . , Bn ]T ,


a ∈ R. Entonces,
n
∑︁
D(C) = (−1) i+1 ci1 Mi1

i=1
n
∑︁
= (−1) i+1 bi1 aMi1 + (−1) r+1 br1 aMr1
i=1
i≠r
=a D(B).

Sea por último B = [bi j ] ∈ Mn (R) tal que B = [B1 , . . . , Br , Br , . . . , Bn ]T .


Entonces,
n
∑︁
D(B) = (−1) i+1 bi1 Mi1 + (−1) r+1 br1 Mr1 + (−1) r+2 Mr+1,1
i=1
i≠r ,r+1

=0 + (−1) r+1 [br1 Mr1 − br1 Mr1 ],

dado que Mr1 = Mr+1,r . De esta manera, D(B) = 0. ✓


Del teorema 2.2.4 se desprende inmediatamente que la función D en


(3.1) coincide con la función definida en (1.1) .
Como habíamos mencionado antes, la función D se definió mediante los
menores de la primera columna. Sin embargo, también podemos definir la
función D a través de los menores de cualquier columna, y demostrar de
manera análoga la proposición 2.3.2. De esto, y teniendo en cuenta que
det(BT ) = det(B), resulta que
n
∑︁
det B = (−1) i+ j bi j Mi j , 1 ≤ j ≤ n, (3.2)
i=1
n
∑︁
det B = (−1) j+i bi j Mi j , 1 ≤ i ≤ n. (3.3)
j=1

Definición 2.3.3. Sea B = [bi j ] ∈ Mn (R). El elemento Bi j definido me-


diante
Bi j := (−1) i+ j Mi j
40 · Determinantes y sistemas de ecuaciones lineales

se denomina el complemento algebraico de bi j . La matriz Cof (B) de los


complementos algebraicos

Cof (B) = [Bi j ]

se denomina matriz cofactor de B. La transpuesta Cof (B)T de la matriz


cofactor de denomina la adjunta de B y se denota por Adj(B).

Teorema 2.3.4. Sea B ∈ Mn (R). Entonces,

(i) B Adj(B) = Adj(B)B = det(B)E.

(ii) B ∈ GLn (R) si, y sólo si, det(B) ∈ R ∗ . En tal caso

B−1 = (det B) −1 Adj(B).

Demostración. (i) Probaremos inicialmente las siguientes fórmulas:


(
0, si i ≠ j,
bi1 B j1 + · · · + bin B jn = (3.4)
det B, si i = j,
(
0, si i ≠ j
b1 j B1i + · · · + bn j Bni = (3.5)
det B, si i = j.

Las pruebas en ambos casos son análogas, por ello, sólo analizaremos (3.4) .
El caso i = j corresponde a (3.3) . Sea i ≠ j y considérese la matriz C = [ci j ]
obtenida de B reemplazando la j-ésima fila de B por la i-ésima. Calculando
det C por la j-ésima fila tenemos
n
∑︁ n
∑︁
0 = det C = (−1) k+ j b jk M jk = bik B jk .
k=1 k=1

Sea ahora C = [ci j ] = B Adj(B). Entonces,

n
(
∑︁ 0, si i ≠ j,
ci j = bik B jk
k=1
det B si i = j,

de donde B Adj(B) = det(B)E. De (3.5) resulta también que


det(B)E = Adj(B)B.
(ii) Es consecuencia de (i) y del corolario 2.1.10. ✓

Del teorema anterior se desprenden algunas consecuencias interesantes.


Determinantes y sistemas de ecuaciones lineales · 41

Observación 2.3.5. (i) Si B, C ∈ Mn (R) son tales que BC = E, entonces


det B ∈ R ∗ , con lo cual B ∈ GLn (R) y CB = E.
(ii) La función
det : GLn (R) −→ R ∗
B ↦−→ det B
es un homomorfismo sobreyectivo de grupos.
Definición 2.3.6. El conjunto de matrices de GLn (R) cuyo determinante
es 1, es decir, el núcleo del homomorfismo det, es un subgrupo normal de
GLn (R), denominado el grupo especial lineal de dimensión n sobre R, y
se denota por SLn (R).
SLn (R) constituye otro de los grupos de matrices que estudiaremos en
el último capítulo. Se tienen además las siguientes propiedades:
En (R) ≤ SLn (R) ⊴ GLn (R), GLn (R)/SLn (R)  R ∗ , (3.6)
donde En (R) es el grupo elemental generado por todas las matrices pro-
piamente elementales (véase la definición 1.4.3). Se puede probar que para
n ≥ 3, En (R) ⊴ SLn (R). Además, existen clases importantes de anillos con-
mutativos para los cuales el grupo especial y el elemental coinciden. Sobre
esto volveremos en el último capítulo (véase también [39]). Por ahora, vea-
mos las siguientes propiedades para cuerpos.
Proposición 2.3.7. Sea 𝕂 un cuerpo. Entonces,
(i) GLn (𝕂) = ⟨Ti j (a), Dn (b) | 1 ≤ i , j ≤ n, i ≠ j, a ∈ 𝕂, b ∈ 𝕂 ∗ ⟩.

(ii) En (𝕂) = SLn (𝕂).


Demostración. (i) Inducción sobre n:
Para n = 1 no hay nada por demostrar.
Sea n = 2 y  
a b
∈ GLn (𝕂);
c d
no es posible que a = 0 = c; sea c ≠ 0, entonces
1 1−a 1 b′
    
a b (1 − a)d
c = , b′ = b + ,
0 1 c d c d c
1 0 1 b′ 1 b′
    
= , d ′ = −b ′c + d,
−c 1 c d 0 d′
1 b ′ 1 −b ′
    
1 0
= ,
0 d′ 0 1 0 d′
42 · Determinantes y sistemas de ecuaciones lineales

de donde,
a−1
1 b′
      
a b 1 c 1 0 1 0
= .
c d 0 1 c 1 0 d′ 0 1
Nótese que d ′ ≠ 0, pues de lo contrario d = b ′c = bc+d−ab
c c, y así, bc − ad = 0.
d d
Esto último implica que b = c a, y como d = c c, tenemos que las columnas
de la matriz son linealmente dependiente contradiciendo nuestra hipótesis
inicial.
Sea
d11 · · · d1n 
D =  ... ..  ∈ GL (𝕂).
 
 ..
 . .  n
dn1 · · · dnn 
 
Luego existe 1 ≤ j ≤ n tal que d j1 ≠ 0, de donde
 1 d′ · · · ′ 
d1n
 12 

1 − d11
 d ′ d ′ · · · ′ 
d2n
 21 22
T1 j D= . ..  ;

 .. .. ..
d j1 . . . 

d ′ d ′ · · · ′ 
dnn
 n1 n2 
mediante operaciones elementales del tipo Ti j reducimos esta última matriz
a una de la forma  
1 0
,
0 D′
donde D ′ ∈ GLn−1 (𝕂). Mediante inducción, y despejando como hicimos
en el caso n = 2, completamos la prueba (nótese que en la factorización de
D sólo aparece una matriz diagonal). Por otra parte, si c = 0 pero a ≠ 0,
realizamos la siguiente operación elemental previamente:
    
1 0 a b a b
= , con a ≠ 0.
1 1 0 d a b+d

(ii) Esto se obtiene de (i) y (3.6) . ✓


Otras consecuencias de la teoría de determinantes son las siguientes.


Teorema 2.3.8. Sea V un R-espacio libre de dimensión finita n ≥ 1. Entonces,
(i) Si X es un sistema de generadores de V con n elementos, entonces X es una
base de V .

(ii) Un conjunto X de generadores de V con r ≥ 1 elementos es minimal si V


no se puede generar con menos de R elementos. Si X es minimal, entonces X
es una base de V y |X | = n. En particular, V no se puede generar con menos
de n elementos, es decir, dimV = minimal de generadores de V .
Determinantes y sistemas de ecuaciones lineales · 43

Demostración. (i) Vimos en el ejemplo 1.2.11 que aunque X sea linealmente


independiente, con |X | = n, no necesariamente X resulta ser una base de
V . Veremos ahora que si V = ⟨X⟩ y |X | = n, entonces X es una base de V .
En efecto, sean Y = {y1 , . . . , yn } una base de V y r1 , . . . , rn ∈ R tales que
x1 · r1 + · · · + xn · rn = 0, entonces [X] [r]T = 0; sin embargo, [X] = [Y ]B y
[Y ] = [X]C para ciertas matrices B, C ∈ Mn (R). De esta forma,

[Y ]B[r]T = 0,

de donde B[r]T = 0; además, [Y ] = [Y ]BC, y en consecuencia, BC = E,


con lo que
det(B) det(C) = 1,

es decir, det(B) ∈ R ∗ , y por tanto, B ∈ GLn (R); así, CB = E y CB[r]T = 0,


de donde se concluye que [r]T = 0.
(ii) Como r es minimal necesariamente r ≤ n. Supongamos que r < n;
como en (i), sea Y = {y1 , . . . , yn } una base de V , entonces [X] = [Y ]B para
alguna B ∈ Mn×r (R), y [Y ] = [X]C para cierta matriz C ∈ Mr×n (R); así
[Y ] = [Y ]BC, y por tanto, BC = E. Si
 
  C
B0 := B 0 ∈ Mn (R) y C0 = ∈ Mn (R),
0

entonces B0 C0 = E y, en consecuencia,

det(B0 ) det(C0 ) = 1;

pero det(C0 ) = 0 lo que es claramente una contradicción, y así, necesaria-


mente r = n. De (i) se sigue que X es una base. ✓

Teorema 2.3.9. Sea R un anillo conmutativo cualquiera y sea f : R n −→ R n


un homomorfismo sobreyectivo. Entonces f es biyectivo.

Demostración. Si X = {e1 , . . . , en } es la base canónica de R n , entonces exis-


ten a1 , . . . , an ∈ R n tales que f (ai ) = ei para 1 ≤ i ≤ n. Sea g : R n −→ R n
el homomorfismo dado por g (ei ) = ai para 1 ≤ i ≤ n, entonces f g = iR n ; así
mX ( f g) = FG = E, de modo que det(F ) ∈ R ∗ y, por tanto, F es invertible.
En consecuencia, f es un homomorfismo biyectivo. ✓

Ejemplo 2.3.10. Aún en DIPs, inyectividad no implica sobreyectividad:


basta considerar la aplicación f : ℤ −→ ℤ, dada por f (a) := 2a; claramente
esta aplicación es un homomorfimo inyectivo pero no sobreyectivo.
44 · Determinantes y sistemas de ecuaciones lineales

4. Ideales, rango y sistemas de ecuaciones

Definición 2.4.1. Sea R un anillo conmutativo. Se denomina sistema li-


neal de ecuaciones en n indeterminadas y m ecuaciones al conjunto de ecua-
ciones

a11 x1 + ··· + a1n xn = b1


.. .. .. .. (4.1)
. . . .
am1 x1 + ··· + amn xn = bm

con a11 , . . . , amn , b1 , . . . , bm ∈ R. Los elementos ai j se denominan coefi-


cientes del sistema, los bi se denominan los términos independientes del
sistema, esto para 1 ≤ i ≤ m y 1 ≤ j ≤ n, y x1 , . . . , xn representan elemen-
tos de R por determinar. Si A = [ai j ] ∈ Mm×n (R) es la matriz de coeficientes
del sistema, X := [x1 , . . . , xn ]T y B := [b1 , . . . , bm ]T , el sistema (4.1) pue-
de escribirse matricialmente en la forma

AX = B. (4.2)

El sistema (4.2) se dice homogéneo si B = 0. Se denomina solución del


sistema (4.2) a un vector columna X0 = [x10 , . . . , xn0 ], xi0 ∈ R, tal que
AX0 = B. (4.2) se dice compatible (o soluble) si posee al menos una so-
lución; de lo contrario se denomina incompatible. Un sistema compatible
con más de una solución se llama indeterminado. Sea A′ X = B ′ otro siste-
ma de orden m × n sobre R; AX = B y A′ X = B ′ se dicen equivalentes si
ambos son incompatibles, o bien, siendo ambos compatibles, tienen el mis-
mo conjunto de soluciones. La matriz (A | B) de orden m × (n + 1) obtenida
de A adjuntando B como última columna, se denomina matriz ampliada
del sistema (4.2) .

Observación 2.4.2. Es claro que la relación de la definición anterior es de


equivalencia.

El propósito de esta sección es estudiar la compatibilidad y determina-


bilidad de los sistemas lineales de ecuaciones con coeficientes en un anillo
conmutativo arbitrario.
Determinantes y sistemas de ecuaciones lineales · 45

Supongamos inicialmente que el sistema (4.2) es cuadrado, es decir,


m = n. Multiplicando (4.2) por la adjunta de A resulta

Adj(A)AX = Adj(A)B,
∑︁n 
 (−1) k+1 M b 
 k1 k 
 
 k=1
.

T .
det(A) [x1 , . . . , xn ] =  .
 
 n . 
∑︁ 
 (−1) k+n M b 
 kn k 
 k=1 
 
Entonces,
n
∑︁
det(A)x j = (−1) k+ j Mk j bk ,
k=1

es decir,
 a11 · · · a1, j−1 b1 a1, j+1 · · · a1n 
det(A)x j = det  ... .. .. .. ..  ,

 .. .. (4.3)
 . . . . . . 
 an1 · · · an, j−1 bn an, j+1 · · · ann 

para cada 1 ≤ j ≤ n; así, det(A)x j = det[A1 · · · A j−1 BA j+1 · · · An ]. Nótese


que si det(A) ∈ R ∗ , entonces el sistema cuadrado AX = B es determinado.
En tal caso, (4.3) se conoce como la regla de Cramer, con X = A−1 B.
Pasamos ahora a considerar el caso general de un sistema rectangular
como en (4.2) . Comencemos por recordar el concepto de ideal de un anillo
conmutativo R (véase también [23]).

Definición 2.4.3. Un subconjunto no vacío I de R se denomina ideal de


R si

(i) Para cualesquiera a, b ∈ I, a + b ∈ I.

(ii) Para cada a ∈ I y cada r ∈ R, ar ∈ I.

En otras palabras, los ideales de R son los subespacios del R-espacio ca-
nónico R 1 (véase [23]). Podemos entonces hablar del ideal generado por un
conjunto (finito o infinito) X de elementos de R.

Definición 2.4.4. Sea A = [ai j ] ∈ Mm×n (R).

(i) Para 1 ≤ k ≤ mı́n{m, n}, sea Ik (A) el ideal generado por los determi-
nantes de todas las submatrices de orden k × k de A.
46 · Determinantes y sistemas de ecuaciones lineales

(ii) Para k ≤ 0, sea Ik (A) := R.

(iii) Para k > mı́n{m, n}, sea Ik (A) := 0.

Ik (A) se denomina el k-ésimo ideal determinante de A.

Nótese que se tiene la cadena:

· · · = I−1 (A) = R = I0 (A) ⊇ I1 (A)


⊇ · · · ⊇ Imı́n{m,n } ⊇ Imı́n{m,n }+1 = 0 = · · · .

Presentamos enseguida el primer criterio para la compatibilidad de un


sistema.

Proposición 2.4.5. Si el sistema (4.2) tiene solución, entonces los ideales de-
terminantes de A coinciden con los ideales determinantes de la matriz ampliada
(A | B).

Demostración. Veamos primero que podemos asumir m ≤ n: en efecto, si


m > n, agregando indeterminadas xn+1 , . . . , xm con coeficientes nulos y co-
lumnas a la matriz A, obtenemos un nuevo sistema A′ X ′ = B, con
A′ = (A | 0); nótese que X es solución de AX = B si, y sólo si,

 X 
 
xn+1 
X′ =  . 
 
.
 . 
 
x 
 m 
es solución de A′ X ′ = B. Además,

Ik (A) = Ik (A′) e Ik (A | B) = Ik (A′ | B), para todo k ∈ ℤ.

Por lo tanto, dado k ∈ ℤ, Ik (A′) = Ik (A′ | B) si, y sólo si, Ik (A) = Ik (A | B).
Supondremos entonces que m ≤ n; para k ≤ 0 ó k > mı́n{m, n} = m
se tiene que Ik (A) = Ik (A | B). Sea entonces 1 ≤ k ≤ mı́n{m, n} = m; es
claro que Ik (A) ⊆ Ik (A | B). Sea s el determinante de una submatriz de
(A | B) de tamaño k × k; si toda la submatriz está incluida en A, se sigue de
inmediato que s ∈ Ik (A). Supongamos entonces que la submatriz incluye la
columna B:
 ai1 j1 · · · ai1 jk−1 bi1 
 
 ai j · · · ai j b i

 21 2 k−1 2
s = det  . .. .. ..  .
 .. . . .

a · · · a b 
 ik j1 ik jk−1 ik 
Determinantes y sistemas de ecuaciones lineales · 47

Sea X = [x1 , . . . , xn ] una solución de AX = B, entonces

bi1 = ai1 1 x1 + · · · + ai1 n xn


.. .. .. ..
. . . .
bi k = aik 1 x1 + · · · + aik n xn .

Aplicando las propiedades de la función determinante obtenemos

 ai j ··· ai1 jk−1 ai1 1   ai j ··· ai1 jk−1 ai1 n 


 11  11
s = x1 det  ... .. .. .. + · · · + x det  .. .. .. ..  .
 
 . . .  n  .
 . . . 
 ai j ··· aik jk−1 aik 1   ai j ··· aik jk−1 aik n 
 k1  k1

De esta forma s resulta ser una combinación lineal de subdeterminantes de


A de tamaño k × k (algunos de ellos pueden ser nulos). En consecuencia,
s ∈ Ik (A). ✓

La condición de la proposición 2.4.5 no es suficiente para garantizar la


solubilidad del sistema AX = B. Es posible presentar un ejemplo donde los
ideales determinantes de A y (A | B) coincidan sin que el sistema AX = B
tenga solución (véase [3], pág. 59, ejemplo 5.24).
Dada una matriz A ∈ Mm×n (R), denotamos por AnnR (Ik (A)) al conjunto
de los elementos r ∈ R que anulan a cada elemento de Ik (A), es decir,

AnnR (Ik (A)) := {r ∈ R | Ik (A)r = 0}.

Definición 2.4.6. Sea A ∈ Mm×n (R).

(i) El rango de A, denotado por rank(A), es el mayor entero no negativo


k tal que Ik (A) ≠ 0.

(ii) El rango de A según McCoy, denotado por Mrank(A), es el mayor


entero no negativo tal que AnnR (Ik (A)) = 0.

Proposición 2.4.7. Sea A ∈ Mm×n (R). Entonces,

(i) rank(A) = rank(AT ); Mrank(A) = Mrank(AT ).

(ii) Para cada Q ∈ GLm (R) y P ∈ GLn (R),

rank(Q AP) = rank(A) y Mrank(Q AP) = Mrank(A).

(iii) 0 ≤ Mrank(A) ≤ rank(A) ≤ mı́n{m, n}.


48 · Determinantes y sistemas de ecuaciones lineales

Demostración. (i) Veamos primero que Ik (A) = Ik (AT ), para todo k ∈ ℤ.


Para k ≤ 0 tenemos que Ik (A) = R e Ik (AT ) = R; para k > mı́n{m, n} tene-
mos que Ik (A) = 0 = Ik (AT ). Supongamos ahora que 1 ≤ k ≤ mı́n{m, n} y
sea s un generador de Ik (A). Entonces existe una submatriz

 i1 · · · ik 
A  ... . . . .. 


 . 
 j1 · · · jk 

de A tal que

 i1 · · · ik   i1 · · · ik 
s = det A  ... . . . ..  = det AT  .. . . ..  ;
 

 .  .
 . . 
 j1 · · · jk   j1 · · · jk 
 

de esto último se sigue que s ∈ Ik (AT ). De manera análoga se muestra la


otra inclusión, de modo que Ik (A) = Ik (AT ); así rank(A) coincide con el
mayor entero positivo k tal que Ik (A) ≠ 0, que es precisamente el mayor
entero positivo k para el que Ik (AT ) ≠ 0, es decir, es igual al rank(AT ). De
la misma manera tenemos que Mrank(A) = Mrank(AT ).
(ii) Comenzamos probando la siguiente propiedad general (véase [3],
pág. 43, lema 4.5): si B ∈ Mm×p (R) y C ∈ Mp×n (R), entonces

Ik (BC) ⊆ Ik (B) ∩ Ik (C), para todo k ∈ ℤ. (4.4)

En efecto, para k ≤ 0 tenemos que Ik (BC) = R, Ik (B) = R = Ik (C); de


forma similar, si k > mı́n{m, n}, entonces Ik (BC) = 0, pero en este caso
k > m ó k > n, lo cual implica que k > mı́n{m, p} ó k > mı́n{p, n}, luego
Ik (B) = 0 ó Ik (C) = 0. Por tanto, podemos asumir 1 ≤ k ≤ mı́n{m, n}. Para
terminar la demostración de (4.4) probemos los siguientes preliminares:
(a) Ik (BC) ⊆ Ik (C): sea C = [C 1 · · · C n ], entonces BC = [BC 1 · · · BC n ].
Sea s un generador de Ik (BC), es decir, s es el determinante de una subma-
triz de BC de orden k × k tomando las filas i1 < · · · < ik y las columnas
j1 < · · · < jk de BC; entonces (BC) j1 = BC j1 , . . . , (BC) jk = BC jk , de modo
que

s ∈ Ik ( [(BC) j1 · · · (BC) jk ]) = Ik ( [BC j1 · · · BC jk ]) = Ik (B[C j1 · · · C jk ]).

Claramente Ik ( [C j1 · · · C jk ]) ⊆ Ik (C), luego resta probar que

Ik (B[C j1 · · · C jk ]) ⊆ Ik ( [C j1 · · · C jk ]).
Determinantes y sistemas de ecuaciones lineales · 49

Nótese que estamos en la situación inicial pero con dos matrices B ∈ Mm×p (R)
y F ∈ Mp×k (R), con 1 ≤ k ≤ mı́n{m, k}, esto es, k ≤ m. Tenemos así
 B1 F 
BF =  ...  ,
 
 
 
Bm F 
 
luego, para cada 1 ≤ i ≤ m,
 f11 · · · fik 
(BF )i =Bi F = [bi1 · · · bip ]  ... . . . ... 
 
 
 
 fp1 · · · fpk 
 
=[bi1 f11 + · · · + bip fp1 · · · bi1 f1k + · · · + bip fpk ]
=bi1 F1 + · · · + bip Fp ,
Íp
de donde (BF )i = l=1 bil Fl . Sea u un generador de Ik (BF ), entonces
i 1 · · · ik   (BF )i 
1
 .. . . .. ® = det  .. 
©  ª 
u = det ­­BF

.
 . . ®

 . 
 
«
1 · · ·
 k ¬

 (BF )ik 
 

p
 Fl 
∑︁   p 
 b F ∑︁ 
i1 l l 
bi2 l Fl 
  
p
  
 l=1
.
 ∑︁  
.  l=1
= det  = bi1 l det 
  
 p . .. 
∑︁

 l=1

 . 

p
bik l Fl 
  ∑︁ 
bik l Fl 
  
  
 l=1   
 l=1 
Fl 
 1
bi1 l1 · · · bik lk det  ...  ,
∑︁
=··· =
 
 
l1 ,...,lk  Fl 
 k
pero
Fl 
 1
det  ...  = 0
 
 
 Fl 
 k
si hay filas repetidas, y en los demás casos
Fl 
 1
det  ...  ∈ Ik (F ).
 
 
 Fl 
 k
50 · Determinantes y sistemas de ecuaciones lineales

Por lo tanto, u ∈ Ik (F ).
(b) Ik (BC) ⊆ Ik (B): por (i),

Ik (BC) = Ik ((BC)T ) = Ik (CT BT ) ⊆ Ik (BT ) = Ik (B).

Con esto hemos completado la prueba de (4.4) .


Retomando la demostración, de (4.4) resulta Ik (P AQ) = Ik (A), para
todo k ∈ ℤ, P ∈ GLm (R) y Q ∈ GLn (R): en efecto,

Ik (P A) ⊆ Ik (A) = Ik (P −1 (P A)) ⊆ Ik (P A),

entonces Ik (P A) = IA ;

Ik (P AQ) = Ik (AQ) ⊆ Ik (A) = Ik ((AQ)Q −1 ) ⊆ Ik (AQ) = Ik (P AQ),

y así, Ik (P AQ) = Ik (A). En consecuencia, rank(P AQ) = rank(A) y


Mrank(P AQ) = Mrank(A).
(iii) Es claro que rank(A) ≤ mı́n{m, n}; también, por definición,
Mrank(A) ≥ 0. Sea l = Mrank(A) y supongamos que l > rank(A), en-
tonces Il (A) = 0, y en consecuencia, AnnR (Il (A)) = R, lo que claramente
es una contradicción. ✓

Sea ahora A ∈ Mm×n (R), con m ≤ n, y supongamos que Mrank(A) = m.


Definimos Im∗ (A | B) como el ideal generado por los determinantes de todas
las submatrices de orden m × m de (A | B) que no son completamente
submatrices de A, es decir, la columna B está incluida.
Para probar la siguiente proposición, recordemos que un elemento s ∈ R
se dice que no es divisor de cero en R si s ≠ 0 y además, para cada a ∈ R
tal que sa = 0, se tiene necesariamente que a = 0.
Recordamos también que para I y J ideales de R se define su producto
I J como el ideal generado por el conjunto de todos los productos de la
forma ab, con a ∈ I y b ∈ J . Nótese entonces que cada elemento de I J es
una suma finita a1 b1 + · · · + at bt , con ai ∈ I, bi ∈ J , 1 ≤ i ≤ t (véase [23]).

Proposición 2.4.8. Sea A ∈ Mm×n con m ≤ n, y sea Mrank(A) = m. Si existe


un ideal J de R y un elemento s ∈ R, que no sea divisor de cero, tal que

J Im∗ (A | B) ⊆ ⟨s⟩ ⊆ J Im (A),

entonces AX = B es soluble.
Determinantes y sistemas de ecuaciones lineales · 51

Demostración. Como Mrank(A) = 0, entonces AnnR (Im (A)) = 0, y por tan-


to, Im (A) ≠ 0. Existe entonces al menos una submatriz A′ de A de orden
m × m con determinante no nulo. Reindexando las columnas y las indeter-
minadas x1 , . . . , xn , podemos asumir, sin pérdida de generalidad, que
 a11 · · · a1m 
A′ =  ... ..  ,

 .. r1 := det(A′) ≠ 0.
 . . 
 am1 · · · amm 

Entonces,
det(A′) · · · 0   b1   b1 
 .. ..  ..   .. 
     
.. 
 .  = A′ Adj(A′) .,
 .
 . . 
    
 0
 ··· det(A′)  bm 
 
bm 
 
y por tanto,
r1 · · ·  b1 
0   (−1) 1+1 M11 · · · (−1) m+1 Mm1   b1 
 .. . .  .. ..  .. ..   .. 
     
 .  =A′ 
 ..
.
 .   .  . . . .
 
0 · · · bm r1  1+m
 (−1) M1m · · · (−1) m+m Mmm  bm 
   
 (−1) 1+1 b1 M11 + · · · + (−1) m+1 bm Mm1 
..
 
=A′ 
 
 . 

1+m
 (−1) b1 M1m + · · · + (−1) m+m bm Mmm 

 x1 
 1
=A′  ...  ,
 
 
x 1 
 m
con x 1j ∈ Im∗ (A | B); así r1 bi = mj=1 ai j x 1j para 1 ≤ i ≤ m. Tomando
Í
1
xm+1 = · · · = xn1 = 0 obtenemos
n
∑︁
r1 bi ai j x 1j , 1 ≤ i ≤ m.
j=1

Sean r1 , . . . , rk los generadores de Im (A). De manera análoga a como lo


hicimos antes, tenemos
n
∑︁
rt bi = ai j x tj , 1 ≤ i ≤ m, 1 ≤ t ≤ k,
j=1

con x tj ∈ Im∗ (A | B). Por hipótesis, existen q1 , . . . , qk ∈ J tales que


k
∑︁
s= qt rt .
t=1
52 · Determinantes y sistemas de ecuaciones lineales

Entonces,
k k ∑︁
n n k
!
∑︁ ∑︁ ∑︁ ∑︁
sbi = qt rt bi = qt ai j x tj = ai j qt x tj .
t=1 t=1 j=1 j=1 t=1

Pero
k
∑︁
qt x tj ∈ J Im∗ (A | B) ⊆ ⟨s⟩.
t=1
Por lo tanto,
n
∑︁
sbi = ai j s xej , xej ∈ R, 1 ≤ i ≤ m,
j=1

y como s no es divisor de cero tenemos que


n
∑︁
bi = ai j xej . ✓

j=1

Corolario 2.4.9. Sea A ∈ Mm×n (R), con m ≤ n. Si Im (A) = R, entonces


AX = B es soluble.
Demostración. Im (A) = R implica que Mrank(A) = m. Tomando J = R y
s = 1 en la proposición 2.4.8, el corolario se sigue de inmediato. ✓

Evidentemente el recíproco no es siempre cierto: basta considerar el sis-


tema homogéneo sobre el anillo ℤ de enteros
    
1 0 x 0
= .
0 0 y 0
Definición 2.4.10. Sea A ∈ Mm×n (R). A se dice unimodular si

Imı́n{m,n } (A) = R.

Corolario 2.4.11. Sea A ∈ Mm×n (R).


(i) Sea m ≤ n. A es unimodular si, y sólo si, A tiene inversa a derecha.

(ii) Sea n ≤ m. A es unimodular si, y sólo si, A tiene inversa a izquierda.


Demostración. (i) ⇒): como m ≤ n, entonces mı́n{m, n} = m; así Im (A) = R,
y por el corolario 2.4.9, tenemos que
1 0
   
0 0
AX =  .  , . . . , AX =  . 
   
 ..   .. 
   
0 1
   
Determinantes y sistemas de ecuaciones lineales · 53

son solubles, luego existen

c11  c1m 
C 1 =  ...  , . . . , C m =  ...  ∈ R n
   
   
   
cn1  cnm 
   

tales que A[C 1 · · · C m ] = E, es decir, si C = [C 1 · · · C m ], entonces C es una


inversa derecha de A.
⇐): si AC = E para alguna C ∈ Mn×m (R), entonces

Im (AC) = Im (E) = R ⊆ Im (A) ∩ Im (C),

y por tanto, Im (A) = R, es decir, A es unimodular dado que mı́n{m, n} = m.


(ii) Sea n ≤ m. Como A ∈ Mm×n (R), entonces AT ∈ Mn×m (R); así,
AT tiene inversa a derecha si, y sólo si, In (AT ) = R, es decir, si existe
D ∈ Mm×n (R) tal que AT D = E. Esto último se tiene si, y sólo si, In (A) = R,
dado que In (A) = In (AT ). Por lo tanto, DT A = E si, y sólo si, A es unimo-
dular. ✓

Observación 2.4.12. (i) Sea A ∈ Mm×n (R), con m ≤ n. Entonces A no


puede tener inversa a izquierda: si C ∈ Mn×m (R) es tal que C A = E, enton-
ces  
  A
C 0 = E,
0

y tomando determinantes resulta 0 = 1.


(ii) Sea A ∈ Mm×n (R) con n ≤ m. Entonces A no puede tener inversa a
derecha: si C ∈ Mm×n (R) es tal que C A = E, entonces
 
  C
A 0 = E,
0

y tomando determinantes resulta 0 = 1.

Estudiaremos ahora los sistemas homogéneos de la forma AX = 0, con


A ∈ Mm×n (R). Nótese en primer lugar que tales sistemas son solubles y que
el conjunto de soluciones conforman un subespacio de Mn×1 (R)  R n .

Teorema 2.4.13. Sea A ∈ Mm×n (R). El sistema homogéneo AX = 0 tiene


solución no trivial X = [x1 , . . . , xn ]T si, y sólo si, Mrank(A) < n. En particular,
si m < n, entonces el sistema AX = 0 tiene solución no trivial.
54 · Determinantes y sistemas de ecuaciones lineales

Demostración. ⇒): sea X = [x1 . . . , xn ]T una solución no trivial del sistema


AX = 0; luego x j ≠ 0 para algún subíndice j, 1 ≤ j ≤ n. Si m < n, tenemos
que Mrank(A) ≤ m < n, y no hay nada por probar. Sea entonces m ≥ n; de
este modo
x1   a11 · · · a1n 
A′  ...  = 0, con A′ =  ... ..  .
   
   ..
   . . 
 xn   an1 · · · ann 
   
Multiplicando por Adj(A′) obtenemos

det(A′)x j = 0. (4.5)

Nótese que si A′ es cualquier submatriz de A de tamaño n×n, entonces tam-


bién se tiene (4.5) ; en otras palabras, x j ≠ 0 anula a todos los generadores
de In (A). Por lo tanto, AnnR (In (A)) ≠ 0, y así, Mrank(A) < n.
⇐): supongamos que t := Mrank(A) < n; entonces AnnR (It+1 (A)) ≠ 0.
Sea y ≠ 0 ∈ R tal que It+1 (A)y = 0; si t = 0 entonces X := [y, . . . , y] es una
solución no trivial del sistema. Supongamos entonces que
1 ≤ t ≤ mı́n{m, n}; como AnnR (It (A)) = 0, el producto de y con algún
generador de It (A) es no nulo. Este generador es el determinante de una
submatriz de A de orden t × t. Permutando filas o columnas de A y reindi-
zando las indeterminadas, podemos asumir sin pérdida de generalidad que
tal submatriz es
 a11 · · · a1t 
A  ... ..  ,


 .. y(det(A′)) ≠ 0.
 . . 
 at1 · · · att 

Sea A′′ la matriz
 a11 · · · a1,t+1 
A′′ :=  ... ..
 
 .. 
 . . 

 at+1,1 · · · at+1,t+1 

(si t = m, tomamos at+1,1 = · · · = at+1,t+1 = 0). Sea d j el determinante de
la submatriz de A′′ obtenida al suprimir la última fila y la j-ésima columna,
1 ≤ j ≤ t + 1; sean además

h j := (−1) j+(t+1) d j , 1 ≤ j ≤ t+1


xej := h j y, 1 ≤ j ≤ t+1
xej := 0, t + 2 ≤ j ≤ n
e := [ xe1 , . . . , xen ]T .
X
Determinantes y sistemas de ecuaciones lineales · 55

Nótese que X
e ≠ 0 ya que xg ′
t+1 = y det(A ) ≠ 0; se tiene entonces que

t+1
 ∑︁ 
a1 j xej 
 

 
 j=1 

AX = 
e  .
..

.

 t+1 
∑︁ 

 am j xej 
 j=1 
 
Pero para 1 ≤ i ≤ m,

t+1
∑︁ t+1 t+1 t+1
©∑︁ ©∑︁ ©∑︁
ai j xej = ­ ai j h j ® y = ­ ai j (−1) j+(t+1) d j ® y = ­ ′′
ai j At+1, j ® y.
ª ª ª
j=1 « j=1 ¬ « j=1 ¬ « j=1 ¬
Para i ≠ t + 1, la suma en el último paréntesis es nula; para i = t + 1 es-
ta suma corresponde al determinante de una submatriz de A de tamaño
(t+1)×(t+1), es decir, es un generador de It+1 (A). Como y ∈ AnnR (It+1 (A)),
entonces AXe = 0 y el sistema tiene una solución no trivial. ✓

Corolario 2.4.14. Sea A ∈ Mn (R). AX = 0 tiene solución no trivial si, y sólo


si, det(A) es un divisor de cero en R.

Demostración. Por resultados anteriores, sabemos que det(A) es un divisor



de cero en R si, y sólo si, AnnR (In (A)) ≠ 0 si, y sólo si, Mrank(A) < n. □

Corolario 2.4.15. SeaV un R-espacio libre de dimensión m ≥ 1. Entonces, todo


conjunto de n > m vectores de V es linealmente dependiente.

Demostración. Sean Y := {y1 , . . . , ym } una base de V , v1 , . . . , vn ∈ V y


b1 , . . . , bn ∈ R tales que v1 · b1 + · · · + vn · bn = 0. Entonces, existen escalares
ai j ∈ R tales que (a11 ·y1 +· · ·+am1 ·ym ) ·b1 +· · ·+(a1n ·y1 +· · ·+amn ·ym ) ·bn = 0.
De la independencia lineal de los vectores de Y resulta el sistema AB = 0,
con A ∈ Mm×n (R) y B := [b1 , . . . , bn ]T . Según el teorema 2.4.13, algún b j
es no nulo. ✓

Ejemplo 2.4.16. Calculemos rank(A) y Mrank(A) para


     
2 2 2 0 1 2
A= ,B= ,C = ∈ M2 (ℤ6 ).
0 2 0 3 3 5

(i) Tenemos I0 (A) = ℤ6 , I1 (A) = ⟨2⟩ e I2 (A) = ⟨2⟩. Así rank(A) = 2.


Ahora, Ann(I0 (A)) = 0, Ann(I1 (A)) = {0, 3} = ⟨3⟩ y Ann(I2 (A)) = ⟨3⟩.
Luego Mrank(A) = 0.
56 · Determinantes y sistemas de ecuaciones lineales

(ii) Tenemos I0 (B) = ℤ6 , I1 (B) = ⟨2, 3⟩ = ℤ6 , pues 3 − 2 = 1 ∈


I1 (B), e I2 (B) = 0. Entonces rank(B) = 1. Por otro lado, Ann(I0 (B)) = 0,
Ann(I1 (B)) = 0 y Ann(I2 (B)) = ℤ6 . Por lo tanto Mrank(B) = 1.
(ii) I0 (C) = ℤ6 , I1 (C) = ⟨1, 2, 3, 5⟩ = ℤ6 e I2 (C) = ⟨−1⟩ = ⟨1⟩ = ℤ6 .
Entonces rank(C) = 2 = Mrank(C).

Ejemplo 2.4.17. Sea R = ℤ4 . Calculemos todas las soluciones de AX = B,


con
1 1 1  1
   
A = 2 1 2 y B = 2 .
 
1 0 2  3
   
Tenemos,
   
1 1 1 1
det(A) = 1 det + 2 det = (2 − 1) + 2(1 − 2) = −1 = 3,
1 2 2 1
1 1 1 
 
det 2 1 2 = 3 + 2(−1) = 1,
3 0 2 
 
1 1 1 
 
det 2 2 2 = 0,
1 3 2 
 
1 1 1 
 
det 2 1 2 = 1 + 3(−1) = −2 = 2,
1 0 3 
 
entonces

3x1 = 1 ⇒ x1 = 3,
3x2 = 0 ⇒ x2 = 0,
3x3 = 2 ⇒ x3 = 2.

En consecuencia
3
 
X = 0
2
 
es la única solución del sistema.

A continuación haremos la comparación de algunos de los resultados de


esta sección con los correspondientes del álgebra lineal clásica sobre cuer-
pos.
Determinantes y sistemas de ecuaciones lineales · 57

Definición 2.4.18. Sea 𝕂 un cuerpo y sea X = {x1 , . . . , xn } un conjunto


finito de vectores de un 𝕂-espacio vectorial V . Se define el rango de X,
denotado por Rank(X), como la dimensión de su envolvente lineal, es decir,

Rank(X) := dim⟨X⟩.

Recordemos algunas propiedades destacadas del rango:

(i) Rank(X) coincide con el máximo número de vectores linealmente


independiente que posea X. Nótese también que Rank(X) concuer-
da con el número minimal de generadores de ⟨X⟩ (véase el teorema
2.3.8).

(ii) Si V es un 𝕂-espacio de dimensión n y X es un sistema de n vectores


de V , entonces X es una base de V si, y sólo si, Rank(X) = n.

(iii) El rango columna de una matriz F ∈ Mm×n (𝕂) se define como el ran-
go de sus vectores columna: cada columna de F se puede considerar
como un elemento de 𝕂 m , y de esta forma,

rango columna de F := Rank{F (1) , . . . , F (n) }.

(iv) El rango columna de F coincide con la dimensión del espacio imagen


de la transformación f que F representa.

(v) De manera análoga se define el rango fila de la matriz F , el cual coin-


cide con el rango columna. Este rango común se denomina rango
de la matriz F y se denota por Rank(F ). En particular, se tiene que
Rank(F ) = Rank(F T ).

(vi) F ∈ Mn (𝕂) es invertible si, y sólo si, Rank(F ) = n.

(vii) Sean F ∈ Mm×n (𝕂), Q ∈ GLm (𝕂) y P ∈ GLn (𝕂). Entonces,

Rank(QF P) = Rank(F ).

(viii) Dos matrices son equivalentes si, y sólo si, tienen el mismo rango.

Proposición 2.4.19. Sea 𝕂 un cuerpo. Para cada A ∈ Mm×n (𝕂) se cumple

0 ≤ Mrank(A) = rank(A) = Rank(A).


58 · Determinantes y sistemas de ecuaciones lineales

Demostración. Si k = rank(A), Ik (A) ≠ 0, Ik+1 = 0, luego Ann𝕂 (Ik (A)) = 0


y Ann𝕂 (Ik+1 (A)) = 𝕂, con lo cual Mrank(A) = k. Sea ahora Rank(A) = r,
entonces A es equivalente a la matriz
 
E 0
B= , E = idéntica de orden r × r.
0 0

Por la proposición 2.4.7, rank(A) = rank(B) = r; así, r = k. ✓


En relación con los sistemas de ecuaciones lineales sobre cuerpos, se tienen


los siguientes resultados.
(a) Sea AX = 0 un sistema homogéneo de orden m × n. Si Rank(A) = r,
entonces la dimensión del espacio solución es n −r, y recíprocamente.

(b) Todo sistema lineal AX = B de orden m ×n, con A ≠ 0, es equivalente


a uno con matriz escalonada y de la forma

a1′ j1 x j1 + a1′ j2 x j2 + a1′ j3 x j3 + · · · + a1n



xn = b1′
a2′ j2 x j2 + a2′ j3 x j3 + · · · + a2n

xn = b2′
..
.
ar′ jr x jr + · · · + arn

xn = br′

0 = br+1
..
.
0 = bm′ ,

con a1′ j , . . . , ar′ jr ≠ 0, para 1 ≤ j1 < j2 < · · · < jr . AX = B es soluble


1
si, y sólo si, en el sistema escalonado anterior no se presentan ecua-
ciones de la forma bt′ = 0, t ≥ r, con bt′ un elemento no nulo de 𝕂. En
tal caso, dando valores arbitrarios de 𝕂 a las indeterminadas libres
x jr +1 , . . . , xn obtenemos valores determinados para las indetermina-
das principales x j1 , . . . , x jr .

(c) Sea AX = B un sistema lineal de orden m × n. En el corolario 2.4.9 se


demostró que si m ≤ n, con Im (A) = 𝕂, entonces el sistema AX = B es
soluble. Pero la condición Im (A) = 𝕂 es equivalente a que
Mrank(A) = m = Rank(A). De este modo, si Rank(A) = m, el sistema
AX = B es soluble.

(d) Respecto a los ideales determinantes de A y de la matriz ampliada


[A | B] se tiene que la coincidencia de estos últimos implica la so-
lubilidad del sistema AX = B: en efecto, si los ideales determinantes
Determinantes y sistemas de ecuaciones lineales · 59

de A y [A | B] coinciden, entonces sus rangos son iguales. De esta


forma, la envolvente lineal de las columnas de [A | B] coincide con
la envolvente lineal de las columnas de A, es decir, B es una combi-
nación lineal de las columnas de A,
 b1   a11   a1n 
 ..   ..   .. 
     
 .  =  .  x1 + · · · +  .  xn ,
     
bm   am1   amn 
     

de donde B = AX y X = [x1 , . . . , xn ]T es solución. En resumen,


AX = B es soluble si, y sólo si, Rank(A) = Rank[A | B].

(e) Si A ∈ Mm×n (𝕂), vimos en el teorema 2.4.13 que AX = 0 tiene


solución no trivial si, y sólo si, Rank(A) < n. En particular, si m < n
entonces Rank(A) ≤ m < n, y el sistema AX = 0 tiene solución no
trivial. Para el caso cuadrado, la condición det(A) es divisor de cero
(véase el corolario 2.4.14) es equivalente a que det(A) = 0.

5. Ejercicios
1. Sea A0 la colección de elementos de A que son divisores de cero. Si
𝕂 es un cuerpo demuestre que

Mn (𝕂) 0 = {B ∈ Mn (𝕂) | det(B) = 0}.

2. Sean B ∈ Mm×p (R) y C ∈ Mp×n (R). Demuestre que

(i) Mrank(BC) ≤ mı́n{Mrank(B), Mrank(C)}.


(ii) rank(BC) ≤ mı́n{rank(B), rank(C)}.

3. Sean A ∈ Mn (R) y B ∈ R n . Sea X0 una solución de AX = B. De-


muestre que X0 es la única solución si, y sólo si, Mrank(A) = n.

4. Demuestre la proposición 2.2.5.


Capítulo
tres
Producto tensorial
Producto tensorial · 63

En este capítulo estudiamos el producto tensorial de espacios, transforma-


ciones y matrices sobre anillos conmutativos. Definiremos los tensores y es-
tableceremos su relación con las funciones multilineales. El producto tenso-
rial de tensores también será considerado. Salvo que se advierta lo contrario,
R denotará un anillo conmutativo arbitrario. Para los espacios vectoriales
utilizaremos la notación por la izquierda para los escalares de R.

1. Producto tensorial de espacios vectoriales


Sea V un R-espacio vectorial libre con base X, recordemos que cada fun-
ción t : X −→ W , con W un R-espacio arbitrario, se puede extender de
manera única a una transformación lineal T : V −→ W de tal forma que
T (x) = t(x), para cada x ∈ X. De otra parte, si X es un conjunto no va-
cío cualquiera, entonces R (X) denota el R-espacio libre con base canónica
X ′ := { 𝜇 x (1)} x ∈X , donde 𝜇 x : R −→ R (X) es la inyección canónica de la
suma directa externa (véase [24]) de tal forma que 𝜇 x (1) := (rz ) z ∈X , con
(
0, si z ≠ x,
rz =
1, si z = x.

Podemos ya emprender la construcción del producto tensorial de dos


espacios vectoriales arbitrarios.
Sean U , V dos espacios vectoriales sobre R y sea X el producto cartesiano
de los conjuntos U y V , es decir, X := U × V . Notemos que en el conjunto
X hemos olvidado las estructuras de R-espacio que tienen U y V , pues a
estos últimos los estamos tomando simplemente como conjuntos no vacíos.
Consideremos entonces el R-espacio vectorial R (X) con base canónica X ′ =
{ 𝜇 x (1)} x ∈X . Notemos que los elementos de X son parejas ordenadas, es
decir, un elemento x ∈ X es de la forma x = (u, v). En otras palabras,
𝜇 x (1) = 𝜇 (u,v) (1) denota el arreglo que tiene solamente una entrada no
nula, la ubicada en la “posición (u, v)”, en la cual colocamos el escalar 1 ∈ R.
Por tanto, un elemento de R (X) es una combinación lineal finita en la forma

r1 · 𝜇 (u1 ,v1 ) (1) + · · · + rt · 𝜇 (ut ,vt ) (1),

para algunos u1 , . . . , ut ∈ U y v1 , . . . , vt ∈ V . Observemos que el elemen-


to anterior es un arreglo finito que tiene ubicados en la posición (u1 , v1 ) al
escalar r1 , en la posición (u2 , v2 ) al escalar r2 y, por último, en la posición
(ut , vt ) al escalar rt ; en todas las demás posiciones se encuentra el escalar
cero. Esta notación puede ser simplificada de la siguiente manera: represen-
temos el elemento 𝜇 (u,v) (1) de la base canónica X simplemente por (u, v),
64 · Producto tensorial

de tal forma que se interprete a U × V como la base canónica de R (X) y


a las parejas (u, v) como los elementos de esta base. Así, podemos pensar
en R (U ×V ) y considerar que la base canónica es U × V . Con esta notación,
podemos decir que un elemento de R (U ×V ) es una combinación lineal finita
en la forma
r1 · (u1 , v1 ) + · · · + rt · (ut , vt ),
donde r1 , . . . , rt ∈ R, u1 , . . . , ut ∈ U y v1 , . . . , vt ∈ V .
Sea S el subespacio de R (U ×V ) generado por todos los elementos de la
siguiente forma

(u + u ′ , v) − (u, v) − (u ′ , v) , (1.1)
′ ′
(u, v + v ) − (u, v) − (u, v ) , (1.2)
r · (u, v) − (r · u, v) , (1.3)
r · (u, v) − (u, r · v) , (1.4)

con r ∈ R, u, u ′ ∈ U y v, v ′ ∈ V . Sea U ⊗ V el R-espacio vectorial cociente


correspondiente, es decir,

U ⊗ V := R (U ×V ) /S.

Denotemos por u ⊗ v la clase de equivalencia (u, v) en el cociente U ⊗ V .


Entonces en U ⊗ V se tienen las siguientes propiedades fundamentales.

Proposición 3.1.1. Para cualesquiera elementos u, u ′ ∈ U , v, v ′ ∈ V y r ∈ R


se tiene que:

(i) (u + u ′) ⊗ v = u ⊗ v + u ′ ⊗ v.

(ii) u ⊗ (v + v ′) = u ⊗ v + u ⊗ v ′.

(iii) r · (u ⊗ v) = r · u ⊗ v.

(iv) r · (u ⊗ v) = u ⊗ r · v.

Demostración. Inmediato de las relaciones (1.1) -(1.4) . ✓


Corolario 3.1.2. La función canónica

t : U × V −→ U ⊗ V
(u, v) ↦−→ u ⊗ v

es bilineal, es decir, para cualesquiera u, u ′ ∈ U , v, v ′ ∈ V y r ∈ R, se satisface:

(i) t (u + u ′ , v) = t(u, v) + t(u ′ + v).


Producto tensorial · 65

(ii) t(u, v + v ′) = t(u, v) + t(u, v ′).

(iii) t(r · u, v) = r · t(u, v).

(iv) t(u, r · v) = r · t(u, v).

Demostración. Consecuencia directa de la proposición anterior. ✓


Definición 3.1.3. El espacio vectorial U ⊗ V se denomina producto tenso-


rial de U con V .

Si z es un elemento de U ⊗ V , con z ∈ R (U ×V ) , entonces z es de la forma


z = r1 · (u1 , v1 ) +· · ·+rt · (ut , vt ), y por tanto en el cociente U ⊗V = R (U ×V ) /S
se tiene que
z = (r1 · u1 ) ⊗ v1 + · · · + (rt · ut ) ⊗ vt ,
pero como r1 · u1 , . . . , rt · ut ∈ U , entonces podemos siempre asumir que z
es de la forma
u1 ⊗ v1 + · · · + ut ⊗ vt .
El producto tensorial tiene la siguiente propiedad universal.

Teorema 3.1.4 (Propiedad universal del producto tensorial) . Sea W un


R-espacio y sea f : U ×V −→ W una funcion bilineal. Entonces, existe una única
transformación lineal F : U ⊗ V −→ W tal que F t = f :
t - U ⊗V
U ×V
pp
pp
pp
f
p pp
pp
?+ F

La transformación lineal F se define por

F (u ⊗ v) := f (u, v).

Demostración. La función f , definida sobre la base canónica U ×V de R (U ×V ) ,


induce una única transformación lineal F ′ : R (U ×V ) −→ W , dada por
F ′ (u, v) := f (u, v). Definimos entonces la función F (z) := F ′ (z), con
z ∈ R (U ×V ) . En particular, si z = (u, v) es un básico, entonces

F (u ⊗ v) = F ′ (u, v) = f (u, v).

F está bien definida: en efecto, sean z1 , z2 ∈ R (U ×V ) tales que z1 = z2 ,


entonces z1 − z2 ∈ S, y por tanto, z1 − z2 es una R-combinación lineal de
66 · Producto tensorial

elementos como en (1.1) -(1.4) . Como F ′ es R-lineal, basta considerar cada


una de las cuatro relaciones por separado. Si

z1 − z2 = (u + u ′ , v) − (u, v) − (u ′ , v) ,

entonces

F ′ (z1 − z2 ) = F ′ [(u + u ′ , v) − (u, v) − (u ′ , v)]


= f (u + u ′ , v) − f (u, v) − f (u ′ , v)
= 0,

ya que f es bilineal. De igual manera se establecen los otros tres casos. Esto
muestra que F ′ (z1 ) = F ′ (z2 ), y así F está bien definida.
De otra parte, como F ′ es R-lineal, entonces F es una transformación
lineal. Además, F t(u, v) = F (u ⊗ v) = f (u, v), lo que prueba que F t = f .
Para la unicidad, sea G otra transformación lineal G : U ⊗ V −→ W tal
que Gt = f ; para probar la igualdad G = F basta considerar el vector u ⊗ v.
Así, Gt (u, v) = f (u, v), es decir, G (u ⊗ v) = f (u, v) = F (u ⊗ v). ✓

Algunas consecuencias del teorema anterior son las siguientes propieda-


des elementales del producto tensorial.

Corolario 3.1.5. Sean U , V y W R-espacios. Entonces:

(i) (U ⊗ V ) ⊗ W  U ⊗ (V ⊗ W ).

(ii) U ⊗ V  V ⊗ U .

(iii) R ⊗ V  V , U ⊗ R  U , R ⊗ R  R.

Demostración. (i) y (ii) quedan como ejercicios al lector.


(iii) Basta considerar la función bilineal f : R × V −→ V definida por
f (r , v) := r · v, que induce la transformación lineal F : R ⊗ V −→ V
dada por F (r ⊗ v) := r · v. De otra parte, la función G : V −→ R ⊗ V ,
definida por G (v) := 1 ⊗ v, es una transformación lineal tal que FG = iV
y GF = iR⊗V . El segundo isomorfismo se establece en forma similar, y el
tercero es consecuencia de cualquiera de los dos anteriores. ✓

Por la parte (i) del resultado anterior, el producto tensorial de tres espa-
cios se puede entonces denotar como U ⊗ V ⊗ W . Más adelante conside-
raremos el producto tensorial de tres o más espacios y su relación con las
funciones multilineales introducidas en el capítulo 2.
Consideremos el caso particular en que U y V son libres de dimensión
finita.
Producto tensorial · 67

Teorema 3.1.6. Sean U y V dos espacios vectoriales libres de dimensión finita n


y m con bases X = {x1 , . . . , xn } y Y = {y1 , . . . , ym }, respectivamente. Entonces,

X ⊗ Y := {xi ⊗ y j | 1 ≤ i ≤ n, 1 ≤ j ≤ m}

es una base de U ⊗ V , y en consecuencia, dimR (U ⊗ V ) = nm.

Demostración. Notemos en primer lugar que si U = 0 ó V = 0, entonces el


teorema se tiene en forma trivial con bases vacías. Sean n, m ≥ 1. Conside-
remos el R-espacio de matrices rectangulares Mn×m (R) con componentes
en R. Definimos entonces la transformación lineal

T : Mn×m (R) −→ U ⊗ V
Ei j ↦−→ xi ⊗ y j , 1 ≤ i ≤ n, 1 ≤ j ≤ m.

De otra parte, consideremos la función

f : U × V −→ Mn×m (R),
f (u, v) = a1 b1 E11 + · · · + a1 bm E1m + · · · + an b1 En1 + · · · + an bm Enm ,

con u = a1 · x1 + · · · + an · xn y v = b1 · y1 + · · · + bm · ym . Es fácil ver que f


es bilineal. Por el teorema 3.1.4, existe entonces una transformación lineal
F : U ⊗ V −→ Mn×m (R) definida por

F (u ⊗ v) = f (u, v) = a1 b1 E11 + · · · + a1 bm E1m + · · · + an b1 En1 + · · · + an bm Enm .

Pero notemos que FT = iMn×m (R) , y también, T F = iU ⊗V . Esto demuestra


que T es un isomorfismo de espacios vectoriales, con lo cual X ⊗ Y es una
base de U ⊗ V y dimR (U ⊗ V ) = nm. ✓

Corolario 3.1.7. Sea R un dominio de integridad y sean U , V , X , Y como en el


teorema 3.1.6. Para cualesquiera elementos u ∈ U y v ∈ V se tiene que

u ⊗ v = 0 ⇔ u = 0 ó v = 0.

Demostración. La condición suficiente se tiene en forma trivial. Por otro la-


do, sean u = a1 · x1 + · · · + an · xn y v = b1 · y1 + · · · + bm · ym no nulos, entonces
existen i0 , j0 tales que ai0 ≠ 0 y b j0 ≠ 0; puesto que
n,m
∑︁
u⊗v = ai b j · (xi ⊗ y j ),
i=1, j=1

entonces, del teorema 3.1.6, resulta u ⊗ v ≠ 0 ya que ai0 b j0 ≠ 0. ✓



68 · Producto tensorial

2. Producto tensorial de transformaciones y


matrices
Sean T : U −→ U ′ y F : V −→ V ′ dos transformaciones lineales, entonces
la función

T × F : U × V −→ U ′ ⊗ V ′
(u, v) ↦−→ T (u) ⊗ F (v)

es bilineal y por tanto induce una transformación lineal

T ⊗ F : U ⊗ V −→ U ′ ⊗ V ′
u ⊗ v ↦−→ T (u) ⊗ F (v).

La transformación T ⊗ F se conoce como el producto tensorial de T con


F . Se tiene entonces la siguiente propiedad.

Teorema 3.2.1. Sean X = {x1 , . . . , xn } una base de U , X ′ = {x1′ , . . . , xp′ }


una base de U ′, Y = {y1 , . . . , ym } una base de V y Y ′ = {y1′ , . . . , yq′ } una base
de V ′. Entonces,
 a11 B · · · a1n B
mX ⊗Y , X ′ ⊗Y ′ (T ⊗ F ) =  ... ..  ,

 ..
 . . 
 ap1 B · · · apn B 

con A = [ai j ] := mX , X ′ (T ) y B = [bi j ] := mY ,Y ′ (F ). La matriz de T ⊗ F se
conoce como el producto tensorial de las matrices A y B, y se denota por A ⊗ B.
Así,
 a11 B · · · a1n B
A ⊗ B :=  ... ..  .
 
 ..
 . . 
 ap1 B · · · apn B 
 
A ⊗ B es de orden pq × nm.

Demostración. Basta aplicar T ⊗ F a los vectores de la base X ⊗ Y y expresar


los resultados a través de la base X ′ ⊗ Y ′. ✓

Ejemplo 3.2.2. Sean T : ℝ3 −→ ℝ2 y F : ℝ2 −→ ℝ4 las transformaciones


lineales definidas por

T (x, y, z) = (2x + 3y, 3x + 4z),


F (x, y) = (x, x + y, y, y − x).
Producto tensorial · 69

Determinemos la matriz de T ⊗ F en las bases canónicas: basta calcular las


matrices A y B de las transformaciones T y F en las bases canónicas:
1 0
  
2 3 0 1 1
A = m(T ) = , B = m(F ) =  ,
3 0 4 0 1
−1
 1
2 0 3 0 0 0

2 2 3 3 0 0

0 2 0 3 0 0
  
2B 3B 0B −2 2 −3 3 0 0

m(T ⊗ F ) = A ⊗ B = = .
3B 0B 4B 3 0 0 0 4 0
 
3 3 0 0 4 4

0 3 0 0 0 4

−3 3 0 0 −4 4

Mostraremos a continuación otras propiedades interesantes del producto
tensorial de transformaciones y matrices:
(i) Sean T : U −→ U ′ y F : V −→ V ′ transformaciones lineales sobre-
yectivas. Entonces, T ⊗ F es sobreyectiva. En efecto, si u ′ ⊗ v ′ ∈ U ′ ⊗ V ′,
entonces existe u ∈ U y v ∈ V tales que T (u) = u ′ , F (v) = v ′. Por lo tanto,
(T ⊗ F ) (u ⊗ v) = T (u) ⊗ F (v) = u ′ ⊗ v ′.
(ii) Sean T : U −→ U ′ y F : V −→ V ′ transformaciones lineales so-
breyectivas, entonces ker(T ⊗ F ) = ker(T ) ⊗ V + U ⊗ ker(F ). Veamos la
demostración: denotemos por W := ker(T ) ⊗ V + U ⊗ ker(F ), este es un
subespacio de U ⊗ V . Es claro que W ⊆ ker(T ⊗ F ), probemos entonces la
otra inclusión. Consideremos el espacio cociente (U ⊗ V )/W y la transfor-
mación lineal canónica

J : U ⊗ V −→ (U ⊗ V )/W
z ↦−→ z.

Para el producto tensorial U ′ ⊗ V ′ consideremos el siguiente diagrama:


t - U′ ⊗V ′
U′ ×V ′
pp
p pp
p
h pp
p pp H
? +
(U ⊗ V ) /W

con h(T (u), F (v)) := J (u ⊗ v). Veamos que h está bien definida. Sean
T (u1 ) = T (u) y F (v1 ) = F (v), entonces u1 − u := u2 ∈ ker(T ) y
70 · Producto tensorial

v1 − v := v2 ∈ ker(F ), luego

u1 ⊗ v1 = (u + u2 ) ⊗ (v + v2 )
= u ⊗ v + u ⊗ v2 + u2 ⊗ v + u2 ⊗ v2
= u ⊗ v + (u ⊗ v2 + u2 ⊗ v + u2 ⊗ v2 ) ,

donde u ⊗ v2 + u2 ⊗ v + u2 ⊗ v2 ∈ U ⊗ ker(F ) + ker(T ) ⊗V = W , esto muestra


que
u1 ⊗ v1 − u ⊗ v ∈ W ,

luego J (u ⊗ v) = J (u1 ⊗ v1 ). Notemos que h es bilineal, por tanto induce la


transformación lineal H dada por

H (T (u) ⊗ F (v)) := h(T (u), F (v)) = J (u ⊗ v),

de donde H (T ⊗ F ) = J . Sea z ∈ ker(T ⊗ F ), entonces

H (T ⊗ F ) (z) = H (0) = 0 = J (z) = z,

lo cual indica que z ∈ W .


(iii) Sean T1 : U −→ U ′, T2 : U ′ −→ U ′′, F1 : V −→ V ′ y F2 : V ′ −→ V ′′
transformaciones lineales, entonces

(T2T1 ) ⊗ (F2 F1 ) = (T2 ⊗ F2 )(T1 ⊗ F1 ).

En forma matricial,

A2 A1 ⊗ B2 B1 = (A2 ⊗ B2 )(A1 ⊗ B1 ).

(iv) Si iU : U −→ U es la idéntica de U e iV : V −→ V es la idéntica de


V , entonces
iU ⊗ iV = iU ⊗V .

En forma matricial,
En ⊗ Em = Enm .

(v) Sean T : U −→ U ′ y F : V −→ V ′ transformaciones lineales biyecti-


vas, entonces
(T ⊗ F ) −1 = T −1 ⊗ F −1 .

Matricialmente,
(A ⊗ B) −1 = A−1 ⊗ B−1 .
Producto tensorial · 71

(vi) Sean T , F1 y F2 transformaciones lineales compatibles para las ope-


raciones indicadas, entonces

T ⊗ (F1 + F2 ) = T ⊗ F1 + T ⊗ F2 .

En forma matricial,

A ⊗ (B1 + B2 ) = A ⊗ B1 + A ⊗ B2 .

En forma similar se tienen las distributivas por el lado derecho.


(vii) Sean T : U −→ U ′ y F : V −→ V ′ transformaciones lineales y sea
a ∈ R, entonces

(a · T ) ⊗ F = T ⊗ (a · F ) = a · (T ⊗ F ).

En forma matricial,

(a · A) ⊗ B = A ⊗ (a · B) = a · (A ⊗ B).

(viii) Sean A ∈ Mn (R) y B ∈ Mm (R), entonces

tr(A ⊗ B) = tr(A) tr(B),


det(A ⊗ B) = det(A) m det(B) n .

(ix) Sean A, A′ ∈ Mn (R) y B, B ′ ∈ Mm (R) entonces

A ∼ A′ , B ∼ B ′ ⇒ A ⊗ B ∼ A′ ⊗ B ′;
A ≈ A′ , B ≈ B ′ ⇒ A ⊗ B ≈ A′ ⊗ B ′ .

3. Funciones multilineales y tensores


En el capítulo 2 consideramos funciones multilineales sobre un mismo es-
pacioV para establecer la teoría de determinantes (véase la definición 2.2.1).
Estudiaremos ahora la noción general de función multilineal y su relación
con el producto tensorial de tres o más espacios vectoriales. Comenzamos
con el dual de un espacio vectorial. Sea V un R-espacio, el conjunto de
transformaciones lineales HomR (V , R) es un R-espacio y se denomina el
espacio dual de V , denotado V ∗ . Para cuando V es libre de dimensión finita
se tiene la siguiente propiedad.
72 · Producto tensorial

Proposición 3.3.1. Sea V un R-espacio de dimensión finita n ≥ 1 con base


X := {x1 , . . . , xn }. Entonces, X ∗ := {x1∗ , . . . , xn∗ } es una base de V ∗ , denomi-
nada la base dual de X, con xi∗ (x j ) := 𝛿i j , donde 𝛿i j es el símbolo de Kronecker.
Además, para cada f ∈ V ∗ y cada v ∈ V se tiene que
n
∑︁ n
∑︁
f = f (xk ) · xk∗ y v= xk∗ (v) · xk .
k=1 k=1

Demostración. Este es un sencillo ejercicio para el lector. ✓


Definición 3.3.2. Sean V1 , . . . , Vn y W espacios vectoriales sobre el anillo


conmutativo R. Una función
f
V1 × · · · × Vn →
− W

es multilineal si es lineal en cada argumento, es decir, para 1 ≤ i ≤ n y


r ∈ R,

f (x1 , . . . , xi + xi′ , . . . , xn ) = f (x1 , . . . , xi , . . . , xn ) + f (x1 , . . . , xi′ , . . . , xn ),


f (x1 , . . . , r · xi , . . . , xn ) = r · f (x1 , . . . , xi , . . . , xn ).

Proposición 3.3.3. La colección M(V1 , . . . , Vn ;W ) de todas las funciones mul-


tilineales de V1 × · · · × Vn en W es un R-espacio vectorial respecto a las siguientes
operaciones:

( f + g)(x1 , . . . , xn ) := f (x1 , . . . , xn ) + g (x1 , . . . , xn ),


(r · f )(x1 , . . . , xn ) := r · f (x1 , . . . , xn ).

Demostración. Ejercicio para el lector. ✓


El producto tensorial de tres o más espacios V1 , . . . , Vn se puede cons-


truir en forma inductiva definiendo

V1 ⊗ · · · ⊗ Vn := (V1 ⊗ · · · ⊗ Vn−1 ) ⊗ Vn ,

o también, mediante las funciones multilineales, como veremos a continua-


ción: consideremos el cociente del R-espacio libre R (V1 ×···×Vn ) por el subes-
pacio S generado por todos los vectores de la forma

(x1 , . . . , xi + xi′ , . . . , xn ) − (x1 , . . . , xi , . . . , xn ) − (x1 , . . . , xi′ , . . . , xn ),


r · (x1 , . . . , xi , . . . , xn ) − (x1 , . . . , r · xi , . . . , xn ),

con 1 ≤ i ≤ n y r ∈ R. Este espacio cociente se denota por

V1 ⊗ · · · ⊗ Vn
Producto tensorial · 73

y se denomina producto tensorial de V1 , . . . , Vn . La clase del vector


(x1 , . . . , xn ) se denota por x1 ⊗ · · · ⊗ xn , y cada elemento de V1 ⊗ · · · ⊗Vn es
una suma finita de elementos de esta forma. La función canónica definida
por

t : V1 × · · · × Vn −→ V1 ⊗ · · · ⊗ Vn
(x1 , . . . , xn ) ↦−→ x1 ⊗ · · · ⊗ xn

es multilineal. Esto en particular quiere decir que

x1 ⊗ · · · ⊗ (xi + xi′) ⊗ · · · ⊗ xn = x1 ⊗ · · · ⊗ xi ⊗ · · · ⊗ xn + x1 ⊗ · · · ⊗ xi′ ⊗ · · · ⊗ xn ,

r · (x1 ⊗ · · · ⊗ xi ⊗ · · · ⊗ xn ) = x1 ⊗ · · · ⊗ r · xi ⊗ · · · ⊗ xn .
El producto tensorial V1 ⊗ · · · ⊗ Vn tiene la siguiente propiedad universal
(véase el teorema 3.1.4): sea W un R-espacio y sea f : V1 × · · · × Vn −→ W
una función multilineal. Entonces, existe una única transformación lineal
F : V1 ⊗ · · · ⊗ Vn −→ W tal que F t = f :
t
V1 × · · · × Vn - V1 ⊗ · · · ⊗ Vn
pp
ppp
p pp p p
ppp
f
p
ppp
F
?
W

La transformación lineal F se define por

F (x1 ⊗ · · · ⊗ xn ) := f (x1 , . . . , xn ).

El teorema 3.1.6 tiene también lugar en este caso general, es decir, el pro-
ducto tensorial de espacios libres de dimensión finita es libre y la dimensión
es el producto de las dimensiones. De manera más precisa, si Xi es una base
de Vi de tamaño ki , entonces

X := X1 ⊗ · · · ⊗ Xn := {x j1 ⊗ · · · ⊗ x jn | x ji ∈ Xi , 1 ≤ i ≤ n}

es una base de V1 ⊗ · · · ⊗ Vn de tamaño k1 · · · kn . Utilizando la notación


precedente, tenemos el siguiente resultado general válido para espacios ar-
bitrarios.

Teorema 3.3.4. M(V1 , . . . , Vn ;W )  HomR (V1 ⊗ · · · ⊗ Vn , W ).

Demostración. Según acabamos de ver, dada f ∈ M(V1 , . . . , Vn ;W ), existe


una única F ∈ HomR (V1 ⊗ · · · ⊗ Vn , W ) tal que F t = f , definimos enton-
ces 𝛼 : M(V1 , . . . , Vn ;W ) −→ HomR (V1 ⊗ · · · ⊗ Vn , W ) por 𝛼 ( f ) := F .
74 · Producto tensorial

Observemos que 𝛼 es una transformación lineal inyectiva. Además, dada


F ∈ HomR (V1 ⊗ · · · ⊗ Vn , W ), definimos f ∈ M(V1 , . . . , Vn ;W ) por

f (x1 , . . . , xn ) := F (x1 ⊗ · · · ⊗ xn );

es claro entonces que f ∈ M(V1 , . . . , Vn ;W ) y 𝛼 ( f ) = F . ✓


Corolario 3.3.5.

M(V1 , . . . , Vn ; R)  HomR (V1 ⊗ · · · ⊗ Vn , R) = (V1 ⊗ · · · ⊗ Vn ) ∗ .

Si V1 , . . . , Vn son libres de dimensión finita, entonces

(V1 ⊗ · · · ⊗ Vn ) ∗  V1∗ ⊗ · · · ⊗ Vn∗ .

Demostración. La primera afirmación es consecuencia directa del teorema


anterior tomando W := R.
Sea fi ∈ Vi ∗ , 1 ≤ i ≤ n. Definimos la función

f : V1 × · · · × Vn −→ R
f (v1 , . . . , vn ) := f1 (v1 ) · · · fn (vn ).

Notemos que f es multilineal, luego induce una única transformación lineal

F : V1 ⊗ · · · ⊗ Vn −→ R
F (v1 ⊗ · · · ⊗ vn ) := f (v1 , . . . , vn ) = f1 (v1 ) · · · fn (vn ).

Esto indica que F ∈ (V1 ⊗ · · · ⊗ Vn ) ∗ . Se define entonces la función

f : V1∗ × · · · × Vn∗ −→ (V1 ⊗ · · · ⊗ V ) ∗


e

( f1 , . . . , fn ) ↦−→ e
f ( f1 , . . . , fn ) := F .

f es multilineal, y por lo tanto, induce una transformación


Notemos que e
lineal
e : V ∗ ⊗ · · · ⊗ Vn∗ −→ (V1 ⊗ · · · ⊗ Vn ) ∗
F 1
F ( f1 ⊗ · · · ⊗ fn ) := e
e f ( f1 , . . . , fn ) = F
F
e ( f1 ⊗ · · · ⊗ fn ) (v1 ⊗ · · · ⊗ vn ) = F (v1 ⊗ · · · ⊗ vn ) = f1 (v1 ) · · · fn (vn ) .

Sea Xi := {xi1 , . . . , xiki } una base de Vi y sea Xi∗ = {xi1


∗ , . . . , x ∗ } la base
iki
dual. Entonces,
e(x ∗ ⊗ · · · ⊗ x ∗ )(x1r ⊗ · · · ⊗ xnr ) = x ∗ (x1r ) · · · x ∗ (xnr )
F 1 j1 n jn 1 n 1j 1 n jn n
( 1
1, si ( j1 , . . . , jn ) = (r1 , . . . , rn ),
=
0, otro caso.
Producto tensorial · 75

Sabemos que

{x1∗ j1 ⊗ · · · ⊗ xn∗ jn | 1 ≤ ji ≤ ki , 1 ≤ i ≤ n}

es una base de V1∗ ⊗ · · · ⊗ Vn∗ y que (X1 ⊗ · · · ⊗ Xn ) ∗ es una base de


(V1 ⊗ · · · ⊗ Vn ) ∗ ; por lo anterior,
e(x ∗ ⊗ · · · ⊗ x ∗ ) = (x1 j ⊗ · · · ⊗ xn j ) ∗ , 1 ≤ ji ≤ ki , 1 ≤ i ≤ n.
F 1 j1 n jn 1 n

Es decir, F
e es una transformación lineal que envía una base en una base, por
tanto, F es biyectiva.
e ✓

Sea V un R-espacio arbitrario y denotemos por

Mn (V ; R) := M(V , . . . , V ; R)  (V ⊗ · · · ⊗ V ) ∗
| {z } | {z }
n-veces n-veces

el R-espacio de funciones multilineales sobre V de n argumentos (véase la


definición 2.2.1). Para el caso particular en el cual V es de dimensión finita
se tiene la siguiente noción de tensor.

Definición 3.3.6. Sea V un R-espacio vectorial libre de dimensión finita


k ≥ 1. Los elementos del R-espacio

Tn (V ) := Mn (V ; R)  (V ⊗ · · · ⊗ V ) ∗  V ∗ ⊗ · · · ⊗ V ∗
| {z } | {z }
n-veces n-veces

se denominan n-tensores sobre V .

Notemos que V ∗ es el espacio de los 1-tensores y que las funciones bili-


neales sobre V son los 2-tensores. Las funciones multilineales consideradas
en el capítulo 2 para definir la función determinante son un ejemplo de
n-tensores. Según la definción anterior, un n-tensor es una suma finita del
producto tensorial de n 1-tensores.

Corolario 3.3.7. Sea V un R-espacio vectorial libre de dimensión finita k ≥ 1.


Entonces, Tn (V ) es libre con dim(Tn (V )) = k n . Si X := {x1 , . . . , xk } es una
base de V , entonces

{x ∗j1 ⊗ · · · ⊗ x ∗jn | 1 ≤ ji ≤ k, 1 ≤ i ≤ n}

es una base de Tn (V ). Además, si f ∈ Tn (V ), entonces


k
∑︁
f = f (x j1 , . . . , x jn ) · (x ∗j1 ⊗ · · · ⊗ x ∗jn ). (3.1)
j1 ,..., jn
76 · Producto tensorial

Demostración. Las primeras dos afirmaciones son consecuencia directa de la


prueba del corolario 3.3.5. Veamos la prueba de la tercera afirmación: sea
(v1 , . . . , vn ) ∈ V n = V × · · · × V ; si vi = ai1 · x1 + · · · + aik · xk , entonces
k
∑︁
f (v1 , . . . , vn ) = a1 j1 a2 j2 · · · an jn f (x j1 , . . . , x jn ),
j1 ,..., jn

y por otro lado

 k
 ∑︁ 
∗ ∗ 


 f (x j1 , . . . , x jn ) · (x j1 ⊗ · · · ⊗ x jn )  (v1 , . . . , vn )
 j1 ,..., jn 
 
∑︁k
= f (x j1 , . . . , x jn )x ∗j1 (v1 ) · · · x ∗jn (vn )
j1 ,..., jn
k
∑︁
= f (x j1 , . . . , x jn )a1 j1 a2 j2 · · · an jn . ✓

j1 ,..., jn

Los escalares f (x j1 , . . . , x jn ) se denominan las coordenadas del tensor f


en la base X := {x1 , . . . , xk }. Veamos como cambian las coordenadas de f al
cambiar la base X: sea Y := {y1 , . . . , yk } otra base de V y Y ∗ = {y1∗ , . . . , yk∗ }
la base dual correspondiente. Entonces,
k
∑︁
f = f (yi1 , . . . , yin ) · (yi∗1 ⊗ · · · ⊗ yi∗n ). (3.2)
i1 ,...,in

Puesto que
{yi∗1 ⊗ · · · ⊗ yi∗n | 1 ≤ ji ≤ k}
es una base de Tn (V ) y x ∗j1 ⊗ · · · ⊗ x ∗jn ∈ Tn (V ), entonces

k
∑︁
x ∗j1 ⊗ ··· ⊗ x ∗jn = (x ∗j1 ⊗ · · · ⊗ x ∗jn ) (yi1 , . . . , yin ) · (yi∗1 ⊗ · · · ⊗ yi∗n )
i1 ,...,in
k
∑︁
= x ∗j1 (yi1 ) · · · x ∗jn (yin ) · (yi∗1 ⊗ · · · ⊗ yi∗n )
i1 ,...,in
k k k
! !
∑︁ ∑︁ ∑︁
= x ∗j1 cvi1 · xv · · · x ∗jn cvin · xv · (yi∗1 ⊗ · · · ⊗ yi∗n )
i1 ,...,in v=1 v=1
k
∑︁
= c j1 i1 · · · c jn in · (yi∗1 ⊗ · · · ⊗ yi∗n ).
i1 ,...,in
Producto tensorial · 77

Reemplazando en (3.1) resulta


k
∑︁ k
∑︁
f = c j1 i1 · · · c jn in f (x j1 , . . . , x jn ) · (yi∗1 ⊗ · · · ⊗ yi∗n ).
j1 ,..., jn i1 ,...,in

De (3.2) se obtiene entonces que


k
∑︁
f (yi1 , . . . , yin ) = c j1 i1 · · · c jn in f (x j1 , . . . , x jn ),
j1 ,..., jn

donde C := [crs ] es la matriz de cambio de la base X a la base Y .


Concluimos esta sección con la definición del producto tensorial de ten-
sores. Para esto, comencemos con una construcción un poco más general.
Existe una transformación lineal
F
Mn (V ; R) ⊗ Mm (V ; R) −
→ Mn+m (V ; R).

En efecto, consideremos el siguiente diagrama


t
Mn (V ; R) × Mm (V ; R) - Mn (V ; R) ⊗ Mm (V ; R)
ppp
p p ppp
pp
p ppp
f
pp pppF
p p ppp
ppp
? 
Mn+m (V ; R)

donde t(h, g) := h ⊗ g y f (h, g) := fh, g , con

fh, g (v1 , . . . , vn ; vn+1 , . . . , vn+m ) := h(v1 , . . . , vn ) g (vn+1 , . . . , vn+m ).

Observemos que efectivamente fh, g ∈ Mn+m (V ; R) y f es bilineal, luego F


existe y es una transformación lineal definida dada por F (h ⊗ g) := fh, g , es
decir,
F (h ⊗ g) (v1 , . . . , vn ; vn+1 , . . . , vn+m )
(3.3)
:= h(v1 , . . . , vn )g (vn+1 , . . . , vn+m ).
Así, dadas dos funciones multilineales h ∈ Mn (V ; R) y g ∈ Mm (V ; R), se
define su producto tensorial por

(h ⊗ g)(v1 , . . . , vn ; vn+1 , . . . , vn+m ) := h(v1 , . . . , vn )g (vn+1 , . . . , vn+m ).

En particular, si V es de dimensión finita, entonces h ∈ Tn (V ), g ∈ Tm (V ) y


la relación anterior define el producto tensorial de tensores.
78 · Producto tensorial

Proposición 3.3.8. SeaV un R-espacio vectorial libre de dimensión finita k ≥ 1.


Entonces, Tn (V ) ⊗ Tm (V )  Tn+m (V ).

Demostración. Basta observar que la transformación lineal F definida en (3.3)


envía una base de Tn (V ) ⊗ Tm (V ) en una base de Tn+m (V ), luego F es un
isomorfismo. ✓

4. Tensores simétricos, antisimétricos y


alternados
En el capítulo 2 definimos las funciones multilineales antisimétricas y alter-
nadas de n argumentos sobre un R-espacio arbitrario V . Demostramos que
que si 2 ∈ R ∗ , entonces las funciones multilineales alternadas y las antisi-
métricas coinciden. Retomamos ahora el tema para el caso particular de los
tensores. En esta sección, salvo que advierta lo contrario, V es un R-espacio
libre de dimensión finita k ≥ 1.

Definición 3.4.1. Sea f ∈ Tn (V ) un tensor.

(i) Se dice que f es simétrico si para cada permutación 𝜋 ∈ Sn y cualquier


elemento (v1 , . . . , vn ) ∈ V × · · · × V se cumple

f (v𝜋 (1) , . . . , v𝜋 (n) ) = f (v1 , . . . , vn ).

(ii) Se dice que f es antisimétrico si

f (v𝜋 (1) , . . . , v𝜋 (n) ) = (−1) 𝜋 f (v1 , . . . , vn ).

(iii) Se dice que f es alternado si f (v1 , . . . , vn ) = 0, cuando vi = v j con


i ≠ j.

De esta definición se obtienen de manera inmediata los siguientes resul-


tados.

Proposición 3.4.2. Sean Sn (V ), An (V ) y ALn (V ) las colecciones de n-tensores


simétricos, antismétricos y alternados, respectivamente, sobre el espacio V . Enton-
ces, Sn (V ), An (V ) y ALn (V ) son R-espacios. Además, ALn (V ) ⊆ An (V ) y si
2 ∈ R ∗ , entonces An (V ) = ALn (V ).

Demostración. Ejercicio para el lector. ✓


Para los tensores alternados se tienen además las siguientes propiedades.


Producto tensorial · 79

Proposición 3.4.3. Sean v1 , . . . , vn ∈ V vectores tales que para algún i,


vi ∈ ⟨v1 , . . . , vi−1 , vi+1 , . . . , vn ⟩. Entonces,

f (v1 , . . . , vn ) = 0, para cada f ∈ ALn (V ).

Además, si R es un DI y v1 , . . . , vn ∈ V son linealmente dependientes, entonces


para cada f ∈ ALn (V ), f (v1 , . . . , vn ) = 0.

Demostración. Sea vi = r1 ·v1 + · · · +ri−1 ·vi−1 +ri+1 ·vi+1 + · · · +rn ·vn , entonces

f (v1 , . . . , vi−1 , r1 · v1 + · · · + ri−1 · vi−1 + ri+1 · vi+1


+ · · · + rn · vn , vi+1 , . . . , vn )
= r1 · f (v1 , . . . , vi−1 , v1 , vi+1 , . . . , vn )
+ · · · + ri−1 · f (v1 , . . . , vi−1 , vi−1 , vi+1 , . . . , vn )
+ ri+1 · f (v1 , . . . , vi−1 , vi+1 , vi+1 , . . . , vn )
+ · · · + rn · f (v1 , . . . , vi−1 , vn , vi+1 , . . . , vn )
= 0.

Para la segunda afirmación, existen r1 , . . . , rn ∈ R no todos nulos, digamos


ri ≠ 0, tales que r1 · v1 + · · · + ri · vi + · · · + rn · vn = 0. Resulta,

0 = f (v1 , . . . , vi−1 , 0, vi+1 , . . . , vn ) = ri · f (v1 , . . . , vi−1 , vi , vi+1 , . . . , vn ),

pero como R es un DI y ri ≠ 0, entonces f (v1 , . . . , vn ) = 0. ✓


Corolario 3.4.4. Sea R un DI y sea V un R-espacio libre de dimensión finita


k ≥ 1. Entonces, para cada n > k, ALn (V ) = 0.

Demostración. Consecuencia directa del corolario 2.4.15 y de la proposición


anterior. □✓

Si R = 𝕂 es un cuerpo de caracterísitica cero, a cada tensor f ∈ Tn (V ) se


pueden asociar un tensor simétrico y uno alternado ( = antisimétrico). En
efecto, definimos

1 ∑︁
S f (v1 , . . . , vn ) := f (v𝜋 (1) , . . . , v𝜋 (n) ),
n!
𝜋 ∈Sn
1 ∑︁
Al f (v1 , . . . , vn ) := (−1) 𝜋 f (v𝜋 (1) , . . . , v𝜋 (n) ).
n!
𝜋 ∈Sn
80 · Producto tensorial

Sea 𝜏 ∈ Sn , entonces 𝜃 := 𝜋𝜏 recorre también el grupo Sn y se obtiene


1 ∑︁
S f (v𝜏 (1) , . . . , v𝜏 (n) ) := f (v𝜋𝜏 (1) , . . . , v𝜋𝜏 (n) )
n!
𝜋 ∈Sn
1 ∑︁
= f (v𝜃 (1) , . . . , v𝜃 (n) )
n!
𝜃 ∈Sn

= S f (v1 , . . . , vn ).

Así, S f ∈ Sn (V ).
−1
De manera similar, 𝜋 = 𝜃 𝜏 −1 y (−1) 𝜋 = (−1) 𝜃 (−1) 𝜏 , pero
−1
(−1) 𝜏 = (−1) 𝜏 , luego
1 ∑︁
Al f (v𝜏 (1) , . . . , v𝜏 (n) ) := (−1) 𝜋 f (v𝜋𝜏 (1) , . . . , v𝜋𝜏 (n) )
n!
𝜋 ∈Sn
1 ∑︁
= (−1) 𝜏 (−1) 𝜃 f (v𝜃 (1) , . . . , v𝜃 (n) )
n!
𝜃 ∈Sn

= (−1) Al f (v1 , . . . , vn ).
𝜏

Proposición 3.4.5. Sea 𝕂 un cuerpo, con char(𝕂) = 0, y V un 𝕂-espacio de


dimensión k ≥ 1. Entonces, S : Tn (V ) −→ Sn (V ) y Al : Tn (V ) −→ ALn (V ),
definidas por S( f ) := S f y Al ( f ) := Al f son transformaciones lineales. Además, si
f es simétrico (alternado), entonces S f = f (Al f = f ).
Demostración. Ejercicio para el lector. ✓

Proposición 3.4.6. Sea 𝕂 un cuerpo, con char(𝕂) = 0, y sea V un 𝕂-espacio


de dimensión finita k ≥ 1. Entonces,

T2 (V ) = S2 (V ) ⊕ AL2 (V ).

Demostración. Considerando que un 2-tensor sobre V es una función bili-


neal sobre V , entonces el resultado es inmediato si se tiene en cuenta que
toda forma bilineal se puede expresar en forma única como suma de una
forma simétrica y una antisimétrica:
1 1
f (u, v) = [ f (u, v) + f (v, u)] + [ f (u, v) − f (v, u)]. ✓

2 2
Concluimos esta sección definiendo el producto exterior entre tensores.
Definición 3.4.7. Sea 𝕂 un cuerpo, con char(𝕂) = 0. Sea V un 𝕂-espacio
de dimensión k ≥ 1 y sean f ∈ Tn (V ), g ∈ Tm (V ). El producto exterior de
f y g se define por
(n + m)!
f ∧ g := Al f ⊗g .
n!m!
Producto tensorial · 81

Según la proposición 3.3.8, f ⊗ g ∈ Tn+m (V ), luego Al f ⊗g ∈ ALn+m (V )


y se tiene que

( f ∧ g) (v1 , . . . , vn+m )
(n + m)! 1 ∑︁
= (−1) 𝜋 ( f ⊗ g)(v𝜋 (1) , . . . , v𝜋 (n+m) )
n!m! (n + m)!
𝜋 ∈Sn+m
1 ∑︁
= (−1) 𝜋 f (v𝜋 (1) , . . . , v𝜋 (n) )g (v𝜋 (n+1) , . . . , v𝜋 (n+m) ).
n!m!
𝜋 ∈Sn+m

Algunas propiedades del producto exterior se resumen en la siguiente


proposición.

Proposición 3.4.8. Sean, 𝕂, V , k, V , f y g como en la definción anterior. En-


tonces,

(i) Si f , g ∈ T1 (V ), entonces f ∧ g = f ⊗ g − g ⊗ f .

(ii) f ∧ 0 = 0.

(iii) Si h ∈ Tm (V ), entonces f ∧ (g + h) = f ∧ g + f ∧ h. La distributiva por el


lado izquierdo también se cumple.

(iv) Si h ∈ Tp (V ), entonces ( f ∧ g) ∧ h = f ∧ (g ∧ h).

(v) Si a ∈ 𝕂, entonces (a · f ) ∧ g = f ∧ (a · g) = a · ( f ∧ g).

(vi) g ∧ f = (−1) nm ( f ∧ g).

(vii) f ∧ f = 0 si n es impar.

Demostración. (i) Tenemos


1
( f ∧ g)(u, v) = [ f (u)g (v) − f (v) g (u)] = f (u) g (v) − g (u) f (v)
1!1!
= ( f ⊗ g) (u, v) − (g ⊗ f )(u, v).

(ii) Evidente ya que f ⊗ 0 = 0 = 0 ⊗ f .


(iii) También evidente ya que f ⊗ (g + h) = f ⊗ g + f ⊗ h.
(iv) Esta propiedad asociativa se interpreta de la siguiente manera:

(n + m + p)!
( f ∧ g) ∧ h = Al ( f ⊗g) ⊗h
n!m!p!
(n + m + p)!
f ∧ (g ∧ h) = Al f ⊗ (g ⊗h)
n!m!p!
82 · Producto tensorial

pero

Al ( f ⊗g) ⊗h (v1 , . . . , vn+m+p )


1 ∑︁
= (−1) 𝜋 (( f ⊗ g) ⊗ h) (v𝜋 (1) , . . . , v𝜋 (n+m+p) )
(n + m + p)!
𝜋 ∈Sn+m+p
1 ∑︁
= (−1) 𝜋 ( f (v𝜋 (1) , . . . , v𝜋 (n) )g (v𝜋 (n+1) , . . . , v𝜋 (n+m) ))
(n + m + p)!
𝜋 ∈Sn+m+p

h(v𝜋 (n+m+1) , . . . , v𝜋 (n+m+p) )


1 ∑︁
= (−1) 𝜋 f (v𝜋 (1) , . . . , v𝜋 (n) )(g (v𝜋 (n+1) , . . . , v𝜋 (n+m) )
(n + m + p)!
𝜋 ∈Sn+m+p

h(v𝜋 (n+m+1) , . . . , v𝜋 (n+m+p) ))


1 ∑︁
= (−1) 𝜋 ( f ⊗ (g ⊗ h))(v𝜋 (1) , . . . , v𝜋 (n+m+p) )
(n + m + p)!
𝜋 ∈Sn+m+p

= Al f ⊗ ( g ⊗h) (v1 , . . . , vn+m+p ).

Esto completa la prueba de la identidad asociativa.


(v) Se obtiene de

(a · f ) ⊗ g = f ⊗ (a · g) = a · ( f ⊗ g).

(vi) Sabemos que

( f ∧ g) (v1 , . . . , vn+m )
1 ∑︁
= (−1) 𝜋 f (v𝜋 (1) , . . . , v𝜋 (n) )g (v𝜋 (n+1) , . . . , v𝜋 (n+m) );
n!m!
𝜋 ∈Sn+m

consideremos la permutación 𝜃 ∈ Sn+m definida por

𝜃 (1) := n + 1, . . . , 𝜃 (m) := n + m, 𝜃 (m + 1) := 1, . . . , 𝜃 (m + n) := n,

entonces

(g ∧ f )(v𝜃 (1) , . . . , v𝜃 (m+n) )


1 ∑︁
= (−1) 𝜋 g (v𝜋𝜃 (1) , . . . , v𝜋𝜃 (m) ) f (v𝜋𝜃 (m+1) , . . . , v𝜋𝜃 (m+n) )
m!n!
𝜋 ∈Sn+m

= ( f ∧ g) (v1 , . . . , vn+m ).
Producto tensorial · 83

Pero como g ∧ f es alternada, entonces es antisimétrica, luego

(g ∧ f ) (v𝜃 (1) , . . . , v𝜃 (m+n) )


= (g ∧ f ) (vn+1 , . . . , vn+m , v1 , . . . , vn )
= (−1) m (g ∧ f ) (v1 , vn+1 . . . , vn+m , v2 , . . . , vn )
= (−1) m (−1) m (g ∧ f )(v1 , v2 , vn+1 . . . , vn+m , v3 , . . . , vn )
= ···
= (−1) nm (g ∧ f )(v1 , . . . , vn+m ).

Así, ( f ∧ g) = (−1) nm (g ∧ f ), lo cual es equivalente a lo requerido.


(vii) El resultado se tiene de (vi) ya que char(𝕂) = 0. ✓

5. Álgebras y producto tensorial


En esta última sección vamos a definir el producto tensorial de álgebras, el
álgebra tensorial y el álgebra exterior de un R-espacio.
Sean A y B dos R-álgebras. Entonces podemos construir el producto
tensorial A ⊗ B de los R-espacios A y B. Este espacio puede ser dotado de
estructura de R-álgebra con el producto definido de la siguiente manera:
Paso 1. Consideremos el diagrama
t - A⊗B⊗A⊗B
A×B×A×B
pp
p p ppp
p
f p ppp
ppp
ppp
F
? 
A⊗B

donde t es la función multilineal canónica, t(a, b, a ′ , b ′) := a ⊗ b ⊗ a ′ ⊗ b ′


y f es definida por f (a, b, a ′ , b ′) := aa ′ ⊗ bb ′. Nótese que f es multilineal,
por tanto, f induce la transformación lineal F definida por

F (a ⊗ b ⊗ a ′ ⊗ b ′) := aa ′ ⊗ bb ′ .

Paso 2. Se tiene el isomorfismo de R-espacios

A ⊗ B ⊗ A ⊗ B  (A ⊗ B) ⊗ (A ⊗ B),
(5.1)
a ⊗ b ⊗ a ′ ⊗ b ′ ↦−→ (a ⊗ b) ⊗ (a ′ ⊗ b ′).

Este isomorfismo se puede probar de la siguiente forma:


84 · Producto tensorial

Paso 2.1. B ⊗ A ⊗ B  B ⊗ (A ⊗ B): en efecto, la función multilineal

f ′ : B × A × B −→ B ⊗ (A ⊗ B),
f ′ (b, a, b ′) := b ⊗ (a ⊗ b ′)

induce una transformación lineal

F ′ : B ⊗ A ⊗ B −→ B ⊗ (A ⊗ B),
F ′ (b ⊗ a ⊗ b ′) := b ⊗ (a ⊗ b ′).

De otra parte, fijemos un elemento b ∈ B y definamos la función bilineal

h : A × B −→ B ⊗ A ⊗ B,
h(a, b ′) := b ⊗ a ⊗ b ′ ,

entonces se induce la transformación lineal

hb : A ⊗ B −→ B ⊗ A ⊗ B,
hb (a ⊗ b ′) = b ⊗ a ⊗ b ′ .

Consideremos la función bilineal

g : B × (A ⊗ B) −→ B ⊗ A ⊗ B,
g (b, z) := hb (z), con z ∈ A ⊗ B,

entonces se induce la transformación lineal

G ′ : B ⊗ (A ⊗ B) −→ B ⊗ A ⊗ B,
G (b ⊗ z) := hb (z).

En particular, G ′ (b ⊗ (a ⊗ b ′)) = hb (a ⊗ b ′) = b ⊗ a ⊗ b ′. Notemos que


entonces F ′ ◦ G ′ = iB⊗ (A⊗B) y G ′ ◦ F ′ = iB⊗A⊗B .
Paso 2.2. Del paso 2.1 se obtiene el isomorfismo

A ⊗ (B ⊗ A ⊗ B)  A ⊗ [B ⊗ (A ⊗ B)]  (A ⊗ B) ⊗ (A ⊗ B)
a ⊗ (b ⊗ a ′ ⊗ b ′) ↦−→ a ⊗ (b ⊗ (a ′ ⊗ b ′)) ↦−→ (a ⊗ b) ⊗ (a ′ ⊗ b ′).

Para completar la prueba del isomorfismo (5.1) debemos probar, a su vez,


el siguiente isomorfismo:

A ⊗ (B ⊗ A ⊗ B)  A ⊗ B ⊗ A ⊗ B,
a ⊗ (b ⊗ a ′ ⊗ b ′) ↦−→ a ⊗ b ⊗ a ′ ⊗ b ′ .
Producto tensorial · 85

La demostración de este isomorfismo es similar a la realizada en el paso 2.1;


veamos los detalles. La función multilineal

f ′′ : A × B × A × B −→ A ⊗ (B ⊗ A ⊗ B),
f ′′ (a, b, a ′ , b ′) := a ⊗ (b ⊗ a ′ ⊗ b ′)

induce una transformación lineal

F ′′ : A ⊗ B ⊗ A ⊗ B −→ A ⊗ (B ⊗ A ⊗ B),
F ′′ (a ⊗ b ⊗ a ′ ⊗ b ′) := a ⊗ (b ⊗ a ′ ⊗ b ′).

De otra parte, fijando a ∈ A, definimos la función función multilineal

l : B × A × B −→ A ⊗ B ⊗ A ⊗ B,
l (b, a ′ , b ′) := a ⊗ b ⊗ a ′ ⊗ b ′ ,

y se induce la transformación lineal

la : B ⊗ A ⊗ B −→ A ⊗ B ⊗ A ⊗ B,
la (b ⊗ a ′ ⊗ b ′) := a ⊗ b ⊗ a ′ ⊗ b ′ .

Por último, la función bilineal

j : A × (B ⊗ A ⊗ B) −→ A ⊗ B ⊗ A ⊗ B,
j (a, z) := la (z), para cada z ∈ B ⊗ A ⊗ B

induce una transformación lineal

J : A ⊗ (B ⊗ A ⊗ B) −→ A ⊗ B ⊗ A ⊗ B,
J (a ⊗ z) := la (z).

En particular, J (a ⊗ (b ⊗ a ′ ⊗ b ′)) := la (b ⊗ a ′ ⊗ b ′) = a ⊗ b ⊗ a ′ ⊗ b ′.
Observemos que entonces J ◦ F ′′ = iA⊗B⊗A⊗B y F ′′ ◦ J = iA⊗ (B⊗A⊗B) .
Paso 3. De los pasos anteriores resulta entonces un isomorfismo, el cual
también denotamos por F ,

F : (A ⊗ B) ⊗ (A ⊗ B) −→ A ⊗ B,
(a ⊗ b) ⊗ (a ′ ⊗ b ′) ↦−→ a ⊗ (b ⊗ a ′ ⊗ b ′) ↦−→ a ⊗ b ⊗ a ′ ⊗ b ′ ↦−→ aa ′ ⊗ bb ′ ,

es decir,
F ((a ⊗ b) ⊗ (a ′ ⊗ b ′)) := aa ′ ⊗ bb ′ .
86 · Producto tensorial

Por el teorema 3.3.4, F induce una función bilineal


f
b
(A ⊗ B) × (A ⊗ B) →
− A ⊗ B,

la cual permite definir la multiplicación en A ⊗ B:

f (a ⊗ b, a ′ ⊗ b ′) := F ((a ⊗ b) ⊗ (a ′ ⊗ b ′)) = aa ′ ⊗ bb ′ .
b

f es bilineal, entonces el producto queda bien definido por


Como b

(a ⊗ b) (a ′ ⊗ b ′) := b
f (a ⊗ b, a ′ ⊗ b ′) = aa ′ ⊗ bb ′ .

La bilinealidad de b f garantiza que este producto es distributivo. A su vez,


la asociatividad es consecuencia de la asociatividad en A y B. El uno de esta
álgebra es 1 ⊗ 1. A ⊗ B se conoce como el producto tensorial de A y B. Si
A y B son álgebras conmutativas, entonces A ⊗ B es conmutativa.
Consideremos ahora un R-espacio V , y definimos
Ê
T (V ) := T i (V ),
i ≥0

donde

T 0 (V ) := R,
T i (V ) := V ⊗ · · · ⊗ V , para i ≥ 1.
| {z }
i−veces

Notemos que cada elemento z ∈ T (V ) es de la forma z = (zi )i ≥0 , con


zi ∈ T i (V ) y zi = 0 para casi todo i. En otras palabras, si

𝜇 i : T i (V ) −→ T (V )

es la inyección canónica de la suma directa externa (véase [24]), entonces z


se puede escribir en la forma
∑︁
z= 𝜇 i (zi ), con Cz := {i | zi ≠ 0};
i ∈ Cz

Cz se conoce como el soporte de z y es un conjunto finito. T (V ) es entonces


un R-espacio. Si identificamos a T i (V ) con su imagen a través de la inyec-
ción canónica 𝜇 i , es decir, si consideramos a T i (V ) como subespacio del
R-espacio T (V ), entonces T (V ) es suma directa interna de los subespacios
T i (V ): ∑︁
T (V ) = ⊕ T i (V ) = R ⊕ V ⊕ (V ⊗ V ) ⊕ · · ·
i ≥0
Producto tensorial · 87

Así, cada elemento z ∈ T (V ) tiene una representación única en la forma

z = z0 + z1 + · · · + zi , con z j ∈ T j (V ), 0 ≤ j ≤ i.

T (V ) tiene estructura de R-álgebra con el producto definido mediante dis-


tributividad y el R-isomorfismo

T i (V ) ⊗ T j (V )  T i+ j (V ). (5.2)

En T (V ) tenemos entonces que

(v1 ⊗ · · · ⊗ vi ) (vi+1 ⊗ · · · ⊗ vi+ j ) := v1 ⊗ · · · ⊗ vi+ j , (5.3)


r (v1 ⊗ · · · ⊗ vi ) := r · (v1 ⊗ · · · ⊗ vi ) =: (v1 ⊗ · · · ⊗ vi )r. (5.4)

El producto anterior está bien definido si se tiene en cuenta (5.2) y que


la representación de cada elemento de T (V ) a través de la suma directa
interna es única. Como estamos considerando que T i (V ) ⊆ T (V ), entonces
el isomorfismo (5.2) se puede interpretar como

T i (V )T j (V ) ⊆ T i+ j (V ).

Notemos que el elemento v1 ⊗ · · · ⊗ vi ∈ T i (V ) corresponde al producto


v1 · · · vi de tal forma que la relación (5.3) se puede escribir en la forma

(v1 ⊗ · · · ⊗ vi ) (vi+1 ⊗ · · · ⊗ vi+ j ) = (v1 · · · vi )(vi+1 · · · vi+ j ) = v1 · · · vi+ j .

T (V ) se conoce como el álgebra tensorial del R-espacio V . Notemos que


la inclusión

𝜇 : V −→ T (V )
v ↦−→ v

es una transformación lineal. El cero de T (V ) es el cero de R y lo mismo


ocurre con el uno. Observemos que T (V ) es un álgebra no conmutativa:
para v, v ′ ∈ V se tiene que vv ′ = v ⊗ v ′ ≠ v ′ ⊗ v = v ′v.
El álgebra tensorial tiene la siguiente propiedad universal.
Teorema 3.5.1 (Propiedad universal del álgebra tensorial) . Para cada
R-álgebra B y cada transformación lineal f : V −→ B, existe un único homo-
morfismo de R-álgebras F : T (V ) −→ B tal que F 𝜇 = f :
𝜇
V - T (V )
p
p pp
f
p pp
pp
F
?
B
88 · Producto tensorial

F se define por

F (v) := f (v), v ∈ V , F (r) := r · 1, r ∈ R.

Demostración. Para i ≥ 2, sea fi la transformación lineal inducida por la


función multilineal

fi ′ : V × · · · × V −→ B,
fi ′ (v1 , . . . , vi ) := f (v1 ) · · · f (vi ),
fi (v1 ⊗ · · · ⊗ vi ) = f (v1 ) · · · f (vi );

además, sean f1 := f , f0 (r) = r · 1. Definimos F por

F (z0 + z1 + · · · + zi ) := f0 (z0 ) + f1 (z1 ) + · · · + fi (zi ),

con z j ∈ T j (V ), 0 ≤ j ≤ i. Así, F es una transformación lineal bien definida


y satisface

F (v1 ⊗ · · · ⊗ vi ) = fi (v1 ⊗ · · · ⊗ vi ) = f (v1 ) · · · f (vi ),

para i ≥ 2 y

F (v) = f1 (v) = f (v), para cada v ∈ V ,


F (r) = f0 (r) = r · 1, para cada r ∈ R.

Notemos que F 𝜇 = f . Además, F es un homomorfismo de R-álgebras ya


que

F (v1 · · · vi )F (vi+1 · · · vi+ j ) = F (v1 ⊗ · · · ⊗ vi )F (vi+1 ⊗ · · · ⊗ vi+ j )


= f (v1 ) · · · f (vi ) f (vi+1 ) · · · f (vi+ j )
= F (v1 ⊗ · · · ⊗ vi+ j )
= F (v1 · · · vi+ j )
= F ((v1 · · · vi )(vi+1 · · · vi+ j )),

y F (1) = 1. Si G es otro homomorfismo de R-álgebras tal que G 𝜇 = f ,


entonces, para cada v ∈ V ,

G (v) = G 𝜇(v) = f (v) = F (v);

además, G (r) = G (r · 1) = r · G (1) = r · 1 = F (r) para cada r ∈ R, es decir,


G = F. ✓

Producto tensorial · 89

Pasamos ahora a construir el álgebra exterior de V . En T (V ) considere-


mos el ideal bilátero J generado por los elementos de la forma v2 , v ∈ V
(véase [23]), es decir,
J := ⟨v 2 | v ∈ V ⟩;
además, definimos

J0 := 0 =: J1 ,
Ji := J ∩ T i (V ), para i ≥ 2.

Nótese que Ji coincide con el R-subespacio Si de T i (V ) generado por los


elementos de la forma v1 · · · vi , con vr = vs para algún par de índices
1 ≤ r ≠ s ≤ i. En efecto, es claro que Ji ⊆ Si ; para la inclusión recíproca
basta observar que cada elemento v1 · · · vr · · · vs · · · vi , con vr = vs , pertenece
a Ji . Ilustremos con dos situaciones particulares la prueba inductiva reque-
rida: consideremos v1v2v1 ,

(v1 + v2 ) (v1 + v2 )v1 = v1 (v1 + v2 )v1 + v2 (v1 + v2 )v1


= v1v1v1 + v1v2v1 + v2v1v1 + v2v2v1 ,

luego v1v2v1 ∈ J3 . Consideremos también el caso v1v2v3v1 :

(v1 + v2 ) (v1 + v2 )v3v1 = v1v1v3v1 + v1v2v3v1 + v2v1v3v1 + v2v2v3v1 ,

notemos que los sumandos v1v1v3v1 , v2v1v3v1 , v2v2v3v1 están en J4 tal co-
mo vimos en el caso particular anteriormente analizado, y por lo tanto,
v1v2v3v1 ∈ J4 . Los dos casos anteriores muestran que la prueba en el ca-
so general v1 · · · vr · · · vs · · · vi , con vr = vs , se establece por inducción sobre
s − r.
Veamos que ∑︁
J= ⊕ Ji .
i ≥0
Í
En efecto, es claro que Ji ⊆ J para cada i ≥ 0, luego i ≥0 Ji ⊆ J ; además,
la suma es directa ya que Ji ⊆ T i (V ). Notemos que J ⊆ i ≥0 ⊕ Ji . Sea z ∈
Í

J , entonces existen z j , z ′j ∈ T (V ) y v j ∈ V , 1 ≤ j ≤ t, tales que z = z1v12 z1′ +


· · · + zt vt2 zt′, pero si expresamos cada z j y cada z ′j a través de su expansión
en T (V ) = i ≥0 ⊕ T i (V ), encontramos que cada uno de los sumandos de
Í

z j v 2j z ′j pertenece a algún Ji , luego la inclusión señalada es cierta.


Se define entonces el álgebra cociente

Λ(V ) := T (V )/ J ,

que se conoce como el álgebra exterior de V .


90 · Producto tensorial

Proposición 3.5.2. Sea V un R-espacio. Entonces,


∑︁
Λ(V ) = ⊕Λi (V ),
i ≥0

T i (V )+ J
con Λi (V ) := J  T i (V )/ Ji , para i ≥ 0.
Demostración. Es claro que Λi (V ) es un R-subespacio de Λ(V ), y además,
T i (V ) + J
 T i (V )/[T i (V ) ∩ J ] = T i (V )/ Ji .
J
En particular, Λ0 (V ) = R y Λ1 (V ) = V . Sea z ∈ Λ(V ), entonces existe
u ∈ T (V ) tal que z = u, luego

z = u0 + u1 + · · · + ui = u0 + u1 + · · · + ui ,

con u j ∈ T j (V ), 0 ≤ j ≤ i. Esto prueba que Λ(V ) = i ≥0 Λi (V ). La suma


Í

es directa ya que si u0 + u1 + · · · + ui = 0, entonces u0 + u1 + · · · + ui ∈ J , luego


u0 + u1 + · · · + ui = w0 + · · · +wi , con w j ∈ J j = J ∩T j (V ), pero como la suma
en T (V ) es directa, entonces u j = w j ∈ J para cada j, es decir, u j = 0. □ ✓

Según la prueba de la proposición anterior


∑︁
Λ(V ) = ⊕ Λi (V ) = R ⊕ V ⊕ Λ2 (V ) ⊕ · · ·
i ≥0

y cada elemento z ∈ Λ(V ) tiene una representación única en la forma

z = z0 + z1 + · · · + zi , con z j ∈ Λ j (V ), 0 ≤ j ≤ i.

Para los elementos de Λi (V ) se usa también la siguiente notación:

v1 ∧ · · · ∧ vi := v1 · · · vi + J ∈ Λi (V ),

luego para el producto en Λ(V ) se tiene que

(v1 ∧ · · · ∧ vi )(vi+1 ∧ · · · ∧ vi+ j ) = v1 ∧ · · · ∧ vi+ j .

Lo anterior demuestra que en Λ(V ) se cumple la siguiente propiedad:

Λi (V )Λ j (V ) ⊆ Λi+ j (V ).

La transformación lineal canónica de inclusión V −→ Λ(V ) la podemos


denotar como 𝜈, es decir,

𝜈 :V −→ Λ(V )
v ↦−→ v
Producto tensorial · 91

y satisface 𝜈 (v) 2 = 0 para cada v ∈ V . En efecto, en Λ(V ) tiene lugar la


identidad
v ∧ v = v 2 + J = 0.
El álgebra exterior está caracterizada con la siguiente propiedad univer-
sal.

Teorema 3.5.3 (Propiedad universal del álgebra exterior) . Para cada


R-álgebra B y cada transformación lineal f : V −→ B tal que f (v) 2 = 0, con
v ∈ V , existe un único homomorfismo de R-álgebras F : Λ(M) −→ B tal que
F𝜈 = f :
𝜈-
V Λ(V )
p
p pp
p
f
p pp F
p
?
B
F se define por

F (v) := f (v), v ∈ V , F (r) := r · 1, r ∈ R.

Demostración. Según el teorema 3.5.1 existe un homomorfismo de R-álge-


bras F ′ : T (V ) −→ B tal que F ′ 𝜇 = f . Definimos F (z) := F ′ (z), con
z ∈ T (V ); F está bien definido ya que si z = z ′, entonces z − z ′ ∈ J y existen
z j , z ′j ∈ T (V ) y v j ∈ V , con 1 ≤ j ≤ t, tales que

z − z ′ = z1v12 z1′ + · · · + zt vt2 zt′ ,

luego

F ′ (z − z ′) = F ′ (z1 )F ′ (v1 ) 2 F ′ (z1′ ) + · · · + F ′ (zt )F ′ (vt ) 2 F ′ (zt′)


= F ′ (z1 ) f (v1 ) 2 F ′ (z1′ ) + · · · + F ′ (zt ) f (vt ) 2 F ′ (zt′) = 0.

F es un homomorfismo de R-álgebras ya que F ′ los es. Además, para cada


v ∈ V se tiene que F 𝜈 (v) = F (v) = F ′ (v) = F ′ 𝜇(v) = f (v). Es claro que
F (r) = r · 1. Sea G otro homomorfismo de R-álgebras tal que G 𝜈 = f ,
entonces
G (v) = G 𝜈 (v) = f (v) = F (v)
y G (r) = G (r · 1) = r · G (1) = r · 1 = F (r), para cada r ∈ R. ✓

Algunas propiedades interesantes relacionadas con el álgebra exterior


son las siguientes:
(i) Para cada v ∈ V , v ∧ v = 0. En notación multiplicativa usual, v 2 = 0.
92 · Producto tensorial

(ii) Para u, v ∈ V , u ∧ v = −(v ∧ v). En notación multiplicativa, uv = −vu.


En efecto, (u + v) (u + v) = 0 = u 2 + uv + vu + v 2 = uv + vu.
(iii) Para cada z ∈ Λi (V ) y w ∈ Λ j (V ), z ∧ w = (−1) i j (w ∧ z). Mediante
notación multiplicativa se tiene que zw = (−1) i j wz. En efecto, si z = z1 ∧
· · · ∧ zi y w = w1 ∧ · · · ∧ w j , entonces

zw = (z1 · · · zi ) (w1 · · · w j )
= (−1) i w1 (z1 · · · zi ) (w2 · · · w j )
= · · · = (−1) i · · · (−1) i (w1 · · · w j )(z1 · · · zi ) = (−1) i j wz.
| {z }
j−veces

(iv) Si V es generado por n elementos, entonces para i > n, Λi (V ) = 0.


En efecto, en cada sumando de la expansión de

v1 ∧ · · · ∧ vi := v1 · · · vi + J ∈ Λi (V )

a través de los generadores de V hay elementos repetidos.


(v) Sea f : V −→ U una transformación lineal. Entonces, f induce
un único homomorfismo de R-álgebras 𝜆 ( f ) : Λ(V ) −→ Λ(U ) tal que
Λ( f )|V = f . Este homomorfismo envia elementos de Λi (V ) en Λi (U ), para
cada i ≥ 0. La restricción de Λ( f ) a Λi (V ) se denota por Λi ( f ) y es tal que

Λi ( f ) (v1 ∧ · · · ∧ vi ) = f (v1 ) ∧ · · · ∧ f (vi ).

Además, Λ( f ) es sobreyectivo si, y sólo si, f es sobreyectivo. En efecto,


es claro que si f es sobreyectivo, entonces Λ( f ) es sobreyectivo. Recípro-
camente, dado u ∈ U existe z ∈ Λ(V ) tal que Λ( f )(z) = u, pero como
Λ( f ) (Λi (V )) ⊆ Λi (U ), entonces z ∈ V y así f (z) = u, es decir, f es sobre-
yectivo.
(vi) Sea f : R −→ C un homomorfismo de anillos. Entonces,

C ⊗ Λ(V )  Λ(C ⊗ V ) (isomorfismo de C-álgebras) .

En efecto, observemos en primer lugar que: C es una R-álgebra; C ⊗ V es


un R-espacio; C ⊗ V es un C-espacio con producto c ′ · (c ⊗ v) := (c ′c) ⊗ v;
C ⊗ Λ(V ) es una R-álgebra; C ⊗ Λ(V ) es una C-álgebra; Λ(C ⊗ V ) es una
C-álgebra; Λ(C ⊗ V ) es una R-álgebra.
La función f ′ : C × V −→ C ⊗ Λ(V ), definida por f ′ (c, v) := c ⊗ v
es bilineal e induce una transformación lineal f : C ⊗ V −→ C ⊗ Λ(V ),
Producto tensorial · 93

f (c ⊗ v) := c ⊗ v; es fácil probar que f (z) 2 = 0 para cada z ∈ C ⊗ V , por lo


tanto, f induce un homomorfismo de R-álgebras

F : Λ(C ⊗ V ) −→ C ⊗ Λ(V ),
F (z) := f (z), con z ∈ C ⊗ V ;

en particular, F (c ⊗ v) = f (c ⊗ v) = c ⊗ v y F (c) = c · 1 = c · (1 ⊗ 1) = c ⊗ 1,
con c ∈ C y v ∈ V .
Por otro lado, fijemos c ∈ C; la función h ′ : V −→ Λ(C ⊗ V ) defini-
da por h ′ (v) := c ⊗ v, con v ∈ V , es una transformación lineal y cumple
h ′ (v) 2 = 0 para cada v ∈ V , por lo tanto, se induce un homomorfismo de R-
álgebras hc : Λ(V ) −→ Λ(C ⊗V ). Con esto construimos una función bilineal
h : C × Λ(V ) −→ Λ(C ⊗ V ) definida por h(c, u) := hc (u), con u ∈ Λ(V ), la
cual a su vez induce una transformación lineal bien definida

H : C ⊗ Λ(V ) −→ Λ(C ⊗ V ).
H (c ⊗ u) := h(c, u) = hc (u).

Ahora es fácil probar que H F = iΛ(C ⊗V ) y F H = iC ⊗Λ(V ) .


(vii) Sea V = V1 ⊕ V2 , entonces

Λ(V )  Λ(V1 ) ⊗ Λ(V2 ) (isomorfismo de R-álgebras) ,

con el producto en Λ(V1 ) ⊗ Λ(V2 ) definido mediante distributividad y la


regla
(zi ⊗ z j ) (zp ⊗ zq ) := (−1) jp (zi zp ) ⊗ (z j zq ), (5.5)

donde zi ∈ Λi (V1 ), z j ∈ Λ j (V2 ), zp ∈ Λp (V1 ) y zq ∈ Λq (V2 ).


Veamos la demostración: notemos inicialmente que el producto (5.5)
dota al R-espacio Λ(V1 ) ⊗ Λ(V2 ) de una estructura de R-álgebra, distinta de
la que vimos para el producto tensorial de álgebras al principio de la presente
sección. Por ejemplo, se puede verificar fácilmente la propiedad asociativa
de este producto y que 1 ⊗ 1 es nuevamente el neutro multiplicativo.
La función definida por

f : V −→ Λ(V1 ) ⊗ Λ(V2 ),
f (v1 + v2 ) := v1 ⊗ 1 + 1 ⊗ v2 ,
94 · Producto tensorial

es un R-homomorfismo. Además satisface la identidad f (v1 + v2 ) 2 = 0. En


efecto,

(v1 ⊗ 1 + 1 ⊗ v2 ) 2 = (v1 ⊗ 1)(v1 ⊗ 1) + (v1 ⊗ 1)(1 ⊗ v2 )


+ (1 ⊗ v2 ) (v1 ⊗ 1) + (1 ⊗ v2 )(1 ⊗ v2 )
= (−1) 0×1 (v12 ⊗ 1) + (−1) 0×0 (v1 ⊗ v2 )
+ (−1) 1×1 (v1 ⊗ v2 ) + (−1) 1×0 (1 ⊗ v22 )
= 0.

Se induce entonces un homomorfismo de R-álgebras

Λ( f ) : Λ(V ) −→ Λ(V1 ) ⊗ Λ(V2 ),


Λ( f ) (v1 + v2 ) := v1 ⊗ 1 + 1 ⊗ v2 ,
Λ( f ) (r) = r · (1 ⊗ 1).

De otra parte, según (v), las inclusiones canónicas 𝜄i : Vi −→ V1 ⊕ V2 ,


i = 1, 2, inducen homomorfismos de R-álgebras Λ(𝜄i ) : Λ(Vi ) −→ Λ(V ),
de tal forma que Λ(𝜄i ) (vi ) = vi , Λ(𝜄i ) (r) = r · 1Λ(V ) . Definimos entonces

f : Λ(V1 ) × Λ(V2 ) −→ Λ(V ),


(z1 , z2 ) := Λ(𝜄1 ) (z1 )Λ(𝜄2 ) (z2 ), con zi ∈ Λ(Vi ).

Notemos que f es bilineal, por lo tanto, por el teorema 3.1.4 se induce un


R-homomorfismo

F : Λ(V1 ) ⊗ Λ(V2 ) −→ Λ(V ),


F (z1 ⊗ z2 ) = Λ(𝜄1 ) (z1 )Λ(𝜄2 )(z2 )

Nótese que F (1 ⊗ 1) = 1Λ(V ) .


Probemos que F Λ( f ) = iΛ(V ) y que Λ( f )F = iΛ(V1 ) ⊗Λ(V2 ) : sea v1 +v2 ∈ V ,
se tiene entonces que

F Λ( f ) (v1 + v2 ) = F (v1 ⊗ 1 + 1 ⊗ v2 ) = v1 + v2 ,
F Λ( f ) (r) = F (r · (1 ⊗ 1)) = r · F (1 ⊗ 1) = r · 1Λ(V ) = r · 1R = r1R = r.

De otra parte,

Λ( f )F (v1 ⊗ v2 ) = Λ( f ) (Λ(𝜄1 ) (v1 )Λ(𝜄2 )(v2 )) = Λ( f )(v1v2 )


= Λ( f ) (v1 )Λ( f ) (v2 ) = (v1 ⊗ 1)(1 ⊗ v2 )
= (−1) 0×0 (v1 ⊗ v2 ) = v1 ⊗ v2 ;
Producto tensorial · 95

además,

Λ( f )F (r ⊗ v2 ) = Λ( f ) (Λ(𝜄1 ) (r)Λ(𝜄2 )(v2 )) = Λ( f )(r · 1Λ(V ) )Λ( f )(v2 )


= (r · Λ( f ) (1Λ(V ) )) (1 ⊗ v2 ) = (r · (1 ⊗ 1))(1 ⊗ v2 )
= (r ⊗ 1)(1 ⊗ v2 ) = (−1) 0×0 (r ⊗ v2 ) = r ⊗ v2 .

De manera similar se prueba que Λ( f )F (v1 ⊗ r) = v1 ⊗ r. Todo lo anterior


demuestra que Λ( f ) es un isomorfismo de R-álgebras.
(viii) Si V es libre con base X := {x1 , . . . , xn }, entonces, para 1 ≤ i ≤ n,
Λi (V ) es libre con base

{x j1 ∧ · · · ∧ x ji | 1 ≤ j1 < · · · < ji ≤ n}.


n
Además, dim Λi (V ) = i y dim Λ(V ) = 2n .
(ix) Si V es un espacio proyectivo finitamente generado, es decir, V es
sumando directo de un espacio libre de dimensión finita, entonces Λ(V ) y
Λi (V ) son espacios proyectivos finitamente generados, para cada i ≥ 0.

6. Ejercicios
1. Complete la demostración del corolario 3.1.5.

2. Demuestre las propiedades (iii)-(ix) de la sección 2.

3. Demuestre la proposición 3.3.3.

4. Demuestre que el producto tensorial de dos matrices cuadradas simé-


tricas es una matriz simétrica.

5. Sean V1 , . . . , Vn R-espacios y 𝜋 ∈ Sn una permutación. Demuestre


que
V1 ⊗ · · · ⊗ Vn  V𝜋 (1) ⊗ · · · ⊗ V𝜋 (n) .

6. Determine en cada caso si f ∈ T2 (ℝ2 ), con

(i) f : ℝ2 × ℝ2 −→ ℝ, f ((c1 , c2 ), (d1 , d2 )) := c1 d2 + c2 d1 .


(ii) f : ℝ2 × ℝ2 −→ ℝ, f ((c1 , c2 ), (d1 , d2 )) := c1 d2 − c2 d1 .
(iii) f : ℝ2 × ℝ2 −→ ℝ, f ((c1 , c2 ), (d1 , d2 )) := c1 + d2 .

7. Para los tensores f del ejercicio anterior, calcule S f y Al f .


96 · Producto tensorial

8. Sean T : ℝ3 −→ ℝ2 y F : ℝ2 −→ ℝ4 transformaciones lineales


definidas por

T (x, y, z) = (2x + 3y, 3x + 4z),


F (x, y) = (x, x + y, y, y − x).

Entonces, ¿dim(ker(T ⊗ F )) = 2?.

9. Demuestre la proposición 3.4.2.

10. SeanV un R-espacio de dimensión finita k ≥ 1 y f ∈ Tn (V ). Demues-


tre que f ∈ An (V ) si, y sólo si, para cada trasposición 𝜏 ∈ Sn y cada
(v1 , . . . , vn ) ∈ V × · · · × V , f (𝜏 (v1 ), . . . , 𝜏 (vn )) = −f (v1 , . . . , vn ).

11. Demuestre la proposición 3.4.5.

12. Determine si se tienen los siguientes isomorfismos de R-álgebras:

Mn (R) ⊗ Mm (R)  Mnm×nm (R),


R [x] ⊗ R[y]  R [x, y].

13. Demuestre el teorema 3.5.1.

14. Sea 𝕂 un cuerpo y sean A ∈ Mn (𝕂), B ∈ Mm (𝕂) matrices diagonali-


zables. ¿Es A ⊗ B diagonalizable?

15. ¿La función f definida por

f : ℝ2 × ℝ2 −→ ℝ,
f ((c1 , c2 ), (d1 , d2 )) := c1 d2 − c2 d1

es un tensor?

16. Sean f , g ∈ AL2 (ℝ2 ) dos tensores antisimétricos. ¿Es f ⊗ g antisi-


métrico?

17. Demuestre las propiedades (v)-(ix) de la sección 5.


Capítulo
cuatro
Formas canónicas
Formas canónicas · 99

Aplicamos en este capítulo la teoría de los módulos finitamente generados


sobre dominios de ideales principales estudiada en [24] para el estudio de
las formas canónicas clásica, racional y de Jordan de una transformación
lineal T : V −→ V , con V un 𝕂-espacio no nulo de dimensión finita y 𝕂 un
cuerpo. En la última sección estudiaremos la forma canónica diagonal y la
diagonalización de matrices mediante similaridad.

1. Polinomios mínimo y característico


Sean End𝕂 (V ) la 𝕂-álgebra de transformaciones lineales de V ,
T : V −→ V un elemento fijo de End𝕂 (V ) y 𝕂 [x] la 𝕂-álgebra de poli-
nomios con coeficientes en 𝕂.

Proposición 4.1.1. La función f : 𝕂 [x] −→ End𝕂 (V ) dada por

a(x) = a0 + a1 x + · · · + an x n ↦−→ a0 · iV + a1 · T + · · · + an · T n =: a(T ) (1.1)

es un homomorfismo de 𝕂-álgebras, donde iV es la función idéntica de V .

Demostración. Sean

a(x) = a0 + a1 x + · · · + an x n , b(x) = b0 + b1 x + · · · + bm x m ∈ 𝕂 [x]

y k ∈ 𝕂. Sin pérdida de generalidad podemos suponer que n = m. Entonces,

f [a(x) + b(x)] = f [(a0 + b0 ) + (a1 + b1 )x + · · · + (an + bn )x n ]


= (a0 + b0 ) · iV + (a1 + b1 ) · T + · · · + (an + bn ) · T n
= (a0 · iV + a1 · T + · · · + an · T n )
+ (b0 · iV + b1 · T + · · · + bn · T n )
= f (a(x)) + f (b(x)).

Además,

f [a(x)b(x)] = f (c(x)) = c0 · iV + c1 · T + · · · + c2n · T 2n ,


Í
con ci = i= j+l a j bl , para 1 ≤ i ≤ 2n; pero utilizando la distributividad del
anillo End𝕂 (V ) se verifica fácilmente que

(a0 ·iV +a1 ·T +· · ·+an ·T n )(b0 ·iV +b1 ·T +· · ·+bn ·T n ) = c0 ·I+c1 ·T +· · ·+c2n ·T 2n ,

es decir, f (c(x)) = f (a(x)) f (b(x)). Finalmente resulta evidente que


f (k · a(x)) = k · f (a(x)) y f (1) = iV . ✓

100 · Formas canónicas

Corolario 4.1.2. Sea a(x) como en la proposición 4.1.1 y v ∈ V . El producto

a(x) · v :=(a0 · iV + a1 · T + · · · + an · T n )(v)


=a0 · v + a1 · T (v) + · · · + an · T n (v) = a(T )(v)

dota a V una estructura de 𝕂 [x]-espacio izquierdo denotada por VT .

Demostración. Nótese que V tiene estructura de End𝕂 (V )-módulo izquier-


do con el producto H · v := H (v), H ∈ End𝕂 (V ), v ∈ V . La afirmación es
ahora evidente ya que f en (1.1) es un homomorfismo de anillos. ✓

Proposición 4.1.3. VT es un 𝕂 [x]-espacio finitamente generado y de torsión.

Demostración. Sea X = {x1 , . . . , xt } una base de V𝕂 . De la inclusión natural

l : 𝕂 −→ 𝕂 [x]
k ↦−→ k

concluimos que VT = 𝕂 [x] ⟨x1 , . . . , xt ⟩. De otra parte se tiene el isomorfismo


de 𝕂-álgebras End𝕂 (V ) = Mt (𝕂). Por lo tanto, dim𝕂 (End𝕂 (V )) = t 2 . Esto
último implica que f en (1.1) no puede ser inyectiva ya que de lo contrario
f (1), f (x), f (x 2 ), . . . sería un subconjunto infinito linealmente indepen-
diente de End𝕂 (V ), en contradicción con lo ya establecido. Así, ker( f ) ≠ 0.
Como 𝕂 [x] es un DIP se tiene

ker( f ) = ⟨qT (x)⟩,

con 0 ≠ qT (x) ∈ 𝕂 [x]. Sin pérdida de generalidad podemos tomar qT (x)


mónico. Resulta entonces que qT (x) · v = 0 para cada v ∈ VT , con lo cual VT
es de torsión. Nótese finalmente que

Ann𝕂 [x] (VT ) = ⟨qT (x)⟩. (1.2)




De acuerdo con este resultado podemos aplicar a VT la teoría de los es-
pacios finitamente generados de torsión sobre un DIP.

Definición 4.1.4. El polinomio qT (x) definido en (1.2) se denomina poli-


nomio mínimo de T.

Según (1.2) , qT (x) no depende de la base X elegida en V .

Proposición 4.1.5. Se tienen las siguientes propiedades para el polinomio qT (x):


Formas canónicas · 101

(i) Si q(x) ∈ 𝕂 [x] es tal que


q(x) · v = 0, para cada v ∈ VT , (1.3)
es decir, si q(T ) = 0, entonces qT (x) | q(x).

(ii) qT (x) es el polinomio mónico de menor grado tal que satisface (1.3) y es
único para T .
Demostración. (i) Sea q(x) ∈ 𝕂 [x] como en (1.3) . Entonces,
q(x) ∈ Ann𝕂 [x] (VT ) = ⟨qT (x)⟩,
con lo que qT (x) | q(x).
(ii) Sea p(x) mónico de 𝕂 [x] que satisface (1.3) . Por (i),
gr(qT (x)) ≤ gr(p(x)). Ahora, si p(x) es de grado mínimo entre los que
cumplen (1.3) , tenemos que gr(qT (x)) = gr(p(x)), por (i) y como qT (x)
y p(x) son mónicos, necesariamente qT (x) = p(x). ✓

Si A ∈ Mt (𝕂) es una matriz, A define una única transformación lineal


T : V −→ V en la base X. Notemos que qT (A) = 0. En efecto,
qT (mX (T )) = mX (qT (T )) = mX (0) = 0.
Tenemos así que existe al menos un polinomio mónico que se anula en A.
Consideremos la colección I de todos los polinomios de 𝕂 [x] que se anu-
lan en A; este conjunto es claramente un ideal de 𝕂 [x], luego I = ⟨qA (x)⟩
y el polinomio qA (x) se puede tomar mónico. Nótese que qA (x) es el poli-
nomio mónico de menor grado tal que qA (A) = 0. En efecto, sea p(x) un
polinomio mónico de grado mínimo tal que p(A) = 0, entonces p(x) ∈ I,
luego qA (x) | p(x), pero como p(x) es mónico y de grado mínimo, enton-
ces p(x) = qA (x). Se define elpolinomio mínimo de la matriz A por qA (x).
Nótese que qA (x) = qT (x). En efecto, ya sabemos que qT (A) = 0, luego
qA (x) | qT (x); pero también qA (T ) = 0 ya que
mX (qA (T )) = qA (mX (T )) = qA (A) = 0
y mX es inyectiva. Resulta, qT (x) | qA (x), con lo cual qT (x) = qA (x).
Definición 4.1.6. (i) Sea A = [ai j ] ∈ Mt (𝕂) una matriz cuadrada. Se
denomina polinomio característico de A, denotado por pA (x), al de-
terminante de la matriz característica
x − a11 −a12 · · · −a1t 
 
 −a21 x − a22 · · · −a2t 
xE − A :=  . ..  .
 
 .. .. ..
 . . . 
 −a
 t1 −a t2 · · · x − att 
102 · Formas canónicas

(ii) Sean 𝕂, V , T , X, t como en el corolario 4.1.3. Sea A = [ai j ] = mX (T )


la matriz de T en la base X. Se define el polinomio característico de
T por pT (x) := pA (x).
Nótese que gr(pT (x)) = t = dim𝕂 (V ); además, pT (x) es mónico y no
depende de la base X elegida en V . En efecto, si Y es otra base de V y
B := mY (T ), entonces

det(xE − B) = det(xE − C −1 AC) = det(C −1 (xE − A)C) = det(xE − A),

donde C es la matriz de cambio de la base X a la base Y .


Observemos que matrices similares tienen el mismo polinomio mínimo
ya que representan la misma transformación lineal. Lo mismo se tiene pa-
ra el polinomio característico. Las afirmaciones recíprocas no son siempre
ciertas, tal como lo ilustran las matrices
   
1 1 1 0
y .
0 1 0 1
Proposición 4.1.7. Sea V = V1 ⊕ · · · ⊕ Vr una descomposición de V en suma de
subespacios T-invariantes no triviales, es decir, T (Vj ) ⊆ Vj . Sea Tj la restricción
de T a Vj , 1 ≤ j ≤ r. Entonces,
(i) Existe una base X en V tal que la matriz de T en la base X es diagonal por
bloques.

(ii) det(T ) = det(T1 ) · · · det(Tr ).

(iii) pT (x) = pT1 (x) · · · pTr (x).

(iv) qT (x) = m. c. m.{qT1 (x), . . . , qTr (x)}


Demostración. (i) Si juntamos las bases de V1 , . . . , Vr obtenemos una base
de V , y en esta base la matriz de T es diagonal por bloques.
Ahora, teniendo en cuenta que el determinante, el polinomio caracterís-
tico y el polinomio mínimo de una transformación lineal coinciden con los
de su matriz en cualquier base, entonces basta probar las afirmaciones en el
caso matricial. Pero el determinante de una matriz diagonal en bloques es
el producto de los determinantes de sus bloques, luego las partes (ii)-(iii) ya
están probadas.
Resta demostrar la parte (iv). Sea
 A1 · · · 0 
A :=  ... . . . .. 


 . 
 0 ···
 Ar 
Formas canónicas · 103

y qA (x) el polinomio mínimo de A. Hagamos

m(x) := m. c. m.{qA1 (x), . . . , qAr (x)}.

Existen polinomios mi (x), 1 ≤ i ≤ r, tales que m(x) = qAi (x)mi (x). Se


debe entonces demostrar que qA (x) = m(x). Teniendo en cuenta que tanto
qA (x) como m(x) son mónicos, entonces basta demostrar que qA (x) | m(x)
y m(x) | qA (x). Sea m(x) = m0 + m1 x + · · · + ml x l , entonces

m(A) = m0 E + m1 A + · · · + ml Al
m0 E + m1 A1 + · · · + ml Al · · · 0 
1
.. ..
 
=
 .. 
 . . . 

 0 l
· · · m0 E + m1 Ar + · · · + ml Ar 

m(A1 ) · · · 0 
=  ... .. 

 ..
 . . 
 0
 · · · m(Ar ) 
qA (A1 )m1 (A1 ) · · · 0 
 1
.. ..

=
 .. 
 . . . 


 0 · · · qAr (Ar )mr (Ar ) 
= 0.

Esto garantiza que qA (x) | m(x).


Para demostrar la segunda parte basta mostrar que qA (x) es múltiplo de
cada qAi (x). Sea qA (x) = q0 + q1 x + · · · + qt x t , entonces qA (A) = 0, luego
q0 E + q1 A + · · · + qt At = 0 y
q1 A1 · · · 0  qt At · · · 0 
 1
 .. ..  + · · · +  .. ..
 
q0 I +  . . .. .. 
 .   .
 . . 

 0 · · · q1 Ar   0 ··· t
qt Ar 
 
qA (A1 ) · · · 0 
 .. .. 

= . . ..
 . 
 0
 · · · qA (Ar ) 
= 0,

luego qA (Ai ) = 0 para cada i, y esto indica que qA (x) es múltiplo de cada
qAi (x). ✓

Proposición 4.1.8. SeaVT un 𝕂 [x]-espacio cíclico con generador v0 . Sean qT (x) =


q0 + q1 x + · · · + qn−1 x n−1 + x n el polinomio mínimo de T y pT (x) su polinomio
característico. Entonces,
104 · Formas canónicas

(i) X := {v0 , T (v0 ), . . . , T n−1 (v0 )} es una 𝕂-base de V .

(ii)
0 0 ··· 0 −q0
 
1 0 ··· 0 −q1
 
mX (T ) = 0 1 ··· 0 −q2,
 
. .. . . .. ..
 ..

 . . . .

0 0 ··· 1 −qn−1 

denominada la matriz compañera del polinomio qT (x).

(iii) pT (x) = qT (x).

Demostración. (i) Dado que VT es cíclico, tenemos

VT  𝕂 [x]/Ann𝕂 [x] (V ) (𝕂 [x]-isomorfismo).

De acuerdo con (1.2) , Ann𝕂 [x] (VT ) = ⟨qT (x)⟩ (nótese que qT (x) ≠ 0 ya
que de lo contrario V no sería de dimensión finita sobre 𝕂). La inclusión
natural 𝕂 ↩→ 𝕂 [x] convierte a 𝕂 [x]/⟨qT (x)⟩ en un 𝕂-espacio vectorial con
base {1, x, . . . , x n−1 }, x i = x i + ⟨qT (x)⟩.
Si v ∈ VT , entonces v = q(x) · v0 , q(x) ∈ 𝕂 [x]; dado que 𝕂 [x] es un
dominio euclideano, v = qT (x)t(x)·v0 +r (x)·v0 , con r (x) = 0 ó gr(r (x)) < n,
resulta entonces v = r (x)·v0 ∈ ⟨v0 , T (v0 ), . . . , T n−1 (v0 )⟩, es decir,V = ⟨X⟩.
Sean ahora a0 , . . . , an−1 ∈ 𝕂 tales que

a0 · v0 + a1 · T (v0 ) + · · · + an−1 · T n−1 (v0 ) = 0,

entonces
(a0 + a1 x + · · · + an−1 x n−1 ) · v0 = 0,

y así
a0 + a1 x + · · · + an−1 x n−1 ∈ Ann𝕂 [x] (V ) = ⟨qT (x)⟩.

Por lo tanto, a0 +a1 ·x+· · ·+an−1 ·x n−1 = 0, de donde a0 = a1 = · · · = an−1 = 0.


(ii) La afirmación de esta parte se sigue de (i) y del hecho que

qT (x) · v0 = 0 = q0v0 + q1 · T (v0 ) + · · · + qn−1 · T n−1 (v0 ) + T n (v0 ).


Formas canónicas · 105

(iii) Dado que al multiplicar una matriz por una propiamente elemental
su determinante no varía, se tiene
x 0 ··· 0 q0 
 
−1 x · · · 0 q1 
 
pT (x) = det  0 −1 · · ·
 0 q2 

 . .. . . .. ..
 ..

 . . . . 

0
 0 ··· −1 x + qn−1 
 0 x2 · · · 0 q0 + q1 x 

−1 x · · · 0 q1 

= det  0 −1 · · ·
 0 q2 
 . .. . . .. ..
 ..

 . . . . 

0
 0 ··· −1 x + qn−1 
0
 0 ··· 0 q0 + q1 x + q2 x 2 
−1 0 · · ·
 0 q1 + q2 x 
= det  0 −1 · · ·
 0 q2 

 . .. . . .. ..
 ..

 . . . . 

0
 0 ··· −1 x + qn−1 
= ···
0
 0 ··· 0 q0 + q1 x + · · · + qn−1 x n−1 + x n 
−1 0 · · ·
 0 q1 + q2 x + · · · + x n−1 

q2 + q3 x + · · · + n n−2
 0 −1 · · · 0
 

= det  . .. . . .. .. 
 .. . . . .


0

0 ··· 0 qn−2 + qn−1 x + x 2 

 
0
 0 ··· −1 x + qn−1 

= qT (x). ✓

Regresamos al estudio de las componentes primarias de VT .

Proposición 4.1.9. Sea p(x) un polinomio mónico irreducible de 𝕂 [x]. La com-


ponente p(x)-primaria de VT es no nula si, y sólo si, p(x) | qT (x).
(p (x)) (p (x))
Demostración. ⇒): supongamos que VT ≠ 0 y sea 0 ≠ v ∈ VT . En-
tonces, Ann𝕂 [x] (v) = ⟨p(x) l ⟩, l ≥ 1 (véase [24]). Puesto que qT (x) · v = 0,
entonces p(x) l | qT (x), y por lo tanto, p(x) | qT (x).
⇐): sea qT (x) = p(x)q(x), con q(x) ∈ 𝕂 [x] mónico. Nótese que
gr(q(x)) < gr(qT (x)), así que, por la proposición 4.1.5, existe v ≠ 0 en
VT tal que q(x) · v ≠ 0, pero entonces p(x) · (q(x) · v) = qT (x) · v = 0, es
(p (x))
decir , VT ≠ 0. ✓

106 · Formas canónicas

De la afirmación anterior resulta inmediatamente la siguiente descom-


posición de VT en suma directa de sus componentes primarias.

Corolario 4.1.10. Sea

qT (x) = q1 (x) k1 · · · qr (x) kr (1.4)

la descomposición del polinomio mínimo de T en producto de mónicos irreducibles.


La descomposición de VT en suma de sus componentes primarias está dada por

VT = (VT ) (q1 (x)) ⊕ · · · ⊕ (VT ) (qr (x)) . (1.5)

Se puede ahora descomponer cada componente primaria en suma di-


recta de 𝕂 [x]-espacios cíclicos (véase [24]). Para simplificar un poco la no-
tación, escribimos
(VT ) (q j (x)) =: Vj , (1.6)
para 1 ≤ j ≤ r.

Lema 4.1.11. Con la notación anterior se tiene que:

(i) Vj es un 𝕂-subespacio T -invariante de V y entonces Tj := T |Vj es un 𝕂-


endomorfismo de Vj .

(ii) Sea qTj (x) el polinomio mínimo de Tj . Entonces,

qTj (x) = q j (x) k j y Vj = ker(q j (T ) k j ).

(iii) Si s j1 ≥ · · · ≥ s jl j ≥ 1 son los divisores elementales de Vj , escritos en orden


decreciente, entonces
s j1 = k j .

(iv) Sea pTj (x) el polinomio característico de Tj . Entonces,


s j1 +···+s jl j
pTj (x) = q j (x) .

(v) qTj (x) | pTj (x).

(vi) dim𝕂 (Vj ) = (s j1 + · · · + s jl j ) gr(q j (x)).

Demostración. (i) Dado que Vj es un 𝕂 [x]-subespacio de VT , este también


resulta ser 𝕂-subespacio de V . Además, Vj es T -invariante. En efecto,
T (Vj ) = x · Vj ⊆ Vj .
Formas canónicas · 107

(ii) Por (1.4) , qT (x) = q j (x) k j z j (x), con


k k
z j (x) := q1k1 (x) · · · q j−1
j−1 j+1
(x)q j+1 (x) · · · qrkr (x).
Sea v j ∈ Vj , entonces existe n ≥ 1 tal que q nj (x) · v j = 0. Como
m. c. d.(q nj (x), z j (x)) = 1, existen w(x), l (x) ∈ 𝕂 [x] tales que
1 = w(x)q nj (x) + l (x)z j (x),
luego
v j = w(x)q nj (x) · v j + l (x)z j (x) · v j = l (x)z j (x) · v j ,
k
de donde q j j (x) · v j = l (x)qT (x) · v j = 0. Hemos demostrado que para cada
k
j, qTj (x) | q j j (x).
Por otra parte, de acuerdo con (1.5) , cada elemento v ∈ V se puede
expresar en la forma
v = v1 + · · · + v j + · · · + vr , v j ∈ Vj .
Entonces,
k k +1
qTj (x)z j (x) · v = qTj (x)q1k1 (x) · · · q j−1
j−1 j
(x)q j+1 (x) · · · qrkr (x) · v = 0.
k
Resulta qT (x) | qTj (x)z j (x), con lo que q j j (x) | qTj (x).
Notemos que si v ∈ Vj , entonces q j (Tj ) k j (v) = 0, es decir,
q j (T ) k j (v) = 0,
luego v ∈ ker(q j (T ) k j ). Recíprocamente, si v ∈ ker(q j (T ) k j ), entonces
q j (T ) k j (v) = 0, luego q j (x) k j · v = 0, es decir, v ∈ Vj .
(iii) Se tiene el 𝕂 [x]-isomorfismo
s s jl
Vj  𝕂 [x]/⟨q j j1 (x)⟩ ⊕ · · · ⊕ 𝕂 [x]/⟨q j j (x)⟩, (1.7)
s
y Ann𝕂 [x] (Vj ) = ⟨q j j1 (x)⟩ = ⟨qTj (x)⟩, véase (1.2) , de modo que según (ii),
s j1 = k j .
(iv) En (1.7) cada sumando es un 𝕂 [x]-subespacio, luego también un 𝕂-
subespacio de Vj ; notemos que cada uno estos sumandos es Tj -invariante:
s
en efecto, sea Wi := 𝕂 [x]/⟨q j ji (x)⟩, 1 ≤ i ≤ l j , entonces Vj  W1 ⊕ · · · ⊕Wl j ;
sea w ∈ Wi , luego x · w ∈ Wi , es decir, T (w) ∈ Wi , luego Tj (Wi ) ⊆ Wi .
Tenemos que cadaWi es un 𝕂 [x]-espacio cíclico Tj -invariante, podemos
entonces aplicar las proposiciones 4.1.8 y 4.1.7 para obtener (iv).
(v) Consecuencia directa de (ii), (iii) y (iv).
(vi) Como el grado del polinomio característico pTj (x) de Tj coincide
con la dimensión de Vj , entonces (v) es consecuencia de (iv). ✓

108 · Formas canónicas

Definición 4.1.12. SeaVT descompuesto como en (1.5) . Los divisores ele-


mentales de VT se denominan divisores elementales de T .

De los resultados obtenidos podemos deducir uno de los teoremas bási-


cos y más importantes del álgebra lineal.

Teorema 4.1.13 (Teorema de Hamilton-Cayley) . Sea V un 𝕂-espacio de


dimensión finita y T : V −→ V una transformación lineal de V . Entonces,

qT (x) | pT (x).

Demostración. Por la parte (v) del lema 4.1.11, para cada 1 ≤ j ≤ r se tiene
que qTj (x) | pTj (x), pero de la proposición 4.1.7 y la descomposición (1.5)
resulta qT1 (x) · · · qTr (x) = q1k1 (x) · · · qrkr (x) = qT (x), y así qT (x) | pT (x). □

2. Forma canónica clásica


Aplicamos ahora los resultados anteriores al estudio de las llamadas formas
canónicas de una transformación lineal, o equivalentemente, de una matriz.
Comenzamos con la forma canónica clásica.
Según (1.5) , podemos elegir en cada Vj una base X j de tal manera que
X := rj=1 X j es una base de V y la matriz de T en dicha base toma la forma
Ð

mX (T1 ) · · · 0 
 1
.. ..

mX (T ) = 
 .. .

(2.1)
 . . . 
 0
 ··· mXr (Tr ) 

Pero, de acuerdo con (1.7) , podemos elegir la base X j de Vj de tal manera


que la matriz de Tj en dicha base sea diagonal en bloques:

 A j1 · · · 0 
mX j (Tj ) =  ... ..
 
 .. .

(2.2)
. .
 
 0 ···
 A jl j 

Por la proposición 4.1.8, el bloque A ji es la matriz compañera del polino-


mio q j (x) s ji de (1.7) . Queremos ahora descomponer cada bloque de (2.2)
de tal manera que aparezca la matriz compañera de q j (x).

Proposición 4.2.1. Sea V un 𝕂 [x]-espacio cíclico con generador v0 y supóngase


que el polinomio mínimo de T (véase la proposición 4.1.8) es de la forma q(x) s ,
Formas canónicas · 109

donde q(x) := q0 + q1 x + · · · + qn−1 x n−1 + x n es irreducible, s ≥ 1. Entonces, existe


una base X en V tal que la matriz T en dicha base es de la forma
C 0 ··· 0 

1 C ··· 0 

mX (T ) =  0 1 0  , (2.3)

. .. 
 .. .

0 · · ·
 1 C 
con s bloques C, donde C es la matriz compañera de q(x) y los 1 van dispuestos en
las entradas (n + 1, n), (2n + 1, 2n) . . . , ((s − 1)n + 1, (s − 1)n).
Demostración. Según la proposición 4.1.8, una 𝕂-base de V es

X ′ = {v0 , Tv0 , T 2v0 , . . . , T ns−1v0 }.

Nótese que

X := {v0 , Tv0 , . . . , T n−1v0 ; (2.4)


n−1
q(T )v0 , T q(T )v0 , . . . , T q(T )v0 ; (2.5)
q(T ) 2v0 , T q(T ) 2v0 , . . . , T n−1 q(T ) 2v0 ; (2.6)
..
. (2.7)
s−1 s−1 n−1 s−1
q(T ) v0 , T q(T ) v0 , . . . , T q(T ) v0 }, (2.8)

tiene ns elementos y satisface ⟨X ′⟩ = ⟨X⟩ = V : en efecto, basta mostrar que


cada elemento de X ′ está en ⟨X⟩. Es claro que v0 , Tv0 , . . . , T n−1v0 ∈ ⟨X⟩;
como
q(T )v0 = q0v0 + q1Tv0 + · · · + qn−1T n−1v0 + T n v0 ,
entonces

T n v0 = q(T )v0 − q0v0 − q1Tv0 − · · · − qn−1T n−1v0 ∈ ⟨X⟩


T n+1v0 = T q(T )v0 − q0Tv0 − · · · − qn−1T n v0 ∈ ⟨X⟩
..
.
T n+n−1v0 = T n−1 q(T )v0 − q0T n−1v0 − · · · − qn−1T 2n−2v0 ∈ ⟨X⟩
T 2n v0 = T n q(T )v0 − q0T n v0 − · · · − qn−1T 2n−1v0
= q(T ) 2v0 − q0 q(T )v0 − q1T q(T )v0 − · · · − qn−1T n−1 q(T )v0
− q0T n v0 − · · · − qn−1T 2n−1v0 ∈ ⟨X⟩,

continuando de esta manera, y por recurrencia, obtenemos lo anunciado.



Así, X es una base de V y es fácil ver que mX (T ) es como en (2.3) . □
110 · Formas canónicas

Reemplazando (2.3) en (2.2) , y luego en (2.1) , obtenemos la denomi-


nada matriz canónica clásica de T . Nótese que esta matriz canónica clásica
consta solamente de unos, ceros y los coeficientes de los factores irreduci-
bles q1 (x), . . . , qr (x) del polinomio mínimo qT (x). Para calcular la matriz
canónica clásica de T es necesario conocer el sistema de divisores elemen-
tales de T , es decir, de VT . Si A es una matriz, entonces A determina una
única transformación lineal T y se definen los divisores elementales de A
como el sistema de divisores elementales de T .

Corolario 4.2.2. (i) Sea T : V −→ V una transformación lineal de un


𝕂-espacio V de dimensión finita. Entonces, existe una base X en V tal que
la matriz de T en la base X es una matriz canónica clásica.

(ii) Toda matriz A ∈ Mn (𝕂) es similar a una única matriz canónica clásica.

(iii) Dos matrices cuadradas son similares si, y sólo si, tienen el mismo sistema de
divisores elementales.

Demostración. Las dos primeras afirmaciones fueron probadas en el desa-


rrollo de la presente sección. La tercera se tiene ya que matrices simila-
res representan la misma transformación lineal y, si dos matrices tienen el
mismo sistema de divisores elementales, entonces son similares a la misma
matriz canónica clásica, y por lo tanto, son similares. ✓

Ejemplo 4.2.3. Ilustramos a continuación el cálculo de las componentes


primarias del VT , donde T es una transformación lineal definida por me-
dio de una matriz. También calcularemos la base X que permite obtener la
forma diagonal en bloques dada en (2.1) . Consideremos la transformación
lineal T : ℝ4 −→ ℝ4 definida por la matriz

 1 −1 0 1 
 
0 3 1 0 
A= 
 .
2 1 2 −1
−3 −2 0 4 
 

Mediante cálculo manual o usando algún paquete de cómputo (por ejemplo,


SWP – Scientific WorkPlace) encontramos que

pA (x) = qA (x) = 36 − 60x + 37x 2 − 10x 3 + x 4 = (x − 2) 2 (x − 3) 2 ;


Formas canónicas · 111

debemos entonces calcular las componentes primarias de V := ℝ4 inducidas


por A, V1 = ker((A − 2E) 2 ), V2 = ker((A − 3E) 2 ). Tenemos

−2 −2 −1 1  1 0 −1 −1
  
2 2 1 −1 2 1 −1 −1
(A − 2E) 2 =  , (A − 3E) 2 = 
  
1 1 1 0 −3 −1 2 2 

−3 −3 −2 1  3 1 −2 −2
  

y calculamos las bases de sus núcleos:


 1 −1    1   1 
      
     
 0   1 
  , ker(A − 3E) 2 = −1 , −1 .
      
2
  
 

ker(A − 2E) =   ,  0 
−1  1   0 
     

    
 1   0 
 
 0   1  
       

La base buscada X es la unión de los cuatro vectores anteriores. Construi-


mos la matriz de cambio

 1 −1 1 1  0 1 1 1
 
0 1 −1 −1 −1 1 1 0 0
 
C =  ,C =  1 ,
 −1 0 1 0   1 1 0
1 0 0 1 0 1
−1 −1
 

y finalmente encontramos que

0 1 1 1 −1 0 1   1 −1 1
1 1 
  
1 1 00 3 1 0   0
0 1 −1 −1
 
1 1 12 1 2 −1 −1 0
0   1 0 
 
−1
 −1 0−3 −2 0 4   1
 1  0 0 1 
3 −1 0 0

1 1 0 0
=  .
0 0 3 0
0 0 −1 3

Ejemplo 4.2.4. Para la matriz A del ejemplo anterior podemos calcular


su forma canónica clásica: tenemos pA (x) = qA (x) = q1 (x) 2 q2 (x) 2 , con
q1 (x) = x − 2 y q2 (x) = x − 3, luego la forma buscada es

2 0 0 0

1 2 0 0

0 .
 0 3 0
0 0 1 3

112 · Formas canónicas

3. Forma canónica racional


La segunda forma canónica destacada es la racional, también denominada
forma canónica de Frobenius, en la cual intervienen los factores invariantes
de VT . Del corolario 4.1.10 y del teorema de estructura de los módulos
finitamente generados sobre DIPs (véase [24]) resulta

VT  𝕂 [x]/⟨q1 (x)⟩ ⊕ · · · ⊕ 𝕂 [x]/⟨qm (x)⟩, (3.1)

donde qi (x) | q j (x) para i ≤ j (cada qi (x) se puede tomar mónico). Existe
entonces una base X en V tal que
C1 · · · 0 
R := mX (T ) =  ... . . . ...  ,
 
(3.2)
 
 
 0 · · · Cm 
 
donde C j es la matriz compañera de q j (x). Nótese que

pT (x) = q1 (x) · · · qm (x),


(3.3)
⟨qm (x)⟩ = Ann𝕂 [x] (VT ), qT (x) = qm (x),

resultando otra demostración del teorema 4.1.13. Esta forma canónica cons-
ta de ceros, unos y los coeficientes de los factores invariantes.

Definición 4.3.1. La matriz R en (3.2) se denomina racional o de Frobe-


nius. Los polinomios q1 (x), . . . , qm (x) en (3.1) se denominan los factores
invariantes de la matriz R. Una transformación lineal T : V −→ V es ra-
cionalizable si existe una base X en V tal que mX (T ) es racional. Los fac-
tores invariantes de mX (T ) se denominan factores invariantes de T . Una
matriz A ∈ Mn (𝕂) es racionalizable si A es similar a una matriz racional R,
y los factores invariantes R se conocen como los factores invariantes de A.

Corolario 4.3.2. Sea T : V −→ V una transformación lineal sobre un


𝕂-espacio V de dimensión finita. Entonces, para cada base Y de V se cumple: T es
racionalizable si, y sólo si, mY (T ) es racionalizable.

Demostración. Esto es consecuencia del hecho que matrices similares repre-


sentan la misma transformación lineal. ✓

Corolario 4.3.3. (i) Toda transformación lineal T : V −→ V de un


𝕂-espacio V de dimensión finita es racionalizable.

(ii) Toda matriz A ∈ Mn (𝕂) es similar a una única matriz racional R.


Formas canónicas · 113

(iii) Dos matrices cuadradas son similares si, y sólo si, tienen los mismos factores
invariantes.

Demostración. La primera afirmación se tiene tal como vimos en (3.2) ; la


segunda es consecuencia de que una matriz representa una transformación
lineal, la unicidad se obtiene a su vez de la unicidad de los factores invarian-
tes de VT . La tercera resulta de que matrices similares representan la misma
transformación lineal y, si dos matrices tienen los mismos factores invarian-
tes, entonces son similares a la misma matriz racional, y por lo tanto, son
similares. ✓

En la proposición 4.1.8 vimos que si VT es un 𝕂 [x]-espacio cíclico, en-


tonces pT (x) = qT (x). Veamos ahora la afirmación recíproca.

Corolario 4.3.4. Sea T : V −→ V una transformación lineal de un 𝕂-espacio


de dimensión finita. VT es cíclico si, y sólo si, pT (x) = qT (x).

Demostración. La condición necesaria la vimos en la proposición 4.1.8. Su-


pongamos entonces que pT (x) = qT (x). Según (3.3) , VT tiene un solo factor
invariante, luego por (3.1) VT es cíclico. ✓

Ejemplo 4.3.5. En este ejemplo mostramos un procedimiento manual sen-


cillo para calcular los factores invariantes de una matriz, y en consecuencia,
su forma canónica racional. El método, sin embargo, no es eficiente para
matrices de dimensiones superiores. Calculemos entonces los factores in-
variantes de la matriz
 3 −4 −4
 
A = −1 3 2  .
 2 −4 −3
 

Notemos en primer lugar que si q(x) = q0 + q1 x + · · · + qn−1 x n−1 + x n y A es


la matriz compañera de p(x), entonces

q(x) 0

 1 
(xE − A) ∼  .
 
..

 . 

 0 1

114 · Formas canónicas

En efecto, vimos en la prueba de la proposición 4.1.8 que


0
 0 ··· 0 q0 + q1 x + · · · + qn−1 x n−1 + x n 
−1 0 · · ·
 0 q1 + q2 x + · · · + x n−1 

 0 −1 · · · 0 q2 + q3 x + · · · + n n−2
 

(xE − A) ∼  . .. . . .. .. ,
 .. . . . .


0 0 ··· 0 qn−2 + qn−1 x + x 2
 

 
0
 0 ··· −1 x + qn−1 

luego
 0 0 ···
 0 q(x)  q(x) 0
−1 0 · · · 0 0    1 
(xE − A) ∼  . ..  ∼  .
 
 .. .. . . .. ..
 . . . .   . 

 0 0 ··· −1 0   0 1

Por otra parte, si q1 (x), . . . , qm (x) son los factores invariantes de A, enton-
ces
q1 (x) 0
..

.
 
 
 
 qm (x) 
(xE − A) ∼  .
 1 

 .. 

 . 

 0 1

En efecto, como toda matriz es racionalizable, existe una matriz invertible
C tal que
 A1 0 

C −1 AC = 
 .. ,

 . 
0
 Am 
donde Ai es la compañera de qi (x), 1 ≤ i ≤ m. Entonces,
xE − A1 0 
 
C −1
(xE − A)C = 
 .. ,

 . 
 0
 xE − Am 
pero, por lo que acabamos de ver,
qi (x) 0

 1 
(xE − Ai ) ∼  ,
 
..

 . 

 0 1

Formas canónicas · 115

de modo que
q1 (x) 0
..

.
 
 
 
 qm (x) 
(xE − A) ∼  .
 1 

 .. 

 . 

 0 1

Con el soporte teórico anterior podemos resolver el ejercicio planteado:
x − 3 4 4   1 x − 3 −2 

(xE − A) =  1
 x − 3 −2  ∼ x − 3
  4 4 
 −2
 4 x + 3  −2
  4 x + 3
1
 x−3 −2 
∼ 0 −(x − 5)(x − 1) 2(x − 1) 
0
 2(x − 1) x − 1 
1 0 0 

∼ 0 −(x − 5)(x − 1) 2(x − 1) 

0
 2(x − 1) x − 1 
1 0 0  1 0 0 
 2

∼ 0 −(x − 1)
 0  ∼ 0 −(x − 1) 2 0 

0 2(x − 1) x − 1 0 0 x − 1
  
x − 1 0 0
 2
∼  0 −(x − 1) 0 ,
 0 0 1

entonces
pA (x) = (x − 1) 3 y qA (x) = (x − 1) 2 ,
y los factores invariantes de A son x − 1 y (x − 1) 2 . Finalmente, podemos
calcular la forma racional de A:
1 0 0 
 
0 0 −1 .
 
0 1 2 
 
Observación 4.3.6. Notemos que las entradas de la matriz xE − A están en
el dominio de ideales principales 𝕂 [x], por lo tanto, los factores invariantes
de la forma normal de Smith de esta matriz, los cuales son únicos (véase [24],
capítulo 8), coinciden con los de A calculados con el método descrito en el
ejemplo anterior.
116 · Formas canónicas

4. Forma canónica de Jordan


Presentamos en esta sección otra forma canónica importante para transfor-
maciones lineales y matrices.

Definición 4.4.1. Sea a ∈ 𝕂, la matriz cuadrada de orden k ≥ 1


a 0 · · · 0 0

1 a · · · 0 0
Ja,k :=  . . .

 .. .. .. .. .. 
 . .
0 0 · · ·
 1 a 

se denomina bloque elemental de Jordan de orden k perteneciente al esca-


lar a. La matriz diagonal de m ≥ 1 bloques
 J1 0 

Ja := 
 .. ,

 . 
0
 Jm 

donde cada J j es un bloque elemental de Jordan perteneciente a a y tal que

orden J1 ≤ orden J2 ≤ · · · ≤ orden Jm

se denomina bloque de Jordan perteneciente a a. Sean a1 , . . . , ar elemen-


tos diferentes de 𝕂. La matriz diagonal de r bloques de Jordan, r ≥ 1,

 Ja 0 
 1
J := 
 .. ,

 . 
0
 Jar 

con Jai un bloque de Jordan perteneciente a ai se denomina matriz diago-


nal en bloques de Jordan pertenecientes a a1 , . . . , ar . Una transformación
lineal T : V −→ V de un 𝕂-espacio de dimensión finita se dice diago-
nalizable en bloques de Jordan si existe una base X en V tal que mX (T )
es una matriz diagonal en bloques de Jordan. Una matriz cuadrada se dice
diagonalizable en bloques de Jordan si es similar a una matriz diagonal en
bloques de Jordan.

Corolario 4.4.2. Sea T : V −→ V una transformación lineal sobre un


𝕂-espacio V de dimensión finita. Entonces, para cada base X de V se cumple:
T es diagonalizable en bloques de Jordan si, y sólo si, mX (T ) es diagonalizable en
bloques de Jordan.
Formas canónicas · 117

Demostración. Dado que matrices similares representan la misma transfor-


mación lineal se tiene entonces la afirmación de la proposición. ✓

Ya se demostró que toda transformación T de un espacio vectorial finito


dimensional es reducible a la forma canónica clásica, o equivalentemente,
que toda matriz cuadrada es similar a una matriz canónica clásica. Se pro-
baron resultados análogos para la forma canónica racional. Mostraremos
en seguida que para cuerpos algebraicamente cerrados toda transformación
lineal ( = toda matriz cuadrada) sobre un espacio finito dimensional es dia-
gonalizable en bloques de Jordan.
Definición 4.4.3. Una transformación lineal T es nilpotente si existe s ≥ 1
tal que T s = 0. El menor s con esta propiedad se llama índice de nilpotencia
de T .
Proposición 4.4.4. Sea T : V −→ V una transformación nilpotente de un
𝕂-espacio V de dimensión finita n ≥ 1 con índice de nilpotencia s ≥ 1. Entonces
existe una base Y en V tal que
C1 0 

mY (T ) = 
 .. ,

 . 
0
 Cm 
con
0 0 · · · 0 0

1 0 · · · 0 0
C j :=  . . .. ..  , de tamaño s j × s j , (4.1)

 .. .. ..
 . . .
0 0 · · · 1 0

s1 + · · · + sm = n, 1 ≤ s1 ≤ s2 ≤ · · · ≤ sm , sm = s, qT (x) = x s , m = número de
factores invariantes de T , y además, m = dim(ker(T )).
Demostración. Sean q1 (x), . . . , qm (x) los factores invariantes de T . Según
(3.3) , qT (x) = qm (x); sea s := índice de nilpotencia de T , entonces
qm (x) = x s , de donde q j (x) = x s j , con 1 ≤ s1 ≤ s2 ≤ · · · ≤ sm = s. Nó-
tese que la matriz compañera de q j (x) es efectivamente (4.1) . Según (3.3) ,
n = gr(pT (x)) = s1 + · · · + sm . Aplicamos entonces (3.2) .
Veamos la prueba de la última afirmación de la proposición, es decir,

m = dim(ker(T )).

Según (3.1) , VT tiene la descomposición en suma de 𝕂 [x]-subespacios cí-


clicos
VT = ⟨w1 ⟩ ⊕ · · · ⊕ ⟨wm ⟩, con ⟨w j ⟩  𝕂 [x]/⟨x s j ⟩.
118 · Formas canónicas

La idea es probar que {T s1 −1 (w1 ), . . . , T sm −1 (wm )} es una base de ker(T ).


Si w ∈ ker(T ), entonces w = u1 + · · · + um , donde u j es un elemento de
⟨w j ⟩, 1 ≤ j ≤ m. Entonces,

w = g1 (T ) (w1 ) + · · · + gm (T )(wm ),

donde el grado de g j (x) se puede tomar inferior a s j . Se tiene que T (w) = 0,


pero como la suma es directa, se concluye que g j (T )T (w j ) = 0. Esto implica
que x s j divide a g j (x)x, pero por la escogencia del grado de g j (x) se tiene
que g j (x)x = b j x s j , b j ∈ 𝕂. Por lo tanto, g j (x) = b j x s j −1 , y en consecuencia,

w = b1T s1 −1 (w1 ) + · · · + btT st −1 (wm ).

La independencia lineal se obtiene de la suma directa y de que

⟨x s j ⟩ = Ann𝕂 [x] (w j ). ✓

Teorema 4.4.5. Sea T : V −→ V una transformación lineal de un 𝕂-espacio


de dimensión finita n ≥ 1. Supóngase que pT (x) se descompone completamente en
𝕂 [x] en producto de factores lineales (esto ocurre, por ejemplo, si 𝕂 es algebrai-
camente cerrado). Entonces, T es diagonalizable en bloques de Jordan de manera
única, salvo el orden de disposición de los bloques.
Demostración. Sea

pT (x) := (x − a1 ) n1 · · · (x − ar ) nr ,

con a1 , . . . , ar elementos diferentes de 𝕂, 1 ≤ n j ≤ n, 1 ≤ j ≤ r. Se-


gún (3.3) , pT (x) y qT (x) tienen los mismos factores irreducibles (aunque
no necesariamente con la misma multiplicidad). Entonces,

qT (x) = (x − a1 ) k1 · · · (x − ar ) kr , 1 ≤ kj ≤ nj.

Sean Vj y Tj como se definieron en (1.6) y en el lema 4.1.11. Para cada


1 ≤ j ≤ r, consideremos la transformación lineal

Tj′ := Tj − a j iVj : Vj −→ Vj .

Por el lema 4.1.11, el polinomio mínimo de Tj es (x − a j ) k j , luego Tj′ es


nilpotente de índice k j . De acuerdo con la proposición 4.4.4, para cada
1 ≤ j ≤ r existe una base Y j en Vj tal que
C j1 0 

mY j (Tj′) = 
 .. ,

 . 
 0
 C jm j 
Formas canónicas · 119

con cada bloque como en (4.1) y de orden s ji .


Nótese que s jm j = k j , m j = número de factores invariantes de Tj′, y tal
como vimos en la la proposición 4.4.4,

m j = dim(ker(Tj′)) = dim(ker(Tj − a j iVj )) = dim(ker(T − a j iV )). (4.2)

En efecto, la última igualdad se tiene ya que ker(Tj − a j iVj ) = ker(T − a j iV )


(véase el lema 4.1.11, parte (ii)). Además, 1 ≤ s j1 ≤ s j2 ≤ · · · ≤ s jm j ,
Ð
s j1 + · · · + s jm j = n j . Según (1.5), si Y := Y j , entonces

mY (T1 ) 0 
 1 
mY (T ) = 
 .. .

 . 
 0
 mYr (Tr ) 

Pero mY j (Tj ) = mY j (Tj′) + mY j (a j iVj ) y mY j (Tj ) es un bloque de Jordan de a j :

 a j  
 bloque elemental
 
 .. 
.

 1
de orden s j1
 
  

 1 a j  

mY j (Tj ) = 
 .. .

 . 
 a j 
bloque elemental
  
  .. 
 1 . 
 de orden s jm j  



 1 a j  

Nótese que en la forma canónica de Jordan aparecen sólo ceros, unos y las
raíces del polinomio característico. La unicidad de estas últimas, la unicidad
de las componentes primarias en (1.5) y la unicidad de los factores invarian-
tes, determinan la unicidad de la estructura de los bloques de Jordan, salvo
el orden de disposición. ✓

Corolario 4.4.6. Sea 𝕂 un cuerpo algebraicamente cerrado. Dos matrices cua-


dradas son similares si, y sólo si, tienen la misma forma canónica de Jordan.

Demostración. Sean A, B ∈ Mn (𝕂) similares, A ≈ J1 y B ≈ J2 , con J1 y J2


matrices diagonales en bloques de Jordan. Por transitividad J1 ≈ J2 . Puesto
que matrices similares representan la misma transformación lineal, se sigue,
por la unicidad expuesta en el teorema 4.4.5, que J1 = J2 (salvo el orden
de los bloques). Recíprocamente, si A ≈ J ≈ B, entonces A ≈ B. ✓

120 · Formas canónicas

Ejemplo 4.4.7. En este ejemplo mostramos una matriz invertible C tal que
C −1 AC es una matriz de Jordan, con

4 1 1 1 

−1 2 −1 −1
A =  .
 6 1 −1 1 

−6 −1 4 2 

Consideramos a la matriz A como una transformación lineal de ℝ4 en ℝ4 en


la base canónica. Determinemos en primer lugar el polinomio característico
y el polinomio mínimo de A : pA (x) = (x + 2)(x − 3) 3 , qA (x) = (x + 2)(x −
3) 2 . De acuerdo con la prueba del teorema 4.4.5, el número de bloques de
Jordan es 2, uno correspondiente al valor −2 y otro correspondiente a 3.
Además se tiene que ℝ4 = V1 ⊕ V2 , con

V1 = ker(A + 2E) = ⟨(0, 0, −1, 1)⟩,


V2 = ker[(A − 3E) 2 ] = ⟨(1, 0, 1, 0), (0, 1, 0, 0), (0, 0, 0, 1)⟩.

Según la proposición 4.4.4, el número de bloques elementales de Jordan


correspondiente a −2 viene dado por dim(ker(A + 2E)) y el número co-
rrespondiente a 3 es dim(ker(A − 3E)). Pero ker(A + 2E) = ⟨(0, 0, −1, 1)⟩
y ker(A − 3E) = ⟨(0, −1, 0, 1) , (1, −2, 1, 0)⟩, luego dim(ker(A + 2E)) = 1
y dim(ker(A − 3E)) = 2. Para el valor 3 se tiene que el tamaño del segun-
do bloque elemental de Jordan viene dado por la multiplicidad de 3 en el
polinomio mínimo, que en este caso es 2. Ya podemos entonces mostrar la
forma de Jordan de la matriz A:

−2 0 0 0
0 3 0 0
J= .
0 0 3 0
0 0 1 3

Para calcular la matriz C debemos encontrar bases X1 en V1 y X2 en V2


de tal forma que C es la matriz de cambio de la base canónica de ℝ4 a la
base X = X1 ∪ X2 . Consideremos

A1′ := A + 2E : V1 −→ V1 ,
A2′ := A − 3E : V2 −→ V2 .

Nótese que A1′ es nilpotente de índice 1 y A2′ es nilpotente de índice 2.


Según la prueba de la proposición 4.4.4, debemos descomponer V1 y V2
en suma directa de subespacios cíclicos. Tal como vimos anteriormente, el
Formas canónicas · 121

número de sumandos cíclicos de V1 es 1 = dim(ker(A + 2E)) y coincide


con el número de factores invariantes de A1′ ; de igual manera, el número
de sumandos cíclicos de V2 es 2 = dim(ker(A − 3E)) y coincide con el
número de factores invariantes de A2′ . Pero V1 = ⟨(0, 0, −1, 1)⟩, entonces
la descomposición cíclica de V1 es trivial: V1 = ⟨v1 ⟩ con v1 := (0, 0, −1, 1),
y en consecuencia,
X1 = {(0, 0, −1, 1)}.
Para V2 los factores invariantes de A2′ son x y x 2 . Necesitamos dos vectores
v2 , v3 ∈ V2 de tal forma que

V2 = ⟨v2 ⟩ ⊕ ⟨v3 ⟩,

donde el polinomio anulador de v2 es x y el polinomio anulador de v2 sea


x 2 . La base buscada en V2 es X2 = {v2 , v3 , A2′ v3 }. Resulta entonces que
x · v2 = 0, es decir, A2′ v2 = 0, con lo cual v2 ∈ ker(A2′ ) = ker(A − 3E), luego
podemos tomar por ejemplo v2 = (0, −1, 0, 1). Nótese que en calidad de
v3 podemos tomar a (0, 0, 0, 1) de tal forma que A2′ (v3 ) = (1, −1, 1, −1).
Se tiene entonces que

X2 := {(0, −1, 0, 1), (0, 0, 0, 1), (1, −1, 1, −1)}

es una base de V2 . La matriz C es


0 0 0 1  1 0 −1 0
 
 0 −1 0 −1 −1 −1 0 0
C =   , C −1 =  ,
 −1 0 0 1 

1
 1 1 1
1 1 1 −1 1 0 0 0
 
−2 0 0 0

−1
0 3 0 0
C AC =  .
0 0 3 0
0 0 1 3

5. Forma canónica diagonal: valores y


vectores propios
Estudiaremos ahora la forma canónica más sencilla, pero a su vez muy exi-
gente, para una transformación lineal o matriz: la forma diagonal. Al igual
que en la forma canónica de Jordan, la diagonalización requiere que el po-
linomio mínimo tenga un aspecto especial, razón por la cual no todo ope-
rador lineal (matriz) ha de ser diagonalizable.
122 · Formas canónicas

Definición 4.5.1. Sea T : V −→ V una transformación lineal de un espacio


V de dimensión finita n ≥ 1. Se dice que T es diagonalizable si existe una
base X en V tal que mX (T ) es una matriz diagonal. Una matriz A de orden
n ≥ 1 se dice que es diagonalizable si A es similar a una matriz diagonal.

Corolario 4.5.2. Sea T : V −→ V una transformación lineal de un espacio


V de dimensión finita n ≥ 1 y sea X una base cualquiera de V . Entonces, T es
diagonalizable si, y sólo si, mX (T ) es diagonalizable.

Demostración. Teniendo en cuenta que matrices que representen la misma


transformación lineal son similares, se tiene el resultado. ✓

Teorema 4.5.3. Sea T : V −→ V una transformación lineal de un espacio V de


dimensión finita n ≥ 1. T es diagonalizable si, y sólo si, el polinomio mínimo de T
es de la forma

qT (x) = (x − a1 ) · · · (x − ar ), a j ∈ 𝕂, 1 ≤ j ≤ r. (5.1)

Demostración. ⇒): sea X una base de V tal que la matriz de T es diagonal,

 a1 · · · 0 
mX (T ) =  ... . . . ..  .


 . 
0 ···
 an 

Nótese que mX (T ) es la forma canónica de Jordan de T ; además, el polino-


mio característico de T es pT (x) = (x − a1 ) n1 · · · (x − ar ) nr , con a1 , . . . , ar los
diferentes escalares en la diagonal de mX (T ) y n j la multiplicidad de a j , 1 ≤
j ≤ r. Luego el polinomio mínimo de T es de la forma
qT (x) = (x − a1 ) k1 · · · (x − ar ) kr , con k j ≥ 1. Si para algún j, k j ≥ 2, en-
tonces en la forma de Jordan de T aparecerían unos debajo de la diagonal,
por lo tanto, k j = 1 para cada j.
⇐): si qT (x) es como en (5.1) , entonces la notación y demostración del
teorema 4.4.5 indican que cada s jm j = 1, pero esto significa que la matriz de
Jordan de T es diagonal, es decir, T es diagonalizable. ✓

En la sección anterior nos encontramos con el cálculo del núcleo de ope-


radores de la forma T − a · iV , con T : V −→ V una transformación lineal y
a ∈ 𝕂 un escalar, así, los elementos de este núcleo son vectores v ∈ V tales
que T (v) = a · v. Tales vectores ocupan un lugar destacado en álgebra lineal
clásica y los definiremos a continuación. A través de los valores y vectores
propios podemos también presentar otros criterios de diagonalización de
operadores lineales.
Formas canónicas · 123

Definición 4.5.4. Sea T : V −→ V una transformación de un 𝕂-espacio


V . Un escalar a ∈ 𝕂 se dice que es un valor propio de T si existe un vector
no nulo v ∈ V tal que T (v) = a · v. En tal caso se dice que v es un vector
propio de T perteneciente al valor propio a.

Nótese que un vector propio solo puede pertenecer a un solo valor pro-
pio.

Ejemplo 4.5.5. Para la transformación lineal T : ℝ2 −→ ℝ2 definida por


T [x, y]T := [2x, 3y]T , a = 2 es un valor propio con vector propio [6, 0]T ;
a = 3 es también un valor propio de T con vector propio [0, −2]T .

Si a ∈ 𝕂, el conjunto

E(a) := {v ∈ V | T (v) = a · v} (5.2)

es un subespacio de V ; nótese que E(a) ≠ 0 si, y sólo si, a es un valor propio


de T .

Definición 4.5.6. El espacio E(a) definidio en (5.2) se denomina el espa-


cio propio de T correspondiente al valor propio a.

Las definiciones de vector propio, valor propio y espacio propio aplican


para espacios vectoriales arbitrarios, no necesariamente de dimensión finita.

Ejemplo 4.5.7. Sea D el operador derivación definido sobre el espacio de


funciones reales cuyas derivadas de cualquier orden existen, y sea a ∈ ℝ;
entonces E(a) = {ce ax | c ∈ ℝ}.

Ejemplo 4.5.8. Existen transformaciones lineales sin valores propios, es


decir, E(a) = 0, para cada a ∈ 𝕂. En efecto, la transformación

T : ℝ2 −→ ℝ2 ,
T [x, y]T = [y, −x]T

no tiene valores propios.

Proposición 4.5.9. Sea T : V −→ V una transformación lineal de un espacio


V . Sean a1 , . . . , ar valores propios diferentes con vectores propios v1 , . . . , vr , res-
pectivamente. Entonces, v1 , . . . , vr son linealmente independientes. En particular,
si V es de dimensión finita n ≥ 1, entonces T tiene a lo sumo n valores propios dife-
rentes. Si T tiene exactamente n valores propios diferentes, entonces {v1 , . . . , vn }
es una base de V .
124 · Formas canónicas

Demostración. La prueba de la primera afirmación se realiza por inducción.


Las otras dos afirmaciones son consecuencia directa de la primera.
n = 1: si a es un valor propio y v ≠ 0 es un vector propio asociado al
valor a, entonces {v} es linealmente independiente.
Supóngase que la afirmación ha sido probada para n − 1 valores propios
diferentes. Sean a1 , . . . , an valores propios diferentes para T con vectores
propios v1 , . . . , vn . Sean b1 , . . . , bn escalares tales que b1 ·v1 +· · ·+bn ·vn = 0.
Aplicando T y multiplicando por an se pueden restar las dos relaciones y
obtener

(b1 a1 − b1 an ) · v1 + · · · + (bn−1 an−1 − bn−1 an ) · vn−1 = 0.

Aplicando inducción resulta entonces que b1 = · · · = bn−1 = 0, de donde


bn = 0. Esto prueba que los vectores v1 , . . . , vn son linealmente indepen-
dientes. ✓

El recíproco de la proposición anterior no es siempre cierto; por ejemplo,


si T = iV , cualquier base de V pertenece a 1, que es el único valor propio de
iV .

Ejemplo 4.5.10. Sea 𝕂 [x] el conjunto de polinomios con coeficientes en el


cuerpo 𝕂, y sea T : V −→ V una transformación lineal. Entonces, para cada
polinomio p(x) ∈ 𝕂 [x] se tiene que si a ∈ 𝕂 es un valor propio de T con
vector propio v, luego p(a) es un valor propio de p(T ) con vector propio v.
En tal caso, E(a) ⊆ ker(p(T )) si a es raíz de p(x), y E(a) ⊆ Im(p(T )) si a
no es raíz de p(x).

El polinomio característico es un instrumento para determinar los valo-


res propios de una transformación lineal.

Proposición 4.5.11. Sea T : V −→ V una transformación lineal de un espacio


V de dimensión finita n ≥ 1 y sea a ∈ 𝕂. Entonces, a es un valor propio de T si,
y sólo si, pT (a) = 0.

Demostración. ⇒): sea v un vector propio de a, entonces T (v) = a · v, luego


(T − a · iV ) (v) = 0, es decir, T − a · iV no es una transformación inyectiva.
Esto implica que si X es una base cualquiera que fijamos en V , entonces
mX (T − a · iV ) tiene determinante igual a cero, es decir, det(A − aE) = 0,
donde A es la matriz de T en la base X. Por lo tanto, pA (a) = 0, es decir, a
es raíz del polinomio característico de A, o sea del polinomio característico
de T .
⇐): si a es raíz de pT (x), entonces a es raíz de pA (x). Por lo tanto,
det(A − aE) = 0, luego mX (T − a · iV ) no es invertible. Esto garantiza que
Formas canónicas · 125

T − a · iV no es invertible, y en consecuencia, no es inyectiva, es decir, existe


v no nulo en V tal que (T − a · iV ) (v) = 0, es decir, T (v) = a · v. Esto quiere
decir que v es vector propio con valor propio a. ✓

Este resultado es válido para valores a ∈ 𝕂, podría ocurrir que las raíces
del polinomio característico no pertenezcan al cuerpo 𝕂, por ejemplo, en el
caso en que 𝕂 sea el cuerpo de números reales y todas las raíces de pT (x)
sean complejas, entonces no tendríamos valores propios. Esta situación no
se presenta por supuesto en cuerpos algebraicamente cerrados.

Corolario 4.5.12. Sea 𝕂 un cuerpo algebraicamente cerrado y sea T : V −→ V


una transformación lineal de un 𝕂-espacio V de dimensión finita n ≥ 1. Entonces,
T tiene n valores propios (no necesariamente diferentes) correspondientes a las n
raíces de su polinomio característico.

No sobra reformular las nociones de valores y vectores propios para ma-


trices.

Definición 4.5.13. Sea A ∈ Mn (𝕂) una matriz cuadrada de orden n ≥ 1.


Un elemento a ∈ 𝕂 se dice que es un valor propio de A si existe vector no
nulo u := [u1 , . . . , un ]T ∈ 𝕂 n tal que Au = a · u. Se dice u es un vector
propio de A correspondiente al valor propio a.

La teoría de valores y vectores propios para matrices está relacionada de


manera obvia con la correspondiente teoría para transformaciones lineales.

Corolario 4.5.14. SeanT : V −→ V una transformación lineal de un 𝕂-espacio


V de dimensión finita n ≥ 1, X := {v1 , . . . , vn } una base de V ,
A := mX (T ) y a ∈ 𝕂. Entonces, a es un valor propio de T si, y sólo si, a es
un valor propio de A. Más exactamente, v = u1 · v1 + · · · + un · vn es un vector
propio de T perteneciente al valor propio a si, y sólo si, [u1 , . . . , un ]T es un vector
propio de A perteneciente al valor propio a.

Teorema 4.5.15. Sea T : V −→ V una transformación lineal de un espacio


V de dimensión finita n ≥ 1. T es diagonalizable si, y sólo si, V tiene una base
constituida por vectores propios.

Demostración. ⇒): existe una base X := {x1 , . . . , xn } en V tal que mX (T ) es


diagonal, digamos
d1 ··· 0 

mX (T ) = 
 .. .

 . 
0
 ··· dn 
126 · Formas canónicas

Esto indica que T (x1 ) = d1 · x1 , . . . , T (xn ) = dn · xn . Puesto que los vectores


x1 , . . . , xn son no nulos, entonces estos vectores son propios.
⇐): sea X = {x1 , . . . , xn } una base de vectores propios. Entonces, exis-
ten escalares d1 , . . . , dn en 𝕂 tales que T (x1 ) = d1 · x1 , . . . , T (xn ) = dn xn .
Nótese que entonces la matriz de T es la base X es diagonal y sus elementos
diagonales son precisamente d1 , . . . , dn . ✓

Sea A ∈ Mn (𝕂) una matriz diagonalizable. Entonces existe una matriz


invertible C tal que C −1 AC = D, donde D es una matriz diagonal. La de-
mostración del teorema anterior nos da una manera de encontrar la matriz
diagonalizante C. En efecto, sea Y la base canónica de 𝕂 n , entonces sabe-
mos que A es la matriz de una transformación T : 𝕂 n −→ 𝕂 n , A = mY (T ).
Como A es diagonalizable, entonces T es diagonalizable. Según la demos-
tración del teorema anterior, existe una base X = {x1 , . . . , xn } en 𝕂 n de
vectores propios de T de tal forma que mX (T ) = D, donde D es una matriz
diagonal. Entonces, D = mX (T ) = C −1 mY (T )C, donde C es la matriz de
cambio de la base Y a la base X. Es decir, la i-ésima columna de C son los
coeficientes de la expansión del i-ésimo vector xi a través de la base canó-
nica Y , es decir, las coordenadas del vector columna xi . En otras palabras,
las columnas de C son los vectores columna x1 , . . . , xn (nótese que, según
el corolario 4.5.14, cada vector columna xi es un vector propio de A).
Corolario 4.5.16. Sea A una matriz cuadrada de orden n ≥ 1. Entonces,
(i) A es diagonalizable si y sólo si, A tiene n vectores propios linealmente inde-
pendientes.

(ii) Si A tiene n valores propios diferentes, entonces A es diagonalizable.


Demostración. Consecuencia inmediata de los resultados precedentes. ✓

Proposición 4.5.17. Sea T : V −→ V una transformación lineal de un espacio


V de dimensión finita n ≥ 1. Sean a1 , . . . , ar los valores propios diferentes pa-
ra T , 1 ≤ r ≤ n, y E(a1 ), . . . , E(ar ) los subespacios propios correspondientes.
Entonces, la suma E(a1 ) + · · · + E(ar ) es directa. En consecuencia,

dim(E(a1 ) ⊕ · · · ⊕ E(ar )) = dim(E(a1 )) + · · · + dim(E(ar )).

Demostración. Sean u1 ∈ E(a1 ), . . . , ur ∈ E(ar ) tales que u1 + · · · + ur = 0,


supongamos que alguno de estos sumandos es no nulo; sean u1 , . . . , us ,
1 ≤ s ≤ r los no nulos. Como u1 , . . . , us son vectores propios correspon-
dientes a valores propios diferentes, entonces son linealmente independien-
tes, pero esto contradice la condición u1 + · · · + us = 0. Por lo tanto, ui = 0,
para cada 1 ≤ i ≤ r. ✓

Formas canónicas · 127

Podemos probar ahora un criterio de diagonalización en términos del


polinomio característico y de los espacios propios.

Teorema 4.5.18. SeaT : V −→ V una transformación lineal de un espacio V de


dimensión finita n ≥ 1. Sean a1 , . . . , ar los valores propios diferentes para T , 1 ≤
r ≤ n, y E(a1 ), . . . , E(ar ) los subespacios propios correspondientes. Entonces, las
siguientes condiciones son equivalentes:

(i) T es diagonalizable.

(ii) El polinomio característico de T es de la forma

pT (x) = (x − a1 ) n1 . . . (x − ar ) nr ,

donde ni = dim(E(ai )), 1 ≤ i ≤ r.

(iii) dim(V ) = dim(E(a1 )) + · · · + dim(E(ar )).

(iv) V = E(a1 ) ⊕ . . . ⊕ E(ar ).

Demostración. (i) ⇒ (ii): por el teorema 4.5.15, V tiene una base


X = {v1 , . . . , vn } constituida por vectores propios. Se ordena esta base de
tal manera que los primeros n1 vectores correspondan al valor propio a1 ,
los siguientes n2 vectores correspondan al valor a2 y así sucesivamente. En-
tonces, la matriz de T en esta base toma la forma
 a1 E · · · 0 
mX (T ) =  ... ..
 
 .. ,

 . . 
 0 ···
 ar E 

donde ai E es una matriz diagonal de orden ni ,


 ai ··· 0 
ai E =  ... ..  ,

 ..
 . . 
0
 ··· ai 

1 ≤ i ≤ r. El polinomio característico de T es

pT (x) = (x − a1 ) n1 · · · (x − ar ) nr .

Se verá ahora que ni = dim(E(ai )). Puesto que gr(pT (x)) = n, entonces
n = n1 + · · · + nr . Por la forma como se ha organizado la base X, se tiene
que V = ⟨X⟩ ⊆ E(a1 ) + · · · + E(ar ), es decir, V = E(a1 ) + · · · + E(ar ),
luego por la proposición 4.5.17, n = dim(E(a1 )) + · · · + dim(E(ar )). Se
128 · Formas canónicas

sabe que ni ≤ dim(E(ai )), para cada 1 ≤ i ≤ r; supóngase que existe i tal
que ni < dim(E(ai )), entonces

n = n1 + · · · + nr < dim(E(a1 )) + · · · + dim(E(ar )) = n.

Esto indica que ni = dim(E(ai )), para cada 1 ≤ i ≤ r.


(ii) ⇒ (iii): dim(V ) = n = n1 + · · · + nr = dim(E(a1 )) + · · · + dim(E(ar )).
(iii) ⇒ (iv): tenemos

dim(V ) = dim(E(a1 )) + · · · + dim(E(ar )) = dim(E(a1 ) + · · · + E(ar )),

de donde V = E(a1 ) + · · · + (E(ar ); además, por la proposición 4.5.17, la


suma es directa, es decir, V = E(a1 ) ⊕ · · · ⊕ E(ar ).
(iv) ⇒ (i): al reunir las bases de E(a1 ), . . . , E(ar ) se obtiene una base
de V constituida por vectores propios, lo cual, de acuerdo con el teorema
4.5.15, garantiza que T es diagonalizable. ✓

Ejemplo 4.5.19. (i) Sean 𝕂 un cuerpo y U , V espacios vectoriales no nulos


de dimensión finita. Sean T : U −→ U y F : V −→ V transformaciones
lineales, a un valor propio de T con vector propio u y b un valor propio de
F con vector propio v. Entonces, ab es un valor propio de T ⊗ F con vector
propio u ⊗ v. En efecto,

(T ⊗ F ) (u ⊗ v) = T (u) ⊗ F (v) = (a · u) ⊗ (b · v) = ab · (u ⊗ v).

Según el corolario 3.1.7, u ⊗ v es no nulo.


En forma matricial, sean A ∈ Mn (𝕂) y B ∈ Mm (𝕂) matrices, a un valor
propio de A con vector columna propio u y b un valor propio de B con
vector columna propio v. Entonces, u ⊗ v es un vector propio de A ⊗ B con
valor propio ab.
(ii) Sean A ∈ Mn (𝕂) y B ∈ Mm (𝕂) matrices diagonalizables, entonces
A ⊗ B es diagonalizable.

Ejemplo 4.5.20. En este ejemplo mostraremos una aplicación del produc-


to tensorial de matrices y de la forma canónica de Jordan. Sean A, B y C
matrices complejas de tamaños n × n, m × m y n × m, respectivamente. Su-
póngase que para cada valor propio 𝛼 de A y cada valor propio 𝛽 de B se
cumple que 𝛼 + 𝛽 ≠ 0. Demostremos entonces que la ecuación matricial
AX + XB = C tiene solución única: en efecto, consideremos el ℂ-espacio
de matrices rectangulares Mn×m (ℂ) y definamos la función T por

T : Mn×m (ℂ) −→ Mn×m (ℂ)


X ↦−→ AX + XB.
Formas canónicas · 129

Notemos que T es una transformación lineal. Para resolver el problema


mostraremos que T es biyectiva; con esto, dada C ∈ Mn×m (ℂ), existe una
única X ∈ Mn×m (ℂ) tal que AX + XB = C.
La prueba de la biyectividad de T la haremos a través de su matriz en
la base canónica X := {E11 , . . . , E1m ; . . . ; En1 , . . . , Enm } de Mn×m (ℂ); es
decir, probaremos que mX(T ) es invertible. Notemos entonces que
 a11 Em · · · a1n Em  BT ··· 0 
mX(T ) =  ... .. ..  +  .. ..
 
 .. ,

 . .   . . . 
 an1 Em · · · ann Em   0 ··· T
B 

donde Em es la idéntica de orden m y BT es la transpuesta de B. Pero
 a11 Em ··· a1n Em 
 .. .. ..  = A ⊗ E ,

 . . .  m

 an1 Em · · · ann Em  

BT · · · 0 
 .. ..  = E ⊗ BT .

..
 .
 . .  n
0 T
B  

De esta forma
mX (T ) = A ⊗ Em + En ⊗ BT .
Puesto que ℂ es algebraicamente cerrado (véase [20] o [26]), existen matri-
ces invertibles F y G de tamaños n × n y m × m, respectivamente, tales que
F −1 AF = J1 y G −1 BT G = J2 son matrices de Jordan. Notemos que en la
diagonal de J1 y J2 están localizados los valores propios 𝛼 de A y 𝛽 de BT ,
respectivamente (observemos que los valores propios de BT son los mismos
de B). Tenemos

J1 ⊗ Em = (F −1 AF ) ⊗ Em = (F −1 ⊗ Em )(A ⊗ Em )(F ⊗ Em ),
En ⊗ J2 = En ⊗ (G −1 BT G) = (En ⊗ G −1 )(En ⊗ BT )(En ⊗ G),

donde además

(F −1 ⊗ Em ) = (F ⊗ Em ) −1 ,
(En ⊗ G −1 ) = (En ⊗ G) −1 .

De esta forma se tiene que

J1 ⊗ Em = (F ⊗ Em ) −1 (A ⊗ Em )(F ⊗ Em ),
En ⊗ J2 = (En ⊗ G) −1 (En ⊗ BT )(En ⊗ G).
130 · Formas canónicas

Resulta entonces que

(F ⊗ Em ) −1 mX(T ) (F ⊗ Em ) = (F ⊗ Em ) −1 (A ⊗ Em )(F ⊗ Em )
+ (F ⊗ Em ) −1 (En ⊗ BT )(F ⊗ Em )
= ( J1 ⊗ Em ) + (F −1 ⊗ Em )(En ⊗ BT )(F ⊗ Em )
= ( J1 ⊗ Em ) + (En ⊗ BT ).

Ahora,

(En ⊗ G) −1 (F ⊗ Em ) −1 mX(T )(F ⊗ Em )(En ⊗ G)


= (En ⊗ G) −1 ( J1 ⊗ Em )(En ⊗ G) + (En ⊗ G) −1 (En ⊗ BT )(En ⊗ G)
= ( J1 ⊗ Em ) + (En ⊗ J2 ).

En total,

(En ⊗ G) −1 (F ⊗ Em ) −1 mX(T )(F ⊗ Em )(En ⊗ G) = ( J1 ⊗ Em ) + (En ⊗ J2 ),

es decir,

(F ⊗ G) −1 mX(T )(F ⊗ G) = ( J1 ⊗ Em ) + (En ⊗ J2 ).

Notemos que la matriz ( J1 ⊗ Em ) + (En ⊗ J2 ) es triangular inferior y en su


diagonal están las sumas de la forma 𝛼 + 𝛽 , las cuales por hipótesis son no
nulas, es decir, esta matriz es invertible, o sea, mX(T ) es también invertible,
y la prueba ha terminado.

6. Ejercicios
1. Sea T : V −→ V una transformación lineal de un espacio 𝕂-espacio
V de dimensión finita n ≥ 1. Demuestre que T es invertible si, y sólo
si, el término independiente q0 del polinomio mínimo qT (x) es no
nulo.

2. Determine la forma canónica de Jordan de la matriz:

0 0 1 0 

0 0 0 −1

1 0 .
 0 0 
0 −1 0 0 

Formas canónicas · 131

3. Calcule la forma de Jordan de la matriz


5 −10 10 −5 1
 
1 0 0 0 0

0 1 0 0 0 .
 
0 0 1 0 0
 
 
0 0 0 1 0

4. Sean T1 , T2 : V −→ V transformaciones diagonalizables de un espa-


cio V de dimensión finita n ≥ 1 tales que T1T2 = T2T1 . Demuestre
que existe una base X en V tal que mX (T1 ) y mX (T2 ) son diagonales.

5. Sea T : V −→ V una transformación lineal de un espacio 𝕂-espacioV


de dimensión finita n ≥ 1 tal que T tiene n valores propios diferentes.
Calcule el número de subespacios invariantes de T .

6. Sea A = [ai j ] una matriz cuadrada de orden n ≥ 1 tal que su número


de entradas nulas es superior a n 2 −n. Demuestre que el determinante
de A es igual a cero.

7. Sea A = [ai j ] una matriz cuadrada invertible de orden n ≥ 1. De-


muestre que

pA−1 (x) = (−x) n (det(A)) −1 pA (x −1 ),

donde pA (x) denota el polinomio característico de la matriz A.

8. Sea T : V −→ V una transformación lineal de un 𝕂-espacio de di-


mensión finita n. Suponga que T es diagonalizable y que 𝛼1 , . . . , 𝛼k
son los distintos valores propios de T , 1 ≤ k ≤ n. Demuestre que
existen transformaciones lineales T1 , . . . , Tk de V tales que:

(i) T = 𝛼1T1 + · · · + 𝛼kTk .


(ii) IV = T1 + · · · + Tk .
(iii) TiTj = 0, para i ≠ j.
(iv) Ti2 = Ti .
(v) Ti (V ) = E(𝛼i ), 1 ≤ i ≤ k.

Demuestre también el recíproco de esta afirmación, es decir, si existen


k escalares distintos 𝛼1 , . . . , 𝛼k y k transformaciones lineales T1 , . . . , Tk
de V , con k ≤ n, que satisfacen (i)-(iii), entonces T es diagonalizable,
𝛼1 , . . . , 𝛼k son los valores propios distintos de T y (iv)-(v) también
se cumplen.
132 · Formas canónicas

9. Pruebe que cada matriz cuadrada compleja A es similar a su trans-


puesta AT .

10. Sea A una matriz cuadrada compleja de orden n ≥ 1 tal que existe un
número natural m para el cual se tiene que Am = E. Demuestre que
A es diagonalizable (E denota la matriz idéntica de tamaño n).

11. Sean S, T : V −→ V transformaciones tales que ST = T S. Demues-


tre que ker(S) e Im(S) son subespacios T -invariantes.

12. Sea T : V −→ V una transformación lineal de un espacio V de di-


mensión finita. Demuestre que existe un entero k tal que:

(i) Para j ≥ k se cumple que Im(T j ) = Im(T k ) y ker(T j ) = ker(T k ).


(ii) Im(T k ) y ker(T k ) son subespacios T -invariantes y

V = Im(T k ) ⊕ N (T k ).

13. Calcule, usando los resultados del presente capítulo, una matriz in-
vertible C tal que C −1 BC sea una matriz de Jordan, donde

7 1 2 2 

1 4 −1 −1
 .
−2
 1 5 −1
1 1 2 8 

14. Sea T : ℂ2 −→ ℂ2 una transformación lineal con un solo valor propio


𝜆 . Demuestre que T − 𝜆 I es nilpotente.

15. Sea T : V −→ V una transformación lineal invertible en un espacio


V complejo de dimensión finita. Demuestre que existe una transfor-
mación S : V −→ V tal que S 2 = T (sugerencia: use la forma canónica
de Jordan). Se dice que S es la raíz cuadrada de T .

16. Según el ejercicio anterior, encuentre la raíz cuadrada de la siguiente


matriz
 2 −1 1 
 
−1 2 −1 .
 
−1 −1 2 
 
17. Calcule la forma canónica racional de la transformación

T : ℝ3 −→ ℝ3 ,
T (x, y, z) = (4z, y − x + 2z, 3x − z).
Formas canónicas · 133

18. Para la matriz real


−1 −1 0 −8
 
1 1 0 4 
A= 

0 1 0 −5
0 0 1 4 

determine:

(i) ¿A es diagonalizable? En caso positivo, calcule una matriz dia-


gonalizante.
(ii) ¿A es diagonalizable en bloques? En caso afirmativo calcule una
matriz que la convierta en matriz diagonal en bloques.
(iii) La forma racional de A y una matriz racionalizante.
(iv) ¿A es diagonalizable en bloques de Jordan? En caso afirmativo
calcule una matriz que la diagonalice en bloques de Jordan.
(v) Resuelva (i)-(iv) pero considerando A como matriz compleja.

19. Sea A ∈ Mn (𝕂) una matriz tal que su forma de Jordan es una celda
de Jordan. Demuestre que la forma racional de A es la compañera
del polinomio mínimo de A (en consecuencia, la forma racional de A
tiene un solo bloque racional).

20. Sea A ∈ Mn (𝕂) una matriz tal que su forma de Jordan es una celda
de Jordan. Demuestre que A no es diagonalizable en bloques.

21. Determine si las siguientes matrices son diagonalizables. En caso afir-


mativo calcule una matriz que diagonalice:

1 1 2 3 
 0 −1 0 
  0 2 2 4 
A =  0 0 1 , B =  .
−1 −3 3 0 0 1 −2
  0 0 0 2 

22. Determine los valores y vectores propios del operador derivación so-
bre el espacio ℝn [x]. ¿Es este operador diagonalizable?

23. Sea A una matriz de orden n ≥ 1 y p(x) un polinomio cualquiera.


Demuestre que si A es diagonalizable, entonces p(A) es diagonaliza-
ble.
Capítulo
cinco
Grupos de
matrices
Grupos de matrices · 137

Este capítulo está dedicado a estudiar grupos de matrices sobre anillos. Se


asume que el lector conoce la teoría clásica de formas bilineales y formas
cuadráticas sobre cuerpos, nosotros aquí construiremos los grupos clásicos
sobre anillos, generalizando estas formas para anillos no conmutativos con
involución. Además, estudiaremos dos teoremas de Suslin relativos al grupo
elemental sobre anillos conmutativos.

1. Grupos de matrices sobre cuerpos


En esta sección se enuncian las definiciones y algunas propiedades relativas
a grupos de matrices sobre cuerpos. Aunque algunos de estos grupos y re-
sultados ya habían sido presentados en capítulos anteriores los repetiremos
para darle completez al tema (véase también [22]).
Si V es un espacio vectorial sobre un cuerpo 𝕂, el conjunto de trans-
formaciones lineales biyectivas de V es un grupo con la composición de
funciones, denominado grupo lineal general, y se denota por GL(V ) (véa-
se también la definición 1.1.22). Cuando la dimensión del espacio es finita,
dim(V ) = n ≥ 2, V se puede identificar con 𝕂 n y el grupo lineal depende
únicamente del cuerpo y la dimensión; en este caso GL(V )  GLn (𝕂). Así,
GLn (𝕂) := Mn (𝕂) ∗ es el grupo de elementos invertibles del anillo Mn (𝕂)
y se conoce como el grupo lineal general de orden n sobre 𝕂.
Una matriz F es invertible si, y sólo si, det(F ) ≠ 0. Por lo tanto, el homo-
morfismo de grupos det : GLn (𝕂) −→ 𝕂 ∗ es sobreyectivo y 𝕂 ∗ es isomorfo
al grupo cociente de GLn (𝕂) con núcleo constituido por las matrices de
determinante uno. Este subgrupo se denota SLn (𝕂) y se denomina gru-
po especial lineal de orden n sobre 𝕂. En general, podemos destacar en
GLn (𝕂) los siguientes subgrupos:

(i) SLn (𝕂) es el subconjunto de GLn (𝕂) constituido por las matrices de
determinante 1, es decir,

SLn (𝕂) := {F ∈ GLn (𝕂) | det(F ) = 1} y SLn (𝕂) ⊴ GLn (𝕂).

(ii) Sea

 d1 0  

  


Dn (𝕂) := D(d1 , . . . , dn ) := 
 .. 

 ∈ Mn (𝕂) | d1 · · · dn ≠ 0 .

  .  
0 dn 

 

  
Entonces, Dn (𝕂) ≤ GLn (𝕂) y se conoce como el grupo de matrices
diagonales de orden n sobre 𝕂.
138 · Grupos de matrices

(iii) Sea
f ··· f1n 
  11 .

 

 

Tn (𝕂) :=  .. ..  ∈ M (𝕂) | f · · · f ≠ 0, f = 0 si i > j 

.
  .  n 11 nn ij

 0 fnn 
 

 
Entonces, Tn (𝕂) ≤ GLn (𝕂) y se denomina el grupo de matrices
triangulares superiores de orden n sobre 𝕂. Además, Dn (𝕂) ≤ Tn (𝕂).

(iv) Sea
UTn (𝕂) := {F ∈ Tn (𝕂) | fii = 1, 1 ≤ i ≤ n} .
Entonces, UTn (𝕂) ≤ Tn (𝕂) ∩ SLn (𝕂) y se denomina el grupo de
matrices unitriangulares superiores de orden n sobre 𝕂.

(iv) Para 1 ≤ m ≤ n, sea UTnm (𝕂) el conjunto de matrices unitriangulares


F = [ fi j ] ∈ UTn (𝕂) tales que fi j = 0 para i < j < i + m, es decir,
las primeras m − 1 diagonales consecutivas por encima de la diagonal
principal de F son nulas. Entonces, UTnm (𝕂) ≤ UTn (𝕂), y además,

UTn (𝕂) = UTn1 (𝕂) ⊇ UTn2 (𝕂) ⊇ · · · ⊇ UTnn (𝕂)


= UTnn+1 (𝕂) = UTnn+2 (𝕂) = · · · = {E}.

Usando la notación de la sección 4 se tienen las siguientes propiedades,


donde En (𝕂) representa el grupo elemental de orden n sobre 𝕂, definido
como el subgrupo de GLn (𝕂) generado por todas las matrices propiamente
elementales, es decir,

En (𝕂) := ⟨Ti j (a)|1 ≤ i , j ≤ n, i ≠ j, a ∈ 𝕂⟩.

Proposición 5.1.1. Sea 𝕂 un cuerpo. Entonces,

(i) GLn (𝕂) se puede generar por matrices propiamente elementales y matrices
diagonales. En forma más precisa,

GLn (𝕂) = ⟨Ti j (a), Di (d) | 1 ≤ i , j ≤ n, i ≠ j, a ∈ 𝕂, 0 ≠ d ∈ 𝕂⟩,


GLn (𝕂) = SLn (𝕂)Dn (𝕂).

(ii) SLn (𝕂) = En (𝕂).

(iii) Dn (𝕂) = ⟨Di (di ) | 0 ≠ di ∈ 𝕂, 1 ≤ i ≤ n⟩.

(iv) Tn (𝕂) = ⟨Ti j (a), Di (d) | j > i , a ∈ 𝕂, 0 ≠ di ∈ 𝕂, 1 ≤ i , j ≤ n⟩.


Grupos de matrices · 139

(v) UTn (𝕂) = ⟨Ti j (a) | j > i , a ∈ 𝕂, 1 ≤ i , j ≤ n⟩.

(vi) UTnm (𝕂) = ⟨Ti j (a) | j − i ≥ m, a ∈ 𝕂, 1 ≤ i , j ≤ n⟩.

(vii)

Z (GLn (𝕂)) = {a · E | a ∈ 𝕂 ∗ },
Z (SLn (𝕂)) = {a · E | a ∈ 𝕂, a n = 1},
Z (Dn (𝕂)) = Dn (𝕂).

(viii)
(
Z (GLn (𝕂)), si |𝕂| ≥ 3,
Z (Tn (𝕂)) = CGLn (𝕂) (Tn (𝕂)) =
{E, T1n (1)}  ℤ2 , si |𝕂| = 2.

(ix) Si 𝕂 es finito con |𝕂| := q, entonces


n−1
Ö
|GLn (𝕂)| = (q n − q j ),
j=0
n−1
1 Ö n
|SLn (𝕂)| = (q − q j ).
q−1
j=0

(x)

[GLn (𝕂), GLn (𝕂)] = SLn (𝕂), si n ≥ 3, ó, n = 2 y |𝕂| ≥ 3,


[GL2 (ℤ2 ), GL2 (ℤ2 )]  ℤ3 .
[SLn (𝕂), SLn (𝕂)] = SLn (𝕂), si n ≥ 3, ó, n = 2 y |𝕂| ≥ 4,
[SL2 (ℤ3 ), SL2 (ℤ3 )]  Q8 ,
[SL2 (ℤ2 ), SL2 (ℤ2 )]  ℤ3 .

(xi) Para 1 ≤ m ≤ n, UTnm (𝕂) ⊴ Tn (𝕂), y además,

{E} = UTnn (𝕂) ⊴ UTnn−1 (𝕂) · · · ⊴ UTn1 (𝕂) = UTn (𝕂) ⊴ Tn (𝕂).

(xii) Si |𝕂| ≥ 3, Dn (𝕂) ⋬ GLn (𝕂) y Dn (𝕂) ⋬ Tn (𝕂).

(xiii) Tn (𝕂), UTn (𝕂) ⋬ GLn (𝕂); UTn (𝕂) ⋬ SLn (𝕂).

(xiv) Para 1 ≤ m ≤ n − 1, UTnm (𝕂) ⋬ GLn (𝕂).


140 · Grupos de matrices

(xv)

[Dn (𝕂), Dn (𝕂)] = {E},


[Tn (𝕂), Tn (𝕂)] = UTn (𝕂), si |𝕂| ≥ 3,
[Tn (ℤ2 ), Tn (ℤ2 )] = UTn2 (ℤ2 ),
[UTnr (𝕂), UTns (𝕂)] = UTnr+s (𝕂), 1 ≤ r , s ≤ n.

(xvi) Tn (𝕂)/UTn (𝕂)  Dn (𝕂)  𝕂 ∗ × · · · × 𝕂 ∗ .


| {z }
n-veces

(xvii) UT m (𝕂)/UT m+1 (𝕂)  𝕂 × · · · × 𝕂 , 1 ≤ m ≤ n − 1.


| {z }
n − m-veces

(xviii) Para n ≥ 3, SLn (𝕂) y GLn (𝕂) no son solubles. Para n = 2 y |𝕂| ≥ 4,
SL2 (𝕂) y GL2 (𝕂) no son solubles.

(xix) SL2 (ℤ3 ), SL2 (ℤ2 ), GL2 (ℤ3 ) y GL2 (ℤ2 ) son solubles.

(xx) Dn (𝕂), Tn (𝕂) y UTnm (𝕂) son solubles, 1 ≤ m ≤ n.

Demostración. (i) Dividimos la prueba en dos partes.


(a) La prueba acerca del sistema de generadores de GLn (𝕂) se puede
realizar por inducción sobre n.
n = 2: Sea  
a11 a12
A=
a21 a22
una matriz invertible. a11 y a12 no pueden ser simultáneamente nulos debi-
do a que el rango de A es dos. Consideremos dos casos. Si a11 ≠ 0, entonces
   
−1 1 b12 1 c12
AD1 (a11 ) = = B y T21 (−b21 )B = = C;
b21 b22 0 c22
 
1 0
también, CT12 (−c12 ) = = F.
0 f22

En total, F = T21 (−b21 )AD1 (a11 −1 )T (−c ), y A se puede despejar como


12 12
un producto de matrices elementales y diagonales. Nótese que F = D2 ( f22 )
es invertible ya que es producto de invertibles. Si a12 ≠ 0, entonces se puede
reducir esta situación a la anterior multiplicando la matriz A a la derecha por
la permutación P12 , y entonces A nuevamente se puede expresar como un
producto de propiamente elementales y diagonales. Para completar la prue-
ba del caso n = 2, veremos al final de la demostración de esta parte (a) que
Grupos de matrices · 141

cada permutación Pi j se pueden expresar como producto de propiamente


elementales y diagonales.
Supongamos que el teorema ha sido probado para matrices de tamaño
n × n y sea A una matriz de tamaño (n + 1) × (n + 1). No es posible que
todos los elementos de la primera fila de A sean nulos; al igual que en el caso
n = 2, multiplicando por una matriz de permutación, se puede asumir que
a11 ≠ 0. La matriz
−1
B = AD1 (a11 )
es tal que b11 = 1 y se puede multiplicar a derecha e izquierda por matrices
propiamente elementales adecuadas hasta obtener una matriz invertible C
de la forma  
1 0
C= ,
0 A0
donde A0 es una matriz de orden n. Puesto que C es invertible, entonces
el rango de A0 es n, es decir, A0 es invertible. Por inducción, A0 se puede
factorizar en un producto de matrices propiamente elementales y diagona-
les de orden n: A0 = F1 · · · Ft . La matriz C se puede entonces escribir en la
forma:      
1 0 1 0 1 0
C= = ··· .
0 F1 · · · Ft 0 F1 0 Ft
C queda entonces factorizada en un producto de matrices propiamente ele-
mentales y diagonales de orden n + 1, de donde, A se expresa como un
producto finito de matrices propiamente elementales y diagonales de orden
n + 1.
Para concluir la prueba, veamos que cada permutación Pi j se puede fac-
torizar como producto de propiamente elementales y diagonales. Es sufi-
ciente considerar el caso i < j ya que P ji = Pi j :

Pi j = Ti j (1)Di (−1)Tji (1)Ti j (−1).

(b) Es claro que SLn (𝕂)Dn (𝕂) ≤ GLn (𝕂); para la otra inclusión, sabe-
mos por (a) que cada elemento de GLn (𝕂) es producto de matrices pro-
piamente elementales, es decir, matrices de SLn (𝕂), y matrices diagonales,
pero como SLn (𝕂) ⊴ GL ( 𝕂), entonces podemos disponer a la izquierda
todas las propiamente elementales y a la derecha las diagonales: en efecto,
en un grupo arbitrario G, si tenemos dos subgrupos S y D tales que S ⊴ G,
entonces DS = SD: ds = dsd −1 d = s ′d, con d ∈ D, s, s ′ ∈ S.
(ii) Veamos que el sistema de generadores de GLn (𝕂) encontrado en (i)
se puede simplificar y considerar solo matrices diagonales de la forma Dn (c),
142 · Grupos de matrices

con c ∈ 𝕂 ∗ . En efecto, sea i ≠ n y c ∈ 𝕂 ∗ , entonces

Di (c) = Pin Dn (c)Pin


= Tin (1)Di (−1)Tni (1)Tin (−1)Dn (c)Tin (1)Di (−1)Tni (1)Tin (−1)

pero como vimos en la parte (b) de (i), podemos permutar Di (−1) con las
matrices propiamente elementales, y además con Dn (c), de tal forma que
Di (−1)Di (−1) = E, y así, en la factorización de Di (c) solo hay propiamente
elementales y la matriz Dn (c).
De lo anterior se obtiene que SLn (𝕂) = En (𝕂): en efecto, es claro que
En (𝕂) ≤ SLn (𝕂); si F ∈ SLn (𝕂) ≤ GLn (𝕂), entonces F es producto de
matrices propiamente elementales y una matriz de la forma Dn (c), c ∈ 𝕂 ∗ ,
pero como det(F ) = 1, entonces c = 1, y de esta manera, F ∈ En (𝕂).
(iii) Evidente.
(iv) Sea F ∈ Tn (𝕂); con los elementos diagonales de F podemos elimi-
nar, por medio de matrices propiamente elementales, todos los elementos
no diagonales superiores de F .
(v) Consecuencia directa de (iv).
(vi) La prueba es como en (iv).
(vii) Sea F ∈ Z (GLn (𝕂)), entonces F conmuta con cualquier matriz pro-
piamente elemental. Veamos que esto implica que A conmuta con cualquier
matriz del anillo Mn (𝕂). Puesto que cada matriz G ∈ Mn (𝕂) se puede es-
cribir en la forma G = in, j gi j Ei j , basta probar que F conmuta con cualquier
Í

matriz gi j Ei j . Si i ≠ j, entonces gi j Ei j = Ti j (gi j ) − E; si i = j, entonces

gii Eii = Tir (gii )Tri (1) − Tri (1) − Tir (gii ),

con i ≠ r. Así, F ∈ Z (Mn (𝕂)) y F es invertible, pero el centro del ani-


llo Mn (𝕂) consta de las matrices diagonales para las cuales todas las entra-
das diagonales son iguales (véase [23]). Esto completa la demostración del
cálculo del centro del grupo GLn (𝕂).
Veamos ahora la prueba para SLn (𝕂). Sea F ∈ Z (SLn (𝕂)), entonces
F conmuta con cada matriz propiamente elemental, luego, por lo probado
anteriomente, F ∈ Z (Mn (𝕂)) ∩SLn (𝕂), es decir, F es de la forma F = a · E,
con a n = 1.
La última identidad se tiene ya que Dn (𝕂) es abeliano.
(viii) Dividimos la prueba en tres partes.
(a) En primer lugar, notemos que Z (Tn (𝕂)) = CGLn (𝕂) (Tn (𝕂)): en efec-
to, para cualquier grupo G y H ≤ G, se tiene que Z (G), Z (H ) ≤ CG (H ),
Grupos de matrices · 143

donde CG (H ) es el centralizador de H en G definido por

CG (H ) := {g ∈ G | gh = hg , para cada h ∈ H }

(véase [22]). Así,


Z (Tn (𝕂)) ≤ CGLn (𝕂) (Tn (𝕂)).
Sea ahora F ∈ CGLn (𝕂) (Tn (𝕂)); entonces para cada j ≥ 2,
FTi j (1) = Ti j (1)F , por lo tanto,
! !
∑︁ ∑︁
frs Ers (E + E1 j ) = (E + E1 j ) frs Ers ,
r ,s r,s
Í Í
y entonces F + r fr1 Er j =F+ s f js E1s , es decir,

0 · · · 0 f11 0 · · · 0  f j1 · · · f j, j−1 fj j f j, j+1 · · · f jn 


 .. . . .. .. .. . . ..  =  .. . . .. .. .. ..  .

..
.
 . . . . . .   . . . . . . . 
0 · · ·
 0 fn1 0 · · · 0  0 · · ·
  0 0 0 ··· 0 

Para j ≥ 2 y cada t ≠ j se tiene que f jt = 0 y f j j = f11 . Por lo tanto,

 f11 f12 · · · f1n 



0 f11 · · · 0 
F= . ..  ∈ Tn (𝕂), (1.1)

 .. .. . .
 . . . 
0
 0 ··· f11 

luego F ∈ Z (Tn (𝕂)).


(b) Veamos que CGLn (𝕂) (Tn (𝕂)) = Z (GLn (𝕂)), para |𝕂| ≥ 3: ya vi-
mos que Z (GLn (𝕂)) ≤ CGLn (𝕂) (Tn (𝕂)); sea F ∈ CGLn (𝕂) (Tn (𝕂)), enton-
ces F es como en (1.1) ; F debe conmutar con cada matriz de Dn (𝕂), luego
F ∈ CGLn (𝕂) (Dn (𝕂)), pero veamos que para |𝕂| ≥ 3,

CGLn (𝕂) (Dn (𝕂)) = Dn (𝕂).

En efecto, como Dn (𝕂) es abeliano, entonces Dn (𝕂) ≤ CGLn (𝕂) (Dn (𝕂));
sea G ∈ CGLn (𝕂) (Dn (𝕂)), entonces

GD(1, . . . , z, . . . , 1) = D(1, . . . , z, . . . , 1)G ,

con z en la posición j y z ≠ 0, 1. Resulta, gi j z = gi j para cada i ≠ j, de donde


gi j (z − 1) = 0, es decir, gi j = 0 para cada i ≠ j. Esto dice que G ∈ Dn (𝕂),
y en consecuencia, F ∈ Dn (𝕂), es decir, F = D( f11 , . . . , f11 ), con f11 ≠ 0.
Según (vii), F ∈ Z (GLn (𝕂)).
144 · Grupos de matrices

(c) Supongamos ahora que |𝕂| = 2. Sea F ∈ F ∈ CGLn (𝕂) (Tn (𝕂)); tal
como vimos en (a),
1 f12 ··· f1n 

0 1 ··· 0 
F= ,

..

 . 

0 0 ··· 1 

además para cada 2 ≤ k ≤ n − 1 se tiene que FTk,k+1 (1) = Tk,k+1 (1)F , con
lo cual

(E + f12 E12 + · · · + f1k E1k + · · · + f1n E1n )(E + Ek,k+1 )


| {z }
S
= (E + Ek,k+1 )(E + f12 E12 + · · · + f1k E1k + · · · + f1n E1n ),
| {z }
S

y además,
E + Ek,k+1 + S + f1k E1,k+1 = E + S + Ek,k+1 ,
de donde f1k = 0 para 2 ≤ k ≤ n − 1. Esto dice que F = E ó F = T1n (1).
(ix) De nuevo, dividimos la prueba en dos partes.
(a) |GLn (𝕂)| = n−1 n j
Î
j=0 (q − q ): sea F ∈ GLn (𝕂), entonces la primera
fila de F es no nula y el número de posibilidades para esta primera fila son
q n − 1 = q n − q 0 ; una vez definida la primera fila, la segunda no puede ser
múltiplo de la primera, por lo tanto, el número de opciones para la segunda
fila son q n − q; una vez definidas la primera y segunda filas, la tercera no
puede ser combinación lineal de las dos primeras, por lo tanto, el número
de posibilidades para la tercera fila son q n − q 2 . Continuando de esta manera
encontramos que el número de posiblidades para la última fila son q n −q n−1 .
Esto completa la demostración.
1 În−1 n j
(b) |SLn (𝕂)| = q−1 j=0 (q − q ): tal como vimos al principio de esta
sección, GLn (𝕂)/SLn (𝕂)  𝕂 , luego∗

n−1
|GLn (𝕂)| 1 Ö n
|SLn (𝕂)| = = (q − q j ).
|𝕂 ∗ | q−1
j=0

(x) Comencemos probando las afirmaciones relativas al grupo SLn (𝕂).


(a) Sea n ≥ 3. Para cualquier grupo G se tiene que [G , G] ≤ G; sea
Ti j (a) un generador de SLn (𝕂), se tiene la siguiente identidad

Ti j (ab) = [Tik (a), Tk j (b)] , con i , j, k diferentes y a, b ∈ 𝕂. (1.2)


Grupos de matrices · 145

Tomando b = 1 obtenemos que SLn (𝕂) ≤ [SLn (𝕂), SLn (𝕂)].


(b) Sea n = 2 y |𝕂| ≥ 4. Como vimos en (a), la inclusión

[SL2 (𝕂), SL2 (𝕂)] ≤ SL2 (𝕂)

se tiene trivialmente; para la otra inclusión se tiene la identidad general

[Ti j (a), D(b1 , . . . , bn )] = Ti j (a(bi−1 b j − 1)). (1.3)

Existe a0 ∈ 𝕂 ∗ tal que a02 − 1 ≠ 0, de lo contrario a02 = 1, de donde a0 = ±1,


y entonces, 𝕂 = {0, 1, −1}. En la identidad anterior tomemos entonces
b1 := a0−1 , b2 := a0 , con lo cual b1−1 b2 − 1 = a02 − 1 := c ≠ 0. Así, dado a ∈ 𝕂,
se tiene

[T12 (a), D(a0−1 , a0 )] = T12 (ac), luego [T12 (ac −1 ), D(a0−1 , a0 )] = T12 (a),

lo cual demuestra que T12 (a) ∈ [SL2 (𝕂), SL2 (𝕂)]. De manera similar se
prueba que T21 (a) ∈ [SL2 (𝕂), SL2 (𝕂)]. En consecuencia,

SL2 (𝕂) ≤ [SL2 (𝕂), SL2 (𝕂)].

(c) Sea n = 2 y |𝕂| = 3. Probemos que en este caso

[SL2 (ℤ3 ), SL2 (ℤ3 )]  Q8 := ⟨a, b|a 4 = 1, b 2 = a 2 , ba = a −1 b⟩.

Q8 se conoce como el grupo de cuaterniones (véase [22]). Según (ix),


1
|SL2 (ℤ3 )| = (32 − 30 )(32 − 31 ) = 24,
3−1
y como [SL2 (ℤ3 ), SL2 (ℤ3 )] ≤ SL2 (ℤ3 ), entonces

| [SL2 (ℤ3 ), SL2 (ℤ3 )] | = 1, 2, 3, 4, 6, 8, 12 ó 24.

Nótese que las siguientes matrices están en SL2 (ℤ3 ):


     
0 1 2 2 1 1
A := , B := , C := ,
2 0 2 1 0 1
     
1 0 2 1 2 2
D := , F := , G := ,
1 1 1 1 1 0

además, A = [C , D] y B = [F , G], es decir, A, B ∈ [SL2 (ℤ3 ), SL2 (ℤ3 )], y


estas matrices cumplen

A4 = E, B2 = A2 , BA = A−1 B,
146 · Grupos de matrices

por lo tanto,
Q8  ⟨A, B⟩ ≤ [SL2 (ℤ3 ), SL2 (ℤ3 )] ,
luego [SL2 (ℤ3 ), SL2 (ℤ3 )] = 8 ó 24. Pero existe una matriz propiamen-
te elemental que no pertenece a [SL2 (ℤ3 ), SL2 (ℤ3 )] (véase la sección de
ejercicios al final del capítulo), luego

[SL2 (ℤ3 ), SL2 (ℤ3 )] = 8 y [SL2 (ℤ3 ), SL2 (ℤ3 )]  Q8 .

(d) Sea n = 2 y |𝕂| = 2. Veamos que [SL2 (ℤ2 ), SL2 (ℤ2 )]  ℤ3 : note-
mos que
1
|SL2 (ℤ2 )| = |GL2 (ℤ2 )| = (22 − 20 )(22 − 21 ) = 6,
2−1
de donde
SL2 (ℤ2 ) = GL2 (ℤ2 )  S3  D3
(sólo hay dos grupos de orden 6: ℤ6 y S3  D3 , véase [22]; pero GL2 (ℤ2 )
no es abeliano: T12 (1)T21 (1) ≠ T21 (1)T12 (1)). Se tiene entonces que

[SL2 (ℤ2 ), SL2 (ℤ2 )]  [D3 , D3 ]  [S3 , S3 ] = A3  ℤ3

(A3 es el grupo alternante de orden 3).


(e) Pasamos ahora a considerar el grupo GLn (𝕂). Tenemos entonces tres
casos.
(1) Sea n ≥ 3. Según (a),

SLn (𝕂) = [SLn (𝕂), SLn (𝕂)] ≤ [GLn (𝕂), GLn (𝕂)];

además, como SLn (𝕂) ⊴ GLn (𝕂) y GLn (𝕂)/SLn (𝕂)  𝕂 ∗ es abeliano, en-
tonces [GLn (𝕂), GLn (𝕂)] ≤ SLn (𝕂) (véase [22]). Otra forma de justificar
esta última afirmación es: det[F , G] = 1 para cualesquiera F , G ∈ GLn (𝕂)
(esta afirmación es válida también para n = 2).
(2) Sea n = 2 y |𝕂| ≥ 3. Tal como vimos en (1),

[GL2 (𝕂), GL2 (𝕂)] ≤ SL2 (𝕂).

Para la otra inclusión, sea a0 ≠ 0, 1; se tienen las siguientes identidades:

T12 (a) = [T12 (ab), D(1, a0 )] , b := (a0 − 1) −1 , a ∈ 𝕂,


T21 (a) = [T21 (ab), D(a0−1 , 1)], b := (a0 − 1) −1 , a ∈ 𝕂.

(3) [GL2 (ℤ2 ), GL2 (ℤ2 )]  ℤ3 : este isomorfismo es consecuencia direc-


ta de (d), ya que GL2 (ℤ2 ) = SL2 (ℤ2 ).
Grupos de matrices · 147

(xi) Basta probar la primera afirmación, UTnm (𝕂) ⊴ Tn (𝕂): sean


F ∈ UTnm 𝕂) y G ∈ Tn (𝕂), entonces F = T1′ · · · Ts′, con cada T ′ una ma-
triz propiamente elemental de la forma Ti j (a), j − i ≥ m, y

G = D(b1 , . . . , bn )T1 · · · Tr ,

donde cada T es una matriz propiamente elemental de la forma Ti j (a), j > i


(esta última afirmación resulta de la identidad general (1.3) ). Entonces,

G −1 FG = Tr−1 · · · T1−1 D(b1−1 , . . . , bn−1 )T1′ · · · Ts′D(b1 , . . . , bn )T1 · · · Tr ,

pero se tiene la identidad general

D(b1 , . . . , bn )Ti j (a) = Ti j (bi ab −1


j )D(b1 , . . . , bn ),

luego
G −1 FG = Tr−1 · · · T2−1 (T1−1T1′′ · · · Ts′′T1 )T2 · · · Tr ,
donde cada T ′′ es nuevamente una matriz de la forma Ti j (a), con j − i ≥ m.
Notemos que

T1−1T1′′ · · · Ts′′T1 = (T1−1T1′′T1 )T1−1T2′′T1 · · · (T1−1Ts′′T1 ).

Para concluir la demostración de esta parte basta probar que cada factor
T1−1Tl′′T1 ∈ UTnm (𝕂), 1 ≤ l ≤ s, y luego repetir el procedimiento para
T2−1 , T2 ; . . . ;Tr−1 , Tr .
Consideremos un producto de la forma P := Ti j (a) −1Trs (b)Ti j (a), con
j > i, s − r ≥ m, a, b ∈ 𝕂. Expandiendo y simplificando, encontramos que

P = E + bErs + baErs Ei j − abEi j Ers − a2 bEi j Ers Ei j .

Se presentan las siguientes posibilidades:


(a) j ≠ r , s ≠ i, entonces P = E + bErs ∈ UTnm (𝕂).
(b) j ≠ r , i = s, entonces P = E + bErs + baEr j , pero como j > i y
s − r ≥ m, entonces j > s y s ≥ r + m, luego j > r + m, es decir, j − r > m,
de donde P ∈ UTnm (𝕂).
(c) j = r , i ≠ s, entonces P = E + bErs − abEis , pero como j > i y
s − r ≥ m, entonces r > i y s ≥ r + m, de donde s > i + m, es decir, s − i > m,
y nuevamente, P ∈ UTnm (𝕂).
(d) j = r, i = s, pero esta situación es imposible ya que j > i, s − r ≥ m,
de donde r > i, i − r ≥ m, es decir, r − i > 0 y i − r ≥ m > 0, contradicción.
(xii) Tenemos dos casos.
148 · Grupos de matrices

(a) Si |𝕂| = 2, claramente Dn (𝕂) = {E} ⊴ GLn (𝕂).


(b) Sea |𝕂| ≥ 3, entonces existen al menos dos elementos no nulos di-
ferentes 𝛽 1 , 𝛽 2 ∈ 𝕂. Sea 𝛼 cualquier elemento no nulo de 𝕂, entonces
𝛼 ( 𝛽 1 − 𝛽 2 ) ≠ 0 y se tiene la siguiente identidad:
  −1      
1 𝛼 𝛽1 0 1 𝛼 1 −𝛼 𝛽 1 𝛽 1 𝛼
=
0 1 0 𝛽2 0 1 0 1 0 𝛽2
 
𝛽1 𝛽1𝛼 − 𝛽2𝛼
= ∉ D2 (𝕂).
0 𝛽2

Esta prueba para el caso n = 2 se extiende al caso general n agregando


bloques nulos y la matriz idéntica En−2 en la identidad anterior. Este mismo
razonamiento también establece que Dn (𝕂) ⋬ Tn (𝕂).
(xiii) Notemos que

T1n (1) ∈ UTn (𝕂) ≤ Tn (𝕂) y Tn1 (a) ∈ SLn (𝕂) ≤ GLn (𝕂),

pero Tn1 (a) −1T1n (1)Tn1 (a) ∉ Tn (𝕂) si a ≠ 0. En efecto,

Tn1 (a) −1T1n (1)Tn1 (a) = (E − aEn1 )(E + E1n )(E + aEn1 )
= E + aE11 + E1n − aEnn − a 2 En1
1 + a 0 · · · 0 1 

 0 1 ··· 0 0 

 .. .. . . . .. 
=  . . . .. . .
 .. .
.. . .. 1 
 . 0 
 
 −a 2 0 · · · 0 1 − a
 

(xiv) El mismo ejemplo del numeral anterior.


(xv) Tenemos tres identidades a probar.
(a) La primera identidad es evidente ya que Dn (𝕂) es abeliano.
(b) El producto de dos elementos de Tn (𝕂) tiene como elementos en la
diagonal principal el producto de los elementos de las diagonales principales
de los dos factores, además, los elementos diagonales de la inversa de una
matriz F de Tn (𝕂) son los inversos de los elementos diagonales de F , por
lo tanto, [Tn (𝕂), Tn (𝕂)] ≤ UTn (𝕂). Para la otra inclusión notemos que si
|𝕂| ≥ 3, entonces existe a0 ≠ 0, 1 en 𝕂 y para cada generador Ti j (a) de
UTn (𝕂) se tiene la siguiente identidad general, la cual generaliza las identi-
dades que vimos en el literal (e.3) de (x):

Ti j (a) = [Ti j (ab), D(1, . . . , a0 , . . . , 1)] ,


Grupos de matrices · 149

con b := (a0 − 1) −1 y a0 en la posición j.


(c) Si |𝕂| = 2, entonces Tn (ℤ2 ) = UTn (ℤ2 ), con lo cual

[Tn (ℤ2 ), Tn (ℤ2 )] = [UTn (ℤ2 ), UTn (ℤ2 )] = UTn2 (ℤ2 )

(véase la parte (d) a continuación).


(d) Consideremos primero el caso trivial n = 2:

UT2 (𝕂) = {T12 (a) | a ∈ 𝕂} y UT22 (𝕂) = {E},

pero como estos dos grupos son abelianos, entonces la afirmación en este
caso se cumple trivialmente:

[UT2 (𝕂), UT2 (𝕂)] = {E} = UT22 (𝕂);


[UT2 (𝕂), UT22 (𝕂)] = {E} = UT23 (𝕂) = [UT22 (𝕂), UT2 (𝕂)];
[UT22 (𝕂), UT22 (𝕂)] = {E} = UT24 (𝕂).

Sea n ≥ 3. Veamos primero que [UTnr (𝕂), UTns (𝕂)] ≤ UTnr+s (𝕂): bas-
ta probar que si T es un generador de UTnr (𝕂) y T ′ es un generador de
UTns (𝕂), entonces [T , T ′] ∈ UTnr+s (𝕂). En efecto, cada generador de
[UTnr (𝕂), UTns (𝕂)] es de la forma [F , G], con F ∈ UTnr (𝕂) y G ∈ UTns (𝕂);
F es producto de generadores e inversos de generadores de UTnr (𝕂), lo
mismo ocurre para UTns (𝕂); pero si T es un generador de UTnr (𝕂), en-
tonces T −1 es también un generador; lo mismo ocurre para UTns (𝕂); así,
cada generador de [UTnr (𝕂), UTns (𝕂)] es de la forma [T1 · · · Tp , T1 · · · Tq′];
se tiene la siguiente identidad en cualquier grupo, [ab, c] = b −1 [a, c]b [b, c];
pero según (xi), UTnr+s (𝕂) ⊴ UTnr (𝕂), UTns (𝕂), por lo tanto, basta probar lo
anunciado arriba.
Sean Tik (a) ∈ UTnr (𝕂), Tje (b) ∈ UTns (𝕂) y consideremos el conmutador

C := [Tik (a), Tje (b)];

según (1.2) , si k = j, entonces C = Tie (ab), pero como k − i ≥ r y


e − j ≥ s, entonces e − i ≥ r + s, es decir, C ∈ UTnr+s (𝕂); si k ≠ j, en-
tonces C = E − abE je Eik ; si e ≠ i encontramos que C = E ∈ UTnr+s (𝕂),
pero si e = i, entonces C = Tjk (−ab), donde k − i ≥ r , i − j ≥ s, luego
k − j ≥ r + s, y nuevamente, C ∈ UTnr+s (𝕂). Esto completa la prueba de la
primera inclusión.
Veamos ahora la otra inclusión, UTnr+s (𝕂) ≤ [UTnr (𝕂), UTns (𝕂)]: basta
probar que cada generador Ti j (a) de UTnr+s (𝕂) pertenece a
[UTnr (𝕂), UTns (𝕂)]; puesto que j − i ≥ r + s > s, entonces j − s > i > 0;
150 · Grupos de matrices

sea k := j − s, entonces k − i = j − i − s ≥ r + s − s = r; j − k = s, con lo cual


Ti j (a) = [Tik (a), Tk j (1)] ∈ [UTnr (𝕂), UTns (𝕂)].
(xvi) Es suficiente considerar el homomorfismo sobreyectivo de grupos

𝜑 : Tn (𝕂) −→ Dn (𝕂)  𝕂 ∗ × · · · × 𝕂 ∗ ,
| {z }
n-veces
F := [ fi j ] ↦−→ D( f11 , . . . , fnn ),

cuyo núcleo es UTn (𝕂).


(xvii) Nótese que la función

𝜑 : UTnm (𝕂) −→ 𝕂 × · · · × 𝕂 ,
| {z }
n − m-veces
F := [ fi j ] ↦−→ ( f1,m+1 , f2,m+2 . . . , fn−m,n )

es un homomorfismo sobreyectivo de grupos cuyo núcleo es UTnm+1 (𝕂). En


efecto, es claro que 𝜑 es sobreyectiva con el núcleo indicado. Veamos que
𝜑 es un homomorfismo de grupos: sean F , G ∈ UTnm (𝕂) y sea H := FG,
entonces 𝜑(H ) = (h1,m+1 , h2,m+2 . . . , hn−m,n ), pero para cada 1 ≤ k ≤ n − m,
n
∑︁
hk,m+k = fki gi ,m+k .
i=1

Si 1 ≤ i < k, entonces fki = 0; si i = k, entonces fki gi ,m+k = gk,m+k ; si


k < i < m + k, entonces 0 < i − k < m, con lo cual fki = 0; si i = m + k,
entonces
fki gi ,m+k = fk,m+k gm+k,m+k = fk,m+k ;
si m + k < i ≤ n, entonces gi ,m+k=0 . De todo lo anterior se tiene que
hk,m+k = fk,m+k + gk,m+k , luego 𝜑(FG) = 𝜑(F ) + 𝜑(G).
(xviii) Tenemos dos casos.
(a) Según (x), para n ≥ 3, GLn (𝕂) y SLn (𝕂) son no solubles.
(b) Para n = 2 y |𝕂| ≥ 4, también según (x), GLn (𝕂) y SLn (𝕂) son no
solubles.
(xix) Tenemos tres casos.
(a) Según (x), SL2 (ℤ3 ) es soluble ya que Q8 es soluble:

[Q8 , Q8 ]  ℤ2 , [ℤ2 , ℤ2 ] = {0}.

(b) SL2 (ℤ2 ) = GL2 (ℤ2 ) es soluble ya que ℤ3 es abeliano (véase (x)).
Grupos de matrices · 151

(c) GL2 (ℤ3 ) es soluble ya que, según (x),

[GL2 (ℤ3 ), GL2 (ℤ3 )] = SL2 (ℤ3 ),

y como vimos en (a), este último es soluble.


(xx) Consecuencia directa de (xi). ✓

Los llamados grupos clásicos surgen al estudiar formas bilineales y ses-


quilineales sobre un espacio vectorial. Nos ocuparemos ahora de estos gru-
pos. Se asume que el lector conoce la teoría clásica de formas bilineales y
formas cuadráticas sobre cuerpos, sin embargo, algunas definiciones y re-
sultados básicos serán recordados.
Si V es un espacio vectorial sobre un cuerpo 𝕂, una forma bilineal sobre
V es una función f : V × V −→ 𝕂 lineal en ambos argumentos, es decir,
satisface

f (u1 + u2 , v) = f (u1 , v) + f (u2 , v),


f (a · u, v) = a f (u, v),
(u, v1 + v2 ) = f (u, v1 ) + f (u, v2 ),
f (u, a · v) = a f (u, v),

para cualesquiera u1 , u2 , u, v1 , v2 , v ∈ V , a ∈ 𝕂. Una forma bilineal f per-


mite definir la ortogonalidad: si u, v ∈ V , u es ortogonal a v (u ⊥ v) si, y sólo
si, f (u, v) = 0. La forma f es simétrica si f (u, v) = f (v, u) para cualesquie-
ra vectores u, v ∈ V ; f se dice antisimétrica si f (u, v) = −f (v, u), y f es
alternada si f (u, u) = 0 para cada u ∈ V . Notemos que toda forma alterna-
da es antisimétrica, y si char(𝕂) ≠ 2, entonces toda forma antisimétrica es
alternada. Si dim(V ) = n y X = {x1 , . . . , xn } es una base del espacio V , la
matriz de la forma f en la base X es la matriz B := [bi j ], con bi j := f (xi , x j );
si u y v se expresan como u = u1 · x1 + · · · + un · xn y v = v1 · x1 + · · · + vn · xn ,
entonces
f (u, v) = [u1 · · · un ]B[v1 · · · vn ]T .
Una forma bilineal f es no degenerada si, para 0 ≠ u ∈ V , existe v ∈ V
tal que f (u, v) ≠ 0, es decir, ningún vector no nulo es ortogonal a todo el
espacio. Equivalentemente, f es no degenarada si, y sólo si, det(B) ≠ 0,
con B la matriz de f en cualquier base. Una transformación lineal T de V
preserva f si, para cada u, v ∈ V , f (T (u), T (v)) = f (u, v).

Proposición 5.1.2. Si dim(V ) = n y f es no degenerada, el conjunto de las


transformaciones lineales que preservan f es un grupo con la composición.
152 · Grupos de matrices

Demostración. Si S y T preservan f para cada u, v ∈ V , resulta

f (ST (u), ST (v)) = f (T (u), T (v)) = f (u, v)

y ST preserva f ; obviamente el producto es asociativo y la transformación


idéntica preserva cualquier forma. Finalmente, si T preserva f y u ∈ V es
tal que T (u) = 0, entonces para cada v ∈ V ,

f (u, v) = f (T (u), T (v)) = f (0, T (v)) = 0,

y en consecuencia, u = 0 por ser f no degenerada. Por lo tanto, T es inyec-


tiva, y como la dimensión de V es finita, T es invertible y

f (T −1 (u), T −1 (v)) = f (TT −1 (u), TT −1 (v)) = f (u, v),

es decir, T −1 también preserva f . ✓


La afirmación anterior se puede traducir también en términos de matri-


ces, ya que si F es la matriz de T en la base de X, entonces

[u1 · · · un ]B[v1 · · · vn ]T = f (u, v) = f (T (u), T (v))


= [u1 · · · un ]F T BF [v1 · · · vn ]T ;

por lo tanto, T preserva f si, y sólo si, B = F T BF , con F := mX (T ). Si f es


no degenerada, det(B) ≠ 0, de manera que det(F ) = ±1, y así, F (y T ) es
invertible. De este modo, asociado a cada forma bilineal no degenerada f
hay un subgrupo de GLn (𝕂), a saber, el grupo de matrices F correspondien-
tes a las transformaciones T que preservan f . Los llamados grupos clásicos
sobre 𝕂 son algunos de los subgrupos de GLn (𝕂) definidos por medio de
estas formas bilineales no degeneradas. Por cada forma no degenerada f , o
lo que es equivalente, por cada matriz invertible B tendríamos uno de tales
grupos.
Observación 5.1.3. (i) Notemos, sin embargo, que si B ∈ Mn (𝕂) es una
matriz cualquiera, no necesariamente invertible, entonces también se pue-
den definir subgrupos de GLn (𝕂) de la siguiente manera:

O(B) := {F ∈ GLn (𝕂) | F T BF = B}.

(ii) De todos los posibles grupos clásicos que se pudieran definir con
formas no degeneradas se destacan aquellos para los cuales la relación de
ortogonalidad entre vectores es simétrica, es decir, u ⊥ v si, y sólo si, v ⊥ u.
Proposición 5.1.4. Sea dim(V ) = n y f una forma bilineal sobre V . La relación
“ser ortogonal a” es simétrica si, y sólo si, f es simétrica o alternada.
Grupos de matrices · 153

Demostración. ⇒): sean u, v, w ∈ V y e


u := f (u, v) · w − f (u, w) · v. Entonces,

f (u, e
u ) = f (u, f (u, v) ·w− f (u, w) ·v) = f (u, v) f (u, w)− f (u, w) f (u, v) = 0,

es decir, u ⊥ e
u ; por hipótesis e
u ⊥ u, esto es,

0 = f (e
u , u) = f (u, v) f (w, u) − f (u, w) f (v, u), (1.4)

y, haciendo w = u, resulta

f (u, u) [ f (u, v) − f (v, u)] = 0, (1.5)

para cada u, v ∈ V . Supongamos ahora que existen x, y ∈ V tales que


f (x, y) ≠ f (y, x) y que existe z ∈ V tal que f (z, z) ≠ 0. Por (1.5) ,

f (x, x) = f (y, y) = 0, f (z, x) = f (x, z) y f (z, y) = f (y, z),

y por (1.4) ,

0 = f (x, z) [ f (y, x) − f (x, y)] y 0 = f (y, z) [ f (x, y) − f (y, x)] ,

luego
f (x, z) = 0 = f (z, x) y f (y, z) = 0 = f (z, y).
Ahora, f (x, y + z) = f (x, y) y f (y + z, x) = f (y, x), luego

f (x, y + z) ≠ f (y + z, x),

y por (1.5) , f (y + z, y + z) = 0. Pero

f (y + z, y + z) = f (y, y) + f (y, z) + f (z, y) + f (z, z) = f (z, z)

lo que contradice la hipótesis f (z, z) ≠ 0. Así, f (x, y) = f (y, x) para cada


x, y ∈ V , es decir, f simétrica, o bien f (z, z) = 0 para cada z ∈ V , es decir,
f alternada.
⇐): si f es simétrica y u ⊥ v, entonces f (v, u) = f (u, v) = 0, de manera
que también v ⊥ u. Si f es alternada, también es antisimétrica, por lo tanto,
si u ⊥ v, entonces f (v, u) = −f (u, v) = 0 y v ⊥ u. ✓

De este modo, el estudio de los grupos clásicos se reduce a dos casos:


grupos obtenidos de formas simétricas y grupos obtenidos de formas alter-
nadas.
Sea f una forma bilineal simétrica no degenerada sobre V . Una transfor-
mación T que preserva f se denomina transformación ortogonal, y el gru-
po clásico correspondiente se denomina grupo ortogonal denotado O(V , f ).
154 · Grupos de matrices

Esta notación resulta adecuada ya que el grupo ortogonal definido de esta


manera depende de V (y, por lo tanto, de 𝕂 y de n) y de f , o de manera
equivalente, de la matriz B. Según vimos atrás, el grupo ortogonal se puede
caracterizar en lenguaje matricial de la siguiente manera:

O(V , f ) = {F ∈ GLn (𝕂) | F T BF = B},

donde B es la matriz de f en una base X de V que se fija (recordemos que


B es simétrica e invertible). Como se anotó anteriormente, si F ∈ O(V , f ),
entonces det(F ) = ±1; las transformaciones ortogonales de determinante
1 se denominan rotaciones y constituyen un subgrupo normal de O(V , f ),
notado O+ (V , f ), de manera que O+ (V , f ) ⊴ SLn (𝕂).
Si en particular B = E, entonces se tiene el grupo ortogonal de orden
n sobre 𝕂, denotado On (𝕂), conformado por las matrices ortogonales, es
decir,
On (𝕂) := {F ∈ GLn (𝕂) | F T F = E}.

Observación 5.1.5. El centro de On (𝕂) es {E, −E} y, salvo algunos casos


particulares, el cociente del grupo conmutante de On (𝕂) con su centro es un
grupo simple; estos resultados fueron probados por Dickson y Dieudonné,
pero la prueba no está en el alcance del presente cuaderno.

Sea f una forma bilineal alternada no degenerada sobre V . Una trans-


formación lineal que preserva f se denomina transformación simplicial; el
grupo correspondiente se denomina grupo simplicial y se nota Spn (𝕂). Se
puede demostrar que si char(𝕂) ≠ 2, entonces se puede encontrar una base
de V tal que la matriz B
e de f en dicha base tenga la siguiente presentación
 
 0 1 
 0 
 −1 0  

0 1
 
 
−1 0
 
B
e :=  .
 .. 

 . 
  

 0 0 1 

 −1 0 

Nótese que la dimensión n de V es entonces siempre par. Se tiene que

Spn (𝕂) := {F ∈ GLn (𝕂) | F T BF


e = B}.
e

Observación 5.1.6. El grupo simpléctico tiene las siguientes propiedades:


en primer lugar, Spn (𝕂) ≤ SLn (𝕂), el centro de Spn (𝕂) es {−E, E}, y si 𝕂
posee más de tres elementos, entonces el grupo simplicial es igual a su grupo
Grupos de matrices · 155

conmutante. El cociente del grupo conmutante de Spn (𝕂) con su centro es


un grupo simple. Si 𝕂 es un cuerpo finito con q elementos (q ≥ 3), entonces
el orden del grupo simplicial es

|Spn (𝕂)| = (q n − 1)q n−1 (q n−2 − 1)q n−3 · · · q 3 (q 2 − 1)q.

La prueba de estas afirmaciones está, de nuevo, fuera del alcance del pre-
sente cuaderno.

A partir de formas sesquilineales que se definen en cuerpos que presen-


ten una involución análoga a la conjugación en ℂ aparece otro tipo de grupo
clásico de matrices, tal como veremos a continuación. Una forma sesquili-
neal en un espacio vectorial sobre ℂ es una función f : V × V −→ ℂ lineal
en un argumento y “semilineal” en el otro; más precisamente:

f (u, v1 + v2 ) = f (u, v1 ) + f (u, v2 ),


f (u, a · v) = a f (u, v),
f (u1 + u2 , v) = f (u1 , v) + f (u2 , v),
f (a · u, v) = a f (u, v),

para todo u, v, u1 , u2 , v1 , v2 ∈ V y a ∈ ℂ. Habitualmente la semilinealidad


se establece para el segundo argumento, pero para definir los grupos clási-
cos el cambio al primer argumento resulta conveniente. Se tiene entonces
que si dim(V ) = n y X = {x1 , . . . , xn } es una base del espacio V , la ma-
triz de la forma sesquilineal f en la base X es la matriz B := [bi j ], donde
bi j := f (xi , x j ); si u y v se expresan como u = u1 · x1 + · · · + un · xn y
v = v1 · x1 + · · · + vn · xn , entonces

f (u, v) = [u1 · · · un ]B[v1 · · · vn ]T .

Notemos que si f es una forma sesquilineal no degenerada, entonces el


conjunto de transformaciones lineales del espacio V que preservan f es un
grupo, es decir, la proposición 5.1.2 también se tiene en este caso. El estu-
dio de los grupos clásicos asociados a formas no degeneradas sesquilineales
complejas generalmente se limita a las formas hermitianas, es decir, tales
que f (u, v) = f (v, u). Observemos que la matriz B := [bi j ] de f satisface
B∗ = B, con B∗ := (B)T := [bi j ]T , denominada la trasjugada de B (la trasju-
gada de una matriz también se conoce en la literatura como la adjunta, pero
ya utilizamos esta denominación de manera difente en el contexto de la teo-
ría de determinates del capítulo 2). Las matrices complejas que coinciden
con su trasjugada se denominan hermitianas. El grupo de transformacio-
nes que preservan f se denomina grupo unitario y se denota por U (V , f ).
156 · Grupos de matrices

Al igual que en el caso ortogonal, estos grupos se pueden también describir


matricialmente: si F es la matriz de T ∈ U (V , f ) en la base de X, entonces

u1 · · · un ]B[v1 · · · vn ]T = f (u, v) = f (T (u),


T (v)) = [u1 · · · un ]F ∗ BF [v1 · · · vn ]T ;

consecuentemente T preserva f si, y sólo si, B = F ∗ BF . Así,

U (V , f ) = {F ∈ GLn (𝕂) | F ∗ BF = B}.

Adicionalmente, notemos que como f es no degenerada, det(B) ≠ 0, de


manera que det(F ) = ±1, ±i.
Si en particular B = E, entonces se tiene el grupo unitario de orden
n sobre ℂ, denotado Un (ℂ), y conformado por las matrices unitarias, es
decir,
Un (ℂ) := {F ∈ GLn (ℂ) | F ∗ F = E}.
Nótese que On (ℝ) = Un (ℝ).
Observación 5.1.7. Si B ∈ Mn (ℂ) es una matriz cualquiera, no necesaria-
mente invertible, entonces también se pueden definir subgrupos de GLn (ℂ)
de la siguiente manera:

U (B) := {F ∈ GLn (ℂ) | F ∗ BF = B}.

2. Grupos de matrices sobre anillos


Sea A un anillo arbitrario. El grupo lineal general de orden n sobre A fue
presentado en la definición 1.3.1 y está constituido por las matrices inver-
tibles del anillo Mn (A), es decir, recordemos que

GLn (A) := {F ∈ Mn (A) | A es invertible} = Mn (A) ∗ .

Los subgrupos En (A), Dn (A), Tn (A), UTn (A) y UTnm (A) se definen en for-
ma análoga a como vimos antes para cuerpos; en los casos de Dn (A) y Tn (A)
se debe asumir que d1 , . . . , dn , f11 , . . . , fnn ∈ A∗ . El grupo especial lineal
sobre anillos arbitrarios en general carece de sentido ya que la teoría de
determinantes para anillos no conmutativos no está siempre definida; por
supuesto que si R es un anillo conmutativo entonces SLn (R) está definido
y consta de las matrices con determinante 1.
Las propiedades estructurales de GLn (A) y sus subgrupos fueron objeto
de intenso estudio en las décadas de los 70 y 80. Mostraremos a continua-
ción solo un par de estas propiedades.
Grupos de matrices · 157

Proposición 5.2.1.
Z (GLn (A)) = {a · E | a ∈ Z (A) ∗ } = Z (A) ∗ E.
Demostración. Es evidente que a · E con a ∈ Z (A) ∗ es invertible (con inversa
a−1 · E) y que conmuta con cualquier matriz de Mn (A), luego
a · E ∈ Z (GLn (A)). Sea ahora F ∈ Z (GLn (A)), entonces para r , s, con
1 ≤ r ≠ s ≤ n, F (E + Ers ) = (E + Ers )F , luego F Ers = Ers F . Ahora bien,
F Ers tiene la r-ésima columna de F en la columna s, y cero en las demás
entradas, y Ers F tiene la s-ésima fila de F en la fila r y cero en las demás en-
tradas. Por lo tanto, F Ers = Ers F implica que si F := [ fi j ], entonces frr = fss ,
fir = 0 para i ≠ r, y fs j = 0 para j ≠ s. Pero F ∈ Z (GLn (A)) conmuta con
todas las matrices Ers (r ≠ s), luego todas las entradas de la diagonal son
iguales y las demás entradas son cero, es decir, F = a · E para algún a ∈ A.
Pero F ∈ GLn (A), luego necesariamente a es invertible, y como F conmuta
con todas las matrices de GLn (A), a ∈ Z (A). ✓

Proposición 5.2.2. Para cada a, b ∈ A y cualesquiera u, v ∈ A∗ :


(i) Ti j (a)Ti j (b) = Ti j (a + b).
(ii) Para i ≠ l y k ≠ j, Ti j (a)Tkl (b) = Tkl (b)Ti j (a).
(iii) [Tik (a), Tk j (b)] = Ti j (ab). Además, si i ≠ l y k ≠ j, [Ti j (a), Tkl (b)] = E.
(iv) Di (u)D j (v) = D j (v)Di (u) si i ≠ j, y Di (u)Di (v) = Di (uv).
(v) Di (u)Ti j (a) = Ti j (ua)Di (u), Di (u)Tji (a) = Tji (au −1 )Di (u). Además,
para j ≠ i y k ≠ i, Di (u)Tjk (a) = Tjk (a)Di (u).
Demostración. (i) Tenemos
Ti j (a)Ti j (b) = (E + a · Ei j )(E + b · Ei j ) = E + a · Ei j + b · Ei j
= E + (a + b) · Ei j = Ti j (a + b).
(ii) Aplicando las definiciones,
Ti j (a)Tkl (b) = (E + a · Ei j )(E + b · Ekl ) = E + a · Ei j + b · Ekl ;
Tkl (b)Ti j (a) = (E + b · Ekl )(E + a · Ei j ) = E + b · Ekl + a · Ei j .
(iii) De nuevo, aplicando las definiciones,
[Tik (a), Tk j (b)]
= (E + a · Eik )(E + b · Ek j )(E − a · Eik )(E − b · Ek j )
= (E + a · Eik + b · Ek j + ab · Ei j )(E − a · Eik − b · Ek j + ab · Ei j )
= E − a · Eik − b · Ek j + ab · Ei j + a · Eik − ab · Ei j + b · Ek j + ab · Ei j
= E + ab · Ei j = Ti j (ab).
158 · Grupos de matrices

Usando (i) y (ii) se tiene que

[Ti j (a), Tkl (b)] = Ti j (a)Tkl (b)Ti j (−a)Tkl (−b)


= Tkl (b)Ti j (a)Ti j (−a)Tkl (−b)
= Tkl (b)Tkl (−b) = E.

(iv) Tenemos

Di (u)D j (v) = (E + (u − 1) · Eii ) (E + (v − 1) · E j j )


= E + (u − 1) · Eii + (v − 1) · E j j ;
D j (v)Di (u) = (E + (v − 1) · E j j ) (E + (u − 1) · Eii )
= E + (v − 1) · E j j + (u − 1) · Eii ;
Di (u)Di (v) = (E + (u − 1) · Eii ) (E + (v − 1) · Eii )
= E + (u − 1 + v − 1 + uv − v − u + 1) · Eii
= E + (uv − 1) · Eii = Di (uv).

(v) De las definiciones se sigue que

Di (u)Ti j (a) = (E + (u − 1) · Eii ) (E + a · Ei j )


= E + a · Ei j + (u − 1) · Eii + (u − 1)a · Ei j
= E + (u − 1) · Eii + ua · Ei j ;
Ti j (ua)Di (u) = (E + ua · Ei j ) (E + (u − 1) · Eii )
= E + (u − 1) · Eii + ua · Ei j ;
Di (u)Tji (a) = (E + (u − 1) · Eii ) (E + a · E ji )
= E + (u − 1) · Eii + a · E ji ;
Tji (au −1 )Di (u) = (E + au −1 · E ji ) (E + (u − 1) · Eii )
= E + (u − 1) · Eii + au −1 · E ji + (a − au −1 ) · E ji
= E + (u − 1) · Eii + a · E ji ;
Di (u)Tjk (a) = (E + (u − 1) · Eii )(E + a · E jk )
= E + (u − 1) · Eii + a · E jk ;
Tjk (a)Di (u) = (E + a · E jk )(E + (u − 1) · Eii )
= E + (u − 1) · Eii + a · E jk . ✓

Corolario 5.2.3. Si n ≥ 3,

[En (A), En (A)] = En (A).


Grupos de matrices · 159

Demostración. [En (A), En (A)] ⊆ En (A); recíprocamente, si Ti j (a) ∈ En (A),


como n ≥ 3, sea k ≠ i, k ≠ j entonces

Ti j (a) = Ti j (a1) = [Tik (a), Tk j (1)] ∈ [En (A), En (A)]. ✓


Corolario 5.2.4. Si n ≥ 3, En (A) no es soluble.

Demostración. Consecuencia directa del corolario anterior. ✓


3. El grupo elemental sobre anillos


conmutativos
Sea R un anillo conmutativo. Vimos en (3.6) que

En (R) ≤ SLn (R) ⊴ GLn (R).

Surgen entonces dos preguntas de manera natural: ¿En (R) ⊴ GLn (R)? y
¿En (R) = SLn (R)? En esta sección vamos a estudiar estas dos preguntas.
Para n ≥ 3 la primera pregunta planteada anteriormente tiene respuesta
positiva y el resultado fue demostrado por A. A. Suslin, el cual es conocido
como el teorema de normalización de Suslin (véase [39]). La prueba cons-
tructiva de este teorema presentada a continuación ha sido adaptada de [34]
(véase también [35]).

Definición 5.3.1. Sean R un anillo conmutativo y n ≥ 2. Una matriz de


Cohn es una matriz de la forma

E + av(v j ei − vi e j ),

con i < j, i , j ∈ {1, . . . , n}, a ∈ R y v := [v1 · · · vn ]T ∈ R n .

Proposición 5.3.2 (Teorema de Mennicke) . Para n ≥ 3, cualquier matriz


de Cohn se puede factorizar en un producto finito de matrices elementales.
160 · Grupos de matrices

Demostración. Primero consideremos el caso i = 1, j = 2; entonces

v1 
B = E + a  ...  v2 , −v1 , 0, . . . , 0
  
 
 
vn 
 
1 + av1v2 −av12 0 ··· 0
 av2

 2
1 − av1v2 0 · · · 0
 av3v2 −av3v1
=


 .
.. .. 

 . En−2 

 av v −avn v1 
 n 2 
1 + av1v2 −av12 0 ··· 0
 av2

 2
1 − av1v2 0 · · · 0 n
0 0 Ö
= Tl1 (avl v2 )Tl2 (−avl v1 ).


 .
. .. 
l=3

 . . En−2 


 0 0 

Entonces, es suficiente mostrar que

1 + av1v2
 −av12 0
A :=  av2
 2 1 − av1v2 0

 0 0 1

se puede factorizar como un producto de matrices elementales, para cua-


lesquiera a, v1 , v2 ∈ R. Para esto aplicamos operaciones elementales sobre
filas y columnas:

1 + av1v2 −av12 0 F1 −→F1 +v1 F3 1 + av1v2 −av12 v1 


 F2 −→F2 +v2 F3 
A =  av2 2 1 − av1v2 0 −−−−−−−−−→  av 2 1 − av1v2 v2 
 2

 0 0 1 
 0 0 1 

 1 −av12 v1   1 0 v1 
C1 −→C1 −av2 C3
 C2 −→C2 +av1 C3 
−−−−−−−−−−−−→  0
 1 − av1v2 v2  −−−−−−−−−−−−→  0
 1 v2 
−av 0 1  −av av 1 
 2  2 1

1 0 v1  1 0 0 
F3 −→F3 +av2 F1
  C3 −→C3 −v1 C1  
−−−−−−−−−−−−→ 0 1
 v2  −−−−−−−−−−−→

0 1
 v2 

0 av 1 + av v  0 av 1 + av v 
 1 1 2  1 1 2

1 0 0  1 0 0 
F3 −→F3 −av1 F2  F2 −→F2 −v2 F3  
−−−−−−−−−−−−→ 0 1 v2  −−−−−−−−−−−→ 0 1 0  .
 
0 0 1  0 0 1 
   
Grupos de matrices · 161

Al escribir las operaciones elementales anteriores, tenemos

A = T13 (−v1 )T23 (−v2 )T31 (−av2 )T32 (av1 )


T13 (v1 )T23 (v2 )T31 (av2 )T32 (−av1 ).

En general, para i < j arbitrarios,


v1 
B = E + a  ...  0, . . . , v j , 0, . . . , −vi , 0, . . . , 0 ,
  
 
 
vn 
 
donde v j ocurre en la i-ésima posición y −vi en la j-ésima posición. Enton-
ces,
1 · · ·
 av1v j ··· −av1vi · · · 0
 .. .. .. 

 . . . 0 


 1 + avi v j −avi2 

 .. .. 
B=  . . 

av2j 1 − avi v j
 
 
.. ..
 
. .
 
 
 

 avn v j −avn vi 1
1 · · · 0 ··· 0 · · · 0

 .. .. .. 

 . . . 0

 1 + avi v j −avi2 
 Ö
 .
.. .
..

=  
 Tli (avl v j )Tl j (−avl vi )
av2j 1 − avi v j  1≤l ≤n
 
 l≠i , j

.. ..

. .
 
 
 

 0 0 1 

= Tit (−vi )Tjt (−v j )Tti (−av j )Tt j (avi )Tit (vi )Tjt (v j )Tti (av j )Tt j (−avi )
Ö
× Tli (avl v j )Tl j (−avl vi ),
1≤l ≤n
l≠i , j

donde t es cualquier índice que cumpla t ∈ {1, . . . , n} − {i , j}. ✓


Definición 5.3.3. Sean R un anillo conmutativo y n ≥ 1. Un vector co-


lumna v = [v1 , · · · , vn ]T ∈ R n se dice vector columna unimodular si sus
componentes generan a R, es decir, existen u1 , . . . , un tales que

v1 u1 + · · · + vn un = 1.
162 · Grupos de matrices

Un vector fila unimodular se define de manera similar.

Lema 5.3.4. Sean R un anillo conmutativo y A ∈ GLn (R), con n ≥ 3. Su-


póngase que A se puede escribir en la forma A = E + vw, con v un vector columna
unimodular y w un vector fila sobre R tales que wv = 0. Entonces, A ∈ En (R).

Demostración. Sea v := [v1 · · · vn ]T unimodular, luego existen g1 , . . . , gn ∈


R tales que v1 g1 +· · ·+vn gn = 1; esto, combinado con wv = w1v1 +· · ·+wn vn =
0, proporciona una nueva expresión para w,
∑︁
w= ai j (v j ei − vi e j ),
i< j

donde ai j := wi g j − w j gi . Luego,
∑︁
A := E + vw = E + v( ai j (v j ei − vi e j ))
i< j
∑︁
=E+ vai j (v j ei − vi e j )
i< j
Ö
= (E + vai j (v j ei − vi e j )).
i< j

Cada factor del lado derecho de la última ecuación en una matriz de Cohn,
luego se pueden escribir como un producto de matrices elementales, con lo
cual A también es un producto de matrices elementales. ✓

Lema 5.3.5. Sean R un anillo conmutativo y n ≥ 3. BTi j (a)B−1 ∈ En (R),


para cada a ∈ R y B ∈ GLn (R).

Demostración. Para una matriz A, denotemos por A(i) su fila i y por A ( j) su


columna j, entonces

BTi j (a)B−1 = E + B (i) a(B−1 ) ( j) .

Sea v := B (i) y w := a(B−1 ) ( j) , entonces (B−1 ) (i) v = 1, luego v es unimodu-


lar; además, wv = 0 ya que i ≠ j. Por lo tanto, BTi j (a)B−1 = E +vw satisface
la condición del lema 5.3.4, así que se puede escribir como un producto de
matrices elementales. ✓

Teorema 5.3.6 (Teorema de normalización de Suslin) . Sea R un anillo


conmutativo. Para n ≥ 3, En (R) ⊴ GLn (R). En particular, En (R) ⊴ SLn (R).

Demostración. Sea A ∈ GLn (R) y F ∈ En (R). Así, el lema 5.3.5 da un proce-


dimiento para encontrar matrices propiamente elementales T1 , . . . , Tt tales
que AF A−1 = T1 · · · Tt . ✓

Grupos de matrices · 163

Estudiaremos ahora la segunda pregunta planteada al inicio de la pre-


sente sección. Desafortunadamente existen anillos conmutativos en los que
En (R) ≠ SLn (R). En [34] se prueba que si 𝕂 un cuerpo, la matriz

x2
 
1 + xy
A := ∈ SL2 (𝕂 [x, y])
−y 2 1 − xy

no se puede factorizar como un producto de matrices elementales (véase


también [35]). No obstante, existen diversos anillos conmutativos en los que
la igualdad se tiene; por ejemplo, en el anillo de funciones reales continuas,
en los dominios euclidianos (por ejemplo, ℤ y los polinomios 𝕂 [x] sobre
un cuerpo 𝕂) y en los anillos con rango estable uno (anillos locales y semi-
locales).
A continuación se presenta detalladamente la demostración de la igual-
dad en los dos últimos casos mencionados. Cabe anotar que dichas demos-
traciones son constructivas. Iniciamos con la siguiente proposición de ca-
rácter general.

Proposición 5.3.7. Sea A un anillo arbitrario y n ≥ 2. Si toda matriz de


GLn (A) se puede expresar como producto de matrices elementales y diagonales,
entonces GLn (A) = En (A)GLn−1 (A). Si además A = R es conmutativo, entonces
En (R) = SLn (R).

Observación 5.3.8. Aquí se considera GLn−1 (A) como un subgrupo de


GLn (A) mediante la inclusión natural


1 0
M−
↦ → .
0 M

Demostración. Claramente En (A)GLn−1 (A) ⊆ GLn (A). Sea entonces M ∈


GLn (A); por hipótesis M se puede expresar como producto de matrices
elementales Ti j (a), i ≠ j, a ∈ A, y diagonales Di (u), u ∈ A∗ . En virtud de
la proposición 5.2.2(v), las matrices diagonales se pueden “conmutar” hacia
la derecha obteniendo M = T1 D, donde T1 es un producto de elementales
y D de diagonales. Pero entonces

d1 0 

D=
 ..  = diag(d1 , . . . , dn ),

 . 
0
 dn 
164 · Grupos de matrices

donde cada di ∈ A∗ , 1 ≤ i ≤ n. Sea u ∈ A∗ y consideremos las siguientes


operaciones sobre filas y columnas:
 −1
0 T21 (1) u −1 0 T12 (−1)
      
u 0 −u T21 (1) 0 −u
−−−−−→ −1 −−−−−−→ −1 −−−−−→ −1
0 u u u u u u 0
   
T12 (u) 1 −u T12 (u) 1 0
−−−−−→ −1 −−−−−→ −1 .
u 0 u 1

Así,

u −1 0
 
= T21 (−1)T12 (1)T21 (−1)T12 (−u)T21 (u −1 )T12 (−u)
0 u

y, por lo tanto,
diag(d1−1 , d1 , 1, . . . , 1) = T2
es producto de elementales. Pero

diag(d1−1 , d1 , 1, . . . , 1)D = diag(1, d1 d2 , d3 . . . , dn ),

luego D = T2−1 diag(1, d1 d2 , d3 , . . . , dn ); en consecuencia,

M = T1 D = T1T2−1 diag(1, d1 d2 , d3 , . . . , dn ) = T3 diag(1, d1 d2 , . . . , dn ),

con T3 = T1T2−1 ∈ En (A) y diag(1, d1 d2 , d3 , . . . , dn ) ∈ GLn−1 (A) (con


inversa diag(1, d2−1 d1−1 , d3−1 , . . . , dn−1 )). Tenemos entonces que

GLn (A) ⊆ En (A)GLn−1 (A).

Sea ahora R un anillo conmutativo; tenemos que

GLn (R) = En (R)GLn−1 (R);

explícitamente, notemos que diag(1, (d1 d2 ) −1 , d1 d2 , 1, . . . , 1) es produc-


to de elementales hasta obtener M = T ′ diag(1, 1, . . . , 1, d1 d2 · · · dn ). Sea
N ∈ SLn (R), entonces N ∈ GLn (R) = En (R)GLn−1 (R), es decir,

N = T diag(1, 1, . . . , 1, u) = T Dn (u)

con u ∈ R ∗ y T ∈ En (R). De este modo, det(N ) = u, y como N ∈ SLn (R),


necesariamente u = 1, Dn (u) = E y N = T es producto de elementales. Por
lo tanto, En (R) = SLn (R). ✓

 Sea R un dominio
Lema 5.3.9.  euclidiano con función euclidiana 𝛿 y sea n ≥ 2.
Si 𝛼 := a1 a2 ·· · an ∈ R n , entonces existe T ∈ En (R) tal que
𝛼T = a 0 · · · 0 , para cierto a ∈ R.
Grupos de matrices · 165

Demostración. Si 𝛼 = 0, basta tomar a = 0 y T = E. Supongamos 𝛼 ≠ 0,


entonces {𝛿 (ak ) | ak ≠ 0} es un subconjunto no vacío de ℕ. Sea

m(𝛼) := mı́n{𝛿 (ak ) | ak ≠ 0}

y sea i el menor de los índices tales que m(𝛼) = 𝛿 (ai ). Si j ≠ i es tal que
a j ≠ 0, existen q j , r j ∈ R tales que a j = ai q j +r j , donde r j = 0 ó 𝛿 (r j ) < 𝛿 (ai ).
Así,
 
𝛼Ti j (−q j ) = a1 · · · ai ··· a j − ai q j · · · an
 
= a1 · · · ai ··· rj ··· an .

Repitiendo esta operación para cada j ≠ i, con a j ≠ 0, se obtiene

𝛼 ′ := 𝛼T1 = a1′ · · · an′ ,


 

donde ai′ = ai , y para j ≠ i, a ′j = a j si a j = 0, y a ′j = r j si a j ≠ 0. Si a ′j = 0


para cada j ≠ i, hemos terminado: en efecto, si i = 1,

𝛼T1 = 𝛼 ′ = a1′ 0 · · ·
 
0 ;

si i ≠ 1 tenemos

𝛼 ′Ti1 (1)T1i (−1) = ai′ 0 · · ·


 
0 = 𝛼T1Ti1 (1)T1i (−1).

Ahora, si para algún j ≠ i se tiene a ′j ≠ 0, entonces

m(𝛼 ′) ≤ 𝛿 (a ′j ) = 𝛿 (r j ) < 𝛿 (ai ),

de donde resulta m(𝛼 ′) < m(𝛼). En consecuencia, si el proceso se repite


con 𝛼 ′, en un número finito de pasos, obtenemos que todos los residuos
son nulos, y así el resultado buscado. ✓

Proposición 5.3.10. Si R es un dominio euclidiano y n ≥ 2, toda matriz de


GLn (R) se puede expresar como producto de matrices elementales y diagonales.

Demostración. Dividimos la prueba en dos parte.


(i) Sea M ∈ GLn (R), n ≥ 2. Por el lema 5.3.9, existe
T ∈ En (R) tal que
 m 0 · · · 0
 
m2 
MT =  . ,
 
 .. M
f 
 
m 
 n 
166 · Grupos de matrices

f ∈ Mn−1 (R). Pero M es invertible, luego det(M) ∈ R ∗ , y como


donde M
det(M) = det(MT ) = m det( M), f ∈ R ∗ , y por tanto,
f se tiene que m, det( M)
M
f ∈ GLn−1 (R). Así,

 1 0 ··· 0

m2 
−1
MT D1 (m ) =  .
 
 ..

 M
f 

m 
 n 
y,
1 0 · · · 0

0 
−1
Tn1 (−mn ) · · · T21 (−m2 )MT D1 (m ) =  . .
 
 .. M
f 
 
0 
 
(ii) Probaremos ahora la afirmación por inducción sobre n.
Si n = 2, por (i) se tiene
 
1 0
T21 (−m2 )MT D1 (m −1 ) = = D2 ( m
e),
0 m
e

dado que m f ∈ R ∗ , y entonces M = T21 (m2 )D2 ( m


e = det( M) e)D1 (m)T −1 es
un producto de matrices elementales y diagonales.
Supongamos ahora que la afirmación es válida para n = k − 1, k ≥ 3, y
sea M ∈ GLk (R). Nuevamente por (i),
 
1 0 −1
M = T21 (m2 ) · · · Tk−1,1 (mk−1 ) f D1 (m)T ,
0 M

con M
f ∈ GLk−1 (R). Por hipótesis de inducción, M
f se puede expresar como
producto de matrices elementales y diagonales de orden k − 1; pero estas
matrices pueden considerarse como elementales y diagonales de orden k y
de ello se sigue la afirmación. ✓

Corolario 5.3.11. Si R es un dominio euclidiano y n ≥ 2, entonces

En (R) = SLn (R).

Demostración. Inmediato de las proposiciones 5.3.10 y 5.3.7. ✓


Definición 5.3.12. Sea A un anillo. Se dice que A tiene rango estable uno
si para cada a, b ∈ A tales que ⟨a, b⟩ = A existe c ∈ A tal que a + cb ∈ A∗ .
Grupos de matrices · 167

Proposición 5.3.13. Si A es un anillo con rango estable uno, toda matriz de


GLn (A), n ≥ 2, se puede expresar como producto de matrices elementales y diago-
nales.

Demostración. De nuevo, dividimos la demostración en dos partes.


(i) Sea M := [mi j ] ∈ GLn (A), n ≥ 2. Como M −1 M = E, existen
r1 , . . . , rn ∈ A tales que r1 m11 + · · · + rn mn1 = 1; así, para cada a ∈ A,
tenemos a = (ar1 )m11 + a(r2 m21 + · · · + rn mn1 ), es decir,

A = ⟨m11 , r2 m21 + · · · + rn mn1 ⟩.

Dado que A tiene rango estable uno, existe c ∈ A tal que

u := m11 + c(r2 m21 + · · · + rn mn1 ) ∈ A∗ .

Ahora,
 u m′ · · · ′ 
m1n
 12 
m21 m22 · · · m2n 
M1 := T12 (cr2 )T13 (cr3 ) · · · T1n (crn )M =  . ..  ;

 .. .. ..
 . . . 
m
 n1 mn2 · · · mnn 

pero u ∈ A∗ , luego

M2 := Tn1 (−mn1 u −1 ) · · · T31 (−m31 u −1 )T21 (−m21 u −1 )M1


u m ′ · · · ′ 
m1n
 12 
0 m ′ · · · ′ 
m2n
22
= . ..  ,
 
.. .
. ..
 . . . 
0 m ′ · · · ′ 
mnn
 n2 
y
′ −1 ′ −1 ′ −1
M3 : = M2T12 (−m12 u )T13 (−m13 u ) · · · T1n (−m1n u )M
u 0 · · · 0 

0 m ′ · · · ′ 
m2n

1 0

22
= . ..  = f D1 (u),
 
. .
. ..
. . . .  0 M

0 m ′ · · · ′ 
mnn
 n2 

con M
f ∈ Mn−1 (A). De este modo obtenemos
 
1 0
M = T1 f D1 (u)T2 ,
0 M
168 · Grupos de matrices

con

T1 := T1n (−crn ) · · · T12 (−cr2 )T21 (m21 u −1 ) · · · Tn1 (mn1 u −1 ) ∈ En (A)

y,
′ −1 ′ −1
T2 := T1n (m1n u ) · · · T12 (m12 u ) ∈ En (A).
Como M , T1 , D1 (u) y T2 son elementos de GLn (A), necesariamente
 
1 0
0 M
f

es invertible, y por lo tanto, Mf ∈ GLn−1 (A).


(ii) Demostraremos ahora la afirmación haciendo inducción sobre n.
Si n = 2, por (i) se tiene
 
1 0
M = T1 D (u)T2 = T1 D2 ( m
e)D1 (u)T2 ,
0 me 1

e ∈ A∗ .
dado que m
Supongamos el resultado válido para n = k − 1, k ≥ 3, y sea
M ∈ GLk (A). Por (i),
 
1 0
M = T1 f D1 (u)T2 , con M ∈ GLk−1 (A);
f
0 M

por inducción, M f es producto de elementales y diagonales de orden


k − 1, que pueden considerarse de orden k, luego M es producto de ma-
trices elementales y diagonales. ✓

Corolario 5.3.14 (Teorema de estabilidad de Suslin) . Si R es un anillo con-


mutativo con rango estable uno y n ≥ 2, entonces En (R) = SLn (R).

Demostración. Inmediato de las proposiciones 5.3.13 y 5.3.7. ✓


4. Grupos clásicos sobre anillos


A continuación se definen los anillos con involución, insumo importante
para introducir los grupos clásicos sobre anillos.

Definición 5.4.1. Sea A un anillo. Una involución en A es una función


∗ : A −→ A que satisface, para cada a, b ∈ A,

(i) (a + b) ∗ = a∗ + b ∗ .
Grupos de matrices · 169

(ii) (ab) ∗ = b ∗ a ∗ .

(iii) (a∗ ) ∗ = a.

Los ejemplos más conocidos de involuciones son la trasposición en Mn (A)


y la conjugación en ℂ.

Proposición 5.4.2. La función identidad es una involución en A si, y sólo si, A


es un anillo conmutativo.

Demostración. La identidad siempre satisface (i) y (iii); claramente satisface


(ii) si, y sólo si, A es conmutativo. ✓

Proposición 5.4.3. Sea ∗ una involución en el anillo A.

(i) 0∗ = 0 y 1∗ = 1.

(ii) Para cada a ∈ A, (−a) ∗ = −a ∗ ; y si a ∈ A∗ , (a−1 ) ∗ = (a∗ ) −1 .

(iii) Si a ∗ = a, entonces (−a) ∗ = −a; y si a ∈ A∗ , (a−1 ) ∗ = a−1 .

(iv) Si a ∈ Z (A), también a∗ ∈ Z (A).

Demostración. (i) 0∗ = (0 + 0) ∗ = 0∗ + 0∗ , luego 0∗ = 0. Por otro lado,


1∗ 1 = 1∗ (1∗ ) ∗ = (1∗ 1) ∗ = (1∗ ) ∗ = 1 de donde 1∗ = 1.
(ii) (−a) ∗ + a∗ = (−a + a) ∗ = 0∗ = 0, luego (−a) ∗ = −a ∗ . Análogamente,
(a ) ∗ a∗ = (aa−1 ) ∗ = 1∗ = 1 y a ∗ (a−1 ) ∗ = (a−1 a) ∗ = 1∗ = 1, de manera que
−1

a∗ ∈ A∗ con inverso (a −1 ) ∗ .
(iii) Según (ii), (−a) ∗ = −a ∗ y (a −1 ) ∗ = (a∗ ) −1 .
(iv) Sea b ∈ A, entonces a ∗ b = a∗ (b ∗ ) ∗ = (b ∗ a) ∗ = (ab ∗ ) ∗ = (b ∗ ) ∗ a ∗ = ba ∗ ,
luego a∗ ∈ Z (A). ✓

Definición 5.4.4. Sean A un anillo y ∗ una involución en A. Dada una


matriz F := [ fi j ] ∈ Mm×n (A), la matriz trasjugada de F respecto a ∗ es
F ∗ := [ f ji∗ ] ∈ Mn×m (A).

Es decir, F ∗ se obtiene de F trasponiendo la matriz de imágenes por ∗.


Nótese que si ∗ es la identidad (A conmutativo), se tiene F ∗ = F T .

Proposición 5.4.5. Sea ∗ una involución en el anillo A. Si F := [ fi j ] ∈ Ml×m (A),


G := [gi j ] ∈ Mn×p (A) y a ∈ A, entonces

(i) (F + G) ∗ = F ∗ + G ∗ siempre que l = n y m = p.

(ii) (GF ) ∗ = G ∗ F ∗ siempre que m = n.


170 · Grupos de matrices

(iii) (F ∗ ) ∗ = F .

(iv) (a · F ) ∗ = F ∗ · a ∗ .

(v) (F −1 ) ∗ = (F ∗ ) −1 siempre que l = m y F sea invertible.

Demostración. (i) Evidente.


Ín
(ii) Sea FG := [bi j ], entonces bi j = k=1 fik gk j , y la entrada (i , j) de
(FG) ∗ es
n
∑︁ ∑︁n
∗ ∗
(b ji ) = ( f jk gki ) = gki∗ f jk∗ .
k=1 k=1

Por otro lado, si G∗


= [ci j ] y F∗
= di j (de manera que ci j = g ji∗ y di j = f ji∗ ),
entonces la entrada (i , j) de G ∗ F ∗ es
n
∑︁ n
∑︁
cik dk j = gki∗ f jk∗
k=1 k=1

y así (FG) ∗ = G ∗ F ∗ .
(iii) Evidente.
(iv) La entrada (i , j) de (a · F ) ∗ es (a f ji ) ∗ = f ji∗ a ∗ , que coincide con la
entrada (i , j) de F ∗ · a ∗ .
(v) Tenemos

F ∗ (F −1 ) ∗ = (F −1 F ) ∗ = E ∗ = E,
(F −1 ) ∗ F ∗ = (F F −1 ) ∗ = E ∗ = E,

de modo que F ∗ es invertible con inversa (F ∗ ) −1 = (F −1 ) ∗ . ✓


Definición 5.4.6. Sea A un anillo con unidad, ∗ una involución en A y


𝜀 ∈ Z (A) tal que 𝜀𝜀 ∗ = 1.

(i) F ∈ Mn (A) es alternada si existe F1 ∈ Mn (A) tal que F = F1 − 𝜀 · F1∗ .

(ii) F ∈ Mn (A) es hermitiana si F = 𝜀 · F ∗ .

(iii) F ∈ Mn (A) es antihermitiana si F = −𝜀 · F ∗ .

La alternancia depende de 𝜀 y de la involución; nótese que por lo menos


𝜀 = 1 y 𝜀 = −1 satisfacen 𝜀𝜀 ∗ = 1. Por otra parte, si ∗ es la identidad
(A conmutativo), las matrices hermitianas se denominan simétricas y las
antihermitianas, antisimétricas.

Proposición 5.4.7. Si F es alternada, entonces F es antihermitiana.


Grupos de matrices · 171

Demostración. Como F alternada, sea F = F1 − 𝜀 · F1∗ . Entonces,

−𝜀 · F ∗ = −𝜀 · (F1 − 𝜀 · F1∗ ) ∗ = −𝜀 · (F1∗ − F1 · 𝜀 ∗ )


= −𝜀 · (F1∗ − 𝜀 ∗ · F1 ) = −𝜀 · F1∗ + 𝜀𝜀 ∗ · F1
= F1 − 𝜀 · F1∗ = F .

Así, F = −𝜀F ∗ y F es antihermitiana. ✓


Proposición 5.4.8. Sea A un anillo tal que 2A = A.

(i) F ∈ Mn (A) es alternada si, y sólo si, es antihermitiana.

(ii) Si F ∈ Mn (A) es hermitiana y antihermitiana, entonces F = 0.

Demostración. 2A = A significa que 1 + 1 ∈ A∗ , es decir, que si a ∈ A es tal


que a + a = 0 entonces a = 0.
(i) Si F es alternada, es antihermitiana por la proposición anterior. Su-
póngase que F es antihermitiana, entonces

(1 + 1) · F = F + F = F − 𝜀 · F ∗ .

Si 2 = 1 + 1, 2∗ = (1 + 1) ∗ = 1∗ + 1∗ = 1 + 1 = 2; por hipótesis 2 ∈ A∗ , luego


(2−1 ) ∗ = 2−1 , y así,

F = 2−1 · [(1 + 1) · F ] = 2−1 · (F − 𝜀 · F ∗ )


= (2−1 · F ) − 𝜀 · (2−1 · F ∗ ) = (2−1 · F ) − 𝜀 · (F · 2−1 ) ∗
= (2−1 · F ) − 𝜀 · (2−1 · F ) ∗ ,

ya que 2−1 ∈ Z (A). Como F = (2−1 · F ) − 𝜀 (2−1 · F ) ∗ , entonces F es


alternada.
(ii) Dado que F es antihermitiana, 𝜀 · F ∗ = −F ; pero también es hermi-
tiana, luego 𝜀 · F ∗ = F , de donde F = −F , F + F = 0, y de 2A = A se sigue
que F = 0. ✓

Proposición 5.4.9. Si ∗ es la identidad (A conmutativo) y 𝜀 = 1, F es alternada


si, y sólo si, XF X T = 0 para cada matriz fila X ∈ M1×n (A).

Demostración. ⇒): sea F alternada con F = F1 − F1T , entonces,

XF X T = X (F1 − F1T )X T = XF1 X T − XF1T X T = XF1 X T − (XF1 X T )T ,

pero XF1 X T ∈ M1 (A) es igual a su traspuesta luego XF X T = 0.


⇐): sea F := [ fi j ] ∈ Mn (A) tal que XF X T = 0 para cada X ∈ M1×n (A).
Sea Xi la matriz fila con 1 en la entrada i-ésima y 0 en las demás; entonces
172 · Grupos de matrices

Xi F XiT = fii = 0 para 1 ≤ i ≤ n. Para i ≠ j, sea Xi j la matriz fila con 1 en


las entradas i, j y 0 en las restantes; tenemos

Xi j F XiTj = fi j + fii + f ji + f j j = fi j + f ji

y f ji = −fi j (1 ≤ i ≠ j ≤ n), de manera que F es antisimétrica. Finalmente,


F1 := [bi j ] se define de la siguiente forma: bi j := 0 para i ≤ j y bi j := fi j
para i > j; así, F = F1 − F1T ya que F1 es la “mitad” inferior de F , y de esta
manera, F es alternada. ✓

Proposición 5.4.10. Sean ∗ una involución en A y F ∈ Mn (A). Entonces,

(i) {M ∈ GLn (A) | M ∗ F M = F } es un subgrupo de GLn (A).

(ii) {M ∈ GLn (A) | ∃rM ∈ Z (A) ∗ , M ∗ F M = rM · F } es un subgrupo de


GLn (A).

Demostración. (i) Como E ∗ = E ∈ GLn (A) y E ∗ F E = EF E = E, el conjunto


no es vacío. Si M y N satisfacen M ∗ F M = F y N ∗ F N = F , entonces

(M N ) ∗ F (M N ) = N ∗ (M ∗ F M)N = N ∗ F N = F ,
(M −1 ) ∗ F M −1 = (M −1 ) ∗ (M ∗ F M)M −1 = (MM −1 ) ∗ F (MM −1 )
= E∗ F E = F ,

por lo tanto, el conjunto resulta ser un subgrupo de GLn (A).


(ii) E pertenece al conjunto, considerando en este caso rE = 1. Si M y
N son tales que M ∗ F M = rM · F y N ∗ F N = rN · F , con rM , rN elementos
invertibles del centro de A, entonces

(M N ) ∗ F (M N ) = N ∗ (M ∗ F M)N = N ∗ (rM · F )N = rM · N ∗ F N
= rM (rN · F ) = rM rN · F ,

con rM rN ∈ Z (A) ∗ , y

(M −1 ) ∗ F M −1 = (M −1 ) ∗ [rM
−1
· M ∗ F M]M −1
−1
= rM · (M −1 ) ∗ M ∗ F MM −1 = rM
−1
·F
−1 ∈ Z (A) ∗ .
con rM ✓

Definición 5.4.11. Sean ∗ una involución en A y F ∈ Mn (A).

(i) El grupo unitario correspondiente a F es

U (F ) := {M ∈ GLn (A) | M ∗ F M = F }.
Grupos de matrices · 173

(ii) El grupo de similitudes correspondiente a F es

GU (F ) := {M ∈ GLn (A) | ∃rM ∈ Z (A) ∗ , M ∗ F M = rM · F };

rM se denomina multiplicador de M ∈ GU (F ).

Por consiguiente, U (F ) es el subgrupo de GU (F ) constituido por las ma-


trices de multiplicador 1.

Proposición 5.4.12. Sea ∗ una involución en A, 𝜀 ∈ Z (A) tal que 𝜀𝜀 ∗ = 1 y


Q ∈ Mn (A). Entonces, X := {M ∈ GLn (A) | M ∗QM − Q es alternada} es un
subgrupo de GLn (A).

Demostración. Como la matriz nula es alternada (0 = 0 − 𝜀 · 0∗ ), E ∈ X y


X ≠ ∅. Si M , N ∈ X, entonces

M ∗QM − Q = M1 − 𝜀 · M1∗ ,
N ∗QN − Q = N1 − 𝜀 · N1∗

para ciertas M1 , N1 ∈ Mn (A). Ahora,

(M N ) ∗Q (M N ) − Q = N ∗ (M ∗QM)N − Q
= N ∗ (Q + M1 − 𝜀 · M1∗ )N − Q
= N ∗QN − Q + N ∗ (M1 − 𝜀 · M1∗ )N
= N1 − 𝜀 · N1∗ + N ∗ M1 N − 𝜀N ∗ M1∗ N
= (N1 + N ∗ M1 N ) − 𝜀 · (N1 + N ∗ M1 N ) ∗

es alternada, de modo que M N ∈ X. Por otro lado,

QM − (M −1 ) ∗Q = (M −1 ) ∗ M1 − 𝜀 · (M −1 ) ∗ M1∗ ,

luego

Q − (M −1 ) ∗QM −1 = (M −1 ) ∗ M1 M −1 − 𝜀 · (M −1 ) ∗ M1∗ M −1 ,

y en consecuencia,

(M −1 ) ∗QM −1 − Q = [𝜀 · (M −1 ) ∗ M1∗ M −1 ] − 𝜀 · [𝜀 · (M −1 ) ∗ M1∗ M −1 ] ∗ ,

luego M −1 ∈ X. ✓

Definición 5.4.13. Sea ∗ una involución en A, 𝜀 ∈ Z (A) tal que 𝜀𝜀 ∗ = 1.


Si Q ∈ Mn (A), el grupo ortogonal correspondiente a Q es

O(Q) := {M ∈ GLn (A) | M ∗QM − Q es alternada}.


174 · Grupos de matrices

En el caso particular de los anillos conmutativos se tienen otros dos gru-


pos clásicos.

Definición 5.4.14. Sean R un anillo conmutativo y ∗ una involución en R.

(i) Sea F ∈ Mn (R). El grupo unitario especial correspondiente a F es

SU (F ) := U (F ) ∩ SLn (R).

(ii) Sea Q ∈ Mn (R). El grupo ortogonal especial correspondiente a Q es

SO(Q) := O(Q) ∩ SLn (R).

Proposición 5.4.15. En las condiciones de la anterior definición se tiene:

(i) SU (F ) ⊴ U (F ).

(ii) SO(Q) ⊴ O(Q).

Demostración. Sean M ∈ SU (F ) (respectivamente, SO(Q)) y N ∈ U (F )


(respectivamente, O(Q)), entonces det(N −1 M N ) = det(M) = 1. □✓

Para terminar, veamos que los grupos clásicos introducidos en esta sec-
ción corresponden a aquellos que vimos para cuerpos al principio del ca-
pítulo. Sea 𝕂 un cuerpo; para los grupos ortogonales se toma la identidad
como involución y Q simétrica, de manera que para cada matriz M se tiene
que M ∗ = M T y si M ∈ O(Q), entonces

(M T QM − Q)T = M T QT M − QT = M T QM − Q ,

es decir, M T QM − Q es simétrica, pero por definición de O(Q) esta ma-


triz también es alternada, por lo tanto antisimétrica. En consecuencia, si
1 + 1 ≠ 0 en 𝕂, se tiene M T QM − Q = 0 (proposición 5.4.8), luego

O(Q) = {M ∈ GLn (𝕂)|M T QM = Q} = U (Q),

y este grupo coincide con el grupo ortogonal definido para cuerpos. Si ade-
más se toma Q invertible, det(M) = ±1 y SU (Q) es el subgrupo de matri-
ces de determinante “positivo”, de ahí que en algunas ocasiones se utilice la
notación U + (Q). Si F es antihermitiana (antisimétrica), entonces el grupo
U (F ) es el grupo simplicial. El grupo de similitudes es entonces

GU (F ) = {M ∈ GLn (𝕂) | ∃rM ∈ 𝕂, M ∗ F M = rM · F }.


Grupos de matrices · 175

En el caso particular 𝕂 = ℝ, tomando la identidad como involución, y dado


que E es simétrica, tenemos que

O(E) = U (E) = {M ∈ Mn (ℝ) | M T M = E} = On (ℝ),

que es el grupo ortogonal “tradicional”; el grupo unitario “tradicional” re-


sulta al tomar 𝕂 = ℂ, F = E y la conjugación como involución, por lo tanto,
se tiene que

U (E) = {M ∈ Mn (ℂ) | M ∗ M = E} = Un (ℂ).

5. Ejercicios
1. Demuestre que existe al menos una matriz propiamente elemental de
SL2 (ℤ3 ) que no pertenece a [SL2 (ℤ3 ), SL2 (ℤ3 )].

2. Calcule el número de formas bilineales simétricas no degeneradas so-


bre el espacio vectorial ℤ22 .

3. Sea dimV = n y sea 𝕂 un cuerpo tal que char(𝕂) ≠ 2. Sea f una


forma bilineal simétrica sobre V . Demuestre que existe una base X
en V tal que mX ( f ) es diagonal.

4. Si dimℂ V = n y f es una forma bilineal simétrica sobre V tal que


rank( f ) = r, demuestre que existe una base ordenada X = {v1 , . . . vn }
en V tal que

(i) mX ( f ) es diagonal.
(ii) f (vi , vi ) = 1 para 1 ≤ i ≤ r, f (vi , vi ) = 0 para i > r.

5. Si dimℝ V = n y f es una forma bilineal simétrica sobre V tal que


rank( f ) = r , demuestre que existe una base ordenada X = {v1 , ..., vn }
en V tal que

(i) mX ( f ) es diagonal.
(ii) f (vi , vi ) = ±1 para 1 ≤ i ≤ r , y f (vi , vi ) = 0 para i > r.
(iii) El número de vectores de la base X para los cuales en (ii) se da
el signo positivo es independiente de dicha base.

6. Sea dim𝕂 V = n y f una forma bilineal antisimétrican sobre el cuerpo


𝕂, donde char(𝕂) ≠ 2. Demuestre que existe una base ordenada X
176 · Grupos de matrices

en V tal que la matriz de f es suma directa de la matriz nula de orden


n − 2k y k matrices 2 × 2 de la forma
 
0 1
.
−1 0

7. Formas sobre espacios no necesariamente libres. Sean A un anillo y


V un A-espacio (A-módulo, véase [24]); sea ∗ una involución en A y
𝜀 ∈ Z (A) es tal que 𝜀𝜀 ∗ = 1.

a) Una forma sesquilineal en V es una función F : V × V −→ A


que satisface para cada u, u1 , u2 , v, v1 , v2 ∈ V y cada a ∈ A,
(i) F (u1 + u2 , v) = F (u1 , v) + F (u2 , v), F (u · a, v) = a ∗ F (u, v).
(ii) F (u, v1 + v2 ) = F (u, v1 ) + F (u, v2 ), F (u, v · a) = F (u, v)a.
Demuestre que si F y G son formas sesquilineales en V , la fun-
ción F + G definida por (F + G)(u, v) = F (u, v) + G (u, v), para
todo u, v ∈ V , es una forma sesquilineal en V .
b) Demuestre que el conjunto de las formas sesquilineales en V es
un grupo abeliano con la adición definida como antes.
c) Si A es conmutativo, el conjunto de las formas sesquilineales en
V es una A-espacio.
d) Sea Λ un subgrupo aditivo del anillo A que satisface:
(i) Para cada 𝜆 ∈ Λ y a ∈ A, se tiene a ∗ 𝜆 a ∈ Λ.
(ii) Λ𝜀 := {a − 𝜀 a∗ | a ∈ A} ⊆ Λ.
(iii) Λ𝜀 := {a ∈ A | a = −𝜀 a∗ } ⊇ Λ.
Demuestre que Λ𝜀 y Λ𝜀 son subgrupos aditivos de A que a su
vez satisfacen (i), (ii) y (iii).
e) Sea Λ como antes. Demuestre que:
(i) Si Λ = 0, entonces A es conmutativo, ∗ es la identidad y
𝜀 = 1.
(ii) Si 2A = A es conmutativo, ∗ es la identidad y 𝜀 = 1, enton-
ces Λ = Λ𝜀 = 0.
(iii) Si Λ = A, entonces A es conmutativo, ∗ es la identidad y
𝜀 = −1.
(iv) Si 2A = A, entonces Λ𝜀 = Λ𝜀 = Λ.
f) Sea F una forma sesquilineal en V .
(i) F es hermitiana si F (u, v) = 𝜀F ∗ (v, u) para cada u, v ∈ V .
Grupos de matrices · 177

(ii) F es antihermitiana si F (u, v) = −𝜀F ∗ (v, u) para cada


u, v ∈ V .
(iii) F es Λ-alternada si satisface:
(i) F (v, v) ∈ Λ para cada v ∈ V .
(ii) F es antihermitiana.
Si Λ = Λ𝜀 , demuestre que una forma sesquilineal es Λ-alternada
si, y sólo si, es antihermitiana. Además, pruebe que esto ocurre
en particular cuando 2A = A, ya que en tal caso el único subgru-
po Λ es Λ𝜀 = Λ𝜀 .
g) F una forma sesquilineal en V . Demuestre que:
(i) Si F se puede expresar como F (u, v) = F1 (u, v) + 𝜀F1∗ (v, u),
para cada u, v ∈ V , siendo F1 una forma sesquilineal en V ,
entonces F es Λ-alternada.
(ii) Cuando 2A = A, el recíproco de (i) es cierto.
h) Demuestre que el conjunto 𝔉Λ de las formas Λ-alternadas es un
subgrupo normal del grupo de formas sesquilineales.

8. Formas cuadráticas sobre espacios no necesariamente libres. Sean


A un anillo y V un A-espacio (A-módulo, véase [24]); sea ∗ una in-
volución en A y 𝜀 ∈ Z (A) tal que 𝜀𝜀 ∗ = 1. Dada una forma sesqui-
lineal F en V , la forma cuadrática correspondiente a F es la clase
q := F + 𝔉Λ . Es decir, si Q es una forma sesquilineal, entonces Q ∈ q
si, y sólo si, Q − F es una forma Λ-alternada. Nótese que q depende
de A, ∗, 𝜀, Λ y F . Sea q una forma cuadrática y Q ∈ q.

(i) La distancia según q es la función

| | q : V −→ A/Λ
v ↦−→ |v| q := Q (v, v) + Λ.

(ii) El producto escalar según q es la función

( , )q : V × V −→ A
(u, v) ↦−→ (u, v)q := Q (u, v) + 𝜀Q ∗ (v, u).

a) Demuestre que la distancia y el producto escalar no dependen


de la forma Q ∈ q elegida.
b) Sea q una forma cuadrática. Demuestre que:
(i) El producto escalar según q es una forma sesquilineal her-
mitiana.
178 · Grupos de matrices

(ii) Para cada v ∈ V , (v, v)q = a + 𝜀 a ∗ , con a ∈ |v| q arbitrario.


(iii) Para cada u, v ∈ V , |u + v| q = |u| q + |v| q + (u, v)q .
(iv) Para cada b ∈ A y v ∈ V , se tiene |v · b| q = b ∗ ab + Λ, con
a ∈ |v| q arbitrario.
c) Sea q una forma cuadrática. Demuestre que:
(i) La distancia y el producto escalar determinan unívocamente
a q.
(ii) Si Λ = Λ𝜀 , el producto escalar determina unívocamente a q.
(iii) Si Λ no contiene ideales biláteros no nulos de A, la distancia
determina unívocamente a q.
(Siempre que se pueda tomar Λ = Λ𝜀 , y cuando 2A = A, esta
es la única opción que se tiene. Por otro lado, la condición en
(iii) significa que si I es un ideal bilátero de A e I ⊆ Λ, entonces
I = 0. Un ejemplo se tiene cuando Λ = 0).

9. Grupos clásicos sobre espacios no necesariamente libres. Sean A un


anillo y V un A-espacio (A-módulo, véase [24]); sea ∗ una involución
en A y 𝜀 ∈ Z (A) tal que 𝜀𝜀 ∗ = 1.

a) Sea F una forma sesquilineal hermitiana o antihermitiana en V .


Demuestre que el conjunto

X := { 𝜌 ∈ AutA (V ) | F ( 𝜌(u), 𝜌(v)) = F (u, v), ∀u, v ∈ V }

es un subgrupo de AutA (V ).
b) Si F es una forma sesquilineal hermitiana o antihermitiana en
V , el grupo unitario correspondiente a F es

U (F ) := { 𝜌 ∈ AutA (V ) | F ( 𝜌(u), 𝜌(v)) = F (u, v), ∀u, v ∈ V }.

Si Q es una forma sesquilineal en V y 𝜌 ∈ AutA (V ), demuestre


que la función RQ , definida como RQ (u, v) = Q ( 𝜌(u), 𝜌(v)),
para cada u, v ∈ V , es una forma sesquilineal en V .
c) Sea q una forma cuadrática.
(i) 𝜌 ∈ AutA (V ) preserva q si para cada Q ∈ q, la forma ses-
quilineal RQ − Q es Λ-alternada.
(ii) 𝜌 ∈ AutA (V ) preserva la distancia | | q si | 𝜌(v)| q = |v| q
para cada v ∈ V .
(iii) 𝜌 ∈ AutA (V ) preserva el producto escalar ( , )q si
( 𝜌(u), 𝜌(v))q = (u, v)q para cada u, v ∈ V .
Grupos de matrices · 179

Así, 𝜌 preserva q si la forma sesquilineal definida por


Q ( 𝜌(u), 𝜌(v)) − Q (u, v) es Λ-alternada. Como la distancia y
el producto escalar determinan q y recíprocamente, demuestre
que: 𝜌 ∈ AutA (V ) preserva q si, y sólo si, preserva la distancia
| | q y el producto escalar ( , )q .
d) Sea q una forma cuadrática. Demuestre que el conjunto

O(q) := { 𝜌 ∈ AutA (V ) | 𝜌 preserva q}

es un subgrupo de AutA (V ) y se denomina el grupo ortogonal


correspondiente a q.
e) Sea q una forma cuadrática y F la forma sesquilineal hermitiana
F = ( , )q . Demuestre que
(i) O(q) ⊆ U (F ).
(ii) Cuando Λ = Λ𝜀 , O(q) = U (F ).
f) Cuando Λ = A, o cuando Λ = 0 y 2A = A, demuestre que
O(q) = U (F ).
· 1

Cuaderno V

Cuerpos
Dedicado a Wilma, mi esposa
Presentación

Uno de los problemas clásicos que motiva la teoría que estudiamos en este
cuaderno es la solubilidad de ecuaciones polinómicas, es decir, el problema
de determinar condiciones necesarias y suficientes para saber si una ecua-
ción polinómica p(x) = 0, de grado n ≥ 1, y con coeficientes en un cuerpo
K, tiene raíces expresables por medio de radicales. Para ello es necesario
desarrollar la teoría de cuerpos, estudiar sus extensiones y sus automorfis-
mos. Una vez estudiada la teoría básica de cuerpos, se introduce la noción
de grupo de Galois de una extensión finita, normal y separable, se establece
la correspondencia que existe entre extensiones y subgrupos del grupo de
Galois, para llegar finalmente al teorema fundamental de la teoría de Galois.
En la parte final del cuaderno, como aplicación, se estudia la solublilidad de
ecuaciones polinómicas por medio de radicales.
Otras fuentes fuertemente recomendadas a los lectores para comple-
mentar los temas aquí tratados son [10], [20] y [41].
Para una mejor comprensión de los temas tratados en este cuaderno se
asume que el lector está familiarizado con las nociones básicas de teoría de
grupos, teoría de anillos y álgebra lineal (véase [21], [22], [23] y [25]). A
denotará un anillo no necesariamente conmutativo y con unidad 1, A∗ el
grupo multiplicativo de los elementos invertibles del anillo A. Si f es un
homomorfismo de anillos, entonces f (1) = 1.
Capítulo
uno
Polinomios
Polinomios · 3

El primer capítulo del presente cuaderno estudia la aritmética básica del


anillo de polinomios en varias variables con coeficientes en un cuerpo. Des-
tacamos el algoritmo de la división y el algoritmo de Euclides, para lo cual
consideramos órdenes monomiales sobre la colección de los monomios es-
tándar. El teorema de Gauss y los polinomios simétricos también ocuparán
un lugar importante en este capítulo.

1. Generalidades
Iniciamos recordando la construcción del anillo de polinomios como subani-
llo del anillo de series. Los detalles de la construcción se pueden consultar
en [23].
Sean A un anillo y S el conjunto de sucesiones en A,
S := {(a0 , a1 , a2 , . . .) := (ai ) | ai ∈ A, i = 0, 1, 2, . . .},
entonces las operaciones de adición y multiplicación definidas en S de la
siguiente manera, para a = (ai ), b = (bi ) ∈ S,
a + b := c = (ci ), ci := ai + bi , i = 0, 1, 2, . . .
∑︁
ab := d = (di ), di := a j bk , i = 0, 1, 2, . . .
j+k=i

dan a S una estructura de anillo; adicionalmente, dos sucesiones son iguales


si, y sólo si, ai = bi , para cada i = 0, 1, 2, . . .. El cero de S es la sucesión
nula
0 := (0, 0, . . .),
y la opuesta de a = (ai ) es −a := (−ai ). Es fácil comprobar que el uno de S
es la sucesión
1 := (1, 0, 0, . . .)
y que el producto se distribuye sobre la adición. El anillo S se denomina
anillo de sucesiones formales en A.
Algunas propiedades relativas a esta construcción se presentan a conti-
nuación:
(i) El anillo S de sucesiones formales es conmutativo si, y sólo si, A es un
anillo conmutativo.

(ii) La función
𝜄 : A −→ S
a ↦−→ (a, 0, 0, . . .)
4 · Polinomios

es un homomorfismo inyectivo de anillos.

(iii) En el anillo S se destacan de manera especial las sucesiones que tie-


nen un número finito de términos no nulos. Se dice que la sucesión
a = (a0 , a1 , a2 , . . .) es un polinomio si existe un entero n tal que
ai = 0 para i > n. Se denomina grado del polinomio a al mayor
entero n tal que an ≠ 0, y se denota por gr(a). Los polinomios de
grado 0 se denominan constantes. La sucesión nula es un polinomio
sin grado. Si a es de grado n, entonces an+k = 0 para k ≥ 1:

a = (a0 , a1 , . . . , an , 0, . . .).

Los elementos a0 , a1 , . . . , an se denominan coeficientes del polino-


mio a; a0 se denomina coeficiente independiente de a. El elemento
an se denomina el coeficiente principal de a y se denota por lc(a). Se
dice que a es mónico si lc(a) = 1.

(iv) El conjunto P de polinomios de S es un subanillo de S.

(v) Queremos ahora presentar los polinomios en su forma habitual de


sumas finitas. Si x denota la sucesión

x := (0, 1, 0, . . .)

entonces

x 2 = (0, 0, 1, 0, . . .),
x 3 = (0, 0, 0, 1, 0, . . .),
..
.
x n = (0, . . . , 0, 1, 0, . . .).

Además, podemos identificar los polinomios constantes en la forma

(a0 , 0, . . .) := a0 , a0 ∈ A,

y un polinomio de grado n se escribirá

a(x) := (a0 , a1 , . . . , an , 0, . . .) = a0 + a1 x + · · · + an x n .

El conjunto P de los polinomios en x con coeficientes en A será deno-


tado por A[x]. Al anillo S de sucesiones lo denotaremos por A[[x]].

(vi) Para cada a ∈ A:

ax = (a, 0, . . .) (0, 1, 0, . . .) = (0, a, 0, . . .) = xa.


Polinomios · 5

(vii) Se tienen las inclusiones

A ↩→ A[x] ↩→ A[[x]].

(vii) Cada elemento a = (ai ) ∈ A[[x]] se puede escribir como una serie,
a= ∞ i
Í
i=0 ai x , y las operaciones que hemos definido en A[[x]] corres-
ponden a la suma y producto de series que se estudian en los cursos de
cálculo. El anillo A[[x]] se conoce también como el anillo de series
formales en A.

(viii) Los anillos de series y polinomios en varias variables se pueden definir


en forma recurrente de la siguiente manera:

A[[x, y]] := A[[x]] [[y]] ,


A[[x1 , . . . , xn ]] := A[[x1 , . . . , xn−1 ]] [[xn ]] ,
A[x, y] := A[x] [y] ,
A[x1 , . . . , xn ] := A[x1 , . . . , xn−1 ] [xn ].

(ix) Para cualesquiera polinomios no nulos a(x), b(x) ∈ A[x] tales que
a(x) + b(x) ≠ 0, se cumple que:

gr(a(x) + b(x)) ≤ máx{gr(a(x)), gr(b(x))}.

Para a(x)b(x) ≠ 0 se tiene también que

gr(a(x)b(x)) ≤ gr(a(x)) + gr(b(x)).

Si A es un dominio, entonces en la última relación se cumple la igual-


dad.

(x) A es un dominio si, y sólo si, A[[x]] es un dominio si, y sólo si, A[x]
es un dominio.

(xi) Si A es un dominio, A[x] ∗ = A∗ .

(xii) Sean A un anillo y a un elemento fijo de A. La función definida por:

𝜑 a : A[x] −→ A
p(x) ↦−→ p0 + p1 a + · · · + pn a n

donde p(x) := p0 + p1 x + · · · + pn x n , es un homomorfismo de anillos,


denominado el homomorfismo evaluación en a.
6 · Polinomios

(xiii) Con la notación del numeral anterior, se dice que a ∈ A es una raíz
o un cero del polinomio p(x) si p(x) ∈ ker(𝜑 a ), es decir, si
p0 + p1 a + · · · + pn a n = 0.
Se escribe entonces p(a) = 0. Si C es un anillo extensión de A, es
decir, A es un subanillo de C, entonces podemos considerar p(x) ∈
C [x] y buscar raíces de p(x) en C.

(xiv) Si R es un DI (dominio de integridad, es decir, dominio connmuta-


tivo), los conceptos de divisibilidad, máximo común divisor, mínimo
común múltiplo, elemento primo y elemento irreducible pueden en-
tonces ser aplicados al dominio R[x].
Cerramos esta sección con un par de ejemplos sobre irreducibilidad y
raíces. Más adelante consideraremos estas tareas de manera sistemática.
Ejemplo 1.1.1. La irreducibilidad de un polinomio es relativa al anillo de
coeficientes. Así por ejemplo, el polinomio p(x) = 2 + 2x 2 puede ser consi-
derado como elemento de ℤ[x] , ℚ[x], ℝ[x] y ℂ[x]:
(i) p(x) es reducible sobre ℤ: p(x) = 2(1 + x 2 ).
(ii) Veamos una prueba directa de la irreducibilidad sobre ℚ: sean
m(x), n(x) ∈ ℚ[x] tales que m(x)n(x) = 2 + 2x 2 , entonces
gr(m(x)n(x)) = gr(m(x)) + gr(n(x)) = 2,
luego gr(m(x)) ≤ 2 y gr(n(x)) ≤ 2. Se presentan entonces tres casos:
Caso 1, gr(m(x)) = 2 y gr(n(x)) = 0: se tiene que n(x) es constante no
nulo.
Caso 2, gr(m(x)) = 0 y gr(n(x)) = 2: se tiene que m(x) es constante no
nulo.
Caso 3, gr(m(x)) = 1 = gr(n(x)): este caso no es posible, pues si b ≠ 0 y
d ≠ 0 son tales que m(x) = a + bx, n(x) = c + dx, entonces
ac + (ad + bc)x + bdx 2 = 2 + 2x 2 ,
con lo cual ac = 2, ad + bc = 0, bd = 2, y de aquí obtenemos acd + bc 2 = 0,
es decir, 2d + bc 2 = 0, luego
2d 2 + bdc 2 = 0 = 2d 2 + 2c 2 = d 2 + c 2 .
Resulta, d = c = 0, una contradicción.
(iii) De manera análoga se establece que p(x) es también irreducible so-
bre ℝ.
(iv) Finalmente, p(x) es reducible sobre ℂ: p(x) = 2(x + i)(x − i).
Polinomios · 7

Ejemplo 1.1.2. Calculemos todas las raíces del polinomio

x 5 + 3x 3 + x 2 + 2x ∈ ℤ5 [x].

Sea a ∈ ℤ5 una raíz de p(x) = x 5 +3x 3 +x 2 +2x, entonces a5 +3a 3 +a2 +2a = 0.
Según el teorema de Fermat (véase [22]), a5 = a, luego 3a3 + a2 + 3a = 0,
pero como ℤ5 no tiene divisiones de cero, entonces a = 0 ó 3a2 + a + 3 =
0. Así, a = 0 ó 5 | (3 + a + 3a2 ). Para la segunda opción ensayamos los
valores a = 0, 1, 2, 3, 4 y encontramos que solo a = 4 satisface la relación
de divisibilidad, por lo tanto, las raíces de p(x) son 0 y 4.

2. Polinomios sobre cuerpos


Un resultado muy importante de los polinomios en una variable sobre cuer-
pos es el teorema que afirma que si 𝕂 es un cuerpo entonces 𝕂 [x] es un DE
(dominio eucilidano), y en consecuencia, un DIP (dominio de ideales prin-
cipales) y un DFU (dominio de factorización única, conocido también como
dominio de Gauss).
Teorema 1.2.1. Sea 𝕂 un cuerpo y sea 𝕂 [x] su anillo de polinomios. Entonces,
𝕂 [x] es un DE.
Demostración. Véase [23]. ✓

Notemos que si R es un dominio euclidiano, entonces no necesariamen-


te R[x] es un dominio euclidiano. En efecto, el contraejemplo clásico es
ℤ[x]: si fuera euclidiano sería un DIP, pero el ideal ⟨2, x⟩ no es principal
(véase [23]). Este mismo ejemplo muestra que si R es un DIP, entonces no
siempre R[x] es un DIP. Sin embargo, más adelante mostraremos que si R
es un DFU, entonces R[x] es también un DFU (véase también [23]). Este
resultado se conoce como el teorema de Gauss.
Del teorema anterior se desprenden inmediatamente los siguientes re-
sultados.
Corolario 1.2.2. Sea 𝕂 un cuerpo. Entonces,
(i) 𝕂 [x] es un DIP y un DFU.

(ii) Cada par de polinomios no nulos f (x), g (x) tienen un máximo común divi-
sor d(x) = m. c. d.( f (x), g (x)), el cual se puede expresar en la forma:

d(x) = f ′ (x) f (x) + g ′ (x) g (x),

con f ′ (x), g ′ (x) ∈ 𝕂 [x].


8 · Polinomios

(iii) Para cada polinomio no nulo f (x) se cumple que f (x) es irreducible si, y sólo
si, ⟨f (x)⟩ es maximal.

(iv) Si p(x) es un polinomio irreducible de 𝕂 [x], entonces para cualquiera poli-


nomios f (x), g (x) ∈ 𝕂 [x] se cumple

p(x) | f (x)g (x) implica p(x) | f (x), o, p(x) | g (x).

(v) Cada par de polinomios no nulos f (x), g (x) tienen un mínimo común múl-
tiplo m(x) = m. c. m.( f (x), g (x)) que satisface

f (x)g (x) = m(x)d(x), con d(x) = m. c. d.( f (x), g (x)).

Demostración. Las afirmaciones del primer numeral se desprenden de las


inclusiones generales DE ⊂ DIP ⊂ DFU (veáse [23]). Las afirmaciones de los
otros numerales son válidas en cualquier DIP. En realidad, las propiedades
(iv) y (v) son válidas en cualquier DFU. En efecto, la prueba de la afirmación
(iv) se puede consultar en [23]; veamos la demostración de la propiedad
(v). Sea R un DFU y sean a, b ∈ R no nulos. Si a ∈ R ∗ , entonces d :=
m. c. d.(a, b) = a y m := m. c. m.(a, b) = b. Una situación similar se tiene si
b ∈ R ∗ . Sean a y b no invertibles, entonces se tienen las descomposiciones
irreducibles
a = p1r1 · · · pnrn y b = q1s1 · · · qtst ;
si {p1 , . . . , pn } ∩ {q1 , . . . , qt } = ∅, entonces d = 1 y m = ab. Supongamos
entonces que {p1 , . . . , pn } ∩ {q1 , . . . , qt } ≠ ∅, por lo que podemos asumir
que
{p1 , . . . , pn } ∩ {q1 , . . . , qt } = {p1 , . . . , pu },
donde u satisface 1 ≤ u ≤ n, de tal forma que
ru+1 su+1
a = p1r1 · · · puru pu+1 · · · pnrn y b = p1s1 · · · pusu qu+1 · · · qtst .

Entonces, notemos que

d = p1v1 · · · puvu , con vi := mı́n{ri , si }, 1 ≤ i ≤ u,


ru+1 su+1
m = p1z1 · · · puzu pu+1 · · · pnrn qu+1 · · · qtst , con zi := máx{ri , si }, 1 ≤ i ≤ u,

y se cumple que ab = dm ya que zi + vi = ri + si para cada 1 ≤ i ≤ u. ✓


Ejemplo 1.2.3. En relación con la propiedad (i) del corolario anterior, vea-
mos que 𝕂 [x, y] no es un DIP. En efecto, probemos que el ideal ⟨x, y⟩ no es
principal. Supongamos lo contrario, es decir, ⟨x, y⟩ = ⟨p(x, y)⟩, para algún
Polinomios · 9

p(x, y) ∈ 𝕂 [x, y]. Entonces x = q(x, y)p(x, y), pero como x es irreducible
se tiene que q(x, y) = x y p(x, y) = 1, ó, q(x, y) = 1 y p(x, y) = x. El primer
caso es imposible ya que ya que ⟨x, y⟩ es propio. El segundo también es
imposible ya que entonces y ∉ ⟨p(x, y)⟩. Este mismo razonamiento aplica
al caso de varias variables.

Veamos ahora un par de propiedades relativas a raíces.

Proposición 1.2.4. Sean 𝕂 un cuerpo, a ∈ 𝕂 y f (x) ∈ 𝕂 [x]. Entonces,


(x − a) | f (x) si, y sólo si, f (a) = 0, es decir, si a es un cero de f (x).

Demostración. ⇒): f (x) = (x − a) g (x) = 0, con g (x) ∈ 𝕂 [x]. Utilizando el


homomorfismo evaluación 𝜑 a encontramos que f (a) = 0.
⇐): teniendo en cuenta que 𝕂 [x] es euclidiano, existen polinomios
p(x), r (x) ∈ 𝕂 [x] tales que f (x) = (x − a)p(x) + r (x), con gr(r (x)) = 0
ó r (x) = 0. Si r (x) = 0, entonces se tiene que (x − a) | f (x). Si r (x) ≠ 0,
entonces f (x) = (x − a)p(x) + k, con k := r (x) ∈ 𝕂 ∗ . Aplicando nuevamente
el homomorfismo evaluación encontramos que f (a) = 0 = k, contradic-
ción. ✓

Proposición 1.2.5. Sean 𝕂 un cuerpo y f (x) un polinomio no nulo de 𝕂 [x].


Entonces, f (x) tiene máximo n raíces en 𝕂, con n = gr( f (x)).

Demostración. La prueba la realizamos por inducción sobre el grado n del


polinomio f (x).
Para n = 1, f (x) = ax + b, con a, b ∈ 𝕂. Si a = 0 y b ≠ 0, entonces f (x)
es constante y no posee raíces. Este caso se cumple trivialmente. Si a ≠ 0,
entonces la única raíz de f (x) es −b a y la proposición en este caso es también
válida.
Supongamos que la afirmación es válida para todos los polinomios de
𝕂 [x], con grado < n. Sea f (x) ∈ 𝕂 [x] con gr( f (x)) = n. Si f (x) no
tiene raíces en 𝕂, entonces la proposición se cumple trivialmente. Sean
a1 , . . . , ar , r raíces distintas del polinomio f (x) que están en 𝕂, entonces
f (x) = (x − a1 )q(x). Nótese que gr(q(x)) = n − 1 y q(x) ∈ 𝕂 [x], se tiene
que

f (a2 ) = (a2 − a1 )q(a2 ) = 0, f (a3 ) = (a3 − a1 )q(a3 ) = 0,


. . . , f (ar ) = (ar − a1 )q(ar ) = 0.

Como 𝕂 no tiene divisiones de cero, entonces a2 , . . . , ar son raíces distintas


de q(x) las cuales están en 𝕂. Según la hipótesis de inducción, r − 1 ≤ n − 1,
de donde r ≤ n. ✓

10 · Polinomios

Ejemplo 1.2.6. Veamos que el polinomio f (x) = x 3 + 3x + 2 ∈ ℤ5 [x] es


irreducible. Si f (x) es reducible entonces existen q(x) y p(x) no constantes
tales que f (x) = p(x)q(x), por lo tanto, gr(p(x)) = 1 ó gr(q(x)) = 1. En
otras palabras, un factor lineal divide a f (x). De acuerdo con la proposición
1.2.4, f (a) = 0, para algún a ∈ ℤ5 , pero

f (0) ≠ 0, f (1) = 1 ≠ 0, f (2) = 1 ≠ 0, f (3) = 1 ≠ 0, f (4) = 3 ≠ 0.

Así, f (x) es irreducible.

Ejemplo 1.2.7. Descompongamos el polinomio f (x) = x 4 + 4 ∈ ℤ5 [x] en


factores lineales. Notemos que

f (x) = x 4 − 1 = (x − 1)(x 3 + x 2 + x + 1) ∈ ℤ5 [x].

Con el polinomio g (x) = x 3 + x 2 + x + 1 ∈ ℤ5 [x] podemos proceder como


en el ejemplo anterior: g (0) ≠ 0, g (1) = 4 ≠ 0, g (2) = 0, luego

f (x) = (x − 1)(x − 2)(x 2 + 3x + 2),

donde el polinomio x 2 + 3x + 2 resulta al dividir g (x) entre x − 2 (véase la


sección siguiente donde trataremos el algoritmo de la división). En total se
tiene que
f (x) = (x − 1)(x − 2)(x + 2)(x + 1).

3. Algoritmos de la división y Euclides en


𝕂 [x]
En esta sección daremos una mirada constructiva al álgebra de los polino-
mios 𝕂 [x], con 𝕂 un cuerpo arbitrario. Este enfoque nos permitirá cons-
truir procedimientos (algoritmos) para calcular el máximo común divisor
de dos o más polinomios y también para expresar éste como combinación
de los polinomios dados.
Para 0 ≠ f (x) ∈ 𝕂 [x], recordemos que el grado de f (x), denotado por
gr( f (x)), es el mayor exponente de x que aparece en f (x). El término prin-
cipal de f (x) , denotado por lt( f (x)), es el término de f (x) con mayor gra-
do. El coeficiente principal de f (x), denotado por lc( f (x)), es el coeficiente
del término principal de f (x). Así, si f (x) = an x n + an−1 x n−1 + · · · + a1 x + a0 ,
donde a0 , . . . , an ∈ 𝕂 y an ≠ 0, entonces gr( f (x)) = n, lt( f (x)) = an x n y
lc( f (x)) = an .
Polinomios · 11

La principal herramienta en el algoritmo de Euclides para calcular el má-


ximo común divisor de dos o más polinomios es el algoritmo de la división
(también conocido como división larga de polinomios), el cual ilustraremos
inicialmente con el siguiente ejemplo.
Ejemplo 1.3.1. Sean f (x) = x 3 − 2x 2 + 2x + 8 y g (x) = 2x 2 + 3x + 1
polinomios en ℚ[x]. Dividimos f (x) por g (x) para obtener el cociente
1 7 27 39
2 x − 4 y el resíduo 4 x + 4 , de la siguiente manera:

x 3 − 2x 2 + 2x + 8 2x 2 + 3x + 1
−x 3 − 32 x 2 − 21 x 1
2x − 4
7

− 72 x 2 + 23 x + 8
7 2 21 7
2x + 4 x + 4
27 39
4 x+ 4

Se tiene entonces que


   
1 7 27 39
f (x) = x− g (x) + x+ .
2 4 4 4
Vamos a analizar los pasos de la división anterior. Primero multiplica-
mos g (x) por 21 x y restamos el producto resultante de f (x). La idea fue
multiplicar g (x) por un término apropiado, precisamente por 12 x, tal que
el término principal de g (x), tantas veces este término, cancele el término
principal de f (x). Después de esta cancelación obtenemos el primer resíduo
h(x) = f (x)− 12 xg (x) = − 72 x 2 + 23 x+8. En general, si tenemos dos polinomios
f (x) = an x n +an−1 x n−1 +· · ·+a1 x+a0 y g (x) = bm x m +bm−1 x m−1 +· · ·+b1 x+b0 ,
con n = gr((x) f ) ≥ m = gr(g (x)), entonces el primer paso en la división de
f (x) por g (x) es restar de f (x) el producto bamn x n−m g (x). Usando la notación
introducida anteriormente, notamos que el factor de g (x) en este producto
es
lt( f (x))
g (x),
lt(g (x))
y así, obtenemos
lt( f (x))
h(x) = f (x) − g (x)
lt(g (x))
como resíduo. Llamaremos a h(x) una reducción de f (x) por g (x) y el pro-
ceso de calcular h(x) es denotado por

f (x) g (x) h(x).


−−−→
Volvamos al ejemplo 1.3.1; después de la cancelación repetimos el pro-
lt(h (x))
ceso para h(x) = − 72 x 2 + 23 x + 8, restando lt(g 7 2 21 7
(x)) g (x) = − 2 x − 4 x − 4
12 · Polinomios

de h(x), y obteniendo el segundo (y, en este ejemplo, el último) resíduo


r (x) = 27 39
4 x + 4 . Esto puede escribirse usando nuestra notación de reduc-
ción como
f (x) g (x) h(x) g (x) r (x).
−−−→ −−−→
El uso repetido, como arriba, de los pasos de reducción será denotado por

f (x) g (x) + r (x).


−−−→
Nótese que en la reducción

f (x) g (x) h(x),


−−−→
el grado de h(x) es estrictamente menor que el grado de f (x). Cuando se
continua el proceso el grado permanece bajando hasta que es menor que
el grado de g (x). De esta forma obtenemos una prueba constructiva del
teorema 1.2.1.

Proposición 1.3.2. Sea g (x) un polinomio no nulo en 𝕂 [x]. Entonces, para cada
f (x) ∈ 𝕂 [x] existen q(x) y r (x) en 𝕂 [x] tales que

f (x) = q(x) g (x) + r (x), con r (x) = 0, ó, gr(r (x)) < gr(g (x)).

Además, q(x) y r (x) son únicos; q(x) es llamado el cociente y r (x) el resíduo.

Demostración. Podemos suponer que f (x) ≠ 0, ya que de lo contrario to-


mamos
0 = 0g (x) + 0.
Sean entonces f (x), g (x) ∈ 𝕂 [x] no nulos, digamos

f (x) = an x n + an−1 x n−1 + · · · + a1 + a0 ,


g (x) = bm x m + bm−1 x m−1 + · · · + b1 + b0 .

Podemos suponer que n ≥ m ya que de lo contrario se tiene

f (x) = 0g (x) + f (x).

Consideremos para cada polinomio de 𝕂 [x] su término principal, así por


ejemplo, lt ( f (x)) = an x n y lt (g (x)) = bm x m . La división de polinomios, tal
como vimos en el ejemplo 1.3.1, implica realizar las siguientes operaciones

lt( f (x))
f (x) − g (x) = r1 (x).
lt(g (x))
Polinomios · 13

Si r1 (x) = 0, ó, gr(r1 (x)) < g (x), entonces hemos terminado ya que toma-
mos
lt( f (x))
q(x) = y r (x) = r1 (x).
lt(g (x))
Supongamos entonces que r1 (x) ≠ 0 y gr(r1 (x)) ≥ g (x); repetimos el an-
terior procedimiento para r1 (x) y g (x):

lt(r1 (x))
r1 (x) − g (x) = r2 (x).
lt(g (x))

Esto puede escribirse usando nuestra notación de reducción como

f (x) g (x) r1 (x) g (x) r2 (x).


−−−→ −−−→
Si r2 (x) = 0 ó gr(r2 (x)) < g (x), entonces hemos terminado ya que se tiene

lt( f (x))
f (x) = r1 (x) + g (x)
lt(g (x))
lt(r1 (x)) lt( f (x))
= g (x) + g (x) + r2 (x)
lt(g (x)) lt(g (x))
= q(x) g (x) + r2 (x),

con
lt(r1 (x)) lt( f (x))
q(x) := + .
lt(g (x)) lt(g (x))
Supongamos entonces que r2 (x) ≠ 0 y gr(r2 (x)) ≥ g (x); repetimos el ante-
rior procedimiento para r2 (x) y g (x). Pero notemos que este procedimiento
termina ya que

gr ( f (x)) > gr (r1 (x)) > gr (r2 (x)) > · · · .

Esta prueba además indica cómo construir el cociente q(x) y el resíduo r (x):
para calcular el nuevo cociente qN (x), al último cociente le adicionamos
lt(rO (x))
lt(g (x)) , donde rO (x) es el último resíduo, es decir,

lt(rO (x))
qN (x) = qO (x) + .
lt(g (x))
lt(rO (x))
Para calcular el nuevo resíduo rN (x), al último le restamos lt(g (x)) g (x), es
decir,
lt(rO (x))
rN (x) = rO (x) − g (x).
lt(g (x))
14 · Polinomios

Finalmente, observemos que el algoritmo anterior sugiere que el cociente y


el resíduo son únicos: sean c(x) y s(x) polinomios que cumplen las mismas
condiciones de q(x) y r (x), entonces

q(x)g (x) + r (x) = c(x)g (x) + s(x),

luego [q(x) − c(x)] g (x) = r (x) − s(x), pero por el grado se tiene que

[q(x) − c(x)] g (x) = r (x) − s(x) = 0,

de donde r (x) = s(x) y q(x) = c(x). ✓


Nótese que la prueba anterior da un algoritmo para calcular q(x) y r (x).


Este algoritmo es conocido como el algoritmo de la división:

ENTRADA: f (x), g (x) ∈ 𝕂 [x], con g (x) ≠ 0


SALIDA: q(x), r (x) tales que f (x) = q(x) g (x) + r (x) y
r (x) = 0 ó gr(r (x)) < gr(g (x))
INICIO: q(x) := 0 ; r (x) := f (x)
MIENTRAS r (x) ≠ 0 Y gr(g (x)) ≤ gr(r (x)) HAGA
lt(r (x))
q(x) := q(x) +
lt(g (x))
lt(r (x))
r (x) := r (x) − g (x)
lt(g (x))
Tabla 1: Algoritmo de la división.

Los pasos en el ciclo MIENTRAS del algoritmo corresponden al pro-


ceso de reducción mencionado. El ciclo se ejecuta hasta que el polinomio
r (x) en el algoritmo satisface r (x) = 0 ó tiene grado estrictamente menor
que el grado de g (x). Como mencionamos antes esto es denotado por

f (x) g (x) + r (x).


−−−→
Ejemplo 1.3.3. Vamos a repetir el ejemplo 1.3.1 usando el algoritmo de la
división.
INICIO: q(x) := 0, r (x) := f (x) = x 3 − 2x 2 + 2x + 8.
Pasamos a través del ciclo MIENTRAS:
x3 1
q(x) := 0+ 2x 2 = 2 x,

x3 7 3
r (x) := x 3 − 2x 2 + 2x + 8 − 2 (2x 2 + 3x + 1) = − x 2 + x + 8.
2x 2 2
Pasamos a través del ciclo MIENTRAS:
1 − 7 x2 1 7
q(x) := x + 2 2 = x − ,
2 2x 2 4
Polinomios · 15

− 7 x2
 
7 2 3 27 39
r (x) := − x + x + 8 − 2 2 (2x 2 + 3x + 1) = x+ .
2 2 2x 4 4
El ciclo MIENTRAS se detiene ya que gr(r (x)) = 1 < 2 = gr(g (x)).
Obtenemos el cociente q(x) y el resíduo r (x) como en el ejemplo 1.3.1.

Con el algoritmo de la división podemos dar una prueba constructiva de


que 𝕂 [x] es un DIP (véase el corolario 1.2.2).

Proposición 1.3.4. Cada ideal de 𝕂 [x] es principal.

Demostración. Sean I un ideal no nulo de 𝕂 [x] y g (x) ∈ I tal que g (x) ≠ 0


y n = gr(g (x)) es mínimo. Para cualquier f (x) ∈ I, por la proposición 1.3.2,
tenemos que f (x) = q(x)g (x) + r (x), para algunos polinomios
q(x), r (x) ∈ 𝕂 [x], con r (x) = 0 ó gr(r (x)) < gr(g (x)) = n. Si r (x) ≠ 0,
entonces r (x) = f (x) − q(x) g (x) ∈ I, y esto contradice la escogencia de
g (x). Entonces, r (x) = 0, f (x) = q(x) g (x), y por lo tanto, I ⊆ ⟨g (x)⟩. La
igualdad se sigue del hecho que g (x) está en I . ✓

Basados en el algoritmo de la división, pasamos ahora a estudiar el al-


goritmo de Euclides, el cual permite calcular el máximo común divisor de
dos o más polinomios. Veamos primero cómo calcular el polinomio g de
la demostración de la proposición 1.3.4. Para comenzar, nos concentra-
remos en ideales I ⊆ 𝕂 [x] generados por dos polinomios no nulos, di-
gamos, I = ⟨ f1 (x), f2 (x)⟩. Recordemos que el máximo común divisor de
f1 (x) y f2 (x), denotado por m. c. d.( f1 (x), f2 (x)), es un polinomio g (x) tal
que g (x) divide a f1 (x) y f2 (x) y además, cumple que si h(x) ∈ 𝕂 [x] es otro
polinomio que divide a f1 (x) y f2 (x), entonces h(x) divide a g (x); además
asumiremos que lc(g (x)) = 1, es decir, g (x) es mónico.

Proposición 1.3.5. Sean f1 (x), f2 (x) ∈ 𝕂 [x] polinomios no nulos. Entonces, el


m. c. d.( f1 (x), f2 (x)) existe y ⟨ f1 (x), f2 (x)⟩ = ⟨m. c. d.( f1 (x), f2 (x))⟩.

Demostración. Por la proposición 1.3.4, existe g (x) ∈ 𝕂 [x] tal que


⟨ f1 (x), f2 (x)⟩ = ⟨g (x)⟩. Ya que g (x) es único, salvo una constante no nula,
podemos asumir que lc(g (x)) = 1. Veamos que

g (x) = m. c. d.( f1 (x), f2 (x)).

Puesto que f1 (x), f2 (x) ∈ ⟨g (x)⟩, g (x) divide tanto a f1 (x) como a f2 (x).
Sea h(x) tal que h(x) divide a f1 (x) y f2 (x). Ya que g (x) ∈ ⟨ f1 (x), f2 (x)⟩,
existen u1 (x), u2 (x) ∈ 𝕂 [x] tales que g (x) = u1 (x) f1 (x) + u2 (x) f2 (x). De
esta forma h(x) divide a g (x), y hemos terminado. ✓

16 · Polinomios

Como consecuencia de lo anterior, si tenemos un algoritmo para calcu-


lar el máximo común divisor, entonces podemos realmente encontrar un
generador para el ideal ⟨ f1 (x), f2 (x)⟩. El algoritmo para calcular el máxi-
mo común divisor es el algoritmo de Euclides. Este algoritmo depende del
algoritmo de la división y del siguiente hecho.

Proposición 1.3.6. Sean f1 (x), f2 (x) ∈ 𝕂 [x] polinomios no nulos. Entonces,

m. c. d.( f1 (x), f2 (x)) = m. c. d.( f1 (x) − q(x) f2 (x), f2 (x)),

para cada q(x) ∈ 𝕂 [x].

Demostración. Es fácil ver que ⟨ f1 (x), f2 (x)⟩ = ⟨ f1 (x) − q(x) f2 (x), f2 (x)⟩.
Entonces, por la proposición anterior,

⟨m. c. d.( f1 (x), f2 (x))⟩ = ⟨ f1 (x), f2 (x)⟩


= ⟨ f1 (x) − q(x) f2 (x), f2 (x)⟩
= ⟨m. c. d.( f1 (x) − q(x) f2 (x), f2 (x))⟩.

Ya que el generador de un ideal principal es único, salvo una constante inver-


tible, y ya que el máximo común divisor de dos polinomios tiene coeficiente
principal igual a 1, entonces

m. c. d.( f1 (x), f2 (x)) = m. c. d.( f1 (x) − q(x) f2 (x), f2 (x)). ✓


Se tiene entonces el algoritmo de Euclides para el cálculo del máximo


común divisor:

ENTRADA: f1 (x), f2 (x) ∈ 𝕂 [x], polinomios no nulos


SALIDA: f (x) = m. c. d.( f1 (x), f2 (x))
INICIO: f (x) := f1 (x), g := f2 (x)
MIENTRAS g (x) ≠ 0 HAGA
f (x) g (x) + r (x), con r (x) el resíduo de la división de f (x) por g (x)
−−−→
f (x) := g (x)
g (x) := r (x)
f (x) := lc( f1(x)) f (x)

Tabla 2: Algoritmo de Euclides.

Observemos que el algoritmo termina ya que el grado de r (x) en el ci-


clo MIENTRAS es estrictamente menor que el grado de g (x), el cual es el
inmediatamente anterior r (x), y por lo tanto, el grado de r (x) es estricta-
mente decreciente a medida que el algoritmo avanza. Además, el algoritmo
Polinomios · 17

da el m. c. d.( f1 (x), f2 (x)) como dato de salida ya que según la proposición


1.3.6, en cada paso a través del ciclo MIENTRAS se tiene que

m. c. d.( f1 (x), f2 (x)) = m. c. d.( f (x), g (x)) = m. c. d.(r (x), g (x)),

siempre que g (x) ≠ 0. Cuando g (x) = 0 entonces

1
m. c. d.( f1 (x), f2 (x)) = m. c. d.( f (x), 0) = f (x).
lc( f (x))

El último paso en el algoritmo asegura que el resultado final tiene coeficiente


principal 1, es decir, es mónico.
Para ilustrar el algoritmo consideremos el siguiente ejemplo.

Ejemplo 1.3.7. Sean f1 (x) = x 3 − 3x + 2 y f2 (x) = x 2 − 1 en ℚ[x].


INICIO: f (x) = x 3 − 3x + 2, g (x) = x 2 − 1.
Pasamos a través del ciclo MIENTRAS:
x 3 − 3x + 2 x2 − 1 − 2x + 2,
−−−−−→
f (x) := x 2 − 1,
g (x) := −2x + 2.
Pasamos a través del ciclo MIENTRAS:
x2 − 1 −2x + 2 x−1 −2x + 2 0,
−−−−−−→ −−−−−−→
f (x) := −2x + 2,
g (x) := 0.
El ciclo MIENTRAS se detiene
f (x) = lc( f1(x)) f (x) = x − 1.
Entonces, m. c. d.( f1 (x), f2 (x)) = x − 1.

Retornamos nuestra atención al caso de ideales generados por más de


dos polinomios no nulos, I = ⟨ f1 (x), . . . , fs (x)⟩.

Proposición 1.3.8. Sean f1 (x), . . . , fs (x) polinomios no nulos de 𝕂 [x].

(i) ⟨ f1 (x), . . . , fs (x)⟩ = ⟨m. c. d.( f1 (x), . . . , fs (x))⟩.

(ii) Si s ≥ 3, entonces

m. c. d.( f1 (x), . . . , fs (x)) = m. c. d.( f1 (x), m. c. d.( f2 (x), . . . , fs (x)).

Demostración. La prueba de la parte (i) es similar a la demostración de la


proposición 1.3.5. Para probar la parte (ii), sea

h(x) := m. c. d.( f2 (x), . . . , , fs (x)).


18 · Polinomios

Entonces, por (i), ⟨ f2 (x), . . . , fs (x)⟩ = ⟨h(x)⟩, y por lo tanto,

⟨ f1 (x), . . . , fs (x)⟩ = ⟨ f1 (x), h(x)⟩.

Nuevamente por (i),

m. c. d.( f1 (x), . . . , fs (x)) = m. c. d.( f1 (x), h(x))


= m. c. d.( f1 (x), m. c. d.( f2 (x), . . . , , fs (x)),

como se había anunciado. ✓


Con las ideas constructivas desarrolladas en esta sección podemos ahora


resolver algunos problemas sencillos, pero interesantes, relacionados con
polinomios en una variable con coeficientes en un cuerpo. Esto lo haremos
a través de los siguientes ejemplos.

Ejemplo 1.3.9. Sean f1 (x), . . . , fs (x) ∈ 𝕂 [x] polinomios no nulos. Que-


remos encontrar el conjunto solución en 𝕂 del sistema simultáneo fi (x) = 0,
1 ≤ i ≤ 0. Para resolver este problema podemos razonar al menos de dos
maneras: una forma es calculando las raíces en 𝕂 de cada fi (x) y luego rea-
lizar la intersección de los conjunto solución encontrados. La otra forma
es calcular f (x) := m. c. d.( f1 (x), . . . , fs (x)) mediante el algoritmo de Eu-
clides y luego encontrar las raíces en 𝕂 de f (x). La justificación de este
segundo método la da la proposición 1.3.8. Veamos un ejemplo concreto.
Resolvamos el sistema simultáneo real
(
x 6 − 1 = 0,
x 4 + 2x 3 + 2x 2 − 2x − 3 = 0.

Aplicamos el algoritmo de Euclides al par de polinomios dados para calcular


el máximo común divisor f (x) (podemos obviar la terminología propia del
algoritmo):

x6 − 1 x 4 + 2x 3 + 2x 2 − 2x − 3
2x 3 − 5x 2 − 2x + 5 x 2 − 2x + 2

x 4 + 2x 3 + 2x 2 − 2x − 3 2x 3 − 5x 2 − 2x + 5
57 2 57 1 9
4 x − 4 2x + 4

57 2 57
2x 3 − 5x 2 − 2x + 5 4 x − 4
8 20
0 57
x − 57
Polinomios · 19

Así,  
4 57 2 57
f (x) = x − = x 2 − 1.
57 4 4
Por lo tanto, las soluciones del sistema dado son x = ±1.

Ejemplo 1.3.10. Otro problema interesante es decidir si un polinomio


f (x) está en el ideal generado por un conjunto finito de polinomios dados,

I = ⟨ f1 (x), . . . , fs (x)⟩.

Para esto primero calculamos g (x) := m. c. d.( f1 (x), . . . , fs (x)), luego usa-
mos el algoritmo de la división para dividir f (x) por g (x). El resíduo de la
división es cero si, y sólo si, f (x) está en el ideal

I = ⟨ f1 (x), . . . , fs (x)⟩ = ⟨g (x)⟩.

Usando la notación de reducción se tiene que

f (x) ∈ I = ⟨g (x)⟩ si, y sólo si, f (x) g (x) + 0.


−−−→
Veamos un ejemplo ilustrativo:

¿f (x) = x 5 + x 3 + x 2 − 7 ∈ I = ⟨x 6 − 1, x 4 + 2x 3 + 2x 2 − 2x − 3⟩?
La misma pregunta para g (x) = x 4 + 2x 2 − 3.

Según el ejemplo 1.3.9, m. c. d.(x 6 − 1, x 4 + 2x 3 + 2x 2 − 2x − 3) = x 2 − 1, y


con el algoritmo de la división encontramos que el resíduo de dividir f (x)
entre x 2 − 1 es 2x − 6, por lo tanto, f (x) ∉ I. En cambio, la divisón de g (x)
entre x 2 − 1 tiene como residuo 0, es decir, g (x) ∈ I.

Ejemplo 1.3.11. Sea I un ideal del anillo 𝕂 [x]. Queremos calcular una
base para el 𝕂-espacio cociente 𝕂 [x]/I. Si I = 0, entonces una base de 𝕂 [x]
es {1, x, x 2 , x 3 , . . . }. Sea I no nulo; entonces I es principal, I = ⟨g (x)⟩, con
g (x) = x n +an−1 x n−1 +· · ·+a1 x+a0 ≠ 0 (siempre podemos tomar el generador
de I mónico). Notemos entonces que X := {x n−1 , x n−2 , . . . , x, 1} es una
base de 𝕂 [x]/I. En efecto, dado f (x) ∈ 𝕂 [x], dividimos f (x) entre g (x)
y encontramos q(x), r (x) ∈ 𝕂 [x] tales que f (x) = g (x)q(x) + r (x), con
r (x) = 0 ó gr(r (x)) < gr(g (x)). Pasando al cociente encontramos que cada
elemento f (x) de 𝕂 [x]/I es una 𝕂-combinación lineal de los elementos de
X. Sean bn−1 , bn−2 , . . . , b1 , b0 ∈ 𝕂 tales que

bn−1 x n−1 + bn−2 x n−2 + · · · + b1 x + b0 = 0,


20 · Polinomios

entonces
bn−1 x n−1 + bn−2 x n−2 + · · · + b1 x + b0 ∈ ⟨g⟩,
pero gr(g (x)) = n, entonces todos los coeficientes bn−1 , bn−2 , . . . , b1 , b0 son
necesariamente nulos.

Ejemplo 1.3.12. Sea p un entero irreducible. Veamos que dado un poli-


nomio irreducible f (x) = p0 + p1 x + · · · + x n de ℤp [x] de grado n, entonces
ℤp [x]/⟨ f (x)⟩ es un cuerpo de p n elementos: puesto que f (x) es irredu-
cible, entonces ⟨ f (x)⟩ es maximal, con lo cual ℤp [x] /⟨ f (x)⟩ es un cuer-
po (véase [23]). Como vimos en el ejemplo anterior, ℤp [x] /⟨f (x)⟩ es un
ℤp -espacio de dimensión n, es decir, ℤp [x] /⟨ f (x)⟩  ℤnp , con lo cual el
número de elementos de este espacio es p n . Este resultado se puede exten-
der a cualquier cuerpo finito 𝕂 de q elementos de tal forma que en este caso
|𝕂 [x]/⟨f (x)⟩| = q n .

Ejemplo 1.3.13. Terminamos esta sección con un algoritmo que calcula no


solo el m. c. d. sino los polinomios coeficientes en la expansión del m. c. d.
de dos polinomios como combinación de éstos (véase la proposición 1.3.5).

ENTRADA: f1 (x), f2 (x) ∈ 𝕂 [x] polinomios no nulos


SALIDA: f (x) = m. c. d.( f1 (x), f2 (x)), u1 (x), u2 (x) ∈ 𝕂 [x]
tales que f (x) = u1 (x) f1 (x) + u2 (x) f2 (x)
INICIO: f (x) := f1 (x), g (x) := f2 (x), u1 (x) := 1, u2 (x) := 0,
v1 (x) := 0, v2 (x) := 1, w(x) = 1, z(x) = 0
MIENTRAS g (x) ≠ 0 HAGA
f (x) g (x) + r (x), con r (x) el residuo de la división de f (x) por g (x)
−−−→
f (x) := g (x) , g (x) := r (x)
w(x) := u1 (x) − q(x)v1 (x), con q(x) el cociente de la división de f (x) por g (x)
z(x) := u2 (x) − q(x)v2 (x)
u1 (x) := v1 (x), u2 (x) := v2 (x), v1 (x) = w(x), v2 (x) = z(x)
f (x) := lc( f1(x)) f (x)
u1 (x) := lc( f1(x)) u1 (x)
u2 (x) := lc( f1(x)) u2 (x)

Tabla 3: Algoritmo de Euclides con coeficientes.

Vamos a aplicar este algoritmo a los polinomios del ejemplo 1.3.9:


ENTRADA:
f1 (x) = x 6 − 1,
f2 (x) = x 4 + 2x 3 + 2x 2 − 2x − 3.
INICIO:
f (x) := x 6 − 1,
g (x) := x 4 + 2x 3 + 2x 2 − 2x − 3,
Polinomios · 21

u1 (x) = 1,
u2 (x) = 0,
v1 (x) = 0,
v2 (x) = 1, w(x) = 1, z(x) = 0.
Primer paso por el ciclo MIENTRAS:
x6 − 1 x 4 + 2x 3 + 2x 2 − 2x − 3
2x 3 − 5x 2 − 2x + 5 x 2 − 2x + 2
x6 − 1 x 4 + 2x 3 + 2x 2 − 2x − 3 2x 3 − 5x 2 − 2x + 5
−−−−−−−−−−−−−−−−−−−−−−→
f (x) := x 4 + 2x 3 + 2x 2 − 2x − 3
g (x) := 2x 3 − 5x 2 − 2x + 5
w(x) := 1 − (x 2 − 2x + 2)(0) = 1
z(x) := 0 − (x 2 − 2x + 2)(1) = −x 2 + 2x − 2
u1 (x) := 0
u2 (x) := 1
v1 (x) := 1
v2 (x) := −x 2 + 2x − 2.
Segundo paso por el ciclo MIENTRAS:
x 4 + 2x 3 + 2x 2 − 2x − 3 2x 3 − 5x 2 − 2x + 5
− 57 57 2
4 + 4 x
1
2x + 4
9

57 57 2
x 4 + 2x 3 + 2x 2 − 2x − 3 2x 3 − 5x 2 − 2x + 5 − + x
−−−−−−−−−−−−−−−−−→ 4 4
f (x) := 2x 3 − 5x 2 − 2x + 5
57 57 2
g (x) := − + x
4 4 
1 9 1 9
w(x) := 0 − x + (1) = − x −
2 4 2 4
 
1 9 1 5 7 11
z(x) := 1 − x + (−x 2 + 2x − 2) = x 3 + x 2 − x +
2 4 2 4 2 2
u1 (x) := 1
u2 (x) := −x 2 + 2x − 2
1 9
v1 (x) = − x −
2 4
1 3 5 2 7 11
v2 (x) = x + x − x + .
2 4 2 2
22 · Polinomios

Tercer paso por el ciclo MIENTRAS:

2x 3 − 5x 2 − 2x + 5 − 57 57 2
4 + 4 x
8
0 57
x − 20
57

57 57 2
2x 3 − 5x 2 − 2x + 5 − + x 0
4 4
−−−−−−−−−−−→

57 57 2
f (x) := − + x
4 4
g (x) := 0
   
8 20 1 9 8 4 2 4
w(x) = 1 − x− − x− = x+ x +
57 57 2 4 57 57 19
   8 20
 
1 3 5 2 7 11

2
z(x) = −x + 2x − 2 − x− x + x − x+
57 57 2 4 2 2
4 2 4 4 4
=− x − x −
57 57 57
1 9
u1 (x) := − x −
2 4
1 3 5 2 7 11
u2 (x) := x + x − x +
2 4 2 2
8 4 2 4
v1 (x) = x+ x +
57 57 19
4 2 4 4 4
v2 (x) = − x − x − .
57 57 57
El ciclo MIENTRAS se detiene y:
1 4
f (x) := f = f = x2 − 1
lc( f ) 57
 
1 4 1 9 2 3
u1 (x) := u1 = − x− =− x−
lc( f ) 57 2 4 57 19
 
1 4 1 3 5 2 7 11
u2 (x) := u2 = x + x − x+
lc( f ) 57 2 4 2 2
2 3 5 2 14 22
= x + x − x+ .
57 57 57 57
Por tanto,

m. c. d.( f1 (x), f2 (x)) = x 2 − 1


   
2 3 2 3 5 2 14 22
= − x− (x 6 − 1) + x + x − x+ (x 4 + 2x 3 + 2x 2 − 2x − 3).
57 19 57 57 57 57
Polinomios · 23

Podemos complementar este ejemplo y expresar h(x) := x 4 + 2x 2 − 3 co-


mo combinación lineal de f1 (x) y f2 (x). Notemos que h(x) está en el ideal
generado por f1 (x) y f2 (x): en efecto, con el algoritmo de la división encon-
tramos que
h(x) = (x 2 − 1)(x 2 + 3),

por lo tanto,

h(x) = u1 (x)(x 2 + 3)(x 6 − 1) + u2 (x)(x 2 + 3)(x 4 + 2x 3 + 2x 2 − 2x − 3).

4. Teorema de Gauss
En esta sección probaremos el siguiente teorema debido a Gauss: si R es un
DFU, entonces, R [x] es también un DFU. La prueba de este resultado requie-
re de algunas definiciones y afirmaciones preliminares (una demostración
diferente usando localizaciones de anillos conmutativos por sistemas mul-
tiplicativos puede ser consultada en [23]).

Definición 1.4.1. Sea R un DFU y sea f (x) = p0 + p1 x + · · · + pn x n un


polinomio no nulo de R [x]. Se denomina contenido del polinomio f (x) al
m. c. d. de sus coeficientes y se denota por c( f (x)),

c( f (x)) := m. c. d.{p0 , p1 , . . . , pn }.

Se dice además que f (x) es un polinomio primitivo si c( f (x)) = 1.

Ejemplo 1.4.2. Sean

f (x) = 8 + 3x + 4x 2 , g (x) = 30 − 12x + 6x 2 ∈ ℤ[x].

Entonces c( f (x)) = 1 y c(g (x)) = 2, es decir, f (x) es primitivo pero g (x) no


lo es. Para el caso cuando R = 𝕂 es un cuerpo, el concepto de contenido y
polinomio primitivo pierden sentido ya que el contenido de cada polinomio
no nulo es 1.

Proposición 1.4.3. Sean R un DFU y a1 , . . . , an ∈ R.

(i) Si d := m. c. d.(a1 , . . . , an ) y ai = dai′, con ai′ ∈ R, 1 ≤ i ≤ n, entonces


m. c. d.(a1′ , . . . , an′ ) = 1.

(ii) Para cada c ∈ R − {0}, m. c. d.(ca1 , . . . , can ) = cd.


24 · Polinomios

Demostración. (i) Sea e := m. c. d.(a0′ , a1′ , . . . , an′ ), entonces ai′ = eai′′, para
cada i, por lo tanto, deai′′ = ai , es decir, de divide a cada ai , luego de divide a
d, con lo cual d = deb, de donde e ∈ R ∗ y así 1 = ee −1 es también el máximo
común divisor de a0′ , a1′ , . . . , an′ .
(ii) Sea r := m. c. d.(ca1 , . . . , can ), entonces para cada i, cai = rqi ; ade-
más, cai = cdai′, luego cd divide a cada cai , con lo cual cd|r, es decir, r = cds,
y por lo tanto cai = cdsqi , es decir, ai = dsqi y de esta manera ds divide a
cada ai , es decir, ds | d. Resulta de aquí que s ∈ R ∗ con lo cual cd es también
máximo común divisor de los elementos ca1 , . . . , can . ✓

Proposición 1.4.4. Sea R un DFU. Entonces,

(i) Cada polinomio no nulo f (x) ∈ R [x] se puede expresar en la forma


f (x) = c f1 (x), donde c := c( f (x)) y f1 (x) es un polinomio primitivo.
Si f (x) tiene otra descomposición en la forma f (x) = d f2 (x), con d ∈ R y
f2 (x) primitivo, entonces c y d son asociados lo mismo que f1 (x) y f2 (x).

(ii) El producto de polinomios primitivos es primitivo.

(iii) El contenido de un producto de polinomios no nulos es igual al producto de


los contenidos, salvo asociados.

Demostración. (i) Sea f (x) = a0 + a1 x + · · · + an x n , entonces

f1 (x) = a0′ + a1′ x + · · · + an′ x n ,

con cai′ = ai , 0 ≤ i ≤ n. Según la parte (i) de la proposición anterior


m. c. d.(a0′ , a1′ , . . . , an′ ) = 1.
Veamos ahora la unicidad: sea f (x) = c f1 (x) = d f2 (x), con

f2 (x) = b0′ + b1′ x + · · · + bn′ x n

primitivo; entonces

m. c. d.(ca0′ , . . . , can′ ) = m. c. d.(db0′ , . . . , dbn′ )u,

con u ∈ R ∗ , luego, por la parte (ii) de la proposición anterior, c = du, con


u ∈ R ∗ , de donde f2 (x) = u f1 (x).
(ii) Sean f (x) = a0 + a1 x + · · · + an x n , g (x) = b0 + b1 x + · · · + bm x m
polinomios primitivos de R [x] y sea p(x) := f (x) g (x). Sea q un irreducible
de R, entonces q no divide todos los coeficientes ai de f (x) ni tampoco todos
los coeficientes q j de g (x); sea ar el primer coeficiente de f (x) que q no
Polinomios · 25

divide y bs el primero de g (x) que q no divide. Notemos que el coeficiente


de x r+s en p(x) es

pr+s = a0 br+s + · · · + ar−1 bs+1 + ar bs + ar+1 bs−1 + · · · + ar+s b0 ,

por lo tanto q no divide pr+s . Así, dado cualquier irreducible q ∈ R, algún


coeficiente de p(x) no es divisible por q, es decir, p(x) es primitivo. Para tres
o más polinomios, el resultado se obtiene por recurrencia.
(iii) Sea p(x) = f (x)g (x), donde f (x) y g (x) son polinomios no nulos
de R [x]. Según (i),

p(x) = c(p(x))p1 (x), f (x) = c( f (x)) f1 (x), g (x) = c(g (x))g1 (x),

donde p1 (x), f1 (x), g1 (x) son primitivos, por lo tanto

c(p(x))p1 (x) = c( f (x))c(g (x)) f1 (x)g1 (x).

Según (ii), f1 (x) g1 (x) es primitivo, luego por la unicidad de (i), se tiene que
c(p(x)) coincide con c( f (x))c(g (x)), salvo asociados. Para tres o más poli-
nomios, el resultado se obtiene por recurrencia. ✓

Sea R un DI y sea F su cuerpo de fracciones (véase [23]). La función

R[x] −→ F [x]
p0 p1 pn
p0 + p1 x + · · · + pn x n ↦−→ + x + · · · + xn
1 1 1
es un homomorfismo inyectivo de anillos, el cual permite considerar a R [x]
como subanillo de F [x] de tal forma que se tiene R ↩→ R[x] ↩→ F [x]. De
otra parte, cada polinomio f (x) = pq00 + pq11 x + · · · + pqnn x n ∈ F [x] se puede
expresar en la forma f (x) = f0 q(x) := 1q f0 (x), donde f0 (x) ∈ R [x] y q ∈
R − {0}. En efecto, basta tomar q := q0 · · · qn y f0 (x) = r0 + r1 x + · · · + rn x n ,
con ri := qp i
qi , 1 ≤ i ≤ n.

Proposición 1.4.5. Sea R un DFU y sea F su cuerpo de fracciones.


Si f (x) ∈ R[x] es irreducible no constante, entonces f (x) considerado como po-
linomio de F [x] es irreducible. Recíprocamente, si f (x) ∈ R [x] es un polinomio
primitivo tal que considerado como elemento de F [x] es irreducible, entonces f (x)
es irreducible como elemento de R[x].

Demostración. Para la primera afirmación supóngase que f (x) es reducible


como polinomio de F [x]. Existen entonces polinomios m(x), n(x) en F [x]
26 · Polinomios

de grado ≥ 1 tales que f (x) = m(x)n(x). Cada uno de estos factores se


puede escribir como
m1 (x) n1 (x)
m(x) = y n(x) = ,
m n
donde m1 (x), n1 (x) ∈ R[x] y m, n ∈ R − {0}; además, m1 (x) es producto
de su contenido m1 y un polinomio primitivo m1′ (x) ∈ R[x], lo mismo se
tiene para n(x). Resulta mn f (x) = m1 n1 m1′ (x)n1′ (x), relación que podemos
considerar en R [x]. Si c := c( f (x)), entonces

mn f (x) = mnc f1 (x) = m1 n1 m1′ (x)n1′ (x),

con f1 (x) primitivo. Como m1′ (x)n1′ (x) es primitivo podemos aplicar la pro-
posición 1.4.4 y obtenemos que m1 n1 = mncu, con u ∈ R ∗ , de donde
f (x) = c f1 (x) = cum1′ (x)n1′ (x), pero notemos que

gr(m1′ (x)) = gr(m(x)) ≥ 1 y gr(n1′ (x)) = gr(n(x)) ≥ 1,

por lo tanto, f (x) es reducible en R [x].


La afirmación recíproca es evidente ya que f (x) es primitivo y
R[x] ↩→ F [x]. □✓

Teorema 1.4.6 (Teorema de Gauss) . Si R es un DFU, entonces R[x] es tam-


bién un DFU.

Demostración. Existencia: sea f (x) ∈ R[x] un polinomio no nulo y no inver-


tible; debemos probar que f (x) tiene una descomposición en producto de
irreducibles. Como f (x) es no nulo, entonces f (x) se puede expresar en la
forma f (x) = c( f (x)) f ′ (x), donde f ′ (x) es primitivo (véase la proposición
1.4.4). Consideremos dos casos:
Caso 1, gr( f ′ (x)) = 0: entonces f ′ (x) = 1 y procedemos a descomponer
c( f (x)) en R; como f (x) no es invertible, entonces c( f (x)) no es invertible
y, por lo tanto, tiene una descomposición en producto finito de irreducibles
de R, los cuales a su vez son irreducibles de R[x] y obtenemos la descom-
posición irreducible de f (x) buscada.
Caso 2, gr( f ′ (x)) ≥ 1: Si c( f (x)) es invertible, entonces pasamos a des-
componer f ′ (x); si c( f (x)) no es invertible, entonces primero lo descompo-
nemos como vimos en el caso anterior, y luego procedemos a descomponer
f ′ (x). Así, solo nos resta ver la descomposición de f ′ (x).
Consideremos a f ′ (x) como elemento de F [x], donde F es el cuerpo de
fracciones de R; si f ′ (x) es irreducible, entonces por la proposición 1.4.5,
f ′ (x) es irreducible en R[x], y hemos terminado. Supongamos que f ′ (x)
Polinomios · 27

es reducible en F [x]. Entonces gr( f ′ (x)) ≥ 2; como F [x] es DFU, enton-


ces f ′ (x) es factorizable en un producto finito de polinomios irreducibles
de F [x]: f ′ (x) = f1 (x) · · · fr (x), fi (x) ∈ F [x] e irreducible, gr( fi (x)) ≥ 1,
1 ≤ i ≤ r, r ≥ 2. Cada polinomio fi (x) se puede expresar en la forma
fi ′ (x)
fi (x) = , con fi ′ (x) ∈ R[x] , qi ∈ R − {0}.
qi
A su vez cada fi ′ (x) se puede escribir en la forma fi ′ (x) = c( fi ′ (x)) fi ′′ (x),
con fi ′′ (x) ∈ R[x] primitivo. Notemos que fi ′′ (x) es irreducible de R [x], ya
que si fuese reducible, entonces por la proposición 1.4.5 sería reducible en
F [x], pero esto no es posible ya que fi (x) es irreducible. Sean
r
Ö r
Ö
q := qi y c := c( fi ′ (x)).
i=1 i=1

Entonces q f ′ (x) = c f1′′ (x) · · · fr′′ (x). Como f ′ (x) y cada f ′′ (x) es primitivo,
entonces por la proposición 1.4.4, existe u ∈ R ∗ tal que
f ′ (x) = u f1′′ (x) · · · fr′′ (x).
Esta es la descomposición irreducible buscada para f ′ (x).
Unicidad: supongamos que f (x) tiene dos descomposiciones en la forma
f (x) = g1 (x) · · · gr (x) = h1 (x) · · · hs (x), donde los gi (x), h j (x) son polino-
mios irreducibles de R [x] de grado ≥ 0. Resulta,
c1 g1′ (x) · · · cr gr (x) ′ = d1 h1′ (x) · · · ds hs (x) ′ ,
con ci := c(gi (x)), d j := c(h j (x)), gi′ (x), h ′j (x) primitivos y 1 ≤ i ≤ r,
1 ≤ j ≤ s. Pero como gi (x) = ci gi′ (x) es irreducible de R[x], entonces se
presentan dos posibilidades: ci es irreducible de R y gi′ (x) = 1 ó bien ci ∈ R ∗
y gi′ (x) es irreducible de R [x] de grado ≥ 1; lo mismo se tiene para cada
h j (x). Podemos entonces escribir

c1 · · · ct ct+1 · · · cr g1′ (x) · · · gt′ (x) gt+1



(x) · · · gr′ (x)
= d1 · · · dm dm+1 · · · ds h1′ (x) · · · hm′ (x)hm+1

(x) · · · hs′ (x),
con c1 , . . . , ct irreducibles de R, ct+1 , . . . , cr ∈ R ∗ , g1′ (x) = · · · = gt′ (x) = 1 y
′ (x), · · · , g ′ (x) irreducibles de R [x] de grado ≥ 1; d , . . . , d irreduci-
gt+1 r 1 m
bles de R, dm+1 , . . . , ds ∈ R ∗ , h1′ (x) = · · · = hm′ (x) = 1 y hm+1 ′ (x), · · · , hs′ (x)
irreducibles de R [x] de grado ≥ 1. Pero de la proposición 1.4.4 se tiene
que
c1 · · · ct ct+1 · · · cr = d1 · · · dm dm+1 · · · ds u, u ∈ R ∗ ,
g1′ (x) · · · gt′ (x) gt+1

(x) · · · gr′ (x) = h1′ (x) · · · hm′ (x)hm+1

(x) · · · hs′ (x), v ∈ R ∗ ,
28 · Polinomios

luego

c1 · · · ct = d1 · · · dm w, w ∈ R ∗ ,

gt+1 (x) · · · gr′ (x) = hm+1

(x) · · · hs′ (x), y ∈ R ∗ .

Como R es un DFU, t = m y di = ci wi , con wi ∈ R ∗ , 1 ≤ i ≤ t; además


como F [x] es DFU, entonces r − t = s − m, es decir, r = s y h ′j (x) = g j′ (x)z j ,
a
con z j ∈ F ∗ , t + 1 ≤ j ≤ r. Sea z j = b jj , entonces en R[x] tenemos

b j h ′j (x) = a j g j′ (x),

pero como h ′j (x) y g j′ (x) son primitivos, entonces a j = b j v j , con v j ∈ R ∗ .


Resulta, h ′j (x) = g j′ (x)v j . Volviendo al principio, concluimos que

hi (x) = gi (x)wi , 1 ≤ i ≤ t y h j (x) = g j (x)d j c −1


j v j , t + 1 ≤ j ≤ r.

Esto completa la prueba. ✓


Corolario 1.4.7. Si R es un DFU, entonces R [x1 , . . . , xn ] también es un DFU.

Demostración. Consecuencia directa del teorema de Gauss. ✓


El problema de factorizar o determinar si un polinomio sobre un DFU,


o sobre su cuerpo de fracciones, es irreducible, en general no es muy fácil
de resolver. Existen algunos criterios que vamos a considerar para el caso
particular de ℤ y ℚ.

Proposición 1.4.8. Si f (x) ∈ ℤ [x] es mónico y se factoriza como el producto


de dos polinomios racionales, entonces f (x) se factoriza como el producto de dos
polinomios enteros mónicos.

Demostración. Si gr( f (x)) = 0, entonces f (x) = 1 y se tiene la descomposi-


ción trivial f (x) = 1 · 1. Sea f (x) = p0 + · · · + pn−1 x n−1 + x n de grado ≥ 1,
el cual es producto de dos polinomios con coeficientes racionales,
p ′ (x) q ′ (x)
f (x) = p(x)q(x) = , p0 , q0 ∈ ℤ − {0}, p ′ (x), q ′ (x) ∈ ℤ[x] − {0}.
p0 q0
Por lo tanto se tiene que

p0 q0 f (x) = c(p ′ (x))c(q ′ (x))p ′′ (x)q ′′ (x),

con p ′′ (x) y q ′′ (x) primitivos. De la proposición 1.4.4 se sigue que

f (x) = up ′′ (x)q ′′ (x), con u = ±1.


Polinomios · 29

Como f (x) es mónico, entonces

1 = ± lc(p ′′ (x)) lc(q ′′ (x)).

Si 1 = lc(p ′′ (x)) lc(q ′′ (x)), entonces lc(p ′′ (x)) = 1 = lc(q ′′ (x)) y tenemos la
factorización deseada, ó, lc(p ′′ (x)) = −1 = lc(q ′′ (x)) y la factorización re-
querida es f (x) = (−p ′′ (x)) (−q ′′ (x)). Si 1 = − lc(p ′′ (x)) lc(q ′′ (x)), entonces
lc(p ′′ (x)) y lc(q ′′ (x)) son de signo contrario y las fatorizaciones requeridas
se obtienen cambiando el signo de alguno de los dos factores. ✓

Proposición 1.4.9 (Criterio de Eisenstein) . Sea f (x) = a0 + a1 x + · · · + an x n


un polinomio en ℤ[x], con n ≥ 1. Si existe p ∈ ℤ irreducible tal que
(i) p ∤ an .

(ii) p | ai , para cada 0 ≤ i ≤ n − 1.

(iii) p 2 ∤ a0 .
Entonces, f (x) es irreducible sobre ℚ.
Demostración. Basta probar la proposición para f (x) := a0 + a1 x + · · · + an x n
primitivo. En efecto, sea f (x) = c f1 (x), con c := c( f (x)) y

f1 (x) := a0′ + a1′ x + · · · + an′ x n

primitivo; notemos entonces que cai′ = ai para cada 0 ≤ i ≤ n, con lo cual


p ∤ an′ , p 2 ∤ a0′ ; además p | a ′j para cada 0 ≤ j ≤ n − 1: en efecto, ya que
p | a j , entonces p | c o p | a ′j , pero p ∤ c, de lo contrario dividiría a an . Así,
f1 (x) satisface las mismas condiciones de f (x).
Sea entonces f (x) primitivo; supóngase que f (x) es reducible sobre ℚ.
Entonces, por la proposición 1.4.5, f (x) es reducible sobre ℤ, y por lo tanto,
existe b(x) ∈ ℤ[x] tal que b(x) | f (x), b(x) ∉ ℤ[x] ∗ y b(x) no es asociado
de f (x), luego existe c(x) ∈ ℤ[x] tal que c(x) ∉ ℤ[x] ∗ y

f (x) = b(x)c(x) = (b0 + b1 x + · · · + br x r )(c0 + c1 x + · · · + cs x s ).

Como f (x) es primitivo, r ≥ 1 y s ≥ 1 (si por ejemplo c(x) fuera una


constante, entonces tomando contenidos a ambos lados c(x) resultaría in-
vertible). Se tiene que a0 = b0 c0 con lo cual p | b0 ó p | c0 . La disyunción
es excluyente ya que de lo contrario p | a02 . Supóngase entonces que p | b0
y p ∤ c0 ; notemos que p ∤ br ya que lo contrario dividiría a an = br cs . Sea
bk el menor coeficiente de b(x) que p no divide, 0 < k ≤ r < n, de donde
p | b0 , . . . , p | bk−1 , pero ak = bk c0 + bk−1 c1 + · · · + b0 ck , por lo tanto, p | bk c0 ,
pero como p ∤ c0 , entonces p | bk , lo cual es una contradicción. El caso p | c0
produce una contradicción similar. Así, f (x) es irreducible sobre ℚ. ✓

30 · Polinomios

Corolario 1.4.10. Sea p ∈ ℤ irreducible y m ≥ 1. Entonces, el polinomio x m − p


es irreducible sobre ℚ, y por lo tanto, sobre ℤ.

Demostración. Consecuencia de la proposición anterior y de la proposición


1.4.5. □✓

Observación 1.4.11. (i) Observemos que la proposición y corolario ante-


riores son válidos en cualquier DFU.
(ii) Si en el criterio de Eisenstein el polinomio f (x) es primitivo, enton-
ces f (x) también resulta irreducible sobre R[x]. Pero si f (x) no es primiti-
vo, podría resultar reducible sobre R [x]. Tómose como ejemplo el polino-
mio f (x) = 6x 2 + 10x + 10 = 2(3x 2 + 5x + 5) ∈ ℤ[x], con p = 5.

Corolario 1.4.12. Sea p ∈ ℤ irreducible y m ≥ 2. Entonces m p es irracional.

Demostración. Supongamos que m p = ba ∈ ℚ, entonces ba es una raíz racional
de x m − p, luego por la proposición 1.2.4, x − ba es un factor de x m − p, es
decir, x m − p es reducible sobre ℚ, contradicción. ✓

Proposición 1.4.13 (Polinomios ciclotómicos) . Sea p ∈ ℤ irreducible. El


polinomio
fp (x) := x p−1 + x p−2 + · · · + x + 1
se denomina ciclotómico y es irreducible sobre ℚ.

Demostración. Supongamos que fp (x) es reducible sobre ℚ. Entonces exis-


ten h(x), f (x) ∈ ℚ [x] tales que

fp (x) = h(x) f (x), gr(h(x)), gr( f (x)) ≥ 1,

entonces
g (x) := fp (x + 1) = h(x + 1) f (x + 1) ∈ ℚ[x] ,
donde gr(h(x + 1)) ≥ 1 y gr( f (x + 1)) ≥ 1, es decir, g (x) es reducible sobre
p−1
ℚ. Notemos que fp (x) = xx−1 , luego
Íp p  p−k
(x + 1) p − 1 x −1
g (x) = = k=0 k
x + 1 − 1 x
x p + 1p x p−1 + · · · + p−1
p 
x+1−1
=
  x   
p−1 p p−2 p p−3 p
=x + x + x +···+ x + p.
1 2 p−2

Pero p ∤ 1, p | pk , 1 ≤ k ≤ p − 1, p 2 ∤ p, luego por la proposición 1.4.9,




g (x) es irreducible en ℚ [x], contradicción. ✓



Polinomios · 31

Proposición 1.4.14. Sea f (x) = x n + pn−1 x n−1 + · · · + p0 ∈ ℤ [x], con p0 ≠ 0,


n ≥ 1. Si f (x) tiene una raíz z en ℚ, entonces f (x) tiene una raíz m en ℤ y
además m | p0 .
m
Demostración. Sea t ∈ ℚ, con m. c. d.(m, t) = 1 una raíz racional de f (x),
entonces  m
f (x) = x − p(x),
t
q (x)
donde p(x) = a con q(x) ∈ ℤ [x] , a ∈ ℤ − {0}; se obtiene entonces que

ta f (x) = (tx − m)q(x) = (tx − m)c(q(x))q ′ (x),

con q ′ (x) primitivo; como f (x) es primitivo (por ser pn = 1), y además,
(tx − m), q ′ (x) son primitivos, entonces

ta = u −1 c(q(x)) y f (x) = uv(tx − m)q ′ (x),

con u, v ∈ ℤ∗ . De aquí obtenemos que m | p0 ; además, uvtqn−1 ′ = pn = 1,



luego t ∈ ℤ , es decir, t = ±1, y de esta forma m ∈ ℤ es raíz de f (x). ✓

Observación 1.4.15. La proposición 1.4.14 es válida en cualquier DFU.

5. Ejemplos
En esta sección ilustraremos y aplicaremos los resultados obtenidos en las
secciones anteriores a través de ejemplos.

Ejemplo 1.5.1. (i) Notemos que f (x) = x 2 + 8x − 2 es irreducible sobre ℚ:


para p = 2 se tiene que 2 ∤ 1, 2 | 8, 2 | −2 y 4 ∤ −2.
(ii) f (x) = x 2 + 6x + 12 es irrreducible sobre ℚ: similar al anterior con
p = 3.
(iii) f (x) = 2x 10 − 25x 3 + 10x 2 − 30 es irreducible sobre ℚ: como en (i)
con p = 5.

Ejemplo 1.5.2. Probemos que p(x) = x 3 + 3x 2 − 8 es irreducible sobre ℚ:


supóngase que p(x) es factorizable en ℚ,

p(x) = m(x)n(x) = (ax + b)n(x),

con a, b ∈ ℚ, a ≠ 0; puesto −ba es una raíz racional, entonces por la pro-


posición 1.4.14, p(x) tiene una raíz c en ℤ tal que c | −8, pero se puede
comprobar por cálculo directo que ninguno de los divisores de −8 es raíz
de p(x).
32 · Polinomios

Ejemplo 1.5.3. Sea p ≥ 2 un irreducible y sea fp : ℤ −→ ℤp el homomor-


fismo sobreyectivo natural, fp (k) := k. Notemos que

fp : ℤ[x] −→ ℤp [x] ,
fp (k0 + k1 x + · · · + km x m ) := k0 + k1 x + · · · + km x m

es un homomorfismo sobreyectivo. Si g (x) ∈ ℤ[x] es de grado m ≥ 2 y


fp (g (x)) no es factorizable en ℤp [x] en un producto de 2 polinomios no
constantes de grado menor que m, entonces g (x) es irreducible sobre ℚ[x].
En efecto, g (x) se puede tomar primitivo y aplicar la proposición 1.4.5. Por
ejemplo, notemos que g (x) = x 3 + 17x + 36 es irreducible sobre ℚ[x]: para
p = 17 se tiene que f17 (g (x)) = x 3 + 2, pero x 3 + 2 no se puede factorizar en
ℤ17 [x] un producto de 2 polinomios no constantes de grado ≤ 3: en caso
contrario uno de los factores sería lineal, x − a, con 0 ≤ a ≤ 17, pero esto
implicaría que a3 = −2 en ℤ17 , pero tal a con 0 ≤ a ≤ 16 no existe.

Ejemplo 1.5.4. Sea R un DI y sea F su cuerpo de fracciones; sabemos que


F [x] es un DI, por lo tanto, tiene cuerpo de fracciones que denotamos por
F (x). Notemos que los elementos de F (x) son fracciones de la forma qp (x)
(x)
,
con p(x), q(x) ∈ F [x], q(x) ≠ 0. Se puede probar fácilmente que F (x) es
isomorfo al cuerpo de fracciones de R [x] (véase el ejercicio 20).

Ejemplo 1.5.5. Vimos en la proposición 1.2.4 que si 𝕂 es un cuerpo y


a ∈ 𝕂 es una raíz de un polinomio f (x) ∈ 𝕂 [x], entonces

f (x) = (x − a) g (x),

con g (x) ∈ 𝕂 [x]. La raíz a se dice de multiplicidad m ≥ 1 si

f (x) = (x − a) m h(x),

con h(x) ∈ 𝕂 [x] y a no es raíz de h(x). Notemos que a es una raíz de


multiplicidad m ≥ 2 si, y sólo si, a es una raíz del polinomio f ′ (x), donde
f ′ (x) denota la derivada del polinomio f (x) definida de la manera usual
como se hace en cálculo.

6. Polinomios en varias variables


Sea R un anillo conmutativo y sea R [X] := R [x1 , . . . , xn ] su anillo de po-
linomios en n variables. Existen varias maneras de escribir cada elemen-
to de R[X] dependiendo del propósito. Por ejemplo, podemos entender a
Polinomios · 33

R [X] como R[X] = R[x1 , . . . , xn−1 ] [xn ] de tal manera que cada elemento
p(X) := p(x1 , . . . , xn ) ∈ R[X] se puede representar en la forma

p(X) = p0 (x1 , . . . , xn−1 ) + p1 (x1 , . . . , xn−1 )xn + · · · + pr (x1 , . . . , xn−1 )xnr ;

de manera similar podemos proceder con respecto a las demás variables.


Otra forma usada muy frecuentemente es expresar los elementos de R[X]
en la forma
t
∑︁
p(X) = c𝛼i x 𝛼i , con c𝛼i ∈ R, x 𝛼i := x1𝛼1i · · · xn𝛼ni , 𝛼i := (𝛼1i , . . . , 𝛼ni ) ∈ ℕn ;
i=1

los elementos c𝛼i se conocen como los coeficientes de p(X), los productos
x 𝛼i son los monomios y los elementos c𝛼i x 𝛼i son los términos. Por ejem-
plo, si p(x, y, z) = 3 − 2xy + 6xz + 7z2 − 4xy 2 z ∈ ℤ[x, y, z], entonces
los coeficientes de este polinomio son 3, −2, 6, 7, −4, los monomios son
1, xy, xz, z2 , xy 2 z y sus términos son 3, −2xy, 6xz, 7z2 , −4xy 2 z.

Definición 1.6.1. Sean R un anillo conmutativo y R[X] := R[x1 , . . . , xn ]


su anillo de polinomios en n variables.

(i) El conjunto de monomios estándar de R[X] se define por

Mon(R[X]) := Mon{x1 , . . . , xn }
:= {x 𝛼 := x1𝛼1 · · · xn𝛼n | 𝛼 = (𝛼1 , . . . , 𝛼n ) ∈ ℕn }.

(ii) Si x 𝛼 ∈ Mon(R[X]), exp(x 𝛼 ) := 𝛼 y gr(x 𝛼 ) := |𝛼 | := 𝛼1 + · · · + 𝛼n .

(iii) Sea p(X) = ti=1 c𝛼i x 𝛼i ∈ R[X], donde cada coeficiente c𝛼i es no nulo.
Í

Se define el grado de p(X) por gr(p(X)) := máx{gr(x 𝛼i )}ti=1 .

(iv) Sea p(X) como en (iii). Se dice que p(X) es homogéneo de grado
n ≥ 0 si todos sus monomios son de grado n.

Ejemplo 1.6.2. Los siguientes polinomios enteros son homogéneos:

2xy − x 2 + yz − 5z2 , x − y + 8z, 3, x 3 − 5x 2 z + z3 ;

en cambio 3xy − y 2 + 4z no es homogéneo.

Proposición 1.6.3. Mon(R[X]) tiene estructura de monoide conmutativo. Ade-


más, R[X] es un R-módulo libre a izquierda con base Mon(R[X]).
34 · Polinomios

Demostración. La estructura de monoide de Mon(R[X]) es isomorfa con la


de ℕn : en efecto, en ℕn se tiene que si

𝛼 = (𝛼1 , . . . , 𝛼n ), 𝛽 = ( 𝛽 1 , . . . , 𝛽 n ) ∈ ℕn ,

entonces
𝛼 + 𝛽 := (𝛼1 + 𝛽 1 , . . . , 𝛼n + 𝛽 n );

el neutro en ℕn es (0, . . . , 0). De otra parte, en Mon(R[X]) se tiene que


𝛽 𝛽 𝛼 + 𝛽1 𝛼 + 𝛽n
x 𝛼 x 𝛽 = x1𝛼1 · · · x 𝛼n x1 1 · · · xn n = x1 1 · · · xn n = x 𝛼+ 𝛽 ,

donde el elemento neutro es 1 := x10 · · · xn0 . Así, el isomorfismo entre ℕn y


Mon(R[X]) viene dado por 𝛼 ↦−→ x 𝛼 .
La segunda afirmación de la proposición se prueba de manera recurrente
ya que, según la definición de R[x1 ] que vimos al principio del capítulo,
R[x1 ] es claramente un R-módulo libre a izquierda con base {x i }i ≥0 (véase

[24]) y, para el caso general, se tiene que R [X] = R [x1 , . . . , xn−1 ] [xn ]. □

Observación 1.6.4. Nótese que la proposición anterior es también válida


cuando el anillo de coeficientes no es conmutativo.

A diferencia del caso de una sola variable, para los polinomios

2xy − x 2 + yz − 5z 2 y 3xy − y 2 + 4z

no es claro cómo definir el monomio principal; por ejemplo, para el pri-


mer polinomio todos los monomios son del mismo grado. Sin embargo,
en el caso general de varias variables, es necesario, en muchos contextos y
aplicaciones, escribir un polinomio en forma ordenada según algún orden
dado a su conjunto (monoide) de monomios estándar. A continuación nos
ocuparemos de estos órdenes sobre Mon(R[X]).
Hay muchas maneras de ordenar Mon(R [X]), sin embargo, nosotros ya
conocemos algunas propiedades que debe satisfacer un orden deseable. Por
ejemplo, el orden mediante el grado en el caso de una variable fue usado
para establecer un algoritmo de división (o reducción) y para extender rela-
ciones de divisibilidad. Por lo tanto, en el caso general, si x 𝛼 ha de dividir a
x 𝛽 , entonces deberíamos tener que x 𝛽 ≥ x 𝛼 , o equivalentemente, si 𝛽 i ≥ 𝛼i
para cada i = 1, . . . , n , entonces x 𝛽 ≥ x 𝛼 . También, en las divisiones des-
critas en la sección 3, nosotros arreglamos los términos de los polinomios en
orden creciente o decreciente, y por lo tanto, pudimos comparar cualesquie-
ra dos monomios. Así, el orden debe ser total, esto es, dados cualesquiera
Polinomios · 35

x 𝛼 , x 𝛽 ∈ Mon(R[X]), exactamente una de las siguientes relaciones debe


cumplirse:
x 𝛽 > x𝛼 , x 𝛽 = x𝛼 ó x𝛼 > x 𝛽 .
Además, la reducción −→+ descrita en la sección 3 debe parar después
de un número finito de pasos. Por lo tanto, para que la reducción sea finita,
necesitamos que el orden sea un buen orden, es decir, no exista una cadena
infinita descendente x 𝛼1 > x 𝛼2 > x 𝛼3 > · · · en Mon(R [X]). Un orden que
satisface todas estas condiciones es conocido como un orden monomial y
tales propiedades serán tenidas en cuenta en la siguiente definición.

Definición 1.6.5. Sea ≥ una relación de orden en Mon(R [X]). Si x 𝛽 ≥ x 𝛼


pero x 𝛽 ≠ x 𝛼 , se escribe x 𝛽 > x 𝛼 , o también, x 𝛼 < x 𝛽 . Se dice que ≥ es
monomial si satisface las siguientes condiciones:

(i) ≥ es un orden total.

(ii) Para cada x 𝛽 ≠ 1 en Mon(R[X]) se tiene que x 𝛽 > 1.

(iii) Si x 𝛽 ≥ x 𝛼 , entonces x 𝛽 x 𝛾 ≥ x 𝛼 x 𝛾 para cada x 𝛾 en Mon(R [X]).

Ejemplo 1.6.6. El orden lexicográfico (lex) en Mon(R[x]) se define de la


siguiente manera:

(i) x1 > x2 > x3 > · · · > xn .

(ii) Para 𝛼 = (𝛼1 , . . . , 𝛼n ) y 𝛽 = ( 𝛽 1 , . . . , 𝛽 n ) ∈ ℕn , definimos

x 𝛽 > x 𝛼 ⇔ existe i ≥ 1 tal que 𝛽 1 = 𝛼1 , . . . , 𝛽 i−1 = 𝛼i−1 , 𝛽 i > 𝛼i .

De esta forma, en el caso de dos variables, se tiene que

1 = x10 x20 < x2 = x10 x2 < x22 = x10 x22 < x23 = x10 x23
< · · · < x1 = x1 x20 < x1 x2 < x1 x22 < · · · < x12 = x12 x20 < · · · .

𝛽 𝛽
Veamos que lex es realmente un orden monomial: sea x 𝛽 = x1 1 · · · xn n ≠ 1
y sea i el menor índice tal que 𝛽 i ≠ 0. Entonces, claramente

x1 1 · · · xn n = x 𝛽 > 1 = x10 · · · xn0 ;


𝛽 𝛽

𝛽 𝛽 𝛾 𝛾
sea ahora x 𝛽 = x1 1 · · · xn n > x1𝛼1 · · · xn𝛼n = x 𝛼 y sea x 𝛾 = x11 · · · xn n , sea
i el menor índice tal que 𝛽 i > 𝛼i , entonces i es el menor índice tal que
𝛽 i + 𝛾i > 𝛼i + 𝛾i , luego x 𝛽 x 𝛾 > x 𝛼 x 𝛾 . Es obvio que lex es un orden total.
36 · Polinomios

Ejemplo 1.6.7. Se define el orden lexicográfico graduado (deglex) en R[X]


de la siguiente manera:

(i) x1 > x2 > x3 > · · · > xn .

(ii) Para 𝛼 = (𝛼1 , . . . , 𝛼n ) y 𝛽 = ( 𝛽 1 , . . . , 𝛽 n ) ∈ ℕn , definimos


(
| 𝛽 | > |𝛼 |, ó,
x >x ⇔
𝛽 𝛼
| 𝛽 | = |𝛼 | y x 𝛽 > x 𝛼 en el orden lex.

De esta forma, en este orden primero ordenamos por el grado total y luego
por el orden lex. En el caso de dos variables x1 y x2 tenemos:

1 = x10 x20 < x10 x2 = x2 < x1 x20 = x1 < x22 = x10 x22 < x1 x2
< · · · < x12 = x12 x20 < x10 x23 = x23 < x1 x22 < x12 x2 < x13 x20 = x13 < · · · .

Veamos este orden en R[x, y] con x < y:

1 < x < y < x 2 < yx < y 2 < x 3 < · · · < yx 2 < y 2 x < y 3 < · · · .
𝛽 𝛽
Probemos que deglex es un orden monomial: sean x 𝛽 = x1 1 · · · xn n ≠ 1 e i
el menor entero tal que 𝛽 i ≠ 0. Entonces claramente

x 𝛽 = x1 1 · · · xn n > 1 = x10 · · · xn0 ;


𝛽 𝛽

𝛽 𝛽 𝛾 𝛾
sea x 𝛽 = x1 1 · · · xn n > x 𝛼 = x1𝛼1 · · · xn𝛼n y sea x 𝛾 = x11 · · · xn n ; si
n
∑︁ n
∑︁
𝛽i > 𝛼i ,
i=1 i=1

entonces
n
∑︁ n
∑︁ n
∑︁ n
∑︁
𝛽i + 𝛾i > 𝛼i + 𝛾i ,
i=1 i=1 i=1 i=1

luego
n
∑︁ n
∑︁
( 𝛽 i + 𝛾i ) > (𝛼i + 𝛾i )
i=1 i=1

de tal forma que en este caso x 𝛽 x 𝛾 > x 𝛼 x 𝛾 . Si


n
∑︁ n
∑︁
𝛼i = 𝛽i ,
i=1 i=1
Polinomios · 37

entonces x 𝛽 > x 𝛼 en el orden lex, y en este caso ya probamos que


x 𝛽 x 𝛾 > x 𝛼 x 𝛾 , y además,
n
∑︁ n
∑︁
(𝛼i + 𝛾i ) = ( 𝛽 i + 𝛾i ).
i=1 i=1

El orden deglex es total ya que


n
∑︁ n
∑︁
𝛽i > 𝛼i
i=1 i=1

ó
n
∑︁ n
∑︁
𝛽i = 𝛼i
i=1 i=1
(y el orden lex es total) ó
n
∑︁ n
∑︁
𝛼i > 𝛽i .
i=1 i=1

Observación 1.6.8. (i) Es importante anotar que en cualquier orden mo-


nomial se necesita especificar un orden para las variables. Por ejemplo, si
tenemos un orden monomial ≥ en R[x, y], sabemos que x ≠ y, pero no
tenemos ningún criterio para deducir que x > y o y > x, luego debemos
postular alguna de estas relaciones en la definición de ≥.
(ii) Si usamos el orden lexicográfico en R[x, y], con x < y (en lugar de
x > y), entonces

1 < x < x 2 < x 3 < · · · < y < yx < yx 2 < · · · < y 2 < · · · .

Regresamos a la definición general de orden monomial. Queremos de-


mostrar que cualquier monomial extiende la divisibildad y es un buen or-
den.
Comencemos con la divisibilidad. Consideramos a los monomios están-
dar con algún orden monomial ≥; ya que Mon(R [X]) ⊂ R [X], podría-
mos entonces decir que x 𝛼 divide a x 𝛽 si, y sólo si, existe un polinomio
c1 x 𝛾1 + · · · + ct x 𝛾1 ∈ R[X] tal que

x 𝛽 = (c1 x 𝛾1 + · · · + ct x 𝛾1 )x 𝛼 ,

donde x 𝛾1 > · · · > x 𝛾1 , resulta x 𝛽 = c1 x 𝛾1 x 𝛼 , de donde c1 = 1 y x 𝛽 = x 𝛾1 x 𝛼 .


Recíprocamente, si esta última igualdad se tiene, entonces x 𝛼 divide a x 𝛽 .
Así, la relación de divisibilidad se puede definir en el monoide Mon(R[X]),
es decir, entre monomios.
38 · Polinomios

Definición 1.6.9. Sean x 𝛼 , x 𝛽 ∈ Mon(R[X]), se dice que x 𝛼 divide a x 𝛽 ,


lo cual se denota por x 𝛼 | x 𝛽 , si existe x 𝛾 ∈ Mon(R [X]) tal que x 𝛽 = x 𝛾 x 𝛼 .

Observemos que la relación | es un orden en Mon(R[X]) que cumple


las condiciones (ii) y (iii) de la definición 1.6.5, pero no es total. Se tiene
sin embargo la siguiente propiedad.

Proposición 1.6.10. Sea ≥ un orden monomial en Mon(R[X]). Para cuales-


quiera x 𝛼 , x 𝛽 ∈ Mon(R [X]) se tiene que si x 𝛼 | x 𝛽 , entonces x 𝛽 ≥ x 𝛼 .

Demostración. Existe x 𝛾 ∈ Mon(R[X]) tal que x 𝛽 = x 𝛾 x 𝛼 . Por la condición


(i) de la definición 1.6.5 se tiene que x 𝛾 ≥ 1, y por la condición (ii) de dicha
definición se obtiene que x 𝛽 = x 𝛾 x 𝛼 ≥ x 𝛼 , como se anunció. ✓

Aplicamos ahora los órdenes monomiales para representar cada polino-


mio de R[X] de una manera ordenada: fijemos un orden monomial sobre
Mon(R[X]), entonces dado P (X) no nulo en R[X], podemos escribir

p(X) = a1 x 𝛼1 + a2 x 𝛼2 + · · · + ar x 𝛼r ,

donde 0 ≠ ai ∈ R, x 𝛼i ∈ Mon(R[X]) y x 𝛼1 > x 𝛼2 > · · · > x 𝛼r . Definimos


entonces lm(P (X)) := x 𝛼1 , el monomio principal de p(X); lc(P (X)) := a1 ,
el coeficiente principal de P (X); lt(P (X)) := a1 x 𝛼1 , el término principal
de P (X). También definimos lm(0) = lc(0) = lt(0) := 0. Nótese que si R
es un DI, lp, lc y lt son funciones multiplicativas, es decir,

lm( f (X) g (X)) = lm( f (X)) lm(g (X)),


lc( f (X)g (X)) = lc( f (X)) lc(g (X)),
lt( f (X)g (X)) = lt( f (X)) lt(g (X)).

En efecto, sean f (X) = a1 x 𝛼1 + · · · + an x 𝛼n y g (X) = b1 x 𝛽 1 + · · · + bm x 𝛽 m ,


entonces
∑︁n ∑︁m
f (X) g (X) = (ai b j x 𝛼i x 𝛽 j ),
i=1 j=1

y nótese que x 𝛼1 x 𝛽 j > x 𝛼i x 𝛽 j con i ≥ 2, j ≥ 1 y también x 𝛼i x 𝛽 1 > x 𝛼i x 𝛽 j ,


con i ≥ 1, j ≥ 2. Esto garantiza que x 𝛼1 x 𝛽 1 = lm( f (X) g (X)), luego
lm( f (X)g (X)) = lm( f (X)) lm(g (X)).
De otra parte, si cambiamos el orden monomial, entonces lm( f (X)),
lc( f (X)) y lt( f (X)) pueden cambiar. Por ejemplo, sea

f = 2x 2 yz + 3xy 3 − 2x 3 ∈ ℤ[x, y];


Polinomios · 39

si el orden es lex con x > y > z, entonces

lm( f ) = x 3 , lc( f ) = −2 y lt( f ) = −2x 3 ;

pero si el orden es deglex con x > y > z, entonces

lm( f ) = x 2 yz, lc( f ) = 2 y lt( f ) = 2x 2 yz.

Cerramos esta sección demostrando que los órdenes monomiales sobre


anillos conmutativos noetherianos (véase [27]), es decir, aquellos que no tie-
nen cadenas ascendentes infinitas de ideales, son buenos órdenes. Ejemplos
importantes de anillos noetherianos son los cuerpos, o más generalmente,
los DIPs.

Proposición 1.6.11. Sea R un anillo conmutativo noetheriano. Entonces, cada


orden monomial sobre Mon(R [X]) es un buen orden, es decir, cada subconjunto no
vacío C de Mon(R[X]) tiene elemento mínimo.

Demostración. Supongamos contrariamente que existe un orden monomial


que no es un buen orden. Entonces, existe un subconjunto no vacío C de
Mon(R[X]) de tal forma que existen x 𝛼i ∈ C , i = 1, 2, . . . tales que

x 𝛼1 > x 𝛼2 > x 𝛼3 > · · · . (6.1)

Esto define una cadena de ideales en R[X]

⟨x 𝛼1 ⟩ ⊂ ⟨x 𝛼1 , x 𝛼2 ⟩ ⊂ ⟨x 𝛼1 , x 𝛼2 , x 𝛼3 ⟩ ⊂ · · · . (6.2)

Nótese que efectivamente ⟨x 𝛼1 , . . . , x 𝛼i ⟩ ≠ ⟨x 𝛼1 , . . . , x 𝛼i+1 ⟩: si tuvieramos


la igualdad, entonces
∑︁i
x 𝛼i +1 = u j x𝛼 j ,
j=1

donde u j ∈ R[X], j = 1, 2, . . . , i. Sea p(X) := ij=1 u j x 𝛼 j ; si expandimos


Í

cada u j como una R-combinación de monomios vemos que cada monomio


de P (X) es divisible por algún x 𝛼 j , 1 ≤ j ≤ i, por lo tanto,
lm(P (X)) = x 𝛾 x 𝛼 j , de donde x 𝛼i +1 es divisible por x 𝛼 j , y en consecuen-
cia, x 𝛼i +1 ≥ x 𝛼 j , lo cual contradice (6.1) . Por lo tanto, la cadena de ideales
en (6.2) es estrictamente creciente, pero esto es una contradicción con el
teorema de la base de Hilbert que dice que las cadenas ascendentes de ideales
en R[X] no son infinitas (véase [27]). ✓

40 · Polinomios

7. Polinomios simétricos
Una posible justificación para introducir y estudiar los polinomios simé-
tricos en varias variables es la permutación de las raíces, tal como veremos
continuación. Consideremos el polinomio p(z) := (z−r1 ) · · · (z−rn ) ∈ R[z];
si desarrollamos los factores de p(z) obtenemos:
p(z) = z n − (r1 + · · · + rn )z n−1 + (r1 r2 + · · · + r1 rn + r2 r3 + · · · + rn−1 rn )z n−2
− (r1 r2 r3 + r1 r2 r4 + · · · + rn−2 rn−1 rn )z n−3 + · · ·
!
∑︁
n−1
+ (−1) ri1 · · · rin−1 z + (−1) n (r1 r2 · · · rn );
i1 <i2 <···<in−1

si permutamos las raíces de p(z), es decir, intercambiamos los factores, en-


tonces los coeficientes de la expansión anterior por supuesto son los mismos.
Definición 1.7.1. Sea R un anillo conmutativo. Un polinomio
p(x1 , . . . , xn ) ∈ R[x1 , . . . , xn ] se dice simétrico si para cada permutación
𝜋 del grupo simétrico Sn se tiene que p(x 𝜋 (1) , . . . , x 𝜋 (n) ) = p(x1 , . . . , xn ).
Los polinomios simétricos elementales son
s1 := x1 + · · · + xn ,
s2 := x1 x2 + · · · + xn−1 xn ,
s3 := x1 x2 x3 + x1 x2 x4 + · · · + xn−2 xn−1 xn ,
..
.
∑︁
sk := xi1 · · · xik ,
i1 <i2 <···<ik
..
.
∑︁
sn−1 := xi1 · · · xin−1 ,
i1 <i2 <···<in−1

sn := x1 x2 · · · xn .
Otra manera de definir los polinomios simétricos es como sigue: note-
mos que cada permutación 𝜋 ∈ Sn define un homomorfismo de anillos
𝜋 : R[x1 , . . . , xn ] −→ R [x1 , . . . , xn ] ,
𝜋 (p(x1 , . . . , xn )) := p(x 𝜋 (1) , . . . , x 𝜋 (n) ),
entonces p(x1 , . . . , xn ) es simétrico si, y sólo si, para cada 𝜋 ∈ Sn ,
p(x1 , . . . , xn ) es un punto fijo de 𝜋. Otros ejemplos de polinomios simétri-
cos no elementales son x12 + · · · + xn2 , x1 + · · · + xn + x1 x2 + · · · + xn−1 xn = s1 + s2 ,
sn−1 sn y los polinomios constantes.
Polinomios · 41

Consideremos nuevamente el polinomio

p(z) = (z − r1 ) · · · (z − rn ) ∈ R[z];

hagamos rn = 0, entonces

(z − r1 ) · · · (z − rn−1 )z = z n − (r1 + · · · + rn−1 )z n−1


+ (r1 r2 + · · · + r1 rn−1 + r2 r3 + · · · + rn−2 rn−1 )z n−2
− (r1 r2 r3 + r1 r2 r4 + · · · + rn−3 rn−2 rn−1 )z n−3
!
Ö
n−2
+ · · · + (−1) ri1 · · · rin−2 z
i1 <i2 <···<in−2
n−1
+ (−1) (r1 r2 · · · rn−1 ).

Notemos entonces que los coeficientes en la expansión anterior correspon-


den a los polinomios simétricos elementales en r1 , . . . , rn−1 , los cuales po-
demos denotar por (s1 )0 , (s2 )0 , . . . , (sn−1 )0 .
Veremos enseguida que la colección S de polinomios simétricos es un
subanillo de R [x1 , . . . , xn ] y contiene a R. ¿El subanillo de R [x1 , . . . , xn ]
generado por R y los polinomios simétricos elementales coincide con S?
La respuesta a esta pregunta es positiva y constituye el principal resultado
de esta sección, el cual demostraremos a continuación. Como en la sección
anterior, denotemos R[X] = R[x1 , . . . , xn ] y sea Mon(R[X]) la colección
de monomios estándar de R [X].

Definición 1.7.2. Sea x 𝛼 = x1𝛼1 · · · xn𝛼n ∈ Mon(R[X]). Se define el peso de


x 𝛼 por
w(x 𝛼 ) := 𝛼1 + 2𝛼2 + · · · + n𝛼n .
Si p(X) = ti=1 c𝛼i x 𝛼i ∈ R[X], se define el peso de p(X) por
Í

w(p(X)) := máx{w(x 𝛼i )}ti=1 .

Observación 1.7.3. (i) Notemos que si x 𝛼 ≠ 1, entonces gr(x 𝛼 ) < w(x 𝛼 ),


y por lo tanto, si P (X) no es constante, entonces gr(p(X)) < w(P (X)). Por
ejemplo, en ℤ[x, y], gr(3x 2 y − xy 2 + 4xy) = 3 y w(3x 2 y − xy 2 + 4xy) = 5.
(ii) Dados dos monomios x 𝛼 , x 𝛽 , con gr(x 𝛼 ) < gr(x 𝛽 ), es posible que
w(x 𝛽 ) > w(x 𝛼 ), por ejemplo, en ℤ[x, y, z] se tiene que gr(z4 ) < gr(x 2 y 2 z),
pero w(z4 ) = 12 > 9 = w(x 2 y 2 z).
(iii) Monomios distintos pueden tener el mismo peso, por ejemplo, x 2 y
y en ℤ[x, y]. Esto impide que sea posible ordenar los monomios solamente
con el peso.
42 · Polinomios

Podemos ya demostrar el resultado central de esta sección.

Teorema 1.7.4. Sea R un anillo conmutativo y R[X] su anillo de polinomios en


las variables x1 , . . . , xn . Entonces,

(i) La colección S de los polinomios simétricos es un subanillo de R[X].

(ii) Si p(X) es un polinomio de peso d, entonces p(s1 , . . . , sn ) es un polinomio


simétrico de grado ≤ d.

(iii) S coincide con el subanillo generado por s1 , . . . , sn y R, es decir,


S = R[s1 , . . . , sn ]. Más exactamente, si s(X) es un polinomio simétrico de
grado d, entonces existe un polinomio p(X) de peso ≤ d tal que
s(X) = p(s1 , . . . , sn ).

Demostración. (i) Sean s(X), t(X) ∈ S y sea 𝜋 ∈ Sn , entonces

𝜋 (s(X) + t(X)) = 𝜋 (s(X)) + 𝜋 (t(X)) = s(X) + t(X);


𝜋 (s(X)t(X)) = 𝜋 (s(X))𝜋 (t(X)) = s(X)t(X);
𝜋 (1) = 1.

(ii) Según (i), p(s1 , . . . , sn ) es un polinomio simétrico. Ordenemos p(X)


según el peso de sus monomios, es decir, p(X) = cx 𝛼 + bx 𝛽 + · · · + cx 𝛾 , con
d = w(x 𝛼 ) ≥ w(x 𝛽 ) ≥ · · · ≥ w(x 𝛾 ), luego

d = 𝛼1 + 2𝛼2 + · · · + n𝛼n ≥ 𝛽 1 + 2 𝛽 2 + · · · + n 𝛽 n ≥ · · · ≥ 𝛾1 + 2𝛾2 + · · · + n𝛾n ;

de otro lado,
𝛽 𝛽 𝛽 𝛾 𝛾 𝛾
p(s1 , . . . , sn ) = cs1𝛼1 s2𝛼2 · · · sn𝛼n + bs1 1 s2 2 · · · sn n + · · · + cs11 s22 · · · sn n ,

y al desarrollar el primer sumando anterior encontramos que

s1𝛼1 · · · sn𝛼n = (x1 + · · · + xn ) 𝛼1 (x1 x2 + · · · + xn−1 xn ) 𝛼2 · · · (x1 · · · xn ) 𝛼n ,

en este desarrollo los monomios son de grado 𝛼1 + 2𝛼2 + · · · + n𝛼n = d, lo


mismo podemos hacer para los otros sumandos, por lo tanto, el monomio
de mayor grado de p(s1 , . . . , sn ) es ≤ d (los monomios de grado d se podrían
cancelar), es decir, gr(p(s1 , . . . , sn )) ≤ d.
(iii) Puesto que rsi = si r y si s j = s j si , para 1 ≤ i , j ≤ n y cada r ∈ R,
entonces el subanillo de R[X] generado por R y s1 , . . . , sn es el conjunto de
todas las expresiones polinómicas en s1 , . . . , sn , conjunto que denotamos
por R[s1 , . . . , sn ] (véase [23]). Por lo tanto, según (i), R [s1 , . . . , sn ] ⊆ S.
S ⊆ R [s1 , . . . , sn ]: procedemos por inducción sobre n.
Polinomios · 43

Para n = 1 la afirmación es evidente ya que s1 = x1 , entonces


R [s1 ] = R[x1 ] = S.
Supongamos que hemos demostrado la afirmación para polinomios si-
métricos en n − 1 variables con cualquier grado d. Sea s(X) un polinomio
simétrico de R [X] de grado d ≥ 0.
Haremos ahora una prueba por inducción sobre d.
Para d = 0, la afirmación es trivial ya que s(X) es una constante y el
polinomio p(X) buscado es s(X).
Sea d ≥ 1 y supongamos la afirmación cierta para polinomios simétri-
cos de n variables de grado ≤ d − 1. Sea s(X) simétrico de R [X] de grado
d; tomando xn = 0, entonces s(x1 , . . . , xn−1 , 0) es un polinomio simétri-
co en n − 1 variables y de grado ≤ d (la simetría de s(x1 , . . . , xn−1 , 0) se
debe a que cada permutación de Sn−1 se puede ver como una permutación
de Sn dejando n fijo), luego, por la inducción sobre n, existe un polinomio
p1 (x1 , . . . , xn−1 ) de peso ≤ d tal que

s(x1 , . . . , xn−1 , 0) = p1 ((s1 )0 , . . . , (sn−1 )0 ).

Al polinomio p1 (x1 , . . . , xn−1 ) lo podemos ver como elemento de R [X], es


decir, como polinomio en n variables, luego, según (ii), p1 (s1 , . . . , sn−1 ) es
un polinomio simétrico en las variables x1 , . . . , xn de grado ≤ d. El polino-
mio
s1 (X) := s(X) − p1 (s1 , . . . , sn−1 )
tiene grado ≤ d y es simétrico en las variables x1 , . . . , xn . Resulta,

s1 (x1 , . . . , xn−1 , 0) = s(x1 , . . . , xn−1 , 0) − p1 ((s1 )0 , . . . , (sn−1 )0 ) = 0.

Esto indica que s1 (X) es divisible por xn , pero como es simétrico, debe ser
divisible también por x1 · · · xn , así, s1 (X) = sn s2 (X). Notemos que s2 (X)
debe ser también simétrico: en efecto, sea 𝜋 ∈ Sn , entonces

𝜋 (s1 (X)) = s1 (X) = 𝜋 (sn s2 (X)) = 𝜋 (sn )𝜋 (s2 (X)) = sn 𝜋 (s2 (X)),

luego cancelamos sn y obtenemos lo anunciado. El grado de s2 (X) es


≤ d − n < d, por lo tanto, podemos aplicar la inducción sobre d y encontra-
mos un polinomio p2 (X) en las n variables x1 , . . . , xn de peso ≤ d − n tal
que s2 (X) = p2 (s1 , . . . , sn ). Reemplazamos y obtenemos

s(X) = s1 (X) + p1 (s1 , . . . , sn−1 ) = sn p2 (s1 , . . . , sn ) + p1 (s1 , . . . , sn−1 ),

donde el polinomio xn p2 (x1 , . . . , xn ) + p1 (x1 , . . . , xn−1 ) tiene peso ≤ d.


Esto completa la demostración. ✓

44 · Polinomios

Veamos ahora la unicidad de la representación de los polinomios simé-


tricos en términos de los simétricos elementales.
Corolario 1.7.5. Sean p(X), q(X) ∈ R[X] tales que
p(s1 , . . . , sn ) = q(s1 , . . . , sn ).
Entonces p(X) = q(X). En otras palabras, los polinomios simétricos elementales
s1 , . . . , sn son algebraicamente independientes sobre R.
Demostración. Según el teorema 1.7.4, la función definida por
𝜙
R[X] →
− S,
p(X) ↦−→ p(s1 , . . . , sn )
es un homomorfismo sobreyectivo de anillos. La prueba del corolario con-
siste en establecer que 𝜙 es inyectivo (la independencia algebraica se entien-
de de la siguiente manera: si los polinomios simétricos elementales s1 , . . . , sn
satisfacen un polinomio p(X) ∈ R[X], entonces P (X) es el polinomio nu-
lo).
La prueba la hacemos por indución sobre n.
Para n = 1 la afirmación es trivial.
Asumamos el resultado cierto para n − 1 variables, y supongamos enton-
ces que 𝜙 no es inyectivo. Sea p(X) ∈ R [X] no nulo de grado mínimo tal
que p(s1 , . . . , sn ) = 0; podemos escribir p(X) en la forma
p(X) = p0 (x1 , . . . , xn−1 ) + p1 (x1 , . . . , xn−1 )xn + · · · + pk (x1 , . . . , xn−1 )xnk .
Notemos que p0 (x1 , . . . , xn−1 ) ≠ 0: en efecto, si p0 (x1 , . . . , xn−1 ) = 0, en-
tonces p(X) = xn q(X), con q(X) ∈ R[X] de grado menor que el grado de
P (X), con lo cual sn q(s1 , . . . , sn ) = 0, de donde q(s1 , . . . , sn ) = 0, contra-
dicción. Resulta,
0 = p0 (s1 , . . . , sn−1 ) + p1 (s1 , . . . , sn−1 )sn + · · · + pk (s1 , . . . , sn−1 )snk .
Si hacemos xn = 0 obtenemos 0 = p0 ((s1 )0 , . . . , (sn−1 )0 ), lo cual es contra-
dictorio con la hipótesis de inducción. ✓

Observación 1.7.6. Notemos que el teorema y corolario anteriores de-


muestran que R [X]  S ⊂ R[X].
Ejemplo 1.7.7. Consideremos nuevamente el polinomio que vimos al ini-
cio de esta sección: p(z) := (z − r1 ) · · · (z − rn ) ∈ R[z]; notemos que el
producto Ö
d(r1 , . . . , rn ) := (ri − r j ) 2
i< j
Polinomios · 45

es un polinomio simétrico en las variables r1 , . . . , rn . En efecto, al aplicar


cualquier permutación 𝜋 ∈ Sn a d(r1 , . . . , rn ) aparecen nuevamente todas
y cada una de las diferencias entre las raíces r’s, pero algunas en orden cam-
biado, es decir, en lugar de ri − r j con i < j, puede aparecer r j − ri . Sin
embargo, como las diferencias aparecen al cuadrado, entonces el producto
total queda invariable. Este polinomio simétrico se denomina el discrimi-
nante de p(z). Notemos que d(r1 , . . . , rn ) es homogéneo de grado n(n −1).

Ejemplo 1.7.8. Para el discriminante d(r1 , r2 ) = (r1 − r2 ) 2 , queremos apli-


car la demostración del teorema 1.7.4 para calcular un polinomio p(r1 , r2 )
de peso ≤ 2 tal que d(r1 , r2 ) = p(s1 , s2 ). Siguiendo la prueba del teorema,
existe un polinomio p1 (r1 ) de peso ≤ 2 tal que d(r1 , 0) = p1 ((s1 )0 ), es de-
cir, r12 = p1 ((s1 )0 ); este polinomio claramente es p1 (r1 ) = r12 , por lo tanto
hacemos

d1 (r1 , r2 ) = d(r1 , r2 ) − s12 = (r1 − r2 ) 2 − (r1 + r2 ) 2 = −4r1 r2 = −4s2 ,

de donde d(r1 , r2 ) = s12 − 4s2 . Así, el polinomio buscado es

p(r1 , r2 ) = x12 − 4x2 ,

el cual tiene peso 2.

Ejemplo 1.7.9. f (x1 , x2 ) = (x1 − x2 ) 2 x12 x22 es un polinomio simétrico en


dos variables de grado ≤ 6; queremos aplicar nuevamente la demostración
del teorema 1.7.4 para encontrar un polinomio en dos variables p(x1 , x2 )
de peso ≤ 6 tal que f (x1 , x2 ) = p(s1 , s2 ). Observemos que f (x1 , 0) = 0,
por lo tanto, en este caso el primer paso de la demostración del teorema no
produce nada nuevo. Notemos que f (x1 , x2 ) = (x1 − x2 ) 2 s22 , luego consi-
deremos el polinomio q(x1 , x2 ) := (x1 − x2 ) 2 , el cual es simétrico de grado
2. A este polinomio le debemos aplicar el teorema, por lo tanto, hacemos
q(x1 , 0) = x12 y consideramos el polinomio

q(x1 , x2 ) − s12 = (x1 − x2 ) 2 − (x1 + x2 ) 2 = −4x1 x2 = −4s2 ,

con lo cual q(x1 , x2 ) = s12 − 4s2 (nótese que el polinomio x12 − 4x2 es de peso
2). Así, f (x1 , x2 ) = (s12 − 4s2 )s22 y el polinomio buscado es

p(x1 , x2 ) = (x12 − 4x2 )x22 ,

el cual es de peso 6.
46 · Polinomios

Ejemplo 1.7.10. Veamos otra ilustración del teorema 1.7.4. Consideremos


el polinomio simétrico f (x1 , x2 , x3 ) = x13 + x23 + x33 de grado 3; buscamos
un polinomio p(x1 , x2 , x3 ) de peso ≤ 3 tal que f (x1 , x2 , x3 ) = p(s1 , s2 , s3 ).
Primero hacemos f (x1 , x2 , 0) = x13 + x23 y buscamos un polinomio
p1 (x1 , x2 ) de peso ≤ 3 tal que f (x1 , x2 , 0) = p1 ((s1 )0 , (s2 )0 ). Para esto
aplicamos el teorema al polinomio simétrico f (x1 , x2 , 0) = x13 + x23 ; por lo
tanto, hacemos f (x1 , 0, 0) = x13 y encontramos

f (x1 , x2 , 0) − (s1 )03 = x13 + x23 − (x1 + x2 ) 3 = −3x12 x2 − 3x1 x22


= −3(x1 + x2 )x1 x2 = −3(s1 )0 (s2 )0 ,

así, f (x1 , x2 , 0) = (s1 )03 − 3(s1 )0 (s2 )0 y el polinomio buscado es

x13 − 3x1 x2 ,

el cual efectivamente es de peso 3.


El siguiente paso es definir f1 (x1 , x2 , x3 ) = f (x1 , x2 , x3 ) − (s13 − 3s1 s2 ),
luego

f1 (x1 , x2 , x3 )
= x13 + x23 + x33 − (x1 + x2 + x3 ) 3 + 3(x1 + x2 + x3 )(x1 x2 + x1 x3 + x2 x3 )
= 3x1 x2 x3 = 3s3 .

Por lo tanto, f (x1 , x2 , x3 ) = s13 − 3s1 s2 + 3s3 y el polinomio buscado es


x13 − 3x1 x2 + 3x3 , el cual tiene peso 3.

8. Ejercicios
1. Sean f (x) = x 6 + 3x 5 + 4x 2 − 3x + 2, g (x) = x 2 + 2x − 3 ∈ ℤ7 [x].
Encuentre q(x) y r (x) en ℤ7 [x] tales que f (x) = g (x)q(x) + r (x), con
gr(r (x)) < 2.

2. Considere el polinomio f (x) = x 3 + 2x + 3 como elemento de ℤ5 [x].


Exprese a f (x) como producto de polinomios irreducibles.

3. Pruebe que p(x) = x 3 − 9 es reducible sobre ℤ11 .

4. Pruebe que p(x) = x 2 + 1 es irreducible como elemento de ℤ11 [x].


Demuestre además que ℤ11 [x]/⟨p(x)⟩ es un cuerpo con 121 elemen-
tos.

5. Escriba todos los polinomios de grado ≤ 3 irreducibles de ℤ3 [x].


Polinomios · 47

6. Pruebe que x 4 − 22x 2 + 1 es irreducible sobre ℚ.

7. Pruebe que x 3 − x 2 + x + 6 es irreducible sobre ℚ.

8. Sean m y n enteros primos relativos, es decir, m. c. d.(m, n) = 1.


Suponga que (x − mn ) | (a0 + a1 x + · · · + ar x r ), donde ai ∈ ℤ. Pruebe
que m | a0 y n | ar .

9. Construya un cuerpo de 27 elementos.

10. Demuestre que si F es un cuerpo finito, entonces su característica es


un primo p, y además, F tiene p n elementos para un cierto n ≥ 1.
n
Pruebe además que a p = a para cada a ∈ F . (Sugerencia: pruebe
que F es un espacio vectorial sobre su subanillo primo, es decir, su
subcuerpo primo, véase [23]).

11. Mediante el algoritmo de Euclides compruebe que

m. c. d.( f1 (x), f2 (x), f3 (x)) = x 2 + x + 1,

donde f1 (x) = x 5 − 2x 4 − x 2 + 2x, f2 (x) = x 7 + x 6 − 2x 4 − 2x 3 + x + 1


y f3 (x) = x 6 − 2x 5 + x 4 − 2x 3 + x 2 − 2x.

12. Calcule el m. c. m. de los polinomios enteros

x 6 − 1, x 4 + 2x 3 + 2x 2 − 2x − 3.

13. Calcule la descomposición irreducible de x 3 − y 3 ∈ ℚ[x, y].

14. Utilizando el teorema de Fermat con p = 5, calcule los ceros del po-
linomio 2x 219 + 3x 74 + 2x 57 + 3x 44 ∈ ℤ5 [x].

15. Sean R un anillo conmutativo, R[x] su anillo de polinomios y ⟨x⟩ el


ideal generado por el polinomio x. ¿Es cierto que R [x]/⟨x⟩  R?

16. Demuestre que el polinomio y 3 + 3x 2 y − 6xy 2 + x ∈ ℤ[x, y] es irre-


ducible.

17. Sean 𝕂 un cuerpo y f (x) = an x n + · · · + a0 ∈ 𝕂 [x]. Si 0 ≠ a ∈ F es


una raíz de f (x), demuestre que a −1 es una raíz de an + · · · + a0 x n .

18. Sean 𝕂 un cuerpo y I1 ⊆ I2 ⊆ I3 ⊆ · · · una cadena ascendente de


ideales de 𝕂 [x]. Demuestre que existe k ≥ 1 tal que

Ik = Ik+1 = Ik+2 = · · · .

Generalice esta propiedad para cualquier DIP.


48 · Polinomios

19. Sea 𝕂 un cuerpo y sea f (x) un polinomio no nulo de 𝕂 [x]. Demues-


tre que las siguientes condiciones son equivalentes:

(i) ⟨ f (x)⟩ es un ideal primo.


(ii) ⟨ f (x)⟩ es un ideal maximal.
(iii) f (x) es irreducible.

20. Sea R un DFU y sea F su cuerpo de fracciones. Demuestre que el


cuerpo de fracciones de R [x] es isomorfo al cuerpo de fracciones de
F [x].

21. Sea 𝕂 un cuerpo infinito y sean f (x), g (x) ∈ 𝕂 [x] tales que
f (a) = g (a) para cada a ∈ 𝕂. Demuestre que f (x) = g (x). ¿Es cierta
esta propiedad para cuerpos finitos?

22. Sea A un anillo arbitrario y sea 𝜄 : A −→ A[x] el homomorfismo


inclusión, es decir, 𝜄(a) := a, a ∈ A. Demuestre que si S es un anillo
cualquiera y f : A −→ f S es un homomorfismo de anillos de tal
forma que en S existe un elemento y con la condición f (a)y = y f (a),
para cada a ∈ A, entonces existe un único homomorfismo de anillos
f : A[x] −→ S tal que e
e f𝜄= f y ef (x) = y.

23. Sea A un anillo arbitrario y sea g (x) un polinomio mónico en A[x].


Demuestre que dado f (x) ∈ A[x] existen q(x) y r (x) en A[x] únicos
tales que

f (x) = q(x)g (x) + r (x), con r (x) = 0, ó, gr(r (x)) < gr(g (x)).

24. Calcule todos los polinomios simétricos de ℤ2 [x1 , x2 ] de grado ≤ 3.

25. Calcule todos los polinomios de ℤ2 [x1 , x2 ] de peso ≤ 3.

26. Compruebe que el polinomio

s(x1 , x2 , x3 ) = (x1 + x2 )(x1 + x3 )(x2 + x3 ) ∈ ℤ[x1 , x2 , x3 ]

es simétrico de grado 3. Encuentre un polinomio p(x1 , x2 , x3 ) en


ℤ[x1 , x2 , x3 ] de peso ≤ 3 tal que s(x1 , x2 , x3 ) = p(s1 , s2 , s3 ).
Capítulo
dos
Extensiones de
cuerpos
Extensiones de cuerpos · 51

El segundo capítulo estudia las extensiones de cuerpos y es el corazón del


presente cuaderno. Dedicaremos especial atención a las extensiones sim-
ples, a las algebraicas, a las trascendentes y su clasificación. El cuerpo de
descomposición de un polinomio y la clausura algebrica de un cuerpo tam-
bién serán temas centrales de este capítulo.

1. Extensiones simples
En esta sección se describen y clasifican las extensiones simples de los cuer-
pos. Se demuestra además la unicidad de éstas, salvo equivalencia. En ade-
lante, salvo que se advierta otra cosa, omitiremos el punto para la multipli-
cación de escalar por vector en un espacio vectorial.

Definición 2.1.1. Se dice que el cuerpo 𝕃 es una extensión del cuerpo 𝔽 si


𝔽 es un subcuerpo de 𝕃.

Proposición 2.1.2. Sea 𝕃 una extensión de 𝔽 . Entonces, 𝕃 es un espacio vectorial


sobre 𝔽 .

Demostración. Los vectores de 𝕃 se suman como elementos del cuerpo 𝕃, es


decir, el grupo aditivo del espacio vectorial 𝕃 es el grupo aditivo del cuerpo
𝕃. El producto de los escalares de 𝔽 por los vectores de 𝕃 es el producto en 𝕃.
Las propiedades que definen un espacio vectorial son entonces consecuencia
de las propiedades de las operaciones del cuerpo 𝕃. ✓

Definición 2.1.3. Sea 𝕃 una extensión de 𝔽 . Se denomina grado de la ex-


tensión a la dimensión de 𝕃 considerado como espacio vectorial sobre 𝔽 y
se denota por [𝕃 : 𝔽 ] := dim𝔽 (𝕃). La extensión se dice finita si su grado es
finito.

Proposición 2.1.4. Sea 𝕃 una extensión finita de 𝕂 y sea 𝕂 una extensión finita
de 𝔽 . Entonces, 𝕃 es una extensión finita de 𝔽 , y además,

[𝕃 : 𝔽 ] = [𝕃 : 𝕂] [𝕂 : 𝔽 ].

Demostración. Sean {v1 , . . . , vm } una base de 𝕂, considerado como un espa-


cio vectorial sobre 𝔽 , y {u1 , . . . , un } una base de 𝕃 como 𝕂-espacio. Probe-
mos que el conjunto {v j ui | 1 ≤ j ≤ m, 1 ≤ i ≤ n} es una base de 𝕃 conside-
rado como un espacio vectorial sobre 𝔽 . Sea x un elemento cualquiera de 𝕃,
entonces existen elementos k1 , . . . , kn en 𝕂 tales que x = k1 u1 +· · ·+kn un ; pa-
ra cada cada 1 ≤ i ≤ n, ki es combinación lineal de los elementos v1 , . . . , vm ,
52 · Extensiones de cuerpos

con coeficientes de 𝔽 , es decir,


m
∑︁
ki = f ji v j ,
j=1

con f ji ∈ 𝔽 . De lo anterior se desprende que


n,m
∑︁
x= f ji v j ui .
i=i , j=1

Resta probar la independencia lineal de los elementos v j ui sobre el cuerpo


𝔽 . Sean 𝜆 ij elementos de 𝔽 tales que

n
∑︁ m
©∑︁ i ª
­ 𝜆 j v j ® ui = 0,
i=1 « j=1 ¬
como mj=1 𝜆 ij v j ∈ 𝕂 y {u1 , . . . , un } es la base de 𝕃 sobre 𝕂, entonces para
Í

cada 1 ≤ i ≤ n se tiene que mj=1 𝜆 ij v j = 0, pero como {v1 , . . . , vm } es una


Í

𝔽 -base de 𝕂, entonces 𝜆 ij = 0 para 1 ≤ i ≤ n y 1 ≤ j ≤ m. Ahora es evidente


que [𝕃 : 𝔽 ] = [𝕃 : 𝕂] [𝕂 : 𝔽 ]. ✓

Corolario 2.1.5. Sea 𝕃 una extensión de 𝕂 y sea 𝕂 una extensión de 𝔽 . Si 𝕃


es una extensión finita de 𝔽 , entonces 𝕃 es una extensión finita de 𝕂 y 𝕂 es una
extensión finita de 𝔽 . Además, [𝕃 : 𝔽 ] = [𝕃 : 𝕂] [𝕂 : 𝔽 ].

Demostración. Como 𝕃 y 𝕂 son espacios vectoriales sobre 𝔽 bajo las mismas


operaciones y 𝕂 ⊂ 𝕃, entonces 𝕂 es un subespacio de 𝕃. Esto implica que
[𝕂 : 𝔽 ] < ∞. De otra parte, cada conjunto de elementos de 𝕃 que sea
linealmente independiente sobre 𝕂 es también linealmente independiente
sobre 𝔽 , pero como [𝕃 : 𝔽 ] < ∞, entonces [𝕃 : 𝕂] < ∞. La relación entre
las dimensiones se obtiene de la proposición 2.1.4. ✓

Corolario 2.1.6. Sea 𝕃 una extensión finita de 𝔽 de grado un número primo p.


Entonces no hay campos intermedios entre 𝕃 y 𝔽 .

Demostración. Sea 𝕂 un subcuerpo de 𝕃 que contiene a 𝔽 , 𝕃 ⊇ 𝕂 ⊇ 𝔽 . De


acuerdo con el corolario anterior, [𝕂 : 𝔽 ] | [𝕃 : 𝔽 ], luego [𝕂 : 𝔽 ] = 1 o
[𝕂 : 𝔽 ] = p. En el primer caso 𝕂 = 𝔽 , y en el segundo, [𝕃 : 𝕂] = 1, con lo
cual 𝕂 = 𝕃. ✓

Es claro que la intersección de subcuerpos de un cuerpo es nuevamente


un cuerpo. Se tiene entonces la siguiente noción.
Extensiones de cuerpos · 53

Definición 2.1.7. Sea 𝕃 una extensión del cuerpo 𝔽 y sea X ⊆ 𝕃. La inter-


sección de todos los subcuerpos de 𝕃 que contienen a X y a 𝔽 se denomina
la adjunción de X a 𝔽 , o también, el subcuerpo generado por X y 𝔽 :
Ù
𝔽 (X) := 𝕃 ′.
(X∪𝔽 ) ⊂𝕃′
𝕃′ es subcuerpo de 𝕃

Nótese que 𝔽 (X) es el subcuerpo más pequeño de 𝕃 que contiene a 𝔽


y a X, y es a su vez, una extensión de 𝔽 . El conjunto X se dice que es un
sistema generador de la extensión 𝔽 (X).
Definición 2.1.8. Sea 𝕃 una extensión del cuerpo 𝔽 y sea 𝛼 ∈ 𝕃. La ad-
junción 𝔽 (𝛼) se conoce como extensión simple de 𝔽 . Se dice que 𝛼 es un
elemento generador de la extensión 𝔽 (𝛼).
La siguiente proposición describe la forma de los elementos de 𝔽 (𝛼).
Proposición 2.1.9. Sea 𝕃 una extensión del cuerpo 𝔽 y sea 𝛼 ∈ 𝕃. Entonces,
 
p(𝛼) p(𝛼)
𝔽 (𝛼) = | p(x), q(x) ∈ 𝔽 [x], q(𝛼) ≠ 0 , con := p(𝛼)q(𝛼) −1 .
q(𝛼) q(𝛼)
Demostración. Sea A el conjunto de fracciones descritos en el enunciado. Es
obvio que A es un subcuerpo de 𝕃 que contiene a 𝔽 y 𝛼, luego A ⊇ 𝔽 (𝛼).
Ahora, si 𝕃 ′ es un subcuerpo de 𝕃 que contiene a 𝔽 y 𝛼, entonces clara-
mente 𝕃 ′ contiene cualquier expresión polinómica en 𝛼 con coeficientes en
𝔽 , y también cualquier cociente de tales expresiones polinómicas, es decir,
𝕃 ′ ⊇ A. Por lo tanto, 𝔽 (𝛼) = 𝕃 ′ ⊇ A. ✓
Ñ

Observación 2.1.10. (i) Sea 𝕃 una extensión del cuerpo 𝔽 y sean


𝛼1 , . . . , 𝛼n ∈ 𝕃; razonando como en la demostración de la proposición an-
terior encontramos que el subcuerpo generado por 𝔽 y 𝛼1 , . . . , 𝛼n es des-
crito por

𝔽 (𝛼1 , . . . , 𝛼n )
 
p(𝛼1 , . . . , 𝛼n )
= | p, q ∈ 𝔽 [x1 , . . . , xn ], q(𝛼1 , . . . , 𝛼n ) ≠ 0 .
q(𝛼1 , . . . , 𝛼n )
(ii) Al final del capítulo volveremos a considerar las adjunciones de la forma
𝔽 (𝛼1 , . . . , 𝛼n ) en el tema de dependencia e independencia algebraica.
Las extensiones simples pueden ser clasificadas en dos tipos: algebraicas
y trascendentes. Para las primeras, veremos que la forma de sus elementos
dada en la proposición anterior se puede simplificar notablemente. Si 𝔽 es
un cuerpo, entonces denotaremos por 𝔽 (x) el cuerpo de fracciones de 𝔽 [x].
54 · Extensiones de cuerpos

Definición 2.1.11. Sea 𝕃 una extensión de 𝔽 y sea 𝛼 ∈ 𝕃. Se dice que 𝛼 es


algebraico sobre 𝔽 si existe un polinomio no nulo f (x) ∈ 𝔽 [x] tal que 𝛼 es
raíz de f (x). En caso contrario, se dice que 𝛼 es trascendente sobre 𝔽 .

Teorema 2.1.12. Sea 𝕃 una extensión de 𝔽 y 𝛼 ∈ 𝕃.

(i) Si 𝛼 es algebraico sobre 𝔽 , entonces existe un único polinomio f (x) ∈ 𝔽 [x]


que satisface las siguientes condiciones: f (𝛼) = 0, f (x) es de grado mínimo,
mónico, irreducible y 𝔽 (𝛼)  𝔽 [x]/⟨ f (x)⟩. Además, si h(x) ∈ 𝔽 [x] es
tal que h(𝛼) = 0, entonces f (x) | h(x). El polinomio f (x) se denomina el
polinomio mínimo de 𝛼 y el entero n se denomina el grado de 𝛼 sobre 𝔽 .

(ii) Si 𝛼 es trascendente sobre 𝔽 , entonces 𝔽 (𝛼)  𝔽 (x).

Demostración. (i) Sea p(x) ∈ 𝔽 [x] un polinomio no nulo tal que p(𝛼) = 0;
sea A := {p(x) ∈ 𝔽 [x] | p(𝛼) = 0, p(x) ≠ 0}. Entonces A ≠ ∅, y sea f (x)
un polinomio de grado mínimo de A; nótese que f (x) se puede tomar mó-
nico. Es claro que gr( f (x)) ≥ 1. Probemos que f (x) es irreducible sobre
𝔽 [x]. Supóngase que existen p(x), q(x) en 𝔽 [x] tales que f (x) = p(x)q(x).
Mediante el homomorfismo evaluación 𝜑𝛼 : 𝔽 [x] −→ 𝕃 obtenemos que
f (𝛼) = p(𝛼)q(𝛼) =0. Si suponemos que p(x) y q(x) son no constantes, en-
tonces, teniendo en cuenta que gr( f (x)) = gr(p(x)) +gr(q(x)), se contradice
la escogencia de f (x). Por lo tanto, alguno, p(x) o q(x), es constante, y así,
f (x) es irreducible.
Notemos que Im(𝜑𝛼 ) = 𝔽 [𝛼], es decir, Im(𝜑𝛼 ) es el menor subanillo de
𝕃 que contiene a 𝔽 y 𝛼, y consta de todas las expresiones polinómicas en
𝛼 con coeficientes en 𝔽 ; además, ker(𝜑𝛼 ) = ⟨ f (x)⟩. En efecto, es claro que
⟨ f (x)⟩ ⊆ ker(𝜑𝛼 ); sea p(x) ∈ ker(𝜑𝛼 ), existen q(x), r (x) en 𝔽 [x] tales que

p(x) = q(x) f (x) + r (x), con r (x) = 0, ó, gr(r (x)) < gr( f (x)).

Resulta, p(𝛼) = q(𝛼) f (𝛼) +r (𝛼) = 0+r (𝛼) = 0. Por la escogencia de f (x) se
tiene que r (x) = 0, con lo cual p(x) ∈ ⟨f (x)⟩. Por el teorema fundamental
de homomorfismo para anillos se tiene que 𝔽 [𝛼]  𝔽 [x]/⟨f (x)⟩. Como
f (x) es irreducible entonces 𝔽 [𝛼] es un cuerpo. Adicionalmente, notemos
que 𝔽 [𝛼] ⊆ 𝔽 (𝛼), pero 𝔽 [𝛼] contiene a 𝔽 y 𝛼, por lo tanto, 𝔽 (𝛼) ⊆ 𝔽 [𝛼],
luego 𝔽 [𝛼] = 𝔽 (𝛼).
Veamos ahora la unicidad de f (x). Sea g (x) otro polinomio mónico de
grado n tal que g (𝛼) = 0; por el algoritmo de la división se tiene que

f (x) = q(x)g (x) + r (x), con r (x) = 0, ó, gr(r (x)) < gr(g (x)),
Extensiones de cuerpos · 55

resulta f (𝛼) = 0 = q(𝛼)g (𝛼) + r (𝛼) = r (𝛼), y de minimalidad de n se tiene


que r (x) = 0. Por lo tanto, g (x)| f (x), pero f (x) es irreducible, luego f (x)
y g (x) son asociados, y como ambos son mónicos, entonces g (x) = f (x).
Para la última afirmación de este numeral aplicamos nuevamente el al-
goritmo de la división:

h(x) = c(x) f (x) + s(x), con s(x) = 0, ó, gr(s(x)) < n,

resulta h(𝛼) = 0 = c(𝛼) f (𝛼) + s(𝛼), por la minimalidad de n se tiene que


s(x) = 0.
(ii) Si 𝛼 es trascendente, entonces 𝜑𝛼 es inyectivo, luego 𝔽 [x]  𝔽 [𝛼], y
entonces, el cuerpo de fracciones de 𝔽 [x] es isomorfo al cuerpo de fraccio-
nes de 𝔽 [𝛼], es decir, 𝔽 (𝛼)  𝔽 (x). ✓

Corolario 2.1.13. Sea 𝕃 una extensión de 𝔽 y sea 𝛼 ∈ 𝕃 un elemento algebraico


de grado n ≥ 1 sobre 𝔽 . Entonces,
( n−1 )
∑︁
k
(i) 𝔽 (𝛼) = ak 𝛼 | ak ∈ 𝔽 .
k=0

(ii) {1, 𝛼 , . . . , 𝛼 n−1 } es una base de 𝔽 (𝛼) y [𝔽 (𝛼) : 𝔽 ] = n.

(iii) Si 𝛽 ∈ 𝔽 es tal que [𝔽 ( 𝛽 ) : 𝔽 ] = m ≥ 1, entonces 𝛽 es algebraico de grado


m.

Demostración. (i) Denotemos


( n−1 )
∑︁
S := ak 𝛼 k | ak ∈ 𝔽 .
k=0

En la demostración del teorema 2.1.12 vimos que Im(𝜑𝛼 ) = 𝔽 [𝛼] = 𝔽 (𝛼).


Es obvio que S ⊆ 𝔽 (𝛼). Ahora sea a = a0 + a1 𝛼 + · · · + am 𝛼 m un elemento
cualquiera de 𝔽 (𝛼) y sea p(x) = a0 + a1 x + · · · + am x m ∈ 𝔽 [x]. Sea f (x) el
polinomio mínimo de 𝛼, se tiene

p(x) = q(x) f (x) + r (x), con gr(r (x)) < gr( f (x)), ó, r (x) = 0.

Aplicando 𝜑𝛼 encontramos que

a = p(𝛼) = q(𝛼) f (𝛼) + r (𝛼) = r (𝛼) = r0 + r1 𝛼 + · · · + rn−1 𝛼 n−1 ∈ S.

Por lo tanto, 𝔽 (𝛼) ⊆ S y entonces 𝔽 (𝛼) = S.


56 · Extensiones de cuerpos

(ii) Según (i), {1, 𝛼 , . . . , 𝛼 n−1 } es un sistema de generadores de 𝔽 (𝛼);


sea ahora 0 = a0 + a1 𝛼 + · · · + an−1 𝛼 n−1 , con ai ∈ 𝔽 , 1 ≤ i ≤ n − 1, entonces
n−1
∑︁
0= ak 𝛼 k ,
k=0

luego 𝛼 es raíz de
n−1
∑︁
t(x) := ak x k
k=0
con lo cual t(x) = 0, es decir, ai = 0 para cada 0 ≤ i ≤ n − 1. Resulta,
[𝔽 (𝛼) : 𝔽 ] = n.
(iii) Si 𝛽 no es algebraico, entonces 𝛽 es trascendente, y por el teore-
ma 2.1.12, 𝔽 ( 𝛽 )  𝔽 (x). Esto implica que [𝔽 ( 𝛽 ) : 𝔽 ] = ∞: en efecto,
𝔽 [x] ⊂ 𝔽 (x) y {1, x, x 2 , . . . } es un conjunto infinito de 𝔽 [x] linealmente
independiente sobre 𝔽 . Así, 𝛽 es algebraico, y como vimos en (ii), [𝔽 ( 𝛽 ) : 𝔽 ]
es el grado del polinomio mínimo de 𝛽 , es decir, el grado de 𝛽 . ✓

Pasamos ahora a considerar la “igualdad” de las extensiones simples.


Definición 2.1.14. Sean 𝕃 y 𝕃 ′ dos extensiones del cuerpo 𝔽 .
(i) Se dice que 𝕃 es equivalente a 𝕃 ′ respecto a 𝔽 si existe un isomorfismo
de anillos h : 𝕃 −→ 𝕃 ′ que deja fijos los elementos de 𝔽 , es decir,
𝕃(a) = a, para cada a ∈ 𝔽 . Se dice que h es una equivalencia.

(ii) Sean 𝔽 (𝛼) y 𝔽 ( 𝛽 ) dos extensiones simples de 𝔽 . Se dice que 𝔽 (𝛼) y


𝔽 ( 𝛽 ) son conjugadas respecto a 𝔽 si existe una equivalencia
h : 𝔽 (𝛼) −→ 𝔽 ( 𝛽 ) tal que h(𝛼) = 𝛽 . En tal caso 𝛼 y 𝛽 se dicen
conjugados respecto a 𝔽 .
Proposición 2.1.15. Sea 𝕃 una extensión de 𝔽 y sean 𝛼 , 𝛽 ∈ 𝕃. Entonces,
(i) Dos extensiones simples trascendentes de 𝔽 , 𝔽 (𝛼) y 𝔽 ( 𝛽 ), son siempre con-
jugadas.

(ii) Dos extensiones simples algebraicas de 𝔽 , 𝔽 (𝛼) y 𝔽 ( 𝛽 ), son conjugadas si,


y sólo si, 𝛼 y 𝛽 tienen el mismo polinomio mínimo.
Demostración. (i) Según la prueba de (ii) del teorema 2.1.12 se tienen los
isomorfismos

𝔽 (𝛼)  𝔽 (x)  𝔽 ( 𝛽 )
p(𝛼) p(x) p( 𝛽 )
↦−→ ↦−→ ,
q(𝛼) q(x) q( 𝛽 )
Extensiones de cuerpos · 57

y la compuesta de éstos deja fijo los elementos de 𝔽 y envía 𝛼 en 𝛽 .


(ii) ⇒): sean 𝔽 (𝛼) y 𝔽 ( 𝛽 ) dos extensiones simples algebraicas conjugadas
con polinomios mínimos f (x) = a0 + a1 x +· · ·+x n y g (x) = b0 +b1 x +· · ·+x m ,
respectivamente. Sea h : 𝔽 (𝛼) −→ 𝔽 ( 𝛽 ) el isomorfismo tal que h(a) = a
para cada a ∈ 𝔽 y h(𝛼) = 𝛽 . Se tiene f (𝛼) = a0 + a1 𝛼 + · · · + 𝛼 n = 0, luego

h( f (𝛼)) = h(0) = a0 + a1 𝛽 + · · · + 𝛽 n = 0,

y por el corolario 2.1.13, se tiene que f (x) | g (x). Análogamente, probamos


que g (x) | f (x); pero como f (x) y g (x) son mónicos, entonces f (x) = g (x).
⇐) : sean 𝔽 (𝛼) y 𝔽 ( 𝛽 ) extensiones simples algebraicas con polinomios
mínimos iguales de grado n, entonces
( n−1 ) ( n−1 )
∑︁ ∑︁
𝔽 (𝛼) = ak 𝛼 k | ak ∈ 𝔽 y 𝔽 ( 𝛽 ) = ak 𝛽 k | ak ∈ 𝔽 .
k=0 k=0

Definimos

h : 𝔽 (𝛼) −→ 𝔽 ( 𝛽 ),
n−1 n−1
!
∑︁ ∑︁
h ak 𝛼 k := ak 𝛽 k ;
k=0 k=0

es fácil probar que h es un homomorfismo de anillos; h es claramente biyec-


tivo; además, h(a) = a para cada a ∈ 𝔽 , y también, h(𝛼) = 𝛽 . ✓

Las extensiones simples de un cuerpo 𝔽 , tanto algebraicas como trascen-


dentes, fueron definidas en el contexto de un cuerpo extensión 𝕃. Quere-
mos ahora mirar a 𝔽 como cuerpo independiente y demostrar que existen
extensiones algebraicas y trascendentes de 𝔽 . Estas extensiones son nuevos
cuerpos construidos únicamente a partir del cuerpo 𝔽 .

Proposición 2.1.16. Sea 𝔽 un cuerpo cualquiera. Entonces, existe al menos una


extensión trascendente simple y al menos una extensión algebraica simple de 𝔽 .

Demostración. El cuerpo 𝔽 (x) de fracciones de 𝔽 [x] contiene a 𝔽 mediante


la inyección canónica 𝜄 : 𝔽 −→ 𝔽 (x), 𝜄(a) := 1a , es decir, podemos consi-
derar que 𝔽 (x) es una extensión de 𝔽 . La fracción x = 1x es un elemento
trascendente de 𝔽 (x) respecto a 𝔽 . En efecto, si a0 + a1 x + · · · + an x n = 0,
entonces necesariamente ai = 0, para cada 0 ≤ i ≤ n.
Probemos ahora la existencia de extensiones simples algebraicas. Sea
f (x) un polinomio irreducible de 𝔽 [x] de grado n ≥ 1. Entonces, el cocien-
te 𝔽 [x]/⟨f (x)⟩ es un cuerpo. Veamos que 𝕃 := 𝔽 [x]/⟨ f (x)⟩ es un cuerpo
58 · Extensiones de cuerpos

que contiene a 𝔽 :

𝜄 : 𝔽 −→ 𝕃
a ↦−→ a := a + ⟨ f (x)⟩;

𝜄 es claramente un homomorfismo inyectivo. Sea 𝛼 := x = x + ⟨ f (x)⟩ y sea


f (x) = a0 + a1 x + · · · + an x n , entonces f (x) = a0 + a1 x + · · · + a n x n = 0, luego
0 = a0 + a1 𝛼 + · · · + an 𝛼 n (considerando 𝔽 ⊂ 𝕃), es decir, 𝛼 es algebraico
sobre 𝔽 . Sea g (x) el polinomio mínimo de 𝛼. Entonces,

f (x) = q(x)g (x) + r (x), con r (x) = 0, ó, gr(r (x)) < gr(g (x)),

resulta f (𝛼) = 0 = q(𝛼)g (𝛼) + r (𝛼) = r (𝛼) = 0, con lo cual r (x) = 0, y


de esta manera, f (x) = q(x) g (x), pero como f (x) es irreducible entonces
q(x) = q0 ∈ 𝔽 − {0}. Se tiene entonces que

𝔽 (𝛼)  𝔽 [x]/⟨g (x)⟩ = 𝔽 [x]/⟨ f (x)⟩ = 𝕃,

es decir, 𝕃  𝔽 (𝛼) es una extensión simple algebraica de 𝔽 . ✓


El siguiente resultado establece que, dado un cuerpo 𝔽 y f (x) ∈ 𝔽 [x] un


polinomio no constante, existe al menos un cuerpo extensión 𝕃 de 𝔽 en el
cual f (x) tiene por lo menos una raíz.

Corolario 2.1.17 (Teorema de Kronecker) . Sea 𝔽 un cuerpo y sea f (x) ∈


𝔽 [x] de grado ≥ 1. Entonces, existe una extensión 𝕃 de 𝔽 y un elemento 𝛼 ∈ 𝕃 tal
que f (𝛼) = 0. Además, [𝕃 : 𝔽 ] ≤ gr( f (x)).

Demostración. Si f (x) es irreducible de 𝔽 [x], entonces, según vimos en la


proposición anterior, podemos tomar

𝕃 = 𝔽 [x]/⟨ f (x)⟩ y 𝛼 = x = x + ⟨ f (x)⟩.

Aquí [𝕃 : 𝔽 ] = gr( f (x)).


Si f (x) es reducible, entonces sea p(x) uno cualquiera de los factores
irreducibles de la descomposición de f (x). Nuevamente, tomamos

𝕃 = 𝔽 [x]/⟨p(x)⟩ y 𝛼 = x = x + ⟨p(x)⟩ ;

en este caso [𝕃 : 𝔽 ] = gr(p(x)) ≤ gr( f (x)). ✓


Veamos ahora algunos ejemplos ilustrativos.


Extensiones de cuerpos · 59

Ejemplo 2.1.18. (i) El complejo 𝛼 = i es algebraico sobre ℝ y su polinomio


mínimo es x 2 + 1, luego ℂ = ℝ(i) es una extensión simple algebraica de ℝ
de grado 2 y [ℂ : ℝ] √5 = 2.
(ii) El real 𝛼 = 3 es algebraico sobre ℚ. Determinemos su polinomio
mínimo f (x) y su grado: se tiene que 𝛼 5 − 3 = 0, luego 𝛼 es raíz de p(x) =
x 5 − 3. Según el corolario 2.1.13 (i), f (x) | p(x), pero por el criterio de
Eisenstein, p(x) es √irreducible sobre ℚ, por lo tanto f (x) = p(x) y el grado
5
de 𝛼 es 5. Así, [ℚ( 3) : ℚ] = 5.
2𝜋i
(iii) El complejo 𝛼 = e 5 es algebraico sobre ℚ. En efecto, 𝛼 5 = e 2𝜋i = 1,
luego 𝛼 es raíz de p(x) = x 5 − 1 = (x − 1)(x 4 + x 3 + x 2 + x + 1). Calculemos su
polinomio mínimo y su grado: el polinomio x 4 +x 3 +x 2 +x+1 es ciclotómico,
luego irreducible sobre ℚ (proposición 1.4.13), por lo tanto, el polinomio
mínimo de 𝛼 es x 4 + x 3 + x 2 + x + 1 y su grado es 4. Se tiene entonces que
[ℚ(𝛼) : ℚ] = 4.

Ejemplo 2.1.19. Para cada uno de los complejos dados a continuación,


determinemos √su polinomio mínimo √ sobre ℚ y su grado.
(i) 𝛼 = 1 + 2. Tenemos 𝛼 − 1 = 2, luego 𝛼 2 − 2𝛼 − 1 = 0, y de esta
manera, 𝛼 es raíz de p(x) = x 2 − 2x − 1. Si 𝛼 fuese raíz de un polinomio
mónico de menor grado, entonces 𝛼 sería racional, por lo que p(x) √es el
polinomio mínimo de 𝛼. Se tiene entonces que gr(𝛼) = 2 y [ℚ(1 + 2) :
ℚ] = 2.
√ √ √ √
(ii) 𝛼 = 2+ 3. Se tiene que 𝛼 2 = 2+2 6+3, con lo cual 𝛼 2 −5 = 2 6,
es decir, 𝛼 4 − 10𝛼 2 + 25 = 24 y por lo tanto, 𝛼 4 − 10𝛼 2 + 1 = 0. Veamos que
el polinomio mínimo de 𝛼 es p(x) = x 4 − 10x 2 + 1. Para esto, probemos
que p(x) es irreducible sobre ℚ.
Si p(x) es factorizable sobre ℚ, entonces puede serlo en 4 factores linea-
les, ó en 2 cuadráticos, ó en 1 cuadrático y 2 lineales, ó en uno cúbico y otro
lineal. Los casos anteriores se reducen de todos modos a 2 cuadráticos, ó a
uno cúbico y otro lineal.
Caso 1, dos factores cuadráticos:

x 4 − 10x 2 + 1 = (x 2 + bx + c) (x 2 + dx + e)
= x 4 + (b + d)x 3 + (e + bd + c)x 2 + (be + cd)x + ce,

de donde b + d = 0, e + bd + c = −10, be + cd = 0, ce = 1, y por tanto


1
b + c(−b) = 0 ⇒ b − bc 2 = 0 ⇒ (b = 0, o , c = 1, o, c = −1).
c
Así,
1
b = 0 ⇒ e + c = −10 ⇒ c + c = −10 ⇒ 1 + c 2 + 10c = 0 ⇒ c ∉ ℚ, falso;
60 · Extensiones de cuerpos

b ≠ 0, c = 1 ⇒ e = 1 ⇒ b 2 = 12, falso;
b ≠ 0, c = −1 ⇒ e = −1 ⇒ b 2 = 8, falso.
Caso 2, un factor lineal y otro cúbico: en este caso p(x) tendrá una raíz en
ℚ, y al ser mónico, tendrá también una raíz m en ℤ, con m | 1 (proposición
1.4.14), luego m = ±1, pero p(±1) ≠ 0.
√ √
De lo anterior concluimos que p(x) es irreducible y [ℚ( 2 + 3) : ℚ)] =
4.
(iii) 𝛼 = 1 + i. Tenemos 𝛼 − 1 = i, de donde 𝛼 2 − 2𝛼 + 2 = 0, luego
p(x) = x 2 −2x+2 es el polinomio mínimo de 𝛼 ya que es irreducible (criterio
de Eisenstein). Así, [ℚ(i + 1) : ℚ] = 2.
√︁ √3 √3
(iv) 1 + 2 = 𝛼. En este caso tenemos 1 + 2 = 𝛼 2 , de donde

2 = (𝛼 2 − 1) 3 = (𝛼 4 − 2𝛼 2 + 1)(𝛼 2 − 1) = 𝛼 6 − 3𝛼 4 + 3𝛼 2 − 1.

Entonces, 𝛼 es raíz de p(x) = x 6 − 3x 4 + 3x 2 − 3, √︁el cual, según el criterio


√3
de Eisenstein, es irreducible sobre ℚ. Resulta, [ℚ( 1 + 2 : ℚ)] = 6.
√︁ √ √3
3
(v) 𝛼 = 2 − 1. Elevando al cuadrado encontramos que 𝛼 2 = 2 − 1,
de donde (𝛼 2 + 1) 3 = 2, y así, 𝛼 6 + 3𝛼 4 + 3𝛼 2 − 1 = 0.
Probemos que p(x) = x 6 + 3x 4 + 3x 2 − 1 es irreducible sobre ℚ. p(x) no
tiene factores lineales, de lo contrario p(±1) = 0, lo cual es falso. p(x) tiene
entonces o dos factores cúbicos o un factor cuadrático y otro de grado 4.
Caso 1, dos factores cúbicos: entonces,

x 6 + 3x 4 + 3x 2 − 1 = (x 3 + ax 2 + bx + c)(x 3 + a ′ x 2 + b ′ x + c ′);
a ′ + a = 0, b ′ + aa ′ + b = 3, c ′ + ab ′ + ba ′ + c = 0,
ac ′ + bb ′ + ca ′ = 3, bc ′ + cb ′ = 0, cc ′ = −1.

Por la proposición 1.4.5, se puede suponer que p(x) tiene la anterior des-
composición en ℤ[x], por lo tanto,

c = 1, c ′ = −1 ⇒ −b + b ′ = 0 ⇒ −a + b 2 − a = 3 = b − a 2 + b
⇒ b 2 − 2a = 2b − a2 ⇒ b 2 − 2a + a 2 − 2b = 0
⇒ (b − 1) 2 + (a − 1) 2 = 2
⇒ (b − 1 = 1, a − 1 = 1) o (b − 1 = 1, a − 1 = −1)
o (b − 1 = −1, a − 1 = 1) o (b − 1 = −1, a − 1 = −1).

Así,
b = 2, a = 2 ⇒ 2 + 2(−2) + 2 = 3, falso;
b = 2, a = 0 ⇒ 2 + 0 + 2 = 3, falso;
Extensiones de cuerpos · 61

b = 0, a = 2 ⇒ 0 + 2(−2) + 0 = 3, falso;
b = 0, a = 0 ⇒ 0 + 0 + 0 = 3, falso.
Caso 2, un factor cuadrático y otro de grado 4: nuevamente en ℤ[x],
x 6 + 3x 4 + 3x 2 − 1 = (x 4 + ax 3 + bx 2 + cx + d)(x 2 + a ′ x + b ′);
a ′ + a = 0, b ′ + aa ′ + b = 3, ab ′ + ba ′ + c = 0,
bb ′ + ca ′ + d = 3, cb ′ + da ′ = 0, db ′ = −1;
de la última identidad surgen dos opciones:
d = 1, b ′ = −1 ⇒ a ′ = c ⇒ −b + c 2 + 1 = 3
⇒ c 2 − b = 2, −1 − c 2 + b = 3
⇒ b − c 2 = 4 ⇒ 2 = −4, falso;
d = −1, b ′ = 1 ⇒ a ′ = c ⇒ b + c 2 − 1 = 3
⇒ b + c 2 = 4, 1 − c 2 + b = 3 ⇒ b − c 2 = 2
3
⇒ 2b = 6 ⇒ b = , falso.
2
√︁ √ que p(x) es irreducible sobre ℤ, y por lo tanto,
Todo lo anterior prueba
3
sobre ℚ. Además, [ℚ( 2 − 1) : ℚ] = 6.
Los ejemplos anteriores han permitido evidenciar que existen números
reales, no racionales, que son algebraicos sobre ℚ, por ejemplo,
√ √ √ √3
√︃
2, 2 + 3, 2 − 1.
Queremos ahora demostrar un teorema de George Cantor que establece la
existencia de números reales trascendentes sobre ℚ.
Teorema 2.1.20 (Teorema de Cantor) . Existen números reales trascendentes
sobre ℚ.

Demostración. Sea A el conjunto de los números reales que son algebraicos


sobre ℚ; se sabe que el anillo ℚ [x] es enumerable, con lo cual ℚ [x] − ℚ es
también enumerable, y así, podemos escribir ℚ [x]−ℚ = { f1 (x), f2 (x), . . . }.
Para cada n ≥ 1, sea Bn := {a ∈ ℝ | fn (a) = 0}; Bn es finito, y por lo tanto,
Ð
enumerable. Puesto que A = n ≥1 Bn , entonces A es enumerable, y por lo
tanto, ℝ no está contenido en A. Así, existen reales que no son algebraicos
sobre ℚ. ✓

Ejemplo 2.1.21. Ejemplos notables de números reales trascendentes sobre


ℚ son e y 𝜋. Las pruebas clásicas de estos hechos son analíticas y se pueden
consultar, por ejemplo, en [38].
62 · Extensiones de cuerpos

2. Extensiones algebraicas
Sea 𝕃 una extensión de 𝔽 y sea 𝛼 un elemento de 𝕃. Hemos dicho que 𝛼
es algebraico sobre 𝔽 si 𝛼 es raíz de un polinomio no nulo de 𝔽 [x]. Nos
proponemos estudiar aquellas extensiones 𝕃 de 𝔽 tales que cada elemento
de 𝕃 es algebraico sobre 𝔽 .

Definición 2.2.1. Se dice que la extensión 𝕃 de 𝔽 es algebraica si cada


elemento de 𝕃 es algebraico sobre 𝔽 .

Teorema 2.2.2. Sea 𝔽 un cuerpo.

(i) Cada extensión finita 𝕃 de 𝔽 es algebraica y es el resutado de adjuntar un


número finito de elementos algebraicos de 𝕃 a 𝔽 .

(ii) Recíprocamente, cada extensión de 𝔽 , resultado de adjuntar un número finito


de elementos algebraicos sobre 𝔽 , es finita, y por lo tanto, algebraica.

Demostración. (i) Sea 𝕃 una extensión finita del cuerpo 𝔽 , digamos de grado
n = [𝕃 : 𝔽 ]. Sea 𝛼 un elemento cualquiera de 𝕃. Entonces, el conjunto de
n + 1 elementos 1, 𝛼 , . . . , 𝛼 n es linelamente dependiente, es decir, existen
elementos a0 , a1 , . . . , an en 𝔽 no todos nulos, tales que

a0 + a1 𝛼 + · · · + an 𝛼 n = 0,

luego 𝛼 es raíz del polinomio no nulo a0 + a1 x + · · · + an x n ∈ 𝔽 [x]; esto


indica que 𝛼 es algebraico sobre 𝔽 .
Sea {𝛼1 , . . . , 𝛼n } una base cualquiera del 𝔽 -espacio 𝕃. Notemos que 𝕃 es
la adjunción 𝔽 (X), donde X := {𝛼1 , . . . , 𝛼n }, es decir, 𝕃 = 𝔽 (𝛼1 , . . . , 𝛼n ).
En efecto, sea 𝕃 ′ un subcuerpo de 𝕃 que contiene a 𝔽 y a X. Entonces, 𝕃 ′ = 𝕃
y 𝔽 (X) = 𝕃.
(ii) Esta afirmación se prueba por inducción sobre el número de elemen-
tos algebraicos a adjuntar a 𝔽 .
Sea n = 1; si 𝛼 es algebraico sobre 𝔽 , entonces 𝔽 (𝛼) es una extensión
finita de 𝔽 con grado igual al grado del polinomio mínimo de 𝛼.
Supongamos que la afirmación es válida para n −1 elementos algebraicos
sobre 𝔽 . Sea J un cuerpo que contiene a 𝔽 y sean 𝛼1 , . . . , 𝛼n ∈ J elemen-
tos algebraicos sobre 𝔽 . Denotemos por 𝕃 la adjunción de los elementos
𝛼1 , . . . , 𝛼n al cuerpo 𝔽 , es decir, 𝕃 = 𝔽 (𝛼1 , . . . , 𝛼n ), y sea
𝕂 := 𝔽 (𝛼1 , . . . , 𝛼n−1 ). Nótese que 𝕃 ⊃ 𝕂 ⊃ 𝔽 . Por hipótesis de induc-
ción [𝕂 : 𝔽 ] es finito; resta probar que [𝕃 : 𝕂] es finita para concluir que
[𝕃 : 𝔽 ] es también finita (corolario 2.1.5). Pero nótese 𝕃 = 𝕂(𝛼n ) (en efecto,
Extensiones de cuerpos · 63

la colección de subcuerpos de J que contiene a 𝔽 y {𝛼1 , . . . , 𝛼n } coincide


con la colección de subcuerpos de J que contiene a 𝕂 y 𝛼n ). Como 𝛼n es
algebraico sobre 𝔽 , entonces 𝛼n es también algebraico sobre 𝕂, por lo tanto,
[𝕃 : 𝕂] es finita. ✓

Corolario 2.2.3. Sea 𝕃 una extensión de 𝕂 y sea 𝕂 una extensión algebraica de


𝔽 . Si 𝛼 ∈ 𝕃 es algebraico sobre 𝕂 entonces 𝛼 es algebraico sobre 𝔽 . En consecuencia,
si 𝕃 es una extensión algebraica de 𝕂 y 𝕂 es una extensión algebraica de 𝔽 , entonces
𝕃 es una extensión algebraica de 𝔽 .

Demostración. Sea f (x) = a0 + a1 x + · · · + an x n el polinomio mínimo de 𝛼 so-


bre 𝕂. Por el teorema anterior, 𝔽 (a0 , a1 , . . . , an ) es una extensión finita de
𝔽 ya que a0 , a1 , . . . , an ∈ 𝕂 son algebraicos sobre 𝔽 . Sea
𝔽 ′ := 𝔽 (a0 , a1 , . . . , an ), entonces f (x) ∈ 𝔽 ′ [x] y 𝛼 es algebraico sobre
𝔽 ′, con lo cual 𝔽 ′ (𝛼) es una extensión finita de 𝔽 ′. Se tiene entonces que

[𝔽 ′ (𝛼) : 𝔽 ] = [𝔽 ′ (𝛼) : 𝔽 ′] [𝔽 ′ : 𝔽 ] ,

es decir, 𝔽 ′ (𝛼) = 𝔽 (a0 , a1 , . . . , an , 𝛼) es una extensión finita de 𝔽 . Según el


teorema anterior, 𝛼 es algebraico sobre 𝔽 . □✓

Corolario 2.2.4. Sea 𝕃 una extensión de 𝔽 y sea

𝔸 := {𝛼 ∈ 𝕃 | 𝛼 es algebraico sobre 𝔽 }.

Entonces, 𝔸 es un subcuerpo de 𝕃 que contiene a 𝔽 y se denomina el cuerpo de


elementos algebraicos de 𝕃 respecto a 𝔽 .

Demostración. 𝔸 es no vacío ya que 𝔸 ⊇ 𝔽 . Sean 𝛼 , 𝛽 ∈ 𝔸, entonces


𝛼 ± 𝛽 , 𝛼 𝛽 ∈ 𝔽 (𝛼 , 𝛽 ), pero por el teorema anterior, 𝔽 (𝛼 , 𝛽 ) es una ex-
tensión algebraica de 𝔽 , con lo cual 𝛼 ± 𝛽 , 𝛼 𝛽 son algebraicos sobre 𝔽 . Lo
mismo se tiene para 𝛽 −1 , con 𝛽 ≠ 0. ✓

Corolario 2.2.5. Sea 𝕃 una extensión de 𝔽 y sean 𝛼 , 𝛽 , elementos de 𝕃 alge-


braicos sobre 𝔽 de grados m y n, respectivamente. Entonces, 𝛼 ± 𝛽 , 𝛼 𝛽 y 𝛼 𝛽 −1
(con 𝛽 ≠ 0) son algebraicos y tienen grado a lo sumo mn.

Demostración. Según vimos en la demostración del teorema 2.2.2,

[𝔽 (𝛼 , 𝛽 ) : 𝔽 ] = [𝔽 ( 𝛽 ) (𝛼) : 𝔽 ( 𝛽 )] [𝔽 ( 𝛽 ) : 𝔽 ].

Como 𝛼 es algebraico de grado m sobre 𝔽 , entones 𝛼 es raíz de un polinomio


de grado m con coeficientes en 𝔽 , y por lo tanto, 𝛼 es raíz al menos de este
64 · Extensiones de cuerpos

polinomio considerado como de coeficientes de 𝔽 ( 𝛽 ), es decir, el grado de


𝛼 sobre 𝔽 ( 𝛽 ) es máximo m. De esto resulta

[𝔽 (𝛼 , 𝛽 ) : 𝔽 ] = [𝔽 ( 𝛽 ) (𝛼) : 𝔽 ( 𝛽 )] [𝔽 ( 𝛽 ) : 𝔽 ] ≤ mn.

Puesto que 𝛼 ± 𝛽 , 𝛼 𝛽 , 𝛼 𝛽 −1 ∈ 𝔽 (𝛼 , 𝛽 ), entonces

𝔽 (𝛼 ± 𝛽 ), 𝔽 (𝛼 𝛽 ), 𝔽 (𝛼 𝛽 −1 ) ⊆ 𝔽 (𝛼 , 𝛽 ),

con lo cual [𝔽 (𝛼 ± 𝛽 ) : 𝔽 ] , [𝔽 (𝛼 𝛽 ) : 𝔽 ], [𝔽 (𝛼 𝛽 −1 ) : 𝔽 ] ≤ mn. ✓


Observación 2.2.6. Sea 𝕃 una extensión de 𝔽 ; cuando hablamos del cuerpo


de elementos algebraicos de 𝕃 hacemos referencia a un subcuerpo fijo 𝔽 . Si
cambiamos el subcuerpo 𝔽 , entonces el cuerpo de elementos algebraicos de
𝕃 relativo a este nuevo subcuerpo puede cambiar.

3. El cuerpo de los números algebraicos


Definición 2.3.1. Los elementos de ℂ algebraicos sobre ℝ conforman el
cuerpo de los números algebraicos y se denota por 𝔸.

Según el corolario 2.2.4, el cuerpo de números algebraicos es un sub-


cuerpo de ℂ que contiene a ℝ.

Definición 2.3.2. Un complejo se dice que es entero algebraico si es raíz


de un polinomio mónico con coeficientes enteros.

Para la prueba del siguiente teorema utilizaremos algunos elementos bá-


sicos de teoría de módulos y álgebra lineal sobre anillos conmutativos (véase
[24] y [25]).

Teorema 2.3.3. El conjunto 𝔼 de enteros algebraicos es un subanillo de ℂ.

Demostración. Paso 1. Sean R ⊆ S anillos conmutativos y sea 𝛼 ∈ S; se dice


que 𝛼 es entero sobre R si 𝛼 es raíz de un polinomio mónico con coeficientes
en R.
Afirmación: Las siguientes condiciones son equivalentes:

(i) 𝛼 es entero sobre R.

(ii) El subanillo de S generado por R y 𝛼, R[𝛼], es un R-módulo finita-


mente generado.

(iii) R[𝛼] está contenido en un subanillo R ′ de S tal que R ′ es finitamente


generado como R-módulo.
Extensiones de cuerpos · 65

(iv) Existe un R [𝛼]-módulo M el cual es fiel, es decir, AnnR [𝛼 ] (M) = 0 y


M es finitamente generado como R-módulo.

Demostremos la afirmación:
(i) ⇒(ii): sea p(x) := p0 + p1 x +· · ·+ pn−1 x n−1 + x n ∈ R[x] tal que p(𝛼) = 0;
recordemos que cada elemento de R[𝛼] es de la forma q(𝛼) con q(x) en
R [x], pero como p(x) es mónico podemos hacer división con resíduo y
obtenemos que R [𝛼] es generado como R-módulo por {1, 𝛼 , . . . , 𝛼 n−1 }.
(ii) ⇒(iii): basta tomar R ′ = R [𝛼].
(iii) ⇒(iv): R ′ es un R[𝛼]-módulo; sea q(𝛼) ∈ R[𝛼] de tal forma que
q(𝛼)r ′ para cada r ′ ∈ R ′, entonces en particular q(𝛼)1 = q(𝛼) = 0, esto dice
que M := R ′ es R [𝛼]-fiel.
(iv) ⇒(i): M es no nulo ya que de lo contrario el anulador sería todo R[𝛼];
sea {z1 , . . . , zt } un conjunto de R-generadores de M; puesto que 𝛼M ⊆ M,
entonces existen ci j ∈ R tales que 𝛼zi = ci1 z1 + · · · + cit zt , 1 ≤ i ≤ t; sea
C := [ci j ] ∈ Mt (R), entonces se tiene el sistema
 T
(C − 𝛼E) z1 · · · zt = 0,

donde E es la matriz idéntica de orden t. Multiplicando a izquierda por la


adjunta de C − 𝛼E entontramos mediante la regla de Cramer que

pC (𝛼) 0  z1 


  .. 

 ..   .  = 0,

 .  
 0
 pC (𝛼)   zt 

donde pC (𝛼) es el polinomio característico de C; resulta, pC (𝛼)zi = 0 para


cada i, y entonces, pC (𝛼) ∈ AnnR [𝛼 ] (M) = 0, es decir, pC (𝛼) = 0 y así 𝛼 es
entero sobre R.
Paso 2. Sea E el conjunto de elementos de S que son enteros sobre R;
veamos que E es un subanillo de S que contiene a R. En primer lugar es
claro que E no es vacío ya que contiene a R. Sean 𝛼 , 𝛽 ∈ E, entonces 𝛼 es
entero sobre R y 𝛽 es entero sobre R[𝛼], y por lo tanto, existen elementos
s1 , . . . , sn , s1′ , . . . , sm′ ∈ S tales que R[𝛼] = Rs1 + · · · + Rsn y
n,m
∑︁
R[𝛼] [ 𝛽 ] = R [𝛼]s1′ + · · · + R [𝛼]sm′ = Rsi s ′j .
i, j

Así, R ′ := R [𝛼 , 𝛽 ] = R [𝛼] [ 𝛽 ] es un subanillo de S que es finitamente


generado como R-módulo y es tal que R [𝛼 ± 𝛽 ], R[𝛼 𝛽 ] ⊆ R ′. Según el
paso 1 se tiene que 𝛼 ± 𝛽 , 𝛼 𝛽 ∈ A. ✓

66 · Extensiones de cuerpos

Ejemplo 2.3.4. Sea 𝛼 ∈ ℂ algebraico sobre ℚ y sea p(x) ∈ ℚ[x] su polino-


mio mínimo. Notemos que 𝛼 es entero algebraico si, y sólo si, p(x) ∈ ℤ[x].
⇐): es claro que si p(x) ∈ ℤ[x], entonces 𝛼 es entero algebraico.
⇒): sea 𝛼 entero algebraico y sea z(x) ∈ ℤ[x] mónico tal que
z(𝛼) = 0; podemos elegir z(x) con grado mínimo. Se tiene que z(x) es
múltiplo de p(x), es decir, existe q(x) ∈ ℚ[x] tal que z(x) = p(x)q(x). Se-
gún la demostración de la proposición 1.4.8, existen polinomios enteros
mónicos p ′′ (x), q ′′ (x) tales que
z(x) = p ′′ (x)q ′′ (x), con gr(p ′′ (x)) = gr(p(x)) y gr(q ′′ (x)) = gr(q(x));
resulta, 0 = p ′′ (𝛼)q ′′ (𝛼), luego
p ′′ (𝛼) = 0 o q ′′ (𝛼) = 0;
en el primer caso, por la elección de z(x), gr(p ′′ (x)) ≥ gr(z(x)), pero tam-
bién gr(z(x)) ≥ gr(p ′′ (x)), luego q ′′ (x) = 1 y z(x) = p ′′ (x). Se tiene que
gr(z(x)) = gr(p(x)), y de esta manera, q(x) = q0 ∈ ℚ, pero z(x) y p(x) son
mónicos, por lo tanto, q0 = 1, y así, p(x) = z(x) ∈ ℤ[x]. En el segundo caso,
es decir, si q ′′ (𝛼) = 0,
gr(q ′′ (x)) ≥ gr(z(x)) ≥ gr(q ′′ (x)),
luego p ′′ (x) = 1, pero esto no es posible ya que gr(p(x)) ≥ 1.
Ejemplo 2.3.5. Un número 𝛼 ∈ ℚ(i) es entero algebraico si, y sólo si,
𝛼 ∈ ℤ[i]:
⇒): sea 𝛼 = a + bi entero algebraico con a, b ∈ ℚ; si b = 0, entonces
veamos que a ∈ ℤ: en efecto, sea a = qp raíz de un polinomio mónico entero
f (x) = x n + kn−1 x n−1 + · · · + k0 , entonces p n + qkn−1 p n−1 + · · · + q n k0 = 0, y
de esta manera, q divide p, es decir, a ∈ ℤ ⊂ ℤ[i].
Sea b ≠ 0;
𝛼 2 = a2 + 2abi − b 2 = a 2 − b 2 + 2a(𝛼 − a),
luego 𝛼 2 − 2a𝛼 + (a2 + b 2 ) = 0, y entonces, el polinomio mínimo de 𝛼 sobre
ℚ es p(x) = x 2 −2ax + (a2 +b 2 ) (el polinomio mínimo no puede ser de grado
1 ya que entonces i ∈ ℚ). Pero como 𝛼 es entero algebraico, entonces, por
el ejemplo anterior, p(x) ∈ ℤ[x], es decir, 2a, a 2 +b 2 ∈ ℤ. Se tiene entonces
que 2a = p ∈ ℤ, de donde a = 2p , y así, p 2 + 4b 2 = 4q, con q ∈ ℤ. Entonces
2 | p 2 , es decir, 2 | p y por lo tanto a ∈ ℤ. Resulta de esto que b 2 ∈ ℤ, luego
b ∈ ℤ, y en consecuencia, 𝛼 ∈ ℤ[i].
⇐): sea 𝛼 = a + bi ∈ ℤ[i]; a, b son claramente enteros algebraicos,
pero i es también entero algebraico, luego por el teorema 2.3.3, 𝛼 es entero
algebraico.
Extensiones de cuerpos · 67

4. Cuerpo de descomposición de un
polinomio
De particular importancia en teoría de ecuaciones polinómicas es la exis-
tencia de un cuerpo extensión en donde una ecuación polinómica tenga un
juego completo de raíces. De ésto nos ocuparemos en esta sección. Comen-
cemos con algunos resultados que ya habíamos iniciado en la sección 2 del
capítulo 1.

Proposición 2.4.1 (Teorema del resíduo) . Sea 𝔽 un cuerpo, p(x) ∈ 𝔽 [x] un


polinomio de grado n ≥ 1 y sea 𝕂 una extensión de 𝔽 . Entonces, para cada 𝛼 ∈ 𝕂
existe q(x) ∈ 𝕂 [x] tal que

p(x) = (x − 𝛼)q(x) + p(𝛼),

donde gr(q(x)) = n − 1.

Demostración. Consideremos a p(x) como elemento de 𝕂 [x]. Aplicando el


algoritmo de la división encontramos q(x) y r (x) en 𝕂 [x] tales que

p(x) = (x − 𝛼)q(x) + r (x), donde r (x) = 0, ó, gr(r (x)) < 1.

Aplicando el homomorfismo evaluación obtenemos que p(𝛼) = r (𝛼), pero


como r (x) es un polinomio constante, entonces r (x) = r (𝛼) y

p(x) = (x − 𝛼)q(x) + p(𝛼).

Evidentemente, gr(q(x)) = n − 1. ✓

Corolario 2.4.2. Sean 𝕂 una extensión del cuerpo 𝔽 , p(x) ∈ 𝔽 [x] y 𝛼 ∈ 𝕂.


Entonces, 𝛼 es raíz de p(x) ∈ 𝔽 [x] si, y sólo si, (x − 𝛼) | p(x) en 𝕂 [x].

Demostración. ⇒): p(𝛼) = 0, luego, por el teorema del residuo, tenemos


p(x) = (x − 𝛼)q(x).
⇐): p(x) = (x − 𝛼)q(x), aplicando el homomorfismo evaluación obte-
nemos que p(𝛼) = 0. ✓

Si 𝛼 ∈ 𝕂 una raíz de p(x) ∈ 𝔽 [x], es posible que (x − 𝛼) 2 , (x − 𝛼) 3 , . . .


dividan también a p(x) en 𝕂 [x]. En tales casos se tienen las llamadas raíces
con multiplicidad (véase el ejemplo 1.5.5).

Definición 2.4.3. Sean 𝕂 una extensión de un cuerpo 𝔽 , p(x) ∈ 𝔽 [x] y


𝛼 ∈ 𝕂. Se dice que 𝛼 es una raíz con multiplicidad m ≥ 1 de p(x) si p(x) =
(x − 𝛼) m h(x), con h(x) ∈ 𝕂 [x] y h(𝛼) ≠ 0.
68 · Extensiones de cuerpos

Nos preguntamos si para un polinomio p(x) de grado n ≥ 1 existe una


extensión donde p(x) tenga más de n raíces.

Proposición 2.4.4. Para cada cuerpo 𝔽 y cada polinomio p(x) ∈ 𝔽 [x] de grado
n ≥ 1, p(x) tiene máximo n raíces en cualquier extensión de 𝔽 .

Demostración. La prueba la realizamos por inducción sobre n. Para n = 1,


sea 𝕂 una extensión de 𝔽 . Si ningún elemento de 𝕂 es raíz de p(x), entonces
la proposición se cumple trivialmente. Supóngase que existe un elemento
𝛼 ∈ 𝕂 tal que p(𝛼) = 0, entonces (x − 𝛼) | p(x), con p(x) = ax + b, donde
a, b ∈ 𝔽 , a ≠ 0. Resulta, ax +b = (x − 𝛼)q, q ∈ 𝔽 − {0}, luego q = a, b = −𝛼q,
es decir, 𝛼 = −ba , y así, p(x) tiene solo una raíz en 𝕂.
Supongamos que la proposición es cierta para cualquier cuerpo exten-
sión de 𝔽 y cualquier polinomio de grado ≤ n − 1. Sea p(x) ∈ 𝔽 [x] un
polinomio de grado n, y sea 𝕂 una extensión de 𝔽 ; si p(x) no tiene raíces en
𝕂, entonces la proposición se cumple trivialmente. Sea 𝛼 ∈ 𝕂 una raíz de
p(x) de multiplicidad m ≥ 1, entonces p(x) = (x − 𝛼) m q(x), q(x) ∈ 𝕂 [x].
Nótese que m ≤ n y gr(q(x)) = n − m. Si p(x) no posee otras raíces en 𝕂,
entonces la proposición está probada. Supóngase que existe 𝛽 ∈ 𝕂, 𝛽 ≠ 𝛼
tal que p( 𝛽 ) = 0, resulta 0 = ( 𝛽 − 𝛼) m q( 𝛽 ), luego 𝛽 es raíz de q(x) en 𝕂,
es decir, cualquier otra raíz 𝛽 en 𝕂 de p(x) es necesariamente raíz de q(x).
De acuerdo con la hipótesis de inducción el número de tales 𝛽 es a lo más
n − m. Sumando esto con la multiplicidad m de 𝛼 obtenemos que p(x) tiene
máximo n raíces en 𝕂. ✓

Proposición 2.4.5. Sea 𝔽 un cuerpo y sea p(x) ∈ 𝔽 [x] un polinomio de gra-


do n ≥ 1. Sea 𝕂 una extensión de 𝔽 en la cual p(x) tiene r raíces diferentes
𝛼1 , . . . , 𝛼r con multiplicidades m1 , . . . , mr , respectivamente. Entonces,

(x − 𝛼1 ) m1 · · · (x − 𝛼r ) mr | p(x) (en 𝕂 [x]).

Además, si m1 + · · · + mr = n, entonces

p(x) = (x − 𝛼1 ) m1 · · · (x − 𝛼r ) mr .

Demostración. Por definición (x − 𝛼1 ) m1 | p(x), luego

p(x) = (x − 𝛼1 ) m1 q1 (x), q1 (x) ∈ 𝕂 [x];

de igual manera (x − 𝛼2 ) m2 | p(x), de donde (x − 𝛼2 ) m2 | q1 (x) ya que


(x − 𝛼1 ) m1 y (x − 𝛼2 ) m2 son primos relativos. Resulta,

p(x) = (x − 𝛼1 ) m1 (x − 𝛼2 ) m2 q2 (x),
Extensiones de cuerpos · 69

con q2 (x) ∈ 𝕂 [x]. De manera análoga,

(x − 𝛼1 ) m1 · · · (x − 𝛼r ) mr | p(x).

Si m1 + · · · + mr = n, entonces, por cuestiones de grado, p(x) coincide con


el producto (x − 𝛼1 ) m1 · · · (x − 𝛼r ) mr . □✓

Según las propiedades anteriores, la noción de cuerpo de descomposi-


ción de un polinomio se puede expresar en términos de un juego completo
de raíces o bien de descomposición completa en factores lineales.
Definición 2.4.6. Sean 𝔽 un cuerpo y p(x) ∈ 𝔽 [x] un polinomio de grado
n ≥ 1. La extensión 𝕂 de 𝔽 se dice que es un cuerpo de descomposición de
f (x) respecto de 𝔽 si
(i) p(x) se descompone completamente en n factores lineales en 𝕂 [x].

(ii) No existe subcuerpo propio de 𝕂 para el cual se cumple (i).


Teorema 2.4.7 (Existencia) . Sea 𝔽 un cuerpo y sea p(x) ∈ 𝔽 [x] un polinomio
de grado n ≥ 1. Entonces,
(i) Existe una extensión 𝕂 de 𝔽 en donde p(x) se descompone en n factores
lineales (no necesariamente diferentes):

p(x) = (x − 𝛼1 ) · · · (x − 𝛼n ), 𝛼i ∈ 𝕂, 1 ≤ i ≤ n.

Además, [𝕂 : 𝔽 ] ≤ n! y 𝛼1 , . . . , 𝛼n son los únicos elementos de 𝕂 que son


raíces de p(x).

(ii) 𝔽 (𝛼1 , . . . , 𝛼n ) es un cuerpo de descomposición de p(x).


Demostración. (i) La demostración la hacemos por inducción sobre n.
Para n = 1, la situación es trivial tomando 𝕂 = 𝔽 , y desde luego,
[𝕂 : 𝔽 ] = 1.
Supongamos que la proposición es válida para todos los polinomios de
grado n −1 y sobre cualquier cuerpo. Sea p(x) ∈ 𝔽 [x] grado n ≥ 2. Según el
corolario 2.1.17, existe una extensión 𝕂1 de 𝔽 donde p(x) tiene una raíz 𝛼1
y p(x) = (x − 𝛼1 )p1 (x), con p1 (x) ∈ 𝕂1 [x] y gr p1 (x) = n − 1; además, [𝕂1 :
𝔽 ] ≤ n. Aplicando la hipótesis de inducción a p1 (x) y 𝕂1 , encontramos
una extensión 𝕂 de 𝕂1 (y, por lo tanto, de 𝔽 ) donde p1 (x) se descompone
en producto de n − 1 factores lineales, p1 (x) = (x − 𝛼2 ) · · · (x − 𝛼n ), con
𝛼2 , . . . , 𝛼n ∈ 𝕂, y además, [𝕂 : 𝕂1 ] ≤ (n − 1)!. Por lo tanto, en 𝕂 [x] se
tiene para p(x) la descomposición

p(x) = (x − 𝛼1 )(x − 𝛼2 ) · · · (x − 𝛼n ).
70 · Extensiones de cuerpos

Resulta,
[𝕂 : 𝔽 ] = [𝕂 : 𝕂1 ] [𝕂1 : 𝔽 ] ≤ (n − 1)!n = n!.
Es obvio que 𝛼1 , . . . , 𝛼n son raíces de p(x). Sea 𝛽 ∈ 𝕂 tal que p( 𝛽 ) = 0,
entonces por el teorema del residuo, (x − 𝛽 ) | p(x) y existe 1 ≤ i ≤ n tal
que (x − 𝛽 ) | (x − 𝛼i ), resulta (x − 𝛼i ) = (x − 𝛽 ), y así, 𝛽 = 𝛼i .
(ii) Es claro que en 𝔽 (𝛼1 , . . . , 𝛼n ) el polinomio p(x) se descompone
completamente en n factores lineales. Sea 𝔽 ⊂ 𝕃 ⊂ 𝔽 (𝛼1 , . . . , 𝛼n ) en donde
p(x) se descompone completamente en n factores lineales,

p(x) = (x − 𝛽 1 ) · · · (x − 𝛽 n ), 𝛽 i ∈ 𝕃, 1 ≤ i ≤ n.

Puesto que 𝕃 ⊂ 𝕂, según (i), { 𝛽 1 , . . . , 𝛽 n } = {𝛼1 , . . . , 𝛼n }, luego


𝔽 (𝛼1 , . . . , 𝛼n ) ⊂ 𝕃, y de esta manera, 𝕃 = 𝔽 (𝛼1 , . . . , 𝛼n ). ✓

Pasamos ahora a considerar la unicidad de los cuerpos de descomposi-


ción.

Proposición 2.4.8. Sean 𝔽 y 𝔽 ′ dos cuerpos y 𝛼 : 𝔽 −→ 𝔽 ′ un isomorfismo.


Entonces, 𝛼 induce un isomorfismo 𝛼 ′ : 𝔽 [x] −→ 𝔽 ′ [x] entre sus anillos de
polinomios. En particular, p(x) ∈ 𝔽 [x] es irreducible si, y sólo si, 𝛼 ′ (p(x)) es
irreducible.

Demostración. 𝛼 ′ se define de la manera natural,

𝛼 ′ : 𝔽 [x] −→ 𝔽 ′ [x]
a0 + a1 x + · · · + an x n ↦−→ 𝛼 (a0 ) + 𝛼 (a0 )x + · · · + 𝛼 (an )x n

Evidentemente 𝛼 ′ es un isomorfismo. La segunda afirmación es consecuen-


cia directa de la primera. ✓

Definición 2.4.9. Sea 𝕂 y 𝕂 ′ extensiones de 𝔽 y 𝔽 ′, respectivamente. Sean


𝛼 : 𝔽 −→ 𝔽 ′ y 𝛼 ∗ : 𝕂 −→ 𝕂 ′ isomorfismos. Se dice que 𝛼 ∗ es una extensión
de 𝛼 si 𝛼 ∗ (a) = 𝛼 (a) para cada a ∈ 𝔽 .

Lema 2.4.10. Sean 𝔽 y 𝔽 ′ cuerpos, 𝛼 : 𝔽 −→ 𝔽 ′ un isomorfismo y


𝛼 ′ : 𝔽 [x] −→ 𝔽 ′ [x] el isomorfismo inducido de la proposición 2.4.8. Sea p(x) ∈
𝔽 [x] un polinomio de grado n ≥ 1 y sea p ′ (x) := 𝛼 ′ (p(x)). Sea 𝜃 una raíz de
p(x) en algún cuerpo extensión de 𝔽 y sea 𝜃 ′ una raíz de p ′ (x) en algún cuerpo
extensión de 𝔽 ′. Entonces, existe un isomorfismo

𝛼 ∗ : 𝔽 (𝜃) −→ 𝔽 ′ (𝜃 ′)

que es extensión de 𝛼 y tal que 𝛼 ∗ (𝜃) = 𝜃 ′.


Extensiones de cuerpos · 71

Demostración. Podemos suponer que p(x) es irreducible ya que 𝜃 es raíz de


algún factor irreducible de p(x). 𝔽 (𝜃) es una extensión simple algebraica de
𝔽 , luego sus elementos son de la forma a0 + a1 𝜃 + · · · + an−1 𝜃 n−1 , donde
ai ∈ 𝔽 , 0 ≤ i ≤ n − 1. Definimos 𝛼 ∗ de la manera natural,
𝛼∗
𝔽 (𝜃) −−→ 𝔽 ′ (𝜃 ′)
a0 + a1 𝜃 + · · · + an−1 𝜃 n−1 ↦−→ 𝛼 (a0 ) + 𝛼 (a1 )𝜃 ′ + · · · + 𝛼 (an−1 )𝜃 ′n−1 ;

𝛼 ∗ es biyectiva ya que p ′ (x) es el polinomio mínimo de 𝜃 ′ y 𝛼 es biyectiva.


Es también claro que 𝛼 ∗ es un homomorfismo de anillos. Además, para cada
a ∈ 𝔽 , 𝛼 ∗ (a) = 𝛼 (a), y 𝛼 ∗ (𝜃) = 𝜃 ′. ✓

Corolario 2.4.11. Sea p(x) ∈ 𝔽 [x] un polinomio de grado n ≥ 1 y sean 𝛼 y


𝛽 raíces de p(x) en algún cuerpo extensión de 𝔽 . Entonces, existe un isomorfismo
entre 𝔽 (𝛼) y 𝔽 ( 𝛽 ) que deja fijos los elementos de 𝔽 y envía 𝛼 en 𝛽 .

Demostración. Se sigue del lema anterior con 𝔽 ′ = 𝔽 , 𝛼 ′ = i𝔽 . ✓


Lema 2.4.12. Sean 𝔽 y 𝔽 ′ cuerpos, 𝛼 : 𝔽 −→ 𝔽 ′ un isomorfismo y


𝛼 ′ : 𝔽 [x] −→ 𝔽 ′ [x] el isomorfismo inducido de la proposición 2.4.8. Sea
p(x) ∈ 𝔽 [x] un polinomio de grado n ≥ 1 y sea p ′ (x) = 𝛼 ′ (p(x)). Sean 𝕂 y
𝕂 ′ cuerpos de descomposición de p(x) y p ′ (x), respectivamente. Entonces, existe
un isomorfismo 𝛼 ∗ : 𝕂 −→ 𝕂 ′ que es extensión de 𝛼, y además, envía las raíces
𝜃 1 , . . . , 𝜃 n de p(x) en las raíces 𝛽 1 , . . . , 𝛽 n de p ′ (x).

Demostración. Puesto que 𝕂 es un cuerpo de descomposición de p(x), en-


tonces
p(x) = (x − 𝜃 1 ) · · · (x − 𝜃 n ), 𝜃 i ∈ 𝕂, 1 ≤ i ≤ n;
pero es claro que 𝔽 (𝜃 1 , . . . , 𝜃 n ) ⊆ 𝕂 y p(x) también se descompone en
𝔽 (𝜃 1 , . . . , 𝜃 n ), por lo tanto, 𝕂 = 𝔽 (𝜃 1 , . . . , 𝜃 n ). De igual manera,
𝕂 ′ = 𝔽 ′ ( 𝛽 1 , . . . , 𝛽 n ). Según el lema 2.4.10, existe una extensión

𝛼1 : 𝔽 (𝜃 1 ) −→ 𝔽 ′ ( 𝛽 1 )

de 𝛼 tal que 𝛼1 (𝜃 1 ) = 𝛽 1 . Podemos considerar que p(x) ∈ 𝔽 (𝜃 1 ) [x] y


𝛼1 (p(x)) = p ′ (x) de tal manera que podemos aplicar nuevamente el lema
2.4.10 para 𝜃 2 y 𝛽 2 , luego existe una extensión

𝛼2 : 𝔽 (𝜃 1 ) (𝜃 2 ) −→ 𝔽 ′ ( 𝛽 1 )( 𝛽 2 )

de 𝛼1 que envía 𝜃 2 en 𝛽 2 . Teniendo en cuenta que

𝔽 (𝜃 1 ) (𝜃 2 ) · · · (𝜃 n ) = 𝔽 (𝜃 1 , . . . , 𝜃 n )
72 · Extensiones de cuerpos

y
𝔽 ′ ( 𝛽 1 ) ( 𝛽 2 ) · · · ( 𝛽 n ) = 𝔽 ′ ( 𝛽 1 , . . . , 𝛽 n ),

al cabo de n pasos encontramos la extensión 𝛼 ∗ buscada. ✓


Teorema 2.4.13 (Unicidad) . Sea p(x) ∈ 𝔽 [x] un polinomio de grado n ≥ 1.


Entonces, dos cuerpos de descomposición de p(x) son extensiones equivalentes.

Demostración. Basta tomar en el teorema anterior 𝔽 ′ = 𝔽 y 𝛼 = i𝔽 . ✓


Ejemplo 2.4.14. Calcularemos en este ejemplo los cuerpos de descompo-


sición de algunos polinomios.
(i) f (x) = x 4 − 8x 2 + 15 ∈ ℚ[x]: observemos que
√ √ √ √
f (x) = (x 2 − 3)(x 2 − 5) = (x + 3)(x − 3)(x + 5)(x − 5),
√ √
luego el cuerpo de descomposición es ℚ( 3, 5). Además,
√ √ √ √
[ℚ( 3, 5) : ℚ] = [ℚ( 3)( 5) : ℚ]
√ √ √ √
= [ℚ( 3)( 5) : ℚ( 3)] [ℚ( 3) : ℚ] = 4.

En efecto, puesto que x 2 − 3 ∈ ℚ[x] es irreducible, entonces



[ℚ( 3) : ℚ] = 2;

2 − 5 ∈ ℚ( 3) [x] es irreducible: de ser reducible se
notemos también
√ que√ x √ √
tendría que 5 ∈ ℚ( 3), es decir,√ 5 = r0 + r1 3 con r0 , r1 ∈ ℚ, y al elevar
al cuadrado obtendríamos que 3 ∈ ℚ. Por lo tanto,
√ √ √
[ℚ( 3)( 5) : ℚ( 3)] = 2.

Notemos que si consideramos f (x) = x 4 − 8x 2 + 15 ∈ ℝ[x], entonces el


cuerpo de descomposición de f (x) es ℝ, ya que por definición el cuerpo de
descomposición contiene el cuerpo de coeficientes.
(ii) f (x) = x 3 + x + 1 ∈ ℤ2 [x]: notemos que f (x) no tiene raíces en
ℤ2 , luego es irreducible. f (x) tiene en ℤ2 [x]/⟨ f (x)⟩ una raíz 𝛼 := x, así
𝛼 3 + 𝛼 + 1 = 0. De aquí resulta, 𝛼 4 + 𝛼 2 + 𝛼 = 0, luego 𝛼 4 + 𝛼 = −𝛼 2 = 𝛼 2 ;
así

𝛼 6 + 𝛼 4 + 𝛼 3 = 0 = 𝛼 6 + 𝛼 4 + (−𝛼 − 1) = 𝛼 6 + 𝛼 4 + 𝛼 + 1 = 𝛼 6 + 𝛼 2 + 1,
Extensiones de cuerpos · 73

es decir, 𝛼 2 es también raíz de f (x). Además, 𝛼 4 = 𝛼 2 + 𝛼 es también raíz:

(𝛼 2 + 𝛼) 3 + (𝛼 2 + 𝛼) + 1 = 𝛼 6 + 3𝛼 5 + 3𝛼 4 + 𝛼 3 + 𝛼 2 + 𝛼 + 1
= 𝛼6 + 𝛼5 + 𝛼4 + 𝛼2 = 𝛼6 + 𝛼5 − 𝛼
= 𝛼 6 + 𝛼 5 + 𝛼 = −𝛼 2 − 1 + 𝛼 5 + 𝛼
= 𝛼2 + 1 + 𝛼5 + 𝛼 = 𝛼5 + 𝛼2 + 𝛼 + 1
= −𝛼 3 + 𝛼 + 1 = 𝛼 3 + 𝛼 + 1 = 0.

Notemos también que 𝛼 , 𝛼 2 y 𝛼 4 son distintos. Por lo tanto, el cuerpo de


descomposición de f (x) es ℤ2 (𝛼 , 𝛼 2 , 𝛼 4 ) = ℤ2 (𝛼)  ℤ2 [x]/⟨ f (x)⟩,

f (x) = (x − 𝛼) (x − 𝛼 2 ) (x − 𝛼 4 ) y [ℤ2 (𝛼) : ℤ2 ] = 3.

(iii) f (x) = x 4 + 1 ∈ ℚ[x]: en ℂ[x] se tiene la descomposición

f (x) = (x 2 − i) (x 2 + i)
√ √ √ √
= (x − i) (x + i) (x − −i)(x + −i)
√ √ !! √ √ !!
2 2 2 2
= x− + i x+ + i
2 2 2 2
√ √ !! √ √ !!
2 2 2 2
x− − i x+ − i ;
2 2 2 2
√ √
observemos que −i = ( i) −1 , por lo tanto
√ √ √ √ √
ℚ( i , − i , ( i) −1 , −( i) −1 ) = ℚ( i)

es un cuerpo de descomposición de f (x), y además, [ℚ( i) : ℚ] = 4.
(iv) f (x) = x 4 + 1 ∈ ℤp [x], con p ≠ 2: sabemos por el corolario 2.1.17
que f (x) tiene al menos una raíz 𝛼 en un cuerpo extensión de ℤp ; notemos
que −𝛼 es también raíz, lo mismo que 𝛼 −1 y −𝛼 −1 . Además, estos cuatro
elementos son distintos. Por lo tanto,

ℤp (𝛼 , −𝛼 , 𝛼 −1 , −𝛼 −1 ) = ℤp (𝛼)

es el campo de descomposición de f (x) y [ℤp (𝛼) : ℤp ] ≤ 4. No podemos


asegurar que f (x) sea irreducible sobre ℤp , por ejemplo, si p = 3 entonces
f (x) = x 4 +1 = (x 2 − x −1)(x 2 + x −1), y en este caso x 2 + x −1 es irreducible
sobre ℤ3 , luego [ℤ3 (𝛼) : ℤ3 ] = 2.
(v) f (x) = x 4 + 1 ∈ ℤ2 [x]: en este caso f (x) = x 4 + 1 = (x + 1) 4 , y
entonces el cuerpo de descomposición es ℤ2 , con [ℤ2 : ℤ2 ] = 1.
74 · Extensiones de cuerpos

(vi) f (x) = x 4 + 4 ∈ ℚ[x]: se tiene la factorización

f (x) = (x 2 + 2x + 2)(x 2 − 2x + 2)
= (x − (−1 + i)) (x + (−1 − i))(x − (1 + i))(x + (1 − i)),

luego el cuerpo de descomposición es

ℚ(−1 + i , −1 − i , 1 + i , 1 − i) = ℚ(i) y [ℚ(i) : ℚ] = 2.

(vii) f (x) = x p − 1 ∈ ℚ[x], con p irreducible: se tiene la descomposición

f (x) = (x − 1)(x p−1 + x p−2 + · · · + x + 1),

y sabemos que fp (x) = x p−1 + x p−2 + · · · + x + 1 es irreducible sobre ℚ; apli-


camos nuevamente el corolario 2.1.17 y obtenemos una raíz 𝛼 de fp (x) en
𝕂 := ℚ[x]/⟨fp (x)⟩. Recordemos que una ℚ-base de 𝕂 es {1, 𝛼 , . . . , 𝛼 p−2 },
además, para cada 0 ≤ k ≤ p − 1 se tiene que

f (𝛼 k ) = (𝛼 k ) p − 1 = (𝛼 p ) k − 1 = 0.

De aquí se obtiene que {1, 𝛼 , . . . , 𝛼 p−1 } es un juego completo de raíces


distintas de f (x) y ℚ(𝛼) es el cuerpo de descomposición de f (x). Además,
[ℚ(𝛼) : ℚ] = p − 1.

Ejemplo 2.4.15. Sea 𝔽 un cuerpo y p(x) ∈ 𝔽 [x] un polinomio irreducible


de grado n ≥ 1. Sea 𝕂 una extensión finita de 𝔽 , digamos [𝕂 : 𝔽 ] = m, de
tal forma que m. c. d.(n, m) = 1. Veamos que p(x) es irreducible sobre 𝕂:
p(x) ∈ 𝕂 [x]; existe un cuerpo extensión 𝕃 de 𝕂 en el cual p(x) tiene una
raíz 𝛼, y además, [𝕃 : 𝕂] ≤ n (corolario 2.1.17). Tenemos entonces que

[𝕂(𝛼) : 𝔽 ] = [𝕂(𝛼) : 𝕂] [𝕂 : 𝔽 ] = [𝕂(𝛼) : 𝕂]m,


[𝕂(𝛼) : 𝔽 ] = [𝕂(𝛼) : 𝔽 (𝛼)] [𝔽 (𝛼) : 𝔽 ] = [𝕂(𝛼) : 𝔽 (𝛼)]n,

de aquí obtenemos que n | [𝕂(𝛼) : 𝕂]m, de donde n | [𝕂(𝛼) : 𝕂], y


así, n ≤ [𝕂(𝛼) : 𝕂]. Pero [𝕃 : 𝕂] = [𝕃 : 𝕂(𝛼)] [𝕂(𝛼) : 𝕂] ≤ n, luego
[𝕂(𝛼) : 𝕂] ≤ n, con lo cual [𝕂(𝛼) : 𝕂] = n. Esto dice que el polinomio
mínimo de 𝛼 sobre 𝕂 es de grado n, luego p(x) no puede tener factores no
triviales en 𝕂 [x], es decir, p(x) es irreducible sobre 𝕂.

Ejemplo 2.4.16. Consideremos p(x) = x 3 − 2 ∈ ℚ[x] y calculemos √3 su


cuerpo de descomposición y el grado de la extensión: sea 𝜃 := 2, entonces

2 2 2 −1 + 3i
p(x) = (x − 𝜃) (x + 𝜃 x + 𝜃 ) = (x − 𝜃) (x − 𝜃 𝛼)(x − 𝜃 𝛼 ), 𝛼 := .
2
Extensiones de cuerpos · 75

Por lo tanto el cuerpo de descomposición de p(x) es

ℚ(𝜃 , 𝜃 𝛼 , 𝜃 𝛼 2 ) = ℚ(𝜃 , 𝛼) = ℚ(𝛼 , 𝜃).

Podemos aplicar el ejemplo anterior para probar que [ℚ(𝛼 , 𝜃) : ℚ] = 6.


Tenemos que

[ℚ(𝛼 , 𝜃) : ℚ] = [ℚ(𝛼) (𝜃) : ℚ] = [ℚ(𝛼)(𝜃) : ℚ(𝛼)] [ℚ(𝛼) : ℚ];

𝛼 es raíz del polinomio ciclotómico f3 (x) = x 2 + x +1, luego [ℚ(𝛼) : ℚ] = 2;


tomando 𝕂 = ℚ(𝛼) en el ejemplo anterior y p(x) = x 3 − 2 ∈ ℚ[x] irreduci-
ble (Eisenstein con p = 2), entonces m. c. d.(3, 2) = 1 y p(x) es irreducible
sobre ℚ(𝛼). Así, 𝜃 es raíz del polinomio irreducible p(x) ∈ ℚ(𝛼) [x], con lo
cual [ℚ(𝛼)(𝜃) : ℚ(𝛼)] = 3, y de esta manera, [ℚ(𝛼 , 𝜃) : ℚ] = 6.
Para concluir el ejemplo, calculemos una ℚ-base de ℚ(𝛼 , 𝜃) usando
la prueba de la proposición 2.1.4: el polinomio mínimo de 𝛼 sobre ℚ es
f3 (x) = x 2 + x + 1, luego una ℚ-base de ℚ(𝛼) es {1, 𝛼}; el polinomio míni-
mo de 𝜃 sobre ℚ(𝛼) es p(x), luego una ℚ(𝛼)-base de ℚ(𝛼)(𝜃) es {1, 𝜃 , 𝜃 2 }.
En total, una ℚ-base de 𝕂 es {1, 𝜃 , 𝜃 2 , 𝛼 , 𝛼𝜃 , 𝛼𝜃 2 }.

5. Clausura algebraica de un cuerpo


Definición 2.5.1. Un cuerpo 𝕂 es algebraicamente cerrado si para cada
polinomio p(x) ∈ 𝕂 [x] de grado ≥ 1 todas las raíces de p(x) están en 𝕂.
Notemos que 𝕂 es algebraicamente cerrado si, y sólo si, cada polino-
mio p(x) ∈ 𝕂 [x] de grado ≥ 1 se descompone completamente en 𝕂 [x] en
producto de factores lineales. También, 𝕂 es algebraicamente cerrado si, y
sólo si, los únicos polinomios irreducibles de 𝕂 [x] son los de primer grado.
De forma equivalente, 𝕂 es algebraicamente cerrado si, y sólo si, el cuer-
po de descomposición de cada polinomio p(x) ∈ 𝕂 [x] de grado ≥ 1 está
contenido en 𝕂.
Observación 2.5.2. (i) Ningún cuerpo finito es algebraicamente cerrado.
En efecto, sea 𝔽 = {a1 = 1, a2 , . . . , an } un cuerpo finito; consideremos el
polinomio p(x) := 1 + (x − a1 ) · · · (x − an ) ∈ 𝔽 [x], entonces f (ai ) = 1 para
cada 1 ≤ i ≤ n, es decir, f (x) no tiene raíces en 𝔽 .
(ii) Así, todo cuerpo algebraicamente cerrado es infinito.
(iii) ℝ es un ejemplo de cuerpo que es infinito pero no es algebraicamente
cerrado.
Veremos a continuación que todo cuerpo 𝔽 está contenido en un cuerpo
algebraicamente cerrado, el cual además es una extensión algebraica de 𝔽 .
76 · Extensiones de cuerpos

Teorema 2.5.3. Sea 𝔽 un cuerpo. Entonces existe una extensión 𝔽 ⊇ 𝔽 que tiene
las siguientes propiedades:

(i) 𝔽 es una extensión algebraica de 𝔽 .

(ii) 𝔽 es algebraicamente cerrado.

(iii) Cada polinomio p(x) ∈ 𝔽 [x] de grado ≥ 1 tiene todas sus raíces en 𝔽 .

(iv) 𝔽 = 𝔽 (S), con

S := {𝛼 ∈ 𝔽 | p(𝛼) = 0, para algún p(x) ∈ 𝔽 [x] de grado ≥ 1}.

Se dice que 𝔽 es una clausura algebraica de 𝔽 .

Demostración. Paso 1. Probemos primero que existe una extensión 𝕂1 ⊇ 𝔽


en la cual cada polinomio p(x) ∈ 𝔽 [x] de grado ≥ 1 tiene al menos una raíz.
Veamos también que 𝕂1 es una extensión algebraica de 𝔽 .
A cada polinomio p(x) ∈ 𝔽 [x] de grado ≥ 1 le asociamos una indeter-
minada yp ; sea Y el conjunto de todas estas indeterminadas. Consideremos
el anillo 𝔽 [Y ] de todos los polinomios en estas indeterminadas; notemos
que cada elemento f (Y ) de 𝔽 [Y ] es un polinomio en un subconjunto fi-
nito {yp1 , . . . , ypn } de indeterminadas de Y (que dependen de f (Y )). Sea
I el ideal de 𝔽 [Y ] generado por todos los polinomios de la forma p(yp ),
p(x) ∈ 𝔽 [x] , gr(p(x)) ≥ 1, es decir,

I := ⟨p(yp ) | p(x) ∈ 𝔽 [x], gr(p(x)) ≥ 1⟩.

Notemos que I es propio: en efecto, supongamos que I = 𝔽 [Y ], entonces


existen polinomios p1 (x), . . . , pn (x) ∈ 𝔽 [x] y elementos q1 , . . . , qn ∈ 𝔽 [Y ]
de tal forma que
1 = q1 p1 (yp1 ) + · · · + qn pn (ypn ).
Cada polinomio qi incluye solamente un número finito de indeterninadas
y’s, luego podemos asumir que todos los polinomios de la relación anterior
incluyen las mismas indeterminadas y1 , . . . , ym (hemos simplificado un po-
co la notación cambiando y fi por yi , y además, notemos que m ≥ n). Tene-
mos entonces que

1 = q1 (y1 , . . . , ym )p1 (y1 ) + · · · + qn (y1 , . . . , ym )pn (yn ).

Según el corolario 2.1.17, existe un cuerpo L1 ⊇ 𝔽 en donde p1 (y1 ) tiene


al menos una raíz 𝛼1 ; p2 (y2 ) puede ser considerado como polinomio de
L1 [y2 ] y existe una extensión L2 ⊇ L1 en donde p2 (y2 ) tiene al menos una
Extensiones de cuerpos · 77

raíz 𝛼2 ; podemos continuar de esta manera y encontrar una extensión 𝕃 ⊇ 𝔽


en donde cada polinomio pi (yi ) tiene una raíz 𝛼i , 1 ≤ i ≤ n. Tomando en
la igualdad de arriba yi = 𝛼i y y j = 𝛼 j = 0 para n + 1 ≤ j ≤ m obtenemos la
contradicción 1 = 0.
Así, I ≠ 𝔽 [Y ]. Existe entonces un ideal maximal P en 𝔽 [Y ] que contiene
a I (véase [23]) de tal manera que 𝕂1 := 𝔽 [Y ]/P es un cuerpo y se tiene el
homomorfismo canónico

j : 𝔽 [Y ] −→ 𝕂1
q −→ q.

Observemos que 𝔽 está sumergido en 𝕂1 : en efecto, la función a ↦−→ a,


a ∈ 𝔽 , es un homomorfismo inyectivo pues si a = 0, entonces a ∈ P y a = 0
(de lo contrario 1 = aa−1 ∈ P). Así pues, podemos asumir que 𝕂1 ⊇ 𝔽 .
Sea p(x) ∈ 𝔽 [x] de grado ≥ 1, entonces yp ∈ 𝕂1 es una raíz de p(x) ya que
p(yp ) = p(yp ) = 0 debido a que p(yp ) ∈ I ⊆ P.
Para terminar este primer paso veamos que 𝕂1 es una extensión alge-
braica de 𝔽 : sea q ∈ 𝕂1 con q ∈ 𝔽 [Y ]; si q ∈ 𝔽 , entonces claramente q es
algebraico sobre 𝔽 . Sea q no constante, q = q(y1 , . . . , yn ) ∈ 𝔽 [Y ], entonces
q = q(y1 , . . . , yn ), pero como vimos antes, cada yi es raíz de un polinomio
con coeficientes de 𝔽 , 1 ≤ i ≤ n, es decir, yi es algebraico sobre 𝔽 . Del coro-
lario 2.2.4 se obtiene que q es algebraico sobre 𝔽 , luego 𝕂1 es una extensión
algebraica de 𝔽 .
Paso 2. Ahora podemos considerar todos los polinomios de 𝕂1 [x] de
grado ≥ 1; según el paso anterior, existe una extensión 𝕂2 ⊇ 𝕂1 en la cual
cada uno de estos polinomios tenga al menos una raíz y sea algebraica sobre
𝕂1 ; surge así una cadena ascendente de cuerpos

𝔽 ⊆ 𝕂1 ⊆ 𝕂2 ⊆ · · · ⊆ 𝕂n ⊆ 𝕂n+1 ⊆ · · ·

de tal forma que cada polinomio de grado ≥ 1 de 𝕂n [x] tiene al menos una
raíz en 𝕂n+1 y 𝕂n+1 sea una extensión algebraica de 𝕂n . Sea
Ø
𝕂 := 𝕂n .
n ≥1

Notemos que 𝕂 es un cuerpo y, por supuesto, contiene a 𝔽 .


Paso 3. Sea p(x) ∈ 𝕂 [x] de grado k ≥ 1, entonces existe n ≥ 1 tal que
todos los coeficientes de p(x) están en 𝕂n , es decir, p(x) ∈ 𝕂n [x]. Entonces,
p(x) tiene al menos una raíz 𝛼1 en 𝕂n+1 , y por lo tanto, p(x) = (x−𝛼1 )p1 (x),
con p1 (x) ∈ 𝕂n+1 [x]; a su vez, p1 (x) tiene al menos una raíz 𝛼2 en 𝕂n+2 y
p(x) = (x − 𝛼1 ) (x − 𝛼2 )p2 (x), con p2 (x) ∈ 𝕂n+2 [x], continuando de esta
78 · Extensiones de cuerpos

manera encontramos que p(x) tiene todas sus raíces en 𝕂n+k ⊆ 𝕂. Hemos
construido un cuerpo algebraicamente cerrado 𝕂 que contiene a 𝔽 .
Paso 4. Sea 𝔽 la unión de todos los subcuerpos de 𝕂 que son extensiones
algebraicas de 𝔽 (al menos 𝔽 es una extensión algebraica de 𝔽 ); notemos que
𝔽 es una extensión algebraica de 𝔽 : sea 𝛼 ∈ 𝔽 , entonces 𝛼 está en alguno de
los subcuerpos de la reunión anterior, luego 𝛼 es algebraico sobre 𝔽 . Esto
demuestra que 𝔽 es una extensión algebraica de 𝔽 y tenemos probado el
numeral (i).
Paso 5. Probemos ahora que 𝔽 es algebraicamente cerrado. Sea
p(x) ∈ 𝔽 [x] de grado ≥ 1 y sea 𝛼 una raíz de p(x); como p(x) ∈ 𝕂 [x] y 𝕂
es algebraicamente cerrado, entonces 𝛼 ∈ 𝕂 y existe n ≥ 1 tal que 𝛼 ∈ 𝕂n .
Veamos que 𝛼 es algebraico sobre 𝔽 : tenemos que 𝔽 ⊆ 𝕂1 ⊆ · · · ⊆ 𝕂n , con
𝕂i una extensión algebraica de 𝕂i−1 , 1 ≤ i ≤ n, luego, aplicando repetida-
mente el corolario 2.2.3, encontramos que 𝛼 es algebraico sobre 𝔽 .
Así, 𝔽 (𝛼) es una extensión algebraica de 𝔽 contenida en 𝕂, con lo cual
𝔽 (𝛼) ⊆ 𝔽 , de donde 𝛼 ∈ 𝔽 . Hemos demostrado que cada raíz de p(x) está
en 𝔽 , es decir, 𝔽 es algebraicamente cerrado. Esto prueba el numeral (ii). El
numeral (iii) es consecuencia directa de (ii) ya que 𝔽 ⊆ 𝔽 .
Para concluir la demostración del teorema veamos la prueba del numeral
(iv). Si 𝛼 ∈ 𝔽 , como 𝔽 es una extensión algebraica de 𝔽 , entonces 𝛼 es raíz de
algún polinomio p(x) ∈ 𝔽 [x] de grado ≥ 1, es decir, 𝛼 ∈ S, luego 𝛼 ∈ 𝔽 (S),
así, 𝔽 ⊆ 𝔽 (S). Recíprocamente, es claro que 𝔽 (S) ⊆ 𝔽 . ✓

Observación 2.5.4. (i) Se puede demostrar que dos clausuras algebraicas


de un cuerpo son extensiones equivalentes, la prueba completa de este teo-
rema usa suficientes elementos de teoría de conjuntos e inducción transfinita
y va más allá de los alcances de este cuaderno (véase [14] o [41]).
(ii) Si 𝔽 es algebraicamente cerrado, entonces 𝔽 = 𝔽 .
(iii) En topología conjuntista la clausura de un subconjunto de un espacio
topológico es el menor cerrado del espacio que contiene a dicho subconjun-
to. Aquí en teoría de cuerpos, la clausura algebraica de un cuerpo 𝔽 no es
el menor algebraico que lo contiene ya que dicho algebraico es 𝔽 y 𝔽 en
general puede no ser algebraicamente cerrado.
(iv) Sea 𝕃 tal que 𝔽 ⊆ 𝕃 ⊆ 𝔽 y 𝕃 es algebraicamente cerrado, entonces
𝕃 = 𝔽 : si 𝛼 ∈ 𝔽 , entonces 𝛼 es raíz de un polinomio p(x) con coeficientes
en 𝔽 , luego p(x) ∈ 𝕃[x], por lo tanto, 𝛼 ∈ 𝕃.
(v) Sea 𝔽 ⊆ 𝕂 ⊆ 𝕃 tal que 𝕂 es una extensión algebraica de 𝔽 . Enton-
ces, 𝕃 = 𝕂 si, y sólo si, 𝕃 = 𝔽 : si 𝕃 = 𝕂, entonces 𝕃 es algebraicamente
cerrado y es una extensión algebraica de 𝕂, pero como 𝕂 es una extensión
Extensiones de cuerpos · 79

algebraica de 𝔽 , entonces 𝕃 es también una extensión algebraica de 𝔽 . Re-


cíprocamente, si 𝕃 = 𝔽 , entonces 𝕃 es algebraicamente cerrado y es una
extensión algebraica de 𝔽 , luego también es una extensión algebraica de 𝕂,
es decir, 𝕃 = 𝕂.
(vi) Sea 𝔽 ⊆ 𝕂, con 𝕂 algebraicamente cerrado, entonces

𝔽 = A = {𝛼 ∈ 𝕂 | 𝛼 es algebraico sobre 𝔽 }.

Por el corolario 2.2.4 sabemos que A es efectivamente un cuerpo que con-


tiene a 𝔽 , y por supuesto, una extensión algebraica de 𝔽 . Veamos que A es
algebraicamente cerrado: sea p(x) ∈ A[x], entonces p(x) ∈ 𝕂 [x], y por lo
tanto, todas sus raíces están en 𝕂; sea 𝛼 una cualquiera de estas raíces, en-
tonces p(𝛼) = 0 y 𝛼 es de esta manera algebraico sobre A, pero como A es
una extensión algebraica de 𝔽 , entonces 𝛼 es algebraico sobre 𝔽 (corolario
2.2.3), es decir, 𝛼 ∈ A.

Cerramos esta sección enunciando y aplicando el teorema sobre la clau-


sura algebraica del cuerpo de los números complejos.

Ejemplo 2.5.5 (Teorema fundamental del álgebra) . ℂ es algebraicamen-


te cerrado. Existen múltiples pruebas de este hecho clásico del álgebra; la
mayoría de las demostraciones cortas usan elementos de análisis complejo,
y otras puramente algebraicas, pero bastante extensas, utilizan demasiadas
herramientas no incluídas en esta colección de cuadernos. Remitimos al lec-
tor interesado a consultar por ejemplo [1] y [42], en donde podrá encontrar
pruebas del teorema.

Ejemplo 2.5.6. (i) ℂ = ℂ ya que ℂ es algebraicamente cerrado.


(ii) ℝ = ℂ: en efecto, ℂ = ℝ(i) es una extensión algebraica de ℝ y ℂ es
algebraicamente cerrado.
(iii) ℚ = {𝛼 ∈ ℂ | 𝛼 es algebraico sobre ℚ}: esto se obtiene del teorema
fundamental del álgebra y de la parte (vi) de la observación 2.5.4.

6. Dependencia e independencia algebraica


Estudiaremos ahora las nociones de dependencia e independencia algebrai-
ca, las cuales, en cierto sentido, son análogas a las de dependencia e inde-
pendencia lineal del álgebra lineal.

Definición 2.6.1. Sean 𝕂 una extensión del cuerpo 𝔽 y u1 , . . . , un ∈ 𝕂. Se


dice que elemento v ∈ 𝕂 depende algebraicamente de u1 , . . . , un respecto
80 · Extensiones de cuerpos

a 𝔽 si v es algebraico sobre el cuerpo 𝔽 (u1 , . . . , un ), es decir, v satisface una


ecuación algebraica de la forma

am (u)vm + am−1 (u)v m−1 + · · · + a0 (u) = 0, (6.1)

donde am (u), am−1 (u), . . . , a0 (u) ∈ 𝔽 [u1 , . . . , un ] no son todos iguales a


cero.

Según la observación 2.1.10, en realidad cada elemento ai (u) es una


fracción de dos expresiones polinómicas en los elementos u1 , . . . , un con
denominador no nulo, pero en la ecuación (6.1) podemos eliminar los de-
nominadores y obtenemos que cada ai (u) ∈ 𝔽 [u1 , . . . , un ].
En forma similar a como ocurre en álgebra lineal, se tienen las siguientes
propiedades básicas de la dependencia algebraica.

Teorema 2.6.2. Sean 𝕂 una extensión del cuerpo 𝔽 y v, u1 , . . . , un ; v1 , . . . , vs


elementos de 𝕂. Entonces,

(i) Para cada 1 ≤ i ≤ n, ui depende algebraicamente de u1 , . . . , un .

(ii) Para cada 1 ≤ i ≤ n, si v depende algebraicamente de u1 , . . . , un , pero no


depende algebraicamente de u1 , . . . , ui−1 , ui+1 , . . . , un entonces ui depende
algebraicamente de u1 , . . . , ui−1 , v, ui+1 , . . . , un .

(iii) Si v depende algebraicamente de v1 , . . . , vs y cada v j , 1 ≤ j ≤ s, depen-


de algebraicamente de u1 , . . . , un , entonces v depende algebraicamente de
u1 , . . . , un .

Demostración. (i) Esta parte es trivial ya que ui es algebraico sobre


𝔽 (u1 , . . . , un ).
(ii) Sea 𝔽 ′ := 𝔽 (u1 , . . . , ui−1 , ui+1 , . . . , un ) y reescribamos (6.1) en la
forma
am (ui )v m + am−1 (ui )v m−1 + · · · + a0 (ui ) = 0, (6.2)
con ak (ui ) ∈ 𝔽 ′ (ui ), 0 ≤ k ≤ m, donde no todos los coeficientes ak (ui ) son
nulos. Podemos también reescribir esta ecuación respecto a ui en la forma

bh (v)uih + bh−1 (v)uih−1 + · · · + b0 (v) = 0, bl (v) ∈ 𝔽 ′ (v), 0 ≤ l ≤ h.

Cada coeficiente bl (v) ∈ 𝔽 (u1 , . . . , ui−1 , v, ui+1 , . . . , un ) y tiene una de dos


opciones: es nulo o no nulo. Si para algún l, bl (v) ≠ 0, entonces hemos
terminado. No es posible que todos sean idénticamente nulos: en efecto, si
suponemos lo contrario, como v por hipótesis no depende algebraicamente
de u1 , . . . , ui−1 , ui+1 , . . . , un , entonces todos los coeficientes en 𝔽 ′ serían
Extensiones de cuerpos · 81

nulos y de esta manera la ecuación (6.2) sería idénticamente nula, con lo


cual am (un ) = · · · = a0 (un ) = 0, contradicción.
(iii) Como v es algebraico sobre 𝔽 (v1 , . . . , vs ), entonces v es algebrai-
co sobre 𝔽 (u1 , . . . , un ; v1 , . . . , vs ), el cual es una extensión algebraica de
𝔽 (u1 , . . . , un ), en consecuencia, v es algebraico sobre 𝔽 (u1 , . . . , un ) (coro-
lario 2.2.3). ✓

Definición 2.6.3. Sea 𝕂 una extensión del cuerpo 𝔽 y sean u1 , . . . , un ∈ 𝕂.


Se dice que u1 , . . . , un son algebraicamente independientes respecto a 𝔽
si ninguno de ellos depende algebraicamente de los restantes.
El siguiente criterio puede ser tomado también como la definición de
elementos algebraicamente independientes.
Teorema 2.6.4. Sea 𝕂 una extensión del cuerpo 𝔽 y sean u1 , . . . , un ∈ 𝕂. Los
elementos u1 , . . . , un son algebraicamente independientes respecto a 𝔽 si, y sólo si,
para cada polinomio f ∈ 𝔽 [x1 , . . . , xn ] se tiene que f (u1 , . . . , un ) = 0 implica
f = 0.
Demostración. ⇒): supongamos que u1 , . . . , un son algebraicamente inde-
pendientes. Sea f ∈ 𝔽 [x1 , . . . , xn ] tal que f (u1 , . . . , un ) = 0. Descom-
poniendo f respecto a un entonces los coeficientes fi (u1 , . . . , un−1 ) de es-
te polinomio deben ser idénticamente nulos. Descomponiendo ahora estos
coeficientes respecto de un−1 encontramos que los coeficientes resultantes
son también idénticamente nulos. Continuando de esta manera encontra-
mos que f es el polinomio nulo.
⇐): evidente. □✓

El teorema anterior justifica porque a un conjunto de elementos algebrai-


camente independientes se le denomina también conjunto trascendente.
Corolario 2.6.5. Sea 𝕂 una extensión del cuerpo 𝔽 y sean u1 , . . . , un ∈ 𝕂
algebraicamente independientes respecto a 𝔽 . Entonces,
(i) 𝔽 [u1 , . . . , un ]  𝔽 [x1 , . . . , xn ].

(ii) 𝔽 (u1 , . . . , un )  𝔽 (x1 , . . . , xn ).


Demostración. (i) El isomorfismo se logra haciendo corresponder a cada po-
linomio f (x1 , . . . , xn ) el elemento f (u1 , . . . , un ) mediante el homomor-
fismo evaluación. La soreyectividad es evidente y la inyectividad está ga-
rantizada por el hecho que los elementos u1 , . . . , un son algebraicamente
independientes.
(ii) Basta tomar el cuerpo de fracciones a cada uno de los anillos de la
parte (i). ✓

82 · Extensiones de cuerpos

Observación 2.6.6. (i) Los conceptos de dependencia e independencia al-


gebraica pueden ser extendidos a conjuntos infinitos. Sea 𝕂 una extensión
del cuerpo 𝔽 y U ⊂ 𝕂; el elemento v ∈ 𝕂 se dice algebraicamente depen-
diente de U respecto a 𝔽 si v es algebraico sobre el cuerpo 𝔽 (U ), es decir,
v satisface una ecuación cuyos coeficientes son funciones racionales de ele-
mentos de U con coeficientes en 𝔽 . Multiplicando por los denominadores
de los coeficientes de la ecuación mencionada, obtenemos que v satisface
una ecuación, los coeficientes de la cual son expresiones polinómicas en U
con coeficientes de 𝔽 , es decir, los coeficientes están en 𝔽 [U ]. Para U = ∅,
la dependencia algebraica de v quiere decir que v es algebraico sobre 𝔽 . El
conjunto U se dice algebraicamente dependiente respecto a 𝔽 si al menos
un elemento u ∈ U depende de los restantes.
(ii) Si v depende algebraicamente de U , entonces existe un subconjunto
finito {u1 , . . . , un } ⊂ U tal que v depende algebraicamente de estos ele-
mentos. Escogiendo este subconjunto de tal forma que ninguno de sus ele-
mentos esté de sobra, entonces cada elemento ui depende algebraicamente
de {v, u1 , . . . , ui−1 , . . . , un }, 1 ≤ i ≤ n.
(iii) Como en el teorema 2.6.2, tenemos en este caso la siguiente obser-
vación: si u depende algebraicamente de U y cada elemento de U depende
algebraicamente de V , entonces u depende algebraicamente de V . El con-
junto V depende algebraicamente de U si cada elemento de V depende
algebraicamente de U . Si V depende algebraicamente de U y U depende de
Z, entonces V depende de Z. U y V se dicen equivalentes respecto a 𝔽 si
cada uno depende algebraicamente del otro. Esta relación es de equivalen-
cia.
(iv) El conjunto U se dice algebraicamente independiente respecto a 𝔽
si ninguno de sus elementos depende algebraicamente de los restantes. Es-
to es equivalente a decir que cada uno de los subconjuntos finitos de U es
algebraicamente independientes (el conjunto vacío por definición es alge-
braicamente independiente). Se dice también que U es un conjunto tras-
cendente. Notemos que U es algebraicamente dependiente si, y sólo si, no
es algebraicamente independiente, es decir, al menos un subconjunto finito
no vacío {u1 , . . . , un } de U es algebraicamente dependiente.
(v) El contenido del teorema 2.6.4 también válido en este caso: si U es
algebraicamente independiente, entonces una relación entre elementos de
U de la forma f (u1 , . . . , un ) = 0, donde f es un polinomio con coeficientes
de 𝔽 , se cumple si, y sólo si, f es el polinomio nulo.
(vi) Veamos ahora la versión general del corolario 2.6.5: sea U alge-
braicamente independiente sobre 𝔽 ; consideremos el anillo de polinomios
𝔽 [X] con coeficientes en 𝔽 en un conjunto de X de indeterminadas de car-
Extensiones de cuerpos · 83

dinalidad igual a la de U . Asignado a cada polinomio f (x1 , . . . , xn ) ∈ 𝔽 [X]


el elemento f (u1 , . . . , un ) ∈ 𝔽 [U ] se obtiene un homomorfismo de anillos
de 𝔽 [X] en el subanillo 𝔽 [U ] de 𝔽 (U ). Como U es algebraicamente inde-
pendiente sobre 𝔽 , entonces se tiene el isomorfismo 𝔽 [X]  𝔽 [U ], el cual
induce el isomorfismo de sus cuerpos de fracciones, 𝔽 (X)  𝔽 (U ). La ex-
tensión 𝔽 (U ) de 𝔽 se denomina extensión trascendente del cuerpo 𝔽 y la
cardinalidad de U se conoce como el grado de trascendencia de 𝔽 (U ).

Probaremos ahora que cada extensión de un cuerpo 𝔽 es el resultado de


una extensión trascendente seguida de una extensión algebraica.

Proposición 2.6.7. Sea 𝕂 una extensión del cuerpo 𝔽 . Entonces, cada subconjun-
to X de 𝕂 es equivalente, en el sentido de la dependencia algebraica, a un subconjunto
X ′ ⊆ X, el cual es algebraicamente independiente sobre 𝔽 .

Demostración. De acuerdo con el teorema de Zermelo, podemos asumir que


X es totalmente ordenado, (X , ⪯). El subconjunto X ′ se define de la si-
guiente forma:
 

a no depende algebraicamente
X := a ∈ X ,
del intervalo Ua que lo precede

con Ua := {u ∈ X | u ≺ a}. Entonces, X ′ tiene las siguientes propiedades:


(i) X ′ es algebraicamente independiente sobre 𝔽 . En efecto, si supone-
mos lo contrario, existe un elemento v ∈ X ′ que depende algebraicamente
de los restantes, por lo tanto, existe un conjunto finito {a1 , . . . , an } ⊆ X ′ tal
que v depende algebraicamente de ellos. El conjunto {a1 , . . . , an } se pue-
de tomar de tamaño mínimo, de tal manera que para cada 1 ≤ i ≤ n, v
no depende algebraicamente de a1 , . . . , ai−1 , ai+1 , . . . , an . Según el teore-
ma 2.6.2, cada ai depende algebraicamente de a1 , . . . , ai−1 , v, ai+1 , . . . , an .
Denotemos an+1 := v, entonces en el conjunto {a1 , . . . , an , an+1 } cada ele-
mento depende de los restantes. Consideremos el mayor elemento del con-
junto {a1 , . . . , an , an+1 }, entonces este elemento no está en X ′, contradic-
ción.
(ii) Es claro que X ′ depende algebraicamente de X ya que X ′ depende
algebraicamente de si mismo. Veamos que X depende algebraicamente de
X ′. En efecto, si suponemos lo contrario, existe al menos un elemento en X
que no depende algebraicamente de X ′, en la colección de tales elementos,
sea a mínimo; por su puesto a no pertenece a X ′, con lo cual a depende
del intervalo Ua que lo precede; por la condición de a, cada elemento de Ua
depende de X ′ y esto implica que a depende de X ′, lo cual es una contra-
dicción. ✓

84 · Extensiones de cuerpos

Proposición 2.6.8. Sea 𝕂 una extensión del cuerpo 𝔽 y sean X ⊆ Y ⊆ 𝕂. Enton-


ces, cada subconjunto X ′ de X algebraicamente independiente sobre 𝔽 y equivalente
a X puede ser extendido a un subconjunto Y ′ de Y algebraicamente independiente
sobre 𝔽 y equivalente a Y .

Demostración. Ordenemos completamente a Y de tal forma que los elemen-


tos de X resulten predecesores de los elementos restantes de Y . Sea Y ′ el
subconjunto de Y construido en la prueba de la proposición anterior. Cla-
ramente X ′ ⊆ Y ′. ✓

Teorema 2.6.9. Sea 𝕂 una extensión del cuerpo 𝔽 . Entonces, 𝕂 se obtiene de 𝔽


por medio de una extensión trascendente de 𝔽 seguida de una extensión algebraica.

Demostración. Sea X := 𝕂 y sea X ′ el subconjunto de X que es algebrai-


camente independiente y equivalente a X (proposición 2.6.7). Como X es
equivalente a X ′ sobre 𝔽 , cada elemento de 𝕂 = X es algebraico sobre 𝔽 (X ′)
(véase el numeral (i) de la observación 2.6.6), es decir, 𝕂 es una extensión
algebraica de 𝔽 (X ′), y esta última es una extensión trascendente de 𝔽 .
Hemos demostrado que

𝕂 = 𝔽 (X ′) (Y ), con Y := 𝕂 − 𝔽 (X ′).

SiY = ∅, entonces 𝕂 = 𝔽 (X ′) es una extensión trascendente de 𝔽 ; si X ′ = ∅,


entonces 𝕂 = 𝔽 (Y ) es una extensión algebraica de 𝔽 . ✓

Observación 2.6.10. (i) El conjunto X ′ del teorema anterior no es úni-


co, pero su cardinalidad sí. En efecto, se tiene el siguiente resultado: dos
conjuntos algebraicamente independientes y equivalentes son equipotentes
(véase Haupt, O., Einführung in die Algebra II, Kap. 23,6). La cardinalidad
de X ′ se denomina el grado de trascendencia de 𝕂 sobre 𝔽 .

Para grados de trascendencia finitos se tiene la siguiente propiedad.

Corolario 2.6.11. Sea E ⊇ 𝔽 una extensión trascendente finita de 𝔽 de grado s


y sea 𝕂 ⊇ E una extensión trascendente finita de E de grado t. Entonces, 𝕂 ⊇ 𝔽
es una extensión trascendente finita de 𝔽 de grado s + t.

Demostración. Sea 𝔽 ⊆ E ⊆ 𝕂; sea X un subconjunto de E algebraicamente


independiente sobre 𝔽 y equivalente a E de tamaño |X | = s (véase la prueba
del teorema 2.6.9) y sea Y un subconjunto de 𝕂 algebraicamente indepen-
diente sobre E equivalente a 𝕂 de tamaño |Y | = t. Puesto que X ∩ Y = ∅,
entonces |X ∪ Y | = s + t. La idea es demostrar que X ∪Y es algebraicamente
independiente sobre 𝔽 , y además, equivalente a 𝕂. Según vimos en la de-
mostración del teorema 2.6.9, 𝕂 es una extensión algebraica de E(Y ), y a su
Extensiones de cuerpos · 85

vez, E es una extensión algebraica de 𝔽 (X), por lo tanto, 𝕂 es una extensión


algebraica de 𝔽 (X , Y ). Esto dice que 𝕂 y X ∪ Y son conjuntos algebraica-
mente equivalentes sobre 𝔽 . Supongamos que se tiene una relación entre
elementos u1 , . . . , un de X ∪ Y de la forma f (u1 , . . . , un ) = 0, donde f es
un polinomio con coeficientes de 𝔽 , entonces nótese que en dicha relación
no pueden aparecer elementos de Y (de lo contrario, existiría una relación
entre estos elementos con coeficientes de E, lo cual contradice la indepen-
dencia algebraica de Y sobre E). Así, la relación mencionada solo involucra
elementos de X con coeficientes de 𝔽 , por lo tanto f = 0. Esto quiere decir
que X ∪ Y es algebraicamente independiente sobre 𝔽 . ✓

Concluimos esta sección ilustrando el teorema 2.6.9 y describiendo to-


dos los generadores de 𝔽 (x) (recordemos que cada extensión trascendente
simple del cuerpo 𝔽 es equivalente a 𝔽 (x), proposición 2.1.15). Además,
caracterizaremos todos los automorfismos de 𝔽 (x) que dejan fijo 𝔽 .

Definición 2.6.12. Sea 𝔽 un cuerpo y sea

f (x)
0≠z= ∈ 𝔽 (x), con m. c. d.( f (x), g (x)) = 1.
g (x)

Se denomina grado de z al mayor de los grados de f (x) y g (x). Para z = 0


no se define grado.

Proposición 2.6.13. Sean 𝔽 un cuerpo y z ∈ 𝔽 (x) de grado n ≥ 1. Entonces,

(i) z es trascendente sobre 𝔽 .

(ii) 𝔽 (x) es una extensión algebraica de 𝔽 (z) de grado n,

𝔽 ⊊ 𝔽 (z) ⊆ 𝔽 (x), 𝔽 (x) = 𝔽 (z)(x), [𝔽 (x) : 𝔽 (z)] = n.

f (x)
Demostración. (i) Sea z = g (x) , donde f (x) y g (x) son primos relativos; sean

g (x) := g0 + g1 x + · · · + gr x r ≠ 0 y f (x) := f0 + f1 x + · · · + fs x s .

Entonces, el elemento x ∈ 𝔽 (x) satisface la ecuación g (x)z − f (x) = 0 con


coeficientes en 𝔽 (z):

(g0 z − f0 ) + (g1 z − f1 )x + · · · + (gr z − fr )x r − fr+1 x r+1 − · · · − fs x s = 0.

No todos los coeficientes en esta ecuación son nulos: en efecto, supongamos


lo contrario, entonces z = gfrr ; si fr = 0, entonces z = 0, falso; si fr ≠ 0,
entonces z es de grado cero, falso. Así, x es algebraico sobre 𝔽 (z). Notemos
86 · Extensiones de cuerpos

que z no es algebraico sobre 𝔽 ya que de lo contrario x sería algebraico sobre


𝔽 , lo cual es falso. Por lo tanto, z es trascendente sobre 𝔽 .
(ii) Tenemos que x es raíz del polinomio

g (y)z − f (y) = (g0 z − f0 ) + · · · + (gr z − fr )y r − fr+1 y r+1 − · · · − fs y s ,

el cual tiene grado n y está en 𝔽 (z) [y]. Veamos que este polinomio es irredu-
cible: si fuera reducible, entonces sería reducible como elemento de
𝔽 [z] [y] = 𝔽 [z, y] (proposición 1.4.5),

g (y)z − f (y) = p(y, z)q(y, z),

pero como g (y)z − f (y) es lineal respecto a z, entonces uno de los factores
depende solamente de y y el otro depende linealmente de z,

g (y)z − f (y) = p(y) (q0 (y) + q1 (y)z),

luego g (y) = p(y)q1 (y) y − f (y) = p(y)q0 (y), pero esto es una contradicción
ya que g (y) y f (y) son primos relativos.
Como conclusión, tenemos que x es algebraico de grado n sobre el cuer-
po 𝔽 (z), y así, [𝔽 (x) : 𝔽 (z)] = n. □✓

Corolario 2.6.14. Sean 𝔽 un cuerpo y z ∈ 𝔽 (x). Entonces,

(i) 𝔽 (z) = 𝔽 (x) si, y sólo si, z es de grado 1. En otras palabras, los únicos
generadores de 𝔽 (x) son de la forma
ax + b
z= ,
cx + d
con ad − bc ≠ 0.

(ii) Cualquier automorfismo del cuerpo 𝔽 (x) que deje fijos los elementos de 𝔽
debe enviar el elemento x en un generador z de 𝔽 (x). Recíprocamente, si z
es un generador de 𝔽 (x), existe un único automorfismo 𝜑 : 𝔽 (x) −→ 𝔽 (x)
tal que 𝜑(x) = z y 𝜑 deja fijo los elementos de 𝔽 . En otras palabras, los
automorfismos de 𝔽 (x) sobre 𝔽 vienen definidos por:
ax + b
x ↦−→ z = , con ad − bc ≠ 0.
cx + d

Demostración. (i) ⇒): sea z ∈ 𝔽 (x) tal que 𝔽 (z) = 𝔽 (x), entonces z no es
de grado 0 (si fuera de grado 0 estaría en 𝔽 , y entonces, 𝔽 (z) = 𝔽 ⊊ 𝔽 (x));
resulta entonces que z es de grado n ≥ 1. Por la proposición anterior, z es
trascendente sobre 𝔽 y [𝔽 (x) : 𝔽 (z)] = n, pero como 𝔽 (x) = 𝔽 (z), entonces
Extensiones de cuerpos · 87

n = 1. Así, z es otro generador de la extensión trascendente 𝔽 (x), y es de la


forma,
ax + b
z= .
cx + d
Como z es de grado 1 y ax + b, cx + d son primos relativos, entonces nece-
sariamente ad − bc ≠ 0. En efecto, supongamos que ad − bc = 0; a y c no
pueden ser simultáneamente nulos ya que de lo contrario z sería de grado
0; supongamos que c ≠ 0, dividimos ax + b entre cx + d y obtenemos

a bc − ad a
ax + b = (cx + d) + = (cx + d),
c c c
y ax + b, cx + d no serían primos relativos. De igual manera si a ≠ 0.
ax+b
⇐): sea z de grado 1, entonces nuevamente z es de la forma z = cx+d ,
con ad − bc ≠ 0; según la proposición 2.6.13, [𝔽 (x) : 𝔽 (z)] = 1, luego,
𝔽 (x) = 𝔽 (z).
(ii) Sea 𝜑 : 𝔽 (x) −→ 𝔽 (x) un automorfismo que deja fijos los elementos
de 𝔽 y sea z := 𝜑(x). Entonces, para cada p(x)q(x) −1 ∈ 𝔽 (x) se tiene que

𝜑(p(x)q(x) −1 ) = p(z)q(z) −1 ∈ 𝔽 (z),

es decir,
𝔽 (x) = 𝜑(𝔽 (x)) ⊆ 𝔽 (z) ⊆ 𝔽 (x),
luego 𝔽 (x) = 𝔽 (z). Esto dice que z es un elemento generador de 𝔽 (x).
Recíprocamente, sea z un generador de 𝔽 (x), es decir, 𝔽 (z) = 𝔽 (x); por
la parte (i), z es de grado 1, luego z es trascendente sobre 𝔽 (proposición
2.6.13). Esto dice que si g (x) ∈ 𝔽 [x] es no nulo, entonces g (z) ≠ 0.
La función 𝜑 ′ : 𝔽 [x] −→ 𝔽 (z) = 𝔽 (x) definida por 𝜑 ′ ( f (x)) := f (z)
es un homomorfismo inyectivo de anillos, luego por la propiedad univer-
sal de 𝔽 (x) existe un único homomorfismo 𝜑 : 𝔽 (x) −→ 𝔽 (z) dado por
𝜑( f (x) g (x) −1 ) := f (z) g (z) −1 . Notemos que 𝜑(x) = z y 𝜑(a) = a para cada
a ∈ 𝔽 . Además, 𝜑 es biyectivo. ✓

7. Ejercicios
1. Sean 𝕃, 𝕂, 𝔽 cuerpos tales que 𝔽 ⊆ 𝕂 ⊆ 𝕃. Demuestre que:

(a) Si [𝕃 : 𝔽 ] = [𝕂 : 𝔽 ], entonces 𝕂 = 𝕃.
(b) Si [𝕃 : 𝕂] = [𝕃 : 𝔽 ], entonces 𝕂 = 𝔽 .

Todas las dimensiones se suponen finitas.


88 · Extensiones de cuerpos

2. Sea 𝔽 la clase de todas las extensiones de un cuerpo fijo 𝔽 . Demuestre


que en 𝔽 la relación “ser equivalente a” es una relación de equivalen-
cia.

3. Para cada uno de los complejos dados a continuación, determine su


polinomio mínimo sobre ℚ y su grado:

(a) 1 + 3.
√ √
(b) 2 + 5.
√︁ √3
(c) 1 − 2.
√4
(d) 2.
√ √
(e) 2 + 3i.

4. Determine el cuerpo de descomposición de los siguientes polinomios


sobre ℚ:

(a) x 3 + 2.
(b) x 4 + x 2 + 1.
(c) x 6 + 1.
(d) x 4 − 2.
(e) x 5 − 1.
√3 √3
5. Sea 𝜑 : ℚ( 2) −→ ℚ( 2) un automorfismo. Demuestre que 𝜑 es
necesariamente el idéntico.
√ √
6. Calcule el polinomio mínimo y el grado de 3 + 5 sobre ℚ.
√ √ √ √
7. Demuestre que ℚ( 3, 5) = ℚ( √3 + √5) (sugerencia: utilice el ejer-
cicio anterior, o también, calcule ( 3 + 5) −1 ).

8. Sea 𝕂 una extensión del cuerpo 𝔽 de tal forma que [𝕂 : 𝔽 ] es un


número primo. Demuestre que 𝕂 es una extensión simple de 𝔽 .

9. Sea 𝕂 una extensión algebraica del cuerpo 𝔽 y sea R un dominio de


integridad tal que 𝔽 ⊆ R ⊆ 𝕂. Demuestre que R es un cuerpo.

10. Sean 𝕂, 𝕃 ⊆ C cuerpos. Sea


n
∑︁
R := { ai bi | ai ∈ 𝕂, bi ∈ 𝕃, 1 ≤ i ≤ n, n ≥ 1}
i=1

(i) Demuestre que R es un dominio de integridad.


Extensiones de cuerpos · 89

(ii) Demuestre que su cuerpo de fracciones Q coincide con 𝕂𝕃, de-


finido éste como el menor subcuerpo de Q que contiene a 𝕂 ∪𝕃,
es decir, Ù
𝕂𝕃 := C ′.
(𝕂∪𝕃) ⊆C ′ ⊆C

(iii) Sea 𝔽 ⊆ 𝕂 ∩ 𝕃. Demuestre que 𝕂𝕃 es una extensión algebraica


de 𝔽 si, y sólo si, 𝕂 y 𝕃 son extensiones algebraicas de 𝔽 .
(iv) Demuestre que si 𝕂 es una extensión algebraica de 𝔽 , entonces
𝕂𝕃 es una extensión algebraica de 𝕃.
Capítulo
tres
Fundamentos de
la teoría de Galois
Fundamentos de la teoría de Galois · 93

El presente capítulo contiene varias herramientas importantes para el es-


tudio de la teoría de Galois. Las extensiones normales, el grupo de raíces
de la unidad, los polinomios ciclotómicos, los cuerpos finitos, la extensiones
separables y los cuerpos perfectos son algunos de los elementos que exami-
naremos ahora.

1. Extensiones normales
Definición 3.1.1. Una extensión 𝕂 de un cuerpo 𝔽 se dice normal (también
denominada extensión de Galois de 𝔽 ) si satisface las siguientes condicio-
nes:

(i) 𝕂 es una extensión algebraica de 𝔽 .

(ii) Si p(x) ∈ 𝔽 [x] es irreducible y tiene al menos una raíz en 𝕂, entonces


p(x) se descompone completamente en 𝕂 [x] en factores lineales.

Teorema 3.1.2. Sea 𝔽 un cuerpo. Entonces,

(i) Sea ∅ ≠ P ⊆ 𝔽 [x] un subconjunto no vacío de polinomios de 𝔽 [x]. Enton-


ces, 𝔽 (P) con

P := {𝛼 ∈ 𝔽 | p(𝛼) = 0 para algún p(x) ∈ P de grado ≥ 1}

es una extensión normal de 𝔽 .

(ii) Recíprocamente, cualquier extensión normal 𝕂 de 𝔽 se obtiene mediante ad-


junción a 𝔽 de todas las raíces en 𝔽 de todos los polinomios de un cierto
subconjunto no vacío P de 𝔽 [x]. Además, si [𝕂 : 𝔽 ] < ∞, entonces 𝕂
se obtiene mediante adjunción de todas las racíces de un conjunto finito de
polinomios.

(iii) El cuerpo de descomposición de cualquier polinomio p(x) ∈ 𝔽 [x] de grado


n ≥ 1 es una extensión normal de 𝔽 .

(iv) La clausura algebraica 𝔽 de 𝔽 es una extensión normal de 𝔽 .

Demostración. (i) Dividimos la prueba en tres casos.


Caso 1, el conjunto P es unitario: sea P := {p(x)}, con gr(p(x)) ≥ 1. Sean
𝛼1 , . . . , 𝛼n las raíces de p(x) en 𝔽 , veamos que 𝔽 (𝛼1 , . . . , 𝛼n ) es una exten-
sión normal de 𝔽 . Sabemos que 𝔽 (𝛼1 , . . . , 𝛼n ) es una extensión algebraica
de 𝔽 ; sea g (x) ∈ 𝔽 [x] un polinomio irreducible con una raíz
𝛼 ∈ 𝔽 (𝛼1 , . . . , 𝛼n ). Si g (x) no se descompone completamente sobre
94 · Fundamentos de la teoría de Galois

𝔽 (𝛼1 , . . . , 𝛼n ) en factores lineales, entonces existe 𝛼 ′ raíz de g (x) que no


pertenece a 𝔽 (𝛼1 , . . . , 𝛼n ) y adicionamos 𝛼 ′ a la extensión 𝔽 (𝛼1 , . . . , 𝛼n );
obtenemos así el cuerpo 𝔽 (𝛼1 , . . . , 𝛼n ) (𝛼 ′) = 𝔽 (𝛼 ′ , 𝛼1 , . . . , 𝛼n ). Según la
proposición 2.1.15, 𝔽 (𝛼)  𝔽 (𝛼 ′) y en este isomorfismo 𝛼 es enviado en
𝛼 ′ y los elementos de 𝔽 quedan invariantes, en particular esto se tiene para
los coeficientes de g (x). Podemos ahora adicionar todas las raíces de p(x) y
extender el isomorfismo anterior a un isomorfismo

𝔽 (𝛼 , 𝛼1 , . . . , 𝛼n )  𝔽 (𝛼 ′ , 𝛼1 , . . . , 𝛼n )

de tal manera que a ↦−→ a, 𝛼 ↦−→ 𝛼 ′, 𝛼i ↦−→ 𝛼 j , con a ∈ 𝔽 (véase la de-


mostración del lema 2.4.12). 𝛼 es una función racional en 𝛼1 , . . . , 𝛼n con
coeficientes en 𝔽 , luego mediante el isomorfismo anterior 𝛼 ′ es también una
función racional en 𝛼1 , . . . , 𝛼n con coeficientes en 𝔽 , pero esto es una con-
tradicción ya que habíamos supuesto así que 𝛼 ′ ∉ 𝔽 (𝛼1 , . . . , 𝛼n ). Hemos
probado que 𝔽 (𝛼1 , . . . , 𝛼n ) es una extensión normal de 𝔽 .
Caso 2, el conjunto P es finito: sea P := {p1 (x), . . . , pt (x)}, con
gr(pi (x)) ≥ 1, 1 ≤ i ≤ t. Sea p(x) := p1 (x) · · · pt (x), entonces el con-
junto P en este caso coincide con el conjunto de todas las raíces de p(x), y
por lo tanto, aplicamos el caso 1.
Caso 3, P es un conjunto arbitrario no vacío: supongamos que P es un con-
junto no vacío de polinomios de 𝔽 [x], cada uno de grado ≥ 1. Puesto que
cada elemento de P es algebraico sobre 𝔽 , entonces 𝔽 (P) es una extensión
algebraica de 𝔽 . Sea p(x) ∈ 𝔽 [x] irreducible y supongamos que p(x) tiene
una raíz 𝛼 en 𝔽 (P), entonces existe un subconjunto finito 𝛼1 , . . . 𝛼 s ∈ P
de tal forma que 𝛼 ∈ 𝔽 (𝛼1 , . . . 𝛼 s ), por lo tanto, existe un conjunto fi-
nito de polinomios P ′ := {p1 (x), . . . , pl (x)} ⊂ 𝔽 [x] de tal forma que
P′ = {𝛼1 , . . . 𝛼 s }. Esto dice que 𝛼 ∈ 𝔽 (P′), luego por el caso 2, p(x) se
descompone completamente en 𝔽 (P′) [x] ⊆ 𝔽 (P) [x]. Se tiene entonces
que 𝔽 (P) es una extensión normal de f .
(ii) Sea 𝕂 una extensión normal de 𝔽 ; como 𝕂 es una extensión algebrai-
ca de 𝔽 , todos los elementos de 𝕂 son algebraicos sobre 𝔽 , luego podemos
decir que 𝕂 es de la forma 𝕂 = 𝔽 (S), con S un subconjunto de elementos de
𝕂 que son algebraicos sobre 𝔽 (en el peor de los casos S = 𝕂; si la extensión
es finita, entonces de acuerdo con el teorema 2.2.2, el conjunto S es finito).
Cada elemento 𝛼 ∈ S es raíz de un polinomio p(x) ∈ 𝔽 [x] de grado ≥ 1
(es entonces claro que S ⊂ 𝔽 ); sea P el conjunto de tales polinomios. Co-
mo 𝕂 es normal sobre 𝔽 , entonces p(x) se descompone completamente en
𝕂 [x] en factores lineales. Adjuntando a 𝔽 el conjunto P de todas las raíces
de todos los polinomios de P se obtiene también el cuerpo 𝔽 (S), es decir,
𝕂 = 𝔽 (S) = 𝔽 (P).
Fundamentos de la teoría de Galois · 95

(iii) Esto es consecuencia de (i) tomando P := {p(x)}.


(iv) Se obtiene también de (i) tomando P := 𝔽 [x]. ✓

Corolario 3.1.3. Sea 𝕂 una extensión finita de un cuerpo 𝔽 . 𝕂 es normal si, y


sólo si, 𝕂 es el cuerpo de descomposición de algún polinomio p(x) ∈ 𝔽 [x].
Demostración. ⇒): según (ii) del teorema anterior, 𝕂 se obtiene de 𝔽 adjun-
tando todas las raíces de un conjunto finito de polinomios p1 (x), . . . , pt (x)
de 𝔽 [x]. Como el caso 2 de la prueba de (i) en el teorema anterior, sea
p(x) := p1 (x) · · · pt (x). Entonces, claramente 𝕂 es el cuerpo de descompo-
sición de p(x) (teorema 2.4.7).
⇐): este es la parte (iii) del teorema anterior. ✓

Corolario 3.1.4. Sean 𝔽 ⊆ 𝕃 ⊆ 𝕂 extensiones. Si 𝕂 es una extensión normal de


𝔽 , entonces 𝕂 es una extensión normal de 𝕃.
Demostración. Según la parte (ii) del teorema anterior, 𝕂 es de la forma
𝕂 = 𝔽 (P), con P un subconjunto no vacío de polinomios de 𝔽 [x]; el resul-
tado se obtiene entonces de manera trivial de la parte (i) de dicho teorema,
ya que 𝔽 [x] ⊆ 𝕃[x]. ✓

Definición 3.1.5. Sea 𝔽 un cuerpo y sea p(x) ∈ 𝔽 [x] un polinomio irre-


ducible. Se dice que la ecuación p(x) = 0 es normal si el cuerpo resultado
de adjuntar a 𝔽 una de las raíces de p(x) es normal.
Ejemplo 3.1.6. Según el numeral (vii) del ejemplo 2.4.14, si p es irredu-
cible entonces la ecuación x p−1 + x p−2 + · · · + x + 1 = 0 es normal. En efecto,
el cuerpo de descomposición del polinomio ciclotómico

fp (x) = x p−1 + x p−2 + · · · + x + 1

es ℚ(𝛼), donde 𝛼 es una de las raíces de fp (x).


Ejemplo 3.1.7. Sea 𝕂 ⊇ 𝔽 tal que [𝕂 : 𝔽 ] = 2. Entonces, 𝕂 es una ex-
tensión normal de 𝔽 . En efecto, como la extensión es finita, entonces es
algebraica. Sea p(x) ∈ 𝔽 [x] irreducible de grado m ≥ 1 y 𝛼 una raíz de p(x)
en 𝕂, entonces 𝕂 ⊇ 𝔽 (𝛼) ⊇ 𝔽 y

2 = [𝕂 : 𝔽 ] = [𝕂 : 𝔽 (𝛼)] [𝔽 (𝛼) : 𝔽 ] = [𝕂 : 𝔽 (𝛼)]m

(véase el corolario 2.1.5). Se tiene entonces que m = 1 ó m = 2. En el primer


caso, p(x) se descompone completamente en 𝔽 [x] ⊆ 𝕂 [x]. En el segundo
caso, p(x) = (x − 𝛼) (𝜆 x + 𝛽 ), con 𝜆 x + 𝛽 ∈ 𝕂 [x], luego p(x) también se
descompone completamente en 𝕂 [x]. Esto prueba que 𝕂 es una extensión
normal de 𝔽 .
96 · Fundamentos de la teoría de Galois

Ejemplo 3.1.8. Sean 𝔽 ⊆ 𝕂 ⊆ 𝕃 extensiones. Si 𝕃 es una extensión normal


de 𝕂 y 𝕂 es una extensión normal de 𝔽 , entonces no siempre 𝕃 es una√ex-
tensión normal de 𝔽 . En efecto, de acuerdo con el ejemplo
√4 anterior, ℚ( 3)
es una extensión
√ normal de ℚ; de manera análoga,
√4 ℚ( √ 3) es una extensión

normal de ℚ( 3) (el polinomio mínimo de 3 sobre ℚ( 3) es x 2 − 3). Pe-
√4
ro ℚ( 3) no es una extensión normal de ℚ. En efecto, p(x) := x 4 −3 ∈ ℚ[x]
es irreducible (criterio
√4 √4 con p = 3), pero no todas las raíces
de Eisenstein √4 de
p(x) están en ℚ( 3): en efecto, i 3 es raíz pero no pertenece a ℚ( 3).

Ejemplo 3.1.9. Sea p(x) := x 3 − 2 ∈ ℚ[x] y 𝛽 una raíz cualquiera de p(x).


Notemos que la ecuación x 3 − 2 = 0 no es normal ya que ℚ( 𝛽 ) no es una
extensión normal de ℚ. En efecto, según el ejemplo 2.4.16, las raíces de
p(x) son

√3 2 −1 + 3i
𝜃 = 2, 𝜃 𝛼 y 𝜃 𝛼 , con 𝛼 := ,
2
y el cuerpo de descomposición es ℚ(𝜃 , 𝛼) ≠ ℚ(𝜃), ℚ(𝛼). Este ejemplo
también permite ilustrar que no toda extensión finita (algebraica) es normal:
en efecto, vimos en el ejemplo 2.4.16 que [ℚ(𝛼 , 𝜃) : ℚ] = 6.

2. Raíces de la unidad
Sea 𝔽 un cuerpo y n ≥ 1 un número natural. Estudiaremos en esta sección
el conjunto de elementos de 𝔽 que son raíces de la ecuación x n − 1 = 0 y las
llamaremos raíces n-ésimas de la unidad en 𝔽 . Para comenzar, veamos el
caso particular de los números complejos.

Ejemplo 3.2.1. Sea 𝜁 = r (cos 𝜃 +i sen 𝜃) ∈ ℂ una raíz de x n −1 = 0, enton-


ces r = 1 y 𝜁 = cos 𝜃 + i sen 𝜃, con 𝜃 = k 2𝜋
n , 0 ≤ k ≤ n − 1. Así, las n raíces
distintas en ℂ de la unidad son 1, 𝜁 , 𝜁 , . . . , 𝜁 n−1 , las cuales geométrica-
2

mente se pueden representar por n puntos sobre la circunferencia compleja


con centro en origen al dividir ésta en n partes iguales. 𝜁 se conoce como la
n-ésima raíz primitiva de la unidad.

Regresamos a considerar el caso de un cuerpo cualquiera 𝔽 . Sea


p := char(𝔽 ); sea p primo con n = p r m, p ∤ m. Observemos que el conjunto
de raíces n-ésimas coincide con el conjunto de raíces m-ésimas: en efecto, si
r
a ∈ 𝔽 es tal que am = 1, entonces a n = a p m = 1; recíprocamente, si a n = 1,
entonces, como la característica de 𝔽 es p, por inducción sobre r se puede
r r r r
demostrar que (am − 1) p = (am ) p − 1p , de donde, (a m − 1) p = a n − 1 = 0,
Fundamentos de la teoría de Galois · 97

por lo tanto, am − 1 = 0, y de esta manera, a es raíz m-ésima de la uni-


dad. Para p = 0 tomamos m = n, y también en este caso, p ∤ m. Así, para
cualquiera de los dos casos podemos asumir que p ∤ n.

Teorema 3.2.2. Sea 𝔽 un cuerpo y n ≥ 1 tal que char(𝔽 ) ∤ n.

(i) Las raíces n-ésimas de la unidad que pertenezcan a 𝔽 conforman un subgrupo


G𝔽 de 𝔽 ∗ , con |G𝔽 | ≤ n.

(ii) Sea 𝕂 el cuerpo de descomposición de x n − 1 ∈ 𝔽 [x]. Entonces, G𝕂 es cíclico


de tamaño n, es decir, G𝕂  ℤn . Cada generador 𝜁 de G𝕂 se conoce como
una raíz primitiva n-ésima de la unidad y 𝕂 = 𝔽 (𝜁 ).

Demostración. (i) Es claro que G𝔽 ⊂ 𝔽 ∗ ; G𝔽 no es vacío ya que 1 ∈ G𝔽 ; si


a, b ∈ G𝔽 , entonces (ab) n = a n b n = 1, luego ab ∈ G𝔽 ; también es obvio que
a−1 ∈ G𝔽 . Según la proposición 2.4.4, |G𝔽 | ≤ n.
(ii) La prueba de esta parte la dividimos en tres pasos.
Paso 1. Como 𝕂 ⊇ 𝔽 , es claro que char(𝕂) = char(𝔽 ). Al igual que en
(i), G𝕂 es un subgrupo de 𝕂 ∗ . Sabemos que 𝕂 = 𝔽 (G𝕂 ), probemos que G𝕂
es de tamaño n. Puesto que x n − 1 se descompone completamente en 𝕂
en producto de n factores lineales, basta mostrar que x n − 1 no tiene raíces
múltiples. Supongamos lo contrario, sea 𝛼 una raíz múltiple de x n − 1, es
claro que 𝛼 ≠ 0; tenemos x n − 1 = (x − 𝛼) t h(x), con t ≥ 2 y (x − 𝛼) ∤ h(x);
tomando la derivada formal entontramos que

nx n−1 = t(x − 𝛼) t−1 h(x) + (x − 𝛼) t h ′ (x)

. Como p ∤ n la única raíz del lado izquierdo es 0, pero 𝛼 es raíz del lado
derecho, contradicción. Esto prueba que |G𝕂 | = n.
Paso 2. Veamos que G𝕂 es cíclico. Sea n = q1r1 · · · qtrt la descomposición
irreducible de n; si t = 1 y r1 = 1, entonces |G𝕂 | = q1 y claramente G𝕂 es
cíclico. Supongamos entonces que t ≥ 2 o t = 1 pero r1 ≥ 2. Consideremos
en G𝕂 el conjunto de elementos a tales que
n
a qi = 1.

n
La cantidad de tales elementos es a lo sumo qi (esto se obtiene de (i) al
n
considerar la ecuación x qi
− 1 = 0). Por lo tanto, en G𝕂 existe al menos un
elemento ai tal que
n
q
ai i ≠ 1.
98 · Fundamentos de la teoría de Galois

n
Sea si := qiri y sea bi := ai i ; notemos que bi es de orden si : en efecto, puesto
s

que bisi = bin = 1 (esto último debido a que bi ∈ G𝕂 ), entonces el orden de bi


divide a si , es decir, |bi | = qil , con 0 ≤ l ≤ ri ; si l < ri , entonces

n nq l
i
n r r
ql si qil q i qil q i
1= bi i = (ai ) = (ai ) = ai i i

n
y al elevar al exponente qiri −l−1 encontraríamos que ai i = 1, contradicción.
q

Hemos demostrado que para cada 1 ≤ i ≤ t, existe un elemento bi ∈ G𝕂


de orden si . Sea 𝜁 := b1 · · · bt ∈ G𝕂 ; puesto que los órdenes s1 , . . . , st son
primos relativos, entonces el orden del elemento 𝜁 es s1 . . . st = n (véase
[22]). Esto completa la prueba de que G𝕂 es cíclico con generador 𝜁 .
Paso 3. Tenemos que G𝕂 = {1, 𝜁 , 𝜁 2 , . . . , 𝜁 n−1 }, luego 𝕂 = 𝔽 (𝜁 ). De
manera complementaria notemos que G𝔽 es un subgrupo de G𝕂 , luego G𝔽
es también cíclico y |G𝔽 | divide n. □✓

Corolario 3.2.3. Sea 𝔽 un cuerpo y G un subgrupo finito de 𝔽 ∗ . Entonces, G es


cíclico.

Demostración. Sea G de tamaño n ≥ 1; cada elemento g ∈ G satisface


g n = 1. Si char(𝔽 ) = 0, entonces char(𝔽 ) ∤ n, aplicamos el paso 3 de la
demostración del teorema anterior y encontramos que G𝔽 es cíclico, con lo
cual G ⊆ G𝔽 es cíclico. Si char(𝔽 ) = p es primo y p ∤ n, entonces nue-
vamente G ⊆ G𝔽 es cíclico. Si p | n, entonces tal y como vimos arriba,
para n = p r m, p ∤ m, G coincide con el grupo cíclico correspondiente a la
ecuación x m − 1 = 0. □✓

Concluimos esta sección extendiendo la noción de polinomio ciclotómi-


co.

Ejemplo 3.2.4. Sea 𝔽 un cuerpo y n ≥ 1 tal que char(𝔽 ) ∤ n. Sea 𝕂 el


cuerpo de descomposición de x n − 1 ∈ 𝔽 [x]. Sean 𝜁1 , . . . , 𝜁s ∈ G𝕂 las
raíces primitivas n-ésimas de la unidad. El n-ésimo polinomio ciclotómico
se define por
fn (x) := (x − 𝜁1 ) · · · (x − 𝜁s ).

Para cada divisor d de n, podemos considerar x d − 1 ∈ 𝔽 [x] y el correspon-


diente polinomio ciclotómico fd (x). Se tiene la siguiente propiedad:
Ö
xn − 1 = fd (x).
d |n
Fundamentos de la teoría de Galois · 99

En efecto, sea Gd el conjunto de raíces primitivas d-ésimas de la unidad.


Probemos que Ø
G𝕂 = · Gd . (2.1)
d |n

Sea d | n con n = dd ′, y sea 𝛼 ∈ Gd , entonces 𝛼 d = 1, luego (𝛼 d ) d =
𝛼 n = 1, es decir, 𝛼 ∈ G𝕂 . Recíprocamente, sea 𝛼 ∈ G𝕂 , entonces 𝛼 n = 1;
sea d mínimo tal que 𝛼 d = 1, es decir, d es el orden del elemento 𝛼 en el
grupo G𝕂 , entonces 𝛼 ∈ Gd y sabemos que d | n (véase [22] o la siguiente
prueba directa: tenemos que n = dd ′ + r, con 0 ≤ r < d, luego 1 = 𝛼 n =

𝛼 dd 𝛼 r = 𝛼 r , y por la condición de d se tiene que r = 0). Hemos demostrado
la igualdad (2.1) y también resulta claro que la unión es disyunta (el orden
de un elemento en un grupo es único). De esto se obtiene que

Ö Ö©Ö ª Ö
xn − 1 = (x − 𝛼) = ­ (x − 𝛼) ® = fd (x).
𝛼 ∈G𝕂 d |n «𝛼 ∈Gd ¬ d |n

En particular, si n = p es primo, entonces


xp − 1
x p − 1 = f1 (x) fp (x) = (x − 1) fp (x) = (x − 1)
x−1
= (x − 1)(x p−1 + x p−2 + · · · + x + 1).

3. Cuerpos finitos
Los cuerpos finitos también se conocen como cuerpos de Galois. Estudiare-
mos en esta sección algunas propiedades elementales de los cuerpos finitos.

Teorema 3.3.1. Sea 𝔽 un cuerpo finito. Entonces,

(i) char(𝔽 ) = p es un primo.

(ii) El subcuerpo primo ℙ de 𝔽 es isomorfo ℤp .

(iii) |𝔽 | = p k , donde k = [𝔽 : ℙ].

(iv) Salvo isomorfismo, existe un único cuerpo finito de tamaño p k y está confor-
k
mado por las raíces del polinomio x p − x. Se denota por GF (p k ).

(v) GF (p k ) ∗ es cíclico y es generado por una cualquiera de las n-ésimas raíces


primitivas de la unidad, con n := p k − 1.

(vi) GF (p k ) = ℙ(𝜁 ), donde 𝜁 es una raíz n-ésima de la unidad. El grado de 𝜁


sobre ℙ es k.
100 · Fundamentos de la teoría de Galois

(vii) Cada z ∈ GF (p k ) es de la forma z = 𝛼 p , con 𝛼 ∈ GF (p k ) único para z, es


decir,
GF (p k ) = GF (p k ) p := {𝛼 p | 𝛼 ∈ GF (p k )}.

(viii) Aut(GF (p k ))  ℤk .

Demostración. (i)-(ii) Recordemos que el subcuerpo primo ℙ de un cuerpo


𝔽 es el cuerpo de fracciones de su subanillo primo P ′; el subanillo primo P ′
es el menor subanillo de 𝔽 que contiene al 1, y por lo tanto, consta de todos
los elementos de la forma k · 1, k ∈ ℤ. Si char(𝔽 ) = 0, entonces P ′  ℤ, y
por lo tanto, ℙ  ℚ; si char(𝔽 ) = p ≠ 0, entonces P ′  ℤp es un dominio
de integridad, por lo tanto p es primo y ℙ  ℤp . Como 𝔽 es finito, entonces
estamos necesariamente en este segundo caso. Esto prueba (i) y (ii).
(iii) 𝔽 es desde luego una extensión de su subcuerpo primo ℙ, y como
𝔽 es finito, entonces claramente [𝔽 : ℙ] := k < ∞; sea {𝛼1 , . . . , 𝛼k } una
ℙ-base de 𝔽 , entonces 𝔽  ℙk (isomorfismo de ℙ-espacios), con lo cual
|𝔽 | = p k .
(iv) Existencia. ¿Existe al menos un cuerpo de tamaño p k ? Consideremos
k
un cuerpo ℙ de tamaño p (por ejemplo, ℤp ) y sea f (x) := x p − x ∈ P [x]; sea
𝕂 el cuerpo de descomposición de f (x) (el cual sabemos que existe, teorema
2.4.7); sea 𝔽 la colección de elementos de 𝕂 que son raíces de f (x); sabemos
que |𝔽 | ≤ p k ; veamos que f (x) no tiene raíces múltiples, con lo cual |𝔽 | = p k .
Se tiene
k
f (x) = x(x p −1 − 1),
k
entonces x = 0 es raíz y pasamos a considerar el polinomio x p −1 − 1. Como
k
char(𝕂) = p ∤ (p k − 1), entonces por la prueba del teorema 3.2.2, x p −1 − 1
no tiene raíces múltiples, así, f (x) no tiene raíces múltiples. Para concluir
la prueba de la existencia, veamos que 𝔽 es un subcuerpo de 𝕂 de tamaño
k k
p k : sean 𝛼 , 𝛽 ∈ 𝔽 , entonces 𝛼 p = 𝛼 y 𝛽 p = 𝛽 , con lo cual
k k k
(𝛼 − 𝛽 ) p = 𝛼 p − 𝛽 p = 𝛼 − 𝛽 ,
k
es decir, 𝛼 − 𝛽 ∈ 𝔽 ; sea 𝛽 ≠ 0, entonces (𝛼 𝛽 −1 ) p = 𝛼 𝛽 −1 , es decir, 𝛼 𝛽 −1 ∈
𝔽.
Unicidad. Sea 𝔽 un cuerpo cualquiera de tamaño p k ; según lo probado en
(i)-(iii), la característica de 𝔽 es p y el subcuerpo primo de 𝔽 es ℙ  ℤp . Con-
sideremos el grupo multiplicativo 𝔽 ∗ del cuerpo 𝔽 ; entonces |𝔽 ∗ | = p k − 1;
k
cada elemento a ∈ 𝔽 ∗ satisface a p −1 = 1 (consecuencia del teorema de
Lagrange de la teoría de grupos, véase [22]), así, cada a ∈ 𝔽 es raíz del po-
k
linomio f (x) = x p − x ∈ ℙ[x]. Esto dice que 𝔽 contiene todas las raíces de
Fundamentos de la teoría de Galois · 101

f (x), y nuevamente, que la cantidad de esas raíces es p k y ningún subcuerpo


propio de 𝔽 contiene todas las raíces, es decir, 𝔽 es el cuerpo de descompo-
sición de f (x). Notemos que esto lo hemos probado para cualquier cuerpo
𝔽 de p k elementos, luego por el teorema 2.4.14, todos los cuerpos de p k
elementos son isomorfos.
(v)-(vi) Según probamos en (iv), existe un único cuerpo de tamaño p k ,
el cual denotamos por GF (p k ), y consta de todas las raíces del polinomio
k
f (x) = x p − x ∈ ℙ[x] y es el cuerpo de descomposición de f (x). Notemos
que GF (p k ) es también el cuerpo de descomposición de x n − 1 ∈ ℙ[x],
con n := p k − 1. Como p ∤ n, podemos aplicar el teorema 3.2.2 y concluir
que GGF (pk ) = GF (p k ) ∗ es cíclico y se genera por cualquiera de las raíces
n-ésimas primitivas de la unidad. Además, GF (p k ) = ℙ(𝜁 ), donde 𝜁 es una
raíz n-ésima primitiva de la unidad. Según (iii),

k = [GF (p k ) : ℙ] = [ℙ(𝜁 ) : ℙ] ,

es decir, el grado de 𝜁 sobre ℙ es k.


(vii) Sean 𝛼 , 𝛽 ∈ GF (p k ) elementos distintos, entonces 𝛼 p ≠ 𝛽 p :

𝛼 p − 𝛽 p = (𝛼 − 𝛽 ) p .

Por lo tanto GF (p k ) = {𝛼 p | 𝛼 ∈ GF (p k )}.


(viii) 𝜑 : GF (p k ) → GF (p k ) dado por 𝛼 ↦−→ 𝛼 p es un automorfismo;
además, 𝜑, 𝜑2 , 𝜑3 , . . . , 𝜑k = iGF (pk ) son también automorfismos, y distin-
tos, para k ≥ 2 (para k = 1, GF (p) = ℙ(𝜁 ) = ℙ  ℤp y el único automorfis-
mo es el idéntico). En efecto, si 𝜁 una raíz n-ésima primitiva de la unidad,
entonces los elementos
2 3 k
𝜑(𝜁 ) = 𝜁 p , 𝜑2 (𝜁 ) = 𝜁 p , 𝜑3 (𝜁 ) = 𝜁 p , . . . , 𝜑k (𝜁 ) = 𝜁 p = 𝜁
r s
son distintos: si 𝜁 p = 𝜁 p con 1 ≤ r < s ≤ k, entonces p r < p s ≤ p k
s r
y p s − p r < p k − 1, con lo cual 𝜁 p −p = 1, falso, ya que el orden de 𝜁 es
p k − 1. Tenemos entonces al menos k automorfismos distintos de GF (p k ).
Por otro lado, GF (p k ) no puede tener más de k automorfismos: en efecto,
sea 𝜑 un automorfismo de GF (p k ); según (vi), 𝜁 es de grado k sobre ℙ y sea
p(x) = p0 + p1 x + · · · + pk−1 x k−1 + x k ∈ ℙ[x] su polinomio mínimo; es claro
que 𝜑 no mueve los elementos del subcuerpo primo ℙ, por lo tanto

𝜑(p0 + p1 𝜁 + · · · + pk−1 𝜁 k−1 + 𝜁 k ) = 𝜑(0) = 0


= p0 + p1 𝜑(𝜁 ) + · · · + pk−1 𝜑(𝜁 ) k−1 + 𝜑(𝜁 ) k ,
102 · Fundamentos de la teoría de Galois

es decir, 𝜁 es enviada en una raíz de p(x), pero como p(x) tiene a lo su-
mo k raíces, entonces las posibilidades de 𝜑 son a lo sumo k. En reali-
dad, hemos demostrado que Aut(GF (p k )) es cíclico de tamaño k, es decir,
Aut(GF (p k ))  ℤk . Esto completa la prueba del teorema. ✓

4. Extensiones separables y cuerpos


perfectos
Definición 3.4.1. Sea 𝔽 un cuerpo.

(i) Un polinomio irreducible p(x) ∈ 𝔽 [x] se dice separable si no tiene


raíces múltiples. En caso contrario, se dice que p(x) es inseparable.

(ii) Un polinomio p(x) ∈ 𝔽 [x] de grado ≥ 1 se dice separable si todos


sus factores irreducibles en 𝔽 [x] son separables. En caso contrario, se
dice que p(x) es inseparable sobre 𝔽 .

(iii) Sea 𝕂 una extensión de 𝔽 . Un elemento 𝛼 ∈ 𝕂 algebraico sobre 𝔽 se


dice separable sobre 𝔽 si su polinomio mínimo sobre 𝔽 es separable.
En caso contrario, se dice que 𝛼 es inseparable sobre 𝔽 .

(iv) Una extensión 𝕂 de 𝔽 es separable si es algebraica y cada uno de sus


elementos es separable sobre 𝔽 . En caso contrario, se dice que 𝕂 es
inseparable.

(v) 𝔽 se dice perfecto si cada polinomio irreducible p(x) ∈ 𝔽 [x] es sepa-


rable.

Es claro que todo cuerpo 𝔽 es una extensión separable de sí mismo. Al-


gunas propiedades menos triviales relacionadas con los conceptos introdu-
cidos anteriormente se presentan a continuación.

Teorema 3.4.2. Sea 𝔽 un cuerpo.

(i) 𝔽 es perfecto si, y sólo si, cada extensión algebraica de 𝔽 es separable.

(ii) Si char(𝔽 ) = 0, entonces 𝔽 es perfecto.

(iii) Si 𝔽 es algebraicamente cerrado, entonces 𝔽 es perfecto.

(iv) Si 𝔽 ⊆ 𝕃 ⊆ 𝕂 y 𝕂 es una extensión separable de 𝔽 , entonces 𝕂 es una


extensión separable de 𝕃 y 𝕃 es una extensión separable de 𝔽 .

(v) Si 𝔽 es perfecto y 𝕂 es una extensión algebraica de 𝔽 , entonces 𝕂 es perfecto.


Fundamentos de la teoría de Galois · 103

(vi) Sea char(𝔽 ) = p, p irreducible, y sea p(x) ∈ 𝔽 [x] irreducible. p(x) es


inseparable si, y sólo si, existe q(x) ∈ 𝔽 [x] tal que p(x) = q(x p ).

(vii) Sea char(𝔽 ) = p, p irreducible. 𝔽 es perfecto si, y sólo si, 𝔽 = 𝔽 p , con


𝔽 P = {𝛼 p | 𝛼 ∈ 𝔽 }.

(viii) Si 𝔽 es finito, entonces 𝔽 es perfecto.

(ix) 𝔽 es perfecto si, y sólo si, char(𝔽 ) = 0 ó char(𝔽 ) = p, p irreducible, y


𝔽p = 𝔽.

Demostración. (i) ⇒): sea 𝕂 una extensión algebraica de 𝔽 y sea 𝛼 ∈ 𝕂; sea


p(x) ∈ 𝔽 [x] el polinomio mínimo de 𝛼, entonces p(x) es irreducible sobre 𝔽
(teorema 2.1.12), y por la hipótesis, p(x) es separable, luego 𝛼 es separable
sobre 𝔽 . Esto prueba que 𝕂 es una extensión separable de 𝔽 .
⇐): sea p(x) ∈ 𝔽 [x] un polinomio irreducible; sea 𝛼 una raíz de p(x)
(tomada por ejemplo de su cuerpo de descomposición); 𝔽 (𝛼) es una exten-
sión algebraica de 𝔽 , luego, por hipótesis, 𝔽 (𝛼) es separable, por lo tanto, 𝛼
es separable, es decir, p(x) es separable. Esto muestra que 𝔽 es perfecto.
(ii) Sea p(x) ∈ 𝔽 [x] un polinomio irreducible de grado n ≥ 1 y sea 𝛼 una
raíz de p(x) tomada de su cuerpo de descomposición 𝕂, podemos asumir
que p(x) es mónico; supongamos que 𝛼 es una raíz con multiplicidad t ≥ 2,
entonces p(x) = (x − 𝛼) t h(x), con h(x) ∈ 𝕂 [x] y h(𝛼) ≠ 0; se tiene que

p ′ (x) = t(x − 𝛼) t−1 h(x) + (x − 𝛼) t h ′ (x),

y por lo tanto,

p ′ (𝛼) = 0 = p1 + 2p2 𝛼 + · · · + (n − 1)pn−1 𝛼 n−2 + n𝛼 n−1 = 0,

con p(x) := p0 + p1 x + · · · + pn−1 x n−1 + x n . Pero como p(x) es el polinomio


mínimo de 𝛼 y el grado de p ′ (x) es menor, entonces obliga a que p ′ (x) = 0,
es decir, ipi = 0 para 1 ≤ i ≤ n, en particular, n · 1 = 0, pero teniendo
en cuenta que char(𝔽 ) = 0, entonces n = 0, contradicción. Hemos probado
que p(x) es separable, y en consecuencia, 𝔽 es perfecto.
(iii) Como 𝔽 es algebraicamente cerrado, entonces los únicos polinomios
irreducibles de 𝔽 [x] son los de grado 1, por lo tanto, son separables.
(iv) Como 𝕂 es una extensión separable de 𝔽 , entonces por definición 𝕂
es una extensión algebraica de 𝔽 , por lo tanto, 𝕂 es una extensión algebraica
de 𝕃. Sea 𝛼 ∈ 𝕂 y sea p(x) ∈ 𝕃[x] su polinomio mínimo sobre 𝕃; sea
q(x) ∈ 𝔽 [x] el polinomio mínimo de 𝛼 sobre 𝔽 , entonces p(x) | q(x); si 𝛼
fuera raíz múltiple de p(x), entonces 𝛼 sería raíz múltiple de q(x), pero esto
104 · Fundamentos de la teoría de Galois

no es posible ya que 𝕂 es una extensión separable de 𝔽 . Esto prueba que 𝛼


es separable sobre 𝕃, y así, 𝕂 es una extensión separable de 𝕃.
Para la segunda afirmación, es claro que 𝕃 es una extensión algebraica de
𝔽 ; si 𝛼 ∈ 𝕃 y p(x) ∈ 𝔽 [x] es su polinomio mínimo, entonces p(x) no tiene
raíces múltiples ya que 𝕂 es separable sobre 𝔽 .
(v) Sea 𝕂 ′ una extensión algebraica de 𝕂; como 𝕂 es una extensión alge-
braica de 𝔽 , se obtiene que 𝕂 ′ es una extensión algebraica de 𝔽 ; pero como
𝔽 es perfecto, entonces según (i), 𝕂 ′ es una extensión separable de 𝔽 . Se-
gún (iv), 𝕂 ′ es una extensión separable de 𝕂. Aplicamos nuevamente (i) y
obtenemos que 𝕂 es perfecto.
(vi) ⇒): procedemos de manera análoga a como vimos en (ii). Sea
p(x) := a0 + a1 x + · · · + an−1 x n−1 + x n ∈ 𝔽 [x] irreducible e inseparable; sea
𝛼 una raíz de p(x), con multiplicidad t ≥ 2, entonces p(x) = (x − 𝛼) t h(x),
con h(x) ∈ 𝕂 [x] y h(𝛼) ≠ 0; se tiene que

p ′ (x) = t(x − 𝛼) t−1 h(x) + (x − 𝛼) t h ′ (x),

y por lo tanto,

p ′ (𝛼) = 0 = a1 + 2a2 𝛼 + · · · + (n − 1)an−1 𝛼 n−2 + n𝛼 n−1 = 0.

Pero como p(x) es el polinomio mínimo de 𝛼 y el grado de p ′ (x) es menor,


entonces obliga a que p ′ (x) = 0, es decir, i ai = 0 para 1 ≤ i ≤ n. Por lo
tanto, p | ai ó bien p | i. Como char(𝔽 ) = p, en el primer caso ai = 0 y en el
segundo i = pmi , es decir, p(x) es de la forma

p(x) = b0 + bp x p + b2p x 2p + · · · ,

con lo cual podemos afirmar que existe un polinomio

q(x) = b0 + bp x + b2p x 2 + · · · ∈ 𝔽 [x]

tal que p(x) = q(x p ).


⇐): sea p(x) := a0 + a1 x + · · · + an−1 x n−1 + an x n ∈ 𝔽 [x] irreducible
tal que p(x) = q(x p ), para algún q(x) ∈ 𝔽 [x], entonces p ′ (x) = 0; sea
𝛼 una raíz de p(x) tomada de su cuerpo de descomposición 𝕂, entonces
p(x) = (x − 𝛼)h(x), con h(x) ∈ 𝕂 [x], con lo cual

p ′ (x) = (x − 𝛼)h ′ (x) + h(x) = 0,

es decir, (x − 𝛼) | h(x), y de esta manera, p(x) = (x − 𝛼) 2 t(x), con


t(x) ∈ 𝕂 [x]. Esto dice que p(x) es inseparable.
Fundamentos de la teoría de Galois · 105

(vii) ⇒): es claro que 𝔽 p ⊆ 𝔽 ; supongamos que 𝔽 ⊈ 𝔽 p , entonces existe


𝛼 ∈ 𝔽 tal que 𝛼 ∉ 𝔽 p ; consideremos el polinomio p(x) := x p − 𝛼 ∈ 𝔽 [x],
entonces p(x) no tiene raíces en 𝔽 ; consideremos la descomposición irre-
ducible de p(x) en 𝔽 [x]; todos los factores de esta descomposición son en-
tonces de grado ≥ 2; sea q(x) ∈ 𝔽 [x] uno de estos factores; sea 𝛽 una raíz
de q(x) (tomada, por ejemplo, en el cuerpo 𝕂 de descomposición de q(x)).
Resulta, q( 𝛽 ) = 0 = p( 𝛽 ) = 𝛽 p − 𝛼, es decir, 𝛼 = 𝛽 p , con lo cual

p(x) = x p − 𝛽 p = (x − 𝛽 ) p ∈ 𝕂 [x],

pero q(x) | p(x), por lo tanto g (x) = (x − 𝛽 ) t , con 2 ≤ t ≤ p. Esto dice que
𝛽 es una raíz múltiple de un polinomio irreducible de 𝔽 [x], lo cual es falso,
ya que 𝔽 es perfecto. Así, 𝔽 p = 𝔽 .
⇐): supongamos que 𝔽 no es perfecto, entonces existe un polinomio
irreducible p(x) ∈ 𝔽 [x] inseparable; sea 𝛼 una raíz múltiple de p(x); según
(vi), existe
q(x) := q0 + q1 x + · · · + qm x m ∈ 𝔽 [x]
p
tal que p(x) = q(x p ); por hipótesis, cada coeficiente qi es de la forma qi = 𝛼i ,
𝛼i ∈ 𝔽 , por lo tanto,
p p p
p(x) = 𝛼0 + 𝛼1 x p + · · · + 𝛼m x mp = (𝛼0 + 𝛼1 x + · · · + 𝛼m x m ) p ,

es decir, p(x) es reducible sobre 𝔽 , falso.


(viii) Esto es consecuencia del numeral anterior y del teorema 3.3.1.
(ix) Esto se obtiene de (vii) y de (ii). ✓

5. Teorema del elemento primitivo


Sea 𝕂 una extensión finita de 𝔽 . Sabemos que 𝕂 es algebraica y se obtie-
ne adjuntando a 𝔽 finitos elementos algebraicos 𝛼1 , . . . , 𝛼n ∈ 𝕂, es decir,
𝕂 = 𝔽 (𝛼1 , . . . , 𝛼n ) (véase el teorema 2.2.2). ¿Existirá 𝛼 ∈ 𝕂 tal que
𝕂 = 𝔽 (𝛼)?, es decir, ¿toda extensión finita es simple? Veremos a continua-
ción que si 𝕂 es separable, entonces la respuesta es positiva.

Teorema 3.5.1. Sea 𝔽 un cuerpo.

(i) Si 𝕂 es una extensión finita y separable de 𝔽 , entonces 𝕂 es una extensión


simple, es decir, existe un elemento primitivo 𝛼 ∈ 𝕂 tal que 𝕂 = 𝔽 (𝛼).

(ii) Si 𝔽 es perfecto (por ejemplo, de característica cero o algebraicamente cerrado


o finito) y 𝕂 es una extensión finita de 𝔽 , entonces 𝕂 es una extensión simple.
106 · Fundamentos de la teoría de Galois

Demostración. (i) Existen 𝛼1 , . . . , 𝛼n ∈ 𝕂 algebraicos sobre 𝔽 tales que


𝕂 = 𝔽 (𝛼1 , . . . , 𝛼n ). La demostración la haremos en forma recurrente sobre
n.
Para n = 1 no tenemos nada por demostrar.
Sea n = 2 y 𝕂 = 𝔽 (𝛼 , 𝛽 ). Consideremos dos casos:
Caso 1, 𝔽 finito: notemos que 𝕂 es un cuerpo finito:

𝔽 (𝛼 , 𝛽 ) = 𝔽 (𝛼) ( 𝛽 ) = 𝔽 [𝛼] ( 𝛽 ) = 𝔽 [𝛼 , 𝛽 ]
n∑︁ o
= ci j 𝛼 i 𝛽 j | ci j ∈ 𝔽 , 0 ≤ i ≤ r − 1, 0 ≤ j ≤ s − 1 ,

donde r es el grado de 𝛼 sobre 𝔽 y s es el grado de 𝛽 sobre 𝔽 (𝛼). Pero según


el teorema 3.3.1, todos los elementos no nulos de 𝕂 son potencias de una
raíz primitiva 𝜁 de la unidad, en particular, los elementos no nulos de 𝔽 , por
lo tanto, 𝕂 = 𝔽 (𝜁 ).
Caso 2. 𝔽 infinito. Sea f (x) ∈ 𝔽 [x] el polinomio mínimo de 𝛼 y sea
g (x) ∈ 𝔽 [x] el polinomio mínimo de 𝛽 ; consideremos una extensión 𝕃
de 𝔽 en donde f (x) y g (x) se descomponen completamente (por ejemplo,
adjuntando a 𝔽 todas las raíces de f (x) y g (x), las cuales podemos tomar de
𝔽 , es decir, 𝕃 podría ser el cuerpo de descomposición de f (x) g (x)). Sean
𝛼1 = 𝛼 , 𝛼2 , . . . , 𝛼r las distintas raíces de f (x) y 𝛽 1 = 𝛽 , 𝛽 2 , . . . , 𝛽 s las
distintas raíces de g (x). Consideremos el subconjunto finito
 
𝛼i − 𝛼1
C := |1 ≤ i ≤ r , 2 ≤ k ≤ s ⊂ 𝕃;
𝛽1 − 𝛽k

como 𝔽 es infinito, entonces existe al menos un d ∈ 𝔽 , d ∉ C; definimos


𝜃 := 𝛼 + d 𝛽 . Es claro que 𝔽 (𝜃) ⊆ 𝔽 (𝛼 , 𝛽 ). Vamos ahora a demostrar que
𝔽 (𝛼 , 𝛽 ) ⊆ 𝔽 (𝜃).
Sea h(x) := f (𝜃 −dx) ∈ 𝔽 (𝜃) [x], entonces h( 𝛽 ) = f (𝜃 −d 𝛽 ) = f (𝛼) = 0.
Esto dice que (x − 𝛽 ) es un factor común de h(x) y g (x) en 𝕃[x]. Tenemos
entonces que m. c. d.(h(x), g (x)) = (x − 𝛽 ) m t(x), con m ≥ 1 y t(x) ∈ 𝕃[x],
t( 𝛽 ) ≠ 0. Si gr(t(x)) ≥ 1, entonces cualquier raíz 𝛾 de t(x) es también
raíz de h(x) y g (x), luego h(𝛾) = 0 = g (𝛾), con lo cual 𝛾 = 𝛽 k , para algún
2 ≤ k ≤ s, y además, h(𝛾) = f (𝜃 − d𝛾) = 0, es decir, 𝜃 − d𝛾 = 𝛼i , para algún
1 ≤ i ≤ r, con lo cual 𝜃 − d 𝛽 k = 𝛼i , y de esta manera,

𝛼 + d 𝛽 − d 𝛽 k = 𝛼i ,

es decir, d ∈ C, lo cual es falso. En conclusión, t(x) es constante. Se tiene


que m. c. d.(h(x), g (x)) = (x − 𝛽 ) m . Como g (x) no tiene raíces múltiples
(por ser 𝛽 separable), entonces m. c. d.(h(x), g (x)) = (x − 𝛽 ) en 𝕃[x]. Sea
Fundamentos de la teoría de Galois · 107

p(x) ∈ 𝔽 (𝜃) [x] el m. c. d. de h(x) y g (x) en 𝔽 (𝜃) [x]; como 𝔽 (𝜃) ⊆ 𝕃 y


p(x) divide tanto a h(x) como a g (x), entonces divide a su máximo común
divisor, es decir, p(x) | (x − 𝛽 ); pero también es cierto que 𝛽 es raíz de
g (x) y h(x), luego es raíz de su máximo común divisor (el máximo común
divisor es combinación de g (x) y h(x)), por lo tanto, (x − 𝛽 ) | p(x). Resulta
así x − 𝛽 = p(x)u, con u ∈ 𝕃. Sea p(x) = ax + e, con a, e ∈ 𝔽 (𝜃), luego
au = 1, con lo cual u = a−1 ∈ 𝔽 (𝜃), y de esta manera, 𝛽 = −ue ∈ 𝔽 (𝜃), de
donde, 𝛼 ∈ 𝔽 (𝜃). Esto demuestra que 𝔽 (𝛼 , 𝛽 ) ⊆ 𝔽 (𝜃).
La prueba se completa en forma recurrente:

𝕂 = 𝔽 (𝛼1 , . . . , 𝛼n ) = 𝔽 (𝛼1 , . . . , 𝛼n−1 )(𝛼n ) = 𝔽 (𝛾)(𝛼n ) = 𝔽 (𝛾 , 𝛼n ) = 𝔽 (𝜃).

(ii) Como 𝕂 es una extensión finita de 𝔽 , entonces 𝕂 es una extensión


algebraica de 𝔽 , pero como 𝔽 es perfecto, entonces por el teorema 3.4.2, 𝕂

es una extensión separable de 𝔽 . El resultado se obtiene entonces de (i). □
√ √ √ √
Ejemplo 3.5.2. Veamos que ℚ( 3, 7) = ℚ( 3 + 7). Podemos hacer
una√prueba
√ directa√sin √
usar el teorema del elemento primitivo: es claro que
ℚ( 3 + 7) ⊆ ℚ( 3, 7); de otra parte,
√ √ 1 √ √
( 3 + 7) −1 = √ √ ∈ ℚ( 3 + 7),
3+ 7

luego
√ √
3− 7 √ √
∈ ℚ( 3 + 7),
−4
√ √ √ √ √ √ √
es
√ decir, √ 3 − √ 7 ∈ ℚ( 3 + 7). Esto
√ dice que
√ 2 3
√ ∈ ℚ( 3 + 7), luego
3 ∈ ℚ( 3 + 7). De igual manera, 7 ∈ ℚ( 3 + 7) y entonces
√ √ √ √
ℚ( 3, 7) ⊆ ℚ( 3 + 7).

Usando la demostración del teorema del elemento primitivo calculamos


el conjunto C:
√ √ √ √
𝛼 = 𝛼1 = 3, 𝛼2 = − 3, 𝛽 = 𝛽 1 = 7, 𝛽 2 = − 7,

0 −2 3
C = { √ , √ },
2 7 2 7

por lo tanto, tomando d = 1, se obtiene el mismo resultado:


√ √
𝜃 = 𝛼 + 1 𝛽 = 3 + 7.
108 · Fundamentos de la teoría de Galois

6. Ejercicios
1. Sean 𝕂 y 𝕃 extensiones normales de un cuerpo 𝔽 . Demuestre que
𝕂 ∩ 𝕃 es una extensión normal de 𝔽 .

2. Demuestre que existen extensiones normales que no son finitas (suge-


rencia: considere un cuerpo finito).

3. Sea n ≥ 1 y sea 𝜁 una raíz n-ésima de la unidad. Demuestre que


(
2 n−1
0, si 𝜁 ≠ 1,
1+ 𝜁 + 𝜁 +···+ 𝜁 =
n, si 𝜁 = 1.

4. Sea n un entero positivo con descomposición irreducible n = q1r1 · · · qtrt .


Demuestre que la cantidad de raíces n-ésimas primitivas distintas de
la unidad viene dada por
t  
Ö 1
𝜑(n) = n 1− .
qi
i=1

5. Calcule f10 (x) (sugerencia: z10 − 1 = f1 (x) f2 (x) f5 (x) f10 (x)).

6. Demuestre que en el cuerpo GF (p k ) el producto de todos los elemen-


tos no nulos es igual a −1.

7. Demuestre el teorema de Wilson: sea p irreducible, entonces

(p − 1)! ≡ −1 (mód p).

8. Sean 𝔽 y 𝕂 cuerpos finitos de órdenes p r y p n , respectivamente, con r |


n. Sea Aut(𝕂, 𝔽 ) los automorfismos de 𝕂 que dejan fijos los elementos
de 𝔽 . Demuestre que Aut(𝕂, 𝔽 ) es cíclico con generador 𝜑 dado por
r
𝜑(𝛼) := 𝛼 p .

9. Sea 𝔽 un cuerpo finito y sea m ≥ 1. Demuestre que existe una exten-


sión simple 𝕂 de 𝔽 tal que 𝕂 es finito y [𝕂 : 𝔽 ] = m.
√3 √ √
10. Calcule un elemento primitivo para la extensión ℚ( 3, 5, 2).
Capítulo
cuatro
Teoría de Galois
Teoría de Galois · 111

Este cuarto capítulo presenta uno de los teoremas más hermosos del álgebra
básica y es el resultado principal de la teoría de Galois: la correspondencia
de Galois. Con este teorema se puede calcular el grupo de Galois de un
polinomio y realizar múltiples aplicaciones, una de las cuales será estudiada
en el próximo capítulo.

1. El grupo de Galois
Sea 𝕂 un cuerpo y sea Aut(𝕂) el grupo de los automorfismos de 𝕂. Tal
como vimos en el capítulo anterior para cuerpos finitos, si ℙ es el subcuerpo
primo de 𝕂 y 𝜑 ∈ Aut(𝕂), entonces 𝜑(a) = a para cada a ∈ ℙ. En el caso
general de un cuerpo arbitrario 𝕂, estudiaremos subgrupos de Aut(𝕂) que
dejan fijos los elementos de subcuerpos de 𝕂.

Proposición 4.1.1. Sea 𝕂 una extensión del cuerpo 𝔽 . Entonces,

(i) El conjunto

G (𝕂, 𝔽 ) := {𝜑 ∈ Aut(𝕂) | 𝜑(a) = a, para cada a ∈ 𝔽 }

es un subgrupo de Aut(𝕂) y se denomina el grupo de Galois de 𝕂 sobre 𝔽 .

(ii) Si 𝕃 es un cuerpo intermedio, 𝔽 ⊆ 𝕃 ⊆ 𝕂, entonces G (𝕂, 𝕃) ≤ G (𝕂, 𝔽 ).

(iii) Sea p(x) ∈ 𝔽 [x] un polinomio de grado ≥ 1 y sea 𝛼 ∈ 𝕂 una raíz de p(x).
Si 𝜑 ∈ G (𝕂, 𝔽 ), entonces 𝜑(𝛼) es una raíz de p(x).

(iv) Para cada n ≥ 1, no es posible que existan n automorfismos distintos


𝜑1 , . . . , 𝜑n ∈ Aut(𝕂) y elementos a1 , . . . , an ∈ 𝕂 no todos nulos tales
que a1 𝜑1 (a) + · · · + an 𝜑n (a) = 0, para cada a ∈ 𝕂.

(v) Si 𝕂 es una extensión finita de 𝔽 , entonces G (𝕂, 𝔽 ) es un grupo finito y

|G (𝕂, 𝔽 )| ≤ [𝕂 : 𝔽 ].

(vi) Si 𝕂 es una extensión finita, normal y separable de 𝔽 , entonces

|G (𝕂, 𝔽 )| = [𝕂 : 𝔽 ].

Demostración. (i) Si 𝜑, 𝜙 ∈ G (𝕂, 𝔽 ) y a ∈ 𝔽 , entonces 𝜑𝜙 ∈ Aut(𝕂) y


𝜑𝜙(a) = a, es decir, 𝜑𝜙 ∈ G (𝕂, 𝔽 ); también, 𝜑−1 ∈ Aut(𝕂) y 𝜑−1 (a) = a,
es decir, 𝜑−1 ∈ G (𝕂, 𝔽 ).
112 · Teoría de Galois

(ii) Es claro que si 𝜑 ∈ G (𝕂, 𝕃) entonces 𝜑 deja fijos todos los elementos
de 𝔽 , es decir, 𝜑 ∈ G (𝕂, 𝔽 ).
(iii) Sean 𝜑 ∈ G (𝕂, 𝔽 ) y p(x) = p0 + p1 x + · · · + pn x n ∈ 𝔽 [x] y 𝛼 ∈ 𝕂 una
raíz de p(x). Entonces,

0 = 𝜑(p(𝛼)) = 𝜑(p0 + p1 𝛼 + · · · + pn 𝛼 n ) = p0 + p1 𝜑(𝛼) + · · · + pn 𝜑(𝛼) n ,

esto dice que 𝜑(𝛼) es una raíz de p(x).


(iv) Supongamos lo contrario; elegimos m mínimo de tal forma que en-
contramos una relación de la forma

a1 𝜑1 (a) + · · · + am 𝜑m (a) = 0 (1.1)

válida para cada a ∈ 𝕂 y con todos los ai no nulos. Si m = 1, entonces


a1 𝜑1 (a) = 0 para cada a ∈ 𝕂, en particular, a1 𝜑1 (1) = 0, de donde a1 = 0,
falso. Por lo tanto, m ≥ 2. Puesto que los automorfismos dados son todos
distintos, entonces existe b ∈ 𝕂 tal que 𝜑1 (b) ≠ 𝜑m (b); se tiene entonces
que a1 𝜑1 (ba) + · · · + am 𝜑m (ba) = 0 para cada a ∈ 𝕂, de donde

a1 𝜑1 (b) 𝜑1 (a) + · · · + am 𝜑m (b) 𝜑m (a) = 0. (1.2)

Multiplicando (1.1) por 𝜑1 (b) y restando el resultado de (1.2) obtenemos

a2 (𝜑2 (b) − 𝜑1 (b)) 𝜑2 (a) + · · · + am (𝜑m (b) − 𝜑1 (b)) 𝜑m (a) = 0,

para cada a ∈ 𝕂. Sea ci := ai (𝜑i (b) − 𝜑1 (b)) ∈ 𝕂, i = 2, . . . , m con cm ≠ 0.


Así, tenemos la ecuación

c1 𝜑1 (a) + · · · + cm 𝜑m (a) = 0

válida para todo a ∈ 𝕂, pero más corta que (1.1) , falso.


(v) Sea [𝕂 : 𝔽 ] = n y sea {𝛼1 , . . . , 𝛼n } una base de 𝕂 sobre 𝔽 . Supon-
gamos que existen n + 1 automorfismos distintos 𝜑1 , . . . , 𝜑n+1 en G (𝕂, 𝔽 ),
entonces el siguiente sistema tiene solución no nula

𝜑1 (𝛼1 )x1 + · · · + 𝜑n+1 (𝛼1 )xn+1 = 0,


..
.
𝜑1 (𝛼n )x1 + · · · + 𝜑n+1 (𝛼n )xn+1 = 0.

Sea a1 , . . . , an+1 ∈ 𝕂 una solución no nula, para 1 ≤ i ≤ n se tiene que

𝜑1 (𝛼i )a1 + · · · + 𝜑n+1 (𝛼i )an+1 = 0.


Teoría de Galois · 113

Sea 𝛼 ∈ 𝕂 un elemento arbitrario de 𝕂, luego existen b1 , . . . , bn ∈ 𝔽 tales


que 𝛼 = b1 𝛼1 + · · · + bn 𝛼n , con lo cual

𝜑1 (𝛼)a1 + · · · + 𝜑n+1 (𝛼)an+1


= 𝜑1 (b1 𝛼1 + · · · + bn 𝛼n )a1 + · · · + 𝜑n+1 (b1 𝛼1 + · · · + bn 𝛼n )an+1 = 0,

lo cual contradice lo probado en (iv). Esto muestra que |G (𝕂, 𝔽 )| ≤ n.


(vi) Según el corolario 3.1.3, existe un polinomio f (x) ∈ 𝔽 [x] tal que
𝕂 es el cuerpo de descomposición de f (x), 𝕂 = 𝔽 (𝛼1 , . . . , 𝛼n ), donde
𝛼1 , . . . , 𝛼n son las raíces de f (x) (véase también el teorema 2.4.7). Como
𝕂 es además separable, el teorema del elemento primitivo (teorema 3.5.1)
dice que 𝕂 es una extensión simple de 𝔽 , es decir, existe 𝛼 ∈ 𝕂 tal que
𝕂 = 𝔽 (𝛼). Además, sabemos que n := [𝕂 : 𝔽 ] es el grado del polinomio
mínimo p(x) ∈ 𝔽 [x] de 𝛼 y que {1, 𝛼 , . . . , 𝛼 n−1 } es una 𝔽 -base de 𝕂. Sea R
el conjunto de raíces de p(x); como 𝕂 es normal y 𝛼 ∈ 𝕂, entonces R ⊂ 𝕂;
como 𝕂 es separable, p(x) tiene exactamente n raíces distintas, es decir, R
tiene n elementos. Por (iii), podemos definir la función

Ψ : G (𝕂, 𝔽 ) −→ R,
𝜑 ↦−→ 𝜑(𝛼).

Esta función demuestra nuevamente, como en (v), que el tamaño de G (𝕂, 𝔽 )


es menor o igual a n. Probaremos que Ψ es biyectiva.
Ψ es inyectiva: sea 𝜑(𝛼) = 𝜙(𝛼) y sea z ∈ 𝕂, entonces

z = a0 + a1 𝛼 + · · · + an−1 𝛼 n−1 ,

con ai ∈ 𝔽 , 0 ≤ i ≤ n − 1, resulta entonces

𝜑(z) = a0 + a1 𝜑(𝛼) + · · · + an−1 𝜑(𝛼) n−1


= a0 + a1 𝜙(𝛼) + · · · + an−1 𝜙(𝛼) n−1 = 𝜙(z),

es decir, 𝜑 = 𝜙.
Ψ es sobreyectiva: sea 𝛽 ∈ R, definimos

𝜑 : 𝕂 −→ 𝕂,
z = a0 + a1 𝛼 + · · · + an−1 𝛼 n−1 ↦−→ a0 + a1 𝛽 + · · · + an−1 𝛽 n−1 .

Es claro que 𝜑 es aditiva, 𝜑(1) = 1 y que 𝜑(𝛼) = 𝛽 , es decir, Ψ(𝜑) = 𝛽 .


Mediante el algoritmo de la división se prueba fácilmente que 𝜑 es multipli-
cativa. También es claro que 𝜑(a) = a para cada a ∈ 𝔽 . Solo falta demostrar
114 · Teoría de Galois

que 𝜑 es biyectiva. Si 𝜑(z) = 0 = a0 + a1 𝛽 + · · · + an−1 𝛽 n−1 , entonces 𝛽 es


raíz de un polinomio sobre 𝔽 de grado ≤ n −1, pero el mínimo de 𝛽 es p(x),
por lo tanto, cada ai = 0, y de esta manera z = 0. Notemos que 𝕂 = 𝔽 ( 𝛽 ):
n = [𝕂 : 𝔽 ] = [𝕂 : 𝔽 ( 𝛽 )] [𝔽 ( 𝛽 ) : 𝔽 ] = [𝕂 : 𝔽 ( 𝛽 )]n,
luego [𝕂 : 𝔽 ( 𝛽 )] = 1. Entonces, dado z ∈ 𝕂 se tiene que z es de la forma
z = a0 + a1 𝛽 + · · · + an−1 𝛽 n−1
y su preimagen por 𝜑 es a0 + a1 𝛼 + · · · + an−1 𝛼 n−1 . ✓

En la proposición anterior, a cada cuerpo intermedio 𝔽 ⊆ 𝕃 ⊆ 𝕂 le asig-


namos un subgrupo G (𝕂, 𝕃) del grupo de Galois G (𝕂, 𝔽 ). Vamos ahora a
proceder a la inversa, partimos de un subgrupo de G (𝕂, 𝔽 ) y le asociaremos
un cuepo intermedio.
Proposición 4.1.2. Sean 𝕂 un cuerpo y S un subconjunto no vacío de Aut(𝕂).
Entonces,
(i) El conjunto
C (𝕂, S) := {a ∈ 𝕂 | 𝜑(a) = a, para cada 𝜑 ∈ S}
es un subcuerpo de 𝕂 y se denomina el cuerpo fijo de S.
(ii) C (𝕂, S) = C (𝕂, ⟨S⟩).
(iii) Sean 𝔽 ⊆ 𝕂 un cuerpo y S ≤ G (𝕂, 𝔽 ). Entonces, 𝔽 ⊆ C (𝕂, S) ⊆ 𝕂. Si
𝕂 es extensión normal de 𝔽 , entonces 𝕂 es extensión normal de C (𝕂, S).
(iv) S ⊆ G (𝕂, C (𝕂, S)), para cada S ⊆ Aut(𝕂).
(v) 𝔽 ⊆ C (𝕂, G (𝕂, 𝔽 )), para cada 𝔽 ⊆ 𝕂.
Demostración. (i) C (𝕂, S) es no vacío ya que 0, 1 ∈ C (𝕂, S); también es
obvio que si a, b ∈ C (𝕂, S), entonces a ± b, ab ∈ C (𝕂, S) y a −1 ∈ C (𝕂, S)
para a ≠ 0.
(ii) Claramente C (𝕂, ⟨S⟩) ⊆ C (𝕂, S). Para la otra inclusión, observe-
mos que cada elemento de ⟨S⟩ es producto de elementos de S y de inversos
de elementos de S, luego si a ∈ 𝕂 queda fijo bajo 𝜑 ∈ S, también queda fijo
bajo 𝜑−1 y los productos mencionados, es decir, C (𝕂, S) ⊆ C (𝕂, ⟨S⟩).
(iii) Si a ∈ 𝔽 y 𝜑 ∈ S, entonces 𝜑(a) = a, es decir, a ∈ C (𝕂, S). La
segunda afirmación se obtiene del corolario 3.1.4.
(iv) Sean 𝜑 ∈ S y a ∈ C (𝕂, S), entonces 𝜑(a) = a, luego hemos probado
que 𝜑 ∈ G (𝕂, C (𝕂, S)).
(v) Sea a ∈ 𝔽 y sea 𝜑 ∈ G (𝕂, 𝔽 ), entonces 𝜑(a) = a, luego hemos
probado que a ∈ C (𝕂, G (𝕂, 𝔽 )). ✓

Teoría de Galois · 115

2. Teorema fundamental de la teoría de


Galois
Con los resultados de la sección anterior podemos ya demostrar el teorema
fundamental de la teoría de Galois.

Teorema 4.2.1. Sea 𝕂 una extensión finita, normal y separable de un cuerpo


𝔽 . Sea S := {S | S ≤ G (𝕂, 𝔽 )} la colección de subgrupos de G (𝕂, 𝔽 ) y sea
C := {𝕃 | 𝔽 ⊆ 𝕃 ⊆ 𝕂} la colección de cuerpos intermedios entre 𝔽 y 𝕂. Entonces,
existe una correspondencia biyectiva entre S y C dada por

Γ : S −→ C,
S ↦−→ C (𝕂, S),

la cual satisface las siguientes propiedades:

(i) G (𝕂, C (𝕂, S)) = S.

(ii) C (𝕂, G (𝕂, 𝕃)) = 𝕃.

(iii) |G (𝕂, 𝕃)| = [𝕂 : 𝕃].


|G (𝕂, 𝔽 )|
(iv) [𝕃 : 𝔽 ] = .
|G (𝕂, 𝕃)|
(v) Si 𝕃 es una extensión normal de 𝔽 , entonces G (𝕂, 𝕃) ⊴ G (𝕂, 𝔽 ).

(vi) Si S ⊴ G (𝕂, 𝔽 ), entonces C (𝕂, S) es una extensión normal de 𝔽 .

(vii) Si 𝕃 es una extensión normal de 𝔽 , entonces G (𝕃, 𝔽 )  G (𝕂, 𝔽 )/G (𝕂, 𝕃).

Demostración. En primer lugar, observemos que según la parte (iii) de la


proposición 4.1.2, Γ(S) efectivamente es un elemento de C. Además de la
función Γ, consideremos la función

Λ : C −→ S,
Λ(𝕃) := G (𝕂, 𝕃),

con 𝕃 un cuerpo intermedio, 𝔽 ⊆ 𝕃 ⊆ 𝕂. Según la parte (ii) de la propo-


sición 4.1.1, G (𝕂, 𝕃) ∈ S. Notemos entonces que ΛΓ(S) = G (𝕂, C (𝕂, S))
y ΓΛ(𝕃) = C (𝕂, G (𝕂, 𝕃)). Si probamos (i) y (ii), entonces obtenemos la
correspondencia biyectiva anunciada.
(i) Como 𝕂 es una extensión finita, normal y separable de 𝔽 , podemos
usar la parte (vi) de la proposición 4.1.1 (y su prueba) y asegurar entonces
116 · Teoría de Galois

que G (𝕂, 𝔽 ) es finito y que 𝕂 es una extensión simple de 𝔽 , 𝕂 = 𝔽 (𝛼),


𝛼 ∈ 𝕂. Sea

S = {𝜑1 := i𝕂 , 𝜑2 , . . . , 𝜑m }, con m ≤ n := |G (𝕂, 𝔽 )| = [𝕂 : 𝔽 ] = gr(p(x)),

donde p(x) es el polinomio mínimo de 𝛼 sobre 𝔽 . Según la parte (iv) de


la proposición 4.1.2, S ⊆ G (𝕂, C (𝕂, S)), por lo tanto basta demostrar que
|G (𝕂, C (𝕂, S))| ≤ m. Examinemos el polinomio
m
Ö
h(x) := (x − 𝜑i (𝛼)).
i=1

Notemos que los coeficientes de h(x) son polinomios simétricos elementales


en las raíces de h(x), es decir, en 𝜑1 (𝛼), . . . , 𝜑m (𝛼) (véase la sección 7 del
capítulo 1), por lo tanto, cada coeficiente queda invariable bajo cada 𝜑 ∈ S,
es decir, cada coeficiente está en C (𝕂, S). En efecto, según la parte (iii) de
la proposición 4.1.1 se tiene que

{𝜑𝜑1 (𝛼), . . . , 𝜑𝜑m (𝛼)} = {𝜑1 (𝛼), . . . , 𝜑m (𝛼)}.

Resulta entonces que h(x) ∈ C (𝕂, S) [x]; pero h(𝛼) = 0 (recordemos que
𝜑1 (𝛼) = 𝛼), entonces el polinomio mínimo q(x) de 𝛼 sobre C (𝕂, S) divide
a h(x), y en consecuencia, gr(q(x)) ≤ m. Así,

[C (𝕂, S)(𝛼) : C (𝕂, S)] = gr(q(x)) ≤ m,

pero C (𝕂, S)(𝛼) = 𝕂 ya que 𝕂 = 𝔽 (𝛼) ⊆ C (𝕂, S)(𝛼). Por lo tanto,


[𝕂 : C (𝕂, S)] ≤ m. Ahora observemos que 𝕂 es una extensión finita, nor-
mal y separable de C (𝕂, S) (lo de finita es claro, la normalidad es por la
parte (iii) de la proposición 4.1.2 y la separabilidad es por la parte (iv) del
teorema 3.4.2). Podemos entonces aplicar la parte (vi) de la proposición
4.1.1 y concluir que |G (𝕂, C (𝕂, S))| = [𝕂 : C (𝕂, S)] ≤ m.
(ii)-(iii) Según la parte (v) de la proposición 4.1.2, 𝕃 ⊆ C (𝕂, G (𝕂, 𝕃)),
luego tenemos que

𝔽 ⊆ 𝕃 ⊆ C (𝕂, G (𝕂, 𝕃)) ⊆ 𝕂.

Como 𝕂 es una extensión finita, normal y separable de 𝔽 , entonces 𝕂 es


una extensión finita, normal y separable de C (𝕂, G (𝕂, 𝕃)), y también de 𝕃
(con lo cual tenemos probado (iii), aplicando la parte (vi) de la proposición
4.1.1). Podemos ahora usar la parte (i) ya demostrada para completar la
prueba de (ii): tenemos

[𝕂 : 𝕃] = [𝕂 : C (𝕂, G (𝕂, 𝕃))] [C (𝕂, G (𝕂, 𝕃)) : 𝕃],


Teoría de Galois · 117

de donde
[𝕂 : 𝕃]
[C (𝕂, G (𝕂, 𝕃)) : 𝕃] = .
[𝕂 : C (𝕂, G (𝕂, 𝕃))]
Pero
[𝕂 : 𝕃]
[C (𝕂, G (𝕂, 𝕃)) : 𝕃] =
|G (𝕂, C (𝕂, G (𝕂, 𝕃)))|
[𝕂 : 𝕃] [𝕂 : 𝕃]
= = = 1,
|G (𝕂, 𝕃)| [𝕂 : 𝕃]

luego C (𝕂, G (𝕂, 𝕃)) = 𝕃.


(iv) [𝕂 : 𝔽 ] = [𝕂 : 𝕃] [𝕃 : 𝔽 ], luego

[𝕂 : 𝔽 ] |G (𝕂, 𝔽 )|
[𝕃 : 𝔽 ] = = .
[𝕂 : 𝕃] |G (𝕂, 𝕃)|

(v) En primer lugar, notemos que si 𝜑 ∈ G (𝕂, 𝔽 ) y 𝛼 ∈ 𝕂 entonces 𝛼


y 𝜑(𝛼) son conjugados respecto de 𝔽 : en efecto, la restricción de 𝜑 a 𝔽 (𝛼)
define un isomorfismo 𝔽 (𝛼) −→ 𝔽 (𝜑(𝛼)) que deja fijos los elementos de 𝔽
y envía 𝛼 en 𝜑(𝛼); esto quiere decir que 𝛼 y 𝜑(𝛼) son conjugados (véase la
definición 2.1.14).
Sean 𝜑 ∈ G (𝕂, 𝔽 ) y 𝛼 ∈ 𝕃, entonces 𝛼 y 𝜑(𝛼) son conjugados respecto
de 𝔽 , luego son raíces del mismo polinomio mínimo sobre 𝔽 (véase la pro-
posición 2.1.15), pero como 𝕃 es una extensión normal de 𝔽 , entonces 𝕃
contiene todas las raíces de este polinomio, en particular, 𝜑(𝛼) ∈ 𝕃. Pode-
mos entonces restrigir el automorfismo 𝜑 al cuerpo 𝕃 y lo denotaremos por
𝜑L . Así, 𝜑L ∈ G (𝕃, 𝔽 ); esto nos permite definir la función

Δ : G (𝕂, 𝔽 ) −→ G (𝕃, 𝔽 ),
𝜑 ↦−→ 𝜑L .

Notemos que Δ es un homomorfismo de grupos con núcleo G (𝕂, 𝕃). Por


lo tanto, G (𝕂, 𝕃) ⊴ G (𝕂, 𝔽 ).
(vi) Sea S ⊴ G (𝕂, 𝔽 ). Puesto que 𝔽 ⊆ C (𝕂, S) ⊆ 𝕂 y 𝕂 es una extensión
algebraica de 𝔽 , entonces C (𝕂, S) es también una extensión algebraica de 𝔽 .
Sea p(x) ∈ 𝔽 [x] irreducible con al menos una raíz 𝛼 ∈ C (𝕂, S). Debemos
probar que todas las raíces de p(x) están en C (𝕂, S).
Paso 1. Podemos asumir que p(x) es mónico, es decir, p(x) es el polino-
mio mínimo de 𝛼 sobre 𝔽 . Sabemos que G (𝕂, 𝔽 ) es finito,

G (𝕂, 𝔽 ) = {𝜑1 = i𝕂 , 𝜑2 , . . . , 𝜑n };
118 · Teoría de Galois

consideremos el polinomio
n
Ö
g (x) := (x − 𝜑i (𝛼)).
i=1

Notemos que los coeficientes de g (x) son polinomios simétricos elementa-


les en las raíces de g (x), es decir, en 𝜑1 (𝛼), . . . , 𝜑n (𝛼), por lo tanto, según
la parte (iii) de la proposición 4.1.1, cada coeficiente queda invariable bajo
cada 𝜑 ∈ G (𝕂, 𝔽 ), es decir, cada coeficiente está en C (𝕂, G (𝕂, 𝔽 )) = 𝔽 ,
luego, g (x) ∈ 𝔽 [x]. p(x) y g (x) tienen como raíz común a 𝛼, luego g (x)
es múltiplo de p(x), y de esta manera, el conjunto de raíces de p(x) es un
subconjunto de {𝜑1 (𝛼), . . . , 𝜑n (𝛼)}.
Paso 2. Para cada 𝜑 ∈ G (𝕂, 𝔽 ) y cada 𝜙 ∈ S se tiene que 𝜑−1 𝜙𝜑 ∈ S,
de donde 𝜑−1 𝜙𝜑(𝛼) = 𝛼, es decir, 𝜙𝜑(𝛼) = 𝜑(𝛼), luego, 𝜑(𝛼) permane-
ce fijo para cada 𝜙 ∈ S, esto es, 𝜑(𝛼) ∈ C (𝕂, S). Se tiene entonces que
{𝜑1 (𝛼), . . . , 𝜑n (𝛼)} ⊂ C (𝕂, S), y según el paso 1, todas las raíces de p(x)
están en C (𝕂, S). Esto demuestra que C (𝕂, S) es una extensión normal de
𝔽.
(vii) Im(Δ)  G (𝕂, 𝔽 )/G (𝕂, 𝕃), luego
[𝕂 : 𝔽 ]
| Im(Δ)| = = [𝕃 : 𝔽 ] = |G (𝕃, 𝔽 )|.
[𝕂 : 𝕃]
La última igualdad se tiene ya que 𝕃 es una extensión finita, normal y sepa-
rable de 𝔽 (véase la parte (iv) del teorema 3.4.2). ✓

3. Ejemplos
Ejemplo 4.3.1 (Grupo de Galois de un polinomio) . Sea 𝔽 un cuerpo y sea
p(x) ∈ 𝔽 [x] un polinomio de grado ≥ 1; sea 𝕂 el cuerpo de descomposición
de p(x) respecto de 𝔽 ; el grupo Galois G (𝕂, 𝔽 ) se conoce como el grupo de
Galois de p(x) respecto a 𝔽 . Notemos que si 𝔽 es perfecto (por ejemplo,
de característica cero o algebraicamente cerrado o finito), entonces 𝕂 es una
extensión finita, normal y separable de 𝔽 , y podemos, por lo tanto, ilustrar
la correspondencia de Galois estudiada en el teorema 4.2.1. Consideremos
el siguiente ejemplo, p(x) = x 3 − 2 ∈ ℚ[x].
Paso 1. Cálculo del cuerpo de descomposición 𝕂: esto lo hicimos en el
ejemplo 2.4.16:

−1 + 3i √3
𝕂 = ℚ(𝛼 , 𝜃) con 𝛼 := y 𝜃 := 2,
2
p(x) = (x − 𝜃) (x + 𝜃 x + 𝜃 ) = (x − 𝜃)(x − 𝜃 𝛼)(x − 𝜃 𝛼 2 ).
2 2
Teoría de Galois · 119

Paso 2. Cálculo del tamaño del grupo de Galois, |G (𝕂, 𝔽 )|, con 𝔽 = ℚ:
según la parte (vi) de la proposición 4.1.1 y el ejemplo 2.4.16,
|G (𝕂, 𝔽 )| = [𝕂 : 𝔽 ] = 6.

Paso 3. Cálculo del grupo de Galois G (𝕂, 𝔽 ): el polinomio mínimo de 𝜃


sobre ℚ es x 3 −2 y las raíces de este polinomio, como ya sabemos, son 𝜃 , 𝜃 𝛼
y 𝜃 𝛼 2 . De otra parte, el polinomio mínimo de 𝛼 sobre√ℚ es f3 (x) := x 2 +x+1
(polinomio ciclotómico) y las raíces son 𝛼 y 𝛼 = −1−2 3i = 𝛼 2 .
Según la parte (iii) de la proposición 4.1.1, si 𝜑 ∈ G (𝕂, 𝔽 ), entonces 𝜑
envía raíces de p(x) en raíces de p(x) y raíces de f3 (x) en raíces de f3 (x). Es
decir, 𝜃 debe ser enviado en 𝜃 , 𝜃 𝛼 , 𝜃 𝛼 2 y 𝛼 en 𝛼 , 𝛼 2 . Con esta información
podemos construir la siguiente tabla para los elementos de G (𝕂, 𝔽 ):
𝜑1 𝜑2 𝜑3 𝜑4 𝜑5 𝜑6
𝜃 enviado en 𝜃 𝜃𝛼 𝜃 𝛼2 𝜃 𝜃𝛼 𝜃 𝛼2
𝛼 enviado en 𝛼 𝛼 𝛼 𝛼2 𝛼2 𝛼2
Notemos que 𝜑1 = i𝕂 ; denotemos 𝜑 := 𝜑2 y observemos que
𝜑2 (𝜃) = 𝜑(𝜑(𝜃)) = 𝜑(𝜃 𝛼) = 𝜑(𝜃) 𝜑(𝛼) = 𝜃 𝛼𝛼 = 𝜃 𝛼 2 ;
𝜑2 (𝛼) = 𝜑(𝜑(𝛼)) = 𝜑(𝛼) = 𝛼 ,
luego 𝜑2 = 𝜑3 . Además,
𝜑3 (𝜃) = 𝜑(𝜃 𝛼 2 ) = 𝜑(𝜃) 𝜑(𝛼) 2 = 𝜃 𝛼𝛼 2 = 𝜃 𝛼 3 = 𝜃
y 𝜑3 (𝛼) = 𝛼, es decir, 𝜑3 = i𝕂 . Denotemos 𝜙 := 𝜑4 , entonces 𝜙2 (𝜃) = 𝜃
y 𝜙2 (𝛼) = 𝛼 4 = 𝛼, es decir, 𝜙2 = i𝕂 . Finalmente, notemos que 𝜑𝜙 = 𝜑5 ,
𝜑2 𝜙 = 𝜑6 y 𝜙𝜑𝜙 = 𝜑2 = 𝜑−1 . Hemos demostrado que
G (𝕂, 𝔽 ) = {i𝕂 , 𝜑, 𝜑2 , 𝜙, 𝜑𝜙, 𝜑2 𝜙}
= ⟨𝜑, 𝜙 | 𝜑3 = i𝕂 , 𝜙2 = ik , 𝜙𝜑𝜙 = 𝜑−1 ⟩
 S3 (grupo simétrico de grado 3) .
Este mismo resultado se obtiene si en lugar de trabajar con 𝕂 = ℚ(𝛼)(𝜃)
aplicamos el teorema del elemento primitivo para calcular 𝛽 tal que
𝕂 = ℚ( 𝛽 ); el grado de 𝛽 sobre ℚ por supuesto debe ser 6 (véase el ejercicio
1).
Paso 4. Cálculo de los subgrupos de G (𝕂, 𝔽 ): los subgrupos de S3 son de
orden 1, 2, 3 y 6 (véase [22]):
S1 = {i𝕂 }, S2 = ⟨𝜑⟩ = {i𝕂 , 𝜑, 𝜑2 }, S3 = ⟨𝜙⟩ = {i𝕂 , 𝜙},
S4 = ⟨𝜑𝜙⟩ = {i𝕂 , 𝜑𝜙}, S5 = ⟨𝜑2 𝜙⟩ = {i𝕂 , 𝜑2 𝜙}, S6 = S3 .
120 · Teoría de Galois

Paso 5. Cálculo de los subgrupos normales de G (𝕂, 𝔽 ): Los subgrupos


normales de S3 son S1 , S2 y S6 (véase [22]).
Paso 6. Cálculo de una 𝔽 -base de 𝕂: esto lo hicimos en el ejemplo 2.4.16;
una 𝔽 -base de 𝕂 es {1, 𝜃 , 𝜃 2 , 𝛼 , 𝛼𝜃 , 𝛼𝜃 2 }.
Paso 7. Cálculo de todos los subcuerpos intermedios (normales) de la
forma 𝔽 ⊆ 𝕃 ⊆ 𝕂:

C (𝕂, S1 ) = C (𝕂, i𝕂 ) = 𝕂;
C (𝕂, S6 ) = C (𝕂, S3 ) = C (𝕂, G (𝕂, 𝔽 )) = 𝔽 .

Para C (𝕂, S2 ), sea z ∈ C (𝕂, S2 ) expresado a través de la base,

z = c0 + c1 𝜃 + c2 𝜃 2 + c3 𝛼 + c4 𝛼𝜃 + c5 𝛼𝜃 2 , ci ∈ 𝔽 , 0 ≤ i ≤ 5;

debe tenerse entonces que 𝜑(z) = z = 𝜑2 (z). Calculemos entonces 𝜑(z) y


𝜑2 (z):

𝜑(z) = c0 + c1 𝛼𝜃 + c2 𝛼 2 𝜃 2 + c3 𝛼 + c4 𝛼 2 𝜃 + c5 𝜃 2 ;
𝜑2 (z) = c0 + c1 𝛼 2 𝜃 + c2 𝛼𝜃 2 + c3 𝛼 + c4 𝜃 + c5 𝛼 2 𝜃 2 ;

pero recordemos que 𝛼 2 = −1 − 𝛼, con lo cual

𝜑(z) = c0 + c1 𝛼𝜃 − c2 𝜃 2 − c2 𝛼𝜃 2 + c3 𝛼 − c4 𝜃 − c4 𝛼𝜃 + c5 𝜃 2 ;
𝜑2 (z) = c0 − c1 𝜃 − c1 𝛼𝜃 + c2 𝛼𝜃 2 + c3 𝛼 + c4 𝜃 − c5 𝜃 2 − c5 𝛼𝜃 2 .

Así, z ∈ C (𝕂, S2 ) si, y sólo si,

−c4 = −c1 + c4 ; −c2 + c5 = −c5 ; c1 − c4 = −c1 ; −c2 = c2 − c5 ,

si, y sólo si,


2c4 = c1 ; 2c5 = c2 ; 2c1 = c4 ; 2c2 = c5 ,

si, y sólo si, c1 = 0 = c4 y c2 = 0 = c5 , si, ý sólo si, z = c0 + c3 𝛼, si, y sólo si,


z ∈ 𝔽 (𝛼).
Hemos demostrado que C (𝕂, S2 ) = 𝔽 (𝛼). Siguiendo este mismo méto-
do encontramos que

C (𝕂, S3 ) = 𝔽 (𝜃);
C (𝕂, S4 ) = 𝔽 (𝛼 2 𝜃);
C (𝕂, S5 ) = 𝔽 (𝛼𝜃).
Teoría de Galois · 121

Podemos entonces presentar los resultados en la siguiente forma:

S1 ↦−→ 𝔽 ⊆ 𝕂 ⊆ 𝕂 (normal) ,
S2 ↦−→ 𝔽 ⊆ 𝔽 (𝛼) ⊆ 𝕂 (normal) ,
S3 ↦−→ 𝔽 ⊆ 𝔽 (𝜃) ⊆ 𝕂,
S4 ↦−→ 𝔽 ⊆ 𝔽 (𝜃 𝛼 2 ) ⊆ 𝕂,
S5 ↦−→ 𝔽 ⊆ 𝔽 (𝜃 𝛼) ⊆ 𝕂,
S6 ↦−→ 𝔽 ⊆ 𝔽 ⊆ 𝕂 (normal) .

Ejemplo 4.3.2. Calculemos el grupo Galois de f (x) = x 3 + x + 1 ∈ ℤ2 [x].


Paso 1. Cálculo del cuerpo de descomposición de f (x): según el ejem-
plo 2.4.14, el cuerpo de descomposición 𝕂 de f (x) es 𝕂 = ℤ2 (𝛼), con
𝛼 := x ∈ ℤ[z]/⟨ f (x)⟩, y además, [𝕂 : 𝔽 ] = 3, con 𝔽 := ℤ2 .
Paso 2. Cálculo del tamaño del grupo de Galois: |G (𝕂, 𝔽 )| = [𝕂 : 𝔽 ] = 3.
Paso 3. Cálculo del grupo de Galois: G (𝕂, 𝔽 )  ℤ3 .
Paso 4. Cálculo de los subgrupos de G (𝕂, 𝔽 ): 0 y ℤ3 .
Paso 5. Cálculo de los subgrupos normales de G (𝕂, 𝔽 ): 0 y ℤ3 .
Paso 6. Cálculo de todos los subcuerpos intermedios normales de la for-
ma 𝔽 ⊆ 𝕃 ⊆ 𝕂: 𝕃 = ℤ2 , ℤ2 (𝛼).

4. Ejercicios
1. Calcule el grupo de Galois del ejemplo 4.3.1 usando el teorema del
elemento primitivo (sugerencia: 𝛽 = 𝜃 + 𝛼).

2. Demuestre que en el ejemplo 4.3.1 se tiene que

C (𝕂, S3 ) = 𝔽 (𝜃); C (𝕂, S4 ) = 𝔽 (𝛼 2 𝜃); C (𝕂, S5 ) = 𝔽 (𝛼𝜃).

3. Calcule el grupo Galois de f (x) = x 4 − 8x 2 + 15 ∈ ℚ[x].

4. Calcule el grupo Galois de f (x) = x 4 + 1 ∈ ℤ3 [x].

5. Calcule G (ℂ, ℝ).


Capítulo
cinco
Solubilidad por
radicales
Solubilidad por radicales · 125

En este capítulo tratamos una de las aplicaciones clásicas de la teoría de Ga-


lois concerniente a determinar cuándo las raíces de un polinomio de grado
n ≥ 1 sobre un cuerpo 𝔽 son expresables mediante fórmulas que involucren
radicales. Como es bien sabido, las raíces del polinomio general de segun-
do grado sobre el cuerpo de los racionales, p(x) = x 2 + bx + c ∈ ℚ[x], son
expresables mediante una fórmula que contiene radicales. Podemos consi-
derar a p(x) como un polinomio sobre el cuerpo de las funciones racionales
en las variables b, c, es decir, p(x) ∈ ℚ(b, c) [x]. Teniendo en cuenta que
b 2 − 4c puede ser menor que cero, ℚ(b, c) no contendría las raíces de p(x).
Por tal razón, podemos hacer una extensión de ℚ(b, c) agregando 𝛼 tal que
𝛼 2 = b 2 − 4c ∈ ℚ(b, c), y así, ℚ(b, c)(𝛼) sería el cuerpo de descomposición
de p(x). En este sentido, las raíces

−b ± b 2 − 4c
2
son expresables en términos de b, c y raíces cuadradas de funciones racio-
nales en las variables b, c. La pregunta que surge es si también es posible
hacer algo similar y expresar mediante fórmulas análogas las raíces de poli-
nomios de tercer, cuarto, quinto grado, etc. De esto nos ocuparemos en este
capítulo.

1. Polinomios solubles por radicales


Sea 𝔽 un cuerpo y p(x) = x n + an−1 x n−1 + · · · + a1 x + a0 ∈ 𝔽 [x] de grado
n ≥ 1; se dice que p(x) es soluble por radicales respecto a 𝔽 si es posible
encontrar una sucesión finita de extensiones simples

𝔽 1 := 𝔽 (𝛼1 ), 𝔽 2 := 𝔽 1 (𝛼2 ), . . . , 𝔽 k := 𝔽 k−1 (𝛼k )


r
y enteros r1 , . . . , rk ≥ 1 tales que 𝛼1r1 ∈ 𝔽 , 𝛼2r2 ∈ 𝔽 1 , . . . , 𝛼kk ∈ 𝔽 k−1 , to-
das las raíces de p(x) estén en 𝔽 k y 𝔽 k sea una extensión normal de 𝔽 . Ob-
servemos que en tal caso el cuerpo de descomposición de p(x) está con-
tenido en 𝔽 k . Interpretando a0 , . . . , an−1 como variables, podemos con-
siderar el cuerpo de fracciones del anillo de polinomios 𝔽 [a0 , . . . , an−1 ],
es decir, el cuerpo de funciones racionales 𝔽 (a0 , . . . , an−1 ), y asumir que
p(x) ∈ 𝔽 (a0 , . . . , an−1 ) [x]. Se dice que p(x) es soluble por radicales si es
soluble por radicales respecto a 𝔽 (a0 , . . . , an−1 ).
Proposición 5.1.1. Sean 𝔽 un cuerpo, n ≥ 1 y 0 ≠ a ∈ 𝔽 . Si 𝔽 contiene una
raíz n-ésima primitiva de la unidad y 𝕂 es el cuerpo de descomposición de x n − a,
entonces
126 · Solubilidad por radicales

(i) 𝕂 = 𝔽 (𝛼), donde 𝛼 es cualquier raíz de x n − a.

(ii) El grupo Galois de x n − a es abeliano.

Demostración. (i) Sea 𝜁 una raíz n-ésima primitiva de la unidad contenida


en 𝔽 , entonces 𝛼 , 𝛼 𝜁 , . . . , 𝛼 𝜁 n−1 son raíces de x n − a, además son todas
distintas. Notemos que el cuerpo de descomposición de x n − a es entonces

𝔽 (𝛼 , 𝛼 𝜁 , 𝛼 𝜁 n−1 ) = 𝔽 (𝛼).

(ii) Por definición, el grupo Galois de x n − a es G (𝔽 (𝛼), 𝔽 ) (véase el


ejemplo 4.3.1); sean 𝜑, 𝜙 ∈ G (𝔽 (𝛼), 𝔽 ); puesto que cada elemento z de
𝔽 (𝛼) es de la forma z = a0 + a1 𝛼 + · · · + 𝛼n−1 𝛼 n−1 , entonces 𝜑𝜙 = 𝜙𝜑 si,
y sólo si, 𝜑𝜙(𝛼) = 𝜙𝜑(𝛼); pero 𝜙(𝛼) = 𝛼 𝜁 i y 𝜑(𝛼) = 𝛼 𝜁 j , para algunos
i , j, luego 𝜑𝜙(𝛼) = 𝛼 𝜁 j+i y 𝜙𝜑(𝛼) = 𝛼 𝜁 i+ j . Esto muestra que G (𝔽 (𝛼), 𝔽 )
es abeliano. ✓

Teorema 5.1.2. Sea 𝔽 un cuerpo perfecto tal que para cada n ≥ 1, 𝔽 contiene una
raíz n-ésima primitiva de la unidad. Sea p(x) ∈ 𝔽 [x] un polinomio no constante. Si
p(x) es soluble por radicales respecto a 𝔽 , entonces el grupo Galois de p(x) respecto
a 𝔽 es soluble.

Demostración. Sea 𝕂 el cuerpo de descomposición de p(x); por definición, el


grupo Galois de p(x) respecto a 𝔽 es G (𝕂, 𝔽 ). Vamos entonces a demostrar
que G (𝕂, 𝔽 ) es un grupo soluble.
Existe una sucesión finita de extensiones simples

𝔽 0 = 𝔽 ⊆ 𝔽 1 = 𝔽 (𝛼1 ) ⊆ 𝔽 2 = 𝔽 1 (𝛼2 ) ⊆ · · · ⊆ 𝔽 k = 𝔽 k−1 (𝛼k ),


r
con r1 , . . . , rk ≥ 1, de tal forma que 𝛼1r1 ∈ 𝔽 , 𝛼2r2 ∈ 𝔽 1 , . . . , 𝛼kk ∈ 𝔽 k−1 , to-
das las raíces de p(x) están en 𝔽 k , es decir, 𝕂 ⊆ 𝔽 k , y además, 𝔽 k es extensión
normal de 𝔽 . Por la proposición 5.1.1, cada 𝔽 i es el cuerpo de descomposi-
ción de 𝔽 i−1 y por lo tanto, 𝔽 i es una extensión normal de 𝔽 i−1 . Puesto que
𝔽 k es una extensión finita, normal y separable de cada 𝔽 i , podemos aplicar el
teorema 4.2.1 y concluir que G (𝔽 k , 𝔽 i ) ⊴G (𝔽 k , 𝔽 i−1 ); se tiene así la siguiente
cadena:

1 ⊴ G (𝔽 k , 𝔽 k−1 ) ⊴ G (𝔽 k , 𝔽 k−2 ) ⊴ · · · ⊴ G (𝔽 k , 𝔽 2 ) ⊴ G (𝔽 k , 𝔽 1 ) ⊴ G (𝔽 k , 𝔽 ),

además del teorema 4.2.1 se tiene también que

G (𝔽 k , 𝔽 i−1 )/G (𝔽 k , 𝔽 i )  G (𝔽 i , 𝔽 i−1 );


Solubilidad por radicales · 127

aplicando nuevamente la proposición 5.1.1 obtenemos que G (𝔽 i , 𝔽 i−1 ) es


abeliano. En conclusión, G (𝔽 k , 𝔽 ) tiene una cadena subnormal con seccio-
nes abelianas, es decir, G (𝔽 k , 𝔽 ) es soluble (véase [22]). Además, 𝔽 ⊆ 𝕂 ⊆
𝔽 k , con 𝕂 extensión normal de 𝔽 , aplicamos otra vez el teorema 4.2.1, y
obtenemos que G (𝔽 k , 𝕂) ⊴ G (𝔽 k , 𝔽 ) y G (𝔽 k , 𝔽 )/G (𝔽 k , 𝕂)  G (𝕂, 𝔽 ), luego
G (𝕂, 𝔽 ) es soluble (véase [22]). ✓

2. Teorema de Abel
Sean 𝔽 un cuerpo y n ≥ 1; consideremos el cuerpo fracciones de
𝔽 [x1 , . . . , xn ], es decir, 𝔽 (x1 , . . . , xn ); un elemento

p(x1 , . . . , xn )
z= ∈ 𝔽 (x1 , . . . , xn )
q(x1 , . . . , xn )

se dice que es una función racional simétrica si para cada 𝜋 ∈ Sn

p(x 𝜋 (1) , . . . , x 𝜋 (n) )


𝜋 (z) := = z.
q(x 𝜋 (1) , . . . , x 𝜋 (n) )

Notemos que la colección 𝕊 de las funciones racionales simétricas es un


subcuerpo de 𝔽 (x1 , . . . , xn ) que contiene a 𝔽 . Más aún, 𝕊 es el cuerpo de
fracciones del dominio S de los polinomios simétricos (véase el teorema
1.7.4). Tenemos entonces

𝔽 ⊂ 𝕊 ⊂ 𝔽 (x1 , . . . , xn ). (2.1)

Cada 𝜋 ∈ Sn define un automorfismo de 𝔽 (x1 , . . . , xn ) que fija los elementos


de 𝔽 ,

𝜋 : 𝔽 (x1 , . . . , xn ) −→ 𝔽 (x1 , . . . , xn ),
p(x 𝜋 (1) , . . . , x 𝜋 (n) )
𝜋 (z) := 𝜋 (z) = ,
q(x 𝜋 (1) , . . . , x 𝜋 (n) )

es decir, 𝜋 ∈ G (𝔽 (x1 , . . . , xn ), 𝔽 ). Denotemos

Sn := {𝜋 | 𝜋 ∈ Sn } ≤ G (𝔽 (x1 , . . . , xn ), 𝔽 ).

Es claro que Sn  Sn . Con esto podemos probar las siguientes propiedades.

Proposición 5.2.1. Sea 𝔽 un cuerpo y n ≥ 1. Entonces,

(i) C (𝔽 (x1 , . . . , xn ), Sn ) = 𝕊.
128 · Solubilidad por radicales

(ii) Sea p(x) := x n − s1 x n−1 + · · · + (−1) n−1 sn−1 x + (−1) n sn ∈ 𝕊[x], donde
s1 , . . . , sn son los polinomios simétricos elementales. Entonces, 𝔽 (x1 , . . . , xn )
es el cuerpo de descomposición de p(x), y por lo tanto, una extensión normal
de 𝕊.

(iii) [𝔽 (x1 , . . . , xn ) : 𝕊] = n!

(iv) 𝕊 = 𝔽 (s1 , . . . , sn ).

(v) G (𝔽 (x1 , . . . , xn ), 𝕊) = Sn  Sn .
Demostración. (i) Las funciones racionales simétricas son exactamente los
elementos de 𝔽 (x1 , . . . , xn ) que quedan fijos bajo cada 𝜋 ∈ Sn .
(ii) Comencemos observando que s1 , . . . , sn ∈ 𝕊, con lo cual efectiva-
mente p(x) ∈ 𝕊[x]. Tenemos que p(x) = (x − x1 ) · · · (x − xn ), luego el cuer-
po de descomposición de p(x) respecto a 𝕊 es 𝕊(x1 , . . . , xn ), y de (2.1) ,
obtenemos que 𝔽 (x1 , . . . , xn ) ⊆ 𝕊(x1 , . . . , xn ) ⊆ 𝔽 (x1 , . . . , xn ), es decir,
𝕊(x1 , . . . , xn ) = 𝔽 (x1 , . . . , xn ).
(iii)-(v) De (i) y la proposición 4.1.2 se obtiene que

Sn ≤ G (𝔽 (x1 , . . . , xn ), C (𝔽 (x1 , . . . , xn ), Sn )) = G (𝔽 (x1 , . . . , xn ), 𝕊),

pero como Sn  Sn y 𝔽 (x1 , . . . , xn ) es una extensión finita de 𝕊 (teorema


2.2.2), entonces por la proposición 4.1.1,

n! ≤ |G (𝔽 (x1 , . . . , xn ), 𝕊)| ≤ [𝔽 (x1 , . . . , xn ) : 𝕊].

Ahora queremos demostrar que [𝔽 (x1 , . . . , xn ) : 𝕊] ≤ n! Tenemos que

𝔽 (s1 , . . . , sn ) ⊆ 𝕊 ⊆ 𝔽 (x1 , . . . , xn ),

luego

[𝔽 (x1 , . . . , xn ) : 𝔽 (s1 , . . . , sn )] = [𝔽 (x1 , . . . , xn ) : 𝕊] [𝕊 : 𝔽 (s1 , . . . , sn )]

siempre y cuando [𝔽 (x1 , . . . , xn ) : 𝔽 (s1 , . . . , sn )] sea finita. Si probamos


que
[𝔽 (x1 , . . . , xn ) : 𝔽 (s1 , . . . , sn )] ≤ n!, (2.2)
tendríamos no solo la desigualdad pedida, sino también que

[𝕊 : 𝔽 (s1 , . . . , sn )] = 1,

es decir, el punto (iv) estaría demostrado. Además, también se tendría que


|G (𝔽 (x1 , . . . , xn ), 𝕊)| = n!, pero como Sn ≤ G (𝔽 (x1 , . . . , xn ), 𝕊), entonces
se sigue la igualdad
Sn = G (𝔽 (x1 , . . . , xn ), 𝕊),
Solubilidad por radicales · 129

y así el numeral (v) también estaría probado.


Veamos entonces la prueba de (2.2) : observemos que
p(x) ∈ 𝔽 (s1 , . . . , sn ) [x] y su cuerpo de descomposición es

𝔽 (s1 , . . . , sn ) (x1 , . . . , xn ) = 𝔽 (x1 , . . . , xn ).

Según el teorema 2.4.7,

[𝔽 (x1 , . . . , xn ) : 𝔽 (s1 , . . . , sn )] ≤ (gr(p(x)))! = n!. ✓


Teorema 5.2.2 (Teorema de Abel) . Sea 𝔽 un cuerpo perfecto tal que para cada
n ≥ 1, 𝔽 contiene una raíz n-ésima primitiva de la unidad. Entonces, para n ≥ 5,
el polinomio p(x) = x n + an−1 x n−1 + · · · + a1 x + a0 ∈ 𝔽 [x] no es soluble por
radicales.

Demostración. Como vimos al inicio de la sección 1, podemos tomar los


coeficientes a0 , . . . , an−1 como variables, y considerar 𝔽 (a0 , . . . , an−1 ) el
cuerpo de las funciones racionales del anillo de polinomios 𝔽 [a0 , . . . , an−1 ],
además p(x) ∈ 𝔽 (a0 , . . . , an−1 ) [x]. Por definición, p(x) es soluble por ra-
dicales si es soluble por radicales respecto a 𝔽 (a0 , . . . , an−1 ).
Supongamos que p(x) es soluble por radicales, entonces, de acuerdo con
el teorema 5.1.2, su grupo Galois respecto a 𝔽 (a0 , . . . , an−1 ) es soluble, pe-
ro su grupo Galois respecto de 𝔽 (a0 , . . . , an−1 ), por definición, es el grupo
de Galois de su cuerpo de descomposición L respecto a 𝔽 (a0 , . . . , an−1 ), es
decir, estamos diciendo que G (L, 𝔽 (a0 , . . . , an−1 )) es soluble.
Calculemos entonces L. Con este propósito, sean 𝛼1 , . . . , 𝛼n las raíces de
p(x) (tomadas, por ejemplo, en su cuerpo de descomposición respecto de 𝔽 ,
o también, en 𝔽 ); veamos a 𝛼1 , . . . , 𝛼n como variables y sea 𝔽 (𝛼1 , . . . , 𝛼n )
el cuerpo de funciones racionales en estas variables con coeficientes en 𝔽 ; sea
𝕊 el cuerpo de las funciones racionales simétricas de 𝔽 (𝛼1 , . . . , 𝛼n ). Probe-
mos que 𝔽 (a0 , . . . , an−1 ) = 𝕊. En efecto, recordemos que los coeficientes
an−1 , . . . , a0 son las funciones simétricas elementales en 𝛼1 , . . . , 𝛼n , por lo
tanto,
𝔽 (a0 , . . . , an−1 ) ⊆ 𝕊 ⊂ 𝔽 (𝛼1 , . . . , 𝛼n ).

Por la parte (iii) de la proposición 5.2.1 se tiene que

[𝔽 (𝛼1 , . . . , 𝛼n ) : 𝔽 (a0 , . . . , an−1 )]


= [𝔽 (𝛼1 , . . . , 𝛼n ) : 𝕊] [𝕊 : 𝔽 (a0 , . . . , an−1 )]
= n![𝕊 : 𝔽 (a0 , . . . , an−1 )] ,
130 · Solubilidad por radicales

pero p(x) considerado como polinomio con coeficientes en 𝔽 (a0 , . . . , an−1 )


tiene sus raíces en un cuerpo extensión de grado a lo sumo n! (véase el teo-
rema 2.4.7), por lo tanto, [𝕊 : 𝔽 (a0 , . . . , an−1 )] = 1, es decir,

𝕊 = 𝔽 (a0 , . . . , an−1 ).

Aplicamos entonces la parte (ii) de la proposición 5.2.1 y obtenemos que


L = 𝔽 (𝛼1 , . . . , 𝛼n ).
Así, hemos llegado a que G (𝔽 (𝛼1 , . . . , 𝛼n ), 𝕊) es soluble, pero según la
parte (v) de la proposición 5.2.1, G (𝔽 (𝛼1 , . . . , 𝛼n ), 𝕊)  Sn es soluble, lo
cual es falso ya que n ≥ 5. Hemos demostrado que p(x) no es soluble por
radicales. ✓

3. Ejercicios
1. Sea 𝔽 un cuerpo. Demuestre que la colección 𝕊 de las funciones racio-
nales simétricas es un subcuerpo del cuerpo de funciones racionales
𝔽 (x1 , . . . , xn ) y contiene a 𝔽 .

2. Sea 𝕊 como en el ejercicio anterior. Demuestre que 𝕊 es el cuerpo


de fracciones del dominio S de los polinomios simétricos (véase el
toerema 1.7.4).
Referencias

[1] S. Axler, Linear Algebra Done Right, 3 ed., Undergraduate Texts in


Mathematics, Springer International Publishing, 2015.

[2] J. Barshay, Topics in Ring Theory, Mathematics Lecture Note Series,


W. A. Benjamin, 1969.

[3] W. Brown, Matrices Over Commutative Rings, Chapman & Hall Pure
and Applied Mathematics, no. 169, Marcel Dekker, 1993.

[4] O. A. Cámpoli, A Principal Ideal Domain That Is Not a Euclidean Domain,


Amer. Math. Monthly 95 (1988), no. 9, 868.

[5] A. Chambert-Loir, Algèbre Commutative, Centre de Mathématiques,


École Polytechnique, 2001.

[6] P. M Cohn, Free Rings and Their Relations, L.M.S. Monographs, Aca-
demic Press, 1985.

[7] P. M. Cohn, Basic Algebra: Groups, Rings and Fields, Springer London,
2003.

[8] L. Corry, Modern Algebra and the Rise of Mathematical Structures,


Birkhäuser Basel, 2003.

[9] C. Faith, Algebra I: Rings, Modules and Categories, Grundlehren der


mathematischen Wissenschaften, Springer Berlin Heidelberg, 1981.

[10] J. Fraleigh, A First Course in Abstract Algebra, 7 ed., Pearson, 2002.

[11] E. R. Gentile, Estructuras algebraicas II: Monografía No. 12, 2th ed.,
Serie de Matemática, Universidad de Buenos Aires, 1979.

[12] N. Gubareni, M. Hazewinkel, and V. V. Kirichenko, Algebras, Rings


and Modules, Springer Netherlands, 2004.

[13] I. N. Herstein, Topics in Algebra, John Wiley & Sons, Inc., 1975.
132 · Referencias

[14] T. W. Hungerford, Algebra, Graduate Texts in Mathematics, no. 73,


Springer Verlag, 2003.

[15] N. Jacobson, Lectures in Abstract Algebra I: Basic Concepts, vol. 1, Gra-


duate Texts in Mathematics, no. 30, Springer New York, 1951.

[16] M. I. Kargapolov and J. I. Merzljakov, Fundamentals of the Theory of


Groups, Graduate Texts in Mathematics, no. 62, Springer New York,
1979, Traducción por R. G. Burns.

[17] F. Kasch, Modules and Rings, Academic Press Inc., 1983.

[18] A. I. Kostrikin, Introducción al álgebra, MIR, 1983.

[19] J. Lambek, Lectures on Rings and Modules, American Mathematical So-


ciety, 1996.

[20] S. Lang, Algebra, Graduate Texts in Mathematics, no. 211, Springer


New York, 2002.

[21] , Undergraduate Algebra, 3 ed., Undergraduate Texts in Mathe-


matics, Springern Verlag, 2005.

[22] O. Lezama, Cuadernos de álgebra, No. 1: Grupos, SAC2 , Departamen-


to de Matemáticas, Universidad Nacional de Colombia, sede Bogotá,
https://sites.google.com/a/unal.edu.co/sac2/.

[23] , Cuadernos de álgebra, No. 2: Anillos, SAC2 , Departamento


de Matemáticas, Universidad Nacional de Colombia, sede Bogotá,
https://sites.google.com/a/unal.edu.co/sac2/.

[24] , Cuadernos de álgebra, No. 3: Módulos, SAC2 , Departamen-


to de Matemáticas, Universidad Nacional de Colombia, sede Bogotá,
https://sites.google.com/a/unal.edu.co/sac2/.

[25] , Cuadernos de Álgebra, No. 4: Álgebra lineal, SAC2 , Departa-


mento de Matemáticas, Universidad Nacional de Colombia, sede Bo-
gotá, https://sites.google.com/a/unal.edu.co/sac2/.

[26] , Cuadernos de Álgebra, No. 5: Cuerpos, SAC2 , Departamen-


to de Matemáticas, Universidad Nacional de Colombia, sede Bogotá,
https://sites.google.com/a/unal.edu.co/sac2/.

[27] , Cuadernos de Álgebra, No. 6: Anillos y módulos, SAC2 , Departa-


mento de Matemáticas, Universidad Nacional de Colombia, sede Bo-
gotá, https://sites.google.com/a/unal.edu.co/sac2/.
Referencias · 133

[28] , Cuadernos de Álgebra, No. 7: Categorías, SAC2 , Departamen-


to de Matemáticas, Universidad Nacional de Colombia, sede Bogotá,
https://sites.google.com/a/unal.edu.co/sac2/.

[29] , Cuadernos de Álgebra, No. 8: Álgebra homológica, SAC2 , De-


partamento de Matemáticas, Universidad Nacional de Colombia, sede
Bogotá, https://sites.google.com/a/unal.edu.co/sac2/.

[30] , Anillos dimensionales, Bol. de Mat. XIX (1985), 194–220.

[31] O. Lezama and G. Villamarín, Anillos, módulos y categorías, Facultad de


Ciencias, Universidad Nacional de Colombia, 1994.

[32] J. McConnell and J. Robson, Noncommutative noetherian rings, Gradua-


te Studies in Mathematics, no. 10, American Mathematical Society,
2001.

[33] B. R. McDonald, Linear Algebra over Commutative Rings, Taylor &


Francis Inc, 1984.

[34] H. Park and C. Woodburn, An Algorithmic Proof of Suslin’s Stability


Theorem for Polynomial Rings, J. Algebra 178 (1995), 277–298.

[35] M. Pinto, Una prueba algorítmica para el teorema de estabilidad de Suslin


sobre dominios de Dedekind, Master’s thesis, Universidad Nacional de
Colombia, sede Bogotá, 2009.

[36] D. Robinson, A Course in the Theory of Groups, Graduate Texts in


Mathematics, no. 80, Springer New York, 1996.

[37] K. Spindler, Abstract Algebra with Applications, vol. I & II, Taylor &
Francis Inc., 1993.

[38] I. Stewart, Galois Theory, 3 ed., Chapman and Hall/CRC, 2003.

[39] A. A. Suslin, On the Structure of the Special Linear Group over Polynomial
Rings, Math. USSR Izv. 11 (1977), no. 2, 221–238.

[40] B. L. van der Waerden, A History of Algebra, Springer Berlin Heidel-


berg, 1985.

[41] B. L. van der Waerden, Algebra, vol. 1, Springer-Verlag GmbH, 1991,


Traducción por F. Blum y J. R. Schulenberg.

[42] R. Výborný, A Simple Proof of the Fundamental Theorem of Algebra,


Mathematica Bohemica 135 (2010), no. 1, 57–61.
Cuadernos de álgebra. Volumen I fue editado
por el Centro Editorial de la Facultad de
Ciencias, Universidad Nacional de Colombia,
sede Bogotá. Se utilizaron como
fuentes principales Baskerllive y Fira Sans.
Matemáticas
Otros títulos Colección
textos Cuadernos José Oswaldo Lezama Serrano
Es licenciado en Matemáticas de la Universidad

de álgebra
Cuadernos de álgebra. Volumen 2 Industrial de Santander y doctorado en
Ipsumquam, core qui
José Oswaldo Lezama Serrano Matemáticas de la Universidad Estatal de San
blamene doluptas La obra Cuadernos de álgebra, dividida
Ecuaciones diferenciales ordinaria.
Armando Casas Petersburgo. En 2017 obtuvo el Premio Nacional de
en dos volúmenes, consta de diez Matemáticas, otorgado por la Sociedad Colombiana
Técnicas de resolución publicaciones sobre los principales
Et elitatenissi de Matemáticas. También, obtuvo reconocimiento
Edixon Rojas y Luz Marina Moya temas de esta rama de las matemáticas.
cuptaquates aliquunt pra como Egresado distinguido de la Universidad
Los cinco cuadernos del presente

Volumen 1
Cálculo integral en una variable
Armando Casas Industrial de Santander y de Excelencia académica,
Jeanneth Galeano Peñaloza y Claudio Rodríguez Beltrán volumen cubren el material fundamental Investigación meritoria y Medalla al mérito,
de las estructuras algebraicas básicas: concedidas por la Universidad Nacional de
Curso libre juvenil de matemáticas.Duntiaectur sene
Tercera edición
grupos, anillos, módulos, espacios Colombia. Fue profesor Titular del Departamento
Myriam Margarita Acevedo, evelibusto ent, sequatesti
Myriam Leonor Campos,
vectoriales y cuerpos. Los cinco de Matemáticas de la Universidad Nacional de
omnite la sit asimporia
Luis Rafael Jiménez y Blanca Aurora León
cuadernos del segundo volumen Colombia durante 35 años. Ha sido autor de libros y
Armando Casas

Cuadernos de álgebra. Volumen 1


contienen temas más especializados
José Oswaldo

José Oswaldo Lezama Serrano


artículos en áreas como grupos de matrices, anillos
como la teoría avanzada de anillos y módulos, álgebra lineal sobre anillos, álgebra
y módulos, categorías, álgebra
homológica, álgebra no conmutativa y Lezama Serrano homológica, álgebra conmutativa y no conmutativa,
geometría algebraica, teoría de categorías, teoría
geometría algebraica. algebraica del control, álgebra constructiva y
computacional. Actualmente es el director del
Los cuadernos del primer volumen
Seminario de Álgebra Constructiva (SAC2).
pueden servir como textos guía o de
apoyo para cursos básicos del área de
álgebra de las carreras de matemáticas
y de las licenciaturas que se ofrecen en
el país. Posiblemente el principal valor
de los cuadernos sea su presentación
ordenada y didáctica, así como la
inclusión de muchas pruebas omitidas
en la literatura y amplias listas de
ejemplos que ilustran la teoría.

Facultad de Ciencias
Sede Bogotá

También podría gustarte