Teoria de Numeros y Conjuntos

Índice general
0. El principio de inducción 1
0.1. Revisión de los números naturales . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1
0.2. Principio de inducción . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2
0.3. Principio de inducción ‘completa’ . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 6
0.4. Principio de inducción ‘desplazada’ . . . . . . . . . . . . . . . . . . . . . . . . . . . . 7
0.5. Ejercicios . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 7
0.6. APÉNDICE: Definiciones recursivas. . . . . . . . . . . . . . . . . . . . . . . . . . . . 9
1. Conjuntos 13
1.1. Conjuntos. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 13
1.1.1. Idea intuitiva de conjunto: pertenencia. Igualdad e inclusión entre conjuntos.
Conjunto potencia. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 13
1.1.2. Operaciones con conjuntos: unión, intersección, complemento. . . . . . . . . 16
1.2. Pares ordenados. Producto cartesiano de conjuntos. . . . . . . . . . . . . . . . . . . . 19
1.3. Correspondencias y aplicaciones . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 20
1.3.1. Comentarios previos: Ideas intuitivas y ejemplos. . . . . . . . . . . . . . . . . 20
1.3.2. Aplicaciones: dominio, codominio, gráfica. . . . . . . . . . . . . . . . . . . . . 22
1.3.3. Imagen y antiimagen de un conjunto. . . . . . . . . . . . . . . . . . . . . . . 23
1.3.4. Aplicaciones inyectivas, suprayectivas, biyectivas. . . . . . . . . . . . . . . . . 24
1.3.5. Más sobre familias de conjuntos . . . . . . . . . . . . . . . . . . . . . . . . . . 25
1.3.6. Composición de aplicaciones. . . . . . . . . . . . . . . . . . . . . . . . . . . . 26
1.3.7. Inversa de una aplicación biyectiva. Inyectividad e inversa parcial. . . . . . . 27
1.4. Relaciones . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 32
1.4.1. Relaciones de equivalencia y particiones. Conjunto cociente. . . . . . . . . . . 32
1.4.2. Relaciones de orden. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 35
1.5. Conjuntos finitos y numerables . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 38
1.5.1. Conjuntos finitos y numerables. Conjuntos equipotentes. . . . . . . . . . . . . 38
1.5.2. APÉNDICE: Un mı́nimo de combinatoria. . . . . . . . . . . . . . . . . . . . . 40
2. Números naturales y enteros 49

2.1. Números naturales. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 49
2.1.1. Lectura preliminar . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 49
2.1.2. Los axiomas de Peano . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 50
2.1.3. El principio de buena ordenación. . . . . . . . . . . . . . . . . . . . . . . . . . 52
2.2. Números enteros. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 52
2.2.1. Necesidad de los enteros. Propiedades de Z. Idea de anillo. . . . . . . . . . . 52
2.2.2. División entera. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 55
2.2.3. Representación decimal y binaria. Bases de numeración . . . . . . . . . . . . 57
2.2.4. Máximo común divisor. Algoritmo de Euclides. . . . . . . . . . . . . . . . . . 62
2.2.5. Números primos y factorización. Teorema fundamental de la Aritmética. . . . 71
2.2.6. Congruencias. Aritmética modular. . . . . . . . . . . . . . . . . . . . . . . . . 75
i
ii ÍNDICE GENERAL
3. Números racionales. Polinomios. 89

3.1. Números racionales. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 89
3.1.1. Insuficiencia de Z. Fracciones. . . . . . . . . . . . . . . . . . . . . . . . . . . . 89
3.1.2. Construcción de Q . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 90
3.2. Polinomios . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 96
3.2.1. Definiciones. Suma y producto de polinomios. . . . . . . . . . . . . . . . . . . 96
3.2.2. División de polinomios. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 98
3.2.3. Máximo común divisor. Algoritmo de Euclides. . . . . . . . . . . . . . . . . . 99
3.2.4. Funciones polinómicas. Raı́ces de polinomios. . . . . . . . . . . . . . . . . . . 103
3.2.5. Factorización de polinomios. . . . . . . . . . . . . . . . . . . . . . . . . . . . . 107
3.2.6. Polinomios, maple y Mathematica . . . . . . . . . . . . . . . . . . . . . . . 111
4. Números reales 119

4.1. Construcciones de los números reales . . . . . . . . . . . . . . . . . . . . . . . . . . . 119
4.1.1. Insuficiencia de Q . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 119
4.1.2. Construcciones de R a partir de Q. . . . . . . . . . . . . . . . . . . . . . . . . 120
4.2. Axiomática de R . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 121
4.3. Representación decimal . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 122
4.3.1. Aperitivo. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 122
4.3.2. Representación decimal canónica . . . . . . . . . . . . . . . . . . . . . . . . . 122
4.3.3. Decimales periódicos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 127
4.4. Representación en otras bases . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 129
4.4.1. Representación binaria . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 129
4.4.2. Representaciones en bases distintas de 10 y 2 . . . . . . . . . . . . . . . . . . 130
5. Números complejos 133

5.1. El cuerpo complejo. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 133
5.2. El plano complejo . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 138
5.3. Polinomios en C y en R. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 141
5.3.1. Potencias y raı́ces de un número complejo . . . . . . . . . . . . . . . . . . . . 142
5.3.2. Teorema fundamental del Álgebra y sus consecuencias . . . . . . . . . . . . . 144
5.4. Fracciones racionales. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 147
5.4.1. Funciones racionales . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 148
5.4.2. Fracciones simples . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 149
5.5. Números complejos y geometrı́a plana . . . . . . . . . . . . . . . . . . . . . . . . . . 151
6. Aritmética de punto flotante. 155

6.1. Aperitivo. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 155
6.2. Representación en punto flotante . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 156
6.2.1. Números de máquina . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 156
6.2.2. Aproximación por redondeo . . . . . . . . . . . . . . . . . . . . . . . . . . . . 159
6.3. Aritmética ‘aproximada’ . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 162
6.4. Estrategias de cálculo . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 168
6.4.1. Reformulación del problema: Ejemplos . . . . . . . . . . . . . . . . . . . . . . 168
6.4.2. Refinamientos en la representación y en la precisión . . . . . . . . . . . . . . 171
6.4.3. Buscar algoritmos estables . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 173
6.4.4. Compensaciones estadı́sticas . . . . . . . . . . . . . . . . . . . . . . . . . . . 176
Capı́tulo 0
El principio de inducción
El objetivo fundamental de este capı́tulo es familiarizarnos con el principio de inducción y

comenzar a utilizarlo en algunos ejemplos, ya que será una herramienta necesaria a lo largo de toda
la asignatura —y de las demás asignaturas, no sólo de este curso.
Al final del capı́tulo se incluyen una serie de referencias en las que podrán completarse algunos
de los temas que aquı́ se esbozan; en casi todas ellas hay ejercicios adicionales (a veces, resueltos)
para practicar con el principio de inducción, pero es bastante más formativo tratar de resolver a
fondo personalmente unos pocos ejercicios que leer muchas soluciones ajenas.
0.1. Revisión de los números naturales

Para comenzar a llevar a cabo nuestro plan de revisión, empezaremos por reflexionar sobre
los objetos matemáticos más sencillos o, mejor dicho, que nos son más familiares: los números
naturales.
Previamente, pongámonos de acuerdo en un punto:
¿Cuál es el primer número natural?
La cuestión no es tan trivial como aparenta. De hecho, en algunos libros se da como respuesta 1
(especialmente en los de Análisis matemático) pero en otros se contesta que es 0 (especialmente en
los de Álgebra).
Esta pluralidad de respuestas obedece, fundamentalmente, al uso que vaya a hacerse de los
números naturales. Simplificando burdamente, podrı́amos decir que incluir 0 entre los números
naturales responde al deseo de operar con ellos de una manera similar para la suma y el producto;
es decir, que igual que para el producto se dispone de un número que multiplicado por cualquier
otro deja como resultado el mismo número, puede parecer conveniente que haya también un número
que sumado con cualquier otro deje este último como resultado.
También puede argumentarse que con el cero podemos representar el número de elementos de
un conjunto vacı́o, de un conjunto sin elementos. Pero en la vida cotidiana, cuando contamos,
contamos “algo”, y empezamos por el 1; escribimos normalmente hh 1o ii por hh primeroii, hh 2o ii por
segundo, . . . (El 0 parece más ‘artificial’ que ‘natural’, valga el juego de palabras. De hecho, el 0 ha
tenido una larga y complicada historia: fue introducido inicialmente como un sı́mbolo y no como
un “verdadero” número, ver [3]).
Que en libros ‘serios’ se adopte tanto una como otra posibilidad y en ambos casos se desarrolle
una teorı́a coherente de los números naturales, parece sugerir que el quid de la cuestión no está en
las operaciones aritméticas, sino en la propia génesis de los números naturales, en la manera de
‘fabricarlos’. En este sentido, podrı́amos preguntar ‘ingenuamente’
¿Cuál es la propiedad más importante de los números naturales?
Tal vez lo esencial no es que ‘el primer’ número natural sea el 0 o el 1, sino que haya un primer
número natural, al cual sigue otro, y a éste otro, y a éste otro, . . . , y ası́ sucesivamente, sin tope,
1
2 CAPÍTULO 0. EL PRINCIPIO DE INDUCCIÓN
y que de esta manera podemos ‘atrapar’ todos los números naturales sin que escape ninguno.
Dicho en la jerga profesional, lo que importa es la propiedad de inducción del conjunto de
los números naturales. Antes de desarrollar esta idea, introducimos la siguiente
Notación.
En lo sucesivo, denotaremos con N el conjunto de los números naturales o enteros positivos

1, 2, 3, . . .
y con N0 el conjunto de los números enteros no negativos
0, 1, 2, 3, . . .
Acordada esta notación, volvamos al asunto de la inducción en N. Tenemos en N, pues, un

elemento inicial que denotamos con 1, al que sigue otro elemento que denotamos con 2, al que
sigue otro elemento que denotamos con 3, al que sigue . . . . Es decir, como propiedad básica de
N consideramos que, en general, cada número natural tiene un siguiente o sucesor, y N se genera
partiendo de 1 y pasando repetitivamente al siguiente de 1, al siguiente del siguiente de 1, al
siguiente del siguiente del siguiente de 1, y ası́ sucesivamente. Pero esta descripción plantea un
problema, la insatisfactoria ‘repetición infinita’ que deja abierta el hh y ası́ sucesivamenteii anterior
(una sucesión de definiciones que no acaba nunca). Dejando el análisis profundo para los filósofos,
con Aristóteles a la cabeza, este problema se zanja en Matemáticas aplicando el siguiente principio:
Inducción matemática. Un conjunto de números naturales que contenga a 1 y que
con cada n contenga al siguiente, debe contener a todos los números naturales.
Más informal: para probar que un conjunto de números naturales abarca todo N, basta que nos
aseguremos de que el 1 está en él, y que demostremos que si admitimos que está n, se deduce que
necesariamente ha de estar también n + 1 (el siguiente de n).
Esta propiedad es la base de muchas definiciones (definiciones recursivas o inductivas) y de
muchas demostraciones (demostraciones por inducción) que involucran a los números naturales.
Comencemos por presentarla de modo que facilite su uso práctico en demostraciones.
0.2. Principio de inducción

La ‘propiedad de inducción’ de N, en la práctica, suele formularse en términos de proposiciones
(enunciados que tienen sentido en un cierto contexto, y que pueden resultar ciertos o pueden resultar
falsos). Si para cada n ∈ N tenemos una proposición Pn , entonces Pn puede ser verdadera para
algunos valores de n y falsa para otros. Por ejemplo, si Pn es la proposición: hh n2 = n ii, entonces
P1 es verdadera (ciertamente 12 = 1), mientras que Pn es falsa para todo n 6= 1, n ∈ N (¿podrı́as
justificar por qué?); si Pn es la proposición:
n (n + 1)
hh 1 + 2 + 3 + ··· + n =ii
2
entonces Pn es verdadera para todo n ∈ N, porque denotando con s la suma del primer término de
la igualdad,
s = 1 + 2 + 3 + ··· + (n − 1) + n
+)
s = n + (n − 1) + (n − 2) + · · · + 2 + 1
2s = (n + 1) + (n + 1) + (n + 1) + · · · + (n + 1) + (n + 1) = n (n + 1)
n (n + 1)
y ası́ s = , como querı́amos probar.
2
0.2. PRINCIPIO DE INDUCCIÓN 3
¿Qué hacer si no hay demostración ‘a la vista’ ? Supongamos ahora que la proposición Pn es la

llamada desigualdad de Bernoulli :
dado n ∈ N, para todo número real x ≥ −1 se verifica (1 + x)n ≥ 1 + nx.
No hay una estrategia directa de éxito claro: podrı́amos pensar en el desarrollo de (1+x)n mediante
la fórmula del binomio, que comenzarı́a por 1+n x+ 21 n (n−1) x2 +· · · , pero la aparición de sumandos
posiblemente negativos (donde haya potencias impares de x cuando consideremos 0 > x ≥ −1)
dificulta el control del tamaño del resultado.
Sin embargo, es muy sencillo probar que si para algún n es cierta Pn , es decir, se cumple
(1 + x)n ≥ 1 + nx (∗ )
entonces también es cierta Pn+1 , es decir, se cumple
(1 + x)n+1 ≥ 1 + (n + 1) x.
En efecto: multiplicando los dos términos de la desigualdad (∗ ) por el número real no negativo
1 + x, se mantiene el sentido de la desigualdad y ası́
(1 + x)n+1 = (1 + x)n (1 + x) ≥ (1 + nx) (1 + x) = 1 + (n + 1) x + nx2 ,
y como nx2 ≥ 0, tendremos 1 + (n + 1) x + nx2 ≥ 1 + (n + 1) x y finalmente
(1 + x)n+1 ≥ 1 + (n + 1) x.
¿No habrá alguna forma de sacarle partido a este hecho? Pensemos un momento: el conjunto de los
números naturales para los que Pn se cumple tiene la propiedad de que con cada n que esté en él,
debe estar también n + 1. De acuerdo con la inductividad de N, bastarı́a que 1 estuviese en dicho
conjunto, para que todos los números naturales estuviesen en dicho conjunto —lo que significarı́a
que Pn serı́a cierta para todo número natural n. Pero P1 dice que ha de ser (1 + x)1 ≥ 1 + 1 · x,
o sea, 1 + x ≥ 1 + x, trivialmente cierto (incluso para cualquier número real x sin restricción).
Ası́ pues, acabamos de demostrar que Pn es cierta para todo número natural n.
Por tanto, ¡hemos encontrado una demostración indirecta, más abordable, del resultado que
buscábamos probar!
Esta misma situación se repite suficientes veces como para que el método empleado merecezca
un enunciado destacado, con nombre propio.
1. Principio de inducción. Para cada número natural n, sea Pn una proposición que puede ser
cierta o falsa, de tal manera que
P1 es cierta, y
para cada n ∈ N, suponiendo que Pn es cierta se puede demostrar que Pn+1 es cierta.
Entonces se cumple que
F Pn es cierta para todo n ∈ N.
Veamos la aplicación de este principio en algunos ejemplos.
Ejemplos.
1. Demostrar que, cualquiera que sea el número natural n,
n
X n (n + 1) (2n + 1)
k2 = .
6
k=1
n
X
(La expresión k 2 es una manera abreviada de indicar 12 + 22 + · · · + k 2 + · · · + n2 .)
k=1
No se ve una manera obvia de calcular directamente la suma que nos proponen (lo que no quiere
decir que no exista). Pero sı́ podemos probar fácilmente por inducción que se cumple la igualdad
para todo n. Para ello, tomemos como Pn la proposición del enunciado:
n
X n (n + 1) (2n + 1)
Pn :: k2 = .
6
k=1
1
X n (n + 1) (2n + 1) 1 (1 + 1) (2 · 1 + 1)
P1 es cierta: para n = 1, k 2 = 12 = 1, mientras que = =
6 6
k=1
1·2·3
= 1.
6
Si es cierta Pn para un n, ¿también es cierta Pn+1 ?
n+1
X (n + 1) (n + 1 + 1) (2(n + 1) + 1) (n + 1) (n + 2) (2n + 3)
Pn+1 :: k2 = =
6 6
k=1
Sı́: porque
n+1
X
k 2 = 12 + 22 + · · · + k 2 + · · · + n2 + (n + 1)2
k=1
n
X ∗ n (n + 1) (2n + 1)
= k 2 + (n + 1)2 = + (n + 1)2
6
k=1
n (n + 1) (2n + 1) + 6(n + 1)2 (n + 1) [n (2n + 1) + 6(n + 1)]
= =
6 6
(n + 1) [2n2 + n + 6n + 6] (n + 1) [2n2 + 7n + 6]
= = .
6 6
∗
En la igualdad = hemos empleado la hh hipótesis de inducciónii (esto es, que suponemos Pn cierta).
Y por último, también
(n + 1) (n + 2) (2n + 3) (n + 1) [(n + 2) (2n + 3)] (n + 1) [2n2 + 7n + 6]

= = .
6 6 6
2. Demostrar que, cualquiera que sea el número natural n,
(i) 42n+1 + 3n+2 es divisible por 13;
(ii) 22n + 5 es divisible por 3;
(iii) 22n + 15n − 1 es divisible por 9.

(i) Para cada número natural n, tomamos
Pn :: 42n+1 + 3n+2 es divisible por 13.
Para n = 1, 42+1 + 31+2 = 64 + 27 = 91 = 13 · 7 (P1 es cierta).

Dado un número natural n arbitrario, supongamos cierta la propiedad para n. Pasando a n + 1,
42(n+1)+1 +3(n+1)+2 = 16·42n+1 +3·3n+2 = (13+3)·42n+1 +3·3n+2 = 13·42n+1 +3 42n+1 + 3n+2 ,

que, aplicando la hipótesis de inducción, es múltiplo de 13 por ser suma de múltiplos de 13.
(ii) Para cada número natural n, tomamos
Pn :: 22n + 5 es divisible por 3.

0.2. PRINCIPIO DE INDUCCIÓN 5
para n = 1, 22 + 5 = 4 + 5 = 3 · 3,
y si es cierto para un n que 22n + 5 es múltiplo de 3, pasando a n + 1,

22(n+1) + 5 = 4 · 22n + 5 = (3 + 1) · 22n + 5 = 3 · 22n + 22n + 5 ,

suma de múltiplos de 3.
(iii) Para cada número natural n, tomamos
Pn :: 22n + 15n − 1 es divisible por 9.
Para n = 1, 22 + 15 − 1 = 18 = 9 · 2 (P1 es cierta).

Dado un número natural n arbitrario, supongamos cierta la propiedad para n, de modo que
exista un k ∈ N tal que 22n + 15n − 1 = 9k. Pasando a n + 1,
22(n+1) +15(n+1)−1 = 4·22n +15n+14 = 4(9k−15n+1)+15n+14 = 4·9k−3·15n+18 = 9(4k−5n+2).
Alternativamente:
22(n+1) + 15(n + 1) − 1 = 4 22n + 15n − 1 − 45n + 18, que será divisible por 9.

O incluso de otra forma:
22(n+1) +15(n+1)−1 = 4·22n +15n+15−1 = 22n +3·22n +15n−1+15 = 22n +15n−1+3 22n + 5 ,

y como 22n + 5 es múltiplo de 3 según hemos probado, lo anterior sea múltiplo de 9 (aplicando la
hipótesis de inducción).
3. Obsérvese que
1 1
1− = ,
2
2
1 1 1
1− 1− = ,
2 3 3

1 1 1 1
1− 1− 1− = .
2 3 4 4
Se pide: conjeturar una ley general sencilla que incluya las anteriores como casos particulares, y
demostrarla mediante el principio de inducción.
Parece que se cumple

1 1 1 1 1 1
Pn :: 1− 1− 1− ··· 1 − 1− = .
2 3 4 n n+1 n+1
Veamos si podemos probarlo por inducción.

1 1
P1 es cierta, trivialmente 1 − = .
2 2
Supongamos cierta Pn . Entonces

1 1 1 1 1 1
1− 1− 1− ··· 1 − 1− 1−
2 3 4 n n+1 n+2

∗ 1 1 1 (n + 2) − 1 1 n+1 1
= 1− = = = ,
n+1 n+2 n+1 n+2 n+1 n+2 n+2
∗
es decir, resulta cierta Pn+1 (hemos aplicado la hipótesis de inducción para escribir =).
0.3. Principio de inducción ‘completa’

A veces, la ayuda que proporciona suponer cierta Pn para demostrar Pn+1 es insuficiente, y se
hace necesario un “apoyo más amplio”. No es difı́cil ver que, cuando interese, se puede modificar
el principio de inducción para usar como “hipótesis de inducción” que son ciertas todas las pro-
posiciones P1 , . . . , Pn , y deducir de ellas Pn+1 . El resultado es lo que algunos textos denominan el
principio de inducción ‘fuerte’ (ver [D’A-W]) o principio de inducción ‘completa’.1
2. Principio de inducción ‘completa’. Para cada número natural n, sea Pn una proposición,
cierta o falsa, de tal manera que
P1 es cierta, y
para cada n ∈ N, suponiendo que P1 , P2 , . . . , Pn son ciertas se puede demostrar que Pn+1 es
cierta.
F Pn es cierta para todo n ∈ N.
Veamos la ventaja conseguida en un ejemplo. Recordemos que un número natural p distinto
de 1 es primo si no tiene más divisores en N que 1 y el propio p; abordemos ahora el siguiente
ejercicio:
4. Probar que para todo número natural n ≥ 2 existe un número primo p que divide a n.
Con el principio de inducción utilizado como hasta ahora, un intento razonable serı́a tomar
Pn :: n = 1 o n ≥ 2 y existe un número primo p que divide a n.
Trivialmente, P1 es cierta. Pero si para un n es cierta Pn , ¿deberá ser cierta Pn+1 ? ¿de qué sirve
que n sea divisible por un número primo p, si eso no implica que p divida a n + 1, ni que ningún
número primo ligado con p (el siguiente, por ejemplo) divida a n + 1?
Sin embargo, pasemos al principio de inducción completa: ahora, partimos de un n tal que no
sólo es cierta Pn , sino también P1 , P2 , y Pk para cualquier k ≤ n. Entonces:
— si n + 1 es primo, basta tomar p = n + 1 para ver que Pn+1 es cierta;
— y si n + 1 no es primo, tendrá un divisor positivo k distinto de 1 y de n + 1; pero los divisores
de un número son menores o iguales que dicho número (¿por qué?); ası́ pues, será k < n + 1, por lo
que k valdrá a lo más n. En consecuencia, Pk es cierta, por nuestra ‘nueva’ hipótesis de inducción.
Y como k 6= 1, esto significa que k admite un divisor primo p, que a su vez será divisor de n + 1;
por tanto Pn+1 es igualmente cierta en este caso. En consecuencia, Pn es cierta para todo n, como
querı́amos demostrar.
Comentarios
La estrategia de demostración que el principio de inducción proporciona recuerda lo que los
franceses llaman reculer pour mieux sauter, retroceder para saltar más. Comparando las dos versio-
nes que hemos enunciado, podrı́amos decir que en la primera tomamos una “pequeña carrerilla”,
de un sólo paso, mientras que en la inducción completa la “carrerilla”se toma desde el principio.
Siguiendo con las comparaciones, también se llama al ‘primer’ principio de inducción el principio
de las fichas de dominó: si pensamos en una colección infinita de fichas de dominó puestas una tras
otra, para tirarlas todas basta con asegurarse de que cae la primera y de que estén colocadas de
forma que cada ficha tire a la siguiente.
1
Su justificación es sencilla: basta observar que el conjunto S = {n ∈ : P1 , P2 , . . . , Pn son todas ciertas}
N
cumple que 1 ∈ S y que n ∈ S implica n + 1 ∈ S; o aplicar el principio de inducción “normal” a la proposición

Qn = P1 “y” P2 “y” . . . “y” Pn , denotada en lógica proposicional por Qn = P1 ∧ P2 ∧ · · · ∧ Pn , que es cierta
cuándo y sólo cuando cada una de las P1 , . . . , Pn son ciertas.
0.4. PRINCIPIO DE INDUCCIÓN ‘DESPLAZADA’ 7
0.4. Principio de inducción ‘desplazada’

Sigamos considerando una colección de proposiciones P1 , P2 , P3 , . . . (una para cada número
natural). A veces se cumple que Pn+1 es cierta siempre que lo sea Pn , aunque P1 sea falsa. Por
ejemplo, consideremos Pn : hh n = n + 1ii; obviamente, de n = n + 1 se sigue que n + 1 = (n + 1) + 1,
que es Pn+1 , mientras que 1 6= 2.
¿Qué conclusiones cabe extraer de este ejemplo trivial? La primera, algo que no hay que olvidar
nunca en Matemáticas: los enunciados matemáticos dicen exactamente lo que dicen, y hasta que
no hayamos comprobado todas las hipótesis, no podemos afirmar ninguna tesis. Y concretamente
en el principio de inducción, no hay que lanzarse sin más a probar que Pn implica Pn+1 olvidando
probar que P1 es cierta (lo que sucede con cierta frecuencia).
La segunda conclusión (ahora que ya nos hemos vuelto extremadamente cuidadosos) es que si
Pn implica Pn+1 para todo n ∈ N y P1 es falsa, quizá Pn no sea cierta para ningún n.
¿Por qué quizá solamente? Porque podrı́a suceder que para algún valor n1 la correspondiente
proposición Pn1 fuese cierta. Por ejemplo, examinemos Pn : hh n2 > n + 2 ii. Que Pn implica Pn+1 es
sencillo de probar: de n2 > n + 2 (n ∈ N) se sigue que (n + 1)2 = n2 + 2n + 1 > n + 2 + 2n + 1 >
(n + 1) + 2; y 12 no es estrictamente mayor que 1 + 2, con lo que P1 es falsa. Pero 42 > 4 + 2, luego
P4 es cierta. ¿Qué provecho se saca de esta información? Que Pn es cierta al menos para n ≥ 4,
según se deduce aplicando el principio de inducción a la proposición Qn = Pn+3 . ¿Sólo para estos
n es cierta Pn ? En este caso no: también es cierta P3 .
Por tanto, resumiendo: cuando se cumple que Pn+1 es cierta siempre que lo sea Pn , o bien Pn
es falsa para todo n o, en caso contrario, hay al menos un valor n1 tal que Pn1 es cierta, y en este
supuesto, procediendo como antes, se prueba lo que suele llamarse el principio de inducción
‘desplazada’ (no es una denominación estándar).
3. Principio de inducción “desplazada”. Sea n1 un número natural dado, y para cada número
natural n ≥ n1 sea Pn una proposición, cierta o falsa, de tal manera que
Pn1 es cierta, y
para cada número natural n ≥ n1 , admitiendo que Pn es cierta se puede demostrar que Pn+1
es es cierta,
F Pn es cierta para todo n ≥ n1 .
Con esta nueva herramienta y las anteriores, el lector puede abordar por su cuenta los ejercicios
del apartado siguiente.
0.5. Ejercicios
0.1. Demostrar que para cada número natural n tal que n2 + 5n + 1 es un número par, también
(n + 1)2 + 5(n + 1) + 1 es un número par. ¿Se sigue de aquı́ por inducción que n2 + 5n + 1 es siempre
un número par? ¿Cuál es la conclusión correcta? Demostrarlo.
0.2. ¿Para qué números naturales n es cierta la desigualdad 2n > n2 ? Demostrarlo por inducción.
0.3. Sea S = {n ∈ N : 2n < 2n }. Probar que n + 1 ∈ S siempre que n ∈ S. ¿Se deduce de aquı́ que
S = N? ¿Por qué? Si no, ¿quién es S? ¿Por qué?
0.4. Demostrar que para todo n ∈ N,
n 2
X
3 n(n + 1)
k = .
2
k=1
0.5. Demostrar que para todo n ∈ N,

2n 2n
X 1 X (−1)k+1
= .
k k
k=n+1 k=1
0.6. Observar que
1 = 1;
1 − 4 = −(1 + 2);
1 − 4 + 9 = 1 + 2 + 3;
1 − 4 + 9 − 16 = −(1 + 2 + 3 + 4).
Conjeturar una fórmula general sencilla que incluya las anteriores como casos particulares, y de-
mostrarla mediante el principio de inducción.
0.7. Definamos los números a1 , a2 , a3 , . . . por a1 = 9, a2 = 36, an+1 = 6an − 9an−1 si n ≥ 2.
Probar que an está bien definido para todo n y que an = 3n (n + 2).
0.8. Sea u1 = 2, u2 = 3, un+1 = 3un − 2un−1 si n ≥ 2. Probar que un está bien definido para todo
n y que un = 2n−1 + 1.
0.9. (a) Conjetura una fórmula para 1 + 3 + · · · + (2n − 1) evaluando la suma para n = 1, 2, 3 y 4.
(b) Prueba tu fórmula usando el principio de inducción.
0.10. (a) Conjetura una fórmula que simplifique el producto

1 1 1 1
1− 1− 1− ··· 1 − 2 .
4 9 16 n
(b) Prueba tu fórmula usando el principio de inducción.
Para finalizar el capı́tulo, un ‘clásico’.

0.11. Evaluar el siguiente resultado:
Teorema. En cualquier examen, todos los alumnos presentados obtienen la misma calificación.
Demostración : La haremos por inducción. Para cada n ∈ N, sea Pn la proposición
hh todo conjunto de n alumnos distintos, al realizar un examen, obtiene una única calificación.ii
Evidentemente, P1 es cierta. Veamos cómo de Pn se sigue Pn+1 .

Supongamos que tenemos un conjunto {A1 , A2 , . . . , An , An+1 } de n + 1 alumnos distintos, con
calificaciones a1 , a2 , . . . , an , an+1 .
Considerando {A1 , A2 , . . . , An }, tenemos un conjunto de n alumnos distintos, luego por la
hipótesis de inducción (estamos admitiendo que Pn es cierta) se tendrá a1 = a2 = · · · = an .
Considerando ahora {A2 , . . . , An , An+1 }, tenemos igualmente un conjunto de n alumnos distin-
tos, de donde a2 = · · · = an = an+1 .
Por tanto, hemos encontrado que
)
a1 = a2 = · · · = an
luego a1 = a2 = · · · = an = an+1 ,
a2 = · · · = an = an+1
es decir, los n + 1 alumnos han obtenido la misma calificación, como querı́amos demostrar.
0.6. APÉNDICE: DEFINICIONES RECURSIVAS. 9
0.6. APÉNDICE: Definiciones recursivas.

Ocupémonos ahora de la inducción como medio de construir definiciones. Exponer una descrip-
ción general del ‘método de definición inductiva’ es competencia de la Lógica matemática o de la
teorı́a de programación de ordenadores, por lo que aquı́ nos limitaremos a mostrar algunos ejemplos
y señalar sus caracterı́sticas más destacadas. Esta sección debe verse más como tema de lectura que
como ‘objeto de estudio’, si bien trata una cuestión importante que no suele comentarse con mucho
detenimiento y que, por eso mismo, puede servir de buena ayuda para entender ciertos aspectos
que de otra manera originarı́an confusión.
En apartados anteriores nos Pnhemos tropezado, sin prestarles especial atención, con expresiones
2
como 1 + 2 + 3 + · · · + n, o k=1 k de la que, decı́amos, era hh una manera abreviada de indicar
12 + 22 + · · · + k 2 + · · · + n2 ii. Usualmente, una descripción de este tipo suele bastar para aclarar a
qué nos referimos; no obstante, al menos las primeras veces que uno se encuentra con ellas, suele ser
necesaria una explicación más detallada de su significado, y no digamos si se trata de implementar
un procedimiento de cálculo de las mismas en un ordenador.
Esto indica que las descripciones “mediante puntos suspensivos · · · ” conllevan una cierta am-
bigüedad, como ocurrı́a con los “y ası́ sucesivamente” que hemos comentado al comienzo del capı́tu-
lo. Generalmente, esta ambigüedad se evita dando una definición recursiva o inductiva; veamos un
primer ejemplo.
Cuando se necesita dar una definición inequı́voca de una expresión como
Sn = 12 + 22 + · · · + n2 ,
basta observar cómo pasamos de cada valor de n al siguiente:
Sn+1 = 12 + 22 + · · · + n2 + (n + 1)2 = Sn + (n + 1)2 ,
con lo cual el problema se solventa fácilmente usando la propiedad de inducción de N; no hay más
que definir Sn haciendo
S1 = 12 y Sn+1 = Sn + (n + 1)2 para cada n ∈ N.
¿Para qué números naturales está bien definido Sn mediante la fórmula anterior? Desde luego para
1, y también para el siguiente de cada número natural para el que esté bien definido; es decir, para
todos los números naturales, por inducción.
Análogamente, si se trata de definir la expresión an para un número dado a y un exponente
n ∈ N cualquiera, en vez de plantearla como “el producto de n factores iguales a a”, podemos
definir recursivamente
a1 = a, an+1 = an · a,
y vale repetir el argumento anterior para concluir que ası́ an está bien definido para todo n ∈ N.
Estos ejemplos muestran que en una definición recursiva, la construcción del objeto que se
define se hace siguiendo siempre unas mismas reglas, pero estas reglas hacen referencia al propio
objeto. Por ello, para no caer en un cı́rculo vicioso, el primero o primeros casos se definen siempre de
manera expresa, sin apelar a las reglas. Consecuentemente, en cada definición recursiva encontramos
siempre dos partes,
la base, que nos dice ‘cómo comenzar’;
la recursión, que nos dice cómo proseguir paso a paso.
Pn ejemplo, si para cada n ∈ N hemos fijado un cierto número an , y definimos recursivamente

Por
k=1 ak mediante
1
X n+1
X n
X
ak = a1 y ak = ak + an+1 para cada n ∈ N,
k=1 k=1 k=1
la base es 1k=1 ak = a1 y la recursión n+1

P P Pn
k=1 ak = k=1 ak +an+1 . De paso, observemos que el ı́ndice
k
Pnpuede sustituirse
Pn por cualquier
Pn otro sı́mbolo, es en realidad un ‘ı́ndice mudo’, y lo mismo significa
k=1 ak que m=1 am o t=1 at : en definitiva, se trata del número Sn construido recursivamente
a partir de S1 = a1 , Sn+1 = Sn + an+1 .
Curiosamente, aparecen definiciones recursivas incluso ‘en la vida misma’. Por ejemplo, ‘perte-
necen a la realeza los reyes o los hijos de algún miembro de la realeza’.
Otros ejemplos más ‘matemáticos’, son los siguientes:
Progresión aritmética de primer término a y razón d, dada por

a1 = a, an+1 = an + d.
‘Obviamente’ an = a+(n−1) d; una demostración completa y cuidadosa es fácil por inducción.
Progresión geométrica de primer término a y razón r, dada por

a1 = a, an+1 = r · an .
‘Obviamente’ an = a · rn−1 ; podemos ‘asegurarnos’ usando inducción.
Un ejemplo famosı́simo [4]: la sucesión de Fibonacci 1, 1, 2, 3, 5, 8, 13, 21, . . . , en la que

cada término es suma de los dos anteriores (y los dos primeros son iguales a 1). Su definición
recursiva es
φ1 = 1, φ2 = 1, φn+1 = φn + φn−1 si n ≥ 2.
NOTA. Estos ejemplos no deben llevar a la conclusión de que cualquier fórmula proporciona una
definición recursiva. Basta observar lo que ocurre si ponemos
3 1
a1 = , an+1 = .
2 an − 1
1 1 1
Entonces a2 = = 2, a3 = = 1, a4 = =???.
(3/2) − 1 2−1 1−1
El factorial de un número natural n, denotado por n! y definido inductivamente por

1! = 1, (n + 1)! = (n + 1) · n!,
que suele introducirse habitualmente como hh el producto n · (n − 1) · · · 3 · 2 · 1ii.
Como se señala en [G-H], hh cuando el reemplazamiento de los puntos suspensivos es una tarea
rutinaria para los seres humanos, a menudo los puntos sustituyen la definición inductiva que se
espera que dé el lector. El uso de puntos suspensivos hace a menudo que las fórmulas sean más
fáciles de entender, pero, nuevamente, sólo para lectores humanos. Y en trabajos más avanzados [o
más cuidadosos], la definición por inducción tiene que ser dada [explı́citamente].ii
Por lo que a los ordenadores se refiere, hay lenguajes de programación como C que admiten
procesos recursivos y otros, como algunos ‘dialectos’ de Fortran, que no los admiten. En esta última
situación, hay que transformar los procesos recursivos en procesos iterativos, de carácter cı́clico,
que hacen uso de bucles en los que intervienen valores calculados en el ciclo previo. Todo programa
recursivo puede reescribirse como un programa iterativo, aunque ciertos problemas se resuelven
de manera más simple y natural mediante recursión (generalmente, a costa de mayor consumo de
memoria). Un ejemplo muy ilustrativo es el conocido problema ‘de la torre de Hanoi’, que puede
verse en [5] o [6].
Bibliografı́a
[B-S] Bartle, R. G.- Sherbert, D. R.: Introducción al Análisis Matemático de una Variable.
Limusa, México, 1990.
Trata el principio de inducción en la Sección 1.3 (págs. 31 a 35). Muy detallado en sus comentarios.
Tiene una buena selección de ejemplos y ejercicios.
[D’A-W] D’Angelo, J. P.; West, D. B.: Mathematical Thinking. Problem-Solving and Proofs.
Prentice-Hall, Upper Saddle River, NJ, 1997.
Dedica al principio de inducción su capı́tulo 4 (págs. 56 a 73). Es un libro muy original en su plantea-
miento, y contiene una gran cantidad de ejercicios y problemas (algunos con cierto grado de dificultad).
[Ebb] Ebbinghaus, H.-D. & al.: Numbers. Springer, New York, 1991.
Es un excelente libro de consulta, a medio camino entre la historia de las ideas sobre los números y
la exposición ‘de teoremas’. Alcanza niveles que superan ampliamente el contenido de este curso, pero
merece la pena conocerlo. En la pág. 15 se encuentra el principio de inducción. No tiene ejercicios.
[G-H] Griffits, H. B.; Hilton, P. J.: Classical Mathematics. Van Nostrand Reinhold, London,
1970.
Una obra ambiciosa: el tı́tulo completo es A Comprehensive Textbook of Classical Mathematics. A
Contemporary Interpretation. Baste con decir que cumple sobradamente su propósito. Tanto su plan-
teamiento como su exposición no han perdido nada de su valor con el tiempo, sino todo lo contrario.
Excelentes comentarios y ejercicios. Imprescindibles y más completos de lo habitual su tratamiento y
comentarios sobre inducción, a la que dedica el capı́tulo 5.
[Lieb] Liebeck, M.: A Concise Introduction to Pure Mathematics. Chapman & Hall/CRC, Boca
Raton, 2000.
De planteamiento muy similar al de esta asignatura, difiere en algunos contenidos y en el orden de expo-
sición. El principio de inducción aparece su capı́tulo 8 (págs. 55 a 68). Tiene ejercicios muy interesantes,
y el capı́tulo 9 está dedicado a demostrar por inducción la fórmula de Euler hh caras + vértices = aristas
+2ii, que aplica luego al estudio de los cinco sólidos platónicos (cubo, tetraedro, octaedro, icosaedro y
dodecaedro).
[Pest] Pestana, D. & al.: Curso práctico de Cálculo y Precálculo. Ariel, Barcelona, 2000.
Orientado fundamentalmente a servir de base para el Análisis matemático, parte de su contenido coincide
con el de nuestra asignatura. Muy claro y muy práctico, explica el principio de inducción en la página
30, dentro de un capı́tulo titulado Métodos de demostración que merece ser leı́do en su totalidad.
11
12 BIBLIOGRAFÍA
Documentos en Internet
[1] Interactive Real Analysis, Seton Hall University:

http://www.shu.edu/projects/reals/infinity/index.html
[2] ¿Es el 0 un número natural?: Math.Sci FAQ,

http://db.uwaterloo.ca/~alopez-o/math-faq/node12.html#SECTION00321000000000000000
[3] Historia del cero, The MacTutor History of Mathematics archive, St Andrews University,
Escocia.
http://www-groups.dcs.st-and.ac.uk/~history/HistTopics/Zero.html
[4] Sobre la sucesión de Fibonacci.

http://www.arrakis.es/~mcj/fibonacc.htm
[5] Recursión y la torre de Hanoi, Universidad de Málaga.

http://www.lcc.uma.es/~pepeg/modula/temas/tema11.pdf
[6] S. Romero, La recursividad.

http://pinsa.escomposlinux.org/sromero/prog/recursividad.html
Capı́tulo 1
Introducción a la teorı́a de conjuntos.
En Matemáticas, los conjuntos aparecen inevitablemente, bien de forma explı́cita o bien de forma
implı́cita, y podemos encontrar ejemplos en abundancia. Acabamos de examinar una propiedad ‘de
los números naturales’, el principio de inducción, que no es una propiedad de cada número natural
(del 1, o del 2, o del 46) sino del conjunto de los números naturales. Igualmente, cuando se dice
que hay “infinitos números primos”, no expresamos una propiedad de cada número primo, sino del
conjunto que forman: “el conjunto de los números primos es infinito”. Muchos objetos geométricos
son conjuntos: rectas, planos, circunferencias, cualquier figura geométrica es un conjunto de puntos;
hablamos del “conjunto de soluciones” de una ecuación o de un sistema de ecuaciones; un espacio
vectorial es un conjunto en el que se ha definido una suma y un producto por escalares que cumplen
unas ciertas reglas, etc.
Sin embargo, el estudio de los conjuntos como objetos matemáticos en sı́ mismos, es decir, la
Teorı́a de conjuntos como disciplina matemática, no aparece hasta la segunda mitad del siglo XIX,
creada por G. Cantor.
La formalización de la Teorı́a de conjuntos como una teorı́a axiomática resultó extremadamente
difı́cil, pese a lo simple y poco problemática que parecı́a la noción de conjunto. Sus primeros
desarrollos hicieron aparecer las famosas paradojas de Burali-Forti, de Cantor, de Russell; las
discusiones sobre el axioma de elección y la hipótesis del continuo . . . (ver [GJPR], [Ap])
Pero lo que a nosotros nos interesa de la Teorı́a de conjuntos es que proporciona un lenguaje
básico para formular enunciados y argumentos que el lenguaje ordinario harı́a farragosos o incom-
prensibles. No nos vamos a enfrentar a ella como “estudiosos”, sino como “usuarios”: nos vamos a
limitar a una Teorı́a intuitiva de conjuntos, planteando este capı́tulo sustancialmente como el texto
[D-H]. Para completar las explicaciones y ver más ejemplos, son interesantes [D’A-W], [G-H],[Ham],
[Lieb], [S-T], ası́ como [Lip], [O.U.], etc., y es esencial [GJPR].
1.1. Conjuntos.
1.1.1. Idea intuitiva de conjunto: pertenencia. Igualdad e inclusión entre con-
juntos. Conjunto potencia.
En un enfoque intuitivo de la teorı́a de conjuntos, como el que aquı́ vamos a emplear, la noción de
conjunto no difiere esencialmente de lo que por tal se entiende en el lenguaje ordinario: una colección
de objetos, reales o abstractos (los elementos del conjunto) agrupados como un todo, percibidos
simultáneamente como un nuevo objeto. Desde el punto de vista matemático, esta descripción de
lo que entendemos como conjunto no sirve como definición: es demasiado vaga e imprecisa, y utiliza
otras palabras (‘colección’, ‘agrupamiento’) que no son más que sinónimos de la palabra ‘conjunto’.
13
14 CAPÍTULO 1. CONJUNTOS
Tampoco nos ayuda recurrir a los diccionarios; en el de la Real Academia Española, por ejemplo,
encontramos lo siguiente:
conjunto : . . . k 4. m. Agregado de varias personas o cosas. k . . . k 6. La totalidad de los elementos
o cosas poseedores de una propiedad común, que los distingue de otros. Por ejemplo, los números
pares. k . . . k 9. (Mat.) La totalidad de los entes matemáticos que tienen determinada propiedad.
El CONJUNTO de los números primos. k . . .
Es muy difı́cil plantear una definición de ‘conjunto’ que no recurra a sinónimos hasta caer en
un cı́rculo vicioso: es un concepto tan básico que sólo podemos dar descripciones aproximativas del
mismo. De hecho, cuando fue preciso establecer una teorı́a de conjuntos rigurosa desde el punto
de vista matemático, una Teorı́a axiomática de conjuntos, la noción de ‘conjunto’ quedó entre los
términos no definidos.1
Proseguiremos, entonces, con nuestras ideas intuitivas de conjunto y de elementos de un con-
junto. Si A es un conjunto y a es uno de sus elementos, diremos que a pertenece a A, y escribiremos
a ∈ A,
mientras que la notación

a∈
/A
indicará que a no pertenece (no es un elemento) de A.
Cuando A es un conjunto con pocos elementos, por ejemplo el de los cinco primeros enteros
positivos pares, suele indicarse listando sus elementos entre llaves,
A = {2, 4, 6, 8, 10}.
Pero lo más habitual es que los conjuntos vengan descritos por una propiedad que caracteriza a
sus elementos: por ejemplo, como citaba el diccionario, el conjunto de todos los enteros positivos
pares. Este conjunto se escribe
{x : x es un entero positivo par },
y se lee el conjunto de los x tales que x es un entero positivo par.

En general, si tenemos una propiedad P (x) relativa a ciertos x,
{x : P (x) es cierta },
es el conjunto de los x tales que x es cierta.

1
Cuando una determinada rama de las matemáticas se desarrolla axiomáticamente, se toman como punto de
partida
(1) unos términos no definidos
(2) unas relaciones no definidas
(3) unos axiomas que relacionan los términos no definidos y las relaciones no definidas.
A partir de ellos, se van definiendo nuevos términos y se desarrollan teoremas basados en los axiomas o en teoremas
anteriores. Por ejemplo, en la geometrı́a plana euclı́dea, ‘punto’ y ‘recta’ son términos no definidos, ‘punto que está en
una recta’ o, lo que es equivalente, ‘recta que pasa por un punto’, es una relación no definida, y son axiomas, entre
otros:
‘Dos puntos distintos están en una y una sola recta’ (equivalentemente, ‘por dos puntos distintos pasa una recta y
una sola’)
‘Dos rectas distintas no pueden tener más de un punto común’.
En la Teorı́a axiomática de conjuntos, son términos no definidos ‘elemento’ y ‘conjunto’, la relación no definida es
‘pertenencia de un elemento a un conjunto’, y son axiomas, entre otros,
Axioma de extensión. Dos conjuntos A y B son iguales si y sólo si cada elemento que pertenece a A también
pertenece a B y cada elemento que pertenece a B también pertenece a A.
Axioma de especificación. Sea P (x) una afirmación y sea A un conjunto. Existe entonces un conjunto al que
pertenecen exactamente los elementos a que pertenecen a A para los que el enunciado P (a) es cierto.
Puede verse un comentario más amplio sobre los sistemas axiomáticos en la página web de la asignatura.
1.1. CONJUNTOS. 15
Frecuentemente, los x son elementos de un conjunto U fijado de antemano (los enteros, en

nuestro primer ejemplo). En vez de escribir entonces {x : x ∈ U y P (x) es cierta }, se emplea la
notación.
{x ∈ U : P (x) es cierta }.
Por otra parte, pensar que todos los elementos que se van a manejar quedan dentro de un
conjunto “universal” (el universo del discurso) permite eliminar paradojas de carácter lógico, como
la no existencia del ‘conjunto de todos los conjuntos’ o la paradoja de Russell, que no hace al caso
comentar aquı́. (Ver [Ham], p. 111 y ss., donde se explica cómo la axiomática de Zermelo-Fraenkel
resuelve estas paradojas; otra solución, la axiomática de von Neumann-Bernays-Gödel, se apunta
en [S-T], cap. 13, p. 252 y ss.)
Los elementos de un conjunto determinan el conjunto. Precisemos esta idea.
Criterio de igualdad de conjuntos. Dos conjuntos A y B son iguales si y sólo si constan de
los mismos elementos, es decir:
(1) para cada x ∈ A también x ∈ B;
(2) para cada x ∈ B también x ∈ A.
Un conjunto muy particular es el conjunto vacı́o, que no posee ningún elemento. Se representa
por el sı́mbolo ∅.
Los conjuntos con un solo elemento suelen denominarse conjuntos unipuntuales (o también
‘singuletes’, por la denominación inglesa ‘singletons’).
Definición 1.1.1. Dados dos conjuntos A y B, diremos que A es un subconjunto de B si cada

elemento de A es también elemento de B, es decir, si x ∈ A implica x ∈ B.
Para indicar que A es un subconjunto de B escribiremos A ⊆ B. También se lee hh A está con-

tenido en B ii.
¡Atención! Algunos libros usan la notación A ⊂ B para indicar que A está contenido en B,
mientras que en otros A ⊂ B significa que hh A está contenido en B y es distinto de B ii. Para evitar
confusiones, en este último caso nosotros pondremos A ⊂ 6=
B, leı́do hh A contenido estrictamente en
B ii.
El criterio de igualdad de conjuntos puede reformularse en términos de subconjuntos de manera
obvia.
Corolario 1.1.2. Dos conjuntos A y B son iguales si y sólo si A ⊆ B y B ⊆ A.
Ejemplos. Para cualquier conjunto A, trivialmente A ⊆ A y ∅ ⊆ A. Que x ∈ A es equivalente a

que {x} ⊆ A (¡pero, en general, no a x ⊆ A ni a {x} ∈ A!). Veremos ejemplos más interesantes en
ejercicios posteriores.
Definición 1.1.3. Dado un conjunto A, el conjunto
℘(A) = {S : S ⊆ A}
cuyos elementos son justamente los subconjuntos de A se denomina conjunto potencia de A o

conjunto de partes de A.
Ejercicios
1.1. Sea A = {2n + 1 : n ∈ N}. Decir si las siguientes afirmaciones son ciertas o falsas, justificando
la respuesta:
(i) si x = (2n + 1)2 para algún n ∈ N, entonces x ∈ A.
(ii) si x ∈ A, entonces x = (2n + 1)2 para algún n ∈ N.

(iii) si existen y ∈ A, z ∈ A tales que x = yz, entonces x ∈ A.
(iv) si x ∈ A, entonces existen y ∈ A, z ∈ A tales que x = yz.
1.2. Probar que {a} = {b, c} si y sólo si a = b = c.

1.3. Probar que {{a}, {a, b}} = {{c}, {c, d}} si y sólo si a = c y b = d.
1.4. ¿Cuáles de los conjuntos A = {x ∈ R : x2 = 1}, B = {x ∈ R : x4 = 1}, C = {x ∈ C : x2 = 1},
D = {x ∈ C : x4 = 1} son iguales y cuáles son distintos? ¿Por qué? ¿Cuáles son subconjuntos de
otros?
1.5. Demostrar las siguientes igualdades entre conjuntos:
(i) {x ∈ R : x3 − x > 0} = {x ∈ R : −1 < x < 0 o x > 1}.
(ii) {(x, y, z) ∈ R3 : x = y, x + y + z = 1}
= {(x, y, z) ∈ R3 : x = t/2, y = t/2, z = 1 − t para algún t ∈ R}.
1.6. Dados tres conjuntos A, B, C, si A ⊆ B y B ⊆ C entonces A ⊆ C.

1.7. ¿Es cierto que A ⊆ B si y sólo si ℘(A) ⊆ ℘(B)? ¿Por qué?
1.8. Sea A0 = ∅, An = ℘(An−1 ), n ∈ N. Describir explı́citamente A1 , A2 , A3 , A4 . ¿Cuántos
elementos tiene cada uno de estos conjuntos? ¿Cuántos elementos crees que tendrá An para un n
arbitrario?
1.1.2. Operaciones con conjuntos: unión, intersección, complemento.

Definición 1.1.4. Dados dos conjuntos A y B, su unión es el conjunto
A ∪ B = {x : x ∈ A o x ∈ B},
formado por los elementos que pertenecen al menos a uno de los dos conjuntos (pueden pertenecer
a los dos).
La intersección de A y B es el conjunto
A ∩ B = {x : x ∈ A y x ∈ B},
formado por los elementos que pertenecen simultáneamente a ambos conjuntos.

Si A ∩ B = ∅, diremos que A es disjunto con B (y entonces también B es disjunto con A).
El complementario de B respecto de A es el conjunto
A \ B = {x : x ∈ A y x ∈
/ B},
formado por los elementos de A que no pertenecen a B. Se le denomina también la diferencia

entre A y B.
Cuando todos los conjuntos que se manejan son subconjuntos de un conjunto X dado explı́ci-
tamente o inequı́vocamente sobreentendido, se pone Ac en vez de X \ A, abreviando hh el comple-
mentario de A respecto de X ii por el complementario de A, sin más.
Diagramas de Venn. Las operaciones con conjuntos permiten realizar “cálculos” que se intuyen
mejor utilizando diagramas de Venn , que consisten en dibujar en el plano regiones, limitadas por
circunferencias o curvas adecuadas, que representan a los conjuntos. Por ejemplo, en los diagramas
1.1. CONJUNTOS. 17
hemos representado dos conjuntos A y B como las regiones limitadas por una elipse grande y una
circunferencia pequeña. Las zonas rayadas representan, sucesivamente, A, B, A ∪ B, A ∩ B, A \ B.
Los “cálculos” con conjuntos comparten algunas reglas (¡no todas!) con las operaciones entre
números.
Proposición 1.1.5. Dados tres conjuntos cualesquiera A, B y C, se tienen las siguientes igualda-
des:
(i) (A ∪ B) ∪ C = A ∪ (B ∪ C).
(ii) (A ∩ B) ∩ C = A ∩ (B ∩ C).
(iii) A ∩ (B ∪ C) = (A ∩ B) ∪ (A ∩ C).
(iv) A ∪ (B ∩ C) = (A ∪ B) ∩ (A ∪ C).
Demostración. Ver [D-H], pp. 10-11.
Proposición 1.1.6. Leyes de De Morgan. Sean A, B, subconjuntos de un conjunto X. Entonces
(i) (A ∪ B)c = Ac ∩ B c .
(ii) (A ∩ B)c = Ac ∪ B c .
Demostración. Ejercicio.
Las definiciones de unión e intersección de dos conjuntos pueden ampliarse a una colección
arbitraria de conjuntos.
Definición 1.1.7. Sea C una colección no vacı́a de conjuntos (un conjunto no vacı́o cuyos elementos
son a su vez conjuntos). La unión de C es el conjunto
[ [
C= A = {x : x ∈ A para algún A ∈ C},
A∈C
formado por los elementos x que pertenecen a uno al menos de los conjuntos de C.
La intersección de C es el conjunto
\ \
C= A = {x : x ∈ A para todos A ∈ C},
A∈C
formado por los elementos x que pertenecen a todos los conjuntos de C.

En particular, cuando C = {A, B} reencontramos las definiciones de A ∪ B y A ∩ B.
En el caso de que sea C = {A1 , A2 , . . . , Ak }, se emplea la notación
k
[ k
\
An , An ,
n=1 n=1
S T
en vez de C, C, respectivamente. Ası́ mismo, cuando C = {An : n ∈ N}, suele emplearse
[ \
An , An ,
n∈ N n∈ N
o alguna otra notación similar.

En ocasiones se manejan ‘conjuntos de ı́ndices’ cualesquiera, no solamente N: por ejemplo,
C = {Ax : x ∈ R}, donde Ax = (−∞, x) = {y ∈ R : y < x}.
En general, si I es un conjunto no vacı́o arbitrario, y para cada i ∈ I tenemos dado un cierto
conjunto Ai , podemos considerar C = {Ai : i ∈ I} y definir
[ [ [ \ \ \
Ai = C = {Ai : i ∈ I}, Ai = C = {Ai : i ∈ I},
i∈I i∈I
de manera que resultará

[
Ai = {x : x ∈ Ai para algún ı́ndice i ∈ I}, (1.1)
i∈I
\
Ai = {x : x ∈ Ai para todos ı́ndices i ∈ I}. (1.2)
i∈I
Cuando C viene dado de este modo, diremos que se trata de una familia de conjuntos
parametrizada por I o con conjunto de ı́ndices I. Daremos una definición más ‘formal’
posteriormente.
Proposición 1.1.8. Leyes de De Morgan. Dado un conjunto X, sea C = {Ai : i ∈ I} una

familia de subconjuntos de X [es decir, C ⊆ ℘(X)] con conjunto de ı́ndices I. Entonces
c T
= i∈I Aci .
S
(1) i∈I Ai
c S
= i∈I Aci .
T
(2) i∈I Ai
Ejercicios
2.1. Sea A un subconjunto de un conjunto dado X. Comprobar que (Ac )c = A.
2.2. Probar que dados dos subconjuntos A, B de un conjunto X, entonces X \ A = B si y sólo si
A ∪ B = X, A ∩ B = ∅.
2.3. Dados dos conjuntos A, B, demostrar que:
(1) A ⊆ B si y sólo si A ∪ B = B.
(2) A ⊆ B si y sólo si A ∩ B = A.
(3) A ⊆ B si y sólo si A \ B = ∅.
2.4. Sean A, B, C, D conjuntos tales que A ⊆ B y C ⊆ D. Probar que A ∪ C ⊆ B ∪ D y
A ∩ C ⊆ B ∩ D.
2.5. Dado un conjunto X, sean A, B, C ⊆ X.
(1) Probar que A \ B = A ∩ B c .
(2) Aplicando lo anterior y las leyes de De Morgan, dar otra expresión de A \ (B \ C).
(3) ¿Es lo mismo A \ (B \ C) que (A \ B) \ C? ¿Por qué?
2.6. Dados dos conjuntos A, B, probar que (A \ B) ∪ (B \ A) = (A ∪ B) \ (A ∩ B) (este conjunto
se denomina diferencia simétrica o discrepancia de A y B.)
1.2. PARES ORDENADOS. PRODUCTO CARTESIANO DE CONJUNTOS. 19
2.7. Sea A0 = ∅, An = An−1 ∪ {An−1 }, n ∈ N. Describir explı́citamente A1 , A2 , A3 , A4 . ¿Cuántos

elementos tiene cada uno de estos conjuntos? ¿Cuántos elementos crees que tendrá An para un n
arbitrario? ¿Cómo probarı́as tu conjetura?
2.8. Sea A1 un conjunto arbitrario, y definamos An+1 = ℘(An ), n ∈ N, A = n An . ¿Es cierto que
S
B ⊆ A si y sólo si ℘(B) ∈ A?
2.9. Para cada k ∈ N, sea Ak = {n ∈ Z : n ≥ k}. Comprobar que
A1 ⊇ A2 ⊇ . . . ⊇ Ak ⊇ Ak+1 ⊇ . . .
y, por tanto, kn=1TAn = Ak 6= ∅ cualquiera que sea k ∈ N.

T
Sin embargo, n∈ An = ∅.N

1 1
2.10. Para cada n ∈ N, sea An = 0, 1 − n , Bn = 0, 1 − n . Comprobar que An está estricta-
2 3
mente contenido en Bn para todo n. ¿Está la unión de los An estrictamente contenida en la unión
de los Bn ? S S
(No: probar que n∈ An = n∈ Bn = [0, 1).)
N N
1.2. Pares ordenados. Producto cartesiano de conjuntos.

El lector ha manejado ya pares ordenados en situaciones concretas: al introducir un sistema de
coordenadas en el plano, por ejemplo, cada punto viene representado por un par ordenado (x, y)
de números reales. La diferencia esencial entre el par ‘ordenado’ (x, y) y el conjunto {x, y} (el ‘par
sin ordenar’) es que distinguimos (x, y) de (y, x), considerando iguales dos pares (x, y) y (u, v)
si y sólo si x = u, y = v. Ampliando esta idea, podemos considerar pares ordenados (a, b) cuyo
primer elemento a pertenezca a un conjunto cualquiera A y su segundo elemento b pertenezca a un
conjunto cualquiera B, manteniendo su ‘propiedad caracterı́stica’:
Criterio de igualdad de pares ordenados. Dados dos conjuntos arbitrarios A, B, y dos pares
ordenados (a, b), (a0 , b0 ), con a, a0 ∈ A, b, b0 ∈ B, es
(a, b) = (a0 , b0 ) si y sólo si a = a0 y b = b0 .
(Como curiosidad, señalemos que es posible dar una definición de par ordenado en términos de
conjuntos.2 )
Definición 1.2.1. El producto cartesiano de dos conjuntos A y B es el conjunto
A × B = {(a, b) : a ∈ A, b ∈ B}
formado por todos los pares ordenados cuyo primer elemento está en A y el segundo en B.
Ejemplos. El conjunto de las coordenadas de los puntos del plano es R × R. Pero quizá el primer
producto cartesiano de su vida (de un conjunto de letras por un conjunto de números) lo haya
manejado el lector en el ‘juego de los barcos’. (Más ejemplos en [G-H], cap. 3.)
Ejercicio. Dados tres conjuntos A, B, C, probar que
(i) A × (B ∪ C) = (A × B) ∪ (A × C).
(ii) A × (B ∩ C) = (A × B) ∩ (A × C).
(iii) A × (B \ C) = (A × B) \ (A × C).
2
Concretamente, Kuratowski dio la siguiente definición formal:
(a, b) = {{a}, {a, b}}.
Si se revisa el ejercicio 1.3, se verá cómo esta definición encaja adecuadamente con la idea intuitiva.
1.3. Correspondencias y aplicaciones entre conjuntos

1.3.1. Comentarios previos: Ideas intuitivas y ejemplos.
¿Cuántas matemáticas hay en una guı́a telefónica? Más de las que parece. Contiene un conjunto
de números (de teléfono), por supuesto, y un conjunto de nombres de usuarios (personas, institu-
ciones, empresas, etc.). Pero lo más interesante es que cada número aparece asociado al nombre del
abonado; es decir, la guı́a es una ‘herramienta’ que permite establecer una correspondencia entre
el conjunto de los nombres de los abonados y el conjunto de los números de teléfonos de la red,
haciendo corresponder a cada nombre su número (o sus números) de teléfono.
¿Cuál es el interés matemático de esta observación? Una de las grandes lı́neas de progreso de
las Matemáticas consiste en descubrir patrones generales que engloben la mayor cantidad posible
de conceptos y situaciones particulares aparentemente distintas, proporcionando un marco teórico
fructı́fero para su estudio unificado. Pues bien: hay multitud de situaciones heterogéneas que respo-
den al patrón que acabamos de considerar, es decir, que pueden describirse como correspondencias
entre conjuntos. Veamos algunas muestras:
— la asignación del NIP hace corresponder a cada alumno de la Universidad de Zaragoza su Número
de Identificación Personal;
— en las tablas de datos recogidos en un experimento, se empareja cada valor de una ‘variable
independiente’ que vamos modificando a voluntad (por ejemplo, el tiempo), con el que alcanza una
‘variable dependiente’ ligada a la anterior (por ejemplo, la distancia recorrida durante ese tiempo
por una bola que se desplaza sobre un plano inclinado);
−−→
— una traslación por un vector ~v hace corresponder a cada punto P el punto Q tal que P Q = ~v ;
— un giro de centro C y ángulo α ‘transforma’ un punto P del plano en el punto Q tal que los
−−→ −−→
vectores CP , CQ tienen el mismo módulo y forman entre sı́ un ángulo α;
— un mapa es una representación de un trozo de la superficie terrestre que hace corresponder a
cada punto de ella un punto del mapa;
— una función como la raı́z cuadrada (real), por ejemplo, hace corresponder a cada número real
no negativo a otro número real no negativo b cuyo cuadrado b2 es a;
— la relación de paternidad entre personas empareja una persona P con otra persona Q si y sólo
si P es el padre de Q;
— la relación de orden ≤ entre números reales empareja un número real dado a con cada número
real b tal que a ≤ b;
— ciertos programas informáticos (‘procedures’, ‘functions’) asocian a cada input admisible de un
determinado tipo de datos, un output del mismo tipo o de otro tipo distinto.
En todos los casos disponemos de un conjunto A del que tomar los objetos (alumnos, números,
puntos, etc.) a los que ‘se hace corresponder’ elementos de un conjunto B (números, etc.) ‘me-
diante un criterio determinado’. Para dar una definición matemáticamente satisfactoria, habrá que
concretar mejor lo que queremos decir con ‘hacer corresponder mediante un criterio determinado’.
Y aquı́ viene en nuestra ayuda el concepto de par ordenado, puesto que, en definitiva, lo que
hacemos, eliminando detalles accesorios, es “emparejar cada elemento x de A con cierto (o ciertos)
elementos y de B” y “no emparejarlo” con otros: es decir, dentro del conjunto A × B de pares
ordenados con primer elemento en A y segundo elemento en B, seleccionamos un subconjunto G
de manera que a un x ∈ A corresponda un y ∈ B si y sólo si (x, y) ∈ G. Por ejemplo, en el caso del
NIP, el conjunto A es el de los alumnos de la Universidad de Zaragoza, B puede ser el conjunto de
los números naturales y G = {(x, y) ∈ A × B : y es el NIP de x}; en la traslación por un vector ~v ,
−−→
A es el conjunto de los puntos del espacio, B también (B = A), y G = {(P, Q) ∈ A × B : P Q = ~v };
en la relación de orden entre números reales, A = B = R, G = {(x, y) ∈ R × R : x ≤ y}, etc.
Como se ve, la noción de correspondencia entre conjuntos, dada por un primer conjunto A,
un segundo conjunto B y un subconjunto G de A × B, es muy general, casi ‘demasiado’ general.
Enseguida se advierten diferencias entre las distintas correspondencias que hemos examinado. En
1.3. CORRESPONDENCIAS Y APLICACIONES 21
algunas de ellas, un mismo elemento del conjunto A está en correspondencia con más de un elemento
de B, por lo que podrı́amos decir que, en cierto modo, son correspondencias ‘ambiguas’ o ‘poco
ajustadas’: ¿cuál es ‘el’ número de teléfono de un abonado que tenga más de un teléfono? ¿cómo
pensar que una variable fı́sica y ‘depende’ de otra variable fı́sica x si a un mismo valor de x le
pueden corresponder varios valores distintos de y?
En una correspondencia entre dos conjuntos A y B que evite esa ‘ambigüedad’, cada elemento
de A tendrá asociado un solo elemento de B; cuando esto suceda, diremos que la correspondencia
es una aplicación. En otras palabras, una aplicación de un conjunto A en un conjunto B es una
terna formada por A, B, y un subconjunto G de A × B que cumple la siguiente condición:
para cada x ∈ A hay un y ∈ B, y sólo uno, tal que (x, y) ∈ G. (∗)
Dicho de otro modo, han de cumplirse dos cosas: (1) a cada x ∈ A, sin excepción, le corresponde
un elemento y ∈ B tal que (x, y) ∈ G, (2) pero uno nada más.
El modelo paradigmático de aplicaciones son las funciones, que no son otra cosa que las aplica-
ciones entre conjuntos de números. Buena parte de la nomenclatura y notaciones que usaremos en
el estudio de las aplicaciones está copiada de las que tradicionalmente empleamos para funciones.
Por ejemplo, indicaremos que f es una aplicación entre un conjunto A y un conjunto B poniendo
f : A → B, llamaremos a G la gráfica de f , y en vez de decir que a un x ∈ A le corresponde un
y ∈ B mediante la aplicación f , diremos que y es el valor de f en x, escrito y = f (x). Con esta
notación, la condición (∗) que caracteriza a las correspondencias que son aplicaciones se expresa a
veces poniendo que
— f (x) está definido cuando y sólo cuando x ∈ A,
— si x1 , x2 ∈ A son tales que x1 = x2 , forzosamente f (x1 ) = f (x2 ).
(Suele decirse que f está bien definida en A para indicar abreviadamente que se cumplen estas dos
condiciones.)
Las transformaciones geométricas también son ejemplos de aplicaciones, y proporcionan otra
manera de interpretar lo que hace una aplicación: una traslación transforma o “convierte” un punto
en su trasladado, etc. La idea de transformación o conversión aparece también en contextos no
geométricos, donde se tienen procesos que pueden representarse mediante un esquema denominado
‘de caja negra’,
entrada caja salida
−→ negra −→
en el que introducimos una ‘entrada admisible’ en la caja negra y obtenemos (sin que nos importe
cómo) una ‘salida’: la ‘caja negra’ puede ser una transformación geométrica o una función o una
tabla, pero también puede ser un amplificador, por el que entra una onda y da como respuesta
otra onda, o puede ser la cuerda de un instrumento musical, que producirá al pulsarla, golpearla
o frotarla un sonido diferente según sea su longitud, o . . . (el lector puede inventar sus propios
ejemplos). Lo sustancial es la existencia de un conjunto predeterminado de entradas admisibles, y
de un emparejamiento de cada uno de ellos con una salida bien definida, perteneciente al mismo o
a otro conjunto.
Esta interpretación de las aplicaciones tiene su incidencia en el lenguaje: nos referiremos indis-
tintamente a f (x) como el valor de f en x o como la imagen de x por f .
Por supuesto, hay correspondencias que no son aplicaciones: la correspondencia entre el nombre
de una persona y la persona NO es una aplicación (y por eso en el DNI es necesario añadir el número
si queremos identificarla); en cambio, SÍ es una aplicación la correspondencia entre la persona y su
nombre ‘auténtico’.
La noción general de aplicación juega un papel unificador entre las diferentes variantes de la
misma que están presentes en todas partes de las Matemáticas: además de las funciones y de las
transformaciones geométricas, encontramos las aplicaciones lineales en Álgebra lineal, las aplica-
ciones continuas en Topologı́a, los homomorfismos en Álgebra abstracta, las variables aleatorias en
Probabilidad, etc. De las propiedades comunes a todas ellas nos ocupamos a continuación.
1.3.2. Aplicaciones: dominio, codominio, gráfica.

En términos conjuntistas,
Definición 1.3.1. Una correspondencia entre dos conjuntos A y B es una terna (A, B, G)
formada por el conjunto A, el conjunto B y un subconjunto G del producto cartesiano A × B.
Definición 1.3.2. Una aplicación f : A → B es una terna (A, B, Gf ), donde A, B son conjuntos
dados, llamados respectivamente el dominio o conjunto inicial y el codominio o conjunto
final de f , y Gf , denominado gráfico o gráfica de f , es un subconjunto del producto cartesiano
A × B tal que para todo x ∈ A existe un elemento único y ∈ B de modo que (x, y) ∈ Gf .
El elemento y unı́vocamente asociado a x suele denotarse por f (x) y se llama valor de la

aplicación f en el punto x o imagen de x por f .
En lo sucesivo, pondremos como es costumbre y = f (x) en vez de (x, y) ∈ Gf .
Informalmente, dar una aplicación f supone dar:
su dominio de definición A = dom f ;
su codominio B;
una regla de correspondencia o regla de definición que permita asignar inequı́vocamente a

cada elemento x de A, sin excepción, un elemento f (x) de B perfectamente determinado por
x y f.
Cambiar una cualquiera de estas tres cosas (el dominio, el conjunto final o la “regla de de-
finición”) hace que la aplicación cambie. Por ejemplo, si tenemos una aplicación f : A → B y
consideramos un subconjunto S de A, la restricción de f a S es la aplicación f |S : S → B tal
que f |S (x) = f (x) para cada x ∈ S, que no es la misma aplicación f (se ha cambiado el dominio),
aunque venga dada por “la misma regla de correspondencia” (a cada x de S, la restricción f |S hace
corresponder el mismo valor que f ¡pero f |S (x) no está definida para x ∈ / S!).
Como acabamos de ver, en la práctica raras veces se muestra una aplicación como una terna,
tal como requerirı́a su definición formal: lo habitual es especificar su dominio, su codominio y la
regla que permite determinar el valor de la aplicación en cada elemento del dominio.
Suele chocar al principiante que a veces la regla de definición de una aplicación aparece dividida
en varias subreglas parciales (expresadas frecuentemente, cuando intervienen conjuntos numéricos,
mediante fórmulas), tendiendo a interpretar incorrectamente que se han definido tantas aplicaciones
cuantas subreglas se enuncien. Por ejemplo, la aplicación f : R → R tal que
(
x, si x ≥ 0;
f (x) =
−x, si x < 0,
es una sola aplicación, la función valor absoluto, y no dos funciones, aunque sus valores coincidan
en parte de su dominio (¡no en todo!) con los que toman las dos aplicaciones distintas g : x ∈ R →
g(x) = x ∈ R y h : x ∈ R → h(x) = −x ∈ R.
En resumen:
Criterio de igualdad de aplicaciones. Dos aplicaciones f : A → B, g : C → D son iguales si
y sólo si
1. A = C (f y g tienen el mismo dominio);
2. B = D (f y g tienen el mismo conjunto de llegada);
3. para todo x ∈ A(= C), f (x) = g(x) (f y g toman el mismo valor en cada elemento de su
dominio común)
Ejercicio. Estudiar si son o no iguales las aplicaciones f : R → R, g : R → R dadas por
f (x) = 2x; g(x) = |x − 1| + |x + 1|.
¿Cambia la respuesta si comparamos las restricciones de f y g al intervalo [1, +∞)? ¿Y comparando

las restricciones a otros subconjuntos de R?
Ejercicio. Sea A = (0, +∞) = {x ∈ R : x > 0} y B = R. ¿Queda definida una aplicación
f : A → B si para cada x ∈ A ponemos
f (x) = log(log(sen x))?
¿Por qué?
Ejercicio. ¿En qué condiciones la correspondencia que asocia cada punto de una transparencia
con su proyección en la pantalla es una aplicación entre la transparencia y la pantalla?
1.3.3. Imagen y antiimagen de un conjunto.

La idea visual del ejercicio anterior se acomoda perfectamente con la nomenclatura que vamos
a introducir a continuación.
Definición 1.3.3. Sea f : A → B una aplicación y sean S ⊆ A, T ⊆ B. Llamamos conjunto

imagen de S por f al conjunto
f (S) = {f (x) : x ∈ S} , o, más explı́citamente, f (S) = {y ∈ B : existe x ∈ S tal que y = f (x)},
y conjunto antiimagen de T por f al conjunto
f −1 (T ) = {x : f (x) ∈ T },
que será un subconjunto (eventualmente vacı́o) de A.

El conjunto imagen del dominio de f suele denominarse, simplemente, conjunto imagen de
f o rango de f , y se denota a veces im f o rang f ; por tanto, se tiene
im f = f (A) = f (dom f ) = {f (x) : x ∈ dom f } .
Proposición 1.3.4. Dada f : A → B, sean A1 , A2 ⊆ A, B1 , B2 ⊆ B. Entonces:
(i) si A1 ⊆ A2 , también f (A1 ) ⊆ f (A2 );
(ii) si B1 ⊆ B2 , también f −1 (B1 ) ⊆ f −1 (B2 ).
Proposición 1.3.5. Dada f : A → B, sean A1 , A2 ⊆ A, B1 , B2 ⊆ B. Entonces:
(i) f (A1 ∪ A2 ) = f (A1 ) ∪ f (A2 ).
(ii) f (A1 ∩ A2 ) ⊆ f (A1 ) ∩ f (A2 ), pudiendo ser f (A1 ∩ A2 ) 6= f (A1 ) ∩ f (A2 ).
(iii) f −1 (B1 ∪ B2 ) = f −1 (B1 ) ∪ f −1 (B2 ).
(iv) f −1 (B1 ∩ B2 ) = f −1 (B1 ) ∩ f −1 (B2 ).

Demostración. Probaremos solamente (ii), dejando la demostración de (i), (iii), (iv) como ejercicio.
De acuerdo con las definiciones anteriores, será:
y ∈ f (A1 ∩ A2 ) ⇐⇒ existe x ∈ A1 ∩ A2 tal que f (x) = y; (1.3)

(
existe a ∈ A1 tal que f (a) = y,
y ∈ f (A1 ) ∩ f (A2 ) ⇐⇒ y ∈ f (A1 ) e y ∈ f (A2 ) ⇐⇒ (1.4)
existe b ∈ A2 tal que f (b) = y.
A su vez, (1.3) significa que existe un mismo x, que está tanto en A1 como en A2 , tal que f (x) = y.
Por tanto, comparando vemos que (1.3) =⇒ (1.4) sin más que tomar a = b = x. Ası́ pues,
y ∈ f (A1 ∩ A2 ) =⇒ y ∈ f (A1 ) ∩ f (A2 ), o lo que es lo mismo,
f (A1 ∩ A2 ) ⊆ f (A1 ) ∩ f (A2 ) como querı́amos probar.
Por contra, no está claro que funcione la implicación inversa, ya que (en principio al menos)
podrı́amos encontrar f (a) = y = f (b) sin que a = b.
' $
' $
A1
A a •X f ' B$
' X $
z y
XXXXX
•
c •P
*

PP
& %
P

PPP y0
q •

b • & %
&
A2 %
& %
¿Tenemos algún contraejemplo sencillo a (1.4) =⇒ (1.3)? Sı́: cualquier aplicación que tenga al
menos dos elementos a 6= b para los que f (a) = f (b); tomando A1 = {a}, A2 = {b}, es A1 ∩ A2 = ∅,
f (A1 ∩ A2 ) = ∅, f (A1 ) = {f (a)} = {f (b)} = f (A2 ), por lo que
f (A1 ) ∩ f (A2 ) = {f (a)} 6⊆ ∅ = f (A1 ∩ A2 ).
Si queremos dar ejemplos concretos, f puede ser una aplicación constante en un conjunto con más
de un elemento, o puede ser f : x ∈ R → f (x) = x2 ∈ R, y entonces podrı́amos tomar incluso A1
y A2 con infinitos elementos e intersección no vacı́a: por ejemplo, A1 = (−∞, 1), A2 = (−1, +∞),
f (A1 ∩ A2 ) = f ((−1, 1)) = [0, 1), f (A1 ) ∩ f (A2 ) = [0, +∞).
Ejercicio. Con las notaciones de la proposición anterior, ¿qué relaciones hay entre f (A1 \ A2 ) y
f (A1 ) \ f (A2 )? ¿y entre f −1 (B1 \ B2 ) y f −1 (B1 ) \ f −1 (B2 )?
1.3.4. Aplicaciones inyectivas, suprayectivas, biyectivas.

Definición 1.3.6. Una aplicación f se dice inyectiva si elementos distintos de su dominio tienen
imágenes distintas: es decir, si dados x, y ∈ dom f , de x 6= y se sigue f (x) 6= f (y); o, equivalente-
mente, si dados x, y ∈ dom f , de f (x) = f (y) se sigue x = y.
Una aplicación f : A → B se dice suprayectiva si f (A) = B (si el conjunto final y el conjunto
imagen de f coinciden) ; dicho de otra forma, si cada elemento de B es imagen de algún (o algunos)
elemento(s) de A, o sea, si para todo b ∈ B existe al menos un a ∈ A tal que f (a) = b.
Una aplicación se dice biyectiva si es simultáneamente inyectiva y suprayectiva. Equivalente-
mente, si para todo b ∈ B existe un a ∈ A , y uno sólo, tal que f (a) = b.
Ejemplos. Para cualquier conjunto A, la aplicación identidad idA : x ∈ A → idA (x) = x ∈ A es

trivialmente biyectiva.
La aplicación f : N → N tal que f (x) = x2 para cada x ∈ N es inyectiva, pero no suprayectiva
(¿por qué?); sin embargo, la aplicación g : Z → Z dada por la misma fórmula no es inyectiva.
La aplicación E : R → R tal que F (x) = ex para cada x ∈ R es inyectiva pero no suprayectiva:
su conjunto imagen F (R) es el intervalo (0, +∞). Sı́ es suprayectiva (e inyectiva) la aplicación
G : R → (0, +∞) dada por G(x) = ex para x ∈ R.
Este último ejemplo ilustra la necesidad de prestar atención al codominio de la función: el cambio
realizado lleva de una aplicación que no es suprayectiva a otra que sı́ lo es. Además, nos da la pista
para transformar cualquier aplicación no suprayectiva en otra ‘casi igual’ que sea suprayectiva:
basta pasar de f : A → B a f˜ : A → f (A) dada por f˜(a) = f (a) para cada a ∈ A, ajustando
solamente el conjunto de llegada (f˜ es la suprayección asociada a f ; cuando f es inyectiva, f˜
es biyectiva, la biyección asociada a f ).
Proposición 1.3.7. Dada f : A → B, sean A1 , A2 ⊆ A. Si f es inyectiva, entonces:
f (A1 ∩ A2 ) = f (A1 ) ∩ f (A2 ).
Demostración. Como ya hemos visto, se verifica ciertamente que f (A1 ∩ A2 ) ⊆ f (A1 ) ∩ f (A2 ). Pero
la inyectividad de f da que también f (A1 ) ∩ f (A2 ) ⊆ f (A1 ∩ A2 ), puesto que y ∈ f (A1 ) ∩ f (A2 )
implica que existe a ∈ A1 tal que f (a) = y y que existe b ∈ A2 tal que f (b) = y, lo que por ser f
inyectiva obliga a que a = b, y por tanto a = b ∈ A1 ∩ A2 =⇒ y = f (a) ∈ f (A1 ∩ A2 ).
En consecuencia, f (A1 ∩ A2 ) = f (A1 ) ∩ f (A2 ) en este caso.
Releyendo atentamente las proposiciones y contraejemplos anteriores vemos que hemos conseguido real-
mente un resultado más preciso: la inyectividad de f es necesaria (contraejemplos previos) y suficiente (última
proposición) para que la igualdad de los conjuntos del enunciado se verifique sin excepciones.
Ejercicio. Con las notaciones de la proposición anterior, ¿afecta a las relaciones entre f (A1 \ A2 )
y f (A1 ) \ f (A2 ) que f sea inyectiva o suprayectiva? La misma pregunta para f −1 (B1 \ B2 ) y
f −1 (B1 ) \ f −1 (B2 ).
1.3.5. Más sobre familias de conjuntos

Podemos extender resultados anteriores si en vez de considerar sólo dos conjuntos consideramos
familias arbitrarias de conjuntos. Además, ahora podemos dar una definición más precisa y más
general de lo que es una familia parametrizada por un conjunto de ı́ndices I.
Definición 1.3.8. Sean A, I conjuntos arbitrarios. Diremos que (ai )i∈I es una familia de ele-
mentos de A con conjunto de ı́ndices I o parametrizada por I si hay una aplicación
f : I → A con f (i) = ai para cada i ∈ I.
Los elementos de A pueden ser a su vez conjuntos, y tenemos entonces una familia indexada
(o parametrizada) de conjuntos .
Realmente, en este “cambio de escritura” lo único que varı́a es el punto de vista: se destacan los
valores de la aplicación f , y se dejan la aplicación y los elementos del dominio en segundo plano.
Habı́amos introducido la unión y la intersección de una familia cualquiera de conjuntos en (1.1)
y (1.2), página 18. Veamos que sus imágenes y antiimágenes por una aplicación funcionan igual
que para dos conjuntos.
Proposición 1.3.9. Dada f : A → B, sea (Ai )i∈I una familia de subconjuntos de A, (Bi )i∈I una
familia de subconjuntos de B. Entonces:
S S
(i) f i∈I Ai = i∈I f (Ai ).
T T
(ii) f i∈I Ai ⊆ i∈I f (Ai ).
(iii) Si f es inyectiva, !
\ \
f Ai = f (Ai ).
i∈I i∈I
En caso contrario, el contenido del apartado anterior puede ser estricto.
(iv) f −1 −1 (B ).
S S
i∈I Bi = i∈I f i
(v) f −1 −1 (B ).
T T
i∈I Bi = i∈I f i
Demostración. Examinemos con detalle el caso más delicado, la imagen de la intersección (los
demás se dejan como ejercicios).
Según las definiciones,
!
\ \
f Ai = {f (x) : x ∈ Ai } = {f (x) : x ∈ Ai para todos ı́ndices i ∈ I},
i∈I i∈I
mientras que
\
f (Ai ) = {y : y ∈ f (Ai ) para todos ı́ndices i ∈ I}
i∈I
= {y : hay un x ∈ Ai tal que y = f (x), para todos ı́ndices i ∈ I}.
A simple vista, los dos conjuntos parecen iguales, pero hay una diferencia fundamental: leı́do
con todo cuidado, observamos que el primer conjunto consta de los elementos y de B que son de la
forma y = f (x) para un mismo x que está simultáneamente en todos los conjuntos Ai cualquiera
que sea i ∈ I, mientras que el segundo consta de los elementos y de B tales que para cada i ∈ I
hay un x ∈ Ai , posiblemente distinto para cada i, con y = f (x); empleando cuantificadores en vez
del lenguaje ordinario, expresemos de manera más clara la ‘pequeña’ diferencia: dado y ∈ B,
!
\
y∈f Ai si y sólo si ∃x ∈ A tal que y = f (x) y ∀i ∈ I, x ∈ Ai ;
i∈I
\
y∈ f (Ai ) si y sólo si ∀i ∈ I, ∃xi ∈ Ai tal que y = f (xi ).
i∈I
La conclusión entonces es que se verifica siempre el contenido de (ii).

¿Qué añade la condición de que f sea inyectiva? Que, desde el momento en que se verifique
) = f (xj ) con xi ∈ Ai , xj ∈ Aj , necesariamente xi = xj ; ahora sı́ podrı́amos asegurar que si
f (xiT
y ∈ i∈I f (Ai ), existe un solo x tal que x ∈ Ai e y = f (x), y los dos conjuntos son iguales.
Pero si suprimimos la inyectividad, ya hemos visto contraejemplos sencillos para familias {A1 , A2 }
de dos conjuntos.
1.3.6. Composición de aplicaciones.

Definición 1.3.10. Sean A, B, C conjuntos arbitrarios. Dadas dos aplicaciones f : A → B y
g : B → C, la composición de f y g, denotada g ◦ f , es la aplicación g ◦ f : A → C dada por
(g ◦ f )(x) = g (f (x))
para cada x ∈ A.
Nótese que, efectivamente, es una aplicación bien definida. En palabras poco precisas, podrı́amos
decir que es el resultado de hacer actuar primero a f y luego a g.
Gráficamente, podrı́amos reflejar la construcción de g ◦ f en el siguiente diagrama:
' $ ' $
A B C
f ' $g
s r z = g(y) = g(f (x))
sr
x r y = f (x)
& %
& %
g◦f & %
Nota. En otros contextos, especialmente en Análisis matemático, se usa una definición más general
de la composición: dadas dos aplicaciones f : A → B y g : C → D, se define g ◦ f como la aplicación
con dominio
dom(g ◦ f ) = f −1 (C) = f −1 (dom g)
y codominio D dada por

(g ◦ f )(x) = g (f (x))
para cada x ∈ dom(g ◦ f ). Obsérvese que tales x son justamente aquellos elementos de A para los
que g (f (x)) “tiene sentido”.
x
Ejemplo. Si f : R → R está dada por f (x) = x2 y g : R → R por g(x) = √ , g◦f y f ◦g
x2 + 1
son las aplicaciones de R en R dadas respectivamente por
x2 x2
(g ◦ f )(x) = g(f (x)) = √ , (f ◦ g)(x) = f (g(x)) = ,
x4 + 1 x2 + 1
distintas. Hay que ser cuidadoso, por tanto, con el orden de escritura en la composición.
1.3.7. Inversa de una aplicación biyectiva. Inyectividad e inversa parcial.

Consideraciones previas
Una correspondencia entre un conjunto A y un conjunto B puede ser “leı́da al revés” para
obtener una correspondencia entre B y A. Por ejemplo, si A es un conjunto de mujeres, B el
conjunto de todos sus parientes femeninos, y a cada x ∈ A asociamos un y ∈ B si y sólo si x es hija
de y, la correspondencia inversa asociarı́a un y ∈ B con un x ∈ A si y sólo si y es la madre de x.
Este ejemplo pone de manifiesto que aún cuando la correspondencia inicial sea una aplicación,
no siempre la correspondencia inversa es también una aplicación: para y ∈ B, es posible que en A
encontremos más de una hija de y o, en el extremo contrario, puede que no haya en A ninguna hija
de y.
Vemos ası́ que, si queremos hablar de la aplicación inversa de una aplicación dada f : A → B
puede haber dificultades por partida doble: bien porque un elemento y de B aparezca como imagen
por f de más de un elemento de A (es decir, porque f no sea inyectiva), o bien porque algún y de
B no sea imagen por f de ningún elemento de A (es decir, porque f no sea suprayectiva).
Hace falta, pues, que f sea biyectiva, y en tal caso podemos construir la aplicación inversa, que
denotaremos por f −1 , con dominio B = codom f y codominio A = dom f , ‘deshaciendo’ la acción
de f , como mostramos en el siguiente esquema.
' $
B
A ' $
f
rb
-
Dado b ∈ B . . .
& %
& %
' $
B
A ' $
f
srb . . . como f es biyectiva, existe un a ∈ A y uno sólo
a×r tal que f (a) = b . . .
& %
& %
' $
B
A ' $
f
srb . . . y, por definición, f −1 (b) es este único a ∈ A.
a×r
}
f −1 & %
& %
Nótese cómo la construcción de la inversa está ligada a la resolución de ecuaciones: f −1 tiene sentido
(es decir, f es biyectiva) si y sólo si para cada b ∈ B la ecuación f (x) = b tiene solución única,
y justamente dicha solución es f −1 (b). Y viceversa: si una ecuación puede expresarse en la forma
f (x) = b (b dato, x incógnita) para una aplicación f que tiene una inversa conocida, la ecuación
tiene una y una sóla solución, que es x = f −1 (b).
Definiciones y propiedades
Definición 1.3.11 (aplicación inversa). Dada una aplicación biyectiva f : A → B, llamaremos
aplicación inversa de f a la aplicación f −1 : B → A tal que para cada b ∈ B, f −1 (b) es el único
elemento a ∈ A para el que f (a) = b.
En términos más formales, f −1 serı́a la aplicación dada por la terna (B, A, Gf −1 ), donde
Gf −1 = {(b, a) : (a, b) ∈ Gf }, y Gf es, por supuesto, la gráfica de f .
Que f −1 es una aplicación de B en A bien definida es consecuencia directa de la biyectividad
de f , porque para cualquier b ∈ B existirá al menos un elemento a ∈ A tal que b = f (a) por ser f
suprayectiva, y ese a es único por ser f inyectiva, con lo que cada elemento de B sin excepción se
corresponde con un elemento inequı́vocamente determinado de A.
Nota. En los textos de Análisis matemático suele hablarse de la aplicación inversa de cualquier
aplicación inyectiva, definiéndola como la aplicación f −1 : f (A) → A tal que f −1 (y) = x si y
sólo si f (x) = y. Obsérvese que, en cualquier caso, esta serı́a la aplicación inversa de la biyección
asociada a f , es decir, de la aplicación biyectiva f˜ : A → f (A) tal que f˜(x) = f (x).
Ejemplos.
(i) La función raı́z cuadrada no es la inversa de la aplicación f : x ∈ R → f (x) = x2 ∈ R,

sino de la aplicación g : x ∈ [0, +∞) → g(x) = x2 ∈ [0, +∞), que técnicamente es —ojo al
trabalenguas— la biyección asociada a la restricción de f a [0, +∞). En la práctica no hay
necesidad de ser tan riguroso con el lenguaje, siempre y cuando no se genere confusión. De
manera similar, la función logaritmo no es la inversa de la aplicación f : x ∈ R → f (x) =
ex ∈ R, sino de la aplicación g : x ∈ R → g(x) = ex ∈ (0, +∞).
(ii) Análogamente, la función arco seno no es la inversa de la aplicación f : x ∈ R → f (x) =

sen x ∈ R, sino de la aplicación g : x ∈ [−π/2, π/2] → g(x) = sen x ∈ [−1, 1].
Proposición 1.3.12. Dadas una aplicación f : A → B y una aplicación g, entonces f es biyectiva
y g es la inversa de f si y sólo si se cumplen las siguientes condiciones:
1. dom g = B y codom g = A, es decir, g : B → A;
2. g(f (a)) = a para todo a ∈ A, es decir, g ◦ f = idA ;
3. f (g(b)) = b para todo b ∈ B, es decir, f ◦ g = idB .
Demostración. =⇒
Hemos de probar que dadas una aplicación biyectiva f : A → B y la aplicación g = f −1 inversa de
f , han de cumplirse las condiciones 1, 2, 3.
De acuerdo con la definición previa, g = f −1 ha de tener dominio B y codominio A, es decir,
se cumple la condición 1.
Para ver que se cumple también 2, tomemos un a ∈ A arbitrario: f (a) será un cierto elemento
b de B, y g(b) = f −1 (b) será el único elemento de A cuya imagen por f sea b, es decir, el a de
partida. Por tanto
g(f (a)) = g(b) = a,
como querı́amos probar. En términos de composiciones, g ◦ f = idA (ambas son aplicaciones de A
en A que transforman cada a ∈ A en el mismo a).
Veamos ahora que es cierto 3. Para b ∈ B arbitrario, g(b) = f −1 (b) será el único elemento a ∈ A
cuya imagen por f sea b, es decir, aquél para el que tengamos f (a) = b. Entonces
f (g(b)) = f (a) = b,
y ası́ f ◦ g = idB puesto que ambas son aplicaciones de B en B que transforman cada b ∈ B en el
propio b.
⇐=
Recı́procamente, supongamos ahora que tenemos aplicaciones f : A → B y g que satisfacen las
condiciones 1,2,3. Veamos que f es biyectiva y que su inversa es g.
f es inyectiva.- Pues sean a1 , a2 ∈ A tales que f (a1 ) = f (a2 ). Entonces, aplicando 2,
a1 = g(f (a1 )) = g(f (a2 )) = a2 ,
y ası́ efectivamente f es inyectiva.

f es suprayectiva.- Pues sea b ∈ B cualquiera. ¿De qué elemento de A será imagen por f ?
Obviamente, de a = g(b) ∈ A, ya que por la elección de a resulta de 3 que
f (a) = f (g(b)) = b.
g es la inversa de f .- Como acabamos de probar, f es biyectiva, luego tiene aplicación inversa

f −1 . ¿Coinciden f −1 y g? Para ello han de tener el mismo dominio, el mismo codominio, y la
misma regla de correspondencia (es decir, tiene que ser f −1 (x) = g(x) para cada x del dominio).
Por definición de inversa, f −1 tiene dominio B y codominio A, igual que g según la condición 1;
y para cada b ∈ B, como f (g(b)) = b (condición 3), g(b) es el (único) elemento de A cuya imagen
por f es b, o sea, f −1 (b):
g(b) = f −1 (b) para cada b ∈ B,
y finalmente g = f −1 .
Cualitativamente, este resultado viene a decir que lo que hace una aplicación (biyectiva) lo
deshace su inversa. Además, como los papeles de f y g son intercambiables, se sigue que si f es
biyectiva y g es la inversa de f , también g es biyectiva y f es la inversa de g.
Ejercicio. Estudiar para qué valores de x ∈ R es

√ √
( x)2 = x; x2 = x;
sen(arc sen x) = x; arc sen(sen x) = x.

¿Cómo encajan los resultados obtenidos con los de la proposición anterior?
Ejercicio. Sea E un espacio vectorial de dimensión 2 sobre un cuerpo K, {~i, ~j} una base de E, y
a cada ~v ∈ E de la forma ~v = x~i + y ~j (x, y ∈ K) hagamos corresponder el vector w ~ = y ~i + x ~j.
Probar que esta correspondencia es una aplicación bien definida de E en E, que es biyectiva, y
hallar su inversa.
Si E es el plano real e ~i, ~j son vectores perpendiculares de módulo 1, ¿cuál serı́a la interpretación
geométrica de f ?
Concluimos esta sección probando un resultado que nos sirve de excusa para presentar uno de
los axiomas más controvertidos de la Teorı́a de conjuntos, el axioma de elección.
Proposición 1.3.13. Una aplicación f : A → B es suprayectiva si y sólo si existe una aplicación
g : B → A tal que f ◦ g = idB .
Demostración. ⇐=
Todo b ∈ B es imagen por f de algún elemento a ∈ A: en efecto, bastará tomar a = g(b) para
obtener f (a) = f (g(b)) = idB (b) = b.
=⇒
Para todo b ∈ B es f −1 ({b}) = {a ∈ A : f (a) = b} 6= ∅ por ser f suprayectiva. Dado, pues, b ∈ B,
elegimos un a ∈ f −1 ({b}) que denotamos g(b). Tenemos ası́ bien definida una aplicación g : B → A,
tal que para cada b ∈ B es f (g(b)) = b por la propia construcción de g, luego f ◦ g = idB para esta
aplicación g.
Nota importante: el Axioma de Elección. Esta “inocente” elección de un elemento deter-

minado en cada conjunto f −1 ({b}), b ∈ B, comporta más dificultades de las que parece (cf. [G-H],
pp. 96 y ss.). De hecho, en la Teorı́a axiomática de conjuntos se requiere un nuevo axioma para
llevar a cabo este proceso, el llamado AXIOMA DE ELECCIÓN (abreviado AC, Axiom of Choice
en inglés), una de cuyas múltiples formulaciones es:
Axioma de elección . Dada una familia {Ai : i ∈ I} de conjuntos no vacı́os disjuntos dos a
dos, existe un conjunto S que consiste exactamente en un elemento de cada Ai .
Por evidente que parezca este enunciado, se deducen de él (en Álgebra, en Análisis, en Topologı́a,
en . . . ) una serie de consecuencias tan sorprendentes que a su utilización por Zermelo en 1904
siguió una discusión que no se aplacó hasta los resultados de Gödel en 1940 y de Cohen en 1966.
Ver una excelente explicación en [C-H], pp. 241 y ss.; más conciso, [Ap], pp. 312–313 y [GJPR], pp.
66–67.
Buscando en Internet “Axiom of Choice” se obtiene una lista inacabable de referencias. Para
empezar, recomendamos [1], [2].
Ejercicios
3.1. Dados dos conjuntos X e Y , expresar como subconjuntos de X × Y las aplicaciones definidas
de la siguiente manera:
(1) la aplicación que hace corresponder a todos los x ∈ X un único punto b ∈ Y (la aplicación
constante con valor fijo b).
(2) supuesto X = Y , la aplicación que hace corresponder a cada x ∈ X el mismo x (la aplicación
identidad ).
(3) supuesto X ⊆ Y , la aplicación que hace corresponder a cada x ∈ X el mismo x (la aplicación
inclusión de X en Y ). ¿Es igual a la anterior?
(4) supuesto X = A × B, Y = A la aplicación que hace corresponder a cada (a, b) ∈ X su primera
componente a (la proyección sobre la primera componente ).
(5) supuesto X = A × B, Y = B la aplicación que hace corresponder a cada (a, b) ∈ X su segunda
componente b (la proyección sobre la segunda componente ).
3.2. Sean A y B conjuntos no vacı́os y f : A → B. Para cada una de las condiciones:
(T1) Para todo b ∈ B existe a ∈ A tal que f (a) = b;
(T2) existe a ∈ A tal que f (a) = b para todo b ∈ B;
(T3) para todo a ∈ A existe b ∈ B tal que f (a) = b;
(T4) existe b ∈ B tal que f (a) = b para todo a ∈ A;
(T5) para todo b ∈ B existe un único a ∈ A tal que f (a) = b;
(T6) para todo a ∈ A existe un único b ∈ B tal que f (a) = b;
(T7) para todos a1 , a2 ∈ A es f (a1 ) 6= f (a2 );
(T8) para todos a1 , a2 ∈ A, si f (a1 ) = f (a2 ) entonces a1 = a2 ;
(T9) para todos a1 , a2 ∈ A, si f (a1 ) 6= f (a2 ) entonces a1 6= a2 ,
explicar cuáles de las hipótesis siguientes las implican:
(H1) f es inyectiva;
(H2) f es suprayectiva;
(H3) f es biyectiva;
(H4) f es constante;
(H5) f es arbitraria;
(H8) ninguna f lo cumple;
(H7) el conjunto B de llegada verifica . . . (completar).
(Por ejemplo: (H2) =⇒ (T1) porque, según la definición, f es suprayectiva cuando etc.)
3.3. Sean f : A1 → B1 , g : A2 → B2 . Definamos h : A1 × A2 → B1 × B2 poniendo
h(x, y) = (f (x), g(y)) para cada (x, y) ∈ A1 ×A2 . Probar que h está bien definida. ¿Qué condiciones
sobre f y g permiten asegurar que h es inyectiva? ¿y que es suprayectiva? ¿y que es biyectiva?
3.4. Sean A ⊆ X y f : X → Y . Sea i : A → X la inclusión de A en X, definida por i(x) = x
para cada x ∈ A. Probar que
(i) f |A = f ◦ i;
(ii) si g = f |A , para cada B ⊆ Y es g −1 (B) = A ∩ f −1 (B).
3.5. Dada f : A → B, probar:

(1) para cada S ⊆ A, S ⊆ f −1 [f (S)]. ¿Qué condición sobre f garantizarı́a que f −1 [f (S)] = S?.
Dar un contraejemplo que pruebe que esta igualdad no es cierta en general.
(2) para cada S ⊆ A y T ⊆ B, f [f −1 (T ) ∩ S] = T ∩ f (S); en particular, f [f −1 (T )] = T ∩ f (A).
x
3.6. Sea f : x ∈ R → f (x) = √ . Calcular f ◦ f . En general, si se define por recurrencia
1 + x2
f1 = f y fn+1 = f ◦ fn , n ∈ N, calcular fn .
3.7. Para conjuntos A, B, C, D y aplicaciones f : A → B, g : B → C, h : C → D, probar que
h ◦ (g ◦ f ) = (h ◦ g) ◦ f .
3.8. Sean f : A → B, g : B → C biyectivas. Probar que g ◦ f : A → C es biyectiva y que
(g ◦ f )−1 = f −1 ◦ g −1 .
3.9. Sean f : A → B y g : B → A tales que g ◦ f = idA . Probar que entonces f es inyectiva y g es
suprayectiva.
1.4. Relaciones
Para las correspondencias entre un conjunto A y él mismo suele emplearse el nombre de re-
laciones. Una vez más, el cambio de nombre refleja un cambio (más psicológico que matemático)
en la manera de ‘percibir’ estas particulares correspondencias. Nos detendremos especialmente en
dos clases de relaciones: las relaciones de equivalencia, cuyo modelo de referencia es la relación de
igualdad entre los elementos de un conjunto, y las relaciones de orden, de las que ya es conocida al
menos la relación ≤ entre números reales. Pasemos a la definición formal.
Definición 1.4.1. Una relación binaria en un conjunto A es un subconjunto R del producto

cartesiano A × A de A por sı́ mismo.
En vez de (a, b) ∈ R , escribiremos a R b, leı́do hh a está relacionado con b en la relación R ii.
Ejemplos.
(1) Sea R el conjunto de las rectas del plano. Se define en R la relación de incidencia poniendo:
para dos rectas r, s ∈ R, es r R s cuando y sólo cuando r y s tienen algún punto común.
(Esta relación se expresa brevemente diciendo hh r corta a sii)
(2) En el mismo conjunto, se define la relación de paralelismo k poniendo:
para dos rectas r, s ∈ R, es rks cuando y sólo cuando r y s son paralelas,
es decir, o no tienen ningún punto común o coinciden.
(3) Sea C el conjunto de las circunferencias del plano. Se define en C la relación de tangencia
poniendo:
para dos circunferencias C1 , C2 ∈ C, es C1 R C2 cuando y sólo cuando C1 y C2 son tangentes.
(4) En N, se define la relación de divisibilidad | poniendo:
para m, n ∈ N, es m | n cuando y sólo cuando m divide a n (i.e., n es un múltiplo de m).
(5) Análogamente se define la relación de divisibilidad en Z.
(6) Dado un conjunto X, se define en ℘(X) la relación de inclusión ⊆ poniendo:
para A, B ∈ ℘(X), es A ⊆ B cuando y sólo cuando A es un subconjunto de B.
Las propiedades más interesantes de las relaciones se recogen en la siguiente definición.
Definición 1.4.2. Sea R una relación (binaria) en un conjunto A. Diremos que R es
• reflexiva si para todo a ∈ A es a R a;
• simétrica si siempre que para a, b ∈ A es a R b, también es b R a;
• antisimétrica si para a, b ∈ A, que sea simultáneamente a R b y b R a obliga a que a = b;
• transitiva si siempre que para a, b, c ∈ A es a R b y b R c, también es a R c.
Ejercicio. ¿Cuáles de estas propiedades, y cuáles no, tienen las relaciones que hemos definido
anteriormente?
1.4.1. Relaciones de equivalencia y particiones. Conjunto cociente.

Definición 1.4.3. Una relación de equivalencia en un conjunto A es una relación (binaria)
en A que tiene las propiedades reflexiva, simétrica y transitiva.
Ejemplos.
1.- El prototipo es la relación de igualdad en cualquier conjunto: a R b cuando a = b.
2.- La relación de paralelismo entre rectas es la única relación de equivalencia de las seis que
habı́amos definido en el apartado anterior.
1.4. RELACIONES 33
−−−→ −−→ −−−→ −−→ −−−→ −−→

3.- Dados dos vectores fijos del plano M N , P Q , pongamos M N ∼ P Q si y sólo si M N y P Q
tienen el mismo módulo, dirección y sentido (se dice entonces que son vectores equipolentes). La
relación de equipolencia ∼ es una relación de equivalencia.
4.- La relación entre fracciones equivalentes, como puede hacer sospechar su propio nombre, es una
relación de equivalencia. (Recordemos que dos fracciones m/n y p/q son equivalentes si mq = np.
Comentaremos esta relación más adelante, cuando hablemos de los números racionales.)
5.- Un importante ejemplo de relación de equivalencia, que estudiaremos con más detalle posterior-
mente, es la congruencia en Z módulo m: fijado m ∈ N con m ≥ 2, diremos que dos enteros a, b ∈ Z
son congruentes módulo m, en sı́mbolos a ≡ b (mód m), cuando m | (b − a) es decir, cuando
exista un k ∈ Z tal que b − a = km. Puesto que a − a = 0 · m, b − a = km implica a − b = (−k)m,
y de b − a = km, c − b = `m se sigue c − a = (c − b) + (b − a) = (` + k)m, vemos que esta relación
tiene efectivamente las propiedades reflexiva, simétrica y transitiva.
Las congruencias son hh las matemáticas del tiempoii: la esfera del reloj marca las horas módulo
12, los dı́as de la semana van según congruencias módulo 7, los meses módulo 12 (el decimotercer
mes vuelve a ser enero); pero también conocemos ejemplos de otro tipo: los cuentakilómetros de
los coches funcionan según congruencias módulo 100 000.
Como se indica en [D-H], “el interés de las relaciones de equivalencia está en el hecho de que cons-
tituyen una abstracción de los procesos ordinarios de clasificación”: permiten repartir el conjunto
en ‘bloques’ disjuntos, las llamadas clases de equivalencia. A su vez, cada uno de esos ‘bloques’
puede considerarse como elemento de un nuevo conjunto, el conjunto cociente, ‘igualando’ (no
distinguiendo entre) los diferentes componentes de un mismo bloque. Pasemos a explicar estos
aspectos.
Definición 1.4.4. Sea R una relación de equivalencia en un conjunto A. Dado a ∈ A, la clase
de equivalencia de a en la relación R es el conjunto
[a] = {b ∈ A : a R b}.
Cada b ∈ [a] se dice que es un representante de la clase [a].

El conjunto cuyos elementos son las clases de equivalencia de R es el conjunto cociente de
A por R , denotado por A/ R , con lo cual
A/ R = {[a] : a ∈ A},
y ası́ A/ R ⊆ ℘(A).
Notemos que siempre a ∈ [a], por la propiedad reflexiva de R .
Ejemplos. Examinemos cuáles son las clases de equivalencia en las relaciones que hemos visto
anteriormente.
1.- Si a R b cuándo y sólo cuando a = b, [a] consta del único elemento a, es decir, [a] = {a} en
este caso. El conjunto cociente es el conjunto de los subconjuntos unipuntuales de A (que no es lo
mismo que A, aunque casi lo parezca).
2.- En la relación de paralelismo, cada clase de equivalencia consta de una recta y todas sus paralelas
(es lo que se llama un haz de rectas paralelas), todas las que tienen ‘la misma dirección’. Hay, pues,
tantas clases de equivalencia como ‘direcciones’.
3.- Cada clase de vectores equipolentes es lo que se denomina un vector libre .
4.- Las clases de equivalencia de fracciones las forman las fracciones ‘que representan un mismo
número racional’. De hecho, un número racional es una clase de equivalencia de fracciones y el
conjunto Q de los números racionales es el conjunto cociente del conjunto de fracciones por esta
relación de equivalencia. (Ver capı́tulo 3.)
5.- En la relación de congruencia módulo m, para cada a ∈ Z es
[a] = a + mZ = {b ∈ Z : b = a + km para algún k ∈ Z}.

Estas clases de equivalencia suelen denominarse clases de restos módulo m, porque dos enteros a
y b están en la misma clase si y sólo si dan el mismo resto al ser divididos por m, es decir, si y sólo
si a = pm + r, b = qm + r para enteros adecuados p, q y r, con 0 ≤ r < m (comprobarlo). Para
m = 2, encontramos dos clases de equivalencia: el conjunto de los enteros pares y el conjunto de
los enteros impares.
En general, el conjunto cociente, que se denota por Zm , ¿cuántos elementos tiene? Tantos como
restos encontramos al dividir por m: 0, 1, . . . m − 1; es decir, m elementos.
6.- Un ejemplo más cotidiano: consideremos un conjunto de folios de papel de distintos colores
(perfectamente diferenciables), y digamos que dos folios son equivalentes si son de igual color.
Formar una clase de equivalencia es formar un conjunto (un ‘cuaderno’) con las hojas de un mismo
color. El conjunto cociente será un conjunto de cuadernos, cada uno de los cuales tiene sus hojas
de un determinado color, diferente del color de las hojas de los demás cuadernos.
Una relación de equivalencia permite ‘partir en trozos’ el conjunto, tomando cada clase de
equivalencia como uno de los trozos. Concretamente, se tiene:
Proposición 1.4.5. Sea R una relación de equivalencia en un conjunto no vacı́o A. Entonces
cada elemento de A está en una y sólo una de las clases de equivalencia definidas por R .
Para probarlo, nos apoyaremos en el siguiente
Lema 1.4.6. Sea R una relación de equivalencia en un conjunto no vacı́o A. Dados b, c ∈ A es
[b] = [c] si y sólo si b R c.
Demostración. Suponiendo [b] = [c], como c ∈ [c] = [b], se sigue que b R c.
Recı́procamente, sea b R c. Si x ∈ [b], serı́a b R x, que con c R b (propiedad simétrica de R )
darı́a c R x por transitividad, o sea, x ∈ [c]; y análogamente, de x ∈ [c] obtenemos c R x, que con
b R c da b R x y finalmente x ∈ [b].
Ahora podemos demostrar la proposición anterior.

Demostración de la proposición 1.4.5.
Obviamente, cada elemento de A está al menos en una clase de equivalencia: a ∈ [a] para cada
a ∈ A por ser R reflexiva. Y no puede estar en más de una: si a ∈ [b] y a ∈ [c], esto significarı́a que
b R a y c R a (por definición), luego a R c (propiedad simétrica de R ) y finalmente b R c (propiedad
transitiva), con lo que aplicando el lema [b] = [c].
La ‘descomposición en bloques’ de un conjunto se denomina partición del conjunto.

Definición 1.4.7. Una partición de un conjunto no vacı́o A es una colección C de subconjuntos
no vacı́os de A tal que cada x ∈ A pertenece a uno y uno sólo de los S ∈ C. En otras palabras, C
verifica que:
1. C ⊆ ℘(A) \ {∅}, S∈C S = A,

S
2. si S, T ∈ C y S 6= T , S ∩ T = ∅.
Puesto que cada clase de equivalencia [a] contiene al menos al elemento a, la proposición 1.4.5
nos dice que el conjunto cociente A/ R (el conjunto de clases de equivalencia) es una partición de
A. Que definir una relación de equivalencia o definir una partición es ‘prácticamente lo mismo’ se
prueba en el siguiente teorema.
Teorema 1.4.8. Sea R una relación de equivalencia en un conjunto no vacı́o A. Entonces, el
conjunto de las clases de equivalencia es una partición de A.
Recı́procamente, si C es una partición de A, existe una relación de equivalencia R (y una sola)
tal que las clases de eqivalencia de R son exactamente los conjuntos de la partición C.
1.4. RELACIONES 35
Demostración. Sólo falta probar el recı́proco.

Supongamos, pues, que tenemos una partición C de A. ‘Arrancando’ de C, hemos de llegar a
construir una relación de equivalencia R sobre A cuyas clases de equivalencia sean precisamente
los conjuntos S ⊆ A que forman la partición C. Revisando el lema 1.4.6, no es difı́cil pensar en la
relación siguiente:
• pondremos a R b para dos elementos a, b ∈ A, si y sólo si existe un S ∈ C tal que a ∈ S y b ∈ S.
¿Tenemos ası́ ciertamente una relación de equivalencia? Dado a ∈ A, como C es una partición,
existe S ∈ C tal que a ∈ S, luego a R a cualquiera que sea a y ası́ R es reflexiva. De la propia
definición se sigue que es simétrica. Para ver que es transitiva, observemos que si a R b existe un
S ∈ C tal que a ∈ S y b ∈ S, y si b R c existe un T ∈ C tal que b ∈ T y c ∈ T ; pero entonces
b ∈ S ∩ T , lo que por ser C una partición obliga a que S = T , deduciéndose que a, c ∈ S = T y
a R c.
¿Son las clases de equivalencia de R exactamente los S ∈ C? Es decir: ¿cada clase de equiva-
lencia de R está en C? ¿y cada S ∈ C es una clase de equivalencia de R ?
Notemos que dados a ∈ A, S ∈ C, se tiene
a ∈ S si y sólo si [a] = S.
En efecto, trivialmente a ∈ [a] siempre, luego si [a] = S, a ∈ [a] = S Recı́procamente, si a ∈ S,

todo b ∈ S cumple a R b y por tanto b ∈ [a]; y al revés, si b ∈ [a], según la definición de R existe
un T ∈ C tal que a, b ∈ T ; pero entonces a ∈ S ∩ T , luego S = T y b ∈ S.
En consecuencia:
Dado a ∈ A, es [a] ∈ C, pues como C es una partición de A, debe existir S ∈ C tal que a ∈ S,
y ası́ [a] = S.
Dado S ∈ C, S = [a] para algún a ∈ A, pues S es no vacı́o y habrá al menos un a ∈ S, con lo

cual S = [a] para este a.
Finalmente, si queremos comprobar que la relación R que hemos construido es la única que
tiene estas clases de equivalencia, basta aplicar el lema 1.4.6.
Ejemplos.
1. Sea A el conjunto de los números enteros pares y B el conjunto de los números enteros
impares. Entonces {A, B} es una partición de Z, y la relación de equivalencia que define es
la congruencia módulo 2.
2. Poniendo A = {x ∈ R : x > 0}, B = {0}, C = {x ∈ R : x < 0}, {A, B, C} es una partición de

R. Si R es la relación de equivalencia que define, es x R y si y sólo si x = y = 0 o x 6= 0 6= y
y x e y tienen el mismo signo.
Ejercicio. Comprúebese, para cada una de las relaciones de equivalencia que hemos encontrado,
que las clases forman una partición del correspondiente conjunto.
1.4.2. Relaciones de orden.

Definición 1.4.9. Una relación de orden en un conjunto A es una relación (binaria) en A que
tiene las propiedades reflexiva, antisimétrica y transitiva.
Ejemplos.
1.- El prototipo es la relación de orden en cualquier subconjunto de R: a R b cuando a ≤ b.
2.- En todo conjunto se puede definir una relación de orden trivial: la igualdad, a R b si y sólo si
a = b.
3.- Dado un conjunto X, la inclusión entre subconjuntos de X es una relación de orden en ℘(X).
4.- La relación de divisibilidad en N es una relación de orden, pero no lo es la divisibilidad en Z
(falla ‘por poco’ la propiedad antisimétrica).
5.- En C puede definirse el orden lexicográfico de la siguiente manera:
para z1 , z2 ∈ C, es z1 ≤ z2 cuando y sólo cuando <e z1 < <e z2 , o <e z1 = <e z2 y =m z1 ≤ =m z2 .
Es fácil comprobar que tiene las propiedades reflexiva, antisimétrica y transitiva. ¿Cuál es la
representación gráfica del conjunto {z ∈ C : 0 ≤ z}?
6.- Ası́ mismo, en C puede definirse el orden producto de la siguiente manera:
para z1 , z2 ∈ C, es z1 ≤ z2 cuando y sólo cuando <e z1 ≤ <e z2 y =m z1 ≤ =m z2 .
También tiene las propiedades reflexiva, antisimétrica y transitiva. ¿Cuál es ahora la represen-
tación gráfica del conjunto {z ∈ C : 0 ≤ z}?
Definición 1.4.10. Un conjunto ordenado es un conjunto A dotado de una relación de orden.
De una manera más formal, un conjunto ordenado serı́a un par (A, R ), donde A es un conjunto y
R una relación de orden en A. Por ejemplo, (N, ≤) y (N, | ) son dos conjuntos ordenados (distintos,
aunque tengan el mismo conjunto base).
Definición 1.4.11. Una relación de orden R en un conjunto A es un orden total si para todo
par a, b de elementos de A se tiene que o bien a R b o bien b R a; en caso contrario, R es un
orden parcial .
Ejercicio. Dar ejempos de órdenes totales y de órdenes parciales.

Diagramas de Hasse. Las relaciones de orden R en conjuntos finitos pequeños F se pueden
visualizar cómodamente mediante diagramas de Hasse , que consisten en un dibujo en el que los
elementos del conjunto están representados por puntos, colocados de manera que si x, y ∈ F son
tales que x R y, el punto que representa a x queda por debajo del punto que representa a y; además,
dos puntos del diagrama se unen mediante un segmento cuando y sólo cuando representan a elemen-
tos x, y ∈ F tales que x R y pero no existe z ∈ F tal que x R z, z R y (es decir, cuando la relación
entre x e y no puede deducirse por transitividad). Por ejemplo, si F = {2, 3, 4, 5, 6, 7, 8, 15, 30}, la
relación de divisibilidad | en F podrı́a reflejarse ası́:
s8 s 30
@ @
@s 4 6 s s 15
@ @
@@ @
@ @
@s @s @s s
2 3 5 7
Ejercicio. ¿Cómo se verı́a en un diagrama de Hasse que la relación representada es un orden total?
Elementos distinguidos en una relación de orden

Algunos conceptos que el lector conoce para el orden de R pueden definirse igualmente en un
conjunto ordenado arbitrario.
Definiciones 1.4.12. Sea A un conjunto ordenado, y denotemos por ≤ su relación de orden. Sea
S un subconjunto de A.
Si para algún a ∈ A es a ≤ s para todo s ∈ S, diremos que a es una cota inferior de S y que
S está acotado inferiormente (por a).
Si para algún b ∈ A fuese b ≥ s para todo s ∈ S, diremos que b es una cota superior de S y
que S está acotado superiormente (por b).
1.4. RELACIONES 37
Cuando S está acotado a la vez superior e inferiormente, se dice que S está acotado .
Un m ∈ A es mı́nimo de un conjunto S si pertenece al conjunto y es una cota inferior del
mismo. Es decir, si m ∈ S y m ≤ s para todo s ∈ S. Pondremos entonces m = mı́n S.
Un M ∈ A es máximo de un conjunto S si pertenece al conjunto y es una cota superior del
mismo. Es decir, si M ∈ S y M ≥ s para todo s ∈ S. Pondremos entonces M = máx S.
Un elemento a ∈ A es ı́nfimo de un conjunto S si es el máximo del conjunto de cotas inferiores
de S. Pondremos entonces a = inf S.
Nótese que si a = inf S, será a = mı́n S si y sólo si a ∈ S.
Un elemento b ∈ A es supremo de un conjunto S si es el mı́nimo del conjunto de cotas
superiores de S. Pondremos entonces b = sup S
Nótese que si b = sup S, será b = máx S si y sólo si a ∈ S.
Otros conceptos importantes en las relaciones de orden son los siguientes.
Definición 1.4.13. Dado un conjunto ordenado (A, ≤) y un subconjunto S de A, un elemento
x ∈ S se dice maximal si para cada a ∈ S tal que x ≤ a, debe ser x = a; un elemento y ∈ S se
dice minimal si para cada b ∈ S tal que b ≤ y, debe ser b = y.
En un conjunto ordenado puede no haber elementos maximales o minimales, igual que no
siempre hay máximos o mı́nimos (Ver [D-H], p. 13; [GJPR], p. 29). En el diagrama de Hasse que
hemos dibujado anteriormente, son elementos minimales el 2, el 3, el 5 y el 7; son elementos
maximales el 7, el 8 y el 30; no hay un elemento máximo ni un elemento mı́nimo, ni tampoco
supremo ni ı́nfimo.
Ejercicios
4.1. Dados dos conjuntos A y B, probar que A × B = ∅ si y sólo si A = ∅ o B = ∅.
4.2. Sean A y B dos conjuntos. Si A × B 6= ∅, probar que A × B ⊆ C × D cuando y sólo cuando
A ⊆ C y B ⊆ D. ¿Por qué hemos necesitado suponer A × B 6= ∅?
4.3. Sea R una relación en un conjunto A. ¿Es cierto que para todo a ∈ A hay al menos un b ∈ B
tal que a R b? ¿Por qué?
4.4. Para cada punto P del plano, el haz de rectas de vértice P es el conjunto de las rectas
que pasan por P . ¿Pueden ser los haces de rectas las clases de equivalencia de alguna relación de
equivalencia? ¿Por qué?
4.5. Sea R la relación definida en N × N de la siguiente manera:
dados dos pares (m, n), (p, q) ∈ N × N, es (m, n) R (p, q) cuando y sólo cuando m + q = p + n.
Estudiar si R es reflexiva, simétrica, antisimétrica, transitiva. ¿Es R una relación de equivalen-
cia? En caso afirmativo, ¿cuáles son las correspondientes clases de equivalencia? Representarlas
gráficamente en el plano.
4.6. Sea R una relación en un conjunto A y S un subconjunto de A. Consideremos en S la relación
R 0 definida por: a R 0 b para a, b ∈ S si y sólo si a R b (la restricción de R a S). Probar que si
R es un relación de equivalencia en A, R 0 es una relación de equivalencia en S; y que si R es una
relación de orden en A, R 0 es una relación de orden en S.
4.7. Sea A un conjunto cualquiera y R una relación de orden en A. Definimos la relación inversa
R−1 poniendo
para x, y ∈ A, es x R−1 y cuando y sólo cuando y R x.
−1
Probar que R es también una relación de orden en A (el llamado orden inverso de R).
Si R es un orden total, ¿es R−1 un orden total? ¿por qué?
4.8. Sea A un conjunto ordenado y S un subconjunto de A. Probar que si existe el máximo o el
mı́nimo de S, es único.
4.9. ¿Qué puede decirse sobre la unicidad de los elementos maximales o minimales en una relación
de orden según sea o no un orden total?
4.10. Sea S = {z = x+iy ∈ C : x, y ∈ R, x2 +y 2 ≤ 1} el cı́rculo de centro 0 y radio 1. Considerando
en C el orden producto definido anteriormente, ¿tiene S elemento máximo? ¿y elemento mı́nimo?
¿y elementos maximales? ¿y elementos minimales? ¿cuáles son? ¿por qué?
Responder las preguntas anteriores considerando en C el orden lexicográfico.
1.5. Conjuntos finitos y numerables

1.5.1. Conjuntos finitos y numerables. Conjuntos equipotentes.
¿Cuántas letras minúsculas tiene el alfabeto griego? Veinticuatro. ¿Cómo lo sabemos? Las po-
nemos en una lista
α, β, γ, δ, ε, ζ, η, θ, ι, κ, λ, µ, ν, ξ, o, π, %, σ, τ , υ, ϕ, χ, ψ, ω,
y, simplemente, contamos:
uno, dos, tres, cuatro, cinco, . . . , veinticuatro.
¿Qué estamos haciendo desde el punto de vista matemático? Emparejamos cada una de las
letras con los números naturales correlativos,
α β γ δ ε ζ η θ ι κ λ µ ν ξ o π % σ τ υ ϕ χ ψ ω
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24
“una letra ↔ un número”, consecutivamente, teniendo buen cuidado de no repetir letras ni sal-
tar números, hasta agotar todas las letras disponibles. En definitiva, estamos estableciendo una
aplicación biyectiva entre el conjunto “alfabeto griego” y el conjunto de “los veinticuatro primeros
números naturales”, o viceversa (si nos fijamos en la aplicación inversa). Generalizando esta idea,
definiremos los conjuntos finitos y el número de elementos de un conjunto finito.
Notación. Para n ∈ N, pongamos N(n) = {k ∈ N : k ≤ n}.
Definición 1.5.1. Diremos que un conjunto A es finito si es vacı́o o existe un n ∈ N tal que hay
una biyección f : N(n) → A.
Qué es el número de elementos de un conjunto ası́ es ‘casi’ obvio. Sólo casi, porque nuestra
experiencia contando conjuntos muy grandes nos dice que no siempre se llega a la misma respuesta
(si vuestros amigos contaran los asistentes al último concierto de vuestro grupo favorito, ¿obtendrı́an
todos el mismo número?) El lema siguiente garantizará que si al contar el número de elementos de
un mismo conjunto se obtienen valores diferentes, es que hay un error.
Lema 1.5.2. Sean m, n ∈ N. Si existe una biyección f : N(m) → N(n), entonces m = n.
Demostración. Procederemos por inducción sobre el enunciado
Pn : Para todo m ∈ N, si existe una biyección f : N(m) → N(n), entonces m = n.
P1 es cierto: si f : N(m) → N(1) = {1} es una biyección, será f (x) = 1 para un único
x ∈ N(m); y si m 6= 1, N(m) tiene al menos un elemento y 6= x, para el que forzosamente f (y) = 1,
contradiciendo la inyectividad de f . Por tanto, m = 1.
Supuesto cierto Pn , también es cierto Pn+1 . Pues si para un m ∈ N existe una biyección
f : N(m) → N(n+1), entonces m 6= 1 (en caso contrario, f (N(m)) = f (N(1)) = {f (1)}, y en N(n+1)
habrı́a elementos distintos de f (1) que no estarı́an en la imagen de f ), y además f (x) = n + 1 para
un único x ∈ N(m). La aplicación f 0 : N(m) \ {x} → N(n) dada por f 0 (k) = f (k), k ∈ N(m) \ {x},
está bien definida y es biyectiva (¿por qué?). Definiendo ahora h : N(m − 1) → N(m) \ {x} por
(
k si k < x,
h(k) =
k + 1 si x < k ≤ m − 1,
1.5. CONJUNTOS FINITOS Y NUMERABLES 39
también h está bien definida y es biyectiva (¿por qué?), de modo que
g = f 0 ◦ h : N(m − 1) → N(n),
composición de dos aplicaciones biyectivas, es biyectiva (¿por qué?). Por la hipótesis de inducción,
esto obliga a que m − 1 = n, y ası́ m = n + 1.
Definición 1.5.3. Dado un conjunto finito A, el número de elementos de A es 0, si A = ∅, o

el único número natural n para el que existe una biyección f : N(n) → A. Suele indicarse por |A|
o por #A o por card A.
La unicidad de n es consecuencia del lema anterior: si A es finito y no vacı́o y existen biyecciones

f : N(n) → A, g : N(m) → A, entonces f −1 ◦ g : N(m) → N(n) es una biyección y por tanto m = n.
Ejercicio. Probar que si A ⊆ B y B es un conjunto finito, entonces A también es un conjunto
finito y |A| ≤ |B|, siendo |A| = |B| si y sólo si A = B.
Pasemos a los conjuntos infinitos. Igual que hay conjuntos finitos con distinto cardinal (con
distinto número de elementos), se puede establecer una noción de cardinal para conjuntos infinitos
que permite “comparar el tamaño” de los conjuntos infinitos. La teorı́a de cardinales sobrepasa los
propósitos de este curso y, afortunadamente, está expuesta excelentemente en [GJPR], cap. 2, a un
nivel asequible. Pero al menos, definiremos aquı́ los cardinales infinitos más sencillos.
Definición 1.5.4. Diremos que un conjunto A es numerable o que tiene cardinal ℵ0 si existe
una biyección f : N → A.
Diremos que A es contable si es finito o numerable.
Ejemplos. (Cf. [GJPR], pp. 57 y ss.)

— El conjunto A = {2n : n ∈ N} de los números naturales pares es numerable.
— El conjunto A = {n2 : n ∈ N} de los cuadrados de los números naturales es numerable (paradoja
de Galileo).
— Los conjuntos finitos no son numerables.
— El conjunto Z de los números enteros es numerable.
— El conjunto Q de los números racionales ¡es numerable! (enumeración diagonal de Cantor ; v.
[4]).
— El conjunto R de los números reales no es numerable. (Lo probaremos más adelante).
Definición 1.5.5. Dados dos conjuntos A y B, si existe una biyección f : A → B diremos que A
y B son equipotentes (escrito A ∼ B) o que tienen el mismo cardinal (escrito |A| = |B| o
#A = #B o card A = card B).
Como entonces f −1 : B → A es también una biyección, B ∼ A siempre que A ∼ B. Ası́ mismo,

hay reflexividad y transitividad (la identidad es una biyección, y la composición de dos biyecciones
es una biyección).3
Los conjuntos numerables (de cardinal ℵ0 ) son los equipotentes a N. Los conjuntos equipotentes
a R se dice que tienen el cardinal del continuo c.
Ejemplos. Los siguientes conjuntos tienen el cardinal del continuo (v. [GJPR], pp. 60 y ss.):
— cualquier subintervalo de R con más de un punto;
— el conjunto C de los números complejos;
— cualquier espacio vectorial de dimensión finita sobre R.
3
Pero ∼ no es una relación de equivalencia en ‘el conjunto de todos los conjuntos’, que no existe. Si nos limitamos
a los subconjuntos de un conjunto universal U , ∼ es una relación de equivalencia en ℘(U ).
1.5.2. APÉNDICE: Un mı́nimo de combinatoria.

En una descripción burda, la combinatoria se ocupa de contar de distintas maneras el número
de elementos de los conjuntos finitos. Es una parte muy importante de las Matemáticas, y sus
aplicaciones no cesan de aumentar. Aquı́ enunciaremos algunos de sus resultados más elementales, la
mayorı́a sin demostración. Para completar las demostraciones y ver más aplicaciones y comentarios,
recomendamos [D’A-W], [Lieb], y el capı́tulo sobre combinatoria de [1, pp. 94 y ss.].
Comenzaremos con dos de los temas más ‘clásicos’ de la Combinatoria.
Permutaciones
¿De cuántas maneras diferentes se pueden poner cuatro neumáticos a un coche? Hay cuatro posicio-
nes posibles: 1) delantera izquierda, 2) delantera derecha, 3) trasera izquierda, 4) trasera derecha.
Inicialmente, en la posición 1) podemos colocar uno cualquiera de los neumáticos, que distingui-
remos con las letras a, b, c, d: hay cuatro posibilidades diferentes. Elegida una de las cuatro, en
la posición 2) podemos colocar uno cualquiera de los tres neumáticos restantes: eso da 4 · 3 = 12
posibilidades. A partir de cada una de ellas, la elección de uno de los dos neumáticos restantes para
ocupar la posición 3) nos lleva a 12 · 2 = 24 posibilidades, y para la posición 4) ya sólo dispone-
mos de un neumático, ası́ que hay finalmente 4 · 3 · 2 · 1 = 4! = 24 maneras distintas de colocar
los neumáticos. Cada una de ellas se obtiene de las demás ‘intercambiando’ o ‘permutando’ los
neumáticos de lugar.
1) a b c d
2) b c d a c d a b d a b c
3) c d b d b c c d a d a c b d a d a b b c a c a b
4) d c d b c b d c d a c a d b d a b a c b c a b a
En los textos antiguos, las permutaciones de elementos de un conjunto se definı́an como ‘las
diversas ordenaciones que podemos formar con los elementos del conjunto, sin repetirlos ni olvidar
ninguno, de manera que dos cualesquiera contienen los mismos objetos y difieren solamente en el
orden de colocación de éstos’ (cf., por ejemplo, [Rey-P-T]). Por tanto, el paso de una permutación
a otra puede identificarse con una biyección del conjunto en sı́ mismo, que es la definición actual.
Definición 1.5.6. Una permutación de un conjunto A es una biyección de A en sı́ mismo.
Generalizando el razonamiento del ejemplo inicial, se obtiene:
Proposición 1.5.7. El número de permutaciones de un conjunto A con n elementos es n!.
Combinaciones
En el texto citado anteriormente, [Rey-P-T], p. 157, se lee: hh combinaciones de orden n de m objetos:

a1 , a2 , . . . , am , (o combinaciones n-arias), son los grupos de n objetos que se pueden formar con ellos,
de modo que dos cualesquiera difieran en algún objeto. Ası́ como las variaciones son sucesiones que
se diferencian entre sı́ por la naturaleza de sus objetos, o por su colocación, aquı́ ésta es indiferente,
y sólo aquélla importa.ii
Si pensamos esta definición en términos de conjuntos, vemos que se está hablando simplemente
de los distintos subconjuntos de n elementos que tiene un conjunto con m elementos. El número de
ellos se cuenta mediante los números combinatorios, que pasamos a definir. (Usaremos el convenio
de que 0! = 1.)
Definición
1.5.8. Dados dos enteros no negativos n y k, con n ≥ k, el número combinatorio
n
, leı́do n sobre k, es el número
k

n n!
= .
k k!(n − k)!
Pongamos ahora Ckn para denotar el número de subconjuntos con k elementos de un conjunto
con n elementos (el número de combinaciones de n elementos tomados de k en k). Como A ⊆ B
implica que |A| ≤ |B| (¿por qué?), esto supone que si k > n, Ckn = 0. Si k = n, obviamente Ckn = 1,
ası́ como C0n = 1. En los restantes casos,
Proposición 1.5.9. Dados dos enteros no negativos n y k con n ≥ k,

n n! n
Ck = = ,
k!(n − k)! k
donde Ckn denota el número de combinaciones de n elementos tomados de k en k.
Demostración. Consideremos un conjunto A que conste de n elementos. Contaremos todas las

permutaciones de A en las siguientes etapas.
(1) Elegimos un subconjunto {a1 , a2 , . . . , ak } de A de k elementos: esto puede hacerse de Ckn maneras
distintas.
(2) Permutamos los elementos de cada uno de los subconjuntos anteriores de todas las maneras
posibles: esto puede hacerse de k! formas distintas para cada uno de los subconjuntos seleccionados.
(3) A cada uno de los resultados anteriores, añadimos los n − k elementos que quedan de A,
ak+1 , ak+2 , . . . , an , en cada una de las (n − k)! formas posibles.
Obtenemos ası́ todas y cada una de las n! permutaciones de los elementos de A, sin repetir
ninguna. Por tanto n! = Ckn · k! · (n − k)!, de donde

n! n
Ckn = = .
k!(n − k)! k
Hay muchı́simas relaciones entre los números combinatorios, que expondremos según las vaya-
mos necesitando. Por ejemplo, es obvio que

n n! n! n
= = = ,
n−k (n − k)!(n − (n − k))! k!(n − k)! k
que responde a la idea de que con cada subconjunto B de A de k elementos tenemos emparejado
el subconjunto A \ B de n − k elementos (y viceversa), con lo cual tantos hay de un tipo como del
otro.
Otra expresión útil es la siguiente:

n n(n − 1) · · · (n − k + 1)
= ,
k k!
que se obtiene dividiendo por (n − k)! el numerador y el denominador en la fórmula inicial. Ası́ es
obvio que
n+1 n+1 n n+1 n+1 n
= o que = .
k (n + 1) − k k k+1 k k
Los números combinatorios se llaman también coeficientes binómicos, debido al siguiente resul-
tado.
Proposición 1.5.10 (Fórmula del binomio de Newton). Dados n ∈ N y x, y ∈ R,
n
n
X n
(x + y) = xk y n−k .
k
k=0
Demostración. Por definición, (x + y)n es el producto de n factores iguales a (x + y). Al desarro-

llar el producto, obtenemos solamente términos (repetidos) de la forma xk y n−k , provenientes de
multiplicar sumandos x tomados (¡una sola vez!) en k factores (0 ≤ k ≤ n) y sumandos y tomados
en los n − k restantes; por consiguiente, obtendremos nk sumandos iguales a xk y n−k , y quedará la

fórmula del enunciado.
(Posteriormente damos una demostración por inducción.)
Para obtener los coeficientes del binomio (los números combinatorios) se puede emplear el
llamado triángulo de Pascal o de Tartaglia, v. [6]:
1
1 1
1 2 1
1 3 3 1
1 4 6 4 1
1 5 10 10 5 1
1 6 15 20 15 6 1
1 7 21 35 35 21 7 1
1 8 28 56 70 56 28 8 1
etc. Detrás de este procedimiento de construcción está la igualdad

n n n! n! n! 1 1
+ = + = +
k k+1 k!(n − k)! (k + 1)!(n − k − 1)! k!(n − k − 1)! n − k k + 1
n! k+1+n−k n!(n + 1)
= · =
k!(n − k − 1)! (n − k)(k + 1) k!(k + 1) · (n − k − 1)!(n − k)

(n + 1)! n+1
= = ,
(k + 1)!(n − k)! k+1
que permite pasar de una fila a la siguiente obteniendo cada elemento como suma de los dos que
tiene encima.
Esta identidad justamente es la que se necesita para dar una demostración alternativa de la
fórmula del binomio mediante inducción.
En efecto: dados n ∈ N y x, y ∈ R, sea Pn el enunciado
n
n
X n
(x + y) = xk y n−k .
k
k=0
P1 1
Para n = 1, P1 afirma que (x + y)1 = xk y 1−k = 1 · x0 y 1 + 1 · x1 y 0 , es decir, que

k=0 k
x + y = y + x, lo cual es obviamente cierto.
Dado un número natural n arbitrario, supongamos que Pn es cierta. Entonces
n
n+1 n
X n
(x + y) = (x + y) (x + y) = ( xk y n−k ) (x + y)
k
k=0

n n n−1 n k n−k n
= y + xy + ··· + x y + ··· + xn−1 y + xn (x + y)
1 k n−1

n n 2 n−1 n k+1 n−k n
= xy + x y + ··· + x y + ··· + xn y + xn+1
1 k n−1

n+1 n n n k n−k+1 n
+ y + xy + ··· + x y + ··· + xn−1 y 2 + xn y
1 k n−1

n n n n
= y n+1 + + x yn + · · · + + xk y n−k+1 + · · ·
0 1 k−1 k

n n
+ + xn y + xn+1
n−1 n

n+1 n + 1 k n−k+1 n+1 n
= y n+1 + x yn + · · · + x y + ··· + x y + xn+1
1 k n
n+1
X n + 1
= xk y n−k+1
k
k=0
que es lo que afirma Pn+1 .
Principios generales
Como muestran los apartados anteriores, para contar los elementos de ciertos conjuntos finitos
suele interesar, en general, organizarlos de manera que se pueda diseñar una estrategia simple que
facilite el recuento. En el nivel más sencillo de aplicación de esta idea hay algunos principios básicos
que recogemos a continuación; para más detalles, nos remitimos a las referencias ya citadas ([1],
[D’A-W], [Lieb]).
Para empezar, veamos como se cuenta el número de elementos de un conjunto ‘por trozos’.
Lema 1.5.11. Sean A y B dos conjuntos finitos. Entonces
|A ∪ B| = |A| + |B| − |A ∩ B|.
En particular, si A y B son disjuntos,
|A ∪ B| = |A| + |B|.
Proposición 1.5.12 (Principio de adición). Sean A1 , . . . , An conjuntos finitos disjuntos dos

a dos, es decir,
Ai ∩ Aj = ∅ si i 6= j, 1 ≤ i, j ≤ n.
Entonces
|A1 ∪ A2 ∪ · · · ∪ An | = |A1 | + |A2 | + · · · + |An |.
Proposición 1.5.13 (Principio de inclusión y exclusión). Sean A1 , . . . , An conjuntos finitos.

Si
α1 = |A1 | + |A2 | + · · · + |An |

α2 = |A1 ∩ A2 | + |A1 ∩ A3 | + · · · + |An−1 ∩ An |,
α3 = |A1 ∩ A2 ∩ A3 | + |A1 ∩ A2 ∩ A4 | + · · · + |An−2 ∩ An−1 ∩ An |,
..
.
αn = |A1 ∩ A2 ∩ · · · ∩ An |
entonces
|A1 ∪ A2 ∪ · · · ∪ An | = α1 − α2 + · · · + (−1)n+1 αn .
Los ejercicios siguientes ilustran cómo el manejo del lenguaje de la teorı́a de conjuntos es
utilı́simo en el análisis de situaciones que a primera vista no se relacionarı́an con dicha teorı́a.
Ejercicios
5.1. ¿Puede creerse a un investigador que informa que, de cada 1000 habitantes, a 816 les gusta el
azúcar; a 723, el helado; a 645, los pasteles; y asimismo que a 562 les gusta el azúcar y el helado; a
463, el azúcar y los pasteles, y a 470, los pasteles y el helado, y sólo a 310 les gustan las tres cosas?
5.2. Tres monedas, una de cobre, otra de nı́quel y otra de plata, son lanzadas simultáneamente
al aire, y esto 100 veces. La de cobre muestra cara en 70 ocasiones, la de nı́quel muestra cara en
50 pruebas y la de plata muestra cara en 56 pruebas. La de cobre y la de nı́quel han mostrado
simultáneamente cara 31 veces y la de nı́quel y de plata han presentado tal circunstancaia 28 veces.
Probar que las tres monedas han mostrado cara simultáneamente por lo menos 9 veces y que las
tres han mostrado simultáneamente cruz a lo más 11 veces.
5.3. En una encarnizada batalla, por lo menos el 70 por ciento de los combatientes pierde un ojo;
al menos un 75 por ciento, una oreja; al menos un 80 por ciento, un brazo, y al menos un 85 por
ciento, una pierna. ¿Cuántos por lo menos han perdido las cuatro cosas? (Lewis Carroll.)
5.4. (Frases matemáticas célebres) Las matemáticas se componen de un 50 % de fórmulas, de un
50 % de demostraciones y de un 50 % de imaginación.
Proposición 1.5.14 (Principio de las cajas o principio del palomar). Si queremos repartir
n objetos en m cajas con rm < n, al menos una caja ha de recibir más de r objetos.
La demostración (muy fácil) junto con ejemplos y ejercicios de aplicación del mismo puede verse
en [D’A-W], cap. 10, pp. 158–162 y 167–169.
En el cálculo del número de permutaciones de n elementos hemos usado implı́citamente un
procedimiento que [Lieb, p. 116] expone ası́:
Proposición 1.5.15 (Principio de multiplicación). Sea P un proceso que consta de n etapas, y

supongamos que para cada r, la etapa résima puede llevarse a cabo de ar maneras distintas. Entonces
P puede llevarse a cabo de a1 a2 · · · an maneras distintas.
Ejemplo. Un sistema de seguridad usa palabras clave que constan de dos letras seguidas por dos
dı́gitos (decimales). ¿Cuántas palabras clave distintas pueden formarse?
Respuesta. 27 × 27 × 10 × 10, incluyendo la ñ y excluyendo la ch y la ll, que constan de dos
caracteres. (Cf. [Lieb, p. 115].)
Usando este principio, o directamente por inducción, se comprueba:
Proposición 1.5.16 (Cardinal de un producto). Sean A y B dos conjuntos finitos, y A × B

su producto cartesiano. Entonces
|A × B| = |A| · |B|.
Contar en tablas. Para contar los elementos de un conjunto es a veces conveniente expresar el
conjunto como subconjunto de un producto cartesiano, representándolo en una tabla. Ası́, el número
total de elementos del conjunto puede obtenerse sumando el número de elementos del conjunto que
hay en cada una de las filas, o bien sumando el número de elementos del conjunto que hay en cada
una de las columnas.4 Con una idea tan simple pueden contestarse preguntas como la siguiente:
Ejemplo. De los alumnos de una clase 32 son varones y cada uno de ellos conoce exactamente a
5 compañeras. Si cada alumna conoce exactamente a 8 compañeros, ¿cuántas alumnas hay en la
clase?
Respuesta. 32 × 5 = n × 8 =⇒ n = 20. (V. [1, pp. 96–97])
Hay multitud de problemas curiosos que se resuelven usando los métodos ‘combinatorios’ ex-
puestos en este apartado. Como pasatiempo de vacaciones, recomendamos especialmente los de
[D’A-W] (repartidos por todo el libro) y [Lieb], cap. 15.
4
Este resultado, cuya demostración rigurosa es más complicada de formular de lo que en principio cabrı́a suponer,
puede verse como ‘un anticipo en versión finita’ del teorema de Fubini, un resultado muy importante sobre integración
que se estudiará en cursos superiores de Análisis matemático.
Bibliografı́a
[Ap] Apéry, R. & al.: Pensar la matemática. Tusquets, Barcelona, 1984.
[C-H] Cohen, P. J.; Hersh, R.: Teorı́a de conjuntos no cantoriana. En [Kl], pp. 238–247.
[D-H] Dorronsoro, J.; Hernández, E.: Números, grupos y anillos. Addison-Wesley/UAM,

Madrid, 1996.
[GJPR] Goberna, M. A.; Jornet, V.; Puente, R.; Rodrı́guez, M.: Álgebra y fundamentos.
Una introducción. Ariel, Barcelona, 2000.
[G-H] Griffits, H. B.; Hilton, P. J.: Classical Mathematics. Van Nostrand Reinhold, London,
1970.
[Ham] Hamilton, A. G.: Numbers, sets and axioms: the apparatus of mathematics. Cambridge
Univ. Press, 1982.
[Kl] Kline, M. (ed.): Matemáticas en el mundo moderno. Blume, Madrid, 1974.
[Lieb] Liebeck, M.: A Concise Introduction to Pure Mathematics. Chapman & Hall/CRC,
Boca Raton, 2000.
[Lip] Lipschutz, S.: Teorı́a de Conjuntos y temas afines. (Col. Schaum) McGraw-Hill, Méxi-
co, 1969.
[O.U.] Open University: Introducción al cálculo y al álgebra (vol. 3: Álgebra). Reverté, Bar-
celona, 1977.
[Rey-P-T] Rey Pastor, J.; Pi Calleja, P.; Trejo. C. A.: Análisis matemático vol. I. Kapelusz,
Buenos Aires, (7a. ed.), 1963.
[S-T] Stewart, I.; Tall, D.: The Foundations of Mathematics. Oxford Univ. Press, 1977.
[1] Eric Schechter, a home page for the Axiom of Choice.

http://math.vanderbilt.edu/~schectex/ccc/choice.html
[2] Nancy McGough, Relevance of the Axiom of Choice (FAQ).

http://db.uwaterloo.ca/~alopez-o/math-faq/node69.html
[3] F. J. Cobos: Curso de Introducción a la Matemática Discreta. Universidad de Sevilla,

2002-2003..
http://ma1.eii.us.es/Docencia/apuntes/ap imd.PDF
47
48 BIBLIOGRAFÍA
[4] Numerabilidad de Q, Math Forum Famous Problems.

http://mathforum.org/isaac/problems/cantor2.html
[5] Proceso diagonal de Cantor, desde un punto de vista computacional:

http://delta.cs.cinvestav.mx/~gmorales/complex/node7.html
[6] El triángulo de Pascal y alguna curiosidad adicional.

http://mathworld.wolfram.com/PascalsTriangle.html
Capı́tulo 2
Números naturales y enteros.
En el desarrollo del tema de los números enteros seguiremos básicamente el texto [D-H]. Sobre
números naturales, si es necesario puede ser útil como libro de consulta [S-T].
Los restantes libros de la bibliografı́a sirven de complemento en algunos puntos concretos que
señalaremos en su momento.
2.1. Números naturales.

Ya tuvimos una primera toma de contacto con el conjunto de los números naturales y una de
sus propiedades esenciales, el principio de inducción. Ahora que nos hemos familiarizado con los
conceptos básicos de la teorı́a de conjuntos, serı́a el momento oportuno de entrar en una funda-
mentación axiomática rigurosa de los números naturales basada, como es habitual, en los axiomas
de Peano, que (creemos) todo aspirante a matemático debe conocer. Sin embargo, la extensión
del programa nos impide disponer del tiempo necesario para llevar a cabo este propósito; como
solución intermedia, recogeremos aquı́ como lectura complementaria de lo visto en clase dichos
axiomas, junto con algunas definiciones y propiedades de los números naturales (enunciadas sin
demostraciones), destacando las que nos serán necesarias posteriormente para el estudio de los
números enteros.
2.1.1. Lectura preliminar

¿Qué ocurrirı́a si al ir profundizando en nuestros conocimientos matemáticos observásemos
incongruencias en algunos de los conceptos que tenı́amos por ‘intuitivamente claros’ o de los resul-
tados que tenı́amos por ‘evidentemente ciertos’ ? ¿No comenzarı́amos a dudar de todo y a intentar
“reconstruir el edificio de nuestros conocimientos”, cimentándolo sobre una base lo más explı́cita y
más sólida posible?
Esto les sucedió a los matemáticos del siglo XIX. Imaginemos la situación: desconfianza en
“todo lo previamente sabido”, hay que replantearlo empezando de cero. Ası́ comenzó un análisis
radical de los fundamentos de las matemáticas y la entronización del método axiomático.
Adoptemos, pues, la misma postura radical que nuestros predecesores decimonónicos: olvidemos
(o hagamos como que nos olvidamos de) nuestras intuiciones geométricas, nuestros conocimientos
de los números enteros, racionales, etc., y concentrémosnos en los números naturales. Cuestionemos
incluso los mismos números naturales. ¿Cómo reconstruir ahora toda la aritmética, la ‘ciencia de
los números naturales’, con la mayor economı́a de medios, partiendo de unos supuestos mı́nimos?
hh Dedekind, y Peano siguiéndole, diseccionaron el concepto de la progresión de los números
naturales y formularon una fundamentación axiomática de la aritmética, conocida ahora, impro-

piamente, como los axiomas de Peano.ii ([3]; ver también [2] y las referencias allı́ citadas.)
La idea esencial es esta: para ‘ir fabricando’ los números naturales, sólo necesitamos disponer
del primero, el 1 en nuestro convenio, y de una manera de pasar al siguiente, de este al siguiente,
49
50 CAPÍTULO 2. NÚMEROS NATURALES Y ENTEROS
de este al siguiente, etc. Ahora que disponemos del lenguaje de la teorı́a de conjuntos, usémoslo
para expresar este proceso.
Olvidando la suma (ya la reconstruiremos después), pongamos sgt (n) en vez de n + 1 para el
‘siguiente’ a n. ‘Pasar de un número natural al siguiente’ es asociar a cada n su siguiente sgt (n),
lo que en el lenguaje conjuntista no es más que definir una aplicación sgt : n ∈ N → sgt (n) ∈ N.
Obviamente, esta aplicación es inyectiva: si m 6= n, sgt (m) 6= sgt (n). Que 1 es ‘el primer número
natural’ es decir que no sigue a ninguno, 1 6= sgt (n) cualquiera que sea n ∈ N; o, en otros términos,
1 no está en el conjunto imagen de la aplicación sgt , 1 ∈ N \ sgt (N). También sabemos que el
principio de inducción tiene un enunciado ‘conjuntista’ en términos de esta aplicación:
dado S ⊆ N tal que 1 ∈ S y sgt (n) ∈ N siempre que n ∈ N, necesariamente S = N,
y gracias a él podemos cerrar el proceso, como descubrieran R. Dedekind [Ddk] y G. Peano
[Peano] entre otros.
2.1.2. Los axiomas de Peano

Los conceptos primitivos y las ‘propiedades fundamentales’ (axiomas) que permiten describir
axiomáticamente los números naturales están recogidos en el enunciado que sigue:
Existen un conjunto N, cuyos elementos se denominan números naturales, que contiene

un elemento distinguido 1, y una aplicación sgt : N → N tal que
(S1) sgt es inyectiva,
(S2) 1 ∈
/ sgt (N),
(S3) dado S ⊆ N con 1 ∈ S y sgt (S) ⊆ S, necesariamente S = N.
Es un hecho notable, y un tanto sorprendente, que todas las propiedades usuales de los números
naturales pueden deducirse de estas, como puso de manifiesto el matemático italiano G. Peano en
su obra [Peano]. Aunque Dedekind habı́a planteado con anterioridad un sistema similar (si bien más
complicado, ver [Ddk]), hoy se llaman en su honor axiomas de Peano para los números naturales.
En una formulación más ‘clásica’, más próxima a la original de Peano,1 suelen enunciarse ası́:
Existe un conjunto N, cuyos elementos se denominan números naturales, tal que

P1. Para todo número natural n existe otro número natural, sgt (n), que llamaremos siguiente o
sucesor de n.
P2. Existe un número natural, que denotamos por 1, tal que sgt (n) 6= 1 cualquiera que sea el
número natural n.
P3. Para números naturales cualesquiera m y n, es sgt (m) = sgt (n) si y sólo si m = n.
P4. (Axioma de inducción matemática). Un conjunto de números naturales que contenga a
1 y que con cada n contenga a sgt (n), debe incluir a todos los números naturales. Es decir,
dado S ⊆ N tal que 1 ∈ S y sgt (n) ∈ S siempre que n ∈ S, es S = N.
Que 1 es el único elemento de N que no está en el conjunto imagen de la aplicación sgt puede
demostrarse por inducción; ası́, el conjunto imagen de dicha aplicación es exactamente N \ {1} (V.
[S-T], p. 147).
Como es presumible, el ‘siguiente’ de un n ∈ N será n + 1 . . . ¡pero sólo cuando sepamos lo que

significa ese signo hh +ii, que habremos de definir a partir de los axiomas anteriores!
Pasemos a ver cómo se construyen por recurrencia las operaciones de suma y producto.
1
En alguna versión posterior, como la publicada en 1895 que reproducimos en [2], Peano parte de 0 como primer
número natural. Ası́ se hace también en las referencias [S-T], [Ham].
2.1. NÚMEROS NATURALES. 51
Proposición 2.1.1 (Suma en N). Dado un número natural m, definimos:
(i) m + 1 = sgt (m)
(ii) para cada n ∈ N, m + sgt (n) = sgt (m + n).
Entonces, dados dos números naturales cualesquiera m y n, m + n es un número natural per-

fectamente definido.
Demostración. Dado m, consideremos
S = {k ∈ N : ∃|x ∈ N tal que m + k = x}.
Evidentemente, 1 ∈ S. Y si k ∈ S, también sgt (k) ∈ S. Por el principio de inducción, S = N.

En particular, n ∈ S, como querı́amos demostrar.
¡Hemos dado una definición recurrente de la suma! También el producto puede definirse por
recurrencia, apoyándonos en la suma que acabamos de construir:
Proposición 2.1.2 (Producto en N). Dado un número natural m, definimos:
(i) m · 1 = m
(ii) para cada n ∈ N, m · sgt (n) = m · n + m.
Entonces, dados dos números naturales cualesquiera m y n, m · n es un número natural perfec-

tamente definido (que se denotará simplemente por mn en vez de m · n si no ha lugar a confusión).
Ya vimos que, en la práctica, el principio de inducción suele aplicarse en términos de “propieda-

des” más que en términos de conjuntos. Justificada ya la notación n + 1 para sgt (n), recuperamos
los enunciados tradicionales que utilizamos a principio de curso.
Empleando adecuadamente el principio de inducción se comprueba que las operaciones de suma

y producto de números naturales, es decir, las aplicaciones del producto cartesiano N × N en N
dadas por
+ : (m, n) ∈ N × N → m + n ∈ N, · : (m, n) ∈ N × N → m n ∈ N.
tienen las propiedades fundamentales que a continuación transcribimos.
Propiedades de la suma y el producto en N. Dados números naturales cualesquiera m, n,

p, se cumplen
N1. Propiedad asociativa de la suma. (m + n) + p = m + (n + p).

N2. Propiedad conmutativa de la suma. m + n = n + m.
N3. Propiedad cancelativa de la suma. m + n = m + p implica n = p.
N4. Propiedad asociativa del producto. (m n) p = m (n p).

N5. Propiedad conmutativa del producto. m n = n m.
N6. Existencia de elemento neutro (identidad) para el producto. Hay un número natural,
que denotamos por 1, tal que 1 · n = n · 1 = n.
N7. Propiedad cancelativa del producto. mn = mp implica n = p.
N8. Propiedad distributiva del producto respecto de la suma. m (n + p) = m n + m p.

2.1.3. El principio de buena ordenación.

Para “comparar el tamaño” de dos números naturales cualesquiera se define en N una ordenación
partiendo de la suma.
Definición 2.1.3. Dados dos números naturales cualesquiera m, n, escribiremos m ≤ n y diremos
que m es menor o igual que n (o lo que es lo mismo, que n es mayor o igual que m, lo que se
escribe n ≥ m), cuando m = n o n = m + p para algún número natural p.
Pondremos m < n (o n > m) para expresar que m es estrictamente menor que n (o sea,
que m es menor y distinto que n).
Como propiedades fundamentales de esta relación tenemos:
Propiedades del orden en N. Dados números naturales cualesquiera m, n, p, se cumplen
N9. Propiedad reflexiva. m ≤ m.
N10. Propiedad antisimétrica. si m ≤ n y n ≤ m, entonces m = n.
N11. Propiedad transitiva. si m ≤ n y n ≤ p, entonces m ≤ p.
N12. Propiedad de orden total. siempre es m ≤ n o n ≤ m.
La propiedad 12 significa, según la definición, que dados dos números naturales cualesquiera m,
n, o bien es m = n, o n = m + p para algún número natural p, o m = n + p para algún número
natural p.
Recordemos que no todas las relaciones de orden son totales, en el sentido que indica la citada
propiedad: no lo era, por ejemplo, la relación de inclusión entre conjuntos. Pero la propiedad más
caracterı́stica de la relación de orden en N, que la distingue de manera especial, es la de ser una
buena ordenación, lo que significa exactamente lo siguiente:
Proposición 2.1.4. Principio de buena ordenación. Todo conjunto no vacı́o de números
naturales posee un elemento mı́nimo, es decir, dado S ⊆ N no vacı́o, existe un elemento m en S
tal que m ≤ n para todo n ∈ S.
También son interesantes las siguientes propiedades de la ordenación de números naturales.
Pueden probarse por inducción, y/o como consecuencia de las que le preceden.
Otras propiedades
(1) Todos los números naturales son mayores o iguales que 1. Es decir, mı́n N = 1.
(Aplı́quese el principio de inducción a la proposición Pn : n ≥ 1.)
(2) Dados m, n ∈ N, se tiene m > n si y sólo si existe p ∈ N tal que m = n + p, lo que abreviaremos
poniendo hh m − n ∈ N ii.
(En este caso, todo es evidente salvo que m = n + p para algún p ∈ N implica m 6= n; para
probarlo, véase primero por inducción sobre m que m 6= m + 1 cualquiera que sea m ∈ N, y después
que para todo m ∈ N, m 6= m + p por inducción sobre p.)
(3) Dados m, n ∈ N, no puede verificarse n < m < n + 1. En palabras, entre dos números naturales
consecutivos no hay ningún número natural.
(Puesto que si m ∈ N serı́a m − n ∈ N por (2) y m − n < 1, contradiciendo (1).)
2.2. Números enteros.

2.2.1. Necesidad de los enteros. Propiedades de Z. Idea de anillo.
La “resta” m − n de números naturales no siempre es posible, según se desprende de las pro-
piedades que hemos visto anteriormente. Dicho de otra forma, la ecuación
x + a = b,
2.2. NÚMEROS ENTEROS. 53
a, b ∈ N, no siempre tiene solución x ∈ N. Lo que hacemos entonces es “inventarnos” las soluciones

y añadirlas como números: ası́ definimos hh el cero 0ii como un nuevo número, solución de x + a = a,
y los hh enteros negativos −nii (números falsos, los llamaba Descartes) como solución de x + a = b
cuando a = b + n. Nos encontramos ası́ con los conocidos
. . . , −3, −2, −1, 0, 1, 2, 3, . . . ,
cuya representación gráfica como puntos de una recta nos es también familiar.
Aunque puede darse una construcción ‘algebraico-conjuntista’ de los números enteros (ver
[GJPR], pp. 91 y ss.), nosotros nos contentaremos de momento con esta idea ‘ingenua’ adoptando
(al menos por ahora) la siguiente descripción.
Definición 2.2.1 (Descripción de los números enteros). Diremos que un x es un número

entero si x ∈ N o si x = 0 o si x = −n con n ∈ N.
El conjunto formado por todos los números enteros se denota por Z.
Si ponemos N0 = N ∪ {0}, −N = {x = −n : n ∈ N}, se tiene Z = N ∪ {0} ∪ (−N) = N0 ∪ (−N).

Nos referiremos a N0 como al conjunto de los enteros no negativos y a −N como al conjunto de los
enteros negativos, siendo el conjunto N de los números naturales el de los enteros positivos.
El lector recordará que la suma y el producto de números naturales se amplı́a a una suma y
producto de números enteros,
+ : (m, n) ∈ Z × Z → m + n ∈ Z, · : (m, n) ∈ Z × Z → m n ∈ Z,
con las propiedades fundamentales que a continuación enunciamos.
Propiedades de la suma y el producto en Z. Dados números enteros cualesquiera m, n, p,

se cumplen
Z1. Propiedad asociativa de la suma. (m + n) + p = m + (n + p).
Z2. Propiedad conmutativa de la suma. m + n = n + m.
Z3. Existencia de elemento neutro (cero) para la suma. Hay un número entero, que
denotamos por 0, tal que 0 + n = n + 0 = n.
Z4. Existencia de elemento opuesto para la suma. Hay un número entero (y uno sólo), que
denotamos por −n, tal que (−n) + n = n + (−n) = 0.
Las propiedades Z1 a Z4 pueden resumirse diciendo que Z es un grupo conmutativo para la
suma. La propiedad cancelativa de la suma en Z va incluida en Z4 (¿por qué?)
Z5. Propiedad asociativa del producto. (m n) p = m (n p).
Z6. Propiedad conmutativa del producto. m n = n m.
Z7. Existencia de elemento neutro (identidad) para el producto. Hay un número entero,
que denotamos por 1, tal que 1 · n = n · 1 = n.
Z8. Propiedad distributiva del producto respecto de la suma. m (n + p) = m n + m p.
Las propiedades Z1 a Z8 pueden resumirse diciendo que Z, para la suma y el producto, es un
anillo conmutativo con unidad. Otros ejemplos de anillos: matrices n × n, funciones reales sobre un
mismo dominio, polinomios, . . .
Z9. Propiedad cancelativa del producto. mn = mp implica n = p.
Los sistemas algebraicos que tienen las propiedades Z1 a Z9 se llaman dominios de integridad.
NO son dominios de integridad los anillos de matrices n × n para n ≥ 2, de funciones reales sobre
un dominio con más de un punto (¿por qué?).
La relación de orden en N puede extenderse a Z.
Definición 2.2.2. Dados dos números enteros cualesquiera m, n, escribiremos m ≤ n y diremos

que m es menor o igual que n (o lo que es lo mismo, que n es mayor o igual que m, lo que
se escribe n ≥ m), cuando m = n o n = m + p para algún número natural p; equivalentemente,
cuando exista p ∈ N0 tal que n = m + p.
Pondremos m < n (o n > m) para expresar que m es estrictamente menor que n (o sea,
que m es menor y distinto que n).
Con esta notación,
N = {n ∈ Z : n > 0}, N0 = {n ∈ Z : n ≥ 0}, −N = {n ∈ Z : n < 0}.
Como propiedades fundamentales de la relación de orden en Z tenemos:
Propiedades del orden en Z. Dados números naturales cualesquiera m, n, p, se cumplen

Z10. Propiedad reflexiva. m ≤ m.
Z11. Propiedad antisimétrica. Si m ≤ n y n ≤ m, entonces m = n.
Z12. Propiedad transitiva. Si m ≤ n y n ≤ p, entonces m ≤ p.
Z13. Propiedad de orden total. Siempre es m ≤ n o n ≤ m.
Nótese que no va a ser válido un principio de buena ordenación igual que para los números
naturales: por ejemplo, el propio conjunto Z no tiene elemento mı́nimo, pues para cada n ∈ Z es
n − 1 < n. Sin embargo, vamos a tener una propiedad análoga para cierta clase de subconjuntos:
Z14. Principio de buena ordenación de los conjuntos minorados (principio del mı́nimo).
Todo conjunto no vacı́o de números enteros acotado inferiormente posee un elemento mı́nimo,
es decir, dado S ⊆ Z no vacı́o tal que para algún k ∈ Z es k ≤ n para todo n ∈ S, existe un
elemento m en S tal que m ≤ n para todo n ∈ S.
Simétricamente:
Z15. Principio del máximo. Todo conjunto no vacı́o de números enteros acotado superiormente
posee un elemento máximo, es decir, dado S ⊆ Z no vacı́o tal que para algún k ∈ Z es k ≥ n
para todo n ∈ S, existe un elemento M en S tal que M ≥ n para todo n ∈ S.
Por ejemplo, máx(−N) = −1.
En Z puede hablarse del “siguiente” a un número entero, en el sentido de que entre n y n + 1 no
hay ningún otro número entero (¿por qué?). No se cumple, sin embargo, el principio de inducción,
sino una propiedad similar aunque más débil:
Z16. Un conjunto de números enteros que contenga un número k y que con cada n contenga a
n + 1, debe contener a todos los números enteros mayores o iguales que k. Es decir, dado
S ⊆ Z tal que k ∈ S y n + 1 ∈ S siempre que n ∈ S, se tiene S ⊇ {n ∈ Z : n ≥ k}.
(Puede precisarse un poco más: dados S ⊆ Z y k ∈ Z, se tiene S = {n ∈ Z : n ≥ k} si y sólo si
k−1∈ / S, k ∈ S y n + 1 ∈ S siempre que n ∈ S.)
Esta hh inducción que comienza en un entero arbitrarioii justifica usar definiciones recurrentes
que tengan base igualmente en un entero arbitrario, y no necesariamente en 1.
Otras propiedades y conceptos en torno a la ordenación de Z son similares a las que el lector
estará manejando en R. Por ejemplo,
Z17. Relación con la suma. a ≤ b =⇒ a + c ≤ b + c.
Z18. Relación con el producto. Si c ≥ 0, a ≤ b =⇒ a c ≤ b c. Si c < 0, a ≤ b =⇒ a c ≥ b c.
El valor absoluto de un número entero a es el número entero no negativo
(
a, si a ≥ 0;
|a| =
−a, si a ≤ 0.
Con esta definición, si a, b, denotan números enteros cualesquiera, se verifican, entre otras, las
siguientes relaciones:
|1| = 1; | − 1| = 1.
| − a| = |a|.
−|a| ≤ a ≤ |a|.
|a b| = |a| |b|.
Ejercicios
6.1. En las propiedades básicas de Z hemos señalado que todo n ∈ Z tiene un opuesto −n tal que
n + (−n) = (−n) + n = 0. ¿Puede haber algún otro m ∈ Z tal que n + m = m + n = 0? ¿Por qué?
Sugerencia: ¿quién serı́a m + n + (−n)?
6.2. Por definición, −1 es el opuesto de 1. Probar que la igualdad (−1)(−1) = 1 es una consecuencia
de la propiedad distributiva.
6.3. Dado un entero cualquiera n, probar que (−1) · n es el opuesto de n.
6.4. Dado un entero arbitrario a, definimos
a0 = 1 ; an+1 = an · a.
Probar que an está bien definido para todo n ∈ N0 .
2.2.2. División entera.

Una herramienta importante en el estudio de Z es la ‘división con resto’.
Proposición 2.2.3 (Existencia de la división entera). Dados a, b ∈ Z, con b 6= 0, existen dos

números enteros c y r tales que
a = cb + r, 0 ≤ r < |b|.
Los enteros c y r, denominados respectivamente cociente y resto de la división entera de a por

b, son únicos. Además, si a y b son números naturales, c tiene que ser un número positivo o nulo.
Demostración. Veamos primero el caso b > 0. Entonces b ∈ N, y b ≥ 1.

Sea
F = {z ∈ Z : zb ≤ a}.
Este es un conjunto no vacı́o, pues si a ≥ 0 contiene a 0 y si a < 0 contiene a a, porque de b ≥ 1,
multiplicando por a (que es negativo) se sigue ab ≤ a. Además, está acotado superiormente por |a|,
puesto que si z ∈ F y z ≥ 0, de 1 ≤ b se pasa a z ≤ zb = a, y si z < 0 trivialmente z < 0 ≤ |a|.
Aplicando el principio del máximo, existe c = máx F . Ası́ c ∈ F y c + 1 ∈
/ F (ver la construcción
gráfica en la nota posterior); por tanto
cb ≤ a, (c + 1)b > a, o sea cb + b > a.
Tomando r = a − cb, se deduce de estas desigualdades que 0 ≤ r < b = |b| y a = cb + r.

Para demostrar la unicidad del cociente y del resto, supongamos que hemos encontrado enteros
c1 , c2 , r1 , r2 tales que
c1 b + r1 = a = c2 b + r2 , 0 ≤ r1 < |b| = b, 0 ≤ r2 < |b| = b.

De las dos igualdades se sigue que

r2 − r1 = (c1 − c2 )b.
Pero también resulta −b < −r1 ≤ r2 − r1 ≤ r2 < b, y ası́ −b < r2 − r1 = (c1 − c2 )b < b, lo cual
sólo es posible si c1 − c2 = 0 (¿por qué?) En definitiva, c1 = c2 y en consecuencia r1 = r2 , como
querı́amos probar.
El caso b < 0 se reduce al anterior sin más que observar que a = cb+r si y sólo si a = (−c)(−b)+r.
Nota. Las figuras que siguen ilustran gráficamente la situación. Para a ≥ 0, se ve que, simplemente,
‘estamos midiendo a con b como unidad de medida’, trasladando un segmento de longitud b hacia
la derecha el número máximo de veces que podamos, sin llegar a sobrepasar a (por la derecha);
para a < 0, trasladarı́amos la unidad de medida hacia la izquierda, justo hasta igualar o sobrepasar
a (por la izquierda).
Ejemplo. La división entera de 1 por 2 da cociente 0 y resto 1; la de −1 por 2 da cociente −1 y

resto 1; la de 1 por −2, cociente 0 y resto 1, y la de −1 por −2, cociente 1 y resto 1.
La división entera en maple y Mathematica

Los programas de cálculo simbólico, como maple y Mathematica , permiten obtener sin difi-
cultad el cociente y el resto de una división entera cuando el dividendo y el divisor no son negativos.
En caso contrario, las cosas se complican.
• maple :
— El cociente entero de un entero no negativo m por un entero no nulo n se obtiene escribiendo
iquo(m,n);
(‘integer quotient’ de m y n);
— El resto de la división entera de un entero no negativo m por un entero no nulo n se obtiene
escribiendo
irem(m,n);
(‘integer remainder’ de m y n);
— si m es un entero negativo, iquo(m,n) e irem(m,n) dan los enteros q y r tales que m = n · q + r,
|r| < |n| y r ≤ 0. ¿Cómo podremos entonces conseguir el cociente y el resto que hemos definido
nosotros? Piénselo el lector.
• Mathematica :
— El cociente entero de un entero cualquiera m por un entero positivo n se obtiene escribiendo
Quotient[m,n]
— El resto de la división entera de un entero cualquiera m por un entero positivo n se obtiene
escribiendo
Mod[m,n]
— si n es un entero negativo, Quotient[m,n] y Mod[m,n] dan los enteros q y r tales que m = n·q+r,
|r| < |n| y r ≤ 0.
En el ejemplo anteriormente comentado, resultarı́a:
maple Mathematica
m n cociente resto iquo(m,n) irem(m,n) Quotient[m,n] Mod[m,n]
1 2 0 1 0 1 0 1
−1 2 −1 1 0 −1 −1 1
1 −2 0 1 0 1 −1 −1
−1 −2 1 1 0 −1 0 −1
Ejercicios
7.1. Sea a un entero cualquiera y sean b y m enteros positivos. Si q es el cociente y r es el resto de
la división entera de a por b, probar que q es el cociente y mr es el resto de la división entera de
ma por mb.
7.2. Sean a, b, c enteros con b > 0, c > 0. Si q es el cociente de la división entera de a por b y q 0 es
el cociente de la división entera de q por c, probar que q 0 es el cociente de la división entera de a
por bc.
7.3. Demostrar, utilizando el algoritmo de la división, que si un número entero es a la vez un
cuadrado y un cubo, entonces se puede escribir en la forma 7k o 7k + 1.
2.2.3. Representación decimal y binaria. Bases de numeración

Cuando escribimos hh el número 1984 ii , estamos usando una notación abreviada para el número
4 + 8 · 10 + 9 · 102 + 1 · 103 . Con el convenio subyacente, nos bastan las diez cifras o dı́gitos decimales
hh 0, 1, 2, 3, 4, 5, 6,7, 8, 9 ii para representar cualquier número entero no negativo (para representar
un número entero negativo arbitrario, añadimos un signo hh − ii a la izquierda de la representación

de su valor absoluto). Pero, ¿por qué utilizar esta representación precisamente? El propio nombre
dı́gito sugiere la respuesta clásica: porque contamos con los dedos, y eso hace aparecer el 10 como
un número base razonable. Sin embargo, nada impide intentar una representación binaria en lugar
de la decimal, es decir, que usemos los dı́gitos binarios hh 0, 1 ii para reescribir
1984 = c0 + c1 · 2 + c2 · 22 + · · · + cn · 2n ,
con ck = 0 ó 1. Observando que
N = c0 + c1 · 2 + c2 · 22 + · · · + cn · 2n = c0 + (c1 + c2 · 2 + · · · + cn · 2n−1 ) · 2
= c0 + (c1 + (c2 + · · · + cn · 2n−2 ) · 2) · 2 = · · · = c0 + (c1 + (c2 + (· · · + (cn · 2) · · · 2) · 2) · 2,
se vislumbra un procedimiento para ir obteniendo los ck : c0 es el resto de la división de N por 2; si

N1 es el cociente, c1 es el resto de la división de N1 por 2; si N2 es el cociente resultante, c2 es el
resto de la división de N2 por 2; si . . . etc., hasta cn−1 , mientras que cn es el último cociente. Por
tanto, dividiendo por 2 sucesivamente,
1984 992 496 248 124 62 31 15 7 3 1

restos 0 0 0 0 0 0 1 1 1 1
lo que deja
1984 = 0 + 0 · 2 + 0 · 22 + 0 · 23 + 0 · 24 + 0 · 25 + 1 · 26 + 1 · 27 + 1 · 28 + 1 · 29 ,
que por analogı́a escribirı́amos

11111000000(2
o con alguna notación similar que destaque que se trata de una representación binaria.
¿Qué interés puede tener una representación ası́, disponiendo como disponemos de nuestra
‘confortable’ notación decimal? El creador del sistema binario, Leibniz, lo veı́a, entre otras cosas,
como una imagen del ‘misterio de la creación’: el 1 representaba a Dios y el 0 la Nada, de la que
todas las cosas fueron creadas. Trescientos años más tarde, resulta que la mayorı́a de los ordenadores
actuales manejan los números a través de su representación binaria, que luego convierten en decimal.
La ventaja que esto ofrece es que cada número se registra en “bits” (binary digits) y cada bit se
corresponde con uno de dos estados posibles (pasa corriente o no pasa). Estas dos condiciones
corresponden a los valores 1 y 0, respectivamente. Ası́, un número representado por una sucesión
de 1 y 0 puede almacenarse en un ordenador como una cadena de bits.
Pero la gran ventaja del sistema binario, que sólo necesita dos caracteres, es a veces su gran
inconveniente: incluso los números pequeños requieren muchas cifras en su escritura. Los números
en representación binaria son, por tanto, muy largos y de manejo incómodo. Pese a ello, como los
ordenadores están formados por dispositivos digitales que sólo tienen dos estados estables posibles,
asimilados a 0 y a 1, puede decirse que casi todos ellos ‘trabajan’ en sistema binario.
Para paliar los inconvenientes del sistema binario hay distintas soluciones. Como comprobaremos
inmediatamente, cualquier entero b mayor o igual que 2 puede tomarse como base de un sistema de
numeración. Si la base b es una potencia de 2, la ‘traducción’ del sistema binario a esta base es muy
cómoda. Por esto, algunos programas de ordenador, sobre todo cuando se trabaja en lenguajes de
ensambladores o en lenguajes de alto nivel como C, emplean el sistema octal (base 8), con dı́gitos
hh 0, 1, 2, 3, 4, 5, 6, 7 ii, o el hexadecimal, usado también en el mundo de la comunicación (las cifras
hexadecimales son hh 0, 1, 2, 3, 4, 5, 6, 7, 8, 9, A, B, C, D, E, F ii).

Todas estas representaciones son ejemplos particulares de notaciones posicionales: un mismo
sı́mbolo (un dı́gito) tiene distinto valor según la posición que ocupe. Cada ‘lugar’ tiene un ‘peso’,
que en nuestro caso corresponde a las potencias sucesivas 1 = b0 , b = b1 , b2 , b3 , . . . , de la base b. 2
Que es posible usar cualquier entero b mayor o igual que 2 como base de un sistema de nume-
ración se sigue de una aplicación reiterada de la división entera.
Proposición 2.2.4 (Teorema fundamental de la numeración). Dado un entero b ≥ 2, todo

entero positivo n se escribe de manera única en la forma
n = ck bk + ck−1 bk−1 + · · · + c1 b + c0 , (2.1)
con cj ∈ Z, 0 ≤ cj < b (1 ≤ j ≤ k) y ck 6= 0. Para indicar esta igualdad escribiremos
n = (ck ck−1 . . . c1 c0 )b , ó también n = ck ck−1 . . . c1 c0 (b ,
y diremos que ésta es la representación de n en la base b.

2
El lector conoce representaciones que no son posicionales: la numeración romana, la ‘notación cientı́fica’. Obsérvese
que todas representaciones son convencionales, y es la clase de uso y manipulación a la que están destinadas la que
marca su conveniencia y utilidad.
Demostración. Probaremos la existencia de representación mediante el principio de inducción com-

pleta. Llamemos Pn al enunciado
n admite una representación del tipo (2.1).
Entonces P1 es cierta, con k = 0 y c0 = 1.
Supongamos cierta Pm para todo m ≤ n, y demostremos que es cierta Pn+1 .
Dividiendo n + 1 por b, obtendremos n + 1 = mb + r, con 0 ≤ r < b y m ≥ 0.
Pero forzosamente m ≤ n, ya que en caso contrario serı́a m > n, luego m ≥ n + 1, y en tal caso
mb ≥ (n + 1)b > n + 1 (recordemos que b ≥ 2), con lo cual
n + 1 = mb + r ≥ mb > n + 1,
imposible.
Ası́ pues, si m = 0, n + 1 = r con 0 < r < b, que es una representación del tipo (2.1). Y si
m 6= 0, por la hipótesis de inducción tendremos
m = ck bk + ck−1 bk−1 + · · · + c1 b + c0 ,
con 0 ≤ cj < b (1 ≤ j ≤ k) y ck 6= 0, luego
n + 1 = mb + r = ck bk+1 + ck−1 bk + · · · + c1 b2 + c0 b + r,
que nos da la representación del tipo (2.1) que estábamos buscando.
Comprobada la existencia de representación, demostremos su unicidad. Como
n = ck bk + ck−1 bk−1 + · · · + c1 b + c0 = (ck bk−1 + ck−1 bk−2 + · · · + c1 )b + c0 , 0 ≤ c0 < b,
resulta que c0 es el resto de la división entera de n por b, determinado unı́vocamente por n y b,
luego c0 es único. A su vez, el cociente de esa división, unı́vocamente determinado por n y b, es
q = ck bk−1 + ck−1 bk−2 + · · · + c1 ,
y reiterando el argumento anterior vamos obteniendo que los c1 , . . . , ck−1 están unı́vocamente
determinados como restos de las sucesivas divisiones por b, y ck como cociente de la última división,
que se produce cuando llegamos a un cociente < b. Esto prueba la unicidad.
La demostración anterior proporciona además un algoritmo ‘teórico’ para calcular los cj me-
diante divisiones sucesivas ‘en escalera’ por la base b; esquemáticamente
n |b
c0 n1 |b
..
c1 n2 . |b
nk−1 |b
ck−1 ck |b
ck 0
En dirección contraria, de la representación de un número en base b podemos obtener el valor
‘teórico’ directamente de la propia definición
n = ck bk + ck−1 bk−1 + · · · + c1 b + c0
o, con un menor número de operaciones, mediante el conocido algoritmo de Horner-Ruffini:
ck ck−1 ck−2 ··· c1 c0
ck b 2
ck b + ck−1 b ··· ckbk−1 + · · · + c2 b k
ck b + · · · + c1 b
b)
ck ck b + ck−1 ck b2 + ck−1 b + ck−2 · · · ck bk−1 + · · · + c1 ck bk + · · · + c1 b + c0
Pero, en la práctica, los cálculos ‘de verdad’ con números ¡se realizan sobre sus representaciones!
Eso supone disponer de buenos algoritmos para llevar a cabo las operaciones aritméticas (i.e., para
sumar, restar, multiplicar, dividir). En base 10, sabemos cómo efectuar estas operaciones, aunque
quizá no nos hayamos preguntado el por qué de ese cómo. Ahora es buen momento.
Si se tiene presente el significado de la representación en base b, las ‘reglas tradicionales’ para

efectuar las operaciones aritméticas en base 10 quedan perfectamente justificadas (sumar “llevan-
do”, multiplicar por un número de varias cifras en filas sucesivas desplazadas un lugar a la izquierda,
etc.) Y, lo que es aún mejor, vemos que las mismas reglas son adaptables para efectuar estas ope-
raciones en cualquier base. Por ejemplo, como en base 2 es 0 + 0 = 0, 1 + 0 = 1, pero 1 + 1 = 10, si
sumamos dos números de varias cifras a la manera tradicional, sólo hemos de tener la precaución de
“llevar 1” cuando sumemos 1 + 1. Supongamos que se trata de calcular m + n, donde m = 100110(2
y n = 11011(2 ; entonces
m + n = (1 · 25 + 0 · 24 + 0 · 23 + 1 · 22 + 1 · 21 + 0) + (1 · 24 + 1 · 23 + 0 · 22 + 1 · 21 + 1)
= (1 + 0) · 25 + (0 + 1) · 24 + (0 + 1) · 23 + (1 + 0) · 22 + (1 + 1) · 21 + (0 + 1)
= (1 + 0) · 25 + (0 + 1) · 24 + (0 + 1) · 23 + (1 + 0) · 22 + (1 + 1) · 21 + 1
= (1 + 0) · 25 + (0 + 1) · 24 + (0 + 1) · 23 + (1 + 0) · 22 + (1 · 2 + 0) · 21 + 1
= (1 + 0) · 25 + (0 + 1) · 24 + (0 + 1) · 23 + (1 + (1 + 0)) · 22 + 0 · 21 + 1
= (1 + 0) · 25 + (0 + 1) · 24 + (0 + 1) · 23 + (1 · 2 + 0) · 22 + 0 · 21 + 1
= (1 + 0) · 25 + (0 + 1) · 24 + (1 + (0 + 1)) · 23 + 0 · 22 + 0 · 21 + 1
= etc.,
que es lo que que realmente queremos indicar cuando escribimos, prescindiendo del subı́ndice (2 por
comodidad,
“llevo” : +1 +1 +1 +1 +1
m: 1 0 0 1 1 0
n: 1 1 0 1 1
m+n: 1 0 0 0 0 0 1
Análogamente se van adaptando las operaciones más complicadas.
Cambios de base
Establecida la existencia y unicidad de representación en cualquier base b ≥ 2, la cuestión que
se suscita inmediatamente es: ¿cómo pasar de la representación de un número n en una base b a
la representación en una nueva base β? Cuando entre b y β no haya ninguna relación ‘especial’, no
podemos apelar a más recursos que los que hemos señalado en el apartado anterior. Por ejemplo,
ya hemos visto cómo expresar el número decimal 1984 en base 2, y si nos dan un número binario
como 11010011(2 , su representación decimal serı́a
1 1 0 1 0 0 1 1
2) 2 6 12 26 52 104 210
1 3 6 13 26 52 105 211
Pero en circunstancias especiales puede haber simplificaciones. Esto sucede, en particular, si
una de las bases es una potencia de la otra, como es el caso cuando se considera b = 2 y β = 8 = 23 ,
o b = 2 y β = 16 = 24 . En la primera situación, como
n = c0 + c1 · 2 + c2 · 22 + c3 · 23 + c4 · 24 + c5 · 25 + c6 · 26 + c7 · 27 + c8 · 28 + c9 · 29 + · · ·
= (c0 + c1 · 2 + c2 · 22 ) + (c3 + c4 · 2 + c5 · 22 ) · 23 + (c6 + c7 · 2 + c8 · 22 ) · (23 )2 + · · · ,
con los cj = 0 o 1, es obvio que si n = d0 + d1 · 8 + d2 · 82 + · · · , con los dk enteros no negativos

< 8, por la unicidad de representación, necesariamente
d0 = c0 + c1 · 2 + c2 · 22 , d1 = c3 + c4 · 2 + c5 · 22 , d2 = c6 + c7 · 2 + c8 · 22 , ...
lo que nos lleva a la siguiente regla:

para cambiar la representación de un número en base 2 a base 8, se agrupan las ci-

fras binarias de tres en tres, de derecha a izquierda, y se sustituye cada grupo por su
expresión en base 8.
Por ejemplo:
1100100101010(2 → [1][100][100][101][010] → 14452(8 .
Y recı́procamente,
para cambiar la representación de un número en base 8 a base 2, cada dı́gito octal se

sustituye por las tres cifras binarias que lo representan en base 2 (incluyendo ceros a la
izquierda cuando sea preciso).
Por ejemplo,
537264(8 → [101][011][111][010][110][100] → 101011111010110100(2 .
Razonando análogamente, cuando b = 2, β = 16, se agrupan/sustituyen cifras en/por blo-

ques de cuatro. Facilita las cosas disponer de una tabla de ‘equivalencias en binario’ de las cifras
hexadecimales (D significa ‘decimal’, B ‘binario’, H ‘hexadecimal’):
D 0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15
B 0 1 10 11 100 101 110 111 1000 1001 1010 1011 1100 1101 1110 1111
H 0 1 2 3 4 5 6 7 8 9 A B C D E F
Recursos informáticos
Los programas de cálculo permiten, por lo general, obtener las cifras de cualquier representación
en una base dentro de tamaños ‘no disparatados’.
En maple , se dispone de la orden

convert(n,base,β);
donde n es un número decimal y β la nueva base, que da una lista con los dı́gitos de la representación
del número en base β. Por ejemplo, convert(17,base,3); da [2,2,1]. Otra opción es
convert(`,base,α,β);
donde ` es una lista de cifras en base α y β la nueva base, que devuelve una lista con los dı́gitos en
base β que representan el mismo número. Por ejemplo, convert([2,2,1],base,3,10); da [7,1].
En Mathematica , la orden
IntegerDigits[n,b]
da una lista de los dı́gitos en base b del número decimal n, mientras que
b^^n
donde n es la representación en base b de un número, da el valor decimal del número. Por ejemplo,
IntegerDigits[10!] da {3, 6, 2, 8, 8, 0, 0},
IntegerDigits[10!,2] da {1,1,0,1,1,1,0,1,0,1,1,1,1,1,0,0,0,0,0,0,0,0},
y 16^^16c91a3 da 23892387.
En la red es fácil encontrar applets de Java que realizan conversiones de base interactivamente.
P. ej., en la siguiente dirección puede pasarse ‘instantáneamente’ de base decimal a base binaria y
viceversa.
http://www.vincesplace.com/TraditionalCourses/cis121/assignments/BinaryNum/BinaryNum.htm
Ejercicios
8.1. Convertir a sistema decimal y binario los números hexadecimales ACABA y FE0.
8.2. En el sistema hexadecimal, ¿es cierto que B0B0 + A0A = BABA?
8.3. Sin pasar a representación decimal, ¿cómo efectuarı́as en base 2 las sumas 1011(2 + 11(2 y
101110(2 + 100011(2 ?
Para debatir. Puesto que 2 + 2 = 11 en base 3 y 2 + 2 = 10 en base 4, ¿habrá que cambiar la

frase hecha hh esto es tan cierto como que dos y dos son cuatroii a hh esto es tan cierto como que dos
y dos son cuatro . . . en base diezii? (Una buena discusión deberı́a empezar con la distinción entre
‘sı́mbolo’ o ‘representación’ y ‘cosa representada’.)
2.2.4. Máximo común divisor. Algoritmo de Euclides.

Definición 2.2.5. Sean a, b ∈ Z. Decimos que a divide a b, o que a es un divisor o un factor
de b, o que b es múltiplo de a, escrito a|b, si existe c ∈ Z tal que b = ac; expresado de otra forma,
si el resto de la división de b por a es 0. Diremos entonces que c es el cociente exacto b/a o el
cofactor de a.
Proposición 2.2.6. La divisibilidad tiene las siguientes propiedades: dados enteros arbitrarios a,
b, d, m, n,
(i) n|n (propiedad reflexiva)
(ii) d|n y n|m implica d|m (propiedad transitiva)
(iii) d|n y d|m implica d|(an + bm) (propiedad de linealidad)
(iv) d|n implica ad|an (propiedad de multiplicación)
(v) ad|an y a 6= 0 implica d|n (ley de cancelación)
(vi) 1|n, −1|n (1 y −1 dividen a cualquier entero)
(vii) m|n ⇐⇒ −m|n ⇐⇒ m| − n (y ası́ m|n ⇐⇒ |m|||n|)
(viii) n|0 (todo entero divide a 0)
(ix) 0|n implica n = 0 (0 sólo divide a 0)
(x) d|n y n 6= 0 implica |d| ≤ |n| (propiedad de comparación)
(xi) d|n y n|d implica |d| = |n| (antisimetrı́a ‘parcial’)
(xii) d|n y d 6= 0 implica (n/d)|n (n/d se llama también divisor conjugado de d)
Demostración. Probemos, por ejemplo, (x). Si d|n y n 6= 0, |n| = |d| · m para algún m ∈ Z; pero
necesariamente m ≥ 0 y m 6= 0, luego m ≥ 1 y |n| ≥ |d|.
Máximo común divisor

Si a, b, son números enteros no nulos, existe m = máx F , donde F = {k ∈ Z : k|a, k|b} (1 y −1 ∈ F ,
y k ∈ F =⇒ k ≤ mı́n{|a|, |b|}, y podemos aplicar el principio del máximo). Además, m ≥ 1 (1 ∈ F ),
luego m ∈ N; de hecho, m = máx{k ∈ N : k|a, k|b}. Esto justifica la siguiente definición.
Definición 2.2.7. Sean a, b, números enteros no nulos. Su máximo común divisor es el mayor
número, natural siempre, que divide a a y b simultáneamente. Lo denotaremos por mcd(a, b).
A veces se amplı́a la definición poniendo mcd(a, 0) = |a|, mcd(0, 0) = 0.
Para calcular el máximo común divisor de dos números no hace falta más herramienta que la
división entera, como justifican los siguientes resultados.
Lema 2.2.8. Si a, b, son números enteros no nulos tales que a = cb + r, se tiene que mcd(a, b) =
mcd(b, r).
Demostración. Si k es un divisor común de a y b, como r = a − cb, por la propiedad (iii) de

linealidad k es un divisor de r, y por tanto todo divisor común de a y b es un divisor común de b
y r.
Recı́procamente, si k 0 es un divisor común de b y r, como a = cb + r, nuevamente por la
propiedad (iii) de linealidad k 0 es un divisor de a, y por tanto todo divisor común de b y r es un
divisor común de a y b.
En consecuencia, el conjunto de divisores comunes a a y b es el mismo que el de divisores
comunes a b y r. Aplicando la definición, mcd(a, b) = mcd(b, r), como querı́amos probar.
Lema 2.2.9. Si a, b, son números enteros no nulos tales que b | a, entonces mcd(a, b) = |b|.
Demostración. Ciertamente |b| es un divisor común de b y a en estas circunstancias; y si k es un

entero positivo que divide a b, k ≤ |b| según hemos señalado anteriormente, luego mcd(a, b) = |b|.
Supongamos ahora que tratamos de calcular el máximo común divisor de dos números de buen
tamaño, 1769 y 551 por ejemplo. Haciendo la división entera, 1769 = 3×551+116, y según el primer
lema, d = mcd(1769, 551) = mcd(551, 116). A su vez, 551 = 4 × 116 + 87, luego d = mcd(116, 87).
Pero 116 = 87 + 29 y 87 = 3 × 29, con lo que finalmente d = mcd(87, 29) = 29 (segundo lema).
¿Hemos tenido suerte? Si reflexionamos un momento sobre el proceso seguido, vemos que puede
aplicarse a enteros positivos arbitrarios a y b: pues tomando como a el mayor y b el menor (si son
iguales no necesitamos hacer cuentas), al efectuar la división entera de a por b obtenemos un resto
no negativo r1 estrictamente menor que b; si r1 = 0, ya tenemos el máximo común divisor de a
y b (= b, segundo lema); si no, d = mcd(a, b) = mcd(b, r1 ), con la ventaja de que hemos pasado a
números más pequeños, y dividiendo b por r1 pasarı́amos a d = mcd(a, b) = mcd(r1 , r2 ), donde r2
es el resto de la división de b por r1 , estrictamente menor que r1 . Reiterando, puesto que en el
peor de los casos irá disminuyendo al menos en 1 el valor de los restos, al cabo de un número finito
de pasos hemos de llegar a resto 0, y podemos aplicar el segundo lema para concluir que el divisor
actual (resto del paso anterior) es el máximo común divisor.
Formalizando este proceso, conocido ya por Euclides, tenemos (ver [C-C-S]):
Definición 2.2.10. Algoritmo de Euclides.
• Input: dos enteros positivos a y b.
• Output: el máximo común divisor de a y b.
Paso 1: Reemplazar (simultáneamente)

a por b, y
b por el resto de la división de a por b.
Paso 2: Repetir el Paso 1 hasta que b sea 0.
Paso 3: Devolver a.
Podemos esquematizarlo de la siguiente manera:
restos & r1 r2 r3 ······ rn−1 0

dividendos ← divisores a b r1 r2 ······ rn−2 rn−1 = d
cocientes c1 c2 c3 ······ cn−1 cn
y entonces d = mcd(a, b) como hemos probado anteriormente.

Proposición 2.2.11. Algoritmo de Euclides. Dados dos números enteros positivos a y b con
a > b, obtenemos su máximo común divisor d = mcd(a, b) procediendo por divisiones enteras
sucesivas, como se ha indicado anteriormente, hasta obtener resto nulo. El máximo común divisor
de a y b es entonces el último resto no nulo.
La hipótesis de que a y b sean enteros positivos no supone ninguna restricción esencial, dado
que mcd(a, b) = mcd(|a|, |b|). Por tanto, el algoritmo de Euclides basta para poder calcular el
máximo común divisor de dos enteros no nulos arbitrarios. Hay además una información importante
contenida en él, que merece la pena destacar como se verá en aplicaciones posteriores: el máximo
común divisor de a y b es una “combinación lineal de a y b con coeficientes enteros”.
Proposición 2.2.12. Identidad de Bézout. Sean a y b enteros no nulos, y d = mcd(a, b).
Entonces existen enteros u, v tales que
d = ua + vb.
Demostración. Supongamos primero que a y b son positivos, y apliquémosles el algoritmo de Eu-

clides, de modo que con la notación previa
r1 = a − c1 b, r2 = b − c2 r1 , rk = rk−2 − ck rk−1 (3 ≤ k < n),
siendo precisamente d = rn−1 . Por tanto
d = rn−1 = rn−3 − cn−1 rn−2 = sn−1 rn−3 + tn−1 rn−2 = sn−1 rn−3 + tn−1 (rn−4 − cn−2 rn−3 )
= sn−2 rn−4 + tn−2 rn−3 = · · · = sk rk−2 + tk rk−1 = · · · = s1 a + t1 b,
donde todos los sk , tk son enteros. Por tanto, u = s1 , v = t1 cumplen la tesis.

Si a o b son negativos, recordemos que también d = mcd(|a|, |b|), y si p. ej. a < 0, b > 0, sabiendo
que d = u|a| + v|b|, será igualmente d = (−u)(−a) + vb. De la misma forma pueden resolverse los
casos restantes.
Nota. Los coeficientes u y v no son únicos: obsérvese, por ejemplo, que
d = ua + vb = (u + nb)a + (v − na)b
cualquiera que sea n ∈ Z.

Una variante de la demostración anterior, más farragosa, permite fabricar un algoritmo para el
cálculo de unos valores de u, v. Manteniendo la notación para los cocientes y restos, y comenzando
por el principio,
a = 1 · a + 0 · b = u0 a + v0 b, b = 0 · a + 1 · b = u1 a + v1 b, r1 = 1 · a − c1 b = u2 a + v2 b,
r2 = −c2 a + (1 + c1 c2 )b = u3 a + v3 b,
y, en general, si rk = uk+1 a + vk+1 b, rk+1 = uk+2 a + vk+2 b, también
rk+2 = rk − ck+2 rk+1 = (uk+1 − ck+2 uk+2 )a + (vk+1 − ck+2 vk+2 )b = uk+3 a + vk+3 b
si ponemos uk+3 = uk+1 − ck+2 uk+2 , vk+3 = vk+1 − ck+2 vk+2 .

Para que intervengan sólo dos ı́ndices consecutivos, introducimos xk = uk+1 , yk = vk+1 , con lo
que queda
xk+2 = uk+1 − ck+2 xk+1 , yk+2 = vk+1 − ck+2 yk+1 ,
y finalmente
d = rn−1 = xn−1 a + yn−1 b = un a + vn b.
Ordenando el proceso anterior se obtiene el siguiente algoritmo:
Definición 2.2.13. Algoritmo de Euclides extendido (Euclides-Bézout).
• Input: dos enteros positivos a y b.
• Output: dos enteros u y v tales que mcd(a, b) = ua + vb.
Paso 1: Hacer u = y = 1 y v = x = 0.
Paso 2: Determinar c y r tales que a = cb + r y 0 ≤ r < b.
Reemplazar
a por b, y b por r,
u por x y v por y,
x por u − cx e y por v − cy.
Paso 4: Devolver u y v.
Visualizado en forma de tabla:
restos & r1 r2 r3 ······ rn−1 0

cocientes c c1 c2 c3 ······ cn−1 cn
uk+1 =xk 1 0 1 ··· ······ un−1 u
vk+1 =yk 0 1 −c1 ··· ······ vn−1 v
xk+1 =uk −ck+1 xk 0 1 −c2 ··· ······ xn−1 = u
yk+1 =vk −ck+1 yk 1 −c1 1 + c1 c2 ··· ······ yn−1 =v
Ejemplo. Apliquemos este algoritmo a los números considerados anteriormente, a = 1769, b = 551,
para los que ya hemos visto que mcd(a, b) = 29 (volveremos a obtenerlo).
restos & 116 87 29 0

dividendos ← divisores 1769 551 116 87 29
cocientes c 3 4 1 3
uk+1 =xk 1 0 1 −4 5
vk+1 =yk 0 1 −3 13 -16
xk+1 =uk −ck+1 xk 0 1 −4 5 —
yk+1 =vk −ck+1 yk 1 −3 13 -16 —
Efectivamente, 29 = 5 · 1769 − 16 · 551.

El recı́proco de la proposición 3.2.15 no es cierto en general: por ejemplo, 441 − 18 · 24 = 9,
mientras que mcd(441, 24) = 3. Sin embargo, lo es en una situación especial.
Definición 2.2.14. Dos números enteros no nulos a y b se dicen relativamente primos o

primos entre sı́ si no tienen más divisores comunes que 1 y −1, es decir, si mcd(a, b) = 1.
Corolario 2.2.15. Dos números enteros no nulos a y b son relativamente primos si y sólo si
existen dos números enteros u y v tales que ua + vb = 1.
Demostración. Si a y b son relativamente primos, la igualdad del enunciado es un caso particular

de la identidad de Bézout.
Supongamos ahora que tenemos enteros u y v para los que se verifica ua + vb = 1. Si k es un
divisor común de a y b, por linealidad k es un divisor de 1 y por tanto |k| = 1 y mcd(a, b) = 1.
Ejemplo. Puesto que para todo entero positivo k es
−3(5k + 3) + 5(3k + 2) = 1,
se sigue que 5k + 3 y 3k + 2 son relativamente primos.

Ejercicio. Dados dos números enteros no nulos a y b relativamente primos, probar que el máximo
común divisor de a + b y a − b es 1 o 2.
Respuesta. Existen u, v ∈ Z tales que ua + vb = 1. Si k es un divisor común de a + b y a − b, por
linealidad k divide a (a + b) + (a − b) = 2a y a (a + b) − (a − b) = 2b; nuevamente por linealidad,
dividirá a 2au + 2bv = 2. Por tanto |k| = 1 o |k| = 2, de donde se sigue que mcd(a + b, a − b) = 1 o
mcd(a + b, a − b) = 2.
Ecuaciones diofánticas lineales

Una aplicación importante de la identidad de Bézout es el estudio de las soluciones de las ecuaciones
(lineales) diofánticas, es decir, ecuaciones en las que se buscan solamente soluciones enteras, que
aparecen en contextos más serios pero también en acertijos como el siguiente:
hh ¿Puede llenarse exactamente un depósito de agua de 56 l. transportándola con un cubo de 6 l.
y otro de 9 l.? ¿Y un depósito de 57 l.? En caso afirmativo, ¿cuál es el número mı́nimo de viajes
que hay que realizar con los cubos para llenar el depósito? ii
Planteamiento: ¿6x + 9y = 56 tiene soluciones x, y ∈ N0 ? ¿6x + 9y = 57 tiene soluciones x,
y ∈ N0 ? ¿cuáles?
Para responder en general, comenzamos por un lema.
Lema 2.2.16. Sean a, b, d, m, p, q números enteros, ab 6= 0.
(i) si d = mcd(a, b), a = pd, b = qd, entonces mcd(p, q) = 1 (es decir, p y q son relativamente
primos).
(ii) si mcd(p, q) = 1 y p | qm, entonces p | m.
Demostración.
(i) Existen u, v ∈ Z tales que ua + vb = d, luego d(up + vq) = d; cancelando d se deduce que
up + vq = 1, y por tanto que mcd(p, q) = 1.
(ii) Existen u, v ∈ Z tales que up + vq = 1, con lo cual upm + vqm = m. A su vez, existe n ∈ Z
tal que pn = qm. Sustituyendo qm por pn y sacando factor común p resulta p(um + vn) = m, es
decir, p divide a m como querı́amos demostrar.
Corolario 2.2.17 (Resolubilidad de ecuaciones diofánticas). Sean a 6= 0, b 6= 0, c, tres

números enteros y d = mcd(a, b). La ecuación
ax + by = c
tiene soluciones enteras si y sólo si d|c.
Demostración. Sea ax + by = c para ciertos enteros x, y. Como d|a y d|b, por la propiedad (iii) de
linealidad, d|c.
Recı́procamente, supongamos que d|c, es decir, c = kd para algún k ∈ Z. Puesto que existen
enteros u, v, para los que d = ua + vb, multiplicando por k obtenemos c = kd = kua + kvb, es decir,
x = ku, y = kv nos da una solución de la ecuación propuesta.
Nótese que la segunda parte de la demostración nos proporciona una solución concreta mediante
la identidad de Bézout. ¿Habrá otras? Vamos a comprobar que o bien no existe solución o bien hay
infinitas, que se pueden construir a partir de una cualquiera de ellas.
Proposición 2.2.18. Sean a 6= 0, b 6= 0, c, tres números enteros; si el par (x0 , y0 ) ∈ Z × Z

constituye una solución particular de la ecuación diofántica ax + by = c, todas las soluciones
enteras de esta ecuación son de la forma
x = x0 + (b/d)n, y = y0 − (a/d)n, n ∈ Z,
donde d = mcd(a, b).
Demostración. Pongamos p = a/d, q = b/d.

Si ax0 + by0 = c, los x, y del enunciado son soluciones de la ecuación, es decir, si x = x0 + qn e
y = y0 − pn para algún entero n,
ax + by = a(x0 + qn) + b(y0 − pn) = (ax0 + by0 ) + aqn − bpn = c + (pd)qn − (qd)pn = c.
Recı́procamente, si x, y son soluciones enteras de la ecuación, son de la forma especificada en

el enunciado. En efecto: de
ax0 + by0 = c, ax + by = c, se sigue a(x − x0 ) + b(y − y0 ) = 0;
por tanto, dividiendo por d = mcd(a, b), podemos reescribir la última igualdad como
p(x − x0 ) = q(y0 − y). [∗]
Ası́, p divide a q(y0 − y). Pero, aplicando las dos partes del lema, mcd(p, q) = 1 y en consecuencia
p divide a y0 − y. Existe, pues, un n ∈ Z tal que y0 − y = pn, es decir, y = y0 − pn. Sustituyendo
este valor de y en la ecuación [∗], resulta finalmente x = x0 + qn, como querı́amos probar.
Ejemplo. De las ecuaciones que habı́amos dejado planteadas, 6x + 9y = 56 no tendrá solución y

6x + 9y = 57 sı́, puesto que mcd(6, 9) = 3. Como 57 = 19 · 3, 9 = 6 + 3, (−1)6 + 9 = 3, se sigue que
(−19)6 + 19 · 9 = 57, lo que da como únicas soluciones con coeficientes positivos
n 7 8 9
x = −19 + 3n 2 5 8
y = 19 − 2n 5 3 1
La primera combinación es la que requiere menor número de viajes.

Nota. Sistematizando el proceso desarrollado en las páginas anteriores, obtenemos (v. [C-C-S], pp.
5–6) el siguiente
Algoritmo de resolución de ecuaciones diofánticas lineales
• Input: enteros a, b, c, con a y b no ambos nulos.
• Output: todas las soluciones enteras x, y de la ecuación xa + yb = c.
Paso 1: Encontrar, usando el algoritmo de Euclides extendido, enteros u, v tales que

d := mcd(a, b) = ua + vb.
Paso 2: Si d no divide a c, devolver ‘NO HAY SOLUCIONES DE LA ECUACIÓN’.
Paso 3: Si d divide a c, devolver entonces x = (uc − nb)/d y y = (vc + na)/d, con n ∈ Z.
Mı́nimo común múltiplo
Emparejado con el concepto de máximo común divisor suele ir el de mı́nimo común múltiplo.
Dados a, b ∈ Z \ {0}, siempre hay enteros positivos que son múltiplos simultáneamente de a y b:
por ejemplo, |ab|. El conjunto F = {z ∈ N : a|z, b|z} es, pues, no vacı́o; por el principio de buena
ordenación, existe m = mı́n F , por lo que podemos enunciar la definición siguiente.
Definición 2.2.19. Sean a, b, números enteros no nulos. Su mı́nimo común múltiplo es el

menor número entero positivo que es múltiplo de a y b simultáneamente. Se escribe mcm(a, b).
(Si ab = 0, se pone a veces mcm(a, b) = 0.)
Si ab 6= 0 y a < 0 o b < 0, podemos reducir el cálculo de su mı́nimo común múltiplo al de los

números positivos |a|, |b|; y cuando a y b son positivos, podemos hallar su mı́nimo común múltiplo
conociendo el máximo común divisor, gracias a:
Proposición 2.2.20. Sean a, b, números enteros positivos. Entonces
mcm(a, b) · mcd(a, b) = ab.
Demostración. Sea d = mcd(a, b), a = pd, b = qd, con lo cual mcd(p, q) = 1.

Si n = p0 a = q 0 b es cualquier múltiplo (positivo) común de a y b, será n = p0 pd = q 0 qd, de donde
p0 p = q 0 q, luego p|q 0 q siendo p y q relativamente primos, y en consecuencia p|q 0 . Entonces q 0 = cp
para algún c y sustituyendo, n = cpb = c(ab/d), con lo que (ab/d) ≤ n.
Como (ab/d) = pb = qa es un múltiplo común de a y b, se sigue que mcm(a, b) = (ab/d).
1769 × 551
Ejemplo. mcm(1769, 551) = = 61 × 551 = 33611.
29
Cálculos con maple y Mathematica
Finalizamos este apartado indicando una serie de recursos de maple y Mathematica que
generalmente sustituyen con ventaja el cálculo ‘a mano’ de los objetos encontrados a lo largo del
mismo. Esto hace innecesario insistir en los ejercicios que se reducen a un mero cálculo, pero todo
matemático debe estar en condiciones de resolverlos incluso cuando falla el suministro eléctrico,
por lo que recomendamos ejercitarse manualmente (sin exagerar) en los algoritmos que hemos ido
exponiendo, y utilizar el ordenador para comprobar los resultados.
La explicación detallada del funcionamiento de las órdenes aquı́ recogidas se encuentra en los
manuales o en la ayuda de los propios programas.
• maple (a, b, c,. . . datos)
entrada salida comentario

igcd(a,b,...); mcd(a, b, . . . )
ilcm(a,b,...); mcm(a, b, . . . )
mcd(a, b)
igcdex(a,b,’s’,’t’);s;t; s mcd(a, b) = sa + tb
t
(x0 , y0 ) solución particular,
b0 = b/d, a0 = a/d,
isolve(a*x+b*y=c,x,y); {x = x0 − b0 Z1, y = y0 + a0 Z1}
(d = mcd(a, b)),
Z1 entero arbitrario
• Mathematica (a, b, c,. . . datos)
entrada salida comentario

GCD[a,b,...] mcd(a, b, . . . )
LCM[a,b,...] mcm(a, b, . . . )
{g,{r,s}}=ExtendedGCD[n=a,m=b,...] g, r, s g = mcd(a, b) = ra + sb
Solve[a*x==c && Modulus==b,x] (ver ejemplo) algunos x soluciones de ax + by = c
Solve[b*y==c && Modulus==a,y] (ver ejemplo) algunos y soluciones de ax + by = c
Ejemplos.
(1) Identidad de Bézout con maple :
igcdex(1027,712,’s’,’t’);s;t;
1
-165
238
(2) Identidad de Bézout con Mathematica :
In[1]:= {g, {r, s}} = ExtendedGCD[n = 1027, m = 712]
Out[1]= {1, {-165, 238}}
(3) Ecuaciones diofánticas lineales con maple :
isolve(8*x+12*y=20);
{x = 1 - 3 _Z1, y = 1 + 2 _Z1}
(4) Ecuaciones diofánticas lineales con Mathematica :
In[1]:=
Solve[8 x == 20 && Modulus == 12, x ]
Out[1]=
{{Modulus -> 12, x -> 1}, {Modulus -> 12, x -> 4},
{Modulus -> 12, x -> 7}, {Modulus -> 12, x -> 10}}
In[2]:=
Solve[12 y == 20 && Modulus == 8, y ]
Out[2]=
{{Modulus -> 8, y -> 1}, {Modulus -> 8, y -> 3},
{Modulus -> 8, y -> 5}, {Modulus -> 8, y -> 7}}
Ejercicios
9.1. Probar que c|a, c|b =⇒ c| mcd(a, b); a|c, b|c =⇒ mcm(a, b)|c.
(N.B. Estas propiedades no están incluidas en las definiciones: hablamos en ellas de máximo y
mı́nimo para la relación de orden, y lo que se pide aquı́ es probar que son igualmente máximo y
mı́nimo para la relación de divisibilidad en N)
9.2. Calcular d = mcd(1320, 714) y escribir d = 1320x + 714y con x, y ∈ Z.
9.3. Calcular mcd(a, b) y encontrar todas las soluciones de ax + by = mcd(a, b) en los siguientes
casos:
(1) a = 63, b = 49; (2) a = 619, b = 93; (3) a = 521, b = 2187.
9.4. Hallar todas las soluciones enteras de las ecuaciones
(1) 2x + 3y = 7; (2) 21x − 35y = −14.
9.5. Definir el máximo común divisor y el mı́nimo común múltipo de tres números, mcd(a, b, c) y
mcm(a, b, c). Hallar mcd(1485, 71148, 7882875), mcm(1485, 71148, 7882875).
9.6. Calcular d = mcd(60, 126, 44) y encontrar enteros x, y, z que verifiquen d = 60x + 126y + 44z.
9.7. Para cada entero positivo n, calcular mcd(n, n + 1) y mcd(n, n + 2).
9.8. Demostrar que 3m + 11 y 2m + 7 son relativamente primos cualquiera que sea m ∈ N.
9.9. Sean a y b dos enteros positivos. Probar que si m = mcm(a, b), entonces mcd(m/a, m/b) = 1.
9.10. Dados a, b ∈ N, si d = mcd(a, b), probar que
{ax + by : x, y ∈ Z} = {dz : z ∈ Z}.
(Este último conjunto suele denotarse por dZ y el primero por aZ + bZ, con lo que la igualdad
anterior queda aZ + bZ = dZ.)
9.11. Si a, b son enteros relativamente primos, ¿quién es mcm(a, b)? ¿Por qué?
9.12. Si a, b son enteros relativamente primos y c es un entero tal que a|c y b|c, probar que ab|c.
¿Qué sucede si a, b no son relativamente primos? ¿por qué?
9.13. Una persona desea comprar 430 dólares en cheques de viaje. Estos solamente existen en
cheques de 20 y 50 dólares. ¿Cuántos cheques de cada cantidad deberá adquirir?
9.14. ¿De cuántas formas posibles se pueden tener 325 pesetas repartidas en monedas de 10 y de
25 pesetas?
9.15. Un tren sale de Parı́s a Niza cada 7 horas, a una hora en punto. Probar que algunos dı́as es
posible tomar este tren a las 9 de la mañana.
Siempre que hay un tren a las 9 de la mañana, Pierre lo coge para ir a visitar a su tı́a Marie.
¿Cada cuánto tiempo ve Marie a su sobrino?
Discutir el mismo problema con el tren a Burdeos, que sale de Parı́s cada 14 horas.
9.16. Demostrar que un cajero automático cargado de billetes de veinte y de cincuenta euros puede
dispensar cualquier cantidad de euros múltiplo de 10 que sea superior o igual a 40 euros.
Sugerencia: puede probarse por inducción, teniendo en cuenta que 2(−2) + 5 = 1 = 2 · 3 − 5.
9.17. El problema de los cocos. Cinco marineros suspicaces emplean el dı́a en recoger un montón
de cocos. Agotados, posponen el reparto del montón hasta la mañana siguiente. Desconfiados, cada
uno decide coger su parte durante la noche. El primer marinero divide el montón en cinco partes
iguales más un coco extra, que da a un mono. Coge un montón y deja el resto en un único montón.
Más tarde, el segundo marinero hace lo mismo; y, de nuevo, el mono recibe un coco sobrante. El
tercero, cuarto y quinto marineros también lo hacen; todas las veces queda un coco, que recibe
el mono. Por la mañana, dividen los cocos restantes en cinco montones iguales, y cada marinero
recibe su “parte”. (Cada marinero sabe que faltan algunos, pero nadie protesta, porque ¡todos son
culpables!) ¿Cuál es el menor número posible de cocos en el montón original?
(Este problema apareció en el Saturday Evening Post el 9 de octubre de 1926.)
Y para (que disfruten) los más atrevidos:

9.18. Consideremos la sucesión de Fibonacci, definida por recurrencia mediante las fórmulas
φ0 = 0, φ1 = 1, φn = φn−1 + φn−2 , n ≥ 2.
Probar que:
(i) mcd(φn , φn+1 ) = 1 para todo n ≥ 1;
(ii) φn+m = φn−1 φm + φn φm+1 para todo n ≥ 1, m ≥ 0;
(iii) si r > 0, φn |φnr para todo n ≥ 1;
(iv) si mcd(m, n) = d, entonces mcd(φm , φn ) = φd .
9.19. Sea mcd(a, b) = 1. Probar que mcd(a + b, a2 − ab + b2 ) es 1 o 3.

9.20. Considérese una diana para dardos con dos regiones, una que vale a puntos y la otra b puntos,
donde a y b son enteros positivos sin factores comunes. ¿Cuál es la mayor puntuación total que no
puede obtenerse lanzando dardos a la diana?
9.21. Sean a, b enteros positivos primos entre sı́. Pobar que cualquier entero c ≥ (a − 1)(b − 1)
tiene la forma ax + by, donde x e y son enteros no negativos. Probar que el entero ab − a − b no
tiene esta forma.
(Teorema de Sylvester, v. [D’A-W] pp. 98 y ss.)
2.2.5. Números primos y factorización. Teorema fundamental de la Aritmética.

Definición 2.2.21. Un número entero positivo p distinto de 1 se dice primo si no tiene más
divisores positivos que él mismo y la unidad; en caso contrario diremos que es compuesto .
Dicho de otra forma, p es primo si p ∈ N \ {1} y a ∈ N, a|p, implica a = 1 o a = p.
Que un número n sea compuesto significa, según la definición, que admite al menos un divisor
positivo a tal que 1 < a < n.
Lema 2.2.22. Para todo entero n ≥ 2 existe un número primo p tal que p|n.
(Se dice entonces que p es un factor primo de n.)
Demostración. Ya lo probamos por inducción. Veamos cómo podrı́a formularse la demostración
con otra apariencia.
Si n es primo, basta tomar p = n. Si no lo es, admite un divisor positivo a1 tal que 1 < a1 < n.
Si a1 es primo, basta tomar p = a1 . Si no lo es, admite un divisor positivo a2 tal que 1 < a2 < a1 ,
que a su vez será divisor de n. Si a2 es primo, basta tomar p = a2 . Si no lo es, podemos continuar
el proceso: pero como cada vez vamos obteniendo divisores ak tales que 1 < ak < ak−1 , es decir,
cada uno estrictamente menor que el anterior, al cabo de un número finito de pasos encontraremos
un divisor primo (= 2, en el peor de los casos).
Teorema 2.2.23 (Euclides). El conjunto de los números primos es infinito.

Demostración. Supongamos, por el contrario, que fuese finito, y que p1 , p2 , . . . , pn fuesen todos
los diferentes números primos (n ∈ N). El número
N = p1 p2 · · · pn + 1
no figura en esa lista, pues es estrictamente mayor que cada uno de sus elementos (¿por qué?), y
tendrı́a que ser divisible por alguno de ellos según el lema anterior. Pero
N = pk (p1 p2 · · · pk−1 pk+1 · · · pn ) + 1

da resto 1 al dividirlo por cada pk , y no resto 0, luego N no tendrı́a factores primos, contradicción.
Un procedimiento cásico para hallar los número primos menores o iguales que un entero positivo
n es la criba de Eratóstenes, que consiste en ir suprimiendo de la lista de los n primeros números
naturales los que son múltiplos de 2, luego los que son múltiplos de 3, de 5, etc. (v. [D-H], p. 34.)
Lo presentamos aquı́ en forma de algoritmo.
Definición 2.2.24. Algoritmo: La criba de Eratóstenes.
• Input: un entero positivo n.
• Output: la lista de primos menores o iguales que n.
Paso 1: Construir la lista L := [2, . . . , n] y la lista vacı́a M .

Paso 2: Sea m el menor elemento de L.
Añadir m a M .
Suprimir de L todos los múltiplos de m.
Paso 3: Repetir el Paso 2 hasta que L esté vacı́a.
Paso 4: Devolver M .
En Internet abundan los applets de Java que ejecutan este proceso interactivamente. Por ejem-
plo, ver estas direcciones:
http://www.win.tue.nl/~ida/demo/c1s4ja.html
http://www.faust.fr.bw.schule.de/mhb/eratosiv.htm
http://www.shodor.org/succeedhi/succeedhi/sieve/model.html
Lema 2.2.25. Sean a y b números enteros no nulos y p un número primo tal que p|ab. Entonces
p|a o p|b.
Demostración. Puesto que p es primo, no tiene más divisores positivos que 1 y p. Por tanto, si
p 6 |a, mcd(p, a) = 1. Podemos entonces aplicar la parte (ii) del lema 2.2.16 para concluir que p|b.
Teorema 2.2.26 (Teorema fundamental de la aritmética). Todo número entero positivo

distinto de 1 puede descomponerse como producto de factores primos de manera única, salvo el
orden de dichos factores.
Demostración. Comencemos probando la existencia de la factorización. (Una presentación alterna-

tiva se encuentra en [D-H], p. 35.)
Notemos que si p es primo, admite la factorización trivial p = p. Sea Pn el enunciado
hh n ≥ 2 y los números enteros desde 2 hasta n admiten una descomposición en factores primos ii.
Puesto que 2 es primo, P2 es cierta. Supongamos ahora que es cierta para un n ≥ 2. Si n + 1 es

primo, Pn+1 es cierta; si no lo es, podremos descomponerlo en n + 1 = n1 n2 con 1 < n1 < n + 1,
1 < n2 < n+1. Pero entonces 2 ≤ n1 ≤ n, 2 ≤ n2 ≤ n, y por la hipótesis de inducción n1 = p1 · · · pj ,
n2 = pj+1 · · · pk , con p1 ,. . . , pj , pj+1 , . . . , pk primos. Por tanto
n + 1 = p1 · · · pj pj+1 · · · pk
es una factorización de n + 1 como producto de primos, es decir, Pn+1 es cierta.

Pasemos a probar la unicidad. (También podrı́a hacerse por inducción). Supongamos que
n = p 1 p 2 · · · pj = q 1 q 2 · · · q k
son dos descomposiciones de n en factores primos. Entonces p1 |q1 (q2 · · · qk ) luego por el lema previo,
p1 |q1 o p1 |(q2 · · · qk ): en el primer caso, como p1 y q1 son primos, necesariamente p1 = q1 ; en
el segundo caso p1 |q2 o p1 |(q3 · · · qk ). Repitiendo el argumento anterior, en k pasos a lo sumo
encontraremos un factor qk1 igual a p1 . Lo mismo podemos hacer con p2 , . . . , pk , que nos llevarán
a factores qk2 = p2 , . . . , qkj = pj . Si no hubiésemos obtenido ası́ todos los factores de la segunda
descomposición, podrı́amos cancelar los factores comunes y quedarı́a
1 = q10 · · · q`0 ,
lo que es imposible. Por tanto, las dos factorizaciones coinciden, salvo quizá en el orden.
El lector habrá obtenido ya anteriormente factorizaciones de numerosos ejemplos, por lo que

no insistimos en este punto. Además, nada nuevo podemos añadir a lo que ya conoce: no hay
un algoritmo general para factorizar números que sea realmente efectivo, por lo que seguiremos
recurriendo a la división por los primeros primos 2, 3, 5, etc., aliviada ligeramente si se aplican
criterios de divisibilidad (hablaremos de ellos más adelante).
Dejamos como ejercicio la comprobación de que la descomposición en factores primos permite
obtener el máximo común divisor y el mı́nimo común múltiplo de la forma ya sabida.
Ejercicio. Sean a = pr11 · · · prkk , b = ps11 · · · pskk las descomposiciones en factores primos distintos de
a y b, “arregladas” para que aparezcan los mismos factores tomando, si es necesario, exponentes
nulos. Pongamos mj = mı́n{rj , sj }, Mj = máx{rj , sj }. Demostrar que
mk Mk
mcd(a, b) = pm
1 · · · pk ,
1
mcm(a, b) = pM
1 · · · pk ,
1
es decir, el máximo común divisor de a y b se obtiene hh multiplicando los factores primos comunes
elevados al menor exponenteii, y el mı́nimo común múltiplo de a y b se obtiene hh multiplicando los
factores primos comunes y no comunes elevados al mayor exponenteii.
Factorización con ordenador

Existen diferentes algoritmos para hallar los factores primos de un número. Si el número no
es demasiado grande, se usa la “búsqueda directa”, haciendo sucesivamente la división por los
primeros números primos, como lo hacemos sin ordenador.
Para números más grandes, hay distintos algoritmos (ninguno de carácter ‘general’) que aprove-
chan las caracterı́sticas especiales del número que se intenta factorizar, usando Teorı́a de Números
avanzada. Hay más información en [5].
En maple se obtienen los factores primos de un número con las órdenes ifactor e ifactors,
y en Mathematica , con FactorInteger o con FactorIntegerECM (requiere cargar el paquete
‘FactorIntegerECM‘). Su sintaxis precisa y las diferentes opciones disponibles pueden consultarse en
los manuales o en la ayuda de los programas.
Como cabe suponer, también en este punto abundan en Internet applets de Java que realizan
la factorización. Por ejemplo, en español, el ‘alpertron’ del argentino Darı́o Alpern [4], descrito ası́:
hh Applet capaz de encontrar factores de 20 ó 30 dı́gitos de números o expresiones numéricas de

hasta 1000 dı́gitos. Calcula además la cantidad y suma de los divisores, el indicador de Euler
y la función Moebius del número y su descomposición como suma de hasta cuatro cuadrados
perfectos. ii
Lectura: Conjetura de Goldbach.

Uno de los aspectos más fascinantes de la Teorı́a de Números —enteros— es que abunda en
problemas sencillos de enunciar que, sin embargo, son tremendamente difı́ciles de resolver, hasta
el punto de que algunos de ellos llevan planteados varios siglos y aún no han sido resueltos. Por
ejemplo, Christian Goldbach (1690–1764) envió en 1742 una carta a su amigo Euler, en la que, tras
comprobar unos pocos casos particulares, afirmaba:
todo número natural par distinto de 2 es suma de dos números primos.
Todavı́a no se sabe si esta afirmación es cierta o falsa. Una excelente novela de Apostolos
Doxiadis, El tı́o Petros y la conjetura deGoldbach, refleja (entre otras cosas) los esfuerzos para
probarla. Y, para animar a quien tenga buenas ideas sobre esta cuestión, las editoriales de la novela,
Bloomsbury Publishing Company (Estados Unidos) y Faber and Faber Limited (Gran Bretaña),
ofrecı́an un premio de un millón de dólares a quien obtuviese una solución antes de marzo de 2002.
Creo que la oferta no ha sido renovada.
Lectura: Conjetura de Fermat/Teorema de Wiles.

Quizá el problema más famoso en este terreno es el llamado “último teorema de Fermat”. Pierre
de Fermat, contemporáneo de Descartes y tan buen o mejor matemático que él, estudiaba hacia
1637 un ejemplar de la edición de G. C. Bachet de la Arithmetica de Diofanto, y tenı́a por costumbre
incluir comentarios propios en el margen del libro. En una página escribió:
Descomponer un cubo en suma de otros dos cubos, una cuarta potencia, o en general cualquier
potencia en suma de dos potencias del mismo orden mientras sea mayor al segundo, es imposible,
y ciertamente he encontrado una demostración magnı́fica de esto, pero el margen es demasiado
estrecho para contenerla.
¿Era un farol? Algunas otras de sus afirmaciones contenı́an las ideas de las demostraciones,
todas ellas de gran originalidad. Lo cierto es que sólo pudieron darse respuestas parciales para
valores particulares del exponente (hay abundantes referencias sobre ellas: una reciente, el capı́tulo
5 de [Casti]). En junio de 1993, el matemático inglés Andrew Wiles presentó en una conferencia
en Cambridge la demostración de un resultado —la conjetura de Shimura-Taniyama-Weil— que
implicarı́a que la afirmación de Fermat era cierta. La comunidad matemática vivió una etapa de
‘suspense’ cuando se descubrió un fallo que Wiles no pudo solucionar hasta 1994, publicando junto
con Richard Taylor en 1995 un artı́culo de más de 130 páginas, que parece haber vencido finalmente
todas las dificultades.
El teorema de Fermat también ha sido fuente de inspiración literaria: una novela de Denis
Guedj, El teorema del loro, da un repaso a la historia de las matemáticas mientras desarrolla una
intriga montada alrededor del loro de un hipotético ‘demostrador’ del teorema.
Ejercicios
10.1. Demostrar que si n ≥ 2 y n no es primo, entonces debe existir un primo p tal que p|n y
p2 ≤ n. ¿Qué interés tiene este resultado en relación con la criba de Eratóstenes?
10.2. Demostrar que todo número primo mayor que 3 es de la forma 6n + 1 o 6n + 5.
10.3. Demostrar que un entero de la forma 4n + 3 admite un divisor primo de esa forma y deducir
que existen infinitos números primos de la forma 4n + 3.
10.4. Probar que cualquier número primo p 6= 3 es de la forma 3q + 1 ó 3q + 2 para algún entero
q. Probar que existen infinitos primos de la forma 3q + 2.
10.5. Si p es primo, probar que p divide al coeficiente binómico

p
, 1 ≤ k ≤ p − 1.
k
Encontrar un contraejemplo para el caso de que p no sea primo.

10.6. Sean p, a, n ∈ Z. Demostrar que si p es primo y n es positivo y se verifica que p|an , entonces
p|a y, por tanto, pn |an . ¿Vale también si p es compuesto?
10.7. Si mcd(a, b) = 1 y a2 − b2 es un cuadrado perfecto, probar que a + b y a − b son ambos

cuadrados perfectos o bien dobles de cuadrados perfectos.
10.8. ¿Cuál es la relación entre el número de ceros en que termina la expresión decimal de un
entero n y su descomposición en factores primos?
10.9. Probar que si 2n − 1 es primo, entonces n es primo. (Los primos de la forma 2n − 1 se llaman
primos de Mersenne ; se conocen 35 primos ası́.)
Sugerencia: ¿qué sucede si n no es primo?
2.2.6. Congruencias. Aritmética modular.

Volvemos sobre una importante relación que habı́amos introducido anteriormente.
Definición 2.2.27. Fijado un entero m ≥ 2, dos números enteros a y b son congruentes módulo
m, a ≡ b (mód m), si m|(b − a).
Equivalentemente, a ≡ b (mód m) si y sólo si a y b dan el mismo resto al dividirlos por m:
pues si a = pm + r, b = qm + r, 0 ≤ r < m, resulta b − a = (q − p)m; y recı́procamente, si
a ≡ b (mód m), para algún entero k es b − a = km, luego si a = pm + r, 0 ≤ r < m, entonces
b = a + km = (p + k)m + r, 0 ≤ r < m, y ası́ r es igualmente el resto de dividir b por m (estamos
usando la unicidad del resto en la división entera).
Proposición 2.2.28. Para cada entero m ≥ 2, la relación de congruencia es una relación de
equivalencia en Z.
Demostración. Ya lo hemos probado en el capı́tulo anterior.
Por consiguiente, fijado m, Z queda ‘partido’ en una colección disjunta de clases de equivalencia
[a] = {b ∈ Z : a ≡ b (mód m)}, que se denominan clases de restos módulo m.
Si representamos en un sistema cartesiano la
relación de congruencia, es decir, el conjunto de
los puntos (a, b) del retı́culo Z × Z tales que a ≡
b (mód m) para m = 3, por ejemplo, comprobamos
que aparecen exactamente los puntos de coordena-
das enteras que están sobre las rectas de pendiente
1 que cortan al eje OX en los valores enteros múlti-
plos de 3, o sea, sobre las rectas y = x + 3n, n ∈ Z.
Para representar ‘horizontalmente’ la clase [a0 ]
correspondiente a un a0 ∈ Z, aprovecharemos que,
por simetrı́a, [a0 ] = {x ∈ Z : x ≡ a (mód m)},
y ası́ tenemos que buscar los puntos (x, a0 ), que
aparecen sobre la recta y = a0 paralela al eje OX,
distanciados consecutivamente en 3 unidades (ver
figura anterior); sus proyecciones sobre el eje OX
son los puntos x de la clase de equivalencia [a0 ]
(figura adjunta). Como se puede observar, hay tan
sólo tres clases distintas:
• las proyecciones de los puntos marcados con cua-
drados (los múltiplos de 3),
• las de los puntos marcados con cı́rculos (los an-
teriores más 1 unidad) y
• las de los puntos marcados con triángulos (los
primeros más 2 unidades).
La situación general es similar:

Proposición 2.2.29. Para cada entero m ≥ 2, dado a ∈ Z, la clase de restos de a módulo m es
[a] = {a + mz : z ∈ Z} = a + mZ.
Demostración. Evidentemente, si b = a + mz, z ∈ Z, es a ≡ b (mód m) por la definición de

congruencia. Y si a ≡ b (mód m), por lo mismo debe existir un z ∈ Z tal que b − a = mz, es decir,
b = a + mz.
Definición 2.2.30. Fijado m ≥ 2, el conjunto de las clases de restos módulo m se denota por Zm
o Z/mZ.
Se trata, pues, del conjunto cociente de Z respecto de la relación de congruencia módulo m.
Proposición 2.2.31. Dado m ≥ 2,
Zm = {[0], [1], . . . , [m − 1]}.
Demostración. Para cada a ∈ Z, [a] = [r] para uno y un solo entero r tal que 0 ≤ r < m: el resto
de la división entera de a por m, según hemos comentado previamente.
Además del interés de las clases de restos en muchos usos de la vida cotidiana (la esfera del
reloj, los meses, los dı́as de la semana, los cuentakilómetros de los coches) y de sus aplicaciones
en cuestiones relacionadas con la divisibilidad, los conjuntos Zm son importantes porque pueden
dotarse de una estructura algebraica (de una suma y un producto). Esta estructura es suficiente-
mente similar a la de Z como para que nos sintamos cómodos operando en ella, y suficientemente
distinta como para proporcionar ejemplos sencillos de situaciones insospechadas: fallos a veces en
la propiedad cancelativa, con la existencia de ‘divisores de cero’, frente a la existencia, en otras
ocasiones, de inverso para el producto como en Q, R y C.
La definición de suma y producto de clases de restos es completamente natural: [a] + [b], [a] · [b],
‘deben ser’ [a + b], [a · b]. Pero un momento de reflexión basta para darse cuenta que necesitamos
un ajuste previo. Si a0 es otro representante de [a] y b0 es otro representante de [b], de modo que
[a] = [a0 ], [b] = [b0 ], ¿llegamos al mismo resultado que antes si tomamos [a0 + b0 ], [a0 · b0 ]? El objetivo
del siguiente lema es comprobar que la respuesta es afirmativa.
Lema 2.2.32. Dado m ≥ 2, sean a ≡ a0 (mód m), b ≡ b0 (mód m). Entonces
a + b ≡ a0 + b0 (mód m), ab ≡ a0 b0 (mód m).
Demostración. Que a ≡ a0 (mód m), b ≡ b0 (mód m), significa que existen p, q ∈ Z tales que
a0 − a = pm, b0 − b = qm. En consecuencia
(a0 + b0 ) − (a + b) = a0 − a + b0 − b = (p − q)m,
y ası́ a + b ≡ a0 + b0 (mód m).

Análogamente,
a0 b0 = (a + pm)(b + qm) = ab + (aq + pb + pqm)m,
de donde ab ≡ a0 b0 (mód m).
Definición 2.2.33. Dado m ≥ 2, sean [a], [b] ∈ Zm . Definimos [a] + [b] = [a + b], [a] · [b] = [a · b]
Notemos que según el lema previo, la aplicación suma (respectivamente, producto) de Zm × Zm
en Zm que hace corresponder a ([a], [b]) ∈ Zm × Zm la clase [a + b] (respectivamente, [ab]) está bien
definida.
Proposición 2.2.34. Con la suma y el producto que acabamos de definir, Zm es un anillo conmu-
tativo con unidad.
Demostración. Que Zm es un anillo conmutativo con unidad significa que se cumple, cualesquiera
que sean las clases [a], [b], [c] ∈ Zm ,
1. Propiedad asociativa de la suma. ([a] + [b]) + [c] = [a] + ([b] + [c]).
(Cierto: ambas son la clase [a + b + c].)
2. Propiedad conmutativa de la suma. [a] + [b] = [b] + [a].
(Puesto que a + b = b + a.)
3. Existencia de elemento neutro (cero) para la suma. Hay una clase, [0] concretamente,
tal que [0] + [a] = [a] + [0] = [a].
(Puesto que 0 + a = a + 0 = a.)
4. Existencia de elemento opuesto para la suma. para cada [a] ∈ Z hay una clase (y una
sóla), la clase [−a], tal que [−a] + [a] = [a] + [−a] = [0].
(Evidente.)
5. Propiedad asociativa del producto. ([a] [b]) [c] = [a] ([b] [c]).
(Ambas son la clase [abc].)
6. Propiedad conmutativa del producto. [a] [b] = [b] [a].
(Inmediato.)
7. Existencia de elemento neutro (identidad) para el producto. Hay una clase, concreta-
mente [1], tal que [1] · [a] = [a] · [1] = [a].
(Inmediato.)
8. Propiedad distributiva del producto respecto de la suma. [a] ([b] + [c]) = [a] [b] + [a] [c].
(Ambas son la clase [a(b + c)] = [ab + ac].)
Ejemplos. Veamos las tablas completas de sumar y multiplicar para m = 6 y m = 7 (en el interior
de la tabla, por comodidad, hemos representado las clases sin los corchetes [ , ].)
+ [0] [1] [2] [3] [4] [5] × [0] [1] [2] [3] [4] [5]
[0] 0 1 2 3 4 5 [0] 0 0 0 0 0 0
[1] 1 2 3 4 5 0 Suma y [1] 0 1 2 3 4 5
[2] 2 3 4 5 0 1 producto [2] 0 2 4 0 2 4
[3] 3 4 5 0 1 2 módulo 6 [3] 0 3 0 3 0 3
[4] 4 5 0 1 2 3 [4] 0 4 2 0 4 2
[5] 5 0 1 2 3 4 [5] 0 5 4 3 2 1
+ [0] [1] [2] [3] [4] [5] [6] × [0] [1] [2] [3] [4] [5] [6]
[0] 0 1 2 3 4 5 6 [0] 0 0 0 0 0 0 0
[1] 1 2 3 4 5 6 0 [1] 0 1 2 3 4 5 6
Suma y
[2] 2 3 4 5 6 0 1 [2] 0 2 4 6 1 3 5
producto
[3] 3 4 5 6 0 1 2 [3] 0 3 6 2 5 1 4
módulo 7
[4] 4 5 6 0 1 2 3 [4] 0 4 1 5 2 6 3
[5] 5 6 0 1 2 3 4 [5] 0 5 3 1 6 4 2
[6] 6 0 1 2 3 4 5 [6] 0 6 5 4 3 2 1
Se observará que entre las tablas de sumar hay bastantes analogı́as: son simétricas respecto a
la diagonal principal, por ejemplo (¿debido a qué?), y en cada fila y cada columna aparece una
permutación de Zm (están todas las clases sin excepción, una sola vez, en ordenaciones diferentes:
¿hay alguna causa?). En las tablas de multiplicar hay mayores discrepancias, e incluso “fenómenos
extraños”. Descontando la anomalı́a que siempre introduce el [0] en la multiplicación, la tabla
de multiplicación módulo 7 mantiene las caracterı́sticas anteriores; por el contrario, en Z6 hay
“aberraciones” tales como que el producto de dos clases no nulas, [2] por [3] y otras, ¡es la clase
nula! Sin embargo, la multiplicación por [5] produce una permutación en Z6 como en la suma, e
incluso “tiene inversa”, la propia clase [5], de modo que [5]2 = [1] (lo cual es menos chocante si se
piensa que [5] = [−1]).
La explicación de estos hechos está en los resultados que vienen a continuación.
Lema 2.2.35. Sean a, b, m enteros y m ≥ 2. Si d = mcd(a, m), entonces la congruencia lineal
ax ≡ b (mód m) (Ξ)
tiene solución si, y sólo si, d|b.
Cuando d divida a b, si x0 es una solución, la solución general viene dada por
x = x0 + (m/d)n, n∈Z
En particular, las soluciones forman, exactamente, d clases de restos módulo m, con representantes
x0 , x0 + (m/d), x0 + 2(m/d), . . . , x0 + (d − 1)(m/d).
Demostración. Un x ∈ Z es solución de la ecuación (Ξ) si y sólo si m divide a b − ax, lo cual a su
vez equivale a que exista un y ∈ Z tal que b − ax = my, o sea, ax + my = b : en otras palabras, x es
solución de (Ξ) si y sólo si es solución (junto con algún y) de la ecuación diofántica ax + my = b.
Como ya sabemos, existe tal solución si y sólo si d = mcd(a, m)|b, y si hay solución, las infinitas
soluciones se deducen de una de ellas x0 (con su pareja y0 ) a través de las fórmulas x = x0 +(m/d)n
(con y = y0 − (a/d)n), n ∈ Z.
La única novedad en el enunciado es, por tanto, la afirmación final. Para probarla, observemos
primero que cada número x0 + k(m/d), 0 ≤ k ≤ d − 1 está en una clase de restos distinta, pues
x0 + j(m/d) ≡ x0 + k(m/d) (mód m) con 0 ≤ j < k ≤ d − 1 implicarı́a que m|(k − j)(m/d), siendo
0 ≤ (k − j)(m/d) ≤ k(m/d) < m, lo cual es imposible.
Por último, dada una solución cualquiera x = x0 + (m/d)n, n ∈ Z, dividiendo n por d resulta
n = qd + r, q ∈ Z, 0 ≤ r ≤ d − 1, y ası́ x0 + (m/d)n = x0 + qm + r(m/d) ≡ x0 + r(m/d) (mód m).
Corolario 2.2.36. Sean a, b, m enteros y m ≥ 2. Si a y m son relativamente primos, entonces la

congruencia lineal
ax ≡ b (mód m) (Ξ)
tiene una y una sola solución módulo m.
Demostración. Basta aplicar el lema anterior teniendo en cuenta que, por hipótesis, mcd(a, m) = 1.
Corolario 2.2.37. Sean a, m enteros y m ≥ 2. La congruencia

ax ≡ 1 (mód m)
tiene solución si, y sólo si, mcd(a, m) = 1, en cuyo caso, hay una sóla solución módulo m.
Formulando los resultados anteriores dentro de Zm , encontramos las causas de los fenómenos
observados en las tablas de multiplicar en Z6 y Z7 .
Corolario 2.2.38. Sean a, b, m enteros y m ≥ 2. Si d = mcd(a, m), entonces la ecuación en Zm
[a] · x = [b]
tiene solución x en Zm si, y sólo si, d|b.
Cuando d divida a b, hay exactamente d soluciones distintas en Zm , y si x0 ∈ Zm es una de
ellas, dichas soluciones son
x0 , x0 + [(m/d)], x0 + [2(m/d)], . . . , x0 + [(d − 1)(m/d)].
Demostración. Es otra forma de enunciar el lema 2.2.35.
Corolario 2.2.39. Sean a y m enteros relativamente primos, y m ≥ 2. Entonces la aplicación

M : Zm → Zm dada por M (x) = [a] · x (la multiplicación por [a]) es una biyección.
Demostración. Según el corolario anterior, para cada [b] ∈ Zm existe un x ∈ Zm y uno sólo tal que
[a] · x = [b], es decir, tal que M (x) = [b], y por tanto M es biyectiva.
Esto explica las ‘permutaciones’. Los ceros ‘anómalos’ provienen de lo siguiente:
Corolario 2.2.40. Sean a y m enteros tales que m ≥ 2 y [a] 6= [0] en Zm . Si d = mcd(a, m) ≥ 2,

existe x ∈ Zm \ {[0]} tal que
[a] · x = [0].
(Decimos entonces que [a] y x son divisores de cero en Zm : su producto es nulo, pese a que
ambos son distintos de cero.)
Demostración. Tomando b = 0 y x0 = [0] en el corolario 2.2.38, vemos que la ecuación
[a] · x = [0]
tiene d − 1 (≥ 1) soluciones distintas de x0 = [0], que son
[(m/d)], [2(m/d)], . . . , [(d − 1)(m/d)].
Si en un anillo con unidad A todo elemento no nulo tiene inverso (o sea, hay un elemento que
multiplicado por él da la unidad), se dice que A es un cuerpo.
Teorema 2.2.41. Sea m un entero mayor o igual que 2. Entonces Zm es un cuerpo si y sólo si
m es primo.
Demostración. Que una clase [a] 6= [0] tenga inverso quiere decir que existe x ∈ Zm tal que
[a] · x = [1].
Pero si m es primo, como m 6 | a ya que [a] 6= [0], se sigue que mcd(a, m) = 1 y la ecuación
[a] · x = [1] tiene solución Zm (única, además).
En cambio, si m es compuesto, m = ab con 1 < a < m, 1 < b < m, por lo cual tiene que ser
[a] 6= [0] 6= [b]; y sin embargo [a] no tiene inverso, pues mcd(a, m) = a 6= 1 (más todavı́a: [a] y [b]
son divisores de cero, ya que [a][b] = [0], aunque [a] y [b] sean los dos distintos de [0], y esto es
imposible cuando [a] tiene inverso).
Nota.
En losanillos
de matrices
también
se encuentran divisores de cero. Por ejemplo, si A =
1 0 0 0 0 0
,B= , AB = sin que ninguno de los factores se anule.
1 0 1 1 0 0
Resolución de ecuaciones en congruencias con ordenador

En maple se dispone de msolve(eqns,m), donde eqns es una ecuación (no necesariamente
tan sencilla como las que hemos estudiado) o un conjunto de ecuaciones. La respuesta es una lista
de valores enteros no negativos, cada uno en una clase de restos módulo m, que dan hh todas las
soluciones módulo mii de la ecuación. Ejemplo:
msolve(8*x=20,12);
{x = 1}, {x = 4}, {x = 7}, {x = 10}
En Mathematica habı́amos encontrado ya la orden Solve[a*x==c && Modulus==b,x], cuya

respuesta (ahora lo vemos) es similar a la de maple . Ejemplo:
In[1]:=
Solve[8 x == 20 && Modulus == 12, x ]
Out[1]=
{{Modulus -> 12, x -> 1}, {Modulus -> 12, x -> 4},
{Modulus -> 12, x -> 7}, {Modulus -> 12, x -> 10}}
APLICACIONES
Criterios de divisibilidad.
Algunas aplicaciones de las congruencias nos son familiares desde bastantes años atrás.
hh Un número es divisible por 2 cuando termina en 0 o cifra par. ii
hh Un número es divisible por 5 cuando termina en 0 o en 5. ii
¿Suena conocido?
hh Un número es divisible por 3 cuando la suma de sus cifras es múltiplo de 3. ii
hh Un número es divisible por 9 cuando la suma de sus cifras es múltiplo de 9. ii
La razón de estas reglas es ahora muy evidente. Partimos de un número N escrito cn cn−1 . . . c1 c0
en base decimal, de manera que
N = c0 + c1 · 10 + · · · + cn−1 · 10n−1 + cn · 10n , cn 6= 0.
Que sea divisible por m equivale a que sea congruente con 0 (mód m). Observando que
10 ≡ 0, 102 ≡ 0, ..., 10n ≡ 0, ... (mód 2),

2 n
10 ≡ 0, 10 ≡ 0, ..., 10 ≡ 0, ... (mód 5),
2 n
10 ≡ 1, 10 ≡ 1, ..., 10 ≡ 1, ... (mód 3),
2 n
10 ≡ 1, 10 ≡ 1, ..., 10 ≡ 1, ... (mód 9),
se deduce
N ≡ c0 (mód 2), N ≡ c0 (mód 5), N ≡ c0 +c1 +c2 +· · · (mód 3), N ≡ c0 +c1 +c2 +· · · (mód 9),
y de aquı́ los criterios de divisibilidad que hemos recordado.

También se justifica ası́ la olvidada “prueba del nueve” para la división: al efectuar ‘a mano’
la división entera entre números grandes a y b, es fácil cometer errores tanto de cálculo como
de escritura. Una prueba cómoda (¡aunque no infalible!) para detectarlos, si hemos obtenido un
cociente c y un resto r, consiste en trazar un aspa como en la figura, y poner en a0 el resultado
de sumar las cifras de a. Si esta es mayor que 9, sustituimos a0 por la suma de sus cifras, y si
es 9 ponemos un cero; repitiendo este proceso si es necesario, llegaremos en unos cuantos pasos
a un valor menor que 9 que pondremos en la casilla de a0 (el valor final es, obviamente, el único
número entre 0 y 8 congruente con a módulo 9; por ejemplo, para a = 87462371, irı́amos obteniendo
8 + 7 + 4 + 6 + 2 + 3 + 7 + 1 = 38, 3 + 8 = 11, 1 + 1 = 2 —o más fácil, 8 + 7 + 4 + 6 + 2 + 3 + 7 + 1 =
(8 + 1) + (7 + 2) + 4 + (6 + 3) + 7 ≡ 4 + 7 = 11).
Con el mismo método de ‘reducción’ sumando cifras, ponemos en
a b
b0 el único número entre 0 y 8 congruente con a módulo 9, en c0 el
r c ‘reducido’ de c. Multiplicamos c0 por b0 , ‘reducimos’ el resultado,
y lo sumamos con las cifras de r prosiguiendo la reducción; la cifra
0 que se obtenga al final debe coincidir con a0 . Si no es ası́, hay un
@0 b 0 0
a @ (c b + r)0 error con toda seguridad; pero si coinciden, podrı́a haber todavı́a
c0 @ un error, aunque sea ‘un poco menos probable’.
La razón: lo que se comprueba en el proceso anterior es si de a ≡ a0 , b ≡ b0 , c ≡ c0 (mód 9),

y a = cb + r, se sigue a0 ≡ c0 b0 + r (mód 9). Si no es ası́, por supuesto debe haber un error
en los números, porque de la igualdad se sigue la equivalencia; pero si se da la equivalencia, no
está garantizada la corrección del resultado.
17526
431 17526
431 17526 431
1286
42 1286
42 286 40
424 324
286
@8 @8 @8
3 @ 4 ¡MAL! 3 @ 3 ¿BIEN? 3 @ 3 REVISADA
6@ 6@ 4@
Ejercicio. Probar que un número es divisible por 11 si y sólo si la suma de las cifras de lugar par
menos la suma de las cifras de lugar impar es múltiplo de 11.
Sugerencia: 10 ≡ −1 (mód 11).
Ejercicio. Probar que un número es divisible por 25 si y sólo si termina en 00, 25, 50 o 75.
Ejercicio. ¿Por qué nunca se enuncia un criterio sencillo de divisibilidad por 7, similar a los que
hemos considerado? (No obstante, ver [6].)
Dı́gitos de control. Las congruencias inciden en nuestra vida diaria de forma invisible, pero
constante, y en las situaciones más insospechadas. Ası́ lo explica el prof. M. Gasca ([G]):
hh Se dice que estamos en la Era de la Información. Veamos algunas de las cuestiones surgidas en
torno a ella y que en el fondo son problemas matemáticos más o menos intrincados. Se usan
mucho los códigos de barras para identificar un producto. Se trata de barras blancas y negras
que al ser leı́das rápidamente por láser se traducen en ceros y unos, sistema binario, que a
su vez se traducen a numeración decimal. En el caso del Código Universal de Productos, el
más frecuente, son unos 12 dı́gitos decimales, de los que uno advierte del grupo de productos
de que se trata, el grupo siguiente identifica al fabricante, otro grupo da idea del producto
concreto, a veces de su tamaño, etc., y el último dı́gito es de control.
Si han observado los números de sus cuentas bancarias de 20 dı́gitos, los 4 primeros son la
entidad, 4 para la Agencia, 2 de control y luego 10 para su cuenta personal. Observarán que
en ambos casos hablamos de dı́gitos de control. Es muy fácil al transmitir tantos números
bailar su orden o confundir una cifra. Mediante un algoritmo matemático muy simple el
ordenador detecta el error. Se entenderá mejor con el NIF. Hacienda tenı́a graves problemas
con la gente que daba, intencionadamente, un número erróneo de DNI, sin poder demostrar la
intencionalidad del error. Un algoritmo muy simple asigna a cada número de DNI una letra,
dando lugar al NIF. Para ello, Hacienda seleccionó 23 letras del alfabeto eliminando i, ñ, o y
u por causar confusiones, y les asignó un número aleatorio entre 0 y 22: la A tiene el 3, la W
el 2, etc. Dividiendo el número del DNI entre 23, prescindiendo de decimales en el cociente
y volviendo a multiplicar por 23, se obtiene un número igual o menor que el del DNI. La
diferencia entre el DNI y ese nuevo número es el que decide la letra. Si ahora Vd. cambiara
algo en su número de DNI, como bailar dos dı́gitos, es sumamente probable que la letra final
no saldrı́a la misma y el ordenador avisará del error. Entendiendo el proceso serı́a facilı́simo
cambiar el número y a la vez cambiar la letra para que concuerden y el ordenador no detecte
el error, pero si posteriormente se descubre, ya hay manifiesta mala fe.
En el caso de la cuenta bancaria, los dı́gitos son 2 porque se usa uno para el grupo de cifras
Banco-Agencia y otro para el número de la cuenta. ii
Por supuesto, podemos añadir otros ejemplos (ver [C-C-S], pp. 46 y ss.):
• ISBN
El ISBN es el International Standard Book Number, el NIF de los libros podrı́amos decir. Es un
código que se asigna a cada publicación que lo solicita, que permite identificarla rápidamente.
Consiste en 9 dı́gitos, seguidos de un décimo sı́mbolo que puede ser otro dı́gito (de 0 a 9) o
una X. Los nueve primeros dı́gitos dan la información del libro, como el año y el lugar de
publicación, y el sı́mbolo final es de control. Si el ISBN de un libro es a1 a2 . . . a9 b, se elige b
de manera que a1 + 2a2 + · · · + 9a9 ≡ b (mód 11), correspondiendo X al resto 10. En este caso
hay posibilidad de corregir pequeños errores: si en el n-ésimo sı́mbolo hay un error de +1 o
−1, entonces a1 + 2a2 + · · · + 9a9 + 10b (mód 11) es igual a +n o −n, respectivamente.
• Música digitalizada
En los CD’s, la música se almacena codificada en listas de ceros y unos. Usando un rayo
laser, el lector de CD’s lee la información del disco y la convierte en la señal que termina
transformada en sonido en los altavoces. Hay muchas causas que pueden originar errores de
lectura: rayas, suciedad o polvo en la superficie del disco, el rayo laser deja de apuntar al
lugar adecuado, etc. El almacenamiento de la información ha de hacerse de manera que el
lector pueda detectar y corregir esos errores.
• Comunicaciones
En todos los canales de comunicación hay que contar con el ‘ruido’, alteraciones de todo tipo
que hacen que la señal recibida no sea igual que la emitida: transmisiones de televisión o
telefonı́a por satélite, lı́neas de teléfono, fax, e-mails, televisión, etc. mediante cable,. . .
Para crear códigos que permitan corregir errores, se han utilizado ¡espacios vectoriales sobre
cuerpos Zp ! (ver Los códigos correctores, de G. Lachaud-S. Vladut y La doble corrección,
de C. Berrou y cols., en [MC1]).
En [COMAP], pp. 586 y ss., pueden verse también algunos detalles sobre corrección de errores
y compresión de datos.
El pequeño teorema de Fermat

Otra aplicación importante de las congruencias es que ciertos resultados permiten responder
afirmativamente a la pregunta: ¿es posible probar que un número no es primo sin conocer sus
factores? Veamos cómo (criterios de primalidad).
Teorema 2.2.42 (El pequeño teorema de Fermat). Dado un número primo p, sea a ∈ N tal
que p no divide a a. Entonces ap−1 ≡ 1 (mód p).
Demostración. Aplicando el corolario 2.2.39,
Zp = {[0], [1], . . . , [p − 1]} = {[0 · a], [1 · a], . . . , [(p − 1) · a]}.
Por tanto
0 6≡ 1 · 2 · · · (p − 1) ≡ a · 2a · · · (p − 1)a ≡ 1 · 2 · · · (p − 1)ap−1 (mód p)
y cancelando 1 ≡ ap−1 (mód p).
Corolario 2.2.43. Dado un número primo p, para cualquier a ∈ N es ap ≡ a (mód p).

Demostración. Si p|a, ap ≡ 0 ≡ a (mód p). En caso contrario, basta multiplicar por a ambos
términos de la equivalencia ap−1 ≡ 1 (mód p).
Por tanto, si encontramos valores de a para los que no se cumplen las equivalencias anteriores,
p NO podrá ser primo.
Ejemplos.
1. 63 no es primo: si lo fuera, 262 ≡ 1 (mód 63), y sin embargo
262 = 260 · 22 = (26 )10 · 22 = (64)10 · 22 ≡ 4 (mód 63).
2. 341 no es primo: si lo fuese, como 73 = 343 ≡ 2 (mód 341) y 210 = 1024 ≡ 1 (mód 341), se
verificarı́a 7340 = 73·113+1 ≡ 2113 7 ≡ 2110+3 7 ≡ 8·7 ≡ 56 (mód 341). Como 56 6≡ 1 (mód 341),
341 no puede ser primo.
Ver comentarios en [D’A-W], p. 114.

La congruencia de Fermat también sirve, obviamente, para hallar restos.
Ejemplo. Como 31 es primo, 1130 ≡ 1 (mód 31), y ası́
11902 = 1130·30+2 = (1130 )30 · 112 ≡ 130 · 112 ≡ 121 ≡ 28 (mód 31).
Criptografı́a.
El pequeño teorema de Fermat, o sus generalizaciones como el teorema de Euler, están en la base
de algunos sistemas modernos de criptografı́a.
hh ¿Cómo transmitir mensajes secretos asegurándose que no serán comprendidos por un eventual
enemigo? Tal es el objetivo de la criptografı́a. En principio, el mensaje a transmitir tiene que
codificarse previamente por medio de una clave que el emisor y el receptor mantienen en
secreto. En general, esta clave puede ser fácilmente hh invertidaii, por lo que sirve tanto para
cifrar el mensaje inicial como para descifrar el mensaje cifrado. En tal caso, que es el clásico, el
emisor y el receptor comparten un mismo secreto, la clave que sirve para cifrar y descifrar. El
principio de la criptografı́a de clave pública, inventado en 1976 por Whitfield Diffie y Martin
Hellman, de la Universidad de Stanford, es muy distinto. El método supone que la clave del
cifrado no puede ser fácilmente invertida para hallar la clave del desciframiento. La primera
puede ser pública, mientras que sólo el receptor puede conocer la segunda. La seguridad es
entonces mucho mayor. Supongamos que Alicia quiere enviar a Bernardo un mensaje secreto
por medio de una clave pública. En tal caso, Bernardo tiene que comunicar a Alicia una
clave de cifrado que puede ser conocida por todo el mundo (es la clave pública). Alicia la
utiliza para cifrar su mensaje, que luego envı́a a Bernardo. Para descifrar el mensaje en clave,
Bernardo utiliza su clave privada, que es el único en conocer.
El sistema de cifrado de clave pública más conocido y utilizado es probablemente el siste-
ma RSA, inventado en 1978 por Ronald Rivest, Adi Shamir y Leonard Adelman, del MIT
(Massachusetts Institute of Technology, Estados Unidos). ii
[· · · ]
hhDesde aproximadamente 1980, es bastante fácil averiguar si un número, aunque sea muy
grande, es o no primo. En cambio, es mucho más difı́cil descomponer un número grande en
factores primos. En esta diferencia de dificultad se basan precisamente los modernos métodos
de criptografı́a. Muy esquemáticamente, la idea consiste en construir la clave del cifrado
(no secreta) por medio de un número N producto p × q de dos números primos grandes.
El desciframiento, en cambio, requiere el conocimiento de p y q por separado, unos valores
que sólo se comunican a las personas autorizadas. Para descifrar un mensaje en clave, un
espı́a tendrı́a que encontrar, conociendo N , sus dos factores primos p y q. Ahora bien, para
N lo bastante grande (digamos que del orden de 150 cifras) y convenientemente elegido, es
imposible realizar esta operación inversa en un tiempo aceptable. ii
[· · · ]
La importancia de la teorı́a de números en criptografı́a es tal que los matemáticos se ven
hh
confrontados a problemas deontológicos. Por ejemplo, si uno de ellos descubre un método de

factorización numérica mucho más eficaz que los precedentes, ¿qué debe hacer? ¿Comunicarlo
al primer ministro, exponerlo públicamente en una conferencia internacional para que nadie
pueda aprovecharse de él a expensas de otros o venderlo al mejor postor? Afortunadamen-
te, hasta dónde se sabe, las mejoras encontradas por los matemáticos no son lo bastante
revolucionarias como para que el problema se plantee en toda su acuidad. ii
(fragmentos del artı́culo La intriga de los números primos, de Henri Cohen, publicado en [MC1].)
En [C-C-S], pp. 15–16, se da la siguiente descripción simplificada, a modo de receta culinaria,
del sistema RSA.
ingredientes necesarios:
dos números primos p y q
un número de codificación v y otro de descodificación w tales que
vw ≡ 1 (mód (p − 1)(q − 1)).
Los primos p y q y el número de descodificación w son secretos. El número de codificación v

y el módulo m = p · q no hace falta que sean secretos, pueden ser públicos.
Codificar un número x transformándolo en otro y mediante
y ≡ xv (mód m).
Descodificar y recuperando x mediante
x ≡ y w (mód m).
¿Qué justifica la última afirmación? Se supone que p y q son muy grandes, y que x es menor que
ellos. Por eso (xq−1 )p−1 ≡ 1 (mód p), (xp−1 )q−1 ≡ 1 (mód q), de donde x(p−1)(q−1) ≡ 1 (mód pq)
(¿por qué?), y ası́
y w ≡ xvw ≡ xa(p−1)(q−1)+1 ≡ (x(p−1)(q−1) )a · x ≡ x (mód m).
Ver otra descripción ‘aproximada’ en [COMAP], pp. 580–584. Para mayor precisión, consultar
en la dirección [1] los apuntes de Fco. Javier Cobos Gavala, Universidad de Sevilla.
Ejercicios
11.1. A lo largo del texto se ha usado que para todo n ∈ N, de a ≡ b (mód m) se sigue an ≡
bn (mód m). Demostrarlo.
11.2. Demostrar, utilizando congruencias, que si un número entero es a la vez un cuadrado y un
cubo, entonces se puede escribir en la forma 7k o 7k + 1.
11.3. Probar que las seis primeras potencias de 10 pertenecen a distintas clases de congruencias
módulo 7. (Comentario: Gauss preguntó si las potencias de 10 dan n − 1 clases de congruencias
distintas módulo n para infinitos n; la pregunta sigue sin contestar. Los módulos 5 y 13 fallan, a
pesar incluso de que son primos.)
11.4. Sea k un número impar. Probar que k 2 ≡ 1 (mód 8).
11.5. ¿Hay algún cuadrado perfecto (entero de la forma k 2 , k ∈ Z), que sea congruente con 2
módulo 3? ¿Por qué?
11.6. Si x2 + y 2 = z 2 , demostrar:
(i) al menos uno de los valores x, y o z es divisible por 3;

(ii) xyz es un múltiplo de 4;
(iii) al menos uno de los valores x, y o z es divisible por 5;
(iv) xyz es un múltiplo de 60.
(Los enteros x, y, z que cumplen la ecuación dada se llaman, por razones obvias, ternas pitagóri-
cas .)
11.7. Dado un entero n ≥ 2, probar que en cada clase de restos módulo n hay exactamente un
entero r que cumple −n/2 < r ≤ n/2.
(Estos números se llaman menores restos absolutos módulo n; cuando n es impar, son 0,
±1, ±2, . . . , ±(n − 1)/2; cuando n es par, 0, ±1, ±2, . . . , ±(n − 2)/2, n/2.)
11.8. Usando el problema anterior, hallar el menor resto no negativo de 28 × 33 (mód 35).
11.9. Decimos que k es un cuadrado módulo n si k ≡ j 2 (mód n) para algún j. Supongamos que
n = m2 + 1 para algún m ∈ N. Probar que si k es un cuadrado módulo n, también −k es un
cuadrado módulo n.
11.10. Si p es un primo, probar por inducción en n que np ≡ n (mód p). Deducir el pequeño
teorema de Fermat.
11.11. Calcular 132231 (mód 7), 246218 (mód 11), 145197 (mód 13).
11.12. Hallar los inversos de 13 en Z21 y Z31 .
11.13. Hallar los inversos de 4 y 12 en Z19 .
Bibliografı́a
[Casti] J. L. Casti: Mathematical Mountaintops: The Five Most Famous Problems of All Time.
Oxford U. P., 2001.
[C-C-S] Cohen, A. M.; Cuypers, H.; Sterk, H.: Algebra Interactive! (Learning algebra in an
exciting way). Springer, Berlin, 1999.
Versión on line:
http://www.win.tue.nl/~ida/home.html
[COMAP] COMAP: Principles and Practice of Mathematics. Springer, New York, 1997.
[Ddk] Dedekind, R.: ¿Qué son y para qué sirven los números?. (edición e introducción de J.
Ferreirós) Alianza Editorial, Madrid, 1998.

Madrid, 1996.
[G] Gasca, M.: Las Matemáticas en la vida del año 2000, Monografı́as de la Academia de
Ciencias de Zaragoza 19 (37–44) 1996.
Univ. Press, 1982.
Raton, 2000.
[MC1] Mundo Cientı́fico: El universo de los números: Matemáticas para interpretar el mundo.
Extra núm. 1, s.f..
[Peano] Peano, G.: Arithmetices principia nova methodo exposita. Bocca, Romæ-Florentiæ, 1889..
Un libro de problemas resueltos muy interesante con muchos ejercicios accesibles, pero que
en buena parte requiere un mayor conocimiento en Teorı́a de Números, es
[Si] Sierpinski, W.: 250 Problems in Elementary Number Theory. Elsevier, New York; PWN,
Warszawa, 1970.
87
88 BIBLIOGRAFÍA
[1] F. J. Cobos: Curso de Introducción a la Matemática Discreta. Universidad de Sevilla,

2002-2003.
http://ma1.eii.us.es/Docencia/apuntes/ap imd.PDF
[2] Axiomas de Peano.

http://www.unizar.es/analisis matematico/numyconj/axpeano.pdf
[3] Fundamentos de la aritmética, The Oxford Companion to Philosophy.

http://www.xrefer.com/entry/551320
[4] D. Alpern, Factorización usando curvas elı́pticas.

http://www.alpertron.com.ar/ECMC.HTM
[5] MathWorld, Prime Factorization Algorithms.

http://mathworld.wolfram.com/PrimeFactorizationAlgorithms.html
[6] Can it divide?, criterios de divisibilidad por veintidós números.

http://www.geocities.com/krishnakoradas/lesson11.htm
Capı́tulo 3
Números racionales. Polinomios.
Sobre los números racionales y su construcción seguimos fundamentalmente el texto [D’A-W].

Sobre polinomios, ver [Pest] y [GJPR]. Si bien [D-H] trata en detalle los polinomios, lo hace a un
nivel más elevado del que corresponde a este curso.
En cada momento daremos las referencias complementarias que sean pertinentes.
3.1. Números racionales.

La idea y el manejo de los números racionales, y más concretamente de las fracciones, nos es so-
bradamente familiar. Lo que pretendemos ahora es reflexionar sobre el significado de las fracciones
apoyados en la base conjuntista que poseemos actualmente, explicando el sentido de las manipu-
laciones que hemos aprendido ‘por decreto’ y sentando las bases para construcciones similares en
contextos más generales, que se utilizarán en otras asignaturas.
3.1.1. Insuficiencia de Z. Fracciones.

Consideremos los dos problemas siguientes:
(a) Hay que repartir veinte abrigos equitativamente, en igual número, entre seis familias.
¿Cuántos hay que dar a cada una?
(b) Se dividen veinte metros de tela a partes iguales entre seis sastres. ¿Cuánta tela tendrá cada
uno?
Ambos problemas se traducen matemáticamente en:
‘Hallar x tal que 6x = 20’.
¿Vale para ambos la misma respuesta? Evidentemente, no. En el primer caso, daremos tres
abrigos a cada familia (y sobrarán dos, no hay ‘solución exacta’); en el segundo, no podemos expresar
la respuesta satisfactoriamente con valores enteros, Z resulta insuficiente en estas y otras situaciones
en las que hay que resolver exactamente ecuaciones de la forma ax = b, a 6= 0. Lo que hacemos
es ‘sacar de la nada’ una solución, la ‘fracción’ que representamos por hh b/aii. Para otra ecuación
a0 y = b0 tendrı́amos la solución y = b0 /a0 . ¿Habrá, pues, tantas soluciones distintas como ecuaciones
distintas? Volviendo sobre el ejemplo de la tela, la experiencia nos dice que si se repartieran diez
metros entre sólo tres sastres, cada uno recibirı́a la misma cantidad que antes, y lo mismo sucederı́a
repartiendo treinta metros entre nueve, etc. Para reflejar fielmente esta situación, habrá que ‘igualar’
soluciones idénticas aunque provengan de ecuaciones distintas. ¿Bajo qué criterio? Si los nuevos
entes van a comportarse de manera coherente con los viejos números enteros, como x = b/a significa
que ax = b e y = b0 /a0 significa a0 y = b0 , también serı́a a0 ax = a0 b, aa0 y = ab0 , y ası́ x = y debe
corresponderse justamente con ba0 = b0 a. Llamamos fracciones equivalentes a las que verifican esta
relación, y decimos que definen el mismo número racional.
¿Qué estamos haciendo, desde nuestra perspectiva actual? Descorriendo todos los velos, en esto
queda el misterio de las fracciones: tomamos pares ordenados (m, n) ∈ Z × (Z \ {0}) y establecemos
89
90 CAPÍTULO 3. NÚMEROS RACIONALES. POLINOMIOS.
una ‘equivalencia’: (m, n) ∼ (p, q) si mq = np; si es una verdadera relación de equivalencia, la

identificación posterior no supone otra cosa que el paso a las clases de equivalencia (un número
racional = una clase de equivalencia de fracciones) y al conjunto cociente (este serı́a Q).
La manera de operar con los nuevos objetos está completamente determinada si no queremos
romper nuestras cómodas leyes. Para sumar fracciones, recurrimos al ‘arreglo’ anterior: x = b/a,
y = b0 /a0 lleva a a0 ax = a0 b, aa0 y = ab0 , y esto fuerza que aa0 (x + y) = a0 b + b0 a, es decir,
x + y = (ba0 + b0 a)/(aa0 ). El producto es más directo: de ax = b y a0 y = b0 se pasa, multiplicando,
a aa0 xy = bb0 , que deja xy = bb0 /aa0 .
¿“Pasan” estas operaciones a las clases de equivalencia, como sucedı́a en el caso de las congruen-
cias? Habrá que comprobar, igual que entonces, que sumando fracciones equivalentes se obtienen
sumas equivalentes, y que multiplicando fracciones equivalentes se obtienen productos equivalentes.
Enseguida nos ocuparemos de ello.
Para complementar esta visión ‘algebraica’ de los números racionales, puede verse una inter-
pretación geométrica como pendientes de rectas, en [D’A-W] pp. 123–124 o en [GJPR] p. 127, por
ejemplo.
3.1.2. Construcción de Q
Formalicemos las consideraciones anteriores.
Lema 3.1.1. Sea F = Z × (Z \ {0}), y ∼ la relación en F dada por

(m, n) ∼ (p, q) cuando y sólo cuando mq = pn.
Entonces ∼ es una relación de equivalencia en F .
Demostración. La relación ∼ es:
Reflexiva, pues (m, n) ∼ (m, n) cualquiera que sea (m, n) ∈ F , ya que trivialmente mn = mn
Simétrica, siempre que (m, n) ∼ (p, q) resulta (p, q) ∼ (m, n) porque lo primero significa que
mq = pn y lo segundo que pn = mq.
Transitiva, de (m, n) ∼ (p, q) y (p, q) ∼ (r, s) se sigue (m, n) ∼ (r, s), porque si mq = pn y
ps = rq, también mqps = pnrq. Si p 6= 0, como q 6= 0, cancelando pq ya queda ms = nr;
mientras que si p = 0, forzosamente m = 0 y r = 0, y en este caso ms = 0 = nr.
A los elementos de F los denominaremos fracciones .
Definición 3.1.2. El conjunto de los números racionales es el conjunto cociente Q = F/ ∼.

Sus elementos, los números racionales , son por tanto las clases de equivalencia [(m, n)].
Nota. Evitando arrastrar las poco intuitivas notaciones (m, n) para lo que siempre hemos escrito
m m
ó m/n, y [(m, n)] para lo que estamos acostumbrados a representar igualmente por ó m/n, de
n n
aquı́ en adelante volvemos a la notación clásica. No obstante, no hay que perder de vista entonces
que tenemos una misma notación para dos objetos distintos: la fracción (m, n) y el número racional
[(m, n)] del cual la fracción anterior es un representante. En cualquier caso, lo que no ha originado
confusión hasta ahora no deberı́a causarla tampoco de ahora en adelante.
Cuando sea necesario, indicaremos explı́citamente si nos estamos refiriendo a una fracción o a
un número racional. Por ejemplo:
Definición 3.1.3. Una fracción m/n se dice irreducible si n > 0 y mcd(m, n) = 1.
Ejercicio. Probar que toda fracción es equivalente a una y una sóla fracción irreducible; dicho
de otro modo, que todo número racional admite un único representante que sea una fracción
irreducible.
3.1. NÚMEROS RACIONALES. 91
m p
Definición 3.1.4. Dadas dos fracciones , llamaremos suma de ambas a la fracción
n q
m p mq + pn
+ =
n q nq
y producto a la fracción
mp mp
=
n q nq
Para definir la suma y el producto en Q dependemos del siguiente lema.
m m0 p p0 m m0 p p0
Lema 3.1.5. Dadas fracciones , 0 , , 0 tales que ∼ 0 , ∼ 0 , se verifica
n n q q n n q q
m p m0 p0 mp m0 p0
+ ∼ 0 + 0, ∼ 0 0.
n q n q n q n q
Demostración. Por hipótesis, mn0 = m0 n, pq 0 = p0 q. Por definición
m p mq + pn m0 p0 m0 q 0 + p0 n0
+ = , + = ,
n q nq n0 q0 n0 q 0
luego
(mq + pn)(n0 q 0 ) = mqn0 q 0 + pnn0 q 0 = (mn0 )(qq 0 ) + (pq 0 )(nn0 ),

(m0 q 0 + p0 n0 )(nq) = m0 q 0 nq + p0 n0 nq = (m0 n)(qq 0 ) + (p0 q)(nn0 )
son iguales, que es lo que necesitábamos probar.

Para el producto la demostración se deja como ejercicio.
m p
Definición 3.1.6. Dados dos números racionales , ∈ Q, llamaremos suma de ambos al
n q
número racional
m p mq + pn
+ =
n q nq
y producto al número racional
mp mp
=
n q nq
Notemos que según el lema la aplicación suma (respectivamente, producto) de Q × Q en
previo,
m p mq + np mp
Q que hace corresponder a , ∈ Q × Q el número racional (respectivamente, )
n q nq nq
está bien definida.
Proposición 3.1.7. Con la suma y el producto que hemos definido, Q es un cuerpo conmutativo.
Demostración. Enunciamos las propiedadesa comprobar,

esbozando
las demostraciones.

m p r m p r
1. Propiedad asociativa de la suma. + + = + + .
n q s n q s
mqs + nps + nqr
(Cierto: ambas operaciones dan como resultado .)
nqs
m p p m
2. Propiedad conmutativa de la suma. + = + .
n q q n
(Inmediato.)
3. Existencia de elemento neutro (cero) para la suma. Hay un número racional, que
m m m
denotamos provisionalmente por [0], tal que [0] + = + [0] = .
n n n
(Vale tomar [0] = 0/1.)
m
4. Existencia de elemento opuesto para la suma. Para cada ∈ Q hay un número racional
n
−m −m m m −m
(y uno sólo), el número racional , tal que + = + = [0].
n n n n n
(Evidente.)

mp r m pr
5. Propiedad asociativa del producto. = .
n q s n q s
mpr
(Ambos son el número racional .)
nqs
mp pm
6. Propiedad conmutativa del producto. = .
n q q n
(Inmediato.)
7. Existencia de elemento neutro (identidad) para el producto. Hay un número racional,
m m m
denotado provisionalmente por [1], tal que [1] · = · [1] = .
n n n
(Tomar [1] = 1/1.)
m
4. Existencia de elemento inverso para el producto. Para cada ∈ Q\{0} hay un elemento
n
n n m m n
(y uno sólo) en Q, el número racional , tal que = = [1].
m m n n m
(Tiene sentido porque m 6= 0.)

m p r mp mr
8. Propiedad distributiva del producto respecto de la suma. + = + .
n q s n q n s
m(ps + qr) mpns + mrnq
(Ambos son iguales a = .)
nqs nqns
Los enteros como racionales.

¿Es inevitable la distinción entre hh el cero de Qii, [0], y hh el cero de Zii, 0? ¿o entre hh el uno de
Q y hh el uno de Zii? ¿No hemos creı́do siempre que los números enteros estaban incluı́dos en los
ii
racionales? ¿Quién no pondrı́a 6/3=2? Sin embargo, nos estamos refiriendo a objetos de naturaleza
distinta: un número racional es nada menos que un conjunto de pares de números enteros. Pero
desde que aprendimos las fracciones hemos ‘identificado’ 0/1 con 0; 1/1 con 1 o, en general, m/1
con m cualquiera que sea m ∈ Z. ¿Es incorrecto matemáticamente? No: hay una buena razón para
hacerlo, que se basa en el siguiente resultado.
Proposición 3.1.8. La aplicación h : Z → Q dada por
h(m) = m/1 ∈ Q, m ∈ Z,
tiene las siguiente propiedades:
(i) es inyectiva, h(m) 6= h(n) si m 6= n;
(ii) transforma sumas en sumas, h(m + n) = h(m) + h(n);
(iii) transforma productos en productos, h(m n) = h(m) h(n).
Es decir, h es un isomorfismo entre Z y h(Z), lo que significa que para todo lo referido a
operaciones algebraicas (con sumas, restas, productos, potencias) Z y h(Z) son indistinguibles:
toda ‘operación’ en uno de estos sistemas puede ser reproducida fielmente en el otro, lo que hace
innecesario a estos efectos diferenciar m de h(m). Por ello, desde este momento, consideramos
Z⊆Q y m = m/1 para todo m ∈ Z.

La idea de isomorfismo, “identificación de dos sistemas matemáticos que tienen las mismas
formas (de operar)”, abstrayendo ası́ su “esencia matemática”, es muy importante y está por todas
partes en Matemáticas. Uno y otro sistema puede verse como un ‘modelo’ distinto de un mismo
‘sistema abstracto’, dos caras de una misma moneda.(*)
Nota. Si se revisan cuidadosamente las demostraciones anteriores, se observará que, de entre todas
las propiedades de Z, sólo hemos necesitado las propiedades de la suma y el producto que hacen de
Z un dominio de integridad. Por tanto, la idea de sumergir un dominio de integridad en un ‘cuerpo
de fracciones’ es reutilizable en toda situación similar (por ejemplo, al tratar con polinomios). Ver
[GJPR], pp. 115 y ss.
La relación de orden en Z se puede extender a una relación de orden en Q.
Lema 3.1.9. Sean m/n, m0 /n0 fracciones equivalentes. Entonces mn > 0 si y sólo si m0 n0 > 0.
Demostración. Por hipótesis mn0 = m0 n, luego mnn0 = m0 n2 ; como n2 > 0, si mn > 0 se sigue que
m0 y n0 son ambos positivos o ambos negativos (no pueden ser nulos —¿por qué?), y en cualquier
caso m0 n0 > 0.
Definición 3.1.10. Sea m/n ∈ Q. Diremos que m/n es positivo si mn > 0.

Dados m/n, p/q ∈ Q, diremos que m/n es menor o igual que p/q, escrito m/n ≤ p/q, si
p/q − m/n es positivo o 0.
Obsérvese que el concepto de número racional positivo está bien definido, en virtud del lema
anterior. También, que un número racional m/n es positivo si y sólo si m/n > 0 (o sea, 0 ≤ m/n
y 0 6= m/n).
Proposición 3.1.11. La relación ≤ es una relación de orden en Q, y es un orden total.
Demostración. La manera más cómoda de comprobarlo pasa por examinar previamente algunas
propiedades del conjunto de los números racionales positivos, que denotaremos aquı́ por P (la
notación habitual es Q+∗ , demasiado complicada).
Primero, veamos que para todo número racional m/n se verifica una y sólo una de estas tres
alternativas: m/n = 0, m/n ∈ P , −m/n ∈ P (ley de tricotomı́a). En efecto, si no es m/n = 0,
tendremos que o bien mn > 0 (en cuyo caso m/n ∈ P ), o bien mn < 0, en cuyo caso (−m)n > 0 y
−m/n ∈ P ; y las alternativas son claramente excluyentes.
Después, P es estable o cerrado para la suma, es decir, si m/n, p/q ∈ P , también m/n+p/q ∈ P .
Supongamos m > 0, n > 0, p > 0, q > 0 (si no es ası́, basta sustituir la fracción m/n por la fracción
equivalente mn/n2 , o p/q por pq/q 2 ). Entonces m/n + p/q = (mq + pn)/pq ∈ P claramente, pues
(mq + pn)pq es un producto de enteros positivos.
Con esto, la relación ≤ es:
Reflexiva, pues m/n ≤ m/n cualquiera que sea m/n ∈ Q, ya que trivialmente m/n−m/n = 0.
Antisimétrica, siempre que m/n ≤ p/q y p/q ≤ m/n simultáneamente, ha de ser m/n = p/q,
porque en caso contrario, p/q − m/n y su opuesto m/n − p/q deberı́an ser simultáneamente
positivos, imposible.
(*)
Generalmente se identifican ambos modelos, como hemos hecho aquı́. Pero en algunas ocasiones, disponer de
varios ‘modelos’ sirve para ‘transferir intuición’ de uno a otro. La ventaja es obvia: si dos juegos distintos obedecen
a las mismas reglas, ganaremos con mayor facilidad jugando el que tenga la estrategia más evidente. Hay un ejemplo
precioso de ello en M. Gardner: Inspiración ¡ajá!. Labor, Barcelona, 1981 (reed. 1992)., pp. 116 y ss. Un feriante
tiene un mostrador con casillas numeradas del 1 al 9, y el juego consiste en ir poniendo monedas por turno (de 50
pesetas el feriante, de 5 pesetas el otro jugador); se lleva todo el dinero de la mesa el que primero ocupe tres casillas
distintas cuyos números sumen 15. El feriante gana siempre que quiere, porque sabe que, disponiendo los números en
un cuadrado mágico, el juego resulta isomorfo al ‘tres en raya’, sencillı́simo de jugar (merece la pena leer la exposición
original y los comentarios del maestro Martin Gardner).
Transitiva, de m/n ≤ p/q y p/q ≤ r/s se sigue m/n ≤ r/s; esto es evidente si m/n = p/q o
p/q = r/s. Si no es este el caso, tendremos r/s − m/n = (r/s − p/q) + (p/q − m/n), suma de
dos racionales positivos, luego positivo.
Un orden total, pues dados m/n, p/q ∈ Q, o p/q − m/n es 0 (con lo cual m/n = p/q), o es
positivo (y ası́ m/n ≤ p/q) o −(p/q − m/n) = m/n − p/q es positivo (lo que da p/q ≤ m/n)
Nota. ¿Se respeta el orden antiguo en Z? Puesto que hemos identificado m ∈ Z con m/1 ∈ Q,
dados m y n ∈ Z disponemos de dos ‘criterios’ para escribir m ≤ n. Pero en la nueva definición,
m ≤ n significa literalmente m/1 ≤ n/1, o sea, que n/1 − m/1 = (n − m)/1 es 0 (en cuyo caso
n − m = 0, i.e. n = m) o es un número racional positivo, es decir, que (n − m) · 1 > 0, i.e., n > m;
en cualquier caso, m ≤ n en la relación de orden de Z.
En consecuencia, la aplicación h : Z → Q que permitı́a identificar Z con h(Z) conserva también
las desigualdades, por lo que Z y h(Z) son ası́ mismo ‘indistinguibles’ (isomorfos) por lo que respecta
a las propiedades de orden.
Es importante saber cómo “se suman y multiplican desigualdades”. Las reglas fundamentales
son las siguientes.
Proposición 3.1.12. Dados m/n, p/q, r/s ∈ Q, se tiene:
(Compatibilidad del orden con la suma) si m/n ≤ p/q, entonces m/n + r/s ≤ p/q + r/s;
(Compatibilidad del orden con el producto por elementos no negativos) si m/n ≤ p/q, y
además r/s ≥ 0, entonces m/n · r/s ≤ p/q · r/s.
En particular, de m/n ≥ 0 y p/q ≥ 0 se sigue m/n p/q ≥ 0.
Demostración. Para la suma basta tener en cuenta que (p/q + r/s) − (m/n + r/s) = p/q − m/n y
aplicar la definición.
Para el producto, notemos primero que si a/b y c/d son números racionales positivos, también
a/b · c/d = ac/bd es positivo, ya que (ac)(bd) = (ab)(cd) > 0. Por tanto, si m/n ≤ p/q, y r/s ≥ 0,
como
p/q · r/s − m/n · r/s = (p/q − m/n) · r/s,
el segundo término es un producto de factores positivos o nulos, y por lo anterior es positivo o nulo.
Un cuerpo en el que se ha definido un orden total que tenga las dos propiedades anteriores se
llama cuerpo conmutativo totalmente ordenado . Podemos resumir entonces las propiedades
vistas diciendo
Q es un cuerpo conmutativo totalmente ordenado.
La enumeración diagonal de Cantor hizo plausible la existencia de una aplicación biyectiva entre
N y Q (i. e., que Q es numerable). Sin embargo, aunque en este sentido N y Q tienen ‘la misma
cantidad de elementos’, los tienen ‘repartidos’ de manera totalmente distinta, como muestran los
siguientes resultados.
Proposición 3.1.13. Entre dos números racionales hay otro número racional.
a+b
Demostración. Dados a, b ∈ Q, si a < b es a < < b, porque
2
a+b a + b − 2a b−a 1
−a= = = (b − a) > 0,
2 2 2 2
ya que b − a > 0 por hipótesis y 1/2 > 0 (¿por qué?). Análogamente
a+b 2b − (a + b) b−a
b− = = > 0.
2 2 2
Proposición 3.1.14. En Q no se cumplen los principios del máximo ni del mı́nimo.
Demostración. Por ejemplo, A = {x ∈ Q : 0 < x < 1} es un conjunto no vacı́o (¿por qué?) acotado
superiormente por 1 e inferiormente por 0. Pero no tiene elemento máximo ni elemento mı́nimo: si
fuese M = máx A, serı́a M ∈ A y por tanto 0 < M < 1; pero según acabamos de probar, existirı́a
x ∈ Q entre M y 1, con lo cual 0 < M < x < 1, es decir, x ∈ M y x > M , por lo que M no puede
ser el máximo de A. Análogamente se prueba con el mı́nimo.
Ejercicios
12.1. Hallar las fracciones irreducibles equivalentes a 36/50, 444/33, 231 107/999 999 989.
12.2. Sean a/m y b/n fracciones irreducibles. Probar que (an + bm)/(mn) es irreducible si y sólo
si m y n son relativamente primos.
12.3. Probar que en todo cuerpo K totalmente ordenado (en particular, en Q) se verifica:
(i) x2 ≥ 0 para cada x ∈ K, y x2 = 0 si y sólo si x = 0.
(ii) 1 > 0 (unidad y cero de K).
(iii) Para 2 = 1 + 1 (en K) y 1/2 = inverso de 2 en K, 0 < 1/2 < 1.
12.4. Sean m, n, p, q enteros positivos tales que m ≤ p ≤ q y p/q ≤ m/n. Probar que n−m ≤ q −p.
Comprobar que esta conclusión no siempre es cierta si m ≤ q < p y p/q ≤ m/n.
12.5. Sean m, n, p, q enteros positivos tales que m/n < p/q. Probar que
m/n < (m + p)/(n + q) < p/q.
12.6. Paradoja de Simpson. En un curso hay dos grupos, el grupo de la mañana y el grupo
de la tarde. En el grupo de la mañana hay A chicas y B chicos, y en el de la tarde hay C chicas
y D chicos. En el primer examen aprueban a chicas y b chicos del grupo de la mañana, y en el
de la tarde aprueban c chicas y d chicos. Tanto en el grupo de la mañana como en el de la tarde
el porcentaje de chicas aprobadas es menor que el de chicos aprobados. ¿Podemos afirmar que el
porcentaje global de aprobados será menor para las chicas que para los chicos?
Examinar el caso A = 14, B = 6, C = 6, D = 19, a = 11, b = 5, c = 2, d = 7. ¿Cómo se explica
esto?
(Ver [D’A-W], pp. 129–130, y [1].)
3.2. Polinomios
Ya es de sobras conocido que las expresiones tales como
x2 + 1, −x3 − (5/2)x + 1, (47/8)x6 − 3x2 + (6/5)x + 2, . . .
y, en general,
an xn + an−1 xn−1 + · · · + a1 x + a0 ,
donde n ∈ N, a0 ,. . . , an ∈ Q, reciben el nombre de polinomios sobre Q o polinomios con coefi-
cientes racionales. Pero el nombre ‘polinomio’ encubre, en realidad, dos conceptos diferentes: el de
polinomio formal o polinomio en sentido estricto y el de función polinómica. En el primer sentido,
manejamos los polinomios como ‘fórmulas’ o ‘expresiones simbólicas’, sin darle a x ningún conte-
nido determinado —dejando la x ‘indeterminada’— y operando con ella, por ası́ decir, como un
objeto ‘que no se mezcla’ con los coeficientes.(**) En el segundo sentido, se piensa en la función
que a cada x de un cierto conjunto de números (u otros objetos: clases de restos, matrices, . . . )
hace corresponder el número (o . . . ) que resulta al calcular an xn + an−1 xn−1 + · · · + a1 x + a0 .
Distinguiremos, pues, entre estos conceptos, reservando el nombre de polinomio para el primero
y llamando función polinómica al segundo.
A lo largo del curso, en esta y otras asignaturas, se manejarán no solamente polinomios con
coeficientes en Q, sino también polinomios con coeficientes reales y complejos. Muchas de las pro-
piedades de los polinomios son comunes en todos estos casos, dependen únicamente de que los
coeficientes pertenezcan a un cuerpo. Para dejarlo más claramente de manifiesto, trataremos por
ello inicialmente con polinomios sobre un cuerpo conmutativo arbitrario K, que podrá ser en su mo-
mento Q, R o C (sin olvidar los cuerpos Zp , tan importantes en aplicaciones). Cuando sea oportuno,
iremos estudiando algunas propiedades especı́ficas de los polinomios con coeficientes racionales.
Mientras no se indique lo contrario, de aquı́ en adelante K representa un cuerpo conmutativo

cualquiera y X una indeterminada.
3.2.1. Definiciones. Suma y producto de polinomios.

Definición 3.2.1. Un polinomio sobre K en la indeterminada X es una expresión de la
forma
p(X) = a0 + a1 X + · · · + an−1 X n−1 + an X n ,
donde n ∈ N, a0 ,. . . , an ∈ K.
Para 1 ≤ k ≤ n, el elemento ak se llama coeficiente de X k en p = p(X); a0 es el término
independiente o constante de p (puede verse como el coeficiente de X 0 ); si k > n, se entiende
(cuando sea conveniente) que el coeficiente de X k en p es 0.
Cuando ak = 1 sólo se pone X k , y −X k si ak = −1; cuando ak = 0 el término +0 · X k
suele omitirse (ası́, para cada a ∈ K, a puede entenderse también como el polinomio ‘constante’
a + 0 · X + 0 · X 2 + 0 · X 3 + · · · ).
El polinomio nulo o cero es aquél cuyos coeficientes son todos cero; se denotará por 0.
Dados dos polinomios
p(X) = a0 + a1 X + · · · + an−1 X n−1 + an X n , q(X) = b0 + b1 X + · · · + bm−1 X m−1 + am X m ,
que p(X) y q(X) sean iguales significa que a0 = b0 , a1 = b1 y, en general, ak = bk para todo k ∈ N,
teniendo en cuenta el convenio anterior de que ak = 0 si k > n y bk = 0 si k > m.
(**)
Es posible dar un sentido preciso a estas nociones un tanto vagas de expresiones simbólicas o formales y de
indeterminada; nosotros nos conformaremos con la idea intuitiva, remitiendo para una definición más rigurosa p. ej.
al libro de Godement, R.: Cours d’algébre. Hermann, Paris, 1963., p. 353.
3.2. POLINOMIOS 97
Al conjunto de los polinomios sobre K en la indeterminada X (también llamados polinomios

con coeficientes en K) lo denotaremos por K[X].
Definición 3.2.2. Si un polinomio p(X) no tiene todos los coeficientes nulos, su grado es el
máximo n tal que an 6= 0, y este coeficiente an recibe entonces el nombre de coeficiente director .
Si el coeficiente director es igual a 1, se dice que p(X) es un polinomio mónico .
El grado de un polinomio p suele denotarse por deg p.

Observemos que al polinomio nulo no le asignamos ningún grado (en algunos textos se considera
deg 0 = −∞). Los polinomios de grado cero o constantes se corresponden con los elementos no nulos
de K.
La suma de polinomios se define sumando ordenadamente los coeficientes correspondientes a la
misma potencia de X. Concretamente,
Definición 3.2.3. Dados dos polinomios en K[X],
p = a0 + a1 X + a2 X 2 + · · · + an X n , q = b 0 + b 1 X + b2 X 2 + · · · + bm X m ,
su suma es el polinomio
p + q = (a0 + b0 ) + (a1 + b1 )X + (a2 + b2 )X 2 + · · ·
(se entiende ak = 0 o bk = 0 donde sea necesario).
Nota. Es cómodo disponer de una cierta flexibilidad a la hora de escribir polinomios, sin tener que
estar sujetos a la rigidez de la forma
p(X) = a0 + a1 X + · · · + an−1 X n−1 + an X n
que exige en principio nuestra definición.

Tras la introducción de la suma, es claro que el polinomio p(X) podrá escribirse igualmente
como
p(X) = an X n + an−1 X n−1 + · · · + a1 X + a0
por ejemplo, sin más que interpretar el segundo término como el polinomio suma de los polinomios
an X n , an−1 X n−1 , . . . , a1 X, a0 . Lo mismo puede decirse si los sumandos aparecen en cualquier otro
orden.
Aprovechando esta situación, en lo sucesivo emplearemos el siguiente
convenio: cuando escribamos un polinomio no nulo p 6= 0 en la forma
an X n + an−1 X n−1 + · · · + a1 X + a0 ,
sobreentenderemos que an es su coeficiente director, es decir, que n es su grado y que an 6= 0.

Ejercicio. Si p, q, p + q ∈ K[X] \ {0}, y
p(X) = an X n + an−1 X n−1 + · · · + a1 X + a0 , q(x) = bm X m + bm−1 X m−1 + · · · + b1 X + b0 ,
probar que el grado de p + q es menor o igual que máx{n, m}, siendo el menor estricto solamente
cuando p y q tienen el mismo grado (n = m) y sus coeficientes directores son opuestos, i.e.,
an + bn = 0.
El producto de polinomios se define por la ley ai X i · bj X j = ai bj X i+j , y buscando que sea
distributivo. Concretamente,
Definición 3.2.4. Dados dos polinomios en K[X],
p = a0 + a1 X + a2 X 2 + · · · + an X n , q = b 0 + b 1 X + b2 X 2 + · · · + bm X m ,
su producto es el polinomio
p · q = c0 + c1 X + c2 X 2 + · · · + cn+m X n+m ,
P
donde ck = i+j=k ai bj , es decir, que si 0 ≤ k ≤ n + m, ck = a0 bk + a1 bk−1 + · · · + ak−1 b1 + ak b0 ,
conviniendo como antes que si alguno de los coeficientes ai , bj no aparecen en p o en q, los tomamos
iguales a cero.
Obsérvese que p · 0 = 0 = 0 · p y que si p y q no son nulos, el coeficiente director de pq es el

producto del coeficiente director de p por el coeficiente director de q (ası́ que también pq 6= 0) y el
grado de pq es la suma del grado de p más el grado de q, deg(pq) = deg p + deg q .
Proposición 3.2.5. Con las operaciones suma y producto anteriores, K[X] es un dominio de
integridad.
Demostración. Se deja como ejercicio el comprobar las diferentes propiedades. Por ejemplo, el
polinomio nulo es el elemento neutro para la suma; el polinomio constante 1 es la identidad para
el producto. La propiedad cancelativa se sigue de que pr = qr es lo mismo que (p − q)r = 0, y este
producto sólo puede ser 0 si r = 0 o p − q = 0.
El espacio vectorial K[X]. En K[X] tenemos definida una suma, y disponemos además de un producto por
escalares ‘natural’: dados a ∈ K, p ∈ K[X], podemos definir a · p como el producto del polinomio constante
a por p. Es fácil comprobar que con esta suma y este producto por escalares, K[X] es un espacio vectorial
sobre K. En cierto sentido, es “el menor espacio vectorial sobre K de dimensión infinita”: una base obvia
está formada por la sucesión de polinomios
1, X, X 2 , . . . , X n , . . .
3.2.2. División de polinomios.

Proposición 3.2.6 (División euclı́dea). Dados p, q ∈ K[X] con q no nulo, existen dos polino-
mios c y r tales que
p = cq + r, con r nulo ó de grado estrictamente menor que q.
Con esta condición, los polinomios c y r, denominados respectivamente cociente y resto de la

división de p por q, son únicos.
Demostración.
Existencia. Si p = 0 o el grado de p es estrictamente menor que el de q, claramente p = 0 · q + p,
y se sigue lo pedido.
Suponiendo, pues, deg p ≥ deg q, procedemos por inducción sobre el grado de p. Si deg p = 0 (y
en consecuencia deg q = 0), tendrı́amos p = a0 , q = b0 6= 0, p = a0 b−1
0 q + 0.
Si el enunciado es cierto cuando el grado del dividendo es menor o igual que n − 1, n ∈ N,
veamos que también lo es cuando deg p = n. Sean an y bm los coeficientes directores de p y q
respectivamente. El polinomio p1 = p − an b−1
m X
n−m q tiene obviamente grado estrictamente menor
al de p. Si p1 = 0 o deg p1 < deg q, tomar c = an b−1 m X

n−m , r = p resuelve la cuestión; y
1
si deg p1 ≥ deg q, por la hipótesis de inducción el resultado es cierto para p1 , luego existen c1 ,
r ∈ K[X] tales que p1 = c1 q + r con r = 0 ó con r de grado estrictamente menor que el de q.
3.2. POLINOMIOS 99
Denotemos por c = an b−1

m X
n−m +c . Entonces p = cq +r, siendo r = 0 ó de grado estrictamente
1
menor que el de q, como querı́amos.
Unicidad. Sean c, c, r, r ∈ K[X] tales que cq + r = p = cq + r con r = 0 ó deg r < deg q, y r = 0
ó deg r < deg q. Entonces
r − r = (c − c)q,
y si r − r 6= 0, por las propiedades de los grados anteriormente señaladas deberı́a ser
deg q ≤ deg(c − c) + deg q = deg((c − c)q) = deg(r − r) ≤ máx{deg r, deg r} < deg q,
imposible.
Por lo tanto r = r, y ası́ (c − c)q = 0; pero q 6= 0, luego c = c.
Nótese que el grado proporciona, para la división de polinomios, el control del tamaño del resto
que para los enteros nos daba la condición 0 ≤ r < |q|.
La propia demostración sugiere el método habitual para efectuar la división, obteniendo suce-
sivamente los términos del cociente de mayor a menor grado.
Ejemplos. Dividir p(X) por q(X) en los siguientes casos:
• p(X) = −6X 4 + 4X 2 + X − 5, q(X) = 2X 2 − 1;
• p(X) = X 6 + 2X 5 + 5X 4 + 7X 3 + X 2 + 3X + 5, q(X) = X 3 + 5X + 3;
• p(X) = X 7 + 1, q(X) = X + 1.
3.2.3. Máximo común divisor. Algoritmo de Euclides.

Definición 3.2.7. Sean p, q ∈ K[X]. Decimos que p divide a q, o que p es un divisor o factor
de q, o que q es múltiplo de p, escrito p|q, si existe c ∈ K[X] tal que q = pc; expresado de otra
forma, si el resto de la división de q por p es 0. Diremos entonces que c es el cociente exacto q/p
o el cofactor de p.
Observaciones. Como consecuencias inmediatas de la definición, se obtienen: dados polinomios

arbitrarios p, q, r, s, t ∈ K[X], y a ∈ K[X] de grado 0 (i.e., constante y no nulo)
(i) p|p (propiedad reflexiva)
(ii) p|q y q|r implica p|r (propiedad transitiva)
(iii) p|q y p|r implica p|(sq + tr) (propiedad de linealidad)
(iv) p|q implica pr|qr (propiedad de multiplicación)
(v) pr|qr y r 6= 0 implica p|q (ley de cancelación)
(vi) p|0 (todo polinomio divide a 0)
(vii) 0|p implica p = 0 (0 sólo divide a 0)
(viii) p|q y q 6= 0 implica deg p ≤ deg q (propiedad de comparación)
(ix) a|p siempre que deg a = 0 (los polinomios de grado 0 dividen a
cualquier polinomio)
(x) p|q y q|p si y sólo si p = aq para algún a de grado 0.
La situación reflejada en (x) se corresponde, en Z, con el hecho de que p|q y q|p simultáneamente
si y sólo si p = aq para a = 1 o a = −1. Con polinomios encontramos un mayor número de
posibilidades, lo que provoca una cierta ambigüedad en la definición de conceptos tales como el de
máximo común divisor o mı́nimo común múltiplo.
Definición 3.2.8. Dados p, q ∈ K[X], diremos que d ∈ K[X] es un máximo común divisor
de p y q si d|p, d|q, y si d0 ∈ K[X] también cumple d0 |p, d0 |q, entonces d0 |d (en palabras, si d es un
divisor común de p y q que a su vez es múltiplo de todos los divisores comunes de p y q).
Obsérvese que hemos definido un máximo común divisor, y no el máximo comun divisor, porque
si d cumple la condición del enunciado, también la cumple ad para cualquier a de grado 0, dado
que d|ad y ad|d. Para seleccionar entre todos ellos un único polinomio, basta exigir ‘en condiciones
normales’ que sea mónico (con coeficiente director 1).
Lema 3.2.9. Dados p, q ∈ K[X] tales que p 6= 0 o q 6= 0, si d, d ∈ K[X] son máximos comunes
divisores de p y q, existe a ∈ K[X] de grado 0 (i.e., un polinomio constante no nulo) tal que d = ad.
Por tanto, si d y d son mónicos, entonces d = d.
Demostración. Aplicando la definición, necesariamente d 6= 0, d 6= 0, d|d y d|d. Por tanto, d = ad
para algún a de grado 0, y deg d = deg d; si estos polinomios son de grado n, y ambos fuesen mónicos,
tendrı́amos d = X n + bn−1 X n−1 + · · · = ad = a(X n + cn−1 X n−1 + · · · ) = aX n + acn−1 X n−1 + · · · ,
y forzosamente a = 1, d = d.
Examinando el caso excluido, p = q = 0, vemos que la definición dejarı́a como máximo común
divisor de p y q tan sólo al 0.
Definición 3.2.10. Dados p, q ∈ K[X] tales que p 6= 0 o q 6= 0, pondremos mcd(p, q) = d si d es
un (el) máximo común divisor mónico de p y q. Para p = q = 0, pondremos mcd(p, q) = 0.
Atención: la existencia de algún máximo común divisor no está garantizada todavı́a; la demos-
tración que hicimos en Z no es traspasable sin más a los polinomios. Afortunadamente, el algoritmo
de Euclides sigue siendo aplicable con el mismo esquema.
Lema 3.2.11. Si p, q, r, c ∈ K[X] son tales que p = cq + r, se tiene que mcd(p, q) = mcd(q, r).
Demostración. El caso q = 0 es trivial. Si q 6= 0, bastará ver que p y q tienen los mismos divisores
comunes que q y r, lo cual es cierto por la propiedad de linealidad.
Lema 3.2.12. Dados p, q ∈ K[X] tales que q|p, q es un máximo común divisor de p y q. En
particular, q es un máximo común divisor de q y 0.
Demostración. Consecuencia trivial de la definición.
Definición 3.2.13. Algoritmo de Euclides para polinomios.
• Input: dos polinomios a y b.
• Output: un máximo común divisor de a y b.
Paso 1: Reemplazar
a por b, y
b por el resto de la división de a por b.
Paso 3: Devolver a.
Proposición 3.2.14. Algoritmo de Euclides. Dados dos polinomios no nulos a y b con deg a ≥
deg b, obtenemos un máximo común divisor procediendo por divisiones enteras sucesivas, como se
ha indicado anteriormente, hasta obtener resto nulo. El último resto no nulo es un máximo común
divisor de a y b.
Demostración. Aplicar los lemas.
El caso de polinomios nulos ya lo hemos comentado.

Por las mismas razones que en Z se tiene una ‘identidad de Bézout’ (repasar las demostraciones).
3.2. POLINOMIOS 101
Proposición 3.2.15. Identidad de Bézout. Sean p y q ∈ K[X] no nulos, y d = mcd(p, q).

Entonces existen polinomios u, v tales que
d = up + vq.
Tenemos igualmente:
Definición 3.2.16. Algoritmo de Euclides extendido (Euclides-Bézout) para polinomios.
• Input: dos polinomios a y b.
• Output: dos polinomios u y v tales que, salvo constantes, mcd(a, b) = ua + vb.
Paso 1: Hacer u = y = 1 e v = x = 0.
Paso 2: Determinar c y r tales que a = cb + r y r = 0 o deg r < deg b.
Reemplazar
a por b, y b por r,
u por x y v por y,
x por u − cx e y por v − cy.
Paso 4: Devolver u y v.
Visualizado en forma de tabla:
restos & r1 r2 r3 ······ rn−1 0

cocientes c c1 c2 c3 ······ cn−1 cn
uk+1 =xk 1 0 1 ··· ······ un−1 u
vk+1 =yk 0 1 −c1 ··· ······ vn−1 v
xk+1 =uk −ck+1 xk 0 1 −c2 ··· ······ xn−1 = u
yk+1 =vk −ck+1 yk 1 −c1 1 + c1 c2 ··· ······ yn−1 =v
Ejercicios. Aplicar el algoritmo de Euclides-Bézout a los polinomios
• p(X) = X 6 − 2X 5 + 3X 4 − 4X 3 + 3X 2 − 2X + 1, q(X) = 3X 5 − 5X 4 + 6X 3 − 6X 2 + 3X − 1;
• p(X) = X 5 + X 4 + 2X 3 − 2X + 3, q(X) = X 4 + 3X 3 + 7X 2 + 8X + 6.
Midiendo el tamaño de los polinomios por el grado, también los máximos comunes divisores son
‘máximos’ en este sentido.
Proposición 3.2.17. Sean p, q, r ∈ K[X]. Si pq 6= 0 y r es un divisor común de p y q de grado

máximo, entonces r es un máximo común divisor de p y q.
Demostración. Sea d = mcd(p, q). Según la definición, r|d, y en consecuencia deg r ≤ deg d. Pero
por hipótesis deg d ≤ deg r, luego r = ad para algún a de grado 0 y r es un máximo común divisor
de p y q.
Los resultados sobre enteros que obtuvimos como consecuencia de la identidad de Bézout pueden
probarse para polinomios adaptando las demostraciones (comprobarlo).
Definición 3.2.18. Dos polinomios no nulos p y q se dicen relativamente primos o primos

entre sı́ si no tienen más divisores comunes que los polinomios de grado 0, es decir, si mcd(p, q) =
1.
Corolario 3.2.19. Dos polinomios no nulos p y q son relativamente primos si y sólo si existen
dos polinomios u y v tales que up + vq = 1.
También:
Proposición 3.2.20. Sean p, q, d, r, s, t ∈ K[X], pq 6= 0.
(i) si d = mcd(p, q), p = dr, q = ds, entonces mcd(r, s) = 1 (es decir, r y s son relativamente
primos).
(ii) si mcd(r, s) = 1 y r | st, entonces r | t.
El concepto de máximo común divisor es aplicable a un número finito arbitrario de polinomios.
Definición 3.2.21. Sea {p1 , p2 , . . . , pm } una familia finita de polinomios de K[X] no nulos. Dire-
mos que un polinomio p ∈ K[X] es un máximo común divisor de la familia {p1 , p2 , . . . , pm }
si verifica:
(i) p divide a pi para i = 1, 2, . . . , m, y
(ii) si q ∈ K[X] divide a pi , para todo i = 1, 2, . . . , m, entonces q divide p.
Ası́ p es el “mayor” de los divisores comunes de todos los pi .
Igual que en Z, para hallar un máximo común divisor de una familia {p1 , p2 , . . . , pm } basta ir
obteniendo un máximo común divisor q1 de p1 y p2 , un máximo común divisor q2 de q1 y p3 , un
máximo común divisor q3 de q2 y p4 , . . .
Se puede probar:
Proposición 3.2.22. En K[X] existe un máximo común divisor de cualquier familia finita de
polinomios no nulos {p1 , p2 , . . . , pm }. Además podemos elegir un tal máximo común divisor que sea
mónico, y entonces es único.
Proposición 3.2.23 (Identidad de Bézout general). . Si p es un máximo común divisor de la

familia {p1 , p2 , . . . , pm }, entonces existen g1 , . . . , gm ∈ K[X] tales que p = g1 p1 + · · · + gm pm .
Como en Z, en K[X] puede definirse también el mı́nimo común múltiplo de dos polinomios (o
de una familia finita).
Definición 3.2.24. Un polinomio m se dice que es un mı́nimo común múltiplo de la familia

finita de polinomios no nulos {p1 , p2 , . . . , pr } si verifica:
1. pi divide a m para i = 1, 2, . . . , r, y
2. si q ∈ K[X] verifica que pi divide a q, (i = 1, 2, . . . , r), entonces m divide q.
Ası́, m es el “menor” de los múltiplos comunes de todos los pi .
Proposición 3.2.25. En K[X] existe un mı́nimo común múltiplo de cualquier familia finita de
polinomios no nulos {p1 , p2 , . . . , pr }. Además entre todos ellos existe uno y sólo uno que es mónico.
Ejercicio. Dados p, q ∈ K[X] tales que pq 6= 0, ¿es cierto que
mcm(p, q) · mcd(p, q) = pq?
En caso negativo, ¿qué relación es cierta?

3.2. POLINOMIOS 103
3.2.4. Funciones polinómicas. Raı́ces de polinomios.

Definición 3.2.26. Sea p(X) = a0 + a1 X + a2 X 2 + · · · + an X n ∈ K[X] un polinomio y a un
elemento de K. La evaluación o el valor de p(X) en a es el elemento de K, denotado por p(a),
dado por
p(a) = a0 + a1 a + a2 a2 + · · · + an an
(obtenido ‘sustituyendo la indeterminada X por el elemento a en la expresión del polinomio’).
La aplicación de K en K que a cada x ∈ K hace corresponder el valor de p(X) en x es la
función polinómica correspondiente al polinomio p, y suele denotarse igualmente con p si no es
motivo de confusión.
Un elemento c ∈ K se dice que es un cero o una raı́z del polinomio p si p(c) = 0.
Notas.
• La suma y el producto de polinomios están definidos justamente para que, cualesquiera que
sean p, q ∈ K[X], a ∈ K, se obtenga
(p + q)(a) = p(a) + q(a), (pq)(a) = p(a) q(a).
• En general, la función polinómica no determina el polinomio que la define: dos polinomios

distintos pueden dar lugar a la misma función (y esta es una razón más para distinguir ambos
conceptos). Por ejemplo, para K = Zp , p entero primo, el pequeño teorema de Fermat nos
dice que las funciones polinómicas corespondientes a los polinomios X p y X son iguales, o
que la asociada al polinomio no nulo X p − X es la función nula.
• El valor de un polinomio en un a ∈ K se halla mediante el conocido algoritmo de Hor-

ner/Ruffini, habida cuenta que
p(a) = a0 + a1 a + a2 a2 + · · · + an an = a0 + a(a1 + a(a2 + a(· · · + a(an−1 + aan ) · · · ))).
Los cálculos se disponen según el esquema

an an−1 ... ak ... a1 a0
a) a an ... a bk+1 ... a b2 a b1
an bn−1 ... bk ... b1 ( b0
donde bk = a bk+1 + ak y b0 = a0 + a b1 = a0 + a (a1 + a b2 ) = a0 + a (a1 + a (a2 + a b3 )) = . . . = p(a).
Ası́ se efectúan solamente n multiplicaciones y n sumas, mientras que el cálculo directo supone
n(n + 1)/2 multiplicaciones y n sumas; este algoritmo es fácil de programar y es muy estable
numéricamente (‘pequeños errores en los datos producen errores pequeños en el resultado’).
Teorema 3.2.27 (Teorema del resto). Sea p(X) ∈ K[X], a ∈ K. El resto de dividir p por X − a
es p(a). Consecuentemente, a es raı́z de p si y sólo si X − a divide a p.
Demostración. Por el algoritmo de la división, existen c, r ∈ K[X] tales que
p(X) = c(X)(X − a) + r(X), con r = 0 ó deg r < deg(X − a) = 1,
y ası́ r tiene que ser constante . Por tanto p(a) = c(a)(a − a) + r = r, de donde se sigue lo pedido.
Nota. El cociente es an X n−1 + bn−1 X n−2 + · · · + bk X k−1 + · · · + b1 con los bk del algoritmo de
Horner/Ruffini (comprobarlo multiplicando este polinomio por X − a).
Ejemplo. Sean p(X) = 7 − 9X + 4X 3 − 8X 4 , q(X) = 2X − 3. Para hallar el cociente y el resto
de la división de p por q, tendremos en cuenta que q(X) = 2(X − 3/2) y p = cq + r si y sólo si
1
p = 2c · q + r, luego usando el algoritmo de Horner/Ruffini
2
−8 4 0 −9 7
3/2) −12 −12 −18 −81/2
−8 −8 −12 −27 (−67/2
con lo cual r = −67/2, 2c = −8X 3 − 8X 2 − 12X − 27, c = −4X 3 − 4X 2 − 6X − 27/2.
Ejercicios.
1. Sean p, q ∈ Q[X] dados por p(X) = X 4 − 6X 3 + 2X 2 + 3X − 4, q(X) = X 2 − X − 2 =
(X + 1)(X − 2). Probar que q no divide a p sin efectuar la división.
2. Si se divide un cierto polinomio p por X − 1 el resto es −2; si lo dividimos por X + 2 el resto
es 79. ¿Cuál es el resto que se obtiene al dividirlo por (X − 1)(X + 2)?
Corolario 3.2.28. Un polinomio de grado n puede tener a lo más n raı́ces distintas.
Demostración. Puesto que si c1 , . . . , ck son raı́ces distintas de un polinomio p, éste es divisible por
(X − c1 ) · · · (X − ck ), y por tanto debe tener grado mayor o igual que k.
Corolario 3.2.29. Sean p, q ∈ K[X] de la forma
p(X) = a0 + a1 X + · · · + an X n , q(X) = b0 + b1 X + · · · + bn X n ,
y supongamos que K tiene por lo menos n + 1 elementos distintos. Entonces:

(i) p es el polinomio nulo si y sólo si la función polinómica p se anula en n + 1 puntos distintos.
(ii) los polinomios p y q son iguales si y sólo si las funciones polinómicas p y q toman el mismo
valor en n + 1 puntos distintos.
Demostración.
(i) Si no fuese p = 0 tendrı́amos un polinomio de grado menor o igual que n con n + 1 raı́ces
distintas.
(ii) La función polinómica p − q se anula en n + 1 puntos distintos.
Las funciones polinómicas (especialmente sobre R y C) son muy útiles en las aplicaciones,
debido sobre todo a que es fácil calcular con ellas, y además sirven para aproximar funciones
más complicadas. Por ejemplo, siempre es posible encontrar explı́citamente un polinomio que tome
valores arbitrarios en una colección finita de puntos prescritos de antemano, como muestra el
siguiente resultado.
Proposición 3.2.30 (Teorema de interpolación de Lagrange). Dados n elementos distintos
x1 , . . . , xn ∈ K y n valores arbitrarios y1 , . . . , yn ∈ K (n ∈ N), existe un polinomio p ∈ K[X]
nulo o de grado n − 1 a lo más, y uno sólo, tal que p(x1 ) = y1 , . . . , p(xn ) = yn . Dicho polinomio
viene dado por la fórmula de interpolación de Lagrange
(X − x2 ) · · · (X − xn ) (X − x1 ) · · · (X − xk−1 )(X − xk+1 ) · · · (X − xn )
p(X) = y1 + · · · + yk
(x1 − x2 ) · · · (x1 − xn ) (xk − x1 ) · · · (xk − xk−1 )(xk − xk+1 ) · · · (xk − xn )
(X − x1 ) · · · (X − xn−1 )
+ · · · + yn .
(xn − x1 ) · · · (xn − xn−1 )
Demostración. El polinomio del enunciado es de grado n − 1 a lo más (o nulo si los yk son todos
nulos), y para cada k, 1 ≤ k ≤ n, cumple que f (xk ) = yk (todos los sumandos son nulos salvo el
k-ésimo, que es yk · 1).
La unicidad es consecuencia del corolario anterior.
Ejercicio. ¿Qué valores han de tener a, b, c ∈ Q para que p(X) = aX 2 + bX + c cumpla p(−1) = 1,
p(−2) = 2, p(−3) = 7?
3.2. POLINOMIOS 105
Raı́ces múltiples.
Sea c una raı́z de un polinomio no nulo p ∈ K[X]. Según hemos probado, tendremos p =
(X − c)p1 para algún p1 ∈ K[X]. Si c fuese también raı́z de p1 , análogamente p1 = (X − c)p2 y
p = (X − c)2 p2 . Reiterando, llegaremos a encontrar un m ∈ N tal que p = (X − c)m pm y c ya NO
es raı́z de pm (va incluida la posibilidad de que pm sea constante).
Definición 3.2.31. Sea c una raı́z de un polinomio p ∈ K[X]. Diremos que c es una raı́z de
multiplicidad m si p = (X − c)m q para algún q ∈ K[X] tal que q(c) 6= 0; dicho de otro modo, si
m es el mayor número natural tal que (X − c)m |p.
Cuando m = 1, suele decirse que a es una raı́z simple ; cuando m = 2, que es una raı́z doble ;
cuando m = 3, que es una raı́z triple , etc.
Diremos que a es una raı́z múltiple para indicar que su multiplicidad es mayor o igual que 2
(o sea, que no es simple).
Se sigue inmediatamente que para un polinomio p cuyas raı́ces sean c1 , . . . , ck , con multiplici-
dades respectivas m1 . . . , mk , hay una factorización
p = (X − c1 )m1 · · · (X − ck )mk q, donde q es un polinomio que no tiene raı́ces en K.
(cuando K = C, esto obliga a que q sea constante, como comentaremos posteriormente.)
Una herramienta importante en el estudio de las raı́ces múltiples es la derivación de polinomios,
que puede definirse ‘formalmente’ para cualquier polinomio sin necesidad del concepto de lı́mite, y
que obedece a las reglas conocidas para la derivación de los polinomios reales.
Definición 3.2.32. Dado un polinomio
p(X) = a0 + a1 X + a2 X 2 + · · · + an X n ∈ K[X],
su polinomio derivado es
p0 (X) = a1 + 2a2 X + 3a3 X 2 + · · · + nan X n−1 ∈ K[X].
El polinomio derivado de p0 es el segundo derivado p00 de p, y reiterando se obtienen los sucesivos
derivados p000 , . . . , p(k) , . . .
Las funciones polinómicas asociadas a estos polinomios son la derivada primera de la función
polinómica p, la derivada segunda, . . . , la derivada k-ésima, . . .
Lema 3.2.33. Dados p, q, a ∈ K[X], se tiene
(i) (p + q)0 = p0 + q 0 ;
(ii) (pq)0 = p0 q + q 0 p;
(iii) si a constante, a0 = 0 y (ap)0 = ap0 .
Demostración. Basta aplicar (con paciencia) la definición.
Proposición 3.2.34. Sea K un cuerpo conmutativo que contiene a Q. Dado p ∈ K[X] no nulo,
(i) las raı́ces múltiples de p, con multiplicidad m, son raı́ces de p0 con multiplicidad m − 1;
(ii) las raı́ces múltiples de p son exactamente las raı́ces del máximo común divisor de p y p0 ; y
un c ∈ K es raı́z de p con multiplicidad m si y sólo si es raı́z de mcd(p, p0 ) con multiplicidad
m − 1;
(iii) c ∈ K es una raı́z de p de orden m ≥ 1 si y sólo si la primera derivada no nula de p en c es
la de orden m:
p(c) = 0, p0 (c) = 0, . . . , p(m−1) (c) = 0, p(m) (c) 6= 0.
Demostración.
(i) c ∈ K es una raı́z de p de orden m ≥ 1 si y sólo si p = (X − c)m q con q(c) 6= 0; pero entonces,
cuando m ≥ 2, p0 = m(X −c)m−1 q +(X −c)m q 0 = (X −c)m−1 [mq +(X −c)q 0 ] = (X −c)m−1 q1
y q1 (c) = mq(c) + 0 · q 0 (c) = mq(c) 6= 0 ya que m 6= 0, con lo cual c es una raı́z de p0 de
multiplicidad m − 1.
(ii) Si c ∈ K es una raı́z de p de multiplicidad m, es raı́z de p0 de multiplicidad m − 1 según
acabamos de probar, y (X − c)m−1 divide por tanto a p y a p0 , pero (X − c)m no, luego
(X − c)m−1 también divide a mcd(p, p0 ) y (X − c)m no lo divide, es decir, c es una raı́z de
mcd(p, p0 ) de multiplicidad m − 1.
Recı́procamente, si c es una raı́z de d = mcd(p, p0 ) de multiplicidad k, (X − c)k divide a d y
por tanto divide a p y a p0 , o sea, c es raı́z de p y p0 de multiplicidad al menos k, luego c es
entonces una raı́z de p de multiplicidad necesariamente igual a k + 1.
(iii) Si c ∈ K es una raı́z de p de orden m, aplicando reiteradamente (i), es una raı́z de orden
m − 1 de p0 , de orden m − 2 de p00 , . . . , de orden 1 de p(m−1) . En consecuencia, p(m−1) (c) = 0,
p(m) (c) 6= 0.
Supongamos ahora que
p(c) = 0, p0 (c) = 0, . . . , p(m−1) (c) = 0, p(m) (c) 6= 0.
Recorriendo a la inversa el camino anterior, c es una raı́z de p(m−1) necesariamente simple,
una raı́z de p(m−2) forzosamente doble, . . . , una raı́z de p obligatoriamente de multiplicidad
m.
Nótese que p0 puede tener raı́ces que no son raı́ces de p: por ejemplo, si p = X 2 − 1, p0 = 2X.
Ejercicio. Hallar todas las raı́ces múltiples de X 5 + 3X 4 + 4X 3 + 4X 2 + 3X + 1.
Raı́ces en Q.
El estudio y localización (exacta o aproximada) de los ceros de los polinomios es de gran
importancia en numerosos ámbitos de las Matemáticas, como irá comprobando el lector a lo largo
de sus estudios. La determinación de los valores que alcanzan las funciones polinómicas es también,
esencialmente, un problema de ceros, puesto que p(x) = y ∈ K para algún x ∈ K si y sólo si
p(x) − y = 0, i.e., si x es un cero del polinomio p(X) − y. En estos tipos de cuestiones intervienen de
manera decisiva las propiedades especı́ficas del cuerpo que se considera. Por ejemplo, en cualquier
cuerpo totalmente ordenado (Q, R, . . . ) se tiene para todo x ∈ K que x2 ≥ 0, x2 + 1 ≥ 1 > 0,
luego X 2 + 1 no tiene ningún cero en estos cuerpos. Tampoco X 2 − 2 tiene ceros en Q (¿por qué?),
aunque los tiene en R como sabemos.
No hay, en general, fórmulas ‘razonables’ que permitan expresar las raı́ces de un polinomio
cualquiera en función de sus coeficientes (la búsqueda de tales fórmulas ha desempeñado un papel
importantı́simo en la historia de las Matemáticas, ver p. ej. [2], [3], [4], [5]). En este apartado
expondremos algunos criterios muy sencillos que permiten limitar la búsqueda de las raı́ces de los
polinomios en Q. La herramienta básica es la divisibilidad de números enteros, dado que podemos
conocer las raı́ces de un polinomio en Q hallando las de un polinomio con coeficientes en Z. En
efecto, si tenemos un polinomio
p(X) = a0 + a1 X + a2 X 2 + · · · + an X n ∈ Q[X],
y los coeficientes a0 , . . . , an se expresan como fracciones bk /m con un denominador común m, lo
cual siempre es posible, será p(c) = 0 si y sólo si q(c) = 0, donde
q(X) = b0 + b1 X + · · · + bn X n ,
con coeficientes b0 , . . . , bn ∈ Z.
3.2. POLINOMIOS 107
Proposición 3.2.35. Sea q(X) = bn X n + bn−1 X n−1 + · · · + b1 X + b0 un polinomio con coeficientes

b0 , . . . , bn ∈ Z, de grado n ≥ 1. Los ceros enteros de q son divisores del término independiente b0 .
Si c = a/b ∈ Q es un cero de q escrito en forma irreducible [es decir, a, b ∈ Z y mcd(a, b) = 1], el
numerador a divide al término independiente b0 , y el denominador b divide al coeficiente director
bn .
Demostración. Si c ∈ Z es tal que q(c) = 0, se deduce que b0 = c(−bn cn−1 − · · · − b1 ) y por tanto
c divide a b0 .
Si q(c) = 0 para c = a/b, a, b ∈ Z y mcd(a, b) = 1, sustituyendo y multiplicando por bn resulta
0 = bn an + bn−1 an−1 b + · · · + b1 abn−1 + b0 bn = a(bn an−1 + bn−1 an−2 b + · · · + b1 bn−1 ) + b0 bn ,
luego a divide a b0 bn , lo que sólo es posible si a divide a b0 ; y análogamente b divide a bn an , luego

a bn .
Las raı́ces enteras deben cumplir otras condiciones fáciles de comprobar.
Proposición 3.2.36. Sea q(X) = bn X n + bn−1 X n−1 + · · · + b1 X + b0 un polinomio con coeficientes

b0 , . . . , bn ∈ Z, de grado n. Si c ∈ Z es un cero de q, necesariamente (c − 1)|q(1) y (c + 1)|q(−1).
Demostración. Aplicando el teorema del resto, q(X) = (X − c)q1 (X), lo que implica
q(1) = (1 − c)q1 (1) = (c − 1)(−q1 (1)) y (c − 1)|q(1).
Análogamente q(−1) = (−1 − c)q1 (−1) = (c + 1)(−q1 (−1)) y (c + 1)|q(−1).
Corolario 3.2.37. En Q hay polinomios sin raı́ces de grado arbitrario (≥ 2).
Demostración. Aplicar lo anterior a los polinomios X n − 2, por ejemplo.
Ejercicio. Hallar las raı́ces de

18X 3 + 3X 2 − 4X − 1.
3.2.5. Factorización de polinomios.

El papel jugado en Z por los números primos lo desempeñan en K[X] los polinomios irreducibles.
Definición 3.2.38. Diremos que un polinomio p no constante es irreducible si cuando p = rs

para polinomios r, s, necesariamente deg r = 0 o deg s = 0.
Dicho de otra forma, p es irreducible si es no constante y para cada polinomio no constante q,
q|p implica que p/q es constante.
Obviamente, los polinomios de grado 1 (polinomios lineales) son irreducibles. Los polinomios
que no son irreducibles deben admitir una factorización como producto de polinomios de grado
mayor o igual que 1.
Corolario 3.2.39. Dado p ∈ K[X],
(i) si p es un polinomio cuadrático (de grado 2), entonces p es irreducible si y sólo si no tiene
raı́ces en K;
(ii) si p es un polinomio cúbico (de grado 3), entonces p es irreducible si y sólo si no tiene raı́ces
en K;
(iii) si p es de grado mayor o igual que 4, entonces para que p sea irreducible es condición nece-
saria, pero no suficiente, que p no tenga raı́ces en K.
Ejercicio. Sea a ∈ K tal que 4a 6= 0. Probar que el polinomio p(X) = aX 2 + bX + c ∈ K[X] tiene
raı́ces en K si y sólo si su discriminante ∆ = b2 − 4ac es un cuadrado perfecto en K, es decir,
−b + δ −b − δ
si existe δ ∈ K tal que δ 2 = ∆, en cuyo caso las raı́ces de p(X) son , (que suelen
2a 2a
escribirse conjuntamente en la fórmula tradicional
√
−b ± b2 − 4ac
.)
2a
Indicación. Para x ∈ K,
p(x) = 0 ⇐⇒ 4ap(x) = 0 ⇐⇒ 4a2 x2 + 4abx + 4ac = 0 ⇐⇒ (2ax + b)2 − b2 + 4ac = 0

⇐⇒ (2ax + b)2 − ∆ = 0 ⇐⇒ (2ax + b)2 = ∆ ⇐⇒
(
NUNCA cuando ∆ ∈ / K 2 := {t2 : t ∈ K}, o bien
⇐⇒
⇐⇒ (2ax + b)2 = δ 2 ⇐⇒ 2ax + b = δ o 2ax + b = −δ.
–—o0o—–
La naturaleza de los polinomios irreducibles es muy variable, dependiendo del cuerpo particular
que se considere, y en general no se sabe cómo son los polinomios irreducibles sobre un cuerpo
cualquiera. No es éste el lugar para un estudio amplio del tema: por lo que a nosotros respecta, la
información fundamental es que en C[X] los polinomios irreducibles son los lineales (de grado 1),
debido al llamado Teorema fundamental del álgebra (D’Alembert-Gauss):
Todo polinomio no constante con coeficientes complejos posee una raı́z en C.
Como consecuencia, se puede afirmar:
[1] Todos los polinomios irreducibles de C[X] son de grado uno. Este hecho se indica diciendo
que C es algebráicamente cerrado. En particular, los polinomios mónicos irreducibles de
C[X] son de la forma X − t con t ∈ C.
[2] Los polinomios mónicos irreducibles de R[X] son de dos formas:
• de grado uno, de la forma X − t con t ∈ R.
• de grado dos, de la forma (X − t)2 + r2 con t, r ∈ R, r 6= 0.
[3] En Q[X] hay polinomios irreducibles del grado que se desee.
–—o0o—–
Sobre el esquema empleado en Z, puede probarse la existencia (con los ajustes pertinentes) de
descomposición de un polinomio en producto de factores irreducibles.
Lema 3.2.40. Un polinomio p no constante es irreducible si y sólo si cuando p|rs, necesariamente
p|r o p|s (en palabras, cuando divide a un producto de polinomios tiene que dividir al menos a uno
de los factores)
Demostración. Si p es irreducible y divide a rs, o bien mcd(p, r) = 1 (y entonces p|s según la
1
Proposición 3.2.20), o bien mcd(p, r) = d 6= 1, con lo cual p = ad, a constante no nula, y d = p;
a
1 1
entonces, para algún q, r = qd = q p = q p, es decir, p|r.
a a
Recı́procamente, si p cumple la condición del enunciado tiene que ser irreducible, pues de p = rs
se sigue que p|rs, luego o bien p|r (y como r|p es deg p = deg r y por tanto deg s = 0) o bien p|s (y
análogamente deg r = 0).
3.2. POLINOMIOS 109
Corolario 3.2.41. Sean p, q ∈ K[X] mónicos e irreducibles tales que p divide a q. Entonces p = q.
Demostración. Puesto que p es irreducible, no es una constante, luego q = ap donde forzosamente
deg a = 0, puesto que q es irreducible. Como p y q son mónicos, necesariamente a = 1 y p = q.
Correspondiendo al teorema fundamental de la Aritmética tenemos el siguiente, que podrı́a
llamarse ‘teorema fundamental de la aritmética de polinomios’.
Teorema 3.2.42 (de factorización única). Para todo polinomio p ∈ K[X] no constante existen
a constante y q1 , . . . , qm ∈ K[X] mónicos e irreducibles tales que
p = aq1 · · · qm .
Además, a y los qj son únicos para cada p.
En palabras, p puede descomponerse como producto de una constante por factores mónicos
irreducibles de manera única, salvo el orden de dichos factores.
(Esto se expresa diciendo que el dominio de integridad K[X] es de factorización única .)
Demostración. Sea a el coeficiente director de p, entonces p = a−1 p es mónico y p = ap. Veamos
que todo polinomio mónico no constante p se puede expresar como producto de polinomios mónicos
irreducibles. Para ello procedamos por inducción sobre el grado deg p ≥ 1.
Si deg p = 1, es claro que p es irreducible.
Supongamos que deg p > 1, y que el resultado es cierto para todo polinomio mónico de grado
inferior al de p.
Si p es irreducible, se sigue lo pedido.
En caso contrario, se puede expresar p = g1 g2 con g1 , g2 ∈ K[X] no constantes, esto es, de grado
no inferior a 1. Además podemos elegirlos mónicos pues el producto de los coeficientes directores
de ambos polinomios vale 1. Puesto que deg g1 , deg g2 < deg p, por hipótesis de inducción g1 y g2
se pueden expresar como producto de polinomios mónicos irreducibles, luego lo mismo sucede con
p = g1 g2 .
Veamos la unicidad: sean aq1 q2 · · · qm = p = bp1 p2 · · · pr dos descomposiciones como las del
enunciado, donde qi , pj ∈ K[X] mónicos e irreducibles, a, b ∈ K. Puesto que el producto de
polinomios mónicos es mónico se sigue que a = b es el coeficiente director de p. Por tanto
q1 q2 · · · qm = p1 p2 · · · pr . Ahora q1 divide p1 p2 · · · pr , y como q1 es irreducible, divide a algún pj .
Cambiando la numeración, si es preciso, podemos suponer que q1 divide p1 , y como p1 y q1 son
mónicos, por el corolario anterior se sigue que p1 = q1 . Simplificando nos queda q2 · · · qm = p2 · · · pr .
Procediendo análogamente con q2 y reiterando el proceso se sigue que m = r y salvo el orden es
p2 = q 2 , p 3 = q 3 , . . . , p m = q m .
Ejemplo. Factoricemos p(X) = 14X 5 − 25X 4 − 85X 3 + 285X 2 − 179X + 30 en Q[X]. Buscamos
primero sus raı́ces enteras, que pueden ser ±1, ±2, ±3, ±5, ±6, ±10, ±15, ±30; pero p(1) = 40,
p(−1) = 550 (utilizar el algoritmo de Ruffini), luego sólo −3 es una posible raı́z; de nuevo mediante
el algoritmo de Ruffini comprobamos que p(−3) = 0 y que
q(X) = p(X)/(X + 3) = 14X 4 − 67X 3 + 116X 2 − 63X + 10,
polinomio que ya no puede tener raı́ces enteras y cuyas posibles raı́ces fraccionarias son ±1/2, ±5/2,
±1/7, ±2/7, etc. Afortunadamente, probando primero 1/2 resulta q(1/2) = 0,
r(X) = q(X)/(X − 1/2) = 14X 3 − 60X 2 + 86X − 20 = 2(7X 3 − 30X 2 + 43X − 10),
que sólo puede tener raı́ces fraccionarias entre ±1/7, ±2/7, etc. Probando nuevamente se obtiene
r(2/7) = 0, (1/2)r(X)/(X − 2/7) = 7X 2 − 28X + 35 = 7(X 2 − 4X + 5) = 7[(X − 2)2 + 1], que ya
no puede tener raı́ces en Q (¿por qué?) y por tanto es irreducible (¿por qué?). Finalmente, pues,
1 2
p(X) = 14X 5 − 25X 4 − 85X 3 + 285X 2 − 179X + 30 = 14(X + 3)(X − )(X − )(X 2 − 4X + 5).
2 7
Corolario 3.2.43. Sean p1 , . . . , pm ∈ K[X] no nulos, factorizados como potencias de polinomios

mónicos irreducibles (distintos). Entonces:
(i) El mcm(p1 , . . . pm ) es el producto de los factores comunes y no comunes con mayor exponente.
(ii) El mcd(p1 , . . . pm ) es el producto de los factores comunes con menor exponente.

Demostración. Es una comprobación directa utilizando las definiciones y las propiedades anteriores.
Ejemplo. Sean p, q ∈ Q[X] los polinomios:
p(X) = X 5 + 3X 4 + 4X 3 + 4X 2 + 3X + 1, q(X) = X 6 + X 4 − X 2 − 1.
Determinemos mcd(p, q), mcm(p, q) a partir de su factorización. Procediendo como antes es fácil
ver que
p(X) = (X + 1)3 (X 2 + 1), q(X) = (X + 1)(X − 1)(X 2 + 1)2 ,
y ası́
mcd(p, q) = (X + 1)(X 2 + 1), mcm(p, q) = (X + 1)3 (X − 1)(X 2 + 1)2 .
Ejercicios
En los ejercicios siguientes, si no se especifica nada sobre K se supone K = Q.
13.1. Sea p ∈ Q[X] tal que p(1) = 1, p(2) = 4. Sea q(X) = X 2 − 3X + 2. Determinar el resto de la
división de p por q.
13.2. Hallar el cociente y el resto de la división de X 2 , X 3 , X 4 y X 5 por el polinomio q(X) =
X 3 − 2X 2 + 3X − 1.
13.3. Determinar polinomios u y v tales que
X 3 u(X) + (1 − X)2 v(X) = 1
(i) utilizando el algoritmo de Euclides-Bézout;
(ii) desarrollando (X + (1 − X))4 por la fórmula del binomio de Newton.
13.4. ¿Cuáles son las raı́ces del polinomio

1 1 1
p(X) = 1 − X + X(X − 1) + · · · + (−1)n X(X − 1) · · · (X − n + 1)
1! 2! n!
para cada n ∈ N?
Indicación : ¿Quién es (1 − t)m ?
13.5. Demostrar que si c/d es una fracción irreducible que representa uno de los ceros del polinomio
de coeficientes enteros
p(X) = an X n + · · · + a1 X + a0 ,
entonces c − md es un divisor de p(m) para todo entero m.
Determinar los ceros racionales del polinomio
p(X) = X 4 − 2X 3 − 8X 2 + 13X − 24.
13.6. Hallar un polinomio de grado 3 que al dividirlo por X − 1, X − 2 y X + 5 da, respectivamente,

restos 2, 1, 8. ¿Hay más de una solución?
13.7. ¿Puede ser un polinomio divisible por su derivada? Justificar la respuesta.
3.2. POLINOMIOS 111
13.8. Sean p(X) = X 5 + 2X 3 − 5X − 3, q(X) = X 2 − 2X − 12. Hallar el cociente y el resto de la

división de p por q, y deducir que p y q son relativamente primos.
13.9. Hallar el máximo común divisor y el mı́nimo común múltiplo de los polinomios
p(X) = 2X 4 + X 3 − 8X 2 − X + 6, q(X) = 2X 3 − 7X 2 + 8X − 3.
¿Cuáles son las raı́ces de p y q?
13.10. (1) Expresar el polinomio p(X) = 3X 4 − 5X 3 + 6X 2 + 7X − 5 como combinación lineal de

potencias de X − 2.
(Indicación : Dividir sucesivamente por X − 2.)
(2) ¿Cuánto valen p(2), p0 (2), p00 (2), p000 (2), p(iv) (2)?
13.11. Fórmula de Taylor. Sea p ∈ Q(X) un polinomio de grado n y a ∈ Q. Probar que
n
X p(k) (a)
p(X) = (X − a)k .
k!
k=0
13.12. Derivada n-ésima de un producto (Leibniz). Sea K un cuerpo cualquiera y p, q ∈

K[X]. Probar por inducción que
n
X n
(pq)(n) = p(k) q (n−k) .
k
k=0
13.13. Sea K un cuerpo cualquiera. Demostrar que si an X n + an−1 X n−1 + · · · + a1 X + a0 ∈ K[X]

es irreducible, también lo es an + an−1 X + · · · + a1 X n−1 + a0 X n .
13.14. Descomponer el polinomio X 4 − 5X 2 + 6 en factores irreducibles en Q[X].
13.15. Probar que p(X) = X 4 + 4 no tiene raı́ces en Q y que puede factorizarse (en Q[X]) como
producto de dos polinomios de grado 2.
3.2.6. Polinomios, maple y Mathematica

Los polinomios aparecen en casi todas las áreas de la Matemática en una o varias de sus
múltiples facetas. Son también de fundamental importancia en numerosı́simas aplicaciones a las
demás ciencias. Por tanto, no es de extrañar que los programas de cálculo simbólico dispongan de
una amplia cantidad de recursos para su manipulación.
Como señala D. Duval en [Duval], hh los polinomios constituyen elementos básicos para el cálculo
formal; [· · · ] figuran explı́cita o implı́citamente en todos los cálculos, por lo que es imprescindible
saber manejarlos lo más eficazmente posible.ii
Es imposible dar una descripción breve de las órdenes de maple y Mathematica que se
encargan del manejo de los polinomios, y menos de los matices que admiten muchas de ellas. En
consecuencia, reseñaremos las más básicas y nos remitimos a los manuales o al menú de ayuda de
cada programa para más información.
En lo que sigue, A, B, etc., indican polinomios en una indeterminada x.
Diferentes representaciones de un polinomio
maple Matematica RESULTADO

collect(A,x); Collect[A,x] Reorganiza el polinomio de manera que x sea
“la indeterminada dominante”, aunque haya
otros “parámetros variables”.
expand(A); Expand[A] Desarrolla productos y potencias.
? FactorTerms[A] Si lo hay, saca factor común numérico.
? FactorTerms[A,x] Si lo hay, saca factor común que no dependa
de x.
simplify(A); Simplify[A] “Simplifica” (a veces) la expresión de A.
Ejemplos: maple
collect(x + 4*y + 5*x*y, x); (1 + 5 y) x + 4 y

collect(x + 4*y + 5*x*y, y); (4 + 5 x) y + x
expand((2 + 4*x^2)^2*(x - 1)^3); 52 x3 − 28 x2 + 12 x − 4 + 64 x5 − 64 x4 + 16 x7 − 48 x6
simplify((x - 1)^2 + 4*x); x2 + 2 x + 1
Ejemplos: Matematica
Collect[x + 4 y + 5 x y, x] 4y + x(1 + 5y)

Collect[x + 4 y + 5 x y, y] x + (4 + 5x)y
Expand[(2 + 4 x^2)^2 (x - 1)^3] −4 + 12 x − 28 x2 + 52 x3 − 64 x4 + 64 x5 − 48 x6 + 16 x7
FactorTerms[2 + 4 x^2] 2 (1 + 2x2 )
FactorTerms[2 a b + 4 a x^2, x] 2 a (b + 2x2 )
Simplify[(x - 1)^2 + 4 x] (1 + x)2
División, mcd, mcm, identidad de Bézout. Derivación.

quo(A,B,x); PolynomialQuotient[A,B,x] Cociente de la división de A por B.
rem(A,B,x); PolynomialRemainder[A,B,x] Resto de la división de A por B.
gcd(A,B); PolynomialGCD[A,B] Máximo común divisor de A y B.
lcm(A,B); PolynomialLCM[A,B] Mı́nimo común múltiplo de A y B.
gcdex(A,B,x,’s’,’t’); ? Máximo común divisor de A y B
s,t; y coeficientes de la identidad de
Bézout.
diff(A, x) D[A, x] A0 , polinomio derivado de A.
Ejemplos: maple
Para A:=2*x^4+x^3-8*x^2-x-6; y B:=2*x^3-7*x^2+8*x-3;

3.2. POLINOMIOS 113
quo(A,B); x+4
rem(A,B); 6 + 12x2 − 30x
gcd(A,B); 1
lcm(A,B); (2x4 + x3 − 8x2 − x − 6)(2x3 − 7x2 + 8x − 3)
1
gcdex(A,B,x,’u’,’v’); u,v; 5 5 1 2 1 1 1 1
− 4 + 4x − 2x , 2 − x + x2 + 2x3
2 2 1 1 8 8 1
diff((x + 1)^2*(x - 1)^3,x); 2(x + 1)(x − 1)3 + 3(x + 1)2 (x − 1)2
diff(expand((x + 1)^2*(x - 1)^3),x); 5x4 − 4x3 − 6 x2 + 4 x + 1
expand(diff((x + 1)^2*(x - 1)^3,x)); 5x4 − 4x3 − 6 x2 + 4 x + 1
Para A=2 x^4+x^3-8 x^2-x-6, B=2 x^3-7 x^2+8 x-3,
PolynomialQuotient[A,B, x] 4+x
PolynomialRemainder[A,B, x] 6 − 30x + 12x2
PolynomialGCD[A,B] 1
PolynomialLCM[A,B] (−3 + 8x − 7x2 + 2x3 )(−6 − x − 8x2 + x3 + 2x4 )
D[(x + 1)^2*(x - 1)^3,x] 2 (−1 + x)3 (1 + x) + 3 (−1 + x)2 (1 + x)2
D[Expand[(x + 1)^2*(x - 1)^3],x] 1 + 4 x − 6 x2 − 4x3 + 5x4
Expand[D[(x + 1)^2*(x - 1)^3,x]] 1 + 4 x − 6 x2 − 4x3 + 5x4
Raı́ces
Aquı́ aumenta la complicación de manera considerable. Ambos programas permiten distintos

tipos de búsqueda de raı́ces, sea en diferentes cuerpos, sea proporcionando valores numéricos apro-
ximados si no hay o no interesan valores simbólicos ‘exactos’. Nos limitamos, por ello, a recoger las
órdenes más simples.

roots(A,x); Da las raı́ces (racionales) y su multiplicidad. Puede
omitirse la variable si es la ‘evidente’.
Roots[A == 0, x] Ver ejemplos. Puede omitirse la variable si es la
‘evidente’.
solve(A=0,x); Solve[A == 0, x] Ver ejemplos. Puede omitirse la variable si no hay
ambigüedad.
fsolve(A=0,x); NSolve[A == 0, x] (Puede omitirse la x si es la variable ‘evidente’.)
Busca soluciones aproximadas usando aritmética
de punto flotante, con diferentes opciones.
Ejemplos: maple
roots(x^3 + x^2 - 12); [[2, 1]]

3 1 √ 3 1 √
solve(x^3 + x^2 - 12=0); 2, − + I 15, − − I 15
2 2 2 2
fsolve(x^3 + x^2 - 12=0); 2.
fsolve(x^3 + x^2 - 12=0,x,complex); −1.500000000 − 1.936491673 I,
−1.500000000 + 1.936491673 I, 2.
1 √ 1 √
Roots[x^3 + x^2 - 12 == 0] x == (−3 − ı̇ı 15)|| x == (−3 + ı̇ı 15)|| x == 2
2 2
√ √

1 1
Solve[x^3 + x^2 - 12 == 0] {x → 2}, x → (−3 − ı̇ı 15) , x → (−3 + ı̇ı 15)
2 2
NSolve[x^3 + x^2 - 12 == 0] {{x → −1.5 − 1.93649 ı̇ı}, {x → −1.5 + 1.93649 ı̇ı}, {x → 2.}}
Factorización
Como las raı́ces, la factorización de polinomios depende del cuerpo en el que se toman los
coeficientes. La cantidad de situaciones posibles es inmensa, y sólo podemos dar idea somera de
algunas de ellas mediante ejemplos.

factor(A); Factoriza respecto al menor cuerpo que contiene a los
coeficientes. Admite opciones.
Factor[A] hh Factoriza sobre los enterosii, dice el manual. Ver
ejemplos.
irreduc(A); true si A es irreducible sobre el menor cuerpo que
contiene a los coeficientes, false si es reducible. Ad-
mite opciones.
Ejemplos: maple
factor(4*x^2-1);
(2x − 1)(2x + 1)
factor(x^2 - 2*sqrt(2)*x + 2);
√
(x − 2)2
factor(x^6-12*x^4+44*x^2-48);
(x − 2)(x + 2)(x2 − 6)(x2 − 2)
factor(sqrt(2)*(x^6-12*x^4+44*x^2-48));
√ √ √
2 (x2 − 6)(x + 2)(x − 2)(x + 2)(x − 2)
factor(sqrt(2)*sqrt(3)*(x^6-12*x^4+44*x^2-48));
√ √ √ √ √ √ √ √
3 2 (x − 3 2)(x + 3 2) (x + 2)(x − 2)(x + 2)(x − 2)
factor(x^6-12*x^4+44*x^2-48,{sqrt(2),sqrt(3)}); (más ‘ortodoxo’)
√ √ √ √ √ √
(x − 3 2)(x + 3 2) (x + 2)(x − 2)(x + 2)(x − 2)
irreduc(x^3+5);
true
irreduc(x^3+5,5^(1/3));
false
factor(x^3+5,5^(1/3));
(x2 − x 5(1/3) + 5(2/3) ) (x + 5(1/3) )
3.2. POLINOMIOS 115
Ejemplos: Mathematica
Factor[4 x^2 + 1]
(−1 + 2 x) (1 + 2 x)
Factor[x^2 - 2 Sqrt[2] x + 2]
2 − 2 x + x2
Factor[x^2 - 2 Sqrt[2] x + 2, Extension -> Sqrt[2]]
√
( 2 − x)2
Factor[x^6 - 12 x^4 + 44 x^2 - 48]
(−2 + x) (2 + x) (−6 + x2 ) (−2 + x2 )
Factor[Sqrt[2] (x^6 - 12 x^4 + 44 x^2 - 48)]
√
2 (−2 + x) (2 + x) (−6 + x2 ) (−2 + x2 )
Factor[x^6 - 12 x^4 + 44 x^2 - 48, Extension -> {Sqrt[2],Sqrt[3]}]
√ √ √ √ √ √
( 2−x) ( 6−x) (−2+x) (2+x) ( 2+x) ( 6+x) (x+ 2)(x− 2)(x+2)(x−2)
(Para entender qué significan las extensiones de cuerpos y por qué son importantes, ver el
capı́tulo 7 de [GJPR].)
Bibliografı́a
[C-C-S] Cohen, A. M.; Cuypers, H.; Sterk, H.: Algebra Interactive! (Learning algebra in an
exciting way). Springer, Berlin, 1999.

Madrid, 1996.
[Duval] Duval, D.: Cálculo simbólico y automatización. Mundo cientı́fico, Extra 1: El universo de
los números, pp. 78–86.
El apartado sobre factorización de polinomios está en buena parte tomado de
[Bern] Bernal, E.: Algebra Lineal. Apuntes de la asignatura, Zaragoza, 1998–99.
[1] M. Conthe: La paradoja de Simpson. Expansión, 08/10/2002.

http://www.expansiondirecto.com/edicion/componentes/noticia/
VersionImprimirExp cmp/0,3240,184488,00.html
http://www.expansiondirecto.com/edicion/componentes/noticia/
VersionImprimirExp cmp/0,3240,192294,00.html
(Cada una de las direcciones debe ir escrita en una sola lı́nea.)
[2] J. M. Albaigès, Abel-Galois: dos vidas, un destino.

http://www.grijalvo.com/Albaig%E8s/b JMAiO ABEL GALOIS.htm
[3] The MacTutor History of Mathematics archive: Quadratic, cubic and quartic equa-
tions.
http://www-history.mcs.st-and.ac.uk/history/HistTopics/Quadratic etc equations.html
[4] The MacTutor History of Mathematics archive: The development of group theory.
http://www-history.mcs.st-and.ac.uk/history/HistTopics/Development group theory.html
[5] E. T. Bell, Los grandes matemáticos: Abel.

http://www.geocities.com/grandesmatematicos/cap17.html
117
118 BIBLIOGRAFÍA
Capı́tulo 4
Números reales
En En
la asignatura de de
la asignatura Análisis matemático
Análisis matemático I se
I sehan
hantratado
tratadolas
laspropiedades
propiedades básicas
básicas de los números
números
reales desde
reales desde unun planteamiento axiomático más o menos explı́cito. Aquı́ Aquı́ nos
nos limitaremos,
limitaremos, porpor tanto,
tanto,
aa describir
describir aa grandes
grandes rasgos
rasgos las
las distintas
distintas construcciones
construcciones de de RR aa partir
partir de
de QQ yy la
la caracterización
caracterización
axiomática de
axiomática R, yy estudiaremos
de R, estudiaremos brevemente
brevemente la la representación
representación decimal
decimal (y(y otras)
otras) de
de los
los números
números
reales. La
reales. La bibliografı́a
bibliografı́a oportuna
oportuna se se irá
irá citando
citando aa lo
lo largo
largo de
de la
la exposición.
exposición.
4.1 LECTURA:
4.1. LECTURA: Construcciones
Construcciones de
de los
los números
números reales.
reales.
4.1.1 Insuficiencia
4.1.1. de Q
Insuficiencia de Q
Ya Ya hemoshemosvisto queque
visto desde
desdeel el
punto
puntodedevistavistaalgebraico,
algebraico,elelsistema
sistema de de los
los números racionales es
números racionales es
bastante incompleto:
bastante incompleto: sisi bien
bien en
en QQ eses posible
posible resolver
resolver siempre
siempre ecuaciones
ecuaciones deldel tipo
tipo ax
ax ++ bb == 0,
0, con
con
a
= 0, hay ecuaciones tan simples como x 2 = 2 que no tienen solución. Esto fue descubierto ya
2
a 6= 0, hay ecuaciones tan simples como x = 2 que no tienen solución. Esto fue descubierto ya
por los
por los pitagóricos
pitagóricos en en el
el siglo
siglo VV antes
antes de de nuestra
nuestra era,
era, en
en su
su formulación
formulación geométrica,
geométrica, en
en términos
términos
de conmensurabilidad
de conmensurabilidad ee inconmensurabilidad
inconmensurabilidad de de longitudes
longitudes (ver
(ver notas
notas históricas
históricas en
en [[Ebb
Ebb],
], cap. 2;
cap. 2;
también, [ ], p. 79 y pp. 103–109). Dos segmentos AB y CD son
también, [Kl1], p. 79 y pp. 103–109). Dos segmentos AB y CD son conmensurables si pueden ser
Kl1 conmensurables si pueden
ser medidos
medidos exactamente
exactamente con con
una una unidad
unidad de longitud
de longitud común
común u, esu,decir,
es decir, si un
si hay haynúmero
un número “exacto”
“exacto”m ∈
m ∈ N de segmentos de longitud u que colocados uno tras otro sin solaparse
N de segmentos de longitud u que colocados uno tras otro sin solaparse cubren AB, y lo mismo cubren AB, y lo mismo
un número
un número nn de de segmentos
sementos parapara CD;
CD; la la razón
razón oo proporción
proporción entre
entre laslas longitudes
longitudes de de los
los segmentos
segmentos
AB yy CD
AB CD es es la
la misma
misma que que la
la razón
razón (el
(el cociente)
cociente) entre
entre los
los números
números m m yy n.
n. En
En caso
caso contrario,
contrario, sonson
inconmensurables.
inconmensurables.
Q
A
s
C
t ?
P
u
0 1/5 2/5 3/5 4/5 1 X ?
BDst
Figura
Figura 11 Figura
Figura 22 Figura
Figura 33
Fijado
Fijado unun segmento
segmento cualquiera,
cualquiera, es
es fácil
fácil construir
construir por
por semejanza
semejanza de
de triángulos
triángulos unun nuevo
nuevo segmento
segmento
cuya
cuya razón
razón con
con el
el primero
primero sea
sea igual
igual aa un
un valor
valor m/n
m/n arbitrariamente
arbitrariamente dado
dado (en
(en la
la figura
figura 11 se
se muestra
muestra
119
107
120 CAPÍTULO 4. NÚMEROS REALES
la construcción de un segmento de longitud 1/5: la recta OP Q y el segmento OP son arbitrarios;

el punto Q se obtiene trasladando OP cinco veces a lo largo de dicha recta; la paralela por P al
segmento que une Q con 1 corta a la recta OX en un punto a distancia 1/5 de O). En sentido
contrario, no es descabellado pensar que dos segmentos cualesquiera siempre son conmensurables:
el algoritmo de Euclides, con la división interpretada como “sustracción repetida de segmentos
iguales”, lleva gráficamente a una unidad de medida común —hasta donde el ojo puede apreciar, al
menos. Por ejemplo, en la figura 2, quitando a AB un segmento de longitud igual a CD queda un
segmento s, de longitud menor que CD; quitando a CD dos segmentos de longitud igual a s, queda
un segmento t, de longitud menor que s; quitando a s un segmento de longitud igual a t, queda
un segmento u tal que la longitud de t es exactamente tres veces la longitud de u (en t encajan
perfectamente tres segmentos de longitud u). Por tanto, u ‘mide’ a AB y CD (en el lenguaje clásico,
u es una parte alı́cuota común de AB y CD): la longitud de AB es 15 veces la longitud de u y la
longitud de CD es 11 veces la longitud de u; la proporción entre las longitudes de los segmentos
AB y CD es, en este caso, de 15 a 11.
Sin embargo, la intuición que el ojo sugiere es desmentida por la razón, y como es bien sabido, el
teorema de Pitágoras obliga a descartar la hipótesis de ‘conmensurabilidad universal’: la diagonal
del cuadrado (figura 3), de la que no dudamos que tenga una longitud, resulta inconmensurable
con el lado, pues si éste tiene una longitud m respecto de cualquier unidad, la diagonal ha de tener
una longitud n tal que n2 = m2 + m2 = 2m2 , lo cual lleva a un absurdo tras eliminar sucesivamente
factores 2 en m y n. (Ver la discusión sobre Aritmética y Geometrı́a en [A-K], p. 43).
Hizo falta mucho talento para solucionar este inconveniente (lo logró Eudoxo, contemporáneo
de Platón, con su teorı́a de las proporciones). Mucho más tarde, cuando la fiabilidad de la intuición
geométrica fue puesta en cuestión nuevamente tras el asentamiento de las geometrı́as no euclı́deas
y la crisis subsiguiente, se hizo necesaria una fundamentación del continuo, i.e., del conjunto de los
números reales (v. [Dur], pp. 70 y ss; [Kl3], cap. 41, pp. 1292 y ss.; [Ebb], cap. 2, pp. 34 y ss.).
No es este el lugar para recorrer la larguı́sima evolución histórica del concepto de número (real)
hasta las ideas actuales, por lo demás excelentemente expuesta en [Dur], pp. 60 y ss, o [Ebb], pp. 24
y ss, por ejemplo. Nos limitaremos en lo que sigue a señalar los principales puntos que subyacen a
una presentación rigurosa de los números reales, que quedan abiertos para tratar en una asignatura
posterior sobre Fundamentos de Análisis matemático.
4.1.2. Construcciones de R a partir de Q.

En la ampliación de un sistema numérico para llegar a otro mayor que subsane alguna deficiencia,
la idea directriz es ‘añadir lo mı́nimo que le falta’. Ası́, para construir Z a partir de N ‘se añaden’
los opuestos de los números naturales (y el 0, si no está incluido en N); para construir Q a partir
de Z, ‘se añaden’ los cocientes de enteros (con denominador no nulo). Para construir R a partir de
Q, hay dos procedimientos destacados:
• método de Cantor-Meray de las sucesiones fundamentales. Trata de suplir la inexis-

tencia de lı́mite de algunas sucesiones de Cauchy de números racionales no convergentes en Q,
identificando las sucesiones de Cauchy que “deberı́an converger a un mismo valor hipotético”,
porque sus diferencias convergen a 0, con ese “valor”. Se define ası́ una relación de equiva-
lencia en el conjunto de las sucesiones de Cauchy de números racionales: son equivalentes
aquellas cuya diferencia tenga lı́mite 0, de manera que R es el conjunto cociente y un número
real es una clase de equivalencia (que va a jugar el papel de ‘lı́mite’ de todas las sucesiones
de la clase). Las operaciones de suma y producto en R se definen a partir de las operaciones
de suma y producto de sucesiones, y se demuestra que con ellas R es un cuerpo. Hay que
definir ası́ mismo una relación de orden entre las sucesiones de Cauchy de Q, que permite
luego definir una ordenación en R con la cual resulta ser un cuerpo totalmente ordenado com-
pleto (en el sentido de que todo conjunto no vacı́o acotado superiormente posee supremo).
El desarrollo en detalle de este proceso se entiende mejor cuando se ha estudiado teorı́a de
4.2. AXIOMÁTICA DE R 121
anillos e ideales. Puede verse, por ejemplo, en [GJPR], [Ebb], [Ham], [S-T] (aquı́ hay además
un interesante apartado sobre la ‘conexión con la intuición’, p. 204).
Este es el método más empleado generalmente, sobre todo porque permite usar construcciones
parecidas en otras situaciones (compleción de espacios métricos en Topologı́a, por ejemplo.)
• método de Dedekind de las cortaduras. Se dirige a conseguir que se cumpla ‘el axioma
del supremo’, no válido en Q. Se parte de las cortaduras en Q, que son pares (A, B) de
subconjuntos de Q tales que:
• A y B son complementarios, A ∪ B = Q y A ∩ B = ∅;
• A=6 ∅=6 B;
• cada elemento de A es menor que cada elemento de B.
Cada cortadura está determinada por A o por B (v. comentarios en [Ebb]), de modo que
podemos quedarnos, por ejemplo, con el conjunto A, y decir como en [Spv], que
un número real es un conjunto A de números racionales con las propiedades siguientes:
• si x ∈ A e y ∈ Q es tal que y < x, entonces también y ∈ A;
• ∅=6 A 6= Q;
• no hay un elemento máximo en A, de manera que si x ∈ A, existe algún y ∈ A tal que
y > x.
De qué modo se definen la suma, el producto y la ordenación en el conjunto R de los números
reales puede verse en [Spv], pp. 811 y ss.; ver también [Ebb], pp. 36 y ss.
• otros métodos. ¿Por qué no usar “los decimales” para construir R? Es posible, pero tiene
más inconvenientes ‘técnicos’ que los métodos anteriores. La manera de hacerlo está indicada
en [Spv], pp. 826–827, ejercicio 2.
También se han empleado intervalos encajados o, equivalentemente, pares de sucesiones
monótonas —los extremos de los intervalos— (v. [Ebb], especialmente el comentario final,
p. 46).
4.2. LECTURA: Axiomática de R.

No se planteó explı́citamente un ‘sistema axiomático para los números reales’ hasta que fue for-
mulado esencialmente por Hilbert hacia 1900, en su obra Grundlagen der Geometrie (Fundamentos
de Geometrı́a). Actualmente, la descripción axiomática de R se resume en:
• R es un cuerpo conmutativo totalmente ordenado completo, es decir, tal que todo conjunto
no vacı́o acotado superiormente tiene supremo.
Ası́ se introduce R en la mayorı́a de los textos de Análisis matemático, para comenzar a estudiar
sus propiedades de manera inmediata. Una buena muestra es [Ap].
Unicidad y minimalidad de R.
En las sucesivas ampliaciones de los números se busca siempre, como hemos señalado anterior-
mente, solucionar algún defecto, pero con una propiedad de minimalidad. Ası́, en los contenidos
N ⊂ Z ⊂ Q,
Z es el menor grupo que contiene a N y Q es el menor cuerpo que contiene a Z; ahora, R no
sólo es el menor cuerpo completo que contiene a Q, sino que es el único salvo isomorfismos.
Una explicación detallada de este hecho puede verse en [Spv], cap. 29, y en [Ebb], p. 50; también,
en [S-T], cap. 10.
4.3. Representación decimal de los números reales

Estudiaremos el significado de la representación decimal de los números reales, justificando
algunos de los resultados que son conocidos desde la enseñanza secundaria.
En toda esta sección, cuando no se especifica lo contrario, hh númeroii significa número real.
4.3.1. Aperitivo.
Lee atentamente estos enunciados:
(1) 0.999 . . . es el número inmediatamente anterior a 1.
(2) 0.333 · · · = 1/3.
(3) Sea x = 0.999 . . . Entonces 10x = 9.999 . . ., de modo que 10x − x = 9.999 . . . − 0.999 . . . = 9
9
y de aquı́ 9x = 9, luego x = = 1, es decir, 1 = 0.999 . . .
9
Responde ahora cuidadosamente a estas cuestiones:
(i) ¿Es cierto (1)?

SÍ u
t NO u
t NO SÉ u
t
(ii) ¿Es cierto (2)? Si lo es, ¿por qué?

SÍ u
t NO u
t NO SÉ u
t
(iii) ¿Es cierto el resultado de (3)?

SÍ u
t NO u
t NO SÉ u
t
¿Qué consecuencias sacas?
Con los números decimales no valen las mismas reglas de operación que con los demás números
t
u
Los números reales no pueden manejarse como las letras en el Álgebra u

t
Otras (explicarlas) u
t
4.3.2. Representación decimal canónica

Las preguntas del apartado anterior tienen por objeto hacernos reflexionar, para que nos plan-
teemos la necesidad de aclarar esta cuestión:
¿en qué consiste la representación decimal de un número real?
Cuando el número real, en particular, es un entero, la cuestión quedó completamente dilucidada.

Pasar de los enteros a los racionales a/b con a ∈ N y b = 10n para algún n ∈ N (*) es ‘casi
automático’: por ejemplo,
123456789 5 6 7 8 9
= 1 · 103 + 2 · 102 + 3 · 101 + 4 · 100 + + + + +
105 10 102 103 104 105
consta de una ‘parte entera’ 1 · 103 + 2 · 102 + 3 · 101 + 4 · 100 , que hemos convenido en representar por
1234, y de una ‘parte fraccionaria’ 5 · 10−1 + 6 · 10−2 + 7 · 10−3 + 8 · 10−4 + 9 · 10−5 , que parece lógico
escribir a continuación de lo anterior como 56789, con algún “separador” en medio que indique que
(*)
a/b es una fracción decimal, no necesariamente irreducible, como en 25/100.
4.3. REPRESENTACIÓN DECIMAL 123
ahora las cifras son los coeficientes de las potencias negativas decrecientes de 10. En la tipografı́a
latina el separador tradicional es una coma, y en la anglosajona un punto; bajo la influencia de
los ordenadores se ha extendido el uso de este último y será el que (a regañadientes) adoptaremos
aquı́. Ası́ pues, la representación decimal del número inicial será hh 1234.56789 ii.
Al igual que para los enteros, hh −1234.56789 ii representará el número opuesto del anterior,
−123456789/105 .
Mantenemos, pues, una notación posicional, en la que cada cifra va multiplicada según su
posición por un factor (un peso), que en el caso de los enteros es una potencia positiva o nula de
1
10, admitiéndose ahora pesos fraccionarios del tipo n = 10−n (i.e., potencias negativas de 10).
10
Pero ası́ se escriben sólo algunos números reales muy especiales: en general, una representación
decimal finita em em−1 . . . e1 e0 .d1 d2 . . . dn (m entero no negativo, n ∈ N, con ek , dj entre 0 y 9 para
0 ≤ k ≤ m, 1 ≤ j ≤ n), corresponde a
d1 d2 dn
em · 10m + · · · + e1 · 10 + e0 + + + ··· + n
10 102 10
em · 10n+m + · · · + e1 · 10n+1 + e0 · 10n + d1 · 10n−1 + d2 · 10n−2 + · · · + dn

= .
10n
(análogo para hh −em etc. ii tomando los opuestos). Se trata, por supuesto, de números racionales;
sin embargo, no todos números racionales tendrán una representación decimal finita: esto es cierto
tan sólo para los que puedan expresarse como cociente de un entero por una potencia de 10.
Notemos, de paso, que cuando em em−1 . . . e1 e0 .d1 d2 . . . dn sea la expresión decimal de un número
x, entonces em em−1 . . . e1 e0 d1 d2 . . . dn (sin punto decimal) es justamente la representación en base
10 del número entero 10n x.
La etapa siguiente, inevitable como vemos, es pasar a “decimales infinitos”. Ahora bien: resulta
√3
más complicado aclarar qué queremos decir, por ejemplo, cuando escribimos 2 = 1.2599210499 . . . .
√
¿Qué significan los puntos suspensivos? ¿Por qué no es 3 2 = 9.9401299521 . . . o cualquier otra ex-
presión similar? ¿Con qué criterio se han elegido las cifras? √
Recapacitando un momento, hemos comenzado escribiendo ‘la parte entera’ √ de 3 2, que es 1;
luego hemos añadido la mayor cifra decimal, 2, tal que√1.2 no sobrepasa a 3 2; después añadimos
la mayor cifra decimal, 5, tal que 1.25 no sobrepasa a 3 2; y ası́ continuamos añadiendo cifras:
√3
√3
√3
1≤√ 2<2 1.259 ≤ √ 2 < 1.260 1.259921 ≤ √ 2 < 1.259922
3 3
1.2 ≤ √2 < 1.3 1.2599 ≤ √2 < 1.2600 1.2599210 ≤ 3 2 < 1.2599211
1.25 ≤ 3 2 < 1.26 1.25992 ≤ 3 2 < 1.25993 etc.
En resumen, vamos haciendo la selección de los dı́gitos de modo que se formen sucesivamente
decimales finitos, cada vez con una cifra más, de tal manera que dichos decimales finitos sean en
cada paso los que “mejor ajusten por abajo”, los que constituyan la aproximación inferior óptima
del número a representar.
La herramienta fundamental en este proceso de construir la representación decimal de cualquier
número real es la noción de parte entera de un numero real arbitrario. Recordemos su definición.
Lema 4.3.1 (Parte entera de un número real). Dado x ∈ R, existe un número entero (y uno
solo), que suele denotarse con bxc, tal que
bxc ≤ x < bxc + 1.
Denominaremos a bxc la parte entera de x.

Dicho en palabras, bxc es el mayor número entero menor o igual que x.
Demostración. Ver [1], pág. 8, Teor. 1.2.3.

La traducción gráfica de este resultado es simple: cada número
S real x queda en uno y sólo uno
de los intervalos [N, N + 1), N ∈ Z, o dicho de otro modo, R = N ∈ [N, N + 1) (unión disjunta:
Z
estos intervalos constituyen una partición de R). Cuando x ∈ [N, N + 1), y sólo entonces, N es la
parte entera de x.
Tenemos ası́ una pista para construir gráficamente, en general, las cifras decimales sucesivas
de cualquier número real x ≥ 0. Pues si ponemos N = bxc y d1 es la primera cifra decimal de
d1 d1 + 1
x, determinada por la condición de que N + ≤ x < N + , esto significará que x ∈
10 10
d1 d1 + 1
[N + , N + ), luego dividiendo el intervalo [N, N + 1) en diez subintervalos disjuntos, del
10 10
1
mismo tipo, de longitud ,
10
1 1 2 8 9 9
[N, N + ), [N + , N + ), . . . , [N + , N + ), [N + , N + 1),
10 10 10 10 10 10
basta localizar entre ellos el único que contiene a x.
x
[ )[ ) • • • • • [ × ) • • • • • [ )[ )
1 2 d1 d1 +1 8 9
N N + 10 N + 10 N + 10 N + 10 N + 10 N + 10 N +1
Obsérvese que si ‘ampliamos 10 veces la escala’, resulta 10N + d1 ≤ 10x < 10N + d1 + 1, de
modo que justamente 10N +d1 = b10xc, y obtenemos por tanto d1 = b10xc−10N = b10xc−10bxc.
d1 d1 + 1
Para hallar el segundo decimal, repetimos el proceso: el intervalo [N + , N + ) se divide
10 10
1
en diez subintervalos cerrados a izquierda y abiertos a derecha, disjuntos, cada uno de longitud ,
100
d1 d2 d1 d2 + 1
y localizamos el único de ellos que contiene a x. Sea éste [N + + ,N + + ); entonces
10 100 10 100
d1 d2 d1 d2 + 1
N+ + ≤x<N+ + , y multiplicando por 100,
10 100 10 100
100N + 10d1 + d2 ≤ 100x < 100N + 10d1 + d2 + 1,
es decir,
100N + 10d1 + d2 = b100xc y d2 = b100xc − 10(10N + d1 ) = b102 xc − 10b10xc.
Reiterando el proceso iremos obteniendo los sucesivos decimales de x. Análogamente, llegaremos a
d1 d2 dn d1 d2 dn + 1
N+ + 2 + ··· + n ≤ x < N + + 2 + ··· + y dn = b10n xc − 10b10n−1 xc.
10 10 10 10 10 10n
Esta va a ser la definición ‘oficial’ de las cifras decimales de un número real cualquiera.
Definición 4.3.2 (Cifras decimales). Dado un número real x ≥ 0 y n ∈ N, la n-ésima cifra
decimal de x es
dn = b10n xc − 10b10n−1 xc.

Si x ≥ 0 y em em−1 . . . e1 e0 es la representación en base 10 de bxc bxc = em 10m +· · ·+e1 10+e0 ,

ei ∈ {0, 1, 2, 3, 4, 5, 6, 7, 8, 9} (0 ≤ i ≤ m), em 6= 0 si bxc 6= 0 , la expresión
em em−1 . . . e1 e0 .d1 d2 . . . dn . . .
recibe el nombre de representación decimal o desarrollo decimal de x.
Cuando hay un M tal que dn = 0 para todo n > M , el desarrollo se abrevia simplemente a
x = em em−1 . . . e1 e0 .d1 d2 . . . dM .
Para x < 0, se toma la representación decimal de |x| con un signo − delante.
No hay que dejarse impresionar por esta definición; las sucesivas cifras decimales de x pueden
irse obteniendo recursivamente como en el comentario previo, según justificamos a continuación.
Proposición 4.3.3. Dado un número real x ≥ 0 y una sucesión (dn ) de números enteros, sea (qn )
la sucesión definida por
d1 dn
qn = bxc + + · · · + n , n ∈ N.
10 10
Las siguientes propiedades son equivalentes:
(i) para todo n ∈ N, dn = b10n xc − 10b10n−1 xc.

1
(ii) para todo n ∈ N, q n ≤ x < qn + .
10n
Demostración. (i) =⇒ (ii).
1
Habrá que probar que qn ≤ x < qn + n
, o lo que es lo mismo, que 10n qn ≤ 10n x < 10n qn + 1,
10
lo que a su vez, puesto que 10n qn es entero, es lo mismo que decir que 10n qn = b10n xc. Pero
10n qn = 10n bxc + 10n−1 d1 + 10n−2 d2 + · · · + 10dn−1 + dn

= 10n bxc + 10n−1 (b10xc − 10bxc) + 10n−2 (b102 xc − 10b10xc)
+ · · · + 10(b10n−1 xc − 10b10n−2 xc) + (b10n xc − 10b10n−1 xc)
= 10n bxc + 10n−1 b10xc − 10n bxc + 10n−2 b102 xc − 10n−1 b10xc
+ · · · + 10b10n−1 xc − 102 b10n−2 xc + b10n xc − 10b10n−1 xc
= b10n xc,
que es lo que querı́amos demostrar. (**)

(ii) =⇒ (i).
Como para todo n ∈ N es 10n qn un entero que según la hipótesis (ii) verifica
10n qn ≤ 10n x < 10n qn + 1,
resulta 10n qn = b10n xc.
dn
Puesto que obviamente qn = qn−1 + n (añadiendo q0 = bxc si es necesario),
10
se sigue que
dn = 10n qn − 10n qn−1 = 10n qn − 10 · 10n−1 qn−1 = b10n xc − 10b10n−1 xc.
Ejemplo. Cálculo de las cifras decimales de un número racional por división.

Para hallar las sucesivas cifras decimales de 57/13, por ejemplo, en la escuela procedı́amos ası́:
57 | 13 57. | 13 57. | 13 57. | 13

5 4 50 4.3 50 4.38 50 4.384
11 110 110
6 60
8 etc.
(**)
También puede hacerse por inducción: para n = 1,
10q1 = 10bxc + d1 = 10bxc + (b10xc − 10bxc) = b10xc,
y si 10n qn = b10n xc,
dn+1
10n+1 qn+1 = 10n+1 (qn + ) = 10 · 10n qn + dn+1 = 10b10n xc + (b10n+1 xc − 10b10n xc) = b10n+1 xc.
10n+1
¿Por qué ‘funciona’ este algoritmo? Analicémoslo en general. Supongamos que tenemos un número
x = a/b > 0 con a, b ∈ N (para simplificar). Efectuando la división entera de a por b, obtendrı́amos
a = N b + r0 con 0 ≤ r0 < b. Entonces N = ba/bc, porque de la condición sobre r0 se deduce que
N b ≤ a < N b + N = (N + 1)b y de aquı́ que N ≤ a/b < N + 1.
Para continuar, “bajamos un cero” que añadimos al resto r0 , y dividimos por b: es decir,
efectuamos la división entera de 10r0 por b, 10r0 = d1 b + r1 , 0 ≤ r1 < b. Como antes,
d1 b ≤ 10r0 < d1 b + b = (d1 + 1)b, y puesto que r0 = a − N b, esto da
d1 b ≤ 10a − 10N b < (d1 + 1)b,
10N b + d1 b ≤ 10a < 10N b + (d1 + 1)b,
10N + d1 ≤ 10(a/b) < 10N + d1 + 1,
y dividiendo or 10,
d1 a d1 1
N+ ≤ <N+ + ,
10 b 10 10
lo que prueba que el cociente d1 es la primera cifra decimal de a/b. Prosiguiendo de manera análoga,
los sucesivos cocientes son, efectivamente, las siguientes cifras decimales de a/b.
Corolario 4.3.4. Dado x ≥ 0, si para cada n ∈ N es dn su n-ésima cifra decimal, poniendo
d1 dn
qn = bxc + + · · · + n , se tiene
10 10
d1 dn
x = sup{qn = bxc + + · · · + n : n ∈ N} = lı́m qn .
10 10 n
Demostración. De
1
q n ≤ x < qn + n .
10
se sigue que
1
|x − qn | < n → 0 cuando n → +∞,
10
y ası́
lı́m qn = x.
n
Además (qn ) es una sucesión monótona no decreciente (¿quién es qn+1 − qn y qué signo tiene?), con
lo cual también sup{qn : n ∈ N} = lı́mn qn = x.
Hay ‘expresiones decimales’ que no aparecen como representación decimal de ningún número
según nuestra definición. Por ejemplo, 0.999 . . . , puesto que, con la notación anterior,
9 9 9 9

9 9 9
− n·
lı́m qn = lı́m + + ··· + n = lı́m 10 10 10 = 10 = 1,
n n 10 102 10 n 1 9
1−
10 10
mientras que 1 = 1.000 . . . . Pero cualquier ‘expresión decimal’ ±em em−1 . . . e1 e0 .d1 d2 . . . dn . . . que
‘no acabe en una sucesión de nueves’ (i.e., que no cumpla dn = 9 para todos n mayores o iguales
que un cierto n0 ), es el desarrollo decimal de algún número real (¿te atreves a demostrarlo?).
Interpretaremos las ‘expresiones decimales anómalas’ como un lı́mite, igual que en el ejemplo
anterior. Para que no haya ambigüedad, si es necesario llamaremos a la representación decimal de x
tal como la hemos definido la representación decimal canónica de x. (Comparar con [B-S], pp. 73 y
ss., y [D’A-W], pp. 231 y ss.)
Ejercicio. Para cada n ∈ N, sean an , bn ∈ {0, 1, 2, 3, 4, 5, 6, 7, 8, 9}, y supongamos que
a
1 a2 an b1 b2 bn
lı́m + + · · · + n = lı́m + + ··· + n .
n 10 102 10 n 10 102 10
Probar que an = bn para todo n o, en caso contrario, existe un N ∈ N tal que an = bn para todo
n ≤ N y an = 0, bn = 9 (o an = 9, bn = 0) para todo n > N .
(Cf. [Lieb], p. 19.)
Una aplicación de la representación decimal (‘canónica’) es la demostración clásica de Cantor

de la no numerabilidad de R.
Proposición 4.3.5. R no es numerable.
Demostración. Ya vimos que si I es un intervalo en R, card I = card R. Basta, pues, probar que
[0, 1) no es numerable.
Supongamos lo contrario, es decir, que existe una biyección entre N y [0, 1), o sea, que hay una
sucesión (xn ) sin términos repetidos cuya imagen es [0, 1). Escribamos sus expresiones decimales,
x1 = 0.d1,1 d1,2 d1,3 . . .

x2 = 0.d2,1 d2,2 d2,3 . . .
x3 = 0.d3,1 d3,2 d3,3 . . .
.. ..
. .
y definamos entonces (
1 si dn,n = 0
dn =
0 en caso contrario.
La sucesión (qn ) definida por
d1 dn
+ · · · + n , n ∈ N,
qn =
10 10
es una sucesión monótona no decreciente (¿quién es qn+1 − qn y qué signo tiene?) acotada supe-
riormente por
1 1 1
sup + ··· + n : n ∈ N = ,
10 10 9
luego convergente. Sea
x = lı́m qn .
n
Como 0 ≤ qn ≤ 1/9, también 0 ≤ x ≤ 1/9, y ası́ x ∈ [0, 1), por lo que x debe estar en la lista de
los xn . Pero la n-ésima cifra decimal de x es dn (¿por qué?), y la n-ésima cifra decimal de xn es
dn,n 6= dn por construcción, luego x 6= xn cualquiera que sea n y la aplicación de partida entre N y
[0, 1) no es suprayectiva, contra lo supuesto.
4.3.3. Decimales periódicos

¿Existe algún criterio para decidir si un número real es o no racional a partir de su desarrollo
decimal? La respuesta es conocida: veamos ahora la explicación.
Definición 4.3.6. Un decimal periódico es una expresión decimal de la forma
±em em−1 . . . e1 e0 .d1 d2 . . . dj p1 p2 . . . pk p1 p2 . . . pk . . . p1 p2 . . . pk . . .
en la que hay un grupo de cifras decimales p1 p2 . . . pk que se repite siempre desde un determinado
lugar. El grupo p1 p2 . . . pk es el periodo , y d1 d2 . . . dj es la parte no periódica , bien entendido
que el periodo se toma de tamaño mı́nimo y que no coincide con el final de la parte no periódica.
Suele abreviarse esta expresión poniendo ±em em−1 . . . e1 e0 .d1 d2 . . . dj p1 p2 . . . pk .
233
Ejemplo. = 10.5909090909 · · · = 10.5 90 tiene parte entera 10, parte no periódica 5 y parte
22
periódica 90.
Proposición 4.3.7. La representación decimal de cada número racional es periódica. Recı́proca-
mente, cada decimal periódico es la representación decimal de un número racional.
Demostración. Sea x ∈ Q. Como 0 = 0.0 es periódico y el caso x < 0 se reduce de manera obvia al
caso −x (> 0), podemos suponer que x = a/b, a, b ∈ N.
Como ya sabemos, podemos hallar las cifras decimales de x mediante divisiones enteras sucesi-
vas. Dividiendo a por b obtendremos un cociente N ≥ 0 y un resto r0 con 0 ≤ r0 < n. Si r0 = 0, la
expresión decimal de a/b será em em−1 . . . e1 e0 .0, donde em em−1 . . . e1 e0 es la representación decimal
de N .
En caso contrario, si fuese r0 6= 0, sea 10r0 = d1 b + r1 , 0 ≤ r1 < b. Si r1 = 0, a/b =
em em−1 . . . e1 e0 .a1 0; si r1 6= 0, 10r1 = d1 b + r2 , y seguimos el proceso inductivamente si no aparece
ningún resto 0.
En tal caso, cada resto (no nulo) r0 , r1 , . . . , rk , . . . , debe ser uno de los b − 1 enteros de que
disponemos entre 1 y b − 1. Por tanto, inevitablemente aparecerá en algún momento un resto (en
el peor de los casos, rb−1 ) que ya haya aparecido previamente. Las cifras decimales obtenidas entre
estas dos apariciones se repetirán ya indefinidamente, es decir, si j y k son los menores enteros tales
que rj = rk (j < k), dj+1 . . . dk será el periodo.
Partamos ahora de un decimal periódico
em em−1 . . . e1 e0 .d1 d2 . . . dj p1 p2 . . . pk
(lo suponemos positivo por comodidad). Construyamos como ya hemos hecho anteriormente un
número real x cuyo desarrollo decimal coincida con el dado, y consideremos
d1 dj p1 pk
r = em 10m + · · · + e1 10 + e0 + + · · · + j ∈ Q, s= j+1
+ · · · + j+k ∈ Q.
10 10 10 10
Entonces

1 1 1 s
x = lı́m r + s + s k + s 2k + · · · + s nk =r+ ∈ Q,
n 10 10 10 1 − (1/10k )
como querı́amos probar. Pero además
s (10k − 1)r + 10k s 10k (r + s) − r 10j+k (r + s) − 10j r

x=r+ = = =
1 − (1/10k ) 10k − 1 10k − 1 (10k − 1)10j
que examinado atentamente contiene la regla de conversión de los decimales periódicos en fraccio-
nes: ‘se forma el numerador escribiendo primero la parte entera seguida de la parte no periódica
y luego la parte periódica, restando después la parte entera seguida de la parte no periódica, y el
denominador escribiendo tantos nueves como cifras tiene la parte periódica seguido de tantos ceros
como cifras tiene la parte no periódica’.(***)
Ejercicios
√
14.1. ¿Puede expresarse 2 como decimal periódico? ¿Por qué?
14.2. Expresar 1/7 y 2/19 como decimales periódicos.
14.3. Encontrar el número racional representado por los decimales periódicos 1.25 137 y 37.14 653.
14.4. ¿Puede existir un número racional que tenga como desarrollo decimal
0.101001000100001000001 . . .?
(A cada cifra 1 sigue un bloque de ceros, con un cero más en cada paso.)
(***)
Pues 10j+k (r + s) = em 10m+j+k + · · · + e0 10j+k + d1 10j+k−1 + · · · + dj 10k + p1 10k−1 + · · · + pk ,
10j r = em 10m+j + · · · + e0 10j + d1 10j−1 + · · · + dj , 10k − 1 = 9 · 10k−1 + · · · + 9 · 10 + 9.
4.4. REPRESENTACIÓN EN OTRAS BASES 129
Y para los que tengan tiempo libre:

14.5. ([Lieb], p. 22.) El crı́tico cinematográfico Ivor Pocoseso está viendo la pelı́cula ‘11.9 Hombres
sin Piedad’. Pero se aburre, y empieza a preguntarse exactamente qué números racionales tienen
expresiones decimales que acaban en 000 . . . (o sea, en ceros repetidos indefinidamente). Nota que
este es el caso si el denominador es 2, 4, 5, 8, 10, y se plantea si habrá una regla general sencilla
que diga qué racionales tienen esta propiedad.
Ayuda a Ivor demostrando que un número racional m/n (en forma irreducible) tiene expresión
decimal que acaba en ceros repetidos indefinidamente si y sólo si el denominador n es de la forma
2p 5q , donde p y q son enteros no negativos.
4.4. Representación en otras bases

Al igual que en la representación de los números enteros, es necesario contemplar la represen-
tación de los números reales en bases distintas de 10.
4.4.1. Representación binaria

Como cabe suponer, si en vez de usar potencias enteras de 10 se utilizan potencias enteras
de 2, se obtiene la representación binaria de los números reales de una manera totalmente
análoga. Para buscarla gráficamente, si bxc = N , el intervalo [N, N + 1) se dividirá ahora en dos
subintervalos [N, N + 12 ), [N + 12 , N + 1), aquél de ellos en el que esté x en otros dos de longitud
1
, etc., llegándose ası́ a una representación para los x ≥ 0 de la forma
22
am am−1 . . . a1 a0 .b1 b2 . . . bn . . .
en la que bxc = am 2m + · · · + a1 2 + a0 , ai ∈ {0, 1} (0 ≤ i ≤ m), am 6= 0 si bxc 6= 0, y bn ∈ {0, 1}
(n-ésima cifra binaria de x) viene dada por bn = b2n xc − 2b2n−1 xc, de modo que si
b1 bn
qn = bxc + + ··· + n, n ∈ N,
2 2
se verifica
1
q n ≤ x < qn + ,
2n
y
x = sup{qn : n ∈ N} = lı́m qn .
n
Igual que en el caso decimal, x es racional si y sólo si su representación binaria es periódica.
Pero los racionales cuya representación binaria tiene nulas todas las cifras a partir de un cierto
lugar no son exactamente los mismos que gozan de esta propiedad en su desarrollo decimal: por
ejemplo,
3
= 0.6 0(10 = 0.1001(2 .
5
Nota. Ya vimos cómo expresar los números enteros en base 2, mediante divisiones sucesivas por
2. Para hallar ahora el desarrollo binario de x − bxc a partir de su desarrolo decimal, basta ir
multiplicando por 2 retirando la parte entera del producto; en el ejemplo anterior,
NÚMERO DECIMAL 0.6000 . . .
2 ∗ resto 1.2 0.4 0.8 1.6 1.2 0.4 ...
resto 0.2 0.4 0.8 0.6 0.2 0.4 ...
CIFRAS BINARIAS 1 0 0 1 1 0 ...
3
y observamos cómo ya se va repitiendo obligadamente el bloque ‘1001’, de modo que = 0.1001.
5
(Para los más atrevidos: ¿cuál es la justificación de este procedimiento?)
También podrı́amos llegar al mismo resultado dividiendo 3

11.00000. . . |101
por 5 en base 2, lo que se hace como en base decimal, con la
0 0 1000 0.10011. . .
precaución de que ahora 1 + 1 = 10. Por ejemplo, 3 = 11(2
00100110
se dividirı́a por 5 = 101(2 como muestra la figura, teniendo
00100001 en cuenta que en base 2 es 101 + 1 = 110, 101 + 11 = 1000;
00100· · · · · · ponemos ceros en el cociente y ‘bajamos ceros del dividendo’
00100· · · · · · en la manera acostumbrada.
A la inversa, si partimos de la expresión binaria ±am am−1 . . . a1 a0 .b1 b2 . . . bn . . . de un número
x, tendremos que hallar (expresando los números en base 10)

m b1 bn
± lı́m am 2 + · · · + a1 2 + a0 + + ··· + n .
n 2 2
Cuando x sea racional, y por tanto su desarrollo sea periódico, podemos calcular este lı́mite como
hicimos en la demostración de que todo decimal periódico es el desarrollo de un número racional.
Por ejemplo, si
x = −1010.0010 101(2 ,
escribiendo todos los números ahora en base 10,

3 1 1 1 1 1 1 1 1 1 1
x = − lı́m 2 + 2 + 3 + + + + + + + + + ···
n 2 25 27 28 210 211 213 214 216

1 1
··· + +
23n+5 23n+7

1 1 1 1 1 1 1 1 1 1 1 1
= − lı́m 8 + 2 + + + + 3 + + 6 + + 9 + + ···
n 8 25 27 2 25 27 2 25 27 2 25 27

1 1 1
· · · + 3n +
2 25 27

1 1 1 1 1 1 1
= − lı́m 8 + 2 + + + 1 + 3 + 6 + 9 + · · · + 3n
n 8 25 27 2 2 2 2
 
1
 
1 − 3n+1
 81 1 1 2  81 5 1  81 5
= − + + lı́m = − + 7 3 =− + 4
  
8 25 27 n 1  8 2 2 −1 8 2 ·7
1− 3
2 2 3
81 · 14 + 5 1139
= − =− .
16 · 7 112
Ejercicios
15.1. Hallar la representación binaria de los números cuya expresión decimal es:
(i) 2.0078125 (ii) 0.8 6 (iii) 3.141592654 . . .
15.2. Hallar la representación decimal de los números cuya expresión binaria es:
(i) 11.01 (ii) 1.0 10 (iii) 0.100011101 . . .
4.4.2. Representaciones en bases distintas de 10 y 2

Por las mismas razones expuestas al hablar de las bases de numeración para representar números
enteros, se emplean a veces el sistema octal (base 8) y el sistema hexadecimal (base 16).
Nada especial hay que añadir sobre la representación de números reales en estos sistemas. Son
una vez más, como el decimal y el binario, sistemas posicionales: el valor de cada cifra depende
de su posición. Para buscar la expresión de un número real en estos sistemas, o para pasar las
representaciones de un número de una base a otra, basta adaptar las ideas que hemos empleado
anteriormente.
Bibliografı́a
[A-K] Aleksandrov. A. D.; Kolmogorov, A. N.; Laurentiev, M. A. & al.: La matemática:

su contenido, métodos y significado (vol. I). Alianza Editorial, Madrid, 1973.
[Ap] Apostol, T.M.: Análisis Matemático (segunda edición). Reverté, Barcelona, 1991.
[B-S] Bartle, R. G.- Sherbert, D. R.: Introducción al Análisis Matemático de una Variable.
Limusa, México, 1990.
[Dur] Durán, A. J.: Historia, con personajes, de los conceptos del cálculo. Alianza, Madrid,
1996.
Univ. Press, 1982.
[Kl1] Kline, M.: El pensamiento matemático de la Antigüedad a nuestros dı́as, I. Alianza

Editorial, Madrid, 1992.
[Kl3] Kline, M.: El pensamiento matemático de la Antigüedad a nuestros dı́as, III. Alianza
Editorial, Madrid, 1992.
Raton, 2000.
[Spv] Spivak, M.: Calculus. Cálculo Infinitesimal. (segunda edición) Reverté, Barcelona, 1990.
[1] Curso de Análisis matemático I. Capı́tulo 1: Números reales. Univ. de Zaragoza.

http://www.unizar.es/analisis matematico/analisis1/apuntes/01-reales.pdf
131
132 BIBLIOGRAFÍA
Capı́tulo 5
Números complejos.
Nuestra presentación de los números complejos es básicamente la del texto [Ap], completado
con [ApC]. Véase también [GJPR], [Her], cap. 4, [D’A-W], cap. 18; [Lieb], cap. 6. Para ejercicios
(resueltos y propuestos) son útiles [Spg], [Wil], ası́ como [D’A-W] y [Lieb].
5.1. El cuerpo complejo.

Como señala [Her], p. 195, hh las sucesivas ampliaciones de los sistemas de números se han
realizado para acomodar resultados sorprendentes en los sistemas de números conocidos. Estos
resultados sorprendentes provienen, en la mayor parte de los casos, de la resolución de ecuaciones
algebraicas.
Por ejemplo, la ecuación x + 7 = 5, en la que solamente aparecen números naturales, no posee
ningún número natural como solución; su solución es el número negativo −2. Los números naturales,
junto con los números negativos, forman el sistema de los números enteros. Este sistema de números
es insuficiente para resolver todas las ecuaciones algebraicas; la ecuación 3x = 5 no posee como
solución ningún número entero; su solución es el número fraccionario 5/3. Los números enteros,
junto con los números fraccionarios, forman el conjunto de los números racionales. Estos números
resultan insuficientes para resolver ecuaciones cuadráticas; por ejemplo, la ecuación√x2 = 2 √no tiene
un número racional como solución; sus soluciones son los números irracionales 2 y − 2. Los
números racionales, junto con los irracionales, forman el sistema de los números reales.ii
Entre los números irracionales hay, incluso, muchos que no son raı́ces de polinomios con coefi-
cientes racionales. Pese a ello, R no es ‘suficientemente completo’ desde el punto de vista algebraico:
un polinomio tan sencillo como X 2 + 1 sigue sin tener raı́ces en R. En pleno Renacimiento, los alge-
bristas italianos del siglo XVI (Tartaglia, Cardano, Bombelli: v. [Ebb], cap. 3), en su búsqueda de
raı́ces reales de ecuaciones cúbicas (de polinomios de grado 3), comenzaron un cálculo formal con
expresiones ‘imaginarias’, ‘ficticias’, en las que aparecı́an raı́ces cuadradas de números negativos,
comprobando que, aunque ignoraban qué significado atribuir a dichas expresiones, los resultados
que obtenı́an a partir de ellas eran consistentes y satisfactorios, resolviendo ası́ problemas de raı́ces
de ecuaciones de segundo y tercer grado en R. La ‘inevitabilidad’ de estas expresiones llevarı́a, tras
periodos de discusión y desconfianza sobre su naturaleza, a la introducción y aceptación final de
los números complejos. (Ver [GJPR], pp. 155–156.)
Definición 5.1.1. El cuerpo de los números complejos es el conjunto
C = {(a, b) : a, b ∈ R}
dotado de las operaciones

• suma: (a, b) + (c, d) = (a + c, b + d)
• producto: (a, b) (c, d) = (ac − bd, bc + ad).
133
134 CAPÍTULO 5. NÚMEROS COMPLEJOS
Los elementos de C reciben el nombre de números complejos .
Como conjunto, pues, C es simplemente R2 = R × R, que conocemos como espacio vectorial

sobre R, con la misma suma que acabamos de definir. La novedad (absolutamente trascendente
como veremos) está en la introducción de un producto ‘interno’, que aplica C × C en C (en R2
tenemos el producto por escalares ‘externos’, que aplica R × R2 en R2 ).
Veamos que está justificado llamar a C el cuerpo de los números complejos.
Proposición 5.1.2. Con la suma y el producto que hemos definido, C es un cuerpo conmutativo.
Demostración. Una vez más, enunciamos las propiedades a comprobar, si bien dejamos las demos-
traciones como ejercicio. (Ver [ApC], pp. 438 y ss.)
1. Propiedad asociativa de la suma. ((a1 , b1 )+(a2 , b2 ))+(a3 , b3 ) = (a1 , b1 )+((a2 , b2 )+(a3 , b3 )).
2. Propiedad conmutativa de la suma. (a1 , b1 ) + (a2 , b2 ) = (a2 , b2 ) + (a1 , b1 ).
3. Existencia de elemento neutro (cero) para la suma. Hay un número complejo, el (0, 0),
tal que para todo (a, b) ∈ C, (0, 0) + (a, b) = (a, b) + (0, 0) = (a, b).
4. Existencia de elemento opuesto para la suma. Para cada (a, b) ∈ C hay un número
complejo (y uno sólo), el número complejo (−a, −b), tal que
(−a, −b) + (a, b) = (a, b) + (−a, −b) = (0, 0).
5. Propiedad asociativa del producto. ((a1 , b1 ) (a2 , b2 )) (a3 , b3 ) = (a1 , b1 ) ((a2 , b2 ) (a3 , b3 )).
6. Propiedad conmutativa del producto. (a1 , b1 ) (a2 , b2 ) = (a2 , b2 ) (a1 , b1 ).
7. Existencia de elemento neutro (identidad) para el producto. Hay un número complejo,
el (1, 0), tal que para todo (a, b) ∈ C es (1, 0) (a, b) = (a, b) (1, 0) = (a, b).
8. Existencia de elemento inverso para el producto. (a, b) ∈ C \ {0} hay un
Para cada
a −b
elemento (y uno sólo) en C, el número complejo , , tal que
a2 + b2 a2 + b2
a −b a −b
( 2 , ) (a, b) = (a, b) ( 2 , ) = (1, 0).
a + b2 a2 + b2 a + b2 a2 + b2
(Tiene sentido porque a 6= 0 o b 6= 0.)
9. Propiedad distributiva del producto respecto de la suma. (a1 , b1 ) ((a2 , b2 ) + (a3 , b3 )) =
(a1 , b1 ) (a2 , b2 ) + (a1 , b1 ) (a3 , b3 ).
El cuerpo C contiene un subconjunto que es ‘una copia isomorfa’ al cuerpo R, que identificaremos
con R. Precisemos esta afirmación:
Proposición 5.1.3. La aplicación h : R → C dada por
h(a) = (a, 0), a ∈ R,
es inyectiva y para cualesquiera a, b ∈ R cumple
• h(a + b) = h(a) + h(b);
• h(a b) = h(a) h(b)
Procedemos, pues, a la identificación de a ∈ R con h(a) ∈ C, lo que nos permite usar la notación
simplificada a = (a, 0). Observando que todo elemento (a, b) ∈ C se puede escribir en la forma
(a, b) = (a, 0) + (b, 0)(0, 1),
si definimos la unidad imaginaria i como
i = (0, 1),
5.1. EL CUERPO COMPLEJO. 135
con esta nueva notación tenemos

(a, b) = a + ib.
Esta manera de escribir un número complejo (forma binómica ) se corresponde con la repre-
sentación del vector (a, b) de R2 en la base canónica {(1, 0), (0, 1)}. Por tanto, si a + ib = a0 + ib0
con a y b reales, necesariamente a = a0 y b = b0 . Como es sabido, la primera componente a del
número complejo z = (a, b) = a + ib se denomina la parte real de z, en sı́mbolos a = <e z, y la
segunda componente b se denomina la parte imaginaria de z, en sı́mbolos b = =m z. Ası́, tanto
la parte real como la parte imaginaria son números reales.
Los números reales están, pues, caracterizados como los z ∈ C tales que =m z = 0. La condición
<e z = 0 caracteriza a los llamados números imaginarios (imaginarios puros, en algunos textos).
Una ventaja de expresar los números complejos en forma binómica es que se hace más facil la
multiplicación. En efecto, teniendo en cuenta que
i2 = (0, 1)(0, 1) = (−1, 0) = −1
comprobamos que la ‘extraña fórmula’
(a, b) (c, d) = (ac − bd, bc + ad)
se traduce en la más ‘natural’
(a + ib)(c + id) = ac − bd + i(bc + ad),
donde para hacer esta operación sólo hace falta usar las reglas habituales de la multiplicación y las
identificaciones anteriormente expuestas. De pasada, hemos comprobado que el número complejo i
es una raı́z de X 2 + 1 en C (‘la otra’ es −i).
Ninguna de las relaciones de orden que pueden definirse en C hacen de él un cuerpo totalmente
ordenado: no hay posibilidad niguna de que se mantengan las mismas propiedades que en Q y en
R ligan la ordenación con la suma y el producto.
(En efecto: en todo cuerpo totalmente ordenado es x2 + 1 > 0 para cualquier elemento x, mientras
que en C tenemos i2 + 1 = 0.)
Conjugación. Módulo de un complejo.

Un instrumento muy importante en el manejo de los números complejos es la conjugación.
Definición 5.1.4. Dado un número complejo z, su complejo conjugado , denotado por z, está da-
do por
z = <e z − i =m z.
Proposición 5.1.5. La aplicación de C en C que asocia a cada número complejo su conjugado,
llamada conjugación , tiene las siguientes propiedades.
(i) Es un isomorfismo de cuerpo, es decir, es biyectiva y para cualesquiera z, w ∈ C se verifica
• z+w =z+w
• zw = z w
(ii) Es una involución, o sea, aplicada dos veces vuelve al elemento de partida:
z = z para todo z ∈ C.
(iii) Deja fijos exactamente los números reales:

z = z si y solo si z ∈ R.
Demostración. Son consecuencias directas de la definición (comprobarlo).

Mediante el conjugado se puede expresar algebraicamente la parte real y la parte imaginaria de
cada z ∈ C,
z+z z−z
<e z = , =m z = .
2 2i
También permite expresar algebraicamente su módulo, que pasamos a definir, lo que facilita muchas
de las operaciones que deberemos efectuar con los números complejos.
Definición 5.1.6. El módulo de un número complejo z es el número real no negativo
√ p
|z| = z z = (<e z)2 + (=m z)2 .
Por tanto, |z|2 = z z. Nótese ası́ mismo que |z| = |z|.
z <e z =m z
Ejercicio. Para z 6= 0, probar que su inverso es 2
= 2
−i .
|z| |z| |z|2
Las propiedades más importantes del módulo, que comparte con el valor absoluto en R, son las
siguientes:
Proposición 5.1.7. Dados z, w ∈ C,
(i) |z| ≥ 0 siempre, y |z| = 0 si y sólo si z = 0.
(ii) |zw| = |z||w|.
(iii) |z + w| ≤ |z| + |w| (desigualdad triangular).
Demostración.
(i) Por la propia definición, |z| ≥ 0 para todo z ∈ C y |0| = 0. Si ahora z = a + ib (a, b ∈ R) es
tal que |z| = 0, es a2 + b2 = |z|2 = 0, y puesto que 0 ≤ a2 ≤ a2 + b2 = 0, a2 = 0 y a = 0
(simétricamente, b = 0).
(ii) |zw|2 = (zw)(zw) = (zw)(z w) = z z w w = |z|2 |w|2 = (|z||w|)2 , y como |zw| y |z||w| son
números reales no negativos, forzosamente |zw| = |z||w|.
(iii) |z + w|2 = (z + w)(z + w) = (z + w)(z + w) = z z + z w + w z + w w = |z|2 + z w + z w + |w|2 =
|z|2 + 2<e (z w) + |w|2 ,
mientras que
(|z| + |w|)2 = |z|2 + 2|z||w| + |w|2 = |z|2 + 2|z w| + |w|2 ,
y como (ver lema siguiente) <e (z w) ≤ |<e (z w)| ≤ |z w|,
se obtiene la desigualdad buscada.
En la demostración de la desigualdad triangular hemos necesitado:

Lema 5.1.8. Para cada z ∈ C,
<e z ≤ |<e z| ≤ |z|, =m z ≤ |=m z| ≤ |z|.
Demostración. Pongamos a = <e z, b = =m z. De
a2 ≤ a2 + b2 = |z|2 , b2 ≤ a2 + b2 = |z|2 ,
se sigue |a| ≤ |z|, |b| ≤ |z|, y finalmente
a ≤ |a| ≤ |z|, b ≤ |b| ≤ |z|.
Como en R, se prueba:
5.1. EL CUERPO COMPLEJO. 137
Corolario 5.1.9 (desigualdad triangular inversa). Dados z, w ∈ C,
|z − w| ≥ ||z| − |w||.
Ejercicios
16.1. Expresar los siguientes números complejos en la forma a + ib, con a, b ∈ R:
5
i4 + i9 + i16

3 2 + 3i 1+i
a) (1 + i) ; b) ; c) ; d) √ .
3 − 4i 2 − i5 + i10 − i15 2
16.2. Calcular
4n
1−i m
X
.
1+i
m=1
Indicación. Calcular primero (1−i)/(1+i) y recordar que (1−w)(1+w+w2 +· · ·+wN ) = 1−wN +1 .

3 − 2ai
16.3. Dado z = , con a ∈ R, determinar el valor de a para que z ∈ R y calcular entonces el
4 − 3i
valor de z.
16.4. Calcular dos complejos cuya suma sea 1 + 4i, cuyo cociente sea imaginario y de manera que
la parte real de uno de ellos sea −1.
16.5. Hallar x, y ∈ R tales que z = x+iy sea una raı́z cuadrada de 2−5i, es decir, (x+iy)2 = 2−5i.
En general, dados a, b ∈ R, si z = x + iy es una raı́z cuadrada de a + bi, es decir, (x + iy)2 = a + bi,
expresar x e y en función de a, b.
1+z
16.6. Sea z ∈ C con z 6= 1. Probar que es imaginario si y sólo si |z| = 1.
1−z
z−a
16.7. Sean w, z ∈ C tales que w = con 0 < a < 1. Probar que |w| < 1 si y sólo si |z| < 1.
az − 1

a−b
16.8. Probar que si |a| = 1 o |b| = 1, entonces
= 1. ¿Qué excepción debe hacerse si
1 − ab
|a| = |b| = 1?
1+z
16.9. Sea w = con w = u + iv y z = x + iy (x, y, u, v ∈ R). Probar que
1−z
u2 + v 2 − 1 2v
x= 2 2
; y= .
(u + 1) + v (u + 1)2 + v 2
16.10. Sea z = a + ib (a, b ∈ R). Demostrar que existen p, m y n independientes de z (z 6= 0, −1)

tales que
(a2 + b2 )(a2 + b2 + 2a + 1)
= p + mz + nz 2 .
a2 − b2 + a − (1 + 2a)bi
Hallar p, m y n.
1.2 El plano complejo

5.2. El plano complejo
Para abordar este apartado utilizaremos frecuentemente un lenguaje geométrico meramente intui-
Ensin
tivo, este apartadoestrictamente
atenernos utilizaremos al frecuentemente un lenguaje
estilo más deductivo geométrico meramente
del planteamiento intuitivo,
del resto del sin
curso. Ası́,
atenernos
por ejemplo,estrictamente
hablaremosal deestilo más deductivo
ángulos, o daremosdel porplanteamiento
bueno que lasdel resto delseno
funciones curso. Ası́, por
y coseno del
ejemplo, hablaremos de ángulos, o daremos por bueno que las funciones seno y coseno
Análisis matemático se corresponden con las funciones definidas gráficamente en Trigonometrı́a, del Análisis
matemático
aunque para seello
corresponden
no tengamosconninguna
las funciones definidas
justificación gráficamente
rigurosa. en Trigonometrı́a,
Si hemos aunque
de ser totalmente para
honestos,
ello no tengamos
ni siquiera tenemosninguna
hasta justificación rigurosa. rigurosa
ahora una definición Si hemosdede lasser totalmente
funciones senohonestos,
y coseno:ninos
siquiera
hemos
tenemos hasta ahora una definición rigurosa de las funciones seno y coseno: nos hemos
conformado con admitir su existencia y propiedades. Es tarea de cursos superiores la construcción conformado
con
y eladmitir
estudiosudeexistencia y propiedades.
estas y otras Es tarea debásicas,
funciones elementales cursos superiores
por lo quelaseguiremos
construcción y el estudio
usándolas como
de estasahora.
hasta y otras funciones elementales básicas, por lo que seguiremos usándolas como hasta ahora.
LaLaidea
ideade
departida
partidaenenesta
estasección
secciónesesque
quetodo
todonúmero
númerocomplejo
complejozz== a+ib
(*)
(a,b b∈∈R)
a+ib(a, R)lolopodemos
podemos
representar en el plano como el punto de coordenadas (a, b), su afijo
representar en el plano como el punto de coordenadas (a, b), su afijo . . 1
Esto
Estosupone
suponeque quetenemos
tenemos fijado
fijado en
en elel plano
plano un
un sistema
sistema cartesiano
cartesiano de
de ejes
ejes coordenados.
coordenados. Los Los
puntos
puntos del eje de abscisas serán los complejos (x, 0), o sea, los números reales, por loque
del eje de abscisas serán los complejos (x, 0), o sea, los números reales, por lo quellamaremos
llamaremos
aaeste ejeeleleje
esteeje ejereal
real. .Análogamente,
Análogamente,elelejeejededeordenadas
ordenadasestará
estaráformado
formadopor
porlos
lospuntos
puntos(0,(0,y),
y),los
los
números y denominaremos a este eje el eje imaginario
números imaginarios puros iy, y denominaremos a este eje el eje imaginario . Nos referiremosaa
imaginarios puros iy, . Nos referiremos
este
estesistema
sistemacon conelelnombre
nombrede dediagrama
diagramade deArgand.
Argand.
EnEneste
estecontexto,
contexto,laladistancia
distanciaeuclı́dea
euclı́deaen
enelelplano,
plano,por
porejemplo,
ejemplo,permitirá
permitirádefinir
definirlaladistancia
distancia
entre dos complejos z y w, que vendrá dada
entre dos complejos z y w, que vendrá dada porpor
d(z, w)==|z|z−−w|,
d(z,w) w|,
p
2 2+ (y − v)2 .2
ya
yaque
quesisizz==x+iy,
x+iy,ww==u+iv, (x,y,y,u,u,v v∈∈R),
u+iv,(x, R),ambas
ambascantidades
cantidadesson igualesa a (x(x−−u)u)
soniguales + (y − v) .
En particular, para cada z ∈ C, su módulo mide la distancia de z a 0.
En particular, para cada z ∈ C, su módulo mide la distancia de z a 0.
Análogamente,
Análogamente,puesto
puestoquequetodo
todopunto
puntodel planozz6==00queda
delplano quedaunı́vocamente
unı́vocamentedeterminado
determinadopor por
sus coordenadas polares, es decir, su distancia al origen (i.e., su módulo) y por el ángulo
sus coordenadas polares, es decir, su distancia al origen (i.e., su módulo) y por el ángulo polar (el polar (el
que
queforma
formaelelsegmento
segmentode deextremos
extremos00yyzzcon
coneleleje
ejereal),
real),podremos
podremosutilizar
utilizarpara
paratales
taleszzlalallamada
llamada
representación
representación polar o módulo-argumental. La medida del ángulo polar (en radianes)eseslolo
polar o módulo-argumental. La medida del ángulo polar (en radianes)
que
quellamaremos
llamaremosargumento
argumentode dez.z.
Pongamosen
Pongamos enorden
ordenestos
estosconceptos.
conceptos.
Observando la figura, tenemos
Observando la figura, tenemos las lasigualdades
igualdades
<eezz==|z||z|cos
cosφ,φ, mzz==|z|
=m |z|sen
senφ,φ,
z=(a,b ) de donde
de donde
|z|
|z|(cosφφ++i isen
zz==|z|(cos senφ).
φ).
b= Im z Comosiempre
Como siempresucede
sucedecon conlalamedida
medidade deángulos,
ángulos,hay
hayaquı́
aquı́una
una
φ ambigüedad, puesto que φ y φ + 2kπ con k ∈ Z hacen el mismo
ambigüedad, puesto que φ y φ + 2kπ con k ∈ Z hacen el mismo
O a = Re z papelde
papel decara
caraaalaslasigualdades
igualdadesanteriores.
anteriores.Esto Estonos
noshace
haceabordar
abordar
las siguientes precisiones sobre la definición de
las siguientes precisiones sobre la definición de argumento.argumento.
Definición5.2.1
Definición 1.2.1(Argumentos). Dadoz z∈∈CC\ \{0},
(Argumentos).Dado {0},un
unargumento
argumentodedez zesescualquier
cualquierφφtal
talque
que
z = |z| cos φ, z = |z| sen φ.

<e z = |z| cos φ, =m z = |z| sen φ.
El conjunto de los argumentos de z lo denotaremos por arg z, es decir,
El conjunto de los argumentos de z lo denotaremos por arg z, es decir,
arg z = {φ ∈ R : cos φ = e z/|z|, sen φ = m z/|z|}.
arg z = {φ ∈ R : cos φ = <e z/|z|, sen φ = =m z/|z|}.
1
Esta observación fue hecha repetidamente por matemáticos que no lograron eco suficiente en la comunidad
(*)
Esta observación
matemática fueArgand,
(entre ellos hecha repetidamente
a cuyo nombrepor matemáticos
ha quedado que nohasta
asociada), lograron ecoadoptada
que fue suficientepor
enGauss
la comunidad
en 1831 y
matemática (entre
más tarde por ellos Argand,
Cauchy, zanjando aası́
cuyo nombre ha
la polémica quedado
sobre asociada),
la legitimidad dehasta que fue complejos
los números adoptada por
(verGauss en 1831
[DD-P], y
pp. 254
más tarde
y ss.) por Cauchy, zanjando ası́ la polémica sobre la legitimidad de los números complejos (ver [DD-P], pp. 254
y ss.)
5.2. EL PLANO COMPLEJO 139
Entonces, arg z es un conjunto! Pero ‘es obvio’ que si para dos valores φ0 , φ ∈ R, se cumple
cos φ = cos φ0 , sen φ = sen φ0 ,
debe existir un k ∈ Z de manera que

φ = φ0 + 2kπ;
en otras palabras, el conjunto arg z puede describirse, conocido uno cualquiera de sus elementos,
de la siguiente manera:
{φ0 + 2kπ : φ0 ∈ arg z, k ∈ Z} = φ0 + 2πZ.
De esta forma, en cualquier intervalo semiabierto de longitud 2π, por ejemplo (−π, π], existe un
único elemento perteneciente al conjunto arg z. A este elemento se le denota por
Arg z,
y se le llama argumento principal (precaución: en algunos textos se llama argumento principal

al que está en el intervalo [0, 2π)). Por tanto, para nosotros:
Definición 5.2.2 (Argumento principal). Dado z ∈ C \ {0},
Arg z = φ si y sólo si φ ∈ (−π, π] y cos φ = <e z/|z|, sen φ = =m z/|z|.
Definición 5.2.3. La representación polar o módulo-argumental de un número complejo no

nulo viene dada por su módulo y uno cualquiera de sus argumentos.
Para presentarla de una manera más compacta, introducimos la siguiente notación.
Definición 5.2.4. Dado φ ∈ R, pondremos
eiφ = cos φ + i sen φ.
Por tanto, dado z ∈ C \ {0}, si φ ∈ arg z será
z = |z| eiφ
(representación exponencial de un número complejo).
Nótese que para z = 0 se tiene z = |z| eiφ cualquiera que sea φ ∈ R.

Ejercicio. Para cada φ ∈ R, |eiφ | = 1. Recı́procamente, para todo z ∈ C con |z| = 1 existe φ ∈ R
tal que z = eiφ .
Ejercicio. Si φ ∈ R, entonces eiφ = 1 si y sólo si existe k ∈ Z tal que φ = 2kπ.
Ejercicio. Comprobar la fórmula de Euler
eiπ + 1 = 0.
(Se ha dicho que esta es una de las más bellas fórmulas de las Matemáticas, porque liga los números
fundamentales del Álgebra, la Geometrı́a y el Análisis).
Proposición 5.2.5 (Representación exponencial del producto de dos números comple-

jos). Dados z1 , z2 ∈ C, si z1 = |z1 | eiφ1 , z2 = |z2 | eiφ2 , con φ1 , φ2 ∈ R, se tiene
z1 z2 = |z1 z2 | ei(φ1 +φ2 ) = |z1 | |z2 | ei(φ1 +φ2 ) .

Demostración. Ya probamos que |z1 z2 | = |z1 | |z2 |.

Demostración. Ya probamos que |z1 z2 | = |z1 | |z2 |.
Operando
Operando
eiφ1iφe1iφ2iφ2 = (cos φ1 + i sen φ1 ) (cos φ2 + i sen φ2 )
e e = (cos φ1 + i sen φ1 ) (cos φ2 + i sen φ2 )
= cos φ1 cos φ2 − sen φ1 sen φ2 + i(cos φ1 sen φ2 + sen φ1 cos φ2 )
= cos φ1 cos φ2 − sen φ1 sen φ2 + i(cos φ1 sen φ2 + sen φ1 cos φ2 )
= cos(φ1 + φ2 ) + i sen(φ1 + φ2 ) = ei(φi(φ1 +φ2 )
,
1 +φ2 )
= cos(φ1 + φ2 ) + i sen(φ1 + φ2 ) = e ,
y queda finalmente
y queda finalmente z1 z2 = |z1 | |z2 | ei(φ1 +φ2 ) = |z1 z2 | ei(φ1 +φ2 ) .
z1 z2 = |z1 | |z2 | ei(φ1 +φ2 ) = |z1 z2 | ei(φ1 +φ2 ) .
Por tanto, mientras que la suma y la resta de números complejos no son otra cosa que la suma
Por tanto,
y la resta mientras
de vectores en elque la suma
plano, que no y lanecesita
resta degráficamente
números complejos
más queno la son otra cosa
traslación que la suma
de segmentos
y lafigura
(ver resta 1),
de vectores en el plano,
la construcción que del
gráfica no necesita
productográficamente
de dos números más que la traslación
complejos es undepoco
segmentos
más
(ver figura(ver
complicada 1), la construcción
figura 2): gráfica del producto de dos vectores es un poco más complicada (ver
figura 2):
z .w
z +w
uz
w
w-z
w
z u1 z
0 0 1
z-w
Figura 1 Figura 2
Figura 1 Figura 2
|w||w|
dados iφ ∈ C, para construir z · w hemos de girar z un ángulo φ (con centro de giro en
dados z, z,
ww== eiφe ∈ C, para construir z · w hemos de girar z un ángulo φ (con centro de giro en el
el origen)
origen) y efectuar
y efectuar una homotecia
una homotecia que multiplique
que multiplique el módulo
el módulo de z de
porz elpor
deelw.deComo
w. Como
se muestrase muestra
en
en la figura, para llevar esto a cabo basta girar el triángulo de vértices 0, 1, z hasta
la figura, para llevar esto a cabo basta girar el triángulo de vértices 0, 1, z hasta que el segmento que el segmento
dede extremos
extremos 0 y0 1y tenga
1 tenga la la dirección
dirección deldel segmento
segmento dede extremos
extremos 0 y0 w,
y w, obteniéndose
obteniéndose ası́ası́
el el triángulo
triángulo
de vértices 0, u , u ; z · w es el punto de corte de la recta que pasa por
de vértices 0, u1 , 1uz ; zz · w es el punto de corte de la recta que pasa por 0 y uz con 0 y u z con la paralela
la paralela por por
ww a la
a la recta
recta queque pasa
pasa porporu1uy1 uy u(¿por
z
z (¿por qué?)
qué?)
Corolario
Corolario 1.2.6
5.2.6 (Representación
(Representación exponencial
exponencial deldel cocientedededos
cociente dosnúmeros
númeroscomplejos).
complejos).
Dados z , z ∈ C, si
Dados z1 , 1z2 ∈2 C, si z1 =z = |z
1 |z1 | e
1 |
iφe1
iφ1 , z = |z |iφeiφ2 = 0, se tiene
, z2 =2 |z2 | e
2 2 6= 0, se tiene
z1 z1 =|z1|z| 1 |i(φi(φ1 −φ2 )

z= |z e| e 1 −φ2 ) . .
z2 2 |z2 | 2
Demostración.Basta
Demostración. Basta tener
tener enen cuenta
cuenta que,
que, según
según lo lo que
que acabamos
acabamos dede probar,
probar,
|z1|z| 1 |i(φi(φ1 −φ
|z1|z| 1 | i(φi(φ 1 −φ
e e 1 −φ 2) 2)
z2 z=
2 = |z2|z| e| e 1 −φ 2 +φ 2) 2)
2 +φ == |z1|z| e1 |iφe1iφ=
1 z .
=1 z1 .
|z2|z| 2 | |z2|z| 2 | 2
Nota.
Nota.LaLa
expresión eiφe,iφφ, ∈
expresión φ∈ comparte
R,R, propiedades
comparte algebraicas
propiedades dede
algebraicas la la
exponencial real:
exponencial real:
eiφeeiφiψeiψ
==ei(φ+ψ) ∈∈
, ,φ, φ,ψ ψ
ei(φ+ψ) R,R,
(eiφ )iφ−1−1
= ei(−φ) , φ ∈ R.
(e ) = ei(−φ) , φ ∈ R.
5.3. POLINOMIOS EN C Y EN R. 141
Ejercicios
17.1. Hallar los módulos y los argumentos √ √de los números complejos: −2x (x ∈ R \ {0}), iy
(y ∈ R \ {0}), 1 + i, −1 − i, (1 + i)(1 + i 3)( 3 − i), 2 + 5i, 2 − 5i, −2 + 5i, −2 − 5i (estos últimos,
en función del arc tg(5/2)). ¿Cuál es el argumento principal?
17.2. Si φ, ψ ∈ R, entonces eiφ = eiψ si y sólo si existe k ∈ Z tal que φ − ψ = 2kπ.
17.3. Hallar el módulo y el argumento principal de 1 + cos φ + i sen φ, donde −π ≤ φ ≤ π.
1 + cos x + i sen x
17.4. Hallar la parte real y la imaginaria, el módulo y un argumento de .
1 + cos y + i sen y
1
17.5. Sean α ∈ R y a ∈ C tales que 2 cos α = a + . Obtener 2 cos nα en función de a.
a
iα
iα 1
Indicación. ¿Qué vale e − a e − ?
a
17.6. Si x + iy = (2 + cos α + i sen α)−1 con α, x, y ∈ R, hallar x e y en función de α y probar que
el punto (x, y) está siempre en la circunferencia de diámetro el segmento que une los puntos ( 31 , 0)
y (1, 0).
17.7. Sean z1 , z2 , z3 ∈ C distintos dos a dos. Explicar el significado geométrico de las relaciones:
z 3 − z1 z 3 − z1
(i) =m =0; (ii) <e =0.
z 2 − z1 z 2 − z1
z2
17.8. Sean z1 , z2 ∈ C con z1 6= 0. Probar que es imaginario si y sólo si |z1 + z2 | = |z1 − z2 |.
z1
Deducir que un paralelogramo tiene sus diagonales iguales si y sólo si es un rectángulo.
17.9. Demostrar que |z1 − z2 |2 + |z1 + z2 |2 = 2|z1 |2 + 2|z2 |2 . Deducir que “un cuadrilátero es un
paralelogramo si y sólo si la suma de los cuadrados de las longitudes de sus diagonales es igual a la
suma de los cuadrados de las longitudes de todos sus lados” (ley del paralelogramo).
17.10. Demostrar que el triángulo cuyos vértices son los puntos z1 , z2 , z3 sobre el diagrama de
Argand es equilátero si y sólo si
z12 + z22 + z32 = z1 z2 + z2 z3 + z3 z1 .
17.11. ¿Cuál es el lugar geométrico de los puntos del plano complejo tales que |z + 16| = 4|z + 1|?
5.3. Polinomios en C y en R.
Reflexionando sobre lo que hemos hecho hasta ahora, parece que nuestros logros son más bien
modestos. Hemos añadido a R básicamente un número, i, que nos genera ‘linealmente’ C, y que es
una raı́z del polinomio concreto X 2 + 1. ¿Qué sucederá con los demás polinomios? Lo que pasa lo
expone estupendamente el premio Nobel de Fı́sica, Richard Feynman, en un capı́tulo llamado
Algebra (de lectura absolutamente recomendada en su totalidad) de su libro [Fey], p. 22-10:
hh Ahora ustedes dirán: “¡Esto puede seguir indefinidamente! Hemos definido las potencias de
los imaginarios y todo lo demás y cuando estamos listos, viene alguien con otra ecuación
que no puede ser resuelta como x6 + 3x2 = −2. ¡Entonces tenemos que generalizar todo de
nuevo!” Pero resulta que con esta invención adicional que es simplemente la raı́z cuadrada
de −1, ¡toda ecuación algebraica puede ser resuelta! Este es un hecho fantástico que debemos
dejar que lo demuestre el Departamento de Matemáticas. Las demostraciones son hermosas
y muy interesantes, pero ciertamente no son evidentes por sı́ mismas. De hecho, la suposición
más evidente es que vamos a tener que inventar de nuevo, de nuevo y de nuevo. Pero el
milagro más grande es que no tenemos que hacerlo. Esta es la última invención. Después
de esta invención de los números complejos, encontramos que las reglas siguen funcionando
con los números complejos y hemos terminado de inventar cosas nuevas. Podemos encontrar
la potencia compleja de cualquier número complejo, podemos resolver cualquier ecuación
escrita algebraicamente en términos de un número finito de esos sı́mbolos. No encontramos
más números nuevos. ii
5.3.1. Potencias y raı́ces de un número complejo

Comenzaremos construyendo las raı́ces de unos polinomios muy particulares, los de la forma
X n − z para un z cualquiera de C. Nuestro desarrollo de esta parte es, esencialmente, el de [Ap],
pp. 26–28.
Definición 5.3.1. Dados z ∈ C y n ∈ Z, se define

(
z 0 = 1, z n+1 = z n z si n ≥ 0,
z n = z −1 −n

si n < 0 y z 6= 0.
Corolario 5.3.2 (Fórmula de De Moivre.). Dado φ ∈ R, para todo n ∈ N es
(cos φ + i sen φ)n = cos(nφ) + i sen(nφ).
Demostración. Escrita en forma exponencial,
(eiφ )n = einφ ,
se obtiene cómodamente por inducción. Para n = 1 es trivialmente cierta, y si es cierta para un n,

entonces
(eiφ )n+1 = (eiφ )n eiφ = einφ eiφ = einφ+iφ = ei(n+1)φ .
Ejercicio. ¿Qué ocurre con la fórmula de De Moivre para n ∈ Z?
Proposición 5.3.3. Dados dos enteros m y n, tenemos, siempre que estén definidas las potencias,
z m z n = z m+n , (z m )n = z mn , (z1 z2 )n = z1n z2n .
Demostración. Para m, n ≥ 0, es un ejercicio de inducción (hacerlo). Para m o n < 0, aplicar la

definición y los resultados para exponentes no negativos (cf. [Ap], Teorema 1.50).
Teorema 5.3.4. Si z 6= 0 y n ∈ N, existen exactamente n números complejos distintos z0 , z1 , . . . ,

zn−1 (llamados raı́ces n-ésimas de z), tales que
zkn = z
para cada k = 0, 1, . . . , n − 1.
Además, si α es un argumento de z, estas raı́ces están dadas por las fórmulas
zk = r eiϕk , k = 0, 1, . . . , n − 1,
donde
α 2kπ
r = |z|1/n , ϕk = + (k = 0, 1, . . . , n − 1).
n n
1.3.POLINOMIOS
5.3. POLINOMIOS EN
EN CC
YY EN
EN R.R. 14311
Demostración.(Cf.
Demostración. (Cf.[Ap[Ap ], págs
], págs 27–28)
27–28)
Los n números complejos r eiϕ k , k = 0, 1, . . . , n − 1, son distintos entre sı́: pues si tomamos
Los n números complejos r eiϕ k, k = 0, 1, . . . , n − 1, son distintos entre sı́: pues si tomamos
iϕk = r eiϕj se sigue ei(ϕk −ϕj ) = 1 [porque r = 0
enteros k, j, con 0 ≤ k ≤
enteros k, j, con 0 ≤ k ≤ n − 1, 0 −iϕ n − 1, 0 ≤ j ≤ n −
≤ j ≤ n − 1, de r e 1, de r e
iϕ k = r eiϕj se sigue ei(ϕk −ϕj ) = 1 [porque r 6= 0
y basta multiplicar por (1/r) e j ] y de aquı́ ϕ − ϕ = 2mπ para algún m ∈ Z; pero entonces
−iϕ
y basta multiplicar por (1/r) e j ] y de aquı́ ϕk − k ϕ j= 2mπ para algún m ∈ Z; pero entonces
j
α 2kπ α 2jπ k −
α +2kπ −α −2jπ = 2mπ, es decir,k − j = m es un entero, y dado que j
+ − − = 2mπ, es decir, = m es un entero, y dado que
nn nn nn nn nn
−(n−(n −− 1)1) =0 − 0− −−
(n(n 1)1) ≤k − k− j j ≤(n(n −− −−
1)1) 0 0 =n n −− 1 1 < 1,
−1−1<< n = n ≤ n ≤ n = n < 1,
n n n n n
k−j
esosólo
eso sólopuede cumplirsesi sik − j ==
puedecumplirse 0, es decir, si k = j.
n n 0, es decir, si k = j.
Además,cada
Además, cadauno
unodedetales talesnúmeros
númerosesesuna unaraı́z
raı́zn-ésima
n-ésimadedez:z:
(r eiϕk )n = rn einϕk = |z| ei(α+2kπ) = |z| eiα = z.
(r eiϕk )n = rn einϕk = |z| ei(α+2kπ) = |z| eiα = z.
Por último, no hay otras raı́ces n-ésimas de z distintas de las anteriores, pues un polinomio de
Por último, no hay otras raı́ces n-ésimas de z distintas de las anteriores, pues un polinomio de
grado n puede tener a lo más n raı́ces distintas, y las raı́ces n-ésimas de z son justamente las raı́ces
grado n puede tener a lo más n −nz. raı́ces distintas, y las raı́ces n-ésimas de z son justamente las raı́ces
del polinomio P (X) = X n
del polinomio P (X) = X − z.
Obsérvese que todas las raı́ces n-ésimas de un complejo z tienen el mismo módulo, |z|1/n , y que
Obsérvese que todas las raı́ces n-ésimas de un complejo z tienen el mismo módulo, |z|1/n , y que
sus argumentos difieren en múltiplos de 2π/n radianes, de modo
sus argumentos difieren en múltiplos de 2π/n radianes, de modo
que sus afijos están sobre una circunferencia de centro el origen
eπi/5 que sus afijos1/n
y radio |z|
están sobre una circunferencia de centro el origen
, ocupando los vértices de un polı́gono regular de
y radio |z| 1/n , ocupando los vértices de un polı́gono regular de
e 2 π i/5 n lados.
n lados.
Ejemplo. Para cada n ∈ N existen n raı́ces n-ésimas de la
π/5 Ejemplo. Para cada n ∈ N2πi/n existen n raı́ces n-ésimas de la
unidad , los números 1, 2πi/n e e2(n−1)πi/n , situados sobre
, . . . ,2(n−1)πi/n
0 unidad , los números 1, e , ..., e , situados sobre
1 los vértices de un polı́gono regular de n lados inscrito en la
los vértices de un polı́gono regular de n lados inscrito en la
circunferencia unidad, de centro el origen y radio 1. Además,
circunferencia unidad, de centro el origen y radio 1. Además,
el polı́gono es simétrico respecto del eje real. Estas raı́ces son
e -2πi/5 el polı́gono es simétrico respecto del eje real. Estas raı́ces son
e -πi/5 las potencias sucesivas de e2πi/n , y pueden obtenerse numerosas
las potencias sucesivas de e2πi/n , y pueden obtenerse numerosas
relaciones algebraicas entre ellas.
relaciones algebraicas entre ellas.
√√
Problemasdedenotación
Problemas notaciónpara paralas lasraı́ces.
raı́ces. SiSi queremos
queremos mantener
mantener laslasnotaciones z 1/nó ón zn zque
notacionesz 1/n que
empleábamospara
empleábamos paralaslasraı́ces
raı́cesn-ésimas
n-ésimasnononegativas
negativasdedeloslosnúmeros
númerosreales
realesnononegativos,
negativos,¿cómo
¿cómopro- pro-
ceder ahora, que para cada z ∈ C \ {0} tenemos n raı́ces diferentes
ceder ahora, que para cada z ∈ C \ {0} tenemos n raı́ces diferentes sin ningún criterio sin ningún criterio incontestable
incontestable
√√
paradistinguir
para distinguirentre
entreellas?
ellas?EnEn particular:
particular: ¿qué
¿qué significa
significa z z 1/2
1/2 ? ? ¿qué
¿qué significa z? z?
significa
√√
Podrı́amosreservar
Podrı́amos reservarel elsı́mbolo z 1/nó ón zn zpara
sı́mboloz 1/n raı́zn-ésima
paralalaraı́z n-ésimaprincipal
principaldedez,z,definida
definidacomo como
|z||z|
1/ni(Arg
i(Arg z)/n
1/n
e e z)/n , ,
dondeArg
donde Arg
z zindica
indicael elargumento
argumentoprincipal
principaldedez z(el(elque
quequeda
quedaentre
entre−π−πy yπ),π),o outilizar
utilizaruno
unodedeellos
ellos
(o los dos) para el conjunto de todas las raı́ces n-ésimas
(o los dos) para el conjunto de todas las raı́ces n-ésimas de z. de z.
Los
Los convenios
convenios utilizados
utilizados varı́an
varı́an dede unos
unos textos
textos a otros,
a otros, por
por lolo cual,
cual, para
para nonocaercaer
enen ambigüedades,
ambigüedades,
merece la pena explicitar siempre el significado exacto atribuido
merece la pena explicitar siempre el significado exacto atribuido a los sı́mbolos que a los sı́mbolos queseseestén
estén
manejando, sin necesidad de decantarse por ninguno. Por ejemplo,
manejando, sin necesidad de decantarse por ninguno. Por ejemplo, pondrı́amos: pondrı́amos:
• •para c∈
paraa,a,b, b,c ∈ R,R,a a
6==
0,0,
2 2 + bz + c = 0
azaz+ bz + c = 0
si siy ysólo
sólosi si
√√b2 − 4ac
−b
−b ± ± b2 − 4ac ,
z=z= ,
2a2a
esesdecir,
decir,
√√b2 − 4ac √√b2 − 4ac
−b
−b + + b 2 − 4ac −b
−b − − b2 − 4ac ,
z=z= o oz =z= ,
√ 2a2a 2a2a
donde√b2b−
donde
2 − 4ac indica una cualquiera de las raı́ces cuadradas del complejo2b2 − 4ac.
4ac indica una cualquiera de las raı́ces cuadradas del complejo b − 4ac.
Ejemplo. Cuando z sea un número real no negativo, z ∈ [0, +∞), como z = 0 o Arg z = 0, se
obtiene como raı́z cuadrada principal de z justamente su raı́z cuadrada real no negativa
Ejercicios
18.1. Dado x ∈ R, hallar la parte real y la imaginaria de:
a) (1 n
+ cos x + i sen x) ; n
1 + cos x + i sen x
b) .
1 + cos y + i sen y
1 + sen a + i cos a n

18.2. Calcular , n ∈ N y a ∈ R.
1 + sen a − i cos a
√ √
18.3. Calcular todos los valores de 4 −1, 6 1 + i.
18.4. Hallar los números complejos que son iguales a la potencia n-ésima de sus conjugados.
18.5. Probar que la suma de las potencias n-ésimas de las raı́ces k-ésimas de la unidad es k o 0,
según n sea o no múltiplo de k.
2π 4π 6π 8π
18.6. Probar que 1 + cos + cos + cos + cos = 0 y dar una interpretación geométrica.
5 5 5 5
Probar que √ √
π 5+1 2π 5−1
cos = , cos = .
5 4 5 4
18.7. Probar que
π 2π 3π 4π
1 − cos + cos − cos + cos = 0
5 5 5 5
π 2π 3π 4π
− sen + sen − sen + sen = 0
5 5 5 5
18.8. Probar que si n ∈ N se tiene

π n π n √ √ n nπ
1 + i tan + 1 − i tan =2 6 − 2 cos
12 12 12
18.9. Hallar la suma 1 + 2 cos θ + 2 cos 2θ + · · · + 2 cos nθ.

sen 6θ sen 5θ
18.10. Expresar en potencias de cos θ (θ ∈ R): cos 6θ, cos 3θ, , .
sen θ sen θ
Expresar en en potencias de sen θ(θ ∈ R): sen 3θ, sen 7θ.
√
2πi/13 13 − 1
18.11. Sea ω = e . Probar que ω + ω3 + ω4 + ω9 + ω 10 + ω 12 = .
2
Indicación: Si S es la suma, ¿quién es (2S + 1)2 ?
6
2
X
18.12. Sea z = e2πi/7 . Calcular zn .
n=1
5.3.2. Teorema fundamental del Álgebra y sus consecuencias

Desde el punto de vista algebraico, la principal ventaja del cuerpo complejo es que, al contrario
que R, C es algebraicamente cerrado, i.e., todo polinomio no constante con coeficientes complejos
tiene una raı́z en C.(**) Este hecho fue ‘presentido’ antes de que se llegara a formular adecuadamente
(**)
Sigue dándose una condición de minimalidad: es el menor cuerpo algebraicamente cerrado que contiene a .
C R
Con mayor precisión, si un cuerpo algebraicamente cerrado contiene un subcuerpo isomorfo a , debe contener un R
subcuerpo isomorfo a .C
5.3. POLINOMIOS EN C Y EN R. 145
y mucho antes de que se lograra una demostración incuestionable (ver [DD-P], pp. 248–253). No es
un resultado fácil de demostrar con argumentos elementales pero, en cursos posteriores, será una
consecuencia sencilla del análisis de las funciones complejas de variable compleja. No obstante,
puede verse una demostración relativamente asequible (bastante larga) en [A-K], pp. 344–352; ver
también [D’A-W], pp. 324 y ss.
Aquı́ nos limitaremos a dar su enunciado y a deducir las consecuencias que de él se derivan en
relación con el estudio de las raı́ces y de la factorización de los polinomios en C[X] y en R[X].
Teorema 5.3.5 (D’Alembert-Gauss). Todo polinomio no constante con coeficientes complejos

admite al menos una raı́z en C.
Corolario 5.3.6. Los polinomios irreducibles en C[X] son los de grado 1 (lineales), de manera que
todo polinomio en C[X] de grado n, n ∈ N, admite una factorización como producto de n factores
lineales.
Demostración. Ya comentamos que los polinomios de grado 1 son siempre irreducibles. Cualquier
otro polinomio p en C[X] de mayor grado ya no es irreducible, pues tendrı́a una raı́z z ∈ C y serı́a
por tanto de la forma p(X) = (X − z) q(X), con deg q = deg p − 1 6= 0.
La segunda conclusión se sigue del teorema de factorización única: necesariamente,
p(X) = a(X − z1 ) · · · (X − zn )
a 6= 0, z1 , . . . , zn ∈ C si deg p = n.
Corolario 5.3.7. Sea n ∈ N. Todo polinomio en C[X] de grado n posee exactamente n raı́ces, si
se cuenta cada una de ellas tantas veces como indique su multiplicidad.
Demostración. Dado p ∈ C[X] de grado n, agrupando los factores X − z repetidos en la descom-

posición anterior, si z1 , . . . , zk , son las distintas raı́ces de p, con multiplicidades m1 , . . . , mk ,
resulta
p(X) = a(X − z1 )m1 · · · (X − zk )mk
y por tanto m1 + · · · + mk = n.
Pasemos ahora a caracterizar los polinomios irreducibles en R[X].
Lema 5.3.8. Dado p ∈ R[X], si z ∈ C es tal que p(z) = 0, entonces p(z) = 0. En palabras, si
un polinomio con coeficientes reales tiene una raı́z compleja z, también su conjugado z es raı́z del
polinomio.
Demostración. Por las propiedades de la conjugación, si p(X) = a0 + a1 X + · · · + an X n , y a0 , a1 ,

. . . , an ∈ R, para todo z ∈ C es
p(z) = a0 + a1 z + · · · + an z n = a0 + a1 z + · · · + an z n = a0 + a1 z + · · · + an z n = p(z).
En particular, p(z) = 0 implica p(z) = p(z) = 0.
Corolario 5.3.9. Los polinomios irreducibles en R[X] son los polinomios lineales y los polinomios
cuadráticos de la forma
a[(X − b)2 + c2 ],
con a, b, c ∈ R, a 6= 0 y c 6= 0 (que son los polinomios cuadráticos sin raı́ces en R).
Demostración. Los polinomios lineales son siempre irreducibles, y los polinomios cuadráticos del
enunciado son irreducibles en R[X] por ser de segundo grado y no tener raı́ces en R (nótese que las
raı́ces en C de a[(X − b)2 + c2 ] son b + ic y b − ic).
Cualquier polinomio irreducible q en R[X] es de esta forma. Pues si tiene alguna raı́z en R,
es lineal. Y si no, mirado en C[X], admitirá al menos una raı́z compleja b + ic con c 6= 0; pero
también tendrá por raı́z b − ic según el lema. Por tanto, es divisible (en principio en C[X]) por
(X − (b + ic))(X − (b − ic)) = (X − b)2 + c2 , que tiene coeficientes reales; el cociente de q por
(X − b)2 + c2 es el mismo en C[X] que en R[X] (¿por qué?), luego debe ser un a ∈ R[X] con
deg a = 0, o sea, una constante real no nula.
Nota. Los polinomios de segundo grado irreducibles en R[X] son, equivalentemente, los de la forma
AX 2 + BX + C con B 2 − 4AC < 0 (¿por qué?).
Ejercicios
19.1. Factorizar X 4 + 1 y X 4 + 4 en C[X], en R[X] y en Q[X].
19.2. Descomponer en factores irreducibles el polinomio X n + X n−1 + · · · + X + 1
(i) en C[X];
(ii) en R[X].
19.3. Mediante factorización, probar que todo polinomio real de grado impar admite al menos una
raı́z real.
19.4. Hallar dos números complejos cuya suma sea 4 y cuyo producto sea 8.
Indicación. ¿Quién es (X − a)(X − b)?
19.5. Si z1 , z2 son las dos soluciones de la ecuación az 2 + bz + c = 0, donde a, b, c ∈ R, demostrar
que z1n + z2n ∈ R para todo n ∈ N. Si la ecuación es en particular z 2 − 2z + 2 = 0, calcular z1n + z2n .
√ √
19.6. Sabiendo que la ecuación z 2 − ( 3 + i 3)z + p = 0 tiene por solución z = −1 + i, hallar p y
la otra raı́z.
19.7. ¿Qué condición han de cumplir los números reales a, b, c, d para que la ecuación
z 3 + az 2 + (b + ic)z + b + id = 0 admita una raı́z real?
19.8. Comprobar que z = 3 + 4i es una solución de la ecuación z 4 − 10z 3 + 62z 2 − 178z + 325 = 0
y hallar las otras tres raı́ces.
19.9. Considérese la ecuación z 3 − 2z + c = 0, donde c ∈ R. Hallar sus soluciones sabiendo que una
de ellas está en la bisectriz del primer cuadrante del plano complejo.
19.10. Resolver la ecuación (iz + 1)5 = (1 − z)5 .
19.11. Demostrar que el polinomio (X +i)n −(X −i)n tiene todas sus raı́ces reales y determinarlas.
19.12.
(i) Demostrar que si a ∈ R,
m−1
Y
2m 2m 2 2 2kπ
(z + a) − (z − a) = 4amz z + a cotg .
2m
k=1
(ii) Usando el apartado anterior, probar que

m−1
Y kπ
cotg = 1.
2m
k=1
N
Y
( zk significa z1 · · · zN .)
k=1
5.4. FRACCIONES RACIONALES. 147
5.4. Fracciones racionales. Fracciones simples.

Como señalábamos al construir los números racionales a partir de los enteros, la misma cons-
trucción puede llevarse a cabo partiendo de cualquier dominio de integridad, para sumergirlo en un
‘cuerpo de fracciones’. En particular, el método puede aplicarse al dominio K[X] de los polinomios
en la indeterminada X con coeficientes en un cuerpo conmutativo K, obteniéndose ası́ el cuerpo de
las fracciones racionales (también llamado ‘de las fracciones algebraicas’, ver [Pest]). No daremos
ninguna demostración, puesto que basta repetir las empleadas en la construcción de Q, cambiando
simplemente ‘número entero’ por ‘polinomio’ (el lector puede comprobarlo en algún caso para una
mejor comprensión del proceso).
Lema 5.4.1. Sea Φ = K[X] × (K[X] \ {0}), y ∼ la relación en Φ dada por

(p1 , q1 ) ∼ (p2 , q2 ) cuando y sólo cuando p1 q2 = p2 q1 .
Entonces ∼ es una relación de equivalencia en Φ.
A los elementos de Φ los denominaremos fracciones algebraicas en la indeterminada X, con

coeficientes en K.
Definición 5.4.2. El cuerpo de las fracciones racionales es el conjunto cociente K(X) =

Φ/ ∼. Sus elementos, que denominaremos fracciones racionales , son las clases de equivalencia
[(p, q)].
Nota sobre nomenclatura y notación. No hay una denominación estándar universalmente

utilizada para los elementos de Φ y de K(X): es habitual llamar indistintamente a unos y otros
‘fracciones algebraicas’ o ‘fracciones racionales’. Para mayor complicación, el sı́mbolo empleado
normalmente para la relación de equivalencia ∼ en Φ es =. Igualmente, se emplea la notación
clásica p/q para los dos objetos distintos (p, q) ∈ Φ o [(p, q)] ∈ K(X). A veces, se dice que una
fracción racional admite una representación p/q para indicar que (p, q) es un representante de la
clase de equivalencia que constituye dicha fracción.
Es realmente notable que a pesar de todos estos ‘abusos’, no haya dificultades serias de enten-
dimiento si se considera en cada situación cuál es el sentido adecuado al contexto.
El lector queda advertido, pues, de que poco a poco iremos relajando la precisión adhiriéndonos
a la práctica habitual, aunque en este primer apartado intentaremos ser fieles a la notación y
nomenclatura introducidas. Como muestra, por ejemplo:
Definición 5.4.3. Una fracción algebraica p/q se dice irreducible si p y q son relativamente
primos, es decir, si mcd(p, q) = 1.
(Evidentemente, aquı́ p/q ∈ Φ, aunque no se indique explı́citamente.)

Ejercicio. Probar que toda fracción algebraica es equivalente a una fracción irreducible; dicho de
otro modo, que toda fracción racional admite un representante que es una fracción irreducible.
Concretamente, dados polinomios p, q ∈ K[X] con q 6= 0 y mcd(p, q) = d, si p = p1 d, q = q1 d,
p/q ∼ p1 /q1 y p1 /q1 es irreducible.
p1 p 2
Definición 5.4.4. Dadas , ∈ Φ, su suma es
q1 q2
p1 p2 p1 q 2 + p 2 q 1
+ = (∈ Φ),
q1 q2 q1 q2
y su producto
p1 p2 p1 p2
= (∈ Φ).
q1 q2 q1 q2
p1 r 1 p2 r 2 p1 r 1 p2 r2
Lema 5.4.5. Dados , , , en Φ tales que ∼ , ∼ , se verifica
q1 s1 q2 s2 q1 s1 q2 s2
p1 p2 r1 r2 p1 p2 r1 r2
+ ∼ + , ∼ .
q1 q2 s1 s2 q1 q2 s1 s2
p1 p 2
Definición 5.4.6. Dadas dos fracciones racionales , ∈ K(X), llamaremos suma de ambas
q1 q2
a la fracción racional
p1 p 2 p 1 q 2 + p2 q 1
+ = [∈ K(X)],
q1 q2 q1 q2
y producto a la fracción racional
p1 p2 p1 p2
= [∈ K(X)].
q1 q 2 q1 q2
Según el lema previo, la

aplicación suma (respectivamente, producto) de K(X)×K(X) en K(X)
p1 p 2 p1 q 2 + p2 q 1
que hace corresponder a , ∈ K(X) × K(X) la fracción racional (respectiva-
q 1 q 2 q1 q2
p1 p2
mente, está bien definida.
q1 q2
Proposición 5.4.7. Con la suma y el producto que hemos definido, K(X) es un cuerpo conmuta-
tivo.
Proposición 5.4.8. La aplicación h : K[X] → K(X) dada por
h(p) = p/1 ∈ K(X), p ∈ K[X],
tiene las siguientes propiedades:
(i) es inyectiva, h(p1 ) 6= h(p2 ) si p1 6= p2 ;
(ii) transforma sumas en sumas, h(p1 + p2 ) = h(p1 ) + h(p2 );
(iii) transforma productos en productos, h(p1 p2 ) = h(p1 ) h(p2 ).
Es decir, h es un isomorfismo entre K[X] y h(K[X]) por lo que, desde este momento, conside-
ramos
K[X] ⊆ K(X) y p = p/1 para todo p ∈ K[X].
5.4.1. LECTURA: funciones racionales.

Igual que hemos hablado de funciones polinómicas, obtenidas mediante evaluación de polino-
mios, ¿podemos definir funciones racionales mediante evaluación de fracciones racionales? Ahora
las cosas se complican: mientras que no hay ningún problema en evaluar p(x) para cada p ∈ K[X]
y x ∈ K, no podemos decir lo mismo sobre la evaluación de p/q ∈ K(X) en cualquier x ∈ K. Si
bien hemos exigido que q 6= 0, eso no impide que puedan existir x ∈ K para los que q(x) = 0 (las
posibles raı́ces de q), lo que hace que p(x)/q(x) no tenga sentido en K. Es, pues, necesario ajustar
nuestro planteamiento.
Definición 5.4.9. Una función racional es un cociente de funciones polinómicas.

Por tanto, su dominio será todo K salvo un número finito de elementos, a lo más (los que anulen
al denominador).
5.4. FRACCIONES RACIONALES. 149
En consecuencia, dos representantes distintos de una misma fracción racional originan dos
X +1
funciones racionales diferentes: por ejemplo, mientras que las fracciones racionales y
X2 − 1
X −2
son iguales, las funciones racionales f y g, cocientes respectivamente de las funciones
X 2 − 3X + 2
polinómicas x + 1 y x2 − 1, x − 2 y x2 − 3x + 2, son distintas puesto que dom f = K \ {1, −1},
dom g = K \ {1, 2}. Evidentemente, en los x pertenecientes a la intersección de sus dominios
1
ambas toman el mismo valor, igual a su vez a .
x−1
Esto es lo que sucede en general:
Sea p/q ∈ Φ y r/s una fracción irreducible equivalente a p/q; el conjunto S de ceros de s está con-
tenido en el conjunto de ceros de q, y la función racional asociada a p/q es la restricción a K \ S
de la función racional asociada a r/s.
5.4.2. Fracciones simples

Las fracciones racionales admiten una representación ‘estándar’ que es muy útil en ciertas
aplicaciones. En lo que sigue, para simplificar los enunciados, suponemos que deg p ≤ deg q significa
hh p = 0 o deg p ≤ deg q ii.
Lema 5.4.10. Dada una fracción p(X)/q(X), existen polinomios p0 (X), p1 (X) unı́vocamente de-
terminados tales que deg p1 < deg q y
p(X) p1 (X)
= p0 (X) + .
q(X) q(X)
Demostración. La igualdad del enunciado puede reescribirse
p(X) p0 (X)q(X) + p1 (X)

= ,
q(X) q(X)
lo que significa, por definición, que (***)
p(X)q(X) = [p0 (X)q(X) + p1 (X)]q(X),
que equivale, cancelando q (o, para la implicación inversa, multiplicando por q), a
p(X) = p0 (X)q(X) + p1 (X).
Por tanto, el lema es sólo otra manera de enunciar la existencia y unicidad de la división de
polinomios.
Lema 5.4.11. Si q(X) ∈ K[X] es de la forma q(X) = q1 (X)q2 (X) con mcd(q1 , q2 ) = 1, toda
fracción racional p(X)/q(X) puede descomponerse en suma de fracciones con denominadores q1 y
q2 ; es decir, existen polinomios p1 y p2 tales que
p(X) p1 (X) p2 (X)

= + .
q(X) q1 (X) q2 (X)
Demostración. Puesto que existen dos polinomios u y v tales que uq1 + vq2 = 1,
p p(uq1 + vq2 ) pv pu
= = + .
q q1 q2 q1 q2
(***)
Aquı́ estamos mirando p/q como elemento de K(X).
Ejemplo. En R(X),
1 1
= √ √ .
X4 + 1 (X + 2X + 1)(X 2 − 2X + 1)
2
√ √
Llamemos A = X 2 + 2X + 1, B = X 2 − 2X + 1. Puesto que
√ √
A = B + 2 2X, B = (X − 2)X + 1,
(algoritmo de Euclides ‘salvo constantes’) se sigue que
√ √
√ √ 1 X− 2 X− 2
1 = B − (X − 2)X = B − (X − 2) √ (A − B) = B(1 + √ )−A √
2 2 2 2 2 2
√ √
X+ 2 X− 2
= √ B− √ A,
2 2 2 2
y de aquı́
√ √ √ √
1 (X + 2)B (X − 2)A 1 X+ 2 1 X− 2
= √ − √ = √ √ − √ √ .
X4 + 1 2 2AB 2 2AB 2 2 X 2 + 2X + 1 2 2 X 2 − 2X + 1
—Análogamente, para
X +1 X +1
= ,
X3 − 1 (X − 1)(X 2 + X + 1)
de X 2 + X + 1 = (X − 1)(X + 2) + 3 se sigue que
X +1 1 X + 1 1 (X + 1)(X + 2) 1 (X − 1) + 2 1 (X 2 + X + 1) + (2X + 1)
= − = −
X3 − 1 3 X − 1 3 X2 + X + 1 3 X −1 3 X2 + X + 1
1 2 1 2X + 1
= − .
3 X − 1 3 X2 + X + 1
Este segundo ejemplo sugiere que el lema anterior puede refinarse cuando el numerador es un
polinomio de menor grado que el denominador .
Lema 5.4.12. Si q(X) ∈ K[X] es de la forma q(X) = q1 (X)q2 (X) con mcd(q1 , q2 ) = 1, toda
fracción algebraica p(X)/q(X) con deg p < deg q puede descomponerse, de manera única, en
suma de fracciones con denominadores q1 y q2 y numeradores p1 y p2 tales que deg p1 < deg q1 ,
deg p2 < deg q2 ; es decir, existen polinomios unı́vocamente determinados p1 y p2 tales que
deg p1 < deg q1 , deg p2 < deg q2 y
p(X) p1 (X) p2 (X)
= + .
q(X) q1 (X) q2 (X)
Demostración. Sean p1 y p2 como en el lema anterior. Si deg p1 ≥ deg q o deg p2 ≥ deg q, dividiendo
serı́a p1 = c1 q1 + r1 , p2 = c2 q2 + r2 , deg r1 < deg q1 , deg r2 < deg q2 o nulos. Haciendo operaciones
p = (c1 +c2 )q +r1 q2 +r2 q1 ; deg(r1 q2 ) < deg q1 +deg q2 = deg q, deg(r2 q1 ) < deg q2 +deg q1 = deg q,
lo que significa que c1 + c2 es el cociente de la división de p por q, necesariamente nulo porque
deg p < deg q (el resto serı́a r1 q2 + r2 q1 ). Por tanto
p(X) r1 (X) r2 (X)
= + , deg r1 < deg q1 , deg r2 < deg q2 .
q(X) q1 (X) q2 (X)
La unicidad se sigue de que si también
p(X) s1 (X) s2 (X)
= + , deg p1 < deg q1 , deg s2 < deg q2 ,
q(X) q1 (X) q2 (X)
se deduce que r1 q2 + r2 q1 = s1 q2 + s2 q1 , es decir, (r2 − s2 )q1 = (s1 − r1 )q2 , y como q1 y q2 son
relativamente primos, q1 |(s1 − r1 ); pero entonces s1 − r1 = 0, pues en caso contrario,
deg q1 ≤ deg(s1 − r1 ) ≤ máx{deg s1 , deg r1 } < deg q1 , imposible. Por lo mismo, r2 − s2 = 0.
5.5. NÚMEROS COMPLEJOS Y GEOMETRÍA PLANA 151
Lema 5.4.13. Toda fracción racional de la forma p(X)/[q(X)]m puede expresarse como
p(X) p1 (X) pk (X) pm (x)

m
= p0 (X) + + ··· + k
+ ··· +
[q(X)] q(X) [q(X)] [q(X)]m
con deg pk < deg q, 1 ≤ k ≤ m.
Demostración. Dividiendo repetidamente por q se obtiene
p = c1 q + pm = (c2 q + pm−1 )q + pm = · · · = (· · · (p0 q + p1 )q + · · · + pm−1 )q + pm ,
con deg pk < deg q, 1 ≤ k ≤ m, lo que equivale a la igualdad del enunciado.
Nota. Los polinomios p0 , p1 , . . . , pm están unı́vocamente determinados (probarlo como ejercicio).
Definición 5.4.14. Un elemento de K(X) es una fracción simple si puede escribirse en la forma
p(X)/[q(X)]k , donde q(X) es irreducible en K[X] y el grado de p(X) ∈ K[X] es estrictamente
menor que el de q(X).
a
Ejemplo. En C(X) las fracciones simples son sólo de la forma , con a, b ∈ C. En R(X)
(X − b)k
a1 + a2 X
aparecen además fracciones del tipo , a1 , a2 , b, c ∈ R.
[(X − b)2 + c2 ]k
Proposición 5.4.15 (Descomposición en fracciones simples). Todo elemento p/q de K(X)

admite una expresión única como suma de un polinomio en X más una suma de fracciones simples.
Demostración. Es consecuencia de los lemas anteriores.
Ejercicio. Simplificar y descomponer en fracciones simples en C(X) y en R(X) las siguientes

fracciones:
(X + 1)3 X 3 − 27 X 2 + 5X + 6
(a) ; (b) ; (c) ;
X2 − 1 X2 − 9 X2 − 4
2X − 3 1 X 5 + 5X 3 − X + 6
(d) ; (e) ; (f) .
(X − 1)(X − 2)(X − 3) (X 2 − 9)2 X3 − 1
Nota. Los programas de cálculo simbólico (maple, Mathematica ) permiten generalmente efec-
tuar estas operaciones. Por ello, recomendamos calcular ‘a mano’ los coeficientes numéricos pedidos
en alguno de los ejercicios anteriores, y plantear cuando menos la forma del resultado en todos los
demás. Solo después es aconsejable pasar al ordenador.
(Para maple , la sintaxis es hh convert((a0 + a1 ∗ x + · · · )/(b0 + b1 ∗ x + · · · ),parfrac,x);ii y
para Mathematica , hh Apart[(a0 + a1 x + · · · )/(b0 + b1 x + · · · )]ii)
5.5. LECTURA: Números complejos y geometrı́a plana.

En los ejercicios de un apartado anterior hemos apuntado tı́midamente la interrelación entre la
geometrı́a del plano y el cálculo con números complejos. Lamentablemente, no podemos extendernos
en esta dirección, pero como un auténtico regalo para cualquier aficionado a las Matemáticas pro-
ponemos la lectura de un libro muy especial, Liang-shin Hahn: Complex Numbers and Geometry.
Mathematical Association of America, 1994., (que contiene resultados geométricos más profundos
que los que aparecen aquı́), y ofrecemos una lista de ejercicios suplementarios ‘fuera de con-curso’
para esos ratos en los que apetece salirse de la rutina (algunos de ellos pertenecen a otro libro
interesante en este aspecto, [Wil]).
Ejercicios
20.1. Desigualdades triangulares. Probar que la longitud del lado de un triángulo es menor
que la suma de las longitudes de los otros dos y mayor que su diferencia.
20.2. Mediatriz de un segmento. Probar que “el lugar geométrico de los puntos que equidistan
de dos puntos fijos A y B es la recta perpendicular al segmento AB por su punto medio.”
20.3. Demostrar que:
(i) Si z1 + z2 + z3 = 0 y |z1 | = |z2 | = |z3 | = 1, los puntos z1 , z2 y z3 son vértices de un triángulo

equilátero inscrito en la circunferencia unidad.
(ii) Si z1 + z2 + z3 + z4 = 0 y |z1 | = |z2 | = |z3 | = |z4 |, los puntos z1 , z2 , z3 y z4 o bien son vértices
de un rectángulo o bien coinciden de dos en dos.
20.4. ¿Bajo qué condición tres puntos z1 , z2 y z3 , distintos dos a dos, estarán sobre una misma
recta?
20.5. ¿Bajo qué condición cuatro puntos z1 , z2 , z3 y z4 , distintos dos a dos, estarán sobre una
misma circunferencia o sobre una misma recta?
20.6. Demostrar que las alturas de un triángulo son concurrentes (es decir, que las tres se cortan
en un mismo punto, el ortocentro del triángulo).
20.7. ¿Puede probarse algebraicamente que un paralelogramo tiene las diagonales perpendiculares
si y sólo si es un rombo? ¿Y que tiene las diagonales iguales si y sólo si es un rectángulo?
Bibliografı́a
[A-K] Aleksandrov. A. D.; Kolmogorov, A. N.; Laurentiev, M. A. & al.: La matemática:

su contenido, métodos y significado (vol. I). Alianza Editorial, Madrid, 1973.
[ApC] Apostol, T.M.: Calculus, vol. I (segunda edición). Reverté, Barcelona, 1989.
[Ap] Apostol, T.M.: Análisis Matemático (segunda edición). Reverté, Barcelona, 1991.
[DD-P] Dahan-Dalmedico, A.; Peiffer, J.: Une histoire des mathématiques. Éditions du Seuil,
Paris, 1986.
[Fey] Feynman, R. & al.: Fı́sica. Volumen I: Mecánica, radiación y calor. Addison-Wesley
Iberoamericana, Wilmington, Delaware, 1987.
[Her] Hernández, E.: Álgebra y geometrı́a. Addison-Wesley/UAM, Madrid, 1994.
Raton, 2000.
[Spg] Spiegel, M.R.: Variable compleja. McGraw Hill (colección Schaum), 1971..
[Wil] Williams, J.: Álgebra de números complejos. Limusa-Wiley, México, 1974.
153
154 BIBLIOGRAFÍA
Capı́tulo 6
Aritmética de punto flotante.
Estudiaremos (muy superficialmente) la representación de los números reales en los ordenadores

y su ‘aritmética’. Las referencias pertinentes a la bibliografı́a irán apareciendo a lo largo de la
exposición.
En todo este capı́tulo, cuando no se especifica lo contrario, hh númeroii significa número real.
6.1. Aperitivo.
Lee atentamente estos enunciados:
(1) Según tu calculadora, ¿qué vale

1 1 1 1 1 1
+ + , 1− − − ?
3 3 3 3 3 3
(2) Comprueba con tu calculadora que

√
1+ 5
a) a = = 1, 6180339 . . .
2
√
1+ 5
a−1 −1 0, 6180339 . . .
b) b = = 2 √ = = 1, 6180333 . . .,
2−a 1+ 5 0, 3819661 . . .
2−
2
de modo que a > b.
Responde ahora cuidadosamente a estas cuestiones:
(i) ¿Cómo se explica el resultado de (1)?
(ii) ¿Son correctas las operaciones de (2)?

SÍ u
t NO u
t NO SÉ u
t
(iii) En (2), lo cierto es que:

a>bu
t a=bu
t a<bu
t .
¿Qué consecuencias sacas?
155
156 CAPÍTULO 6. ARITMÉTICA DE PUNTO FLOTANTE.
6.2. Representación en punto flotante

En una reunión se plantea la siguiente pregunta:
“¿Cuánto vale π?”
El ingeniero dice: “Es aproximadamente 3 y 1/7.”
El fı́sico responde: “Es 3.141592.”
El matemático piensa un momento, y replica:
“Es igual a π.”
(Del folklore)
Hemos mostrado la posibilidad teórica de representar los números reales mediante sucesiones de
dı́gitos en distintas bases. Ahora vamos a enfrentarnos con su representación práctica en un orde-
nador, con las limitaciones efectivas que la realidad impone.
6.2.1. Números de máquina

El conjunto de los números reales no puede representarse plenamente en un ordenador (¡ni
siquiera el de los números enteros!). Si queremos guardar las cifras decimales (o más frecuentemente,
binarias) de un número en un ordenador, sólo disponemos de un número finito de ‘huecos’ para
hacerlo. Podemos, simplemente, ignorar las cifras del desarrollo a partir de un cierto lugar; pero se
aprovecha mejor el espacio evitando “ceros innecesarios” como en la ‘notación cientı́fica’, con una
representación en punto flotante:
número = signo × mantisa × base exponente
Por ejemplo, para la constante de gravitación universal G = 6.673 × 10−11 , la mantisa es 6.673, la
base es 10 y el exponente −11.
Este y otros ejemplos de magnitudes muy grandes o muy pequeñas, como
Masa del electrón 9.109 × 10−28 g.

Masa del sol 1.989 × 1030 kg.
Constante de Plank 6.626 × 10−34 J·s
Número de Avogadro 6.022 × 1023 mol−1
ponen de manifiesto el ahorro de cifras que conlleva esta notación.

Pero cada número admite infinitas representaciones de este tipo:
−111/2 = −55.5 × 100 = −5.55 × 101 = −0.555 × 102 = . . ., o también
−111/2 = −555 × 10−1 = −5550 × 10−2 = . . .
Para tener unicidad hace falta normalizar la representación. Habitualmente, como hemos hecho
en los ejemplos de notación cientı́fica,
el primer dı́gito no nulo de la mantisa aparece a la izquierda del punto,
la parte entera del valor absoluto consta de una sola cifra: −111/2 = −5.55 × 101 .
Esto excluye el número 0, que queda como excepción, y ha de ser representado aparte.
En matemáticas es también frecuente otra normalización,
colocando la primera cifra no nula inmediatamente después del punto;
el valor absoluto de la mantisa es siempre menor o igual que 1 y su parte entera es nula:
−111/2 = −0.555 × 102 .
La diferencia entre ambas normalizaciones es inesencial: todo se reduce a sumar o restar 1 al
exponente. Lo importante es que el punto decimal flota para eliminar los ceros ‘innecesarios’:
2/111 = 0.018018018 . . . = 1.8018018 × 10−2 , o bien 2/111 = 0.18018018 × 10−1 .
6.2. REPRESENTACIÓN EN PUNTO FLOTANTE 157
La normalización ahorra espacio: Si se emplea base 2 en vez de base 10, como todas las mantisas
comenzarán por hh 1. etc.ii, podemos sobreentender no sólo el punto, sino también el 1 (‘técnica
del bit fantasma’). En la segunda normalización, todas las mantisas —en cualquier base— van a
comenzar por hh 0. etc.ii, lo que hace innecesario explicitar el 0 y el punto.
Finalmente, el tamaño de las palabras del ordenador fuerza a limitar:
la precisión, la cantidad p de dı́gitos disponibles para colocar en ellos la mantisa;
la cantidad p0 de dı́gitos disponibles para el exponente, que estará por tanto comprendido
entre un valor mı́nimo y un valor máximo.
Con tales condicionantes, fijada una base β, los números de máquina , verdaderamente dis-
ponibles en el ordenador, serán

E d2 d3 dp
y = ±β d1 + + 2 + · · · + p−1 ,
β β β
donde cada dı́gito dk satisface 0 ≤ dk ≤ β − 1 y d1 6= 0, y el exponente E toma sus valores entre
un mı́nimo Emin y un máximo Emax .
Paralelamente, con la segunda normalización obtendrı́amos

e d1 d2 dp
y = ±β + 2 + ··· + p ,
β β β
con 0 ≤ dk ≤ β − 1 y d1 6= 0, y emin ≤ e ≤ emax . Se pasa de una a otra, por tanto, tomando
e = E + 1. Ambas son equivalentes, en el sentido de que generan exactamente los mismos números
(con la relación señalada entre los exponentes, y con Emin = emin − 1, Emax = emax − 1).
Aún ası́:
— hay multitud de implementaciones posibles
— cada fabricante elige la que mejor le parece
— esto dificulta enormemente la transportabilidad de los programas de cálculo.
Para unificar, se han propuesto diversas estandarizaciones:
norma IEEE 754 (completada con la IEEE 854); denominada también IEC 559. Es la más
utilizada. Hay en la red ‘applets’ que muestran el formato archivado por el ordenador ([2]). La
normalización elegida para la mantisa (denominada significando en esta norma) es la primera,
d1 .d2 . . . dp , con β = 2 o β = 10 como bases permitidas.
norma ISO/IEC 10967-1 Language Independent Aritmetic, Part 1 [LIA-1], posterior y menos
restrictiva. Usa la segunda normalización 0.d1 d2 . . . dp para la mantisa (denominada ahora
fracción), y admite cualquier base β que sea un número natural par.
Sistemas numéricos en punto flotante

Para analizar las dificultades y la complejidad de la representación y manejo en el ordenador
de números en punto flotante, se establecen ‘modelos ideales’, que sean ‘simples pero realistas’.
Siguiendo a Higham (v. [Hig] §2.1, pp. 40 y ss.), usaremos lo que él denomina sistemas numéricos
en punto flotante.
Previamente, notemos: cuando escribimos

d1 d2 dp
y = ±β e + 2 + ··· + p ,
β β β
d1 d2 dp
la fracción f = + 2 + · · · + p se puede representar también como m × β −p , donde m es un
β β β
entero de p dı́gitos del intervalo [β p−1 , β p − 1]; concretamente m = d1 β p−1 + d2 β p−2 + · · · + dp . Ası́
y = ±f × β e = ±(m × β −p ) × β e = ±m × β e−p .
Por ser la notación más cómoda, ésta es la forma de los valores que vamos a usar para definir los
sistemas numéricos en punto flotante.
Definición 6.2.1. Un sistema numérico en punto flotante es un subconjunto finito de R,

F = F (β, p, emin , emax ), caracterizado por cuatro parámetros enteros:
• β∈Z (la base o radix de F )

• p∈Z (la precisión de F )
• emin ∈ Z (el menor exponente de F )
• emax ∈ Z (el mayor exponente de F )
Dados valores especı́ficos de β, p, emin , emax , se define
FN = {y = ±m × β e−p : m, e ∈ Z, β p−1 ≤ m ≤ β p − 1, emin ≤ e ≤ emax },
y finalmente
F = {0} ∪ FN
El mayor y el menor número positivo de F son
f max := máx{y ∈ F : y > 0} = β emax (1 − β −p )

f minN := mı́n{y ∈ FN : y > 0} = β emin −1
Llamaremos rango de F al conjunto [−f max, −f minN ] ∪ {0} ∪ [f minN , f max] (que contiene
a F estrictamente).
Nótese que ahora la mantisa m de un número y = 0.d1 d2 . . . dp × β e de FN es el entero
d1 d2 . . . dp (escritos en base β).
Llamaremos a d1 el dı́gito más significativo y a dp el dı́gito menos significativo de y.
En la norma LIA-1, los parámetros β y p han de satisfacer
β ≥ 2 y p ≥ 2,
y β tiene que ser par.

Ası́ mismo, “para que haya bastantes elementos en F ”, los parámetros emin , emax y p han de
satisfacer
p − 2 ≤ −emin ≤ β p − 1,
p ≤ emax ≤ β p − 1.
En IEEE 754 y 854 se consideran cuatro formatos distintos: precisión simple, precisión doble,
precisión simple extendida, precisión doble extendida, con valores para los parámetros (ver [Hig],
p. 41):
formato β p emin emax

IEEE simple 2 24 −125 128
IEEE doble 2 53 −1021 1024
IEEE simple extendida 2 ≥ 32 ≤ −1021 ≥ 1024
IEEE doble extendida 2 ≥ 64 ≤ −16381 ≥ 16384
(reajustados a la normalización hh 0.d1 . . .ii).

Ejemplos
1.- Si β = 2, p = 5 [= 22 + 1], y = 11/2 = 22 + 1 + 1/2 = 23 (2−1 + 2−3 + 2−4 ), tendrı́amos
(con mantisa y exponente en base 2, escrito el cero como O y el uno como I para distinguir)
y = O.IOIIO × 2II = IOIIO × 2II−IOI ; la mantisa m es IOIIO y el exponente e es II.
2.- ‘Minimodelo’ con β = 2, p = 3, emin = −1, emax = 3. Los números no negativos de F serı́an (en
escritura decimal) el 0 y
fracción
1/2 1/2 + 1/8 1/2 + 1/4 1/2 + 1/4 + 1/8 exponente
0.25 0.3125 0.3750 0.4375 × 2−1
0.5 0.625 0.750 0.875 × 20
1.0 1.25 1.50 1.75 × 21
2.0 2.5 3.0 3.5 × 22
4.0 5.0 6.0 7.0 × 23
que se distribuyen gráficamente ası́:
0 0.25 0.5 1.0 2.0 3.0 4.0 5.0 6.0 7.0
Junto con sus opuestos (los simétricos respecto del origen) forman el sistema F = F (2, 3, −1, 3).
Este ejemplo ilustra cómo el espaciado de los números de F salta un factor 2 (= β) con cada
potencia de 2 (= β).
6.2.2. Aproximación por redondeo

Elegido un determinado sistema numérico en punto flotante para implementar en el ordenador,
el resto de los números reales (¡casi todos!) no existen para él. Esta situación no es nueva en
absoluto: cada vez que hemos usado un valor numérico de π, hemos puesto π = 3.14, o π = 3.1416,
o π = 3.141592654 (cuando disponemos de calculadora); no hemos podido manejar su ‘valor exacto’,
que, como decı́a el matemático, ‘es π’. La realidad fuerza inevitablemente a tomar aproximaciones,
por lo que, si no podemos evitar los errores que generan, tratemos al menos de minimizarlos.
Eso hacemos cuando ponemos π = 3.1416 (aproximación por exceso) y no π = 3.1415 (aproxi-
mación por defecto o por corte): tomamos el valor más próximo a π entre los que tienen cinco cifras
decimales.
Para simplificar(*) , definiremos:
Definición 6.2.2 (Redondeo y desbordamiento.). Dado F = F (β, p, emin , emax ), el redondeo
( respecto de F ) es la aplicación f l : R → F ∪ {overflow, underflow} dada por
f l(x) = overflow si |x| > f max = máx F
(hay un desbordamiento por exceso )
f l(x) = underflow si 0 < |x| < f minN = mı́n{|y| : y ∈ F, y 6= 0}

(hay un desbordamiento por defecto ).
f l(x) = elemento de F más próximo a x si x está en el rango de F .

Cuando haya dos números en F a la misma distancia de x, convendremos en tomar como
f l(x) el que tenga el último dı́gito dp par.
(*)
La norma IEEE 754 contempla distintos modos de redondeo: redondeo hacia +∞ (round down), redondeo hacia
−∞ (round up), redondeo hacia 0 (round towards zero) y redondeo al más próximo (round to nearest). Ver [Gold]
Ejercicio. Para x, y en el rango de F ,

(i) x ≤ y implica f l(x) ≤ f l(y);
(ii) f l(−x) = − f l(x);
(iii) f l(β n · x) = β n · f l(x) (supuesto β n · x en el rango de F ).

Ejemplos. (1) En nuestro ‘minimodelo’ con β = 2, p = 3, emin = −1, emax = 3, se produce
desbordamiento por exceso siempre que |x| > 7, y por defecto si 0 < |x| < 0.25.
underflow overflow
0 0.25 0.5 1.0 2.0 3.0 4.0 5.0 6.0 7.0
Para x = 4.5, serı́a f l(x) = 4; para x = 5.5, serı́a f l(x) = 6 (¿por qué?).
(2) Para β = 10, p = 6:
a = 0.31415926525 . . . × 101 f l(a) = 0.314159 × 101
b = −0.81412781 f l(b) = −0.814128 × 100
c = 0.112399972 f l(c) = 0.124000 × 100
d = 0.999999721 f l(d) = 0.100000 × 101
Obsérvese cómo el último dı́gito de la mantisa de b ha sido modificado. El cambio puede afectar
incluso a varios dı́gitos (como en c) y a veces hasta al exponente, como en el ejemplo d.
Medidas del error de redondeo

Al redondear un número, es decir, al sustituir un x ∈ R por f l(x) como valor aproximado,
cometemos un error cuyo tamaño conviene saber controlar. Puesto que cada x en el rango de
F que no pertenezca a F estará en un intervalo (y1 , y2 ) con extremos en F y uno sólo, y f l(x)
será precisamente uno de esos extremos,
y1 —————————————— y2
x
el valor de | f l(x) − x| = mı́n{|x − y| : y ∈ F } será, en el peor de los casos, la mitad de la longitud
y2 − y1 del intervalo. Basta, por tanto, controlar el espaciado entre los números de F . En general,
se observa que el espaciado es uniforme entre potencias consecutivas de β, y que se multiplica por
β al saltar a una nueva potencia de β.
Para concretar más, se utiliza el épsilon de la máquina, que es la distancia M desde 1.0 al
siguiente número de F más grande que él. Por tanto,
Definición 6.2.3. Épsilon de la máquina . Para un sistema numérico en punto flotante F =
F (β, p, emin , emax ), el épsilon de la máquina es el número
M = β 1−p ,
Por tanto, M es el espaciado de los números en punto flotante entre 1.0 y β, mientras que el
espaciado de los números entre 1.0 y 1/β es β −p = M /β. En general,
Lema 6.2.4. La distancia entre un número en punto flotante normalizado y y otro número en
punto flotante normalizado adyacente a y es como mı́nimo β −1 M |y| y como máximo M |y| (salvo
que uno de ellos sea cero).
Demostración. Ver [Hig], pp. 41.
Pero según dice [Hig], ‘la cantidad más útil asociada con F , que está por todas partes en el
mundo del análisis de los errores de redondeo’, es la llamada unidad de redondeo, que no es otra
cosa que la mitad del épsilon de la máquina.
Definición 6.2.5. Dado un sistema numérico en punto flotante F = F (β, p, emin , emax ), el número
1 1
u = β 1−p = M se llama unidad de redondeo del sistema F .
2 2
En el estándar IEEE con simple precisión se tiene u = 2−24 ≈ 5.96 × 10−8 ; en doble precisión,
u = 2−53 ≈ 1.11 × 10−16 .
A partir del lema anterior, se obtiene:
Proposición 6.2.6. Si x ∈ R está en el rango de F , entonces
1
| f l(x) − x| ≤ u |x| = β 1−p |x|;
2
precisando más,
1
f l(x) = x(1 + δ), |δ| < u = β 1−p .
2
Demostración. Ver [Hig], p. 42, Th. 2.2.
Esta proposición nos da cotas superiores del error absoluto y del error relativo en la aproxima-
ción de x por f l(x). Recordamos la definición de estos conceptos.
Definición 6.2.7. Sea x un número real. Si x

e es otro número real, que tomamos como una aproxi-
mación de x, se llama error absoluto (de la aproximación) a la diferencia
Ea (x) = |x − x
e|,
y error relativo (cuando x 6= 0) al cociente

Ea (x) |x − xe| x
e x
= 1 − = − 1 .
e
Er (x) = =
|x| |x| x x
e = x + α con |α| = Ea (x); y para x 6= 0, x

Ası́ x e = x(1 + ρ) con |ρ| = Er (x).
La proposición 6.2.6 significa, por tanto, que el error relativo del redondeo es siempre estricta-
mente menor que la unidad de redondeo.
Nota. En algunos textos, el error se expresa en términos de la unidad en el último lugar, que se
define para un y ∈ F por
ulp(y) = ulp(±0.d1 d2 . . . dp × β e ) = 0.00 . . . 01 × β e = β e−p
(ulp: unity in the last place). Ası́, por ejemplo, si F corresponde a β = 10 y p = 3, y se redondea
.0314159 a .314 × 10−1 , entonces hay un error de .159 unidades en el último lugar. Dada la distri-
bución de los elementos de F , es preferible usar el error relativo, más preciso; mientras que para
x = 0.9994999999 tendrı́amos f l(x) = 0.999 × 100 , con ulp(f l(x)) = 10−3 y un error de 0.4999999
ulp ≈ 0.5 ulp, el error relativo es 0.0005002502252 ≈ 0.1u, y sin embargo para x = 1.005 serı́a
f l(x) = 0.100 × 101 , con ulp(f l(x)) = 10−2 , un error de 0.5 ulp igualmente, pero el error relativo
correspondiente serı́a 0.004975124378 ≈ u, aproximadamente diez veces mayor que el anterior (este
es el fenómeno llamado wobbling precision, ‘precisión bamboleante’ u ‘oscilante’).
6.3. Aritmética ‘aproximada’

Prácticamente en todas las operaciones que realiza un ordenador los datos llegan inevitablemen-
te afectados de errores, o se generan errores de redondeo en el curso de los cálculos. Al efectuar las
operaciones más elementales, las aritméticas (sumas, restas, multiplicaciones, divisiones) los errores
de los resultados ¿son del mismo orden que los iniciales o, por el contrario, se produce un aumento
significativo en los mismos? ¿son las propias operaciones una nueva fuente de error, se realicen
como se realicen? Responder con precisión a esta pregunta es una tarea ciertamente complicada, y
es el objeto de estudios especı́ficos fuera de lugar en esta asignatura. Pero podemos hacernos una
idea de las dificultades y los problemas que se suscitan examinando qué sucede en nuestro modelo
de sistemas de números en punto flotante.
Para empezar, ¿cómo se propagan los errores en una suma?
Lema 6.3.1. Sean x, y, αx , αy , εa (x), εa (y), números reales tales que |αx | ≤ εa (x), |αy | ≤ εa (y),
y sean
x
e = x + αx
. Entonces Ea = |(x + y) − (e x + ye)| ≤ |αx | + |αy |,
ye = y + αy
pudiendo tomar Ea cualquier valor desde Ea = 0 hasta Ea = εa (x) + εa (y).
Análogamente, si x + y 6= 0, y para ρx , ρy , es

x
e = x(1 + ρx ) |(x + y) − (e
x + ye)| |x ρx + y ρy |
, entonces Er = = ,
ye = y(1 + ρy ) |x + y| |x + y|
y nada puede decirse en general: Er puede tomar cualquier valor en [0, +∞).
Demostración. Por la desigualdad triangular
Ea = |(x + y) − (e
x + ye)| = | − (αx + αy )| ≤ |αx | + |αy |.
Como cualquier valor r ∈ [0, εa (x) + εa (y)] puede ponerse en la forma r = s + t con 0 ≤ s ≤ εa (x),
0 ≤ t ≤ εa (y) (¿por qué?), Ea puede alcanzar el valor r.
En cuanto a Er , sustituyendo xe y ye por su expresión en términos de x e y aparece la igualdad
del enunciado. Que Er puede alcanzar cualquier valor no negativo es claro: tomemos, por ejemplo,
x > 0, h > 0 cualesquiera, y = −x + h, ρx ≥ 0 arbitrario, ρy = 0; ası́ x + y = h y
xρx
Er = ,
h
que puede tomar tanto el valor Er = 0 para ρx = 0 como cualquier valor positivo R (basta que sea
xρx
ρx > 0, h = ).
R
Vemos, pues, que aunque el error absoluto de los sumandos esté acotado por un cierto εa , el de la
suma puede llegar a ser 2εa , y al cabo de N sumas, N εa , y que el error relativo queda descontrolado.
Como generalmente lo que importa es el error relativo, afinaremos el resultado anterior.
Proposición 6.3.2. Sean x, y, ρx , ρy , εr (x), εr (y), números reales tales que x + y 6= 0 y |ρx | ≤
εr (x), |ρy | ≤ εr (y), y sean
x
e = x(1 + ρx )
.
ye = y(1 + ρy )
Si x e y tienen el mismo signo,
Er ≤ máx{|ρx |, |ρy |},
pudiendo tomar Er cualquier valor desde Er = 0 hasta Er = máx{εr (x), εr (y)}.

6.3. ARITMÉTICA ‘APROXIMADA’ 163
Demostración. Cuando x e y tienen el mismo signo, |x + y| = |x| + |y| (¿por qué?). Poniendo
máx{|ρx |, |ρy |} = ρ, aplicando la igualdad previa y la desigualdad triangular
|x ρx + y ρy | |x| |ρx | + |y| |ρy | |x| ρ + |y| ρ

Er = ≤ ≤ = ρ.
|x| + |y| |x| + |y| |x| + |y|
Para concluir, tomando x = y 6= 0, ρx = ρy = ρ con ρ ∈ [0, máx{εr (x), εr (y)}] arbitrario, se

obtiene Er = ρ.
En este caso, vemos que el error de la suma de datos erróneos no supera el error de los sumandos.
Por contra, con x e y de signos opuestos el desastre es total.
Proposición 6.3.3. Sean x, y, ρx , ρy , números reales tales que x + y 6= 0 y

x
e = x(1 + ρx )
.
ye = y(1 + ρy )
Si x e y tienen signos opuestos, y no hay circunstancias especiales en los valores de los datos,
Er puede tomar cualquier valor no negativo, por grande que este sea.
Demostración. Revisar la demostración del lema 6.3.1.
Esta es una causa de error insalvable, ‘intrı́nseca’ a la operación, que ningún ordenador ni
programa alguno pueden evitar.
Obsérvese la disparidad del comportamiento cuando los sumandos ‘se añaden o refuerzan’ (tie-
nen el mismo signo) o ‘se oponen’ (tienen signos opuestos). En el primer caso el error relativo de la
suma es, como mucho, el del ‘peor’ de los sumandos; en el segundo caso, el error relativo de la suma
se dispara cuando la suma es ‘casi cero’, aún con pequeñı́smos errores relativos en los sumandos
(suele llamarse a este fenómeno cancelación catastrófica).
Para empeorar un poco más las cosas, cuando manejamos un sistema F de números en punto
flotante, y es x e + ye ∈ F (el resultado exacto de la suma
e = f l(x), ye = f l(y), no siempre resulta x
de dos números de F no siempre está en F ), con lo cual necesitará ser redondeado, y lo mejor que
la máquina podrá ofrecer como suma de estos números, será f l(e x + ye) (la situación real puede ser
más complicada). En la construcción ‘más favorable’ de la ‘suma de máquina’, tendrı́amos, pues,
x ⊕ y = f l(f l(x) + f l(y)),
añadiendo otro error al que puede achacarse exclusivamente al redondeo de x e y (y suponiendo

que no haya desbordamiento).
Similarmente, la ‘mejor versión’ en este planteamiento de las restantes operaciones aritméti-
cas(**) , corresponderı́a a
x y = f l(f l(x) − f l(y))

x y = f l(f l(x) · f l(y))
x y = f l(f l(x)/ f l(y))
(Para que tengan sentido, se supone que todos los números que intervienen están en el rango de
F : es trivial dar ejemplos en los que x, y cumplen esta condición, mientras que x y da overflow
o underflow para = alguna de las operaciones anteriores.)
(**)
En la aritmética de punto flotante del estándar IEEE se estipula que, al menos para elementos de F , hh cada
operación debe ser efectuada como si produjese primero un resultado intermedio correcto en precisión infinita y con
rango no acotado, y luego se ajustase este resultado intermedio a la precisión destinada ii, de modo que finalmente
se obtenga la respuesta exacta correctamente redondeada.
Veamos algunos ejemplos de los errores que se originan al realizar estas operaciones. Con base
10 y precisión p = 5, tomamos
y = 5/7 f l(y) = 0.71428×100

u = 0.714251 f l(u) = 0.71425×100
v = 98765.9 f l(v) = 0.98765×105
w = 0.111111×10−4 f l(w) = 0.11111×10−4
Calculando, obtenemos:
Operación Resultado Error absoluto Error relativo

y u 0.30000 × 10 −4 0.472 × 10−5 0.136
(y u) w 0.27000 × 10 1 0.425 0.136
(y u) w 0.29629 × 10 1 0.466 0.136
u⊕v 0.98766 × 105 0.162 × 101 0.164 × 10−4
yw 0.64286 × 105 0.779 0.122×10−4
Se observa que el comportamiento es bastante desigual. Además, con estas nuevas operaciones
se pierden algunas de las buenı́simas propiedades algebraicas y estructurales de R. Comprobémoslo.
Siguiendo con base 10 y precisión p = 5, prescindiendo del 0 previo al punto por comodidad de
escritura, tomamos
x = 1000000 f l(x) = .10000 × 107
y = −1000000 f l(y) = −.10000 × 107
z=1 f l(z) = .10000 × 101
Calculando, resulta:
x+y x⊕y y+z y⊕z x+y+z (x ⊕ y) ⊕ z x ⊕ (y ⊕ z)

0 0
.00000 × 10 −999999 −.10000 × 10 7 1 .10000 × 10 (= 1) .00000 × 100 (= 0)
1
¡No hay asociatividad para la ‘suma flotante’ ⊕! Ni funciona tampoco la propiedad cancelativa: en
este mismo ejemplo,
y ⊕ z = y ⊕ 0 6=⇒ z = 0.
También podemos observar que para x = 3 × 107 , por ejemplo,
f l(1/x) = .33333 × 10−7 , x (1/x) = f l((.30000 × 108 )(.33333 × 10−7 )) = .99999,
mientras que si y = .33334 × 10−7 , z = .33335 × 10−7 ,
x y = y x = x z = z x = .10000 × 101 = 1.
Esto implica que tampoco el producto es asociativo: para estos valores,
z (x y) = z 1 = z 6= y = 1 y = (z x) y.
Además, x tiene dos inversos, y y z, ninguno de los cuales coincide, por cierto, con f l(1/x).
Comparando, en general, con las propiedades fundamentales de R, encontramos:

PROPIEDADES VALIDEZ
de cuerpo
Suma cerrada NO Puede haber underflow/overflow
Suma asociativa NO a veces (a ⊕ b) ⊕ c 6= a ⊕ (b ⊕ c)
Suma conmutativa SI siempre a ⊕ b = b ⊕ a
Elemento neutro SI siempre 0 ∈ F y a ⊕ 0 = 0 ⊕ a = a para todo a
Elemento opuesto SI siempre −a ∈ F y a ⊕ (−a) = (−a) ⊕ a = 0
Producto cerrado NO Puede haber underflow/overflow

Producto asociativo NO a veces (a b) c 6= a (b c)
Producto conmutativo SI siempre a b = b a
Elemento unidad SI siempre 1 ∈ F y 1 a = a 1 = a para todo a
Elemento inverso ?? ???
Distributiva NO a veces a (b ⊕ c) 6= (a b) ⊕ (a c)
de cuerpo ordenado
Reflexiva SI siempre a ≤ a
Simétrica SI siempre a ≤ b y b ≤ a implica a = b (a, b ∈ F )
Transitiva SI siempre a ≤ b, b ≤ c implica a ≤ c
Invariancia por traslación SI siempre a ≤ b implica a ⊕ c ≤ b ⊕ c
Invariancia por escalado SI siempre a ≤ b, 0 ≤ c implica a c ≤ b c
Completitud SI trivial: F es finito
Arquimediana SI trivial: F es acotado
Densidad NO F es finito
topológicas
Conexión NO todos los puntos son aislados
Revisemos ahora el funcionamiento de estas operaciones y el error cometido al tomarlas como
aproximaciones de las operaciones exactas.
Errores en sumas y restas

Estudiaremos solamente x ⊕ y y x y cuando x y y son elementos positivos del rango de F ,
porque todos los demás casos puede reducirse a éste teniendo en cuenta que f l(−x) = − f l(x),
x y = x ⊕ (−y), etc.
Proposición 6.3.4. Dados x, y ≥ f minN , tales que x ⊕ y ∈ F , si
f l(x) = x(1 + ρx ) (|ρx | < u),
f l(y) = y(1 + ρy ) (|ρy | < u),
se tiene
|(x + y) − (x ⊕ y)|
Er = < 2u + u2 ,
|x + y|
y ası́
x ⊕ y = (x + y)(1 + ρ), |ρ| < 2u + u2 ≈ M .
Demostración. Si z = f l(x) + f l(y) = x + y + xρx + yρy , x ⊕ y = f l(z) = z(1 + ρz ) = z + zρz
(|ρz | < u), será
x ⊕ y − (x + y) = x ⊕ y − z + z − (x + y) = zρz + xρx + yρy
= (x + y + xρx + yρy )ρz + xρx + yρy = (x + y)ρz + (xρx + yρy )(ρz + 1),
de donde

|(x ⊕ y) − (x + y)| xρx + yρy
Er = = ρz + (1 + ρz ) ≤ |ρz | + máx{|ρx |, |ρy |}(1 + |ρz |)
|x + y| x+y
< u + u(1 + u) = 2u + u2 ≈ 2u = M (u2 ≈ 0).
Esta es una estimación ‘pesimista’ del error, que puede mejorarse en circunstancias especiales.
Ası́, cuando x, y ∈ FN ( ⇐⇒ ρx = ρy = 0), Er = |ρz | < u; o si ρz = 0 (i.e., si f l(x) + f l(y) ∈ FN ),
Er ≤ máx{|ρx |, |ρy |} < u. Sin embargo, en otras circunstancias, el error puede superar a u.
Ejemplos.
1.- Para β = 10, p = 5, x = y = 1.00005, Er = .4999750012 × 10−4 ≈ u.
2.- Para β = 2, p = 3 (cf. ‘minimodelo’), x ligeramente mayor que 1.125 (con lo cual f l(x) = 1.25),
y ligeramente mayor que 4.5 (con lo cual f l(y) = 5), x + y ‘ligeramente mayor’ que 5.625, x ⊕ y = 7,
queda Er ≈ 0.244 ≈ 2u = M = 0.25
En la sustracción habrá que imponer restricciones adicionales, si hemos de evitar cancelaciones

catastróficas. Si x, y ∈ F , obviamente sólo hay error de redondeo y el error relativo de x y
estará acotado por u. Pero, en general, el resultado puede presentar un error relativo desmesurada-
mente grande: si a = f max = β emax (1 − β −p ), d = β emax −p es la distancia de a al anterior elemento
a+b
de F , b = a − d es tal elemento, c = el punto medio del segmento[b, a],
2
b —————————————— a
y c x
h h
tomando cualquier h > 0 menor que d/2, para x = c + , y = c − , serı́a (ver figura)
2 2
x − y = h, f l(x) = a, f l(y) = b, x y = f l(d) = d,
y por tanto
|(x − y) − (x y)| |h − d| d
Er = = = − 1,
|x − y| |h| h
que tiende a +∞ cuando h tiende a 0+ (el argumento puede trasladarse a otros intervalos de F ).
Vemos ası́ que la cancelación catastrófica es insalvable cuando se manejan datos aproximados,
por ejemplo datos que sean resultados redondeados (aproximados) de una operación anterior.
Nótese que incluso si x e y (distintos) son ‘suficientemente próximos’ y están ‘adecuadamente
situados’ para que f l(x) = f l(y), con lo cual x y = 0, el error relativo alcanza un desastroso
100 %: Er = 1 en este caso.
En general, cuando (x + y)/(|x − y|) no es ‘demasiado grande’, hay cancelación benigna, que
no aumenta exageradamente el error previo, puesto que, conservando la notación anterior y proce-
diendo de la forma acostumbrada,

x y xρx − yρy x+y
Er = − 1 = ρz +
(1 + ρz ) ≤ |ρz | + máx{|ρx |, |ρy |} (1 + |ρz |)
x−y x−y |x − y|
x+y x+y
< u+ u(1 + u) = u + (u + u2 ).
|x − y| |x − y|
Errores en productos y cocientes

La notación en punto flotante está mejor adaptada al producto que a la suma, en cierto sentido,
y jugando con los exponentes es más fácil evitar el desbordamiento. Pero hemos de pensar que
incluso partiendo de números de F su producto exacto tiene ‘demasiadas cifras’, y casi siempre
será necesario el redondeo. Analicemos el tamaño del error relativo que introduce la operación .
Proposición 6.3.5. Dados números reales no nulos x e y, tales que x y ∈ F , si
f l(x) = x(1 + ρx ) (|ρx | < u),

f l(y) = y(1 + ρy ) (|ρy | < u),
se tiene
|(x y) − (x y)|
Er = < 3u + 3u2 + u3 ,
|x y|
o sea
x y = (x y)(1 + ρ), |ρ| < 3u + 3u2 + u3 ≈ 3u.
Demostración. Poniendo z = f l(x) f l(y) = xy(1 + ρx )(1 + ρy ), x y = f l(z) = z(1 + ρz ) (|ρz | < u),
queda x y = xy(1 + ρx )(1 + ρy )(1 + ρz ), y ası́
|(x y) − (x y)|
Er = = |(1 + ρx )(1 + ρy )(1 + ρz ) − 1|
|x y|
= |ρx + ρy + ρz + ρx ρy + ρx ρz + ρy ρz + ρx ρy ρz |
< 3u + 3u2 + u3 ≈ 3u,
suponiendo 3u2 + u3 ≈ 0.
Análogamente, para la operación :
Proposición 6.3.6. Dados números reales x e y, tales que x y ∈ F , si
f l(x) = x(1 + ρx ) (|ρx | < u),

f l(y) = y(1 + ρy ) (|ρy | < u),
se tiene
|(x/y) − (x y)| 3u + u2
Er = < ,
|x/y| 1−u
o sea
3u + u2
x y = (x/y)(1 + ρ), |ρ| < ≈ 3u.
1−u
1 + ρx
Demostración. Poniendo z = f l(x)/ f l(y) = (x/y) , x y = f l(z) = z(1 + ρz ) (|ρz | < u),
1 + ρy
(1 + ρx )(1 + ρz )
queda x y = (x/y) , y ası́, usando que |1 + ρy | ≥ 1 − |ρy | > 1 − u > 0,
1 + ρy

|(x y) − (x/y)| (1 + ρx )(1 + ρz )
Er = = − 1
|x/y| 1 + ρy

(1 + ρx )(1 + ρz ) − (1 + ρy ) ρx + ρz − ρy + ρx ρz
= =
1 + ρy 1 + ρy
3u + u2
< ≈ 3u
1−u
suponiendo 4u2 /(1 − u) ≈ 0.

6.4. Estrategias de cálculo para reducir los errores de redondeo

La computación en punto flotante es inexacta por naturaleza, y no es difı́cil
utilizarla mal de modo que las respuestas computadas consistan casi enteramente
en ‘ruido’.
Uno de los principales problemas del análisis numérico es determinar cómo
serán de exactos los resultados de ciertos métodos numéricos; aquı́ está involu-
crado un problema de ‘salto de credibilidad’: no sabemos cuántas respuestas del
ordenador creer.
Los usuarios novatos del ordenador resuelven este problema confiando implı́ci-
tamente en el ordenador como autoridad infalible; tienden a creer que todos los
dı́gitos de una respuesta impresa son significativos.
Los usuarios desilusionados del ordenador mantienen justamente la actitud
opuesta, constantemente temen que sus respuestas carezcan casi de sentido.
(D. E. Knuth)
El análisis elemental de las operaciones que acabamos de efectuar muestra que es necesario un
estudio previo a cualquier proceso de cálculo con ordenador, para evitar una acumulación exage-
rada de errores, especialmente cuando haya que realizar operaciones consecutivas (a veces en gran
número) con el ordenador. Hay tarea para personas con ingenio hasta en los casos más simples,
como señala J. M. Muller en su artı́culo Ordenadores en busca de aritmética [MC1, pp. 92–99], al-
tamente recomendable: hh . . . Si el lector deduce que no hay que depositar jamás una confianza ciega
en los resultados facilitados por un ordenador y que la implantación rápida de una operación tan
elemental como la suma compete todavı́a al campo de la investigación, me daré por absolutamente
satisfecho. ii
Los ejemplos siguientes ilustran algunas de las dificultades y muestran caminos para paliar sus
consecuencias.
6.4.1. Reformulación del problema: Ejemplos

Cálculo de una diferencia de cuadrados
Consideremos la evaluación de x2 − y 2 cuando x = 1.21, y = 1.20 en un sistema con β = 10 y

p = 3. Resulta
x y x2 y2 x2 − y 2 Error relativo
Valor exacto 1.21 1.20 1.4641 1.4400 0.0241
Redondeo 0.121 × 10 0.120 × 10 0.146 0.144 0.200 × 10−1 0, 170 . . . ≈ 34u
1 −2
ya que en este caso u = 10 = 0.005.
2
Pero x2 − y 2 = (x − y)(x + y). ¿Qué sucede si rehacemos el cálculo usando la segunda expresión?
x y x−y x+y (x − y)(x + y) Error relativo

Valor exacto 1.21 1.20 0.01 2.41 0.0241
Redondeo 0.121 × 10 0.120 × 10 0.1 × 10−1 0.241 × 10 0.241 × 10−1 0
¡El resultado es exacto! Todas las cantidades x, y, x + y, x − y, (x + y)(x − y) son ‘números de

máquina’ y no hemos introducido ningún error, mientras que al calcular x x ha sido necesario el
redondeo y x x − y y ha originado una cancelación con los dos últimos dı́gitos falsos. Si bien
el ejemplo es un poco ‘tramposo’, incluso cuando x e y deban redondearse la segunda expresión es
preferible para el cálculo, puesto que si f l(x) y f l(y) tienen varias cifras iniciales coincidentes, sus
cuadrados tendrán iguales doble número de dı́gitos, y la cancelación es ‘aún más catastrófica’.
6.4. ESTRATEGIAS DE CÁLCULO 169
Raı́ces de una ecuación de segundo grado

Para resolver una ecuación de segundo grado con raı́ces reales
ax2 + bx + c = 0,
a, b, c ∈ R, a 6= 0, b2 − 4ac ≥ 0, disponemos de las conocidı́simas fórmulas

√ √
−b + b2 − 4ac −b − b2 − 4ac
x1 = , x2 = .
2a 2a
¿Qué problemas podrá haber en el cálculo efectivo con unas fórmulas tan familiares? Comenzando
por el discriminante b2 − 4ac, vemos la amenaza de una ‘cancelación catastrófica’√cuando b√
2 y 4ac
tengan valores parecidos. ¿La salvaremos como antes, reescribiendo b2 −4ac = (b− 4ac)(b+ 4ac)?
Los resultados no son muy halagüeños. Incluso ignorando el problema del cálculo de una raı́z
cuadrada aproximada, los resultados en ambos casos pueden ser muy mediocres. Siguiendo con
β = 10, p = 3 como antes, veamos qué sucede en el siguiente ejemplo:
a b c b2 4ac b2 − 4ac Error relativo

V.E. 1.22 3.34 2.28 11.1556 11.1264 0.0292
P.F. 0.122 × 10 0.334 × 10 0.228 × 10 0.112 × 102 0.111 × 102 0.100 485u
(en la primera fila están los valores exactos, en la segunda los resultados en punto flotante). Análo-
gamente
√
4ac S ≈ 4ac b−S b+S (b − S)(b + S)
V.E. 11.1264 3.335625878 0.004374122 6.675625878 0.02920000202
P.F. 0.111 × 102 0.333 × 10 0.1 × 10−1 0.667 × 10 0.667 × 10−1
¡No coincide ni la primera cifra significativa! (aunque al menos ha disminuido el error a 257u,
aproximadamente).
Queda√otra cancelación catastrófica al acecho. ¿Qué sucede si b2 es mucho mayor que 4ac?
Entonces b2 − 4ac ≈ |b|, con lo cual, si b > 0, podemos tener dificultades con la fórmula para x1 ,
y si b < 0, con la fórmula para x2 .
Afortunadamente, este √ problema es más sencillo de solventar. Supongamos, por ejemplo, que
b > 0. Entonces D = b + b2 − 4ac es una suma de cantidades positivas, con lo que el error no
superará al error de los datos en mucho más de 2u, y pasaremos a calcular x2 = −D/2a. Para el
cálculo de x1 disponemos de otras fórmulas más adecuadas:
c −2c
x1 = = √ .
ax2 b + b2 − 4ac
Cuando b < 0, basta usar la fórmula tradicional para x1 y hallar x2 a partir de
c 2c
x2 = = √ .
ax1 −b + b2 − 4ac
Sumas en cadena
Los errores en una sola operación (no ‘catastrófica’) en punto flotante se amplifican según se
van encadenando más y más operaciones, si bien el aumento es en general tan pequeño que hace
falta un número muy grande de operaciones inexactas para llegar a errores visibles. No obstante,
puesto que no hay asociatividad, incluso en sumas de varios sumandos positivos no es indiferente
la manera de llevar a cabo las operaciones: el orden y la manera de agrupar puede inicidir en que
el error final sea más grande o más pequeño.
Veamos una ilustración clara (muy simplificada). Con precisión p = 3 y base 10, y sumandos
100, 0.9, 0.9, 0.9, podemos proceder ası́:
(((100 ⊕ 0.9) ⊕ 0.9) ⊕ 0.9 = (100 ⊕ 0.9) ⊕ 0.9 = 100 ⊕ 0.9 = 100
(100 ⊕ 0.9) ⊕ (0.9 ⊕ 0.9) = 100 ⊕ 1.8 = 102
((0.9 ⊕ 0.9) ⊕ 0.9) ⊕ 100 = (1.8 ⊕ 0.9) ⊕ 100 = 2.7 ⊕ 100 = 103
valor exacto: 100 + 0.9 + 0.9 + 0.9 = 100.9 + 0.9 + 0.9 = 101.8 + 0.9 = 102.7
En las evaluaciones primera y tercera hemos procedido recurrentemente: en cada etapa sumamos
la suma parcial previa con el sumando siguiente. En la segunda hemos emparejado los sumandos,
reduciendo el número de operaciones.
Observamos que el primer procedimiento da mayor error, el segundo es ‘menos costoso’, y que
el tercero da el valor redondeado del resultado exacto, el mejor valor posible.
La causa del éxito final es aquı́ muy aparente: al sumar números de tamaño muy distinto, hay
que tener precaución de que ‘el pez grande no se coma al chico’, como sucede en la evaluación
100 ⊕ 0.9 = 100. Parece conveniente ordenar los sumandos de menor a mayor para homogeneizar
tamaños en la medida de lo posible, permitiendo ası́ que la adición de los sumandos pequeños
lleve a un valor que no desaparezca cuando lleguen los sumandos ‘grandes’. (Esta es una pequeña
muestra de las dificultades que tienen que superar los programadores incluso en situaciones que no
parecen a priori tan complicadas). Además, los dos primeros sumandos está involucrados en n − 1
operaciones y el último en una sóla, con lo que el error absoluto final es menor.
Por otra parte, cuando la rapidez de cálculo es importante, la opción del emparejamiento parece
ventajosa. Además, al disminuir el número de operaciones efecuadas, cabe suponer que disminuirá el
crecimiento de los errores (con datos de magnitudes similares, al menos). Nótese que en una suma
de n = 2k sumandos, cada sumando estarı́a ahora involucrado en k = log2 (n) operaciones, lo que
lleva a un error absoluto del orden de n log2 (n) veces el máximo de los errores de los sumandos,
ver [1] p. 15.
Sobre las dificultades de la implementación de algoritmos eficaces en la adición de muchos
sumandos, ver más detalles en [3], Floating point summation, y [4], ası́ cómo en el artı́culo de J. P.
Muller ya citado [MC1]. En [Brz], pp. 10–11, hay un ejemplo de ‘corrección de la aritmética’ para
efectuar sumas.
Costo operativo y eficiencia: Evaluación de polinomios

hh Un mismo problema suele poder resolverse por diversos métodos numéricos. ¿Cómo decidirse
por uno? El tamaño de los errores es ciertamente un criterio útil: podrı́amos elegir el método
que diese menores errores. No obstante hay un criterio mejor: nos quedaremos con el método
que, dando errores dentro de unos lı́mites predeterminados, necesite el menor trabajo. Esta
preocupación por estudiar la eficiencia de los diversos métodos es un rasgo distintivo del
análisis numérico. La eficiencia depende tanto del tamaño de los errores como del costo ope-
rativo del método. Aquellas tareas para las que, en un momento histórico dado, no se dispone
de un método aceptablemente eficiente no se pueden llevar a cabo.
Ejemplo. Método de Horner (1744–1834) para evaluar polinomios. Supongamos que desea-
mos hallar el valor de un polinomio cuártico a0 + a1 x + a2 x2 + a3 x3 + a4 x4 (los ai son números
reales conocidos) para un valor dado de x0 de la variable x. El método más ingenuo halla
sucesivamente los productos x20 = x0 ∗ x0 , x30 = x20 ∗ x0 , x40 = x30 ∗ x0 con un coste operativo de
tres multiplicaciones, luego los productos ai ∗ xi0 (otras cuatro multiplicaciones), y finalmente
hace las cuatro sumas/restas. (Que sean efectivamente sumas o restas depende del signo con-
creto que vayan teniendo los sumandos; para sumar 48 y -27 hay que restar.) En total cuatro
sumas/restas y siete multiplicaciones. Sin embargo haciendo las operaciones en orden
h i
a0 + x0 ∗ a1 + x0 ∗ a2 + x0 ∗ [a3 + x0 ∗ a4 ] (1.6)
sólo son precisas cuatro sumas/restas y cuatro multiplicaciones. Para un polinomio de grado
N el método ingenuo requiere N sumas/restas y 2N − 1 multiplicaciones, el método (1.6)
llamado de Horner o de multiplicación encajada usa N sumas/restas y N multiplicaciones.
Como ninguno de los dos métodos genera errores —excepto los derivados de usar mantisa de
longitud finita— el de Horner, que tiene menor costo operativo es más eficiente. Si sólo se va
a evaluar una vez un polinomio y se usa un ordenador no hay diferencia entre usar uno u otro
método. Si, como a veces ocurre, dentro de un programa grande hay que evaluar millones de
veces, usar uno u otro método puede significar tener que esperar el resultado dos horas o sólo
una. Si calculamos con papel y lápiz en un examen usar un mal método puede implicar no
tener el resultado a tiempo. ii
([S-S], pp. 13 y 14.)
6.4.2. Refinamientos en la representación y en la precisión

Dos recursos que permiten mejorar la exactitud de los cálculos son el uso de números desnorma-
lizados y de precisión múltiple.
Números desnormalizados
Para paliar los problemas que ocasiona el redondeo de números ‘cercanos al cero’, se amplı́a
a veces el sistema F de números en punto flotante incluyendo los números desnormalizados
(también llamados subnormales en inglés). Tanto los estándares IEEE 754 y 854 como LIA-1 y unas
cuantas implementaciones ‘no-IEEE’ incluyen números desnormalizados. Siguiendo con la notación
habitual, un número en punto flotante desnormalizado es un número real de la forma
y = ±m × β emin −p
donde m es un entero del intervalo [1, β p−1 − 1]. La fracción correspondiente g queda en el intervalo
[β −p , 1/β −β −p ]; su dı́gito más significativo es 0, y su exponente emin . Los números desnormalizados
rellenan parcialmente los “huecos de subdesbordamiento” que se producen entre ±β emin −1 y 0.
Tomados juntos, componen el conjunto que en LIA-1 se denota FD . La admisión o no de números
desnormalizados se controla mediante el parámetro booleano denorm, que toma el valor true o false
según se permitan números desnormalizados o no. En el primer caso, se redefine F = {0}∪FN ∪FD ;
en el segundo, se mantiene la definición previa.
El mı́nimo número positivo en punto flotante desnormalizado es β emin −p = f minN · εM . Los
valores de FD están igualmente espaciados, con el mismo espacio que el de los números de F entre
β emin −1 y β emin , que es β emin −p = f minN · εM . Volviendo al ejemplo con β = 2, p = 3, emin = −1,
emax = 3, la representación gráfica de F con los números desnormalizados incluidos (2−4 = 0.0625,
2 × 2−4 = 0.125, 3 × 2−4 = 0.1875) serı́a
0.0625
↓
0 0.25 0.5 1.0 2.0 3.0 4.0 5.0 6.0 7.0
Los valores de FD tienen un máximo absoluto de error de representación de β emin −p . Sin embargo,
como los números desnormalizados tienen menos de p dı́gitos de precisión, el error relativo de
representación puede variar ampliamente. Este error relativo va desde M = β 1−p en el extremo
superior de FD hasta 1 en el extremo inferior de FD . Cerca de 0, el error relativo crece sin tope.
Siempre que una adición o sustracción de números de F produce un resultado en FD , dicho
resultado es exacto, el error relativo es cero. Un ejemplo trivial: en el modelo anterior,
1 0.875 = 0.125 con números desnormalizados incluidos, 1 0.875 = 0 en caso contrario.
hh Incluso para una “sustracción efectiva” no se pierde exactitud, porque la disminución del
número de dı́gitos significativos es exactamente la misma que el número de dı́gitos cancelados

en la sustracción. Para la multiplicación, división, escalado, y algunas conversiones, los dı́gitos
significativos (y por tanto la exactitud) pueden perderse si el resultado está en FD . ii ([LIA-1],
p. 33.)
La ventaja fundamental que proporcionan los números desnormalizados es la siguiente:
Incluyendo en F los números desnormalizados, si x, y ∈ F , para que x y = 0 es

necesario y suficiente que x = y.
Obviamente, esto no es cierto cuando F no contiene a FD .
Mayor precisión
Mientras que habitualmente es posible disponer de dı́gitos extra en una computación (aumen-
tando la precisión p, pasando por ejemplo de precisión simple a doble precisión), esto siempre es
costoso en tiempo y en espacio. Además, aunque intuitivamente al aumentar la precisión parece
lógico esperar que la exactitud aumente, esto no siempre es ası́. En muchos casos el error estimado
de un algoritmo es efectivamente proporcional a la precisión, como hemos visto en casi todas las
operaciones aritméticas; pero como las cotas del error no siempre se alcanzan, no hay garantı́a de
que un resultado concreto calculado con precisión p sea menos exacto que el calculado con preci-
sión p + q mayor (v. [Hig], pp. 19–20). No obstante, es una técnica frecuente en la estimación de la
exactitud recalcular (al menos en la ‘etapa de ensayo’ de un algoritmo) aumentando la precisión y
observar cuántos dı́gitos de la respuesta ası́ obtenida coinciden con la original.
Dı́gitos de seguridad (Guard digits)

Cuando se entra en los pormenores de la implementación efectiva de las operaciones en punto
flotante, las complicaciones aumentan tremendamente. Por ejemplo, contra lo que cabrı́a suponer,
la suma es mucho más complicada que la multiplicación y la división. Para empezar, no se conoce a
priori el exponente del resultado, y hay que proceder a redondeos y reescalados para determinarlos;
básicamente, el ordenador procede como nosotros, reescalando las mantisas para poder ‘alinearlas’y
sumarlas a continuación; el resultado puede tener una mantisa que comience por 0 (perdiendo
la normalización) y/o más de p cifras. Se ve la necesidad de añadir cifras extras en las etapas
intermedias para disminuir errores. Ası́ se describe el proceso en [Brz], pp. 33 y ss.:
hh Cada operación aritmética efectuada con el ordenador está igualmente manchada por un error
de afectación. Es decir, que se tiene:
|(a b) − f l(a b)| ≤ 5|(a b)|10−p ,
donde designa una de las cuatro operaciones aritméticas (suma, resta, multiplicación, divi-
sión). Este resultado da la diferencia máxima que puede existir entre el resultado exacto de
una operación aritmética y el resultado encontrado por el ordenador. Ası́, para un ordenador
que trabaje con mantisas de ocho dı́gitos, el error relativo es inferior a 5 · 10−8 . Se puede
pensar que este es un error muy débil, despreciable incluso, y sin embargo vamos a ver que
sus consecuencias puede ser catastróficas (no siempre, afortunadamente para nosotros). Para
comprender bien lo que pasa, hay que saber que las operaciones aritméticas se efectúan en
memorias especiales, el acumulador , cuyas mantisas comportan al menos p + 1 dı́gitos.
Se completan los operandos con ceros a la derecha, se efectúa la operación en el acumula-
dor, y después se reenvı́a el resultado a la memoria redondeándolo. Este error de redondeo
es preponderante sobre el que se hace en el acumulador, lo que explica que cada operación
esté manchada solamente con un error de afectación. Demos un ejemplo para ilustrar nuestro
propósito: calculemos a = b × c
memoria acumulador
b 0.842345 → 0.8423450
c 0.516287 · 10−2 → 0.5162870 · 10−2
a 0.434892 · 10−2 ← 0.4348917 · 10−2
Para una suma, tras la transferencia de los operandos al acumulador, el ordenador comienza
por modificar el exponente del operando menor (en valor absoluto) para que tenga el mismo
valor que el de el más grande; de hecho, el ordenador alinea como nosotros las cifras de las
potencias idénticas de 10, unas sobre otras:
memoria acumulador
b 0.842345 → 0.8423450
c 0.516287 · 10−2 → 0.0051629
a 0.847508 ← 0.8475079
Y lo mismo, evidentemente, para una sustracción. ii
Extrañamente, hay fabricantes (como cray) que construyen algunas de sus máquinas sin au-
mentar los bits disponibles para los datos intermedios, limitándose a recortar éstos al tamaño
correspondiente a la precisión, lo que puede suponer un error relativo añadido hasta de β − 1, es
decir, del 100 % cuando β = 2 y del 900 % cuando β = 10. En efecto:
[Gold] Con sumandos en F :
Proposición 6.4.1. Usando un formato de punto flotante con parámetros β y p, y computando
diferencias usando p dı́gitos, el error relativo del resultado puede llegar a ser β − 1.
1 α α
Demostración. Para x = = 0.10 · · · 0 × 100 , α = β − 1, y = 2 + · · · + p+1 = 0.αα · · · α × 10−1
β β β
resulta x − y = β −p−1 , x y = β −p , Er = β − 1.
En cambio:
Proposición 6.4.2. Si x e y son números en punto flotante en un formato con parámetros β y
p, y si la sustracción se hace con p + 1 dı́gitos (i.e., con un dı́gito ‘de seguridad’) entonces el error
relativo de redondeo del resultado es menor que 2, donde es el épsilon de la máquina.
(La adición está incluida en el teorema anterior ya que x e y pueden ser positivos o negativos.)
Para máquinas que trabajan sin dı́gitos extras hay muchos algoritmos que dejan de funcionar
correctamente, como lo hacen en caso contrario. Existen además resultados como el siguiente,
válidos cuando se opera con digitos ‘de seguridad’ (v. [Hig], p. 50):
Teorema 6.4.3 (Sterbenz). Sean x e y números en punto flotante con y/2 ≤ x ≤ 2y. Si la
sustracción se realiza con un dı́gito de seguridad, entonces x − y es computado exactamente (supo-
niendo que |x − y| ≥ f minN .)
6.4.3. Buscar algoritmos estables

hh Se puede oir a veces el siguiente argumento ingenuo:
¿Por qúe perder el tiempo con todos esos pequeños errores de punto flotante? Incluso
IEEE en precisión simple nos da 7 dı́gitos significativos por lo menos, y seguro que
esto es suficiente para la mayorı́a de las aplicaciones, y además está la precisión
doble, y seguramente esta tiene que bastar.
Un contraargumento es que los errores pueden propagarse y crecer rápidamente, y como

son inevitables “pequeños” errores de redondeo, existe siempre el peligro de que nuestras
computaciones produzcan basura.
Los problemas que tienen una tendencia inherente a la “amplificación de errores” se llaman
mal condicionados; requieren usar paquetes de aritmética multiprecisión y un estrecho control
de errores.
Un ejemplo clásico de problema mal condicionado es cierto polinomio de grado 20; tras multi-
plicar uno de sus coeficientes (el que multiplica a la potencia 19) por un factor 1.0000000005,
la localización de la mayor parte de las raı́ces cambia completamente.
En el anterior ejemplo, simplemente entrar los datos (los coeficientes del polinomio) en el
ordenador puede ser suficiente para estropear todo el cálculo, por cuanto la conversión de
la representación decimal externa a la interna, binaria, puede introducir errores demasiado
grandes.
Un problema bien condicionado puede tener un algoritmo que amplifique los errores: tal
algoritmo se dice que es inestable. En términos sencillos, un algoritmo inestable transforma
un “pequeño” cambio en las cantidades de entrada en un cambio “grande” en las cantidades
de salida. ii
([4], § 4-7.)
La estabilidad de un algoritmo es una de sus propiedades más importantes, pero no es sencilla

de definir con precisión. En [1], p. 13, se describe ası́:
hh Supongamos que g(x) es la solución exacta de un problema con inputs x, y g ∗ (x) es el valor
calculado por un algoritmo particular. La solución calculada g ∗ (x) puede ser pensada a menudo
como la solución exacta de un problema perturbado con inputs x e, esto es, g ∗ (x) = g(e
x). Si siempre
hay un x ∗
e cercano a x tal que g (x) = g(e x), entonces el algoritmo se dice estable . Si no, el algoritmo
es inestable . ii
Nótese que la estabilidad es una propiedad relativa al algoritmo empleado para resolver un pro-
blema, mientras que el condicionamiento se refiere al propio problema: un problema de computación
se dice mal condicionado si pequeñas perturbaciones en el problema producen perturbaciones
grandes en la solución exacta. Además del ejemplo anteriormente señalado sobre cálculo de raı́ces
de un polinomio, otro problema tı́pico mal condicionado es el de la resolución de un sistema lineal
cuando la matriz de los coeficientes es casi singular: pequeños cambios en dichos coeficientes o en los
términos independientes pueden llevar a soluciones exactas muy diferentes; como al almacenar los
datos en la máquina se producen errores de redondeo, es sustancialmente imposible dar soluciones
precisas a los problemas mal condicionados con cualquier algoritmo que se utilice. Por contra, a
veces un algoritmo inestable puede modificarse convenientemente para lograr uno estable.
Estos son los consejos a los programadores de un experto ([Hig], pp. 30 y 31):
hh Diseño de algoritmos estables

No hay una receta simple para diseñar algoritmos numéricamente estables. Mientras que esto
ayuda a mantener a los analistas numéricos en el negocio (¡incluso probando que los algoritmos de
los demás son inestables!) no es una buena noticia para los cientı́ficos computacionales en general.
El mejor consejo es ser consciente de la necesidad de la estabillidad numérica cuando se diseña un
algoritmo y no concentrarse exclusivamente en otros aspectos, tales como el costo computacional
y la paralelizabilidad.
Se pueden dar unas pocas pautas.
1. Intentar evitar restar cantidades contaminadas de error (aunque tales restas pueden ser ine-
vitables).
2. Minimizar el tamaño de las cantidades intermedias en relación a la solución final. La razón

es que si las cantidades intermedias son muy grandes, entonces la respuesta final puede ser
el resultado de cancelación sustractiva dañina. Mirándolo de otra manera, los números in-
termedios grandes arrollan los datos iniciales, con el resultado de pérdida de información.
El ejemplo clásico de algoritmo en el que esta consideración es importante es la eliminación
gaussiana, pero un ejemplo aún más simple es la sumación recursiva.
3. Buscar diferentes formulaciones de una computación que sean matemáticamente pero no

numéricamente equivalentes. Por ejemplo, el método clásico de Gram-Schmidt es inestable,
pero una modificación trivial produce el método de Gram-Schmidt estable modificado (MGS).
Hay dos maneras de usar el método MGS para resolver un problema de mı́nimos cuadrados,
el más obvio de los cuales es inestable.
4. Es ventajoso expresar la actualización de fórmulas como
valor nuevo = valor viejo + pequeña corrección
si la pequeña corrección puede calcularse con muchas cifras significativas correctas. Los méto-
dos numéricos a menudo están expresados de manera natural en esta forma; los ejemplos
incluyen métodos para resolver ecuaciones diferenciales ordinarias, donde la corrección es
proporcional al tamaño de paso, y el método de Newton para resolver un sistema no lineal.
Un ejemplo clásico del uso de esta estrategia de actualización es el refinamiento iterativo
para mejorar la solución calculada de un sistema lineal Ax = b, en el que calculando resi-
duos r = b − Ay en precisión extendida y resolviendo ecuaciones actualizadas que tienen los
residuos como términos independientes es posible calcular una solución con un alto grado de
exactitud. Para otro ejemplo (en el que la corrección no es necesariamente pequeña), ver el
Problema . . .
5. Usar sólo transformaciones bien condicionadas del problema. En cálculos matriciales, esto
viene a ser multiplicar por matrices ortogonales donde sea posible, en vez de no ortogonales,
y posiblemente, matrices mal condicionadas. Ver §6.2 para una explicación simple de este
consejo en términos de normas.
6. Tomar precauciones para evitar desbordamientos innecesarios.
Concerniente al segundo punto, una buena recomendación es mirar los números generados
durante una computación. Esto era práctica común en los primeros tiempos del cálculo electrónico.
¡En algunas máquinas era inevitable, porque los contenidos almacenados se mostraban como luces o
monitores! Wilkinson ganó en penetración sobre la estabilidad numérica inspeccionando el progreso
de un algoritmo, y alterando a veces su curso (para un proceso iterativo con parámetros) . . . ii
hh Concepciones equivocadas
Algunos mitos y concepciones equivocadas comunes han sido señalados en este capı́tulo (ninguno
de ellos por vez primera—ver notas y referencias). Los destacamos en la siguiente lista.
1. La cancelación en la sustracción de dos números casi iguales es siempre una mala cosa.
2. Los errores de redondeo pueden cargarse una computación sólo si se acumulan un vasto
número de ellos.
3. Una computación corta libre de cancelación y desbordamiento tiene que ser exacta.
4. Aumentar la precisión con la que se efectúa una computación aumenta la exactitud de la

respuesta.
5. La respuesta final calculada a partir de un algoritmo no puede ser más exacta que ninguna
de las cantidades intermedias, esto es, los errores no pueden cancelarse.
6. Los errores de redondeo sólo pueden estorbar, no ayudar, al éxito de un cálculo. ii
De marcado carácter práctico son también las recomendaciones y consejos que se encuentran a
lo largo del manual [4], dirigidas especı́ficamente a los usuarios de FORTRAN.
6.4.4. Compensaciones estadı́sticas

Hemos buscado hasta aquı́ las situaciones más desfavorables, para poner de manifiesto los pro-
blemas que puede originar la computación con ordenadores. hh Afortunadamente, en numerosos casos
prácticos, los errores se compensan de una operación a otra. ii ([Brz]) Suele hacerse la hipótesis
de que los errores relativos en cada operación aritmética en punto flotante se distribuyen ‘uni-
formemente’ desde el punto de vista estadı́stico en el intervalo (−M , M ), y que los errores son
independientes, lo que lleva a una distribución normal que sugiere un error tı́pico en N operaciones
de tamaño N 1/2 M —la desviación estándar—, muy inferior al tamaño N 2 M de las estimaciones
‘más pesimistas’. Sin embargo, los errores no tienden a ser independientes, y la estimación N 1/2 M
es, en general, demasiado ‘optimista’.
En todo caso, los siguientes párrafos parecen dejar las cosas en el punto justo:
[Hig], p. 16: hh Desde que se desarrollaron las primeras computadoras electrónicas en los 1940s, se
ha hecho a menudo comentarios del tipo siguiente: “La enorme velocidad de las máquinas actuales
significa que en un problema tı́pico se efectúan muchos millones de operaciones en punto flotante.
Esto significa a su vez que los errores de redondeo pueden acumularse potencialmente de manera
desatrosa”. Este sentimiento es cierto, pero engañoso. Las más de las veces, la inestabilidad no
está causada por la acumulación de millones de errores de redondeo, sino por el crecimiento insidioso
de tan sólo unos pocos errores de redondeo. ii
[Hig], pp. 21–22: hh No es inusual que los errores de redondeo se cancelen en algoritmos estables,
con el resultado de que la respuesta final computada es mucho más exacta que las cantidades
intermedias. Este fenómeno no es apreciado universalmente, quizás porque tendemos a mirar los
números intermedios en un algoritmo sólo cuando algo va mal, no cuando la respuesta computada
es satisfactoria. ii
[Hig], p. 29: hh Los errores de redondeo, y su efecto acumulado en una computación, no son alea-
torios. Este hecho subyace en el éxito de muchas computaciones, [· · · ] Aquı́ daremos simplemente
un ejemplo numérico revelador (debido a W. Kahan).
Defı́nase la función racional
622 − x(751 − x(324 − x(59 − 4x)))
r(x) = ,
112 − x(151 − x(72 − x(14 − x)))
que está expresada en una forma que corresponde a la evaluación de los polinomios cuárticos
del numerador y el denominador mediante la regla de Horner. Hemos calculado r(x) mediante la
regla de Horner en aritmética de doble precisión para 361 números en punto flotante consecutivos
comenzando con a = 1.606, o sea x = a + (k − 1)2−52 , k = 1 : 361; la función r(x) es virtualmente
constante en este intervalo. La figura 1.6 dibuja los valores computados de la función junto con
una aproximación mucho más exacta a r(x) (calculada a partir de una representación en fracción
continua). El patrón sorprendente formado por los valores calculados mediante la regla de Horner
muestra claramente que los errores de redondeo en este ejemplo no son aleatorios. ii
(Ver también [Hig], p. 52–53).
Bibliografı́a
[Brz] Brezinski, C.: Introduction à la pratique du calcul numérique. Dunod/Bordas, Paris, 1988.
[Hig] Higham, N.: Accuracy and Stability of Numerical Algorithms. SIAM, Philadelphia, 1996.
[MC1] Mundo Cientı́fico: El universo de los números: Matemáticas para interpretar el mundo.
Extra núm. 1, s.f..
[S-S] Sanz-Serna, J. M.: Diez lecciones de Cálculo Numérico. Universidad de Valladolid, 1998.
[Gold] Goldberg, D.: What Every Computer Scientist Should Know About Floating-Point Arit-
hmetic. Computing Surveys, 1991.
http://docs.sun.com/db/doc/800-7895
La referencia universal.
[LIA-1] ISO/IEC: Information technology – language independent arithmetic. Part 1: Integer and
floating point arithmetic, 1994. ISO/IEC 10967-1:1994(E).
ftp://crl.dec.com/pub/misc/lia-1-is.ps.Z.
–—oOo—–
[1] Gray, R.: Advanced Statistical Computing. Course Notes, 2002.

http://biowww.dfci.harvard.edu/~gray/248-02/report.pdf
[2] IEEE-754 Floating-Point Conversion: From Decimal Floating-Point To 32-bit and 64-bit
Hexadecimal Representations Along with Their Binary Equivalents (1998)
http://babbage.cs.qc.edu/courses/cs341/IEEE-754.html
[3] Moore, D.: Introduction to Computacional Science. CAAM 420, Lecture Notes, 2000.
http://www.owlnet.rice.edu/~caam420/lectures
[4] UNFP: User Notes on Fortran Programming. (An open cooperative practical guide),
1998.
http://www.ibiblio.org/pub/languages/fortran/ch4-6.html
177

Teoria de Numeros y Conjuntos

Cargado por

Información del documento

Derechos de autor

Formatos disponibles

Compartir este documento

Compartir o incrustar documentos

Opciones para compartir

¿Le pareció útil este documento?

¿Este contenido es inapropiado?

Copyright:

Formatos disponibles

Teoria de Numeros y Conjuntos

Cargado por

Copyright:

Formatos disponibles

Índice general

2. Números naturales y enteros 49

3. Números racionales. Polinomios. 89

4. Números reales 119

5. Números complejos 133

6. Aritmética de punto flotante. 155

El objetivo fundamental de este capı́tulo es familiarizarnos con el principio de inducción y

0.1. Revisión de los números naturales

En lo sucesivo, denotaremos con N el conjunto de los números naturales o enteros positivos

Acordada esta notación, volvamos al asunto de la inducción en N. Tenemos en N, pues, un

0.2. Principio de inducción

¿Qué hacer si no hay demostración ‘a la vista’ ? Supongamos ahora que la proposición Pn es la

entonces también es cierta Pn+1 , es decir, se cumple

(1 + x)n+1 = (1 + x)n (1 + x) ≥ (1 + nx) (1 + x) = 1 + (n + 1) x + nx2 ,

y como nx2 ≥ 0, tendremos 1 + (n + 1) x + nx2 ≥ 1 + (n + 1) x y finalmente

(n + 1) (n + 2) (2n + 3) (n + 1) [(n + 2) (2n + 3)] (n + 1) [2n2 + 7n + 6]

(ii) 22n + 5 es divisible por 3;

(iii) 22n + 15n − 1 es divisible por 9.

Pn :: 42n+1 + 3n+2 es divisible por 13.

Para n = 1, 42+1 + 31+2 = 64 + 27 = 91 = 13 · 7 (P1 es cierta).

42(n+1)+1 +3(n+1)+2 = 16·42n+1 +3·3n+2 = (13+3)·42n+1 +3·3n+2 = 13·42n+1 +3 42n+1 + 3n+2 ,

Pn :: 22n + 5 es divisible por 3.

y si es cierto para un n que 22n + 5 es múltiplo de 3, pasando a n + 1,

(iii) Para cada número natural n, tomamos

Pn :: 22n + 15n − 1 es divisible por 9.

Para n = 1, 22 + 15 − 1 = 18 = 9 · 2 (P1 es cierta).

22(n+1) +15(n+1)−1 = 4·22n +15n+14 = 4(9k−15n+1)+15n+14 = 4·9k−3·15n+18 = 9(4k−5n+2).

O incluso de otra forma:

Veamos si podemos probarlo por inducción.

0.3. Principio de inducción ‘completa’

Pn :: n = 1 o n ≥ 2 y existe un número primo p que divide a n.

cumple que 1 ∈ S y que n ∈ S implica n + 1 ∈ S; o aplicar el principio de inducción “normal” a la proposición

0.4. Principio de inducción ‘desplazada’

0.5. Demostrar que para todo n ∈ N,

0.6. Observar que

(b) Prueba tu fórmula usando el principio de inducción.

Para finalizar el capı́tulo, un ‘clásico’.

Evidentemente, P1 es cierta. Veamos cómo de Pn se sigue Pn+1 .

0.6. APÉNDICE: Definiciones recursivas.

S1 = 12 y Sn+1 = Sn + (n + 1)2 para cada n ∈ N.

la base, que nos dice ‘cómo comenzar’;

la recursión, que nos dice cómo proseguir paso a paso.

Pn ejemplo, si para cada n ∈ N hemos fijado un cierto número an , y definimos recursivamente

la base es 1k=1 ak = a1 y la recursión n+1

Progresión aritmética de primer término a y razón d, dada por

Progresión geométrica de primer término a y razón r, dada por

Un ejemplo famosı́simo [4]: la sucesión de Fibonacci 1, 1, 2, 3, 5, 8, 13, 21, . . . , en la que

El factorial de un número natural n, denotado por n! y definido inductivamente por

[1] Interactive Real Analysis, Seton Hall University:

[2] ¿Es el 0 un número natural?: Math.Sci FAQ,

[4] Sobre la sucesión de Fibonacci.

[5] Recursión y la torre de Hanoi, Universidad de Málaga.

[6] S. Romero, La recursividad.

Introducción a la teorı́a de conjuntos.

mientras que la notación

{x : x es un entero positivo par },

y se lee el conjunto de los x tales que x es un entero positivo par.

es el conjunto de los x tales que x es cierta.

Frecuentemente, los x son elementos de un conjunto U fijado de antemano (los enteros, en

Definición 1.1.1. Dados dos conjuntos A y B, diremos que A es un subconjunto de B si cada

Para indicar que A es un subconjunto de B escribiremos A ⊆ B. También se lee hh A está con-

Corolario 1.1.2. Dos conjuntos A y B son iguales si y sólo si A ⊆ B y B ⊆ A.

Ejemplos. Para cualquier conjunto A, trivialmente A ⊆ A y ∅ ⊆ A. Que x ∈ A es equivalente a

Definición 1.1.3. Dado un conjunto A, el conjunto