Está en la página 1de 179

Índice general

0. El principio de inducción 1
0.1. Revisión de los números naturales . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1
0.2. Principio de inducción . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2
0.3. Principio de inducción ‘completa’ . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 6
0.4. Principio de inducción ‘desplazada’ . . . . . . . . . . . . . . . . . . . . . . . . . . . . 7
0.5. Ejercicios . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 7
0.6. APÉNDICE: Definiciones recursivas. . . . . . . . . . . . . . . . . . . . . . . . . . . . 9

1. Conjuntos 13
1.1. Conjuntos. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 13
1.1.1. Idea intuitiva de conjunto: pertenencia. Igualdad e inclusión entre conjuntos.
Conjunto potencia. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 13
1.1.2. Operaciones con conjuntos: unión, intersección, complemento. . . . . . . . . 16
1.2. Pares ordenados. Producto cartesiano de conjuntos. . . . . . . . . . . . . . . . . . . . 19
1.3. Correspondencias y aplicaciones . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 20
1.3.1. Comentarios previos: Ideas intuitivas y ejemplos. . . . . . . . . . . . . . . . . 20
1.3.2. Aplicaciones: dominio, codominio, gráfica. . . . . . . . . . . . . . . . . . . . . 22
1.3.3. Imagen y antiimagen de un conjunto. . . . . . . . . . . . . . . . . . . . . . . 23
1.3.4. Aplicaciones inyectivas, suprayectivas, biyectivas. . . . . . . . . . . . . . . . . 24
1.3.5. Más sobre familias de conjuntos . . . . . . . . . . . . . . . . . . . . . . . . . . 25
1.3.6. Composición de aplicaciones. . . . . . . . . . . . . . . . . . . . . . . . . . . . 26
1.3.7. Inversa de una aplicación biyectiva. Inyectividad e inversa parcial. . . . . . . 27
1.4. Relaciones . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 32
1.4.1. Relaciones de equivalencia y particiones. Conjunto cociente. . . . . . . . . . . 32
1.4.2. Relaciones de orden. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 35
1.5. Conjuntos finitos y numerables . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 38
1.5.1. Conjuntos finitos y numerables. Conjuntos equipotentes. . . . . . . . . . . . . 38
1.5.2. APÉNDICE: Un mı́nimo de combinatoria. . . . . . . . . . . . . . . . . . . . . 40

2. Números naturales y enteros 49


2.1. Números naturales. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 49
2.1.1. Lectura preliminar . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 49
2.1.2. Los axiomas de Peano . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 50
2.1.3. El principio de buena ordenación. . . . . . . . . . . . . . . . . . . . . . . . . . 52
2.2. Números enteros. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 52
2.2.1. Necesidad de los enteros. Propiedades de Z. Idea de anillo. . . . . . . . . . . 52
2.2.2. División entera. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 55
2.2.3. Representación decimal y binaria. Bases de numeración . . . . . . . . . . . . 57
2.2.4. Máximo común divisor. Algoritmo de Euclides. . . . . . . . . . . . . . . . . . 62
2.2.5. Números primos y factorización. Teorema fundamental de la Aritmética. . . . 71
2.2.6. Congruencias. Aritmética modular. . . . . . . . . . . . . . . . . . . . . . . . . 75

i
ii ÍNDICE GENERAL

3. Números racionales. Polinomios. 89


3.1. Números racionales. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 89
3.1.1. Insuficiencia de Z. Fracciones. . . . . . . . . . . . . . . . . . . . . . . . . . . . 89
3.1.2. Construcción de Q . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 90
3.2. Polinomios . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 96
3.2.1. Definiciones. Suma y producto de polinomios. . . . . . . . . . . . . . . . . . . 96
3.2.2. División de polinomios. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 98
3.2.3. Máximo común divisor. Algoritmo de Euclides. . . . . . . . . . . . . . . . . . 99
3.2.4. Funciones polinómicas. Raı́ces de polinomios. . . . . . . . . . . . . . . . . . . 103
3.2.5. Factorización de polinomios. . . . . . . . . . . . . . . . . . . . . . . . . . . . . 107
3.2.6. Polinomios, maple y Mathematica . . . . . . . . . . . . . . . . . . . . . . . 111

4. Números reales 119


4.1. Construcciones de los números reales . . . . . . . . . . . . . . . . . . . . . . . . . . . 119
4.1.1. Insuficiencia de Q . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 119
4.1.2. Construcciones de R a partir de Q. . . . . . . . . . . . . . . . . . . . . . . . . 120
4.2. Axiomática de R . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 121
4.3. Representación decimal . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 122
4.3.1. Aperitivo. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 122
4.3.2. Representación decimal canónica . . . . . . . . . . . . . . . . . . . . . . . . . 122
4.3.3. Decimales periódicos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 127
4.4. Representación en otras bases . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 129
4.4.1. Representación binaria . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 129
4.4.2. Representaciones en bases distintas de 10 y 2 . . . . . . . . . . . . . . . . . . 130

5. Números complejos 133


5.1. El cuerpo complejo. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 133
5.2. El plano complejo . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 138
5.3. Polinomios en C y en R. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 141
5.3.1. Potencias y raı́ces de un número complejo . . . . . . . . . . . . . . . . . . . . 142
5.3.2. Teorema fundamental del Álgebra y sus consecuencias . . . . . . . . . . . . . 144
5.4. Fracciones racionales. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 147
5.4.1. Funciones racionales . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 148
5.4.2. Fracciones simples . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 149
5.5. Números complejos y geometrı́a plana . . . . . . . . . . . . . . . . . . . . . . . . . . 151

6. Aritmética de punto flotante. 155


6.1. Aperitivo. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 155
6.2. Representación en punto flotante . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 156
6.2.1. Números de máquina . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 156
6.2.2. Aproximación por redondeo . . . . . . . . . . . . . . . . . . . . . . . . . . . . 159
6.3. Aritmética ‘aproximada’ . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 162
6.4. Estrategias de cálculo . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 168
6.4.1. Reformulación del problema: Ejemplos . . . . . . . . . . . . . . . . . . . . . . 168
6.4.2. Refinamientos en la representación y en la precisión . . . . . . . . . . . . . . 171
6.4.3. Buscar algoritmos estables . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 173
6.4.4. Compensaciones estadı́sticas . . . . . . . . . . . . . . . . . . . . . . . . . . . 176
Capı́tulo 0

El principio de inducción

El objetivo fundamental de este capı́tulo es familiarizarnos con el principio de inducción y


comenzar a utilizarlo en algunos ejemplos, ya que será una herramienta necesaria a lo largo de toda
la asignatura —y de las demás asignaturas, no sólo de este curso.
Al final del capı́tulo se incluyen una serie de referencias en las que podrán completarse algunos
de los temas que aquı́ se esbozan; en casi todas ellas hay ejercicios adicionales (a veces, resueltos)
para practicar con el principio de inducción, pero es bastante más formativo tratar de resolver a
fondo personalmente unos pocos ejercicios que leer muchas soluciones ajenas.

0.1. Revisión de los números naturales


Para comenzar a llevar a cabo nuestro plan de revisión, empezaremos por reflexionar sobre
los objetos matemáticos más sencillos o, mejor dicho, que nos son más familiares: los números
naturales.
Previamente, pongámonos de acuerdo en un punto:
¿Cuál es el primer número natural?
La cuestión no es tan trivial como aparenta. De hecho, en algunos libros se da como respuesta 1
(especialmente en los de Análisis matemático) pero en otros se contesta que es 0 (especialmente en
los de Álgebra).
Esta pluralidad de respuestas obedece, fundamentalmente, al uso que vaya a hacerse de los
números naturales. Simplificando burdamente, podrı́amos decir que incluir 0 entre los números
naturales responde al deseo de operar con ellos de una manera similar para la suma y el producto;
es decir, que igual que para el producto se dispone de un número que multiplicado por cualquier
otro deja como resultado el mismo número, puede parecer conveniente que haya también un número
que sumado con cualquier otro deje este último como resultado.
También puede argumentarse que con el cero podemos representar el número de elementos de
un conjunto vacı́o, de un conjunto sin elementos. Pero en la vida cotidiana, cuando contamos,
contamos “algo”, y empezamos por el 1; escribimos normalmente hh 1o ii por hh primeroii, hh 2o ii por
segundo, . . . (El 0 parece más ‘artificial’ que ‘natural’, valga el juego de palabras. De hecho, el 0 ha
tenido una larga y complicada historia: fue introducido inicialmente como un sı́mbolo y no como
un “verdadero” número, ver [3]).
Que en libros ‘serios’ se adopte tanto una como otra posibilidad y en ambos casos se desarrolle
una teorı́a coherente de los números naturales, parece sugerir que el quid de la cuestión no está en
las operaciones aritméticas, sino en la propia génesis de los números naturales, en la manera de
‘fabricarlos’. En este sentido, podrı́amos preguntar ‘ingenuamente’
¿Cuál es la propiedad más importante de los números naturales?
Tal vez lo esencial no es que ‘el primer’ número natural sea el 0 o el 1, sino que haya un primer
número natural, al cual sigue otro, y a éste otro, y a éste otro, . . . , y ası́ sucesivamente, sin tope,

1
2 CAPÍTULO 0. EL PRINCIPIO DE INDUCCIÓN

y que de esta manera podemos ‘atrapar’ todos los números naturales sin que escape ninguno.
Dicho en la jerga profesional, lo que importa es la propiedad de inducción del conjunto de
los números naturales. Antes de desarrollar esta idea, introducimos la siguiente

Notación.

En lo sucesivo, denotaremos con N el conjunto de los números naturales o enteros positivos


1, 2, 3, . . .
y con N0 el conjunto de los números enteros no negativos
0, 1, 2, 3, . . .

Acordada esta notación, volvamos al asunto de la inducción en N. Tenemos en N, pues, un


elemento inicial que denotamos con 1, al que sigue otro elemento que denotamos con 2, al que
sigue otro elemento que denotamos con 3, al que sigue . . . . Es decir, como propiedad básica de
N consideramos que, en general, cada número natural tiene un siguiente o sucesor, y N se genera
partiendo de 1 y pasando repetitivamente al siguiente de 1, al siguiente del siguiente de 1, al
siguiente del siguiente del siguiente de 1, y ası́ sucesivamente. Pero esta descripción plantea un
problema, la insatisfactoria ‘repetición infinita’ que deja abierta el hh y ası́ sucesivamenteii anterior
(una sucesión de definiciones que no acaba nunca). Dejando el análisis profundo para los filósofos,
con Aristóteles a la cabeza, este problema se zanja en Matemáticas aplicando el siguiente principio:
Inducción matemática. Un conjunto de números naturales que contenga a 1 y que
con cada n contenga al siguiente, debe contener a todos los números naturales.
Más informal: para probar que un conjunto de números naturales abarca todo N, basta que nos
aseguremos de que el 1 está en él, y que demostremos que si admitimos que está n, se deduce que
necesariamente ha de estar también n + 1 (el siguiente de n).
Esta propiedad es la base de muchas definiciones (definiciones recursivas o inductivas) y de
muchas demostraciones (demostraciones por inducción) que involucran a los números naturales.
Comencemos por presentarla de modo que facilite su uso práctico en demostraciones.

0.2. Principio de inducción


La ‘propiedad de inducción’ de N, en la práctica, suele formularse en términos de proposiciones
(enunciados que tienen sentido en un cierto contexto, y que pueden resultar ciertos o pueden resultar
falsos). Si para cada n ∈ N tenemos una proposición Pn , entonces Pn puede ser verdadera para
algunos valores de n y falsa para otros. Por ejemplo, si Pn es la proposición: hh n2 = n ii, entonces
P1 es verdadera (ciertamente 12 = 1), mientras que Pn es falsa para todo n 6= 1, n ∈ N (¿podrı́as
justificar por qué?); si Pn es la proposición:
n (n + 1)
hh 1 + 2 + 3 + ··· + n =ii
2
entonces Pn es verdadera para todo n ∈ N, porque denotando con s la suma del primer término de
la igualdad,
s = 1 + 2 + 3 + ··· + (n − 1) + n
+)
s = n + (n − 1) + (n − 2) + · · · + 2 + 1
2s = (n + 1) + (n + 1) + (n + 1) + · · · + (n + 1) + (n + 1) = n (n + 1)
n (n + 1)
y ası́ s = , como querı́amos probar.
2
0.2. PRINCIPIO DE INDUCCIÓN 3

¿Qué hacer si no hay demostración ‘a la vista’ ? Supongamos ahora que la proposición Pn es la


llamada desigualdad de Bernoulli :
dado n ∈ N, para todo número real x ≥ −1 se verifica (1 + x)n ≥ 1 + nx.
No hay una estrategia directa de éxito claro: podrı́amos pensar en el desarrollo de (1+x)n mediante
la fórmula del binomio, que comenzarı́a por 1+n x+ 21 n (n−1) x2 +· · · , pero la aparición de sumandos
posiblemente negativos (donde haya potencias impares de x cuando consideremos 0 > x ≥ −1)
dificulta el control del tamaño del resultado.
Sin embargo, es muy sencillo probar que si para algún n es cierta Pn , es decir, se cumple

(1 + x)n ≥ 1 + nx (∗ )

entonces también es cierta Pn+1 , es decir, se cumple

(1 + x)n+1 ≥ 1 + (n + 1) x.

En efecto: multiplicando los dos términos de la desigualdad (∗ ) por el número real no negativo
1 + x, se mantiene el sentido de la desigualdad y ası́

(1 + x)n+1 = (1 + x)n (1 + x) ≥ (1 + nx) (1 + x) = 1 + (n + 1) x + nx2 ,

y como nx2 ≥ 0, tendremos 1 + (n + 1) x + nx2 ≥ 1 + (n + 1) x y finalmente

(1 + x)n+1 ≥ 1 + (n + 1) x.

¿No habrá alguna forma de sacarle partido a este hecho? Pensemos un momento: el conjunto de los
números naturales para los que Pn se cumple tiene la propiedad de que con cada n que esté en él,
debe estar también n + 1. De acuerdo con la inductividad de N, bastarı́a que 1 estuviese en dicho
conjunto, para que todos los números naturales estuviesen en dicho conjunto —lo que significarı́a
que Pn serı́a cierta para todo número natural n. Pero P1 dice que ha de ser (1 + x)1 ≥ 1 + 1 · x,
o sea, 1 + x ≥ 1 + x, trivialmente cierto (incluso para cualquier número real x sin restricción).
Ası́ pues, acabamos de demostrar que Pn es cierta para todo número natural n.
Por tanto, ¡hemos encontrado una demostración indirecta, más abordable, del resultado que
buscábamos probar!
Esta misma situación se repite suficientes veces como para que el método empleado merecezca
un enunciado destacado, con nombre propio.
1. Principio de inducción. Para cada número natural n, sea Pn una proposición que puede ser
cierta o falsa, de tal manera que
P1 es cierta, y
para cada n ∈ N, suponiendo que Pn es cierta se puede demostrar que Pn+1 es cierta.
Entonces se cumple que
F Pn es cierta para todo n ∈ N.
Veamos la aplicación de este principio en algunos ejemplos.
Ejemplos.
1. Demostrar que, cualquiera que sea el número natural n,
n
X n (n + 1) (2n + 1)
k2 = .
6
k=1
n
X
(La expresión k 2 es una manera abreviada de indicar 12 + 22 + · · · + k 2 + · · · + n2 .)
k=1
4 CAPÍTULO 0. EL PRINCIPIO DE INDUCCIÓN

No se ve una manera obvia de calcular directamente la suma que nos proponen (lo que no quiere
decir que no exista). Pero sı́ podemos probar fácilmente por inducción que se cumple la igualdad
para todo n. Para ello, tomemos como Pn la proposición del enunciado:
n
X n (n + 1) (2n + 1)
Pn :: k2 = .
6
k=1

1
X n (n + 1) (2n + 1) 1 (1 + 1) (2 · 1 + 1)
P1 es cierta: para n = 1, k 2 = 12 = 1, mientras que = =
6 6
k=1
1·2·3
= 1.
6
Si es cierta Pn para un n, ¿también es cierta Pn+1 ?
n+1
X (n + 1) (n + 1 + 1) (2(n + 1) + 1) (n + 1) (n + 2) (2n + 3)
Pn+1 :: k2 = =
6 6
k=1

Sı́: porque
n+1
X
k 2 = 12 + 22 + · · · + k 2 + · · · + n2 + (n + 1)2
k=1
n
X ∗ n (n + 1) (2n + 1)
= k 2 + (n + 1)2 = + (n + 1)2
6
k=1
n (n + 1) (2n + 1) + 6(n + 1)2 (n + 1) [n (2n + 1) + 6(n + 1)]
= =
6 6
(n + 1) [2n2 + n + 6n + 6] (n + 1) [2n2 + 7n + 6]
= = .
6 6

En la igualdad = hemos empleado la hh hipótesis de inducciónii (esto es, que suponemos Pn cierta).
Y por último, también

(n + 1) (n + 2) (2n + 3) (n + 1) [(n + 2) (2n + 3)] (n + 1) [2n2 + 7n + 6]


= = .
6 6 6
2. Demostrar que, cualquiera que sea el número natural n,
(i) 42n+1 + 3n+2 es divisible por 13;

(ii) 22n + 5 es divisible por 3;

(iii) 22n + 15n − 1 es divisible por 9.


(i) Para cada número natural n, tomamos

Pn :: 42n+1 + 3n+2 es divisible por 13.

Para n = 1, 42+1 + 31+2 = 64 + 27 = 91 = 13 · 7 (P1 es cierta).


Dado un número natural n arbitrario, supongamos cierta la propiedad para n. Pasando a n + 1,

42(n+1)+1 +3(n+1)+2 = 16·42n+1 +3·3n+2 = (13+3)·42n+1 +3·3n+2 = 13·42n+1 +3 42n+1 + 3n+2 ,




que, aplicando la hipótesis de inducción, es múltiplo de 13 por ser suma de múltiplos de 13.
(ii) Para cada número natural n, tomamos

Pn :: 22n + 5 es divisible por 3.


0.2. PRINCIPIO DE INDUCCIÓN 5

para n = 1, 22 + 5 = 4 + 5 = 3 · 3,

y si es cierto para un n que 22n + 5 es múltiplo de 3, pasando a n + 1,


22(n+1) + 5 = 4 · 22n + 5 = (3 + 1) · 22n + 5 = 3 · 22n + 22n + 5 ,


suma de múltiplos de 3.

(iii) Para cada número natural n, tomamos

Pn :: 22n + 15n − 1 es divisible por 9.

Para n = 1, 22 + 15 − 1 = 18 = 9 · 2 (P1 es cierta).


Dado un número natural n arbitrario, supongamos cierta la propiedad para n, de modo que
exista un k ∈ N tal que 22n + 15n − 1 = 9k. Pasando a n + 1,

22(n+1) +15(n+1)−1 = 4·22n +15n+14 = 4(9k−15n+1)+15n+14 = 4·9k−3·15n+18 = 9(4k−5n+2).

Alternativamente:

22(n+1) + 15(n + 1) − 1 = 4 22n + 15n − 1 − 45n + 18, que será divisible por 9.


O incluso de otra forma:

22(n+1) +15(n+1)−1 = 4·22n +15n+15−1 = 22n +3·22n +15n−1+15 = 22n +15n−1+3 22n + 5 ,


y como 22n + 5 es múltiplo de 3 según hemos probado, lo anterior sea múltiplo de 9 (aplicando la
hipótesis de inducción).
3. Obsérvese que

1 1
1− = ,
  2
 2
1 1 1
1− 1− = ,
2 3 3
   
1 1 1 1
1− 1− 1− = .
2 3 4 4

Se pide: conjeturar una ley general sencilla que incluya las anteriores como casos particulares, y
demostrarla mediante el principio de inducción.
Parece que se cumple
      
1 1 1 1 1 1
Pn :: 1− 1− 1− ··· 1 − 1− = .
2 3 4 n n+1 n+1

Veamos si podemos probarlo por inducción.


1 1
P1 es cierta, trivialmente 1 − = .
2 2
Supongamos cierta Pn . Entonces
       
1 1 1 1 1 1
1− 1− 1− ··· 1 − 1− 1−
2 3 4 n n+1 n+2
 
∗ 1 1 1 (n + 2) − 1 1 n+1 1
= 1− = = = ,
n+1 n+2 n+1 n+2 n+1 n+2 n+2

es decir, resulta cierta Pn+1 (hemos aplicado la hipótesis de inducción para escribir =).
6 CAPÍTULO 0. EL PRINCIPIO DE INDUCCIÓN

0.3. Principio de inducción ‘completa’


A veces, la ayuda que proporciona suponer cierta Pn para demostrar Pn+1 es insuficiente, y se
hace necesario un “apoyo más amplio”. No es difı́cil ver que, cuando interese, se puede modificar
el principio de inducción para usar como “hipótesis de inducción” que son ciertas todas las pro-
posiciones P1 , . . . , Pn , y deducir de ellas Pn+1 . El resultado es lo que algunos textos denominan el
principio de inducción ‘fuerte’ (ver [D’A-W]) o principio de inducción ‘completa’.1
2. Principio de inducción ‘completa’. Para cada número natural n, sea Pn una proposición,
cierta o falsa, de tal manera que
P1 es cierta, y

para cada n ∈ N, suponiendo que P1 , P2 , . . . , Pn son ciertas se puede demostrar que Pn+1 es
cierta.
Entonces se cumple que
F Pn es cierta para todo n ∈ N.
Veamos la ventaja conseguida en un ejemplo. Recordemos que un número natural p distinto
de 1 es primo si no tiene más divisores en N que 1 y el propio p; abordemos ahora el siguiente
ejercicio:
4. Probar que para todo número natural n ≥ 2 existe un número primo p que divide a n.
Con el principio de inducción utilizado como hasta ahora, un intento razonable serı́a tomar

Pn :: n = 1 o n ≥ 2 y existe un número primo p que divide a n.

Trivialmente, P1 es cierta. Pero si para un n es cierta Pn , ¿deberá ser cierta Pn+1 ? ¿de qué sirve
que n sea divisible por un número primo p, si eso no implica que p divida a n + 1, ni que ningún
número primo ligado con p (el siguiente, por ejemplo) divida a n + 1?
Sin embargo, pasemos al principio de inducción completa: ahora, partimos de un n tal que no
sólo es cierta Pn , sino también P1 , P2 , y Pk para cualquier k ≤ n. Entonces:
— si n + 1 es primo, basta tomar p = n + 1 para ver que Pn+1 es cierta;
— y si n + 1 no es primo, tendrá un divisor positivo k distinto de 1 y de n + 1; pero los divisores
de un número son menores o iguales que dicho número (¿por qué?); ası́ pues, será k < n + 1, por lo
que k valdrá a lo más n. En consecuencia, Pk es cierta, por nuestra ‘nueva’ hipótesis de inducción.
Y como k 6= 1, esto significa que k admite un divisor primo p, que a su vez será divisor de n + 1;
por tanto Pn+1 es igualmente cierta en este caso. En consecuencia, Pn es cierta para todo n, como
querı́amos demostrar.

Comentarios
La estrategia de demostración que el principio de inducción proporciona recuerda lo que los
franceses llaman reculer pour mieux sauter, retroceder para saltar más. Comparando las dos versio-
nes que hemos enunciado, podrı́amos decir que en la primera tomamos una “pequeña carrerilla”,
de un sólo paso, mientras que en la inducción completa la “carrerilla”se toma desde el principio.
Siguiendo con las comparaciones, también se llama al ‘primer’ principio de inducción el principio
de las fichas de dominó: si pensamos en una colección infinita de fichas de dominó puestas una tras
otra, para tirarlas todas basta con asegurarse de que cae la primera y de que estén colocadas de
forma que cada ficha tire a la siguiente.
1
Su justificación es sencilla: basta observar que el conjunto S = {n ∈ : P1 , P2 , . . . , Pn son todas ciertas}
N

cumple que 1 ∈ S y que n ∈ S implica n + 1 ∈ S; o aplicar el principio de inducción “normal” a la proposición


Qn = P1 “y” P2 “y” . . . “y” Pn , denotada en lógica proposicional por Qn = P1 ∧ P2 ∧ · · · ∧ Pn , que es cierta
cuándo y sólo cuando cada una de las P1 , . . . , Pn son ciertas.
0.4. PRINCIPIO DE INDUCCIÓN ‘DESPLAZADA’ 7

0.4. Principio de inducción ‘desplazada’


Sigamos considerando una colección de proposiciones P1 , P2 , P3 , . . . (una para cada número
natural). A veces se cumple que Pn+1 es cierta siempre que lo sea Pn , aunque P1 sea falsa. Por
ejemplo, consideremos Pn : hh n = n + 1ii; obviamente, de n = n + 1 se sigue que n + 1 = (n + 1) + 1,
que es Pn+1 , mientras que 1 6= 2.
¿Qué conclusiones cabe extraer de este ejemplo trivial? La primera, algo que no hay que olvidar
nunca en Matemáticas: los enunciados matemáticos dicen exactamente lo que dicen, y hasta que
no hayamos comprobado todas las hipótesis, no podemos afirmar ninguna tesis. Y concretamente
en el principio de inducción, no hay que lanzarse sin más a probar que Pn implica Pn+1 olvidando
probar que P1 es cierta (lo que sucede con cierta frecuencia).
La segunda conclusión (ahora que ya nos hemos vuelto extremadamente cuidadosos) es que si
Pn implica Pn+1 para todo n ∈ N y P1 es falsa, quizá Pn no sea cierta para ningún n.
¿Por qué quizá solamente? Porque podrı́a suceder que para algún valor n1 la correspondiente
proposición Pn1 fuese cierta. Por ejemplo, examinemos Pn : hh n2 > n + 2 ii. Que Pn implica Pn+1 es
sencillo de probar: de n2 > n + 2 (n ∈ N) se sigue que (n + 1)2 = n2 + 2n + 1 > n + 2 + 2n + 1 >
(n + 1) + 2; y 12 no es estrictamente mayor que 1 + 2, con lo que P1 es falsa. Pero 42 > 4 + 2, luego
P4 es cierta. ¿Qué provecho se saca de esta información? Que Pn es cierta al menos para n ≥ 4,
según se deduce aplicando el principio de inducción a la proposición Qn = Pn+3 . ¿Sólo para estos
n es cierta Pn ? En este caso no: también es cierta P3 .
Por tanto, resumiendo: cuando se cumple que Pn+1 es cierta siempre que lo sea Pn , o bien Pn
es falsa para todo n o, en caso contrario, hay al menos un valor n1 tal que Pn1 es cierta, y en este
supuesto, procediendo como antes, se prueba lo que suele llamarse el principio de inducción
‘desplazada’ (no es una denominación estándar).
3. Principio de inducción “desplazada”. Sea n1 un número natural dado, y para cada número
natural n ≥ n1 sea Pn una proposición, cierta o falsa, de tal manera que
Pn1 es cierta, y
para cada número natural n ≥ n1 , admitiendo que Pn es cierta se puede demostrar que Pn+1
es es cierta,
Entonces se cumple que
F Pn es cierta para todo n ≥ n1 .
Con esta nueva herramienta y las anteriores, el lector puede abordar por su cuenta los ejercicios
del apartado siguiente.

0.5. Ejercicios
0.1. Demostrar que para cada número natural n tal que n2 + 5n + 1 es un número par, también
(n + 1)2 + 5(n + 1) + 1 es un número par. ¿Se sigue de aquı́ por inducción que n2 + 5n + 1 es siempre
un número par? ¿Cuál es la conclusión correcta? Demostrarlo.
0.2. ¿Para qué números naturales n es cierta la desigualdad 2n > n2 ? Demostrarlo por inducción.
0.3. Sea S = {n ∈ N : 2n < 2n }. Probar que n + 1 ∈ S siempre que n ∈ S. ¿Se deduce de aquı́ que
S = N? ¿Por qué? Si no, ¿quién es S? ¿Por qué?
0.4. Demostrar que para todo n ∈ N,
n  2
X
3 n(n + 1)
k = .
2
k=1
8 CAPÍTULO 0. EL PRINCIPIO DE INDUCCIÓN

0.5. Demostrar que para todo n ∈ N,


2n 2n
X 1 X (−1)k+1
= .
k k
k=n+1 k=1

0.6. Observar que

1 = 1;
1 − 4 = −(1 + 2);
1 − 4 + 9 = 1 + 2 + 3;
1 − 4 + 9 − 16 = −(1 + 2 + 3 + 4).

Conjeturar una fórmula general sencilla que incluya las anteriores como casos particulares, y de-
mostrarla mediante el principio de inducción.
0.7. Definamos los números a1 , a2 , a3 , . . . por a1 = 9, a2 = 36, an+1 = 6an − 9an−1 si n ≥ 2.
Probar que an está bien definido para todo n y que an = 3n (n + 2).
0.8. Sea u1 = 2, u2 = 3, un+1 = 3un − 2un−1 si n ≥ 2. Probar que un está bien definido para todo
n y que un = 2n−1 + 1.
0.9. (a) Conjetura una fórmula para 1 + 3 + · · · + (2n − 1) evaluando la suma para n = 1, 2, 3 y 4.
(b) Prueba tu fórmula usando el principio de inducción.
0.10. (a) Conjetura una fórmula que simplifique el producto
     
1 1 1 1
1− 1− 1− ··· 1 − 2 .
4 9 16 n

(b) Prueba tu fórmula usando el principio de inducción.

Para finalizar el capı́tulo, un ‘clásico’.


0.11. Evaluar el siguiente resultado:
Teorema. En cualquier examen, todos los alumnos presentados obtienen la misma calificación.
Demostración : La haremos por inducción. Para cada n ∈ N, sea Pn la proposición
hh todo conjunto de n alumnos distintos, al realizar un examen, obtiene una única calificación.ii

Evidentemente, P1 es cierta. Veamos cómo de Pn se sigue Pn+1 .


Supongamos que tenemos un conjunto {A1 , A2 , . . . , An , An+1 } de n + 1 alumnos distintos, con
calificaciones a1 , a2 , . . . , an , an+1 .
Considerando {A1 , A2 , . . . , An }, tenemos un conjunto de n alumnos distintos, luego por la
hipótesis de inducción (estamos admitiendo que Pn es cierta) se tendrá a1 = a2 = · · · = an .
Considerando ahora {A2 , . . . , An , An+1 }, tenemos igualmente un conjunto de n alumnos distin-
tos, de donde a2 = · · · = an = an+1 .
Por tanto, hemos encontrado que
)
a1 = a2 = · · · = an
luego a1 = a2 = · · · = an = an+1 ,
a2 = · · · = an = an+1

es decir, los n + 1 alumnos han obtenido la misma calificación, como querı́amos demostrar.
0.6. APÉNDICE: DEFINICIONES RECURSIVAS. 9

0.6. APÉNDICE: Definiciones recursivas.


Ocupémonos ahora de la inducción como medio de construir definiciones. Exponer una descrip-
ción general del ‘método de definición inductiva’ es competencia de la Lógica matemática o de la
teorı́a de programación de ordenadores, por lo que aquı́ nos limitaremos a mostrar algunos ejemplos
y señalar sus caracterı́sticas más destacadas. Esta sección debe verse más como tema de lectura que
como ‘objeto de estudio’, si bien trata una cuestión importante que no suele comentarse con mucho
detenimiento y que, por eso mismo, puede servir de buena ayuda para entender ciertos aspectos
que de otra manera originarı́an confusión.
En apartados anteriores nos Pnhemos tropezado, sin prestarles especial atención, con expresiones
2
como 1 + 2 + 3 + · · · + n, o k=1 k de la que, decı́amos, era hh una manera abreviada de indicar
12 + 22 + · · · + k 2 + · · · + n2 ii. Usualmente, una descripción de este tipo suele bastar para aclarar a
qué nos referimos; no obstante, al menos las primeras veces que uno se encuentra con ellas, suele ser
necesaria una explicación más detallada de su significado, y no digamos si se trata de implementar
un procedimiento de cálculo de las mismas en un ordenador.
Esto indica que las descripciones “mediante puntos suspensivos · · · ” conllevan una cierta am-
bigüedad, como ocurrı́a con los “y ası́ sucesivamente” que hemos comentado al comienzo del capı́tu-
lo. Generalmente, esta ambigüedad se evita dando una definición recursiva o inductiva; veamos un
primer ejemplo.
Cuando se necesita dar una definición inequı́voca de una expresión como
Sn = 12 + 22 + · · · + n2 ,
basta observar cómo pasamos de cada valor de n al siguiente:
Sn+1 = 12 + 22 + · · · + n2 + (n + 1)2 = Sn + (n + 1)2 ,
con lo cual el problema se solventa fácilmente usando la propiedad de inducción de N; no hay más
que definir Sn haciendo

S1 = 12 y Sn+1 = Sn + (n + 1)2 para cada n ∈ N.

¿Para qué números naturales está bien definido Sn mediante la fórmula anterior? Desde luego para
1, y también para el siguiente de cada número natural para el que esté bien definido; es decir, para
todos los números naturales, por inducción.
Análogamente, si se trata de definir la expresión an para un número dado a y un exponente
n ∈ N cualquiera, en vez de plantearla como “el producto de n factores iguales a a”, podemos
definir recursivamente
a1 = a, an+1 = an · a,
y vale repetir el argumento anterior para concluir que ası́ an está bien definido para todo n ∈ N.
Estos ejemplos muestran que en una definición recursiva, la construcción del objeto que se
define se hace siguiendo siempre unas mismas reglas, pero estas reglas hacen referencia al propio
objeto. Por ello, para no caer en un cı́rculo vicioso, el primero o primeros casos se definen siempre de
manera expresa, sin apelar a las reglas. Consecuentemente, en cada definición recursiva encontramos
siempre dos partes,

la base, que nos dice ‘cómo comenzar’;

la recursión, que nos dice cómo proseguir paso a paso.

Pn ejemplo, si para cada n ∈ N hemos fijado un cierto número an , y definimos recursivamente


Por
k=1 ak mediante

1
X n+1
X n
X
ak = a1 y ak = ak + an+1 para cada n ∈ N,
k=1 k=1 k=1
10 CAPÍTULO 0. EL PRINCIPIO DE INDUCCIÓN

la base es 1k=1 ak = a1 y la recursión n+1


P P Pn
k=1 ak = k=1 ak +an+1 . De paso, observemos que el ı́ndice
k
Pnpuede sustituirse
Pn por cualquier
Pn otro sı́mbolo, es en realidad un ‘ı́ndice mudo’, y lo mismo significa
k=1 ak que m=1 am o t=1 at : en definitiva, se trata del número Sn construido recursivamente
a partir de S1 = a1 , Sn+1 = Sn + an+1 .
Curiosamente, aparecen definiciones recursivas incluso ‘en la vida misma’. Por ejemplo, ‘perte-
necen a la realeza los reyes o los hijos de algún miembro de la realeza’.
Otros ejemplos más ‘matemáticos’, son los siguientes:

Progresión aritmética de primer término a y razón d, dada por


a1 = a, an+1 = an + d.
‘Obviamente’ an = a+(n−1) d; una demostración completa y cuidadosa es fácil por inducción.

Progresión geométrica de primer término a y razón r, dada por


a1 = a, an+1 = r · an .
‘Obviamente’ an = a · rn−1 ; podemos ‘asegurarnos’ usando inducción.

Un ejemplo famosı́simo [4]: la sucesión de Fibonacci 1, 1, 2, 3, 5, 8, 13, 21, . . . , en la que


cada término es suma de los dos anteriores (y los dos primeros son iguales a 1). Su definición
recursiva es
φ1 = 1, φ2 = 1, φn+1 = φn + φn−1 si n ≥ 2.
NOTA. Estos ejemplos no deben llevar a la conclusión de que cualquier fórmula proporciona una
definición recursiva. Basta observar lo que ocurre si ponemos
3 1
a1 = , an+1 = .
2 an − 1
1 1 1
Entonces a2 = = 2, a3 = = 1, a4 = =???.
(3/2) − 1 2−1 1−1

El factorial de un número natural n, denotado por n! y definido inductivamente por


1! = 1, (n + 1)! = (n + 1) · n!,
que suele introducirse habitualmente como hh el producto n · (n − 1) · · · 3 · 2 · 1ii.

Como se señala en [G-H], hh cuando el reemplazamiento de los puntos suspensivos es una tarea
rutinaria para los seres humanos, a menudo los puntos sustituyen la definición inductiva que se
espera que dé el lector. El uso de puntos suspensivos hace a menudo que las fórmulas sean más
fáciles de entender, pero, nuevamente, sólo para lectores humanos. Y en trabajos más avanzados [o
más cuidadosos], la definición por inducción tiene que ser dada [explı́citamente].ii
Por lo que a los ordenadores se refiere, hay lenguajes de programación como C que admiten
procesos recursivos y otros, como algunos ‘dialectos’ de Fortran, que no los admiten. En esta última
situación, hay que transformar los procesos recursivos en procesos iterativos, de carácter cı́clico,
que hacen uso de bucles en los que intervienen valores calculados en el ciclo previo. Todo programa
recursivo puede reescribirse como un programa iterativo, aunque ciertos problemas se resuelven
de manera más simple y natural mediante recursión (generalmente, a costa de mayor consumo de
memoria). Un ejemplo muy ilustrativo es el conocido problema ‘de la torre de Hanoi’, que puede
verse en [5] o [6].
Bibliografı́a

[B-S] Bartle, R. G.- Sherbert, D. R.: Introducción al Análisis Matemático de una Variable.
Limusa, México, 1990.
Trata el principio de inducción en la Sección 1.3 (págs. 31 a 35). Muy detallado en sus comentarios.
Tiene una buena selección de ejemplos y ejercicios.

[D’A-W] D’Angelo, J. P.; West, D. B.: Mathematical Thinking. Problem-Solving and Proofs.
Prentice-Hall, Upper Saddle River, NJ, 1997.
Dedica al principio de inducción su capı́tulo 4 (págs. 56 a 73). Es un libro muy original en su plantea-
miento, y contiene una gran cantidad de ejercicios y problemas (algunos con cierto grado de dificultad).

[Ebb] Ebbinghaus, H.-D. & al.: Numbers. Springer, New York, 1991.
Es un excelente libro de consulta, a medio camino entre la historia de las ideas sobre los números y
la exposición ‘de teoremas’. Alcanza niveles que superan ampliamente el contenido de este curso, pero
merece la pena conocerlo. En la pág. 15 se encuentra el principio de inducción. No tiene ejercicios.

[G-H] Griffits, H. B.; Hilton, P. J.: Classical Mathematics. Van Nostrand Reinhold, London,
1970.
Una obra ambiciosa: el tı́tulo completo es A Comprehensive Textbook of Classical Mathematics. A
Contemporary Interpretation. Baste con decir que cumple sobradamente su propósito. Tanto su plan-
teamiento como su exposición no han perdido nada de su valor con el tiempo, sino todo lo contrario.
Excelentes comentarios y ejercicios. Imprescindibles y más completos de lo habitual su tratamiento y
comentarios sobre inducción, a la que dedica el capı́tulo 5.

[Lieb] Liebeck, M.: A Concise Introduction to Pure Mathematics. Chapman & Hall/CRC, Boca
Raton, 2000.
De planteamiento muy similar al de esta asignatura, difiere en algunos contenidos y en el orden de expo-
sición. El principio de inducción aparece su capı́tulo 8 (págs. 55 a 68). Tiene ejercicios muy interesantes,
y el capı́tulo 9 está dedicado a demostrar por inducción la fórmula de Euler hh caras + vértices = aristas
+2ii, que aplica luego al estudio de los cinco sólidos platónicos (cubo, tetraedro, octaedro, icosaedro y
dodecaedro).

[Pest] Pestana, D. & al.: Curso práctico de Cálculo y Precálculo. Ariel, Barcelona, 2000.
Orientado fundamentalmente a servir de base para el Análisis matemático, parte de su contenido coincide
con el de nuestra asignatura. Muy claro y muy práctico, explica el principio de inducción en la página
30, dentro de un capı́tulo titulado Métodos de demostración que merece ser leı́do en su totalidad.

11
12 BIBLIOGRAFÍA

Documentos en Internet

[1] Interactive Real Analysis, Seton Hall University:


http://www.shu.edu/projects/reals/infinity/index.html

[2] ¿Es el 0 un número natural?: Math.Sci FAQ,


http://db.uwaterloo.ca/~alopez-o/math-faq/node12.html#SECTION00321000000000000000

[3] Historia del cero, The MacTutor History of Mathematics archive, St Andrews University,
Escocia.
http://www-groups.dcs.st-and.ac.uk/~history/HistTopics/Zero.html

[4] Sobre la sucesión de Fibonacci.


http://www.arrakis.es/~mcj/fibonacc.htm

[5] Recursión y la torre de Hanoi, Universidad de Málaga.


http://www.lcc.uma.es/~pepeg/modula/temas/tema11.pdf

[6] S. Romero, La recursividad.


http://pinsa.escomposlinux.org/sromero/prog/recursividad.html
Capı́tulo 1

Introducción a la teorı́a de conjuntos.

En Matemáticas, los conjuntos aparecen inevitablemente, bien de forma explı́cita o bien de forma
implı́cita, y podemos encontrar ejemplos en abundancia. Acabamos de examinar una propiedad ‘de
los números naturales’, el principio de inducción, que no es una propiedad de cada número natural
(del 1, o del 2, o del 46) sino del conjunto de los números naturales. Igualmente, cuando se dice
que hay “infinitos números primos”, no expresamos una propiedad de cada número primo, sino del
conjunto que forman: “el conjunto de los números primos es infinito”. Muchos objetos geométricos
son conjuntos: rectas, planos, circunferencias, cualquier figura geométrica es un conjunto de puntos;
hablamos del “conjunto de soluciones” de una ecuación o de un sistema de ecuaciones; un espacio
vectorial es un conjunto en el que se ha definido una suma y un producto por escalares que cumplen
unas ciertas reglas, etc.
Sin embargo, el estudio de los conjuntos como objetos matemáticos en sı́ mismos, es decir, la
Teorı́a de conjuntos como disciplina matemática, no aparece hasta la segunda mitad del siglo XIX,
creada por G. Cantor.
La formalización de la Teorı́a de conjuntos como una teorı́a axiomática resultó extremadamente
difı́cil, pese a lo simple y poco problemática que parecı́a la noción de conjunto. Sus primeros
desarrollos hicieron aparecer las famosas paradojas de Burali-Forti, de Cantor, de Russell; las
discusiones sobre el axioma de elección y la hipótesis del continuo . . . (ver [GJPR], [Ap])
Pero lo que a nosotros nos interesa de la Teorı́a de conjuntos es que proporciona un lenguaje
básico para formular enunciados y argumentos que el lenguaje ordinario harı́a farragosos o incom-
prensibles. No nos vamos a enfrentar a ella como “estudiosos”, sino como “usuarios”: nos vamos a
limitar a una Teorı́a intuitiva de conjuntos, planteando este capı́tulo sustancialmente como el texto
[D-H]. Para completar las explicaciones y ver más ejemplos, son interesantes [D’A-W], [G-H],[Ham],
[Lieb], [S-T], ası́ como [Lip], [O.U.], etc., y es esencial [GJPR].

1.1. Conjuntos.
1.1.1. Idea intuitiva de conjunto: pertenencia. Igualdad e inclusión entre con-
juntos. Conjunto potencia.
En un enfoque intuitivo de la teorı́a de conjuntos, como el que aquı́ vamos a emplear, la noción de
conjunto no difiere esencialmente de lo que por tal se entiende en el lenguaje ordinario: una colección
de objetos, reales o abstractos (los elementos del conjunto) agrupados como un todo, percibidos
simultáneamente como un nuevo objeto. Desde el punto de vista matemático, esta descripción de
lo que entendemos como conjunto no sirve como definición: es demasiado vaga e imprecisa, y utiliza
otras palabras (‘colección’, ‘agrupamiento’) que no son más que sinónimos de la palabra ‘conjunto’.

13
14 CAPÍTULO 1. CONJUNTOS

Tampoco nos ayuda recurrir a los diccionarios; en el de la Real Academia Española, por ejemplo,
encontramos lo siguiente:
conjunto : . . . k 4. m. Agregado de varias personas o cosas. k . . . k 6. La totalidad de los elementos
o cosas poseedores de una propiedad común, que los distingue de otros. Por ejemplo, los números
pares. k . . . k 9. (Mat.) La totalidad de los entes matemáticos que tienen determinada propiedad.
El CONJUNTO de los números primos. k . . .
Es muy difı́cil plantear una definición de ‘conjunto’ que no recurra a sinónimos hasta caer en
un cı́rculo vicioso: es un concepto tan básico que sólo podemos dar descripciones aproximativas del
mismo. De hecho, cuando fue preciso establecer una teorı́a de conjuntos rigurosa desde el punto
de vista matemático, una Teorı́a axiomática de conjuntos, la noción de ‘conjunto’ quedó entre los
términos no definidos.1
Proseguiremos, entonces, con nuestras ideas intuitivas de conjunto y de elementos de un con-
junto. Si A es un conjunto y a es uno de sus elementos, diremos que a pertenece a A, y escribiremos

a ∈ A,

mientras que la notación


a∈
/A
indicará que a no pertenece (no es un elemento) de A.
Cuando A es un conjunto con pocos elementos, por ejemplo el de los cinco primeros enteros
positivos pares, suele indicarse listando sus elementos entre llaves,

A = {2, 4, 6, 8, 10}.

Pero lo más habitual es que los conjuntos vengan descritos por una propiedad que caracteriza a
sus elementos: por ejemplo, como citaba el diccionario, el conjunto de todos los enteros positivos
pares. Este conjunto se escribe

{x : x es un entero positivo par },

y se lee el conjunto de los x tales que x es un entero positivo par.


En general, si tenemos una propiedad P (x) relativa a ciertos x,

{x : P (x) es cierta },

es el conjunto de los x tales que x es cierta.


1
Cuando una determinada rama de las matemáticas se desarrolla axiomáticamente, se toman como punto de
partida
(1) unos términos no definidos
(2) unas relaciones no definidas
(3) unos axiomas que relacionan los términos no definidos y las relaciones no definidas.
A partir de ellos, se van definiendo nuevos términos y se desarrollan teoremas basados en los axiomas o en teoremas
anteriores. Por ejemplo, en la geometrı́a plana euclı́dea, ‘punto’ y ‘recta’ son términos no definidos, ‘punto que está en
una recta’ o, lo que es equivalente, ‘recta que pasa por un punto’, es una relación no definida, y son axiomas, entre
otros:
‘Dos puntos distintos están en una y una sola recta’ (equivalentemente, ‘por dos puntos distintos pasa una recta y
una sola’)
‘Dos rectas distintas no pueden tener más de un punto común’.
En la Teorı́a axiomática de conjuntos, son términos no definidos ‘elemento’ y ‘conjunto’, la relación no definida es
‘pertenencia de un elemento a un conjunto’, y son axiomas, entre otros,
Axioma de extensión. Dos conjuntos A y B son iguales si y sólo si cada elemento que pertenece a A también
pertenece a B y cada elemento que pertenece a B también pertenece a A.
Axioma de especificación. Sea P (x) una afirmación y sea A un conjunto. Existe entonces un conjunto al que
pertenecen exactamente los elementos a que pertenecen a A para los que el enunciado P (a) es cierto.
Puede verse un comentario más amplio sobre los sistemas axiomáticos en la página web de la asignatura.
1.1. CONJUNTOS. 15

Frecuentemente, los x son elementos de un conjunto U fijado de antemano (los enteros, en


nuestro primer ejemplo). En vez de escribir entonces {x : x ∈ U y P (x) es cierta }, se emplea la
notación.
{x ∈ U : P (x) es cierta }.
Por otra parte, pensar que todos los elementos que se van a manejar quedan dentro de un
conjunto “universal” (el universo del discurso) permite eliminar paradojas de carácter lógico, como
la no existencia del ‘conjunto de todos los conjuntos’ o la paradoja de Russell, que no hace al caso
comentar aquı́. (Ver [Ham], p. 111 y ss., donde se explica cómo la axiomática de Zermelo-Fraenkel
resuelve estas paradojas; otra solución, la axiomática de von Neumann-Bernays-Gödel, se apunta
en [S-T], cap. 13, p. 252 y ss.)
Los elementos de un conjunto determinan el conjunto. Precisemos esta idea.
Criterio de igualdad de conjuntos. Dos conjuntos A y B son iguales si y sólo si constan de
los mismos elementos, es decir:
(1) para cada x ∈ A también x ∈ B;
(2) para cada x ∈ B también x ∈ A.
Un conjunto muy particular es el conjunto vacı́o, que no posee ningún elemento. Se representa
por el sı́mbolo ∅.
Los conjuntos con un solo elemento suelen denominarse conjuntos unipuntuales (o también
‘singuletes’, por la denominación inglesa ‘singletons’).

Definición 1.1.1. Dados dos conjuntos A y B, diremos que A es un subconjunto de B si cada


elemento de A es también elemento de B, es decir, si x ∈ A implica x ∈ B.

Para indicar que A es un subconjunto de B escribiremos A ⊆ B. También se lee hh A está con-


tenido en B ii.
¡Atención! Algunos libros usan la notación A ⊂ B para indicar que A está contenido en B,
mientras que en otros A ⊂ B significa que hh A está contenido en B y es distinto de B ii. Para evitar
confusiones, en este último caso nosotros pondremos A ⊂ 6=
B, leı́do hh A contenido estrictamente en
B ii.
El criterio de igualdad de conjuntos puede reformularse en términos de subconjuntos de manera
obvia.

Corolario 1.1.2. Dos conjuntos A y B son iguales si y sólo si A ⊆ B y B ⊆ A.

Ejemplos. Para cualquier conjunto A, trivialmente A ⊆ A y ∅ ⊆ A. Que x ∈ A es equivalente a


que {x} ⊆ A (¡pero, en general, no a x ⊆ A ni a {x} ∈ A!). Veremos ejemplos más interesantes en
ejercicios posteriores.

Definición 1.1.3. Dado un conjunto A, el conjunto

℘(A) = {S : S ⊆ A}

cuyos elementos son justamente los subconjuntos de A se denomina conjunto potencia de A o


conjunto de partes de A.

Ejercicios
1.1. Sea A = {2n + 1 : n ∈ N}. Decir si las siguientes afirmaciones son ciertas o falsas, justificando
la respuesta:

(i) si x = (2n + 1)2 para algún n ∈ N, entonces x ∈ A.

(ii) si x ∈ A, entonces x = (2n + 1)2 para algún n ∈ N.


16 CAPÍTULO 1. CONJUNTOS

(iii) si existen y ∈ A, z ∈ A tales que x = yz, entonces x ∈ A.

(iv) si x ∈ A, entonces existen y ∈ A, z ∈ A tales que x = yz.

1.2. Probar que {a} = {b, c} si y sólo si a = b = c.


1.3. Probar que {{a}, {a, b}} = {{c}, {c, d}} si y sólo si a = c y b = d.
1.4. ¿Cuáles de los conjuntos A = {x ∈ R : x2 = 1}, B = {x ∈ R : x4 = 1}, C = {x ∈ C : x2 = 1},
D = {x ∈ C : x4 = 1} son iguales y cuáles son distintos? ¿Por qué? ¿Cuáles son subconjuntos de
otros?
1.5. Demostrar las siguientes igualdades entre conjuntos:

(i) {x ∈ R : x3 − x > 0} = {x ∈ R : −1 < x < 0 o x > 1}.

(ii) {(x, y, z) ∈ R3 : x = y, x + y + z = 1}
= {(x, y, z) ∈ R3 : x = t/2, y = t/2, z = 1 − t para algún t ∈ R}.

1.6. Dados tres conjuntos A, B, C, si A ⊆ B y B ⊆ C entonces A ⊆ C.


1.7. ¿Es cierto que A ⊆ B si y sólo si ℘(A) ⊆ ℘(B)? ¿Por qué?
1.8. Sea A0 = ∅, An = ℘(An−1 ), n ∈ N. Describir explı́citamente A1 , A2 , A3 , A4 . ¿Cuántos
elementos tiene cada uno de estos conjuntos? ¿Cuántos elementos crees que tendrá An para un n
arbitrario?

1.1.2. Operaciones con conjuntos: unión, intersección, complemento.


Definición 1.1.4. Dados dos conjuntos A y B, su unión es el conjunto

A ∪ B = {x : x ∈ A o x ∈ B},

formado por los elementos que pertenecen al menos a uno de los dos conjuntos (pueden pertenecer
a los dos).
La intersección de A y B es el conjunto

A ∩ B = {x : x ∈ A y x ∈ B},

formado por los elementos que pertenecen simultáneamente a ambos conjuntos.


Si A ∩ B = ∅, diremos que A es disjunto con B (y entonces también B es disjunto con A).
El complementario de B respecto de A es el conjunto

A \ B = {x : x ∈ A y x ∈
/ B},

formado por los elementos de A que no pertenecen a B. Se le denomina también la diferencia


entre A y B.

Cuando todos los conjuntos que se manejan son subconjuntos de un conjunto X dado explı́ci-
tamente o inequı́vocamente sobreentendido, se pone Ac en vez de X \ A, abreviando hh el comple-
mentario de A respecto de X ii por el complementario de A, sin más.

Diagramas de Venn. Las operaciones con conjuntos permiten realizar “cálculos” que se intuyen
mejor utilizando diagramas de Venn , que consisten en dibujar en el plano regiones, limitadas por
circunferencias o curvas adecuadas, que representan a los conjuntos. Por ejemplo, en los diagramas
1.1. CONJUNTOS. 17

hemos representado dos conjuntos A y B como las regiones limitadas por una elipse grande y una
circunferencia pequeña. Las zonas rayadas representan, sucesivamente, A, B, A ∪ B, A ∩ B, A \ B.
Los “cálculos” con conjuntos comparten algunas reglas (¡no todas!) con las operaciones entre
números.
Proposición 1.1.5. Dados tres conjuntos cualesquiera A, B y C, se tienen las siguientes igualda-
des:
(i) (A ∪ B) ∪ C = A ∪ (B ∪ C).

(ii) (A ∩ B) ∩ C = A ∩ (B ∩ C).

(iii) A ∩ (B ∪ C) = (A ∩ B) ∪ (A ∩ C).

(iv) A ∪ (B ∩ C) = (A ∪ B) ∩ (A ∪ C).
Demostración. Ver [D-H], pp. 10-11.

Proposición 1.1.6. Leyes de De Morgan. Sean A, B, subconjuntos de un conjunto X. Entonces

(i) (A ∪ B)c = Ac ∩ B c .

(ii) (A ∩ B)c = Ac ∪ B c .

Demostración. Ejercicio.

Las definiciones de unión e intersección de dos conjuntos pueden ampliarse a una colección
arbitraria de conjuntos.
Definición 1.1.7. Sea C una colección no vacı́a de conjuntos (un conjunto no vacı́o cuyos elementos
son a su vez conjuntos). La unión de C es el conjunto
[ [
C= A = {x : x ∈ A para algún A ∈ C},
A∈C

formado por los elementos x que pertenecen a uno al menos de los conjuntos de C.
La intersección de C es el conjunto
\ \
C= A = {x : x ∈ A para todos A ∈ C},
A∈C

formado por los elementos x que pertenecen a todos los conjuntos de C.


En particular, cuando C = {A, B} reencontramos las definiciones de A ∪ B y A ∩ B.
En el caso de que sea C = {A1 , A2 , . . . , Ak }, se emplea la notación
k
[ k
\
An , An ,
n=1 n=1
18 CAPÍTULO 1. CONJUNTOS

S T
en vez de C, C, respectivamente. Ası́ mismo, cuando C = {An : n ∈ N}, suele emplearse
[ \
An , An ,
n∈ N n∈ N

o alguna otra notación similar.


En ocasiones se manejan ‘conjuntos de ı́ndices’ cualesquiera, no solamente N: por ejemplo,
C = {Ax : x ∈ R}, donde Ax = (−∞, x) = {y ∈ R : y < x}.
En general, si I es un conjunto no vacı́o arbitrario, y para cada i ∈ I tenemos dado un cierto
conjunto Ai , podemos considerar C = {Ai : i ∈ I} y definir
[ [ [ \ \ \
Ai = C = {Ai : i ∈ I}, Ai = C = {Ai : i ∈ I},
i∈I i∈I

de manera que resultará


[
Ai = {x : x ∈ Ai para algún ı́ndice i ∈ I}, (1.1)
i∈I
\
Ai = {x : x ∈ Ai para todos ı́ndices i ∈ I}. (1.2)
i∈I

Cuando C viene dado de este modo, diremos que se trata de una familia de conjuntos
parametrizada por I o con conjunto de ı́ndices I. Daremos una definición más ‘formal’
posteriormente.

Proposición 1.1.8. Leyes de De Morgan. Dado un conjunto X, sea C = {Ai : i ∈ I} una


familia de subconjuntos de X [es decir, C ⊆ ℘(X)] con conjunto de ı́ndices I. Entonces
c T
= i∈I Aci .
S
(1) i∈I Ai
c S
= i∈I Aci .
T
(2) i∈I Ai

Demostración. Ejercicio.

Ejercicios
2.1. Sea A un subconjunto de un conjunto dado X. Comprobar que (Ac )c = A.
2.2. Probar que dados dos subconjuntos A, B de un conjunto X, entonces X \ A = B si y sólo si
A ∪ B = X, A ∩ B = ∅.
2.3. Dados dos conjuntos A, B, demostrar que:
(1) A ⊆ B si y sólo si A ∪ B = B.
(2) A ⊆ B si y sólo si A ∩ B = A.
(3) A ⊆ B si y sólo si A \ B = ∅.
2.4. Sean A, B, C, D conjuntos tales que A ⊆ B y C ⊆ D. Probar que A ∪ C ⊆ B ∪ D y
A ∩ C ⊆ B ∩ D.
2.5. Dado un conjunto X, sean A, B, C ⊆ X.
(1) Probar que A \ B = A ∩ B c .
(2) Aplicando lo anterior y las leyes de De Morgan, dar otra expresión de A \ (B \ C).
(3) ¿Es lo mismo A \ (B \ C) que (A \ B) \ C? ¿Por qué?
2.6. Dados dos conjuntos A, B, probar que (A \ B) ∪ (B \ A) = (A ∪ B) \ (A ∩ B) (este conjunto
se denomina diferencia simétrica o discrepancia de A y B.)
1.2. PARES ORDENADOS. PRODUCTO CARTESIANO DE CONJUNTOS. 19

2.7. Sea A0 = ∅, An = An−1 ∪ {An−1 }, n ∈ N. Describir explı́citamente A1 , A2 , A3 , A4 . ¿Cuántos


elementos tiene cada uno de estos conjuntos? ¿Cuántos elementos crees que tendrá An para un n
arbitrario? ¿Cómo probarı́as tu conjetura?
2.8. Sea A1 un conjunto arbitrario, y definamos An+1 = ℘(An ), n ∈ N, A = n An . ¿Es cierto que
S
B ⊆ A si y sólo si ℘(B) ∈ A?
2.9. Para cada k ∈ N, sea Ak = {n ∈ Z : n ≥ k}. Comprobar que

A1 ⊇ A2 ⊇ . . . ⊇ Ak ⊇ Ak+1 ⊇ . . .

y, por tanto, kn=1TAn = Ak 6= ∅ cualquiera que sea k ∈ N.


T
Sin embargo, n∈ An = ∅.N

   
1 1
2.10. Para cada n ∈ N, sea An = 0, 1 − n , Bn = 0, 1 − n . Comprobar que An está estricta-
2 3
mente contenido en Bn para todo n. ¿Está la unión de los An estrictamente contenida en la unión
de los Bn ? S S
(No: probar que n∈ An = n∈ Bn = [0, 1).)
N N

1.2. Pares ordenados. Producto cartesiano de conjuntos.


El lector ha manejado ya pares ordenados en situaciones concretas: al introducir un sistema de
coordenadas en el plano, por ejemplo, cada punto viene representado por un par ordenado (x, y)
de números reales. La diferencia esencial entre el par ‘ordenado’ (x, y) y el conjunto {x, y} (el ‘par
sin ordenar’) es que distinguimos (x, y) de (y, x), considerando iguales dos pares (x, y) y (u, v)
si y sólo si x = u, y = v. Ampliando esta idea, podemos considerar pares ordenados (a, b) cuyo
primer elemento a pertenezca a un conjunto cualquiera A y su segundo elemento b pertenezca a un
conjunto cualquiera B, manteniendo su ‘propiedad caracterı́stica’:
Criterio de igualdad de pares ordenados. Dados dos conjuntos arbitrarios A, B, y dos pares
ordenados (a, b), (a0 , b0 ), con a, a0 ∈ A, b, b0 ∈ B, es
(a, b) = (a0 , b0 ) si y sólo si a = a0 y b = b0 .
(Como curiosidad, señalemos que es posible dar una definición de par ordenado en términos de
conjuntos.2 )
Definición 1.2.1. El producto cartesiano de dos conjuntos A y B es el conjunto

A × B = {(a, b) : a ∈ A, b ∈ B}

formado por todos los pares ordenados cuyo primer elemento está en A y el segundo en B.
Ejemplos. El conjunto de las coordenadas de los puntos del plano es R × R. Pero quizá el primer
producto cartesiano de su vida (de un conjunto de letras por un conjunto de números) lo haya
manejado el lector en el ‘juego de los barcos’. (Más ejemplos en [G-H], cap. 3.)
Ejercicio. Dados tres conjuntos A, B, C, probar que
(i) A × (B ∪ C) = (A × B) ∪ (A × C).

(ii) A × (B ∩ C) = (A × B) ∩ (A × C).

(iii) A × (B \ C) = (A × B) \ (A × C).
2
Concretamente, Kuratowski dio la siguiente definición formal:
(a, b) = {{a}, {a, b}}.
Si se revisa el ejercicio 1.3, se verá cómo esta definición encaja adecuadamente con la idea intuitiva.
20 CAPÍTULO 1. CONJUNTOS

1.3. Correspondencias y aplicaciones entre conjuntos


1.3.1. Comentarios previos: Ideas intuitivas y ejemplos.
¿Cuántas matemáticas hay en una guı́a telefónica? Más de las que parece. Contiene un conjunto
de números (de teléfono), por supuesto, y un conjunto de nombres de usuarios (personas, institu-
ciones, empresas, etc.). Pero lo más interesante es que cada número aparece asociado al nombre del
abonado; es decir, la guı́a es una ‘herramienta’ que permite establecer una correspondencia entre
el conjunto de los nombres de los abonados y el conjunto de los números de teléfonos de la red,
haciendo corresponder a cada nombre su número (o sus números) de teléfono.
¿Cuál es el interés matemático de esta observación? Una de las grandes lı́neas de progreso de
las Matemáticas consiste en descubrir patrones generales que engloben la mayor cantidad posible
de conceptos y situaciones particulares aparentemente distintas, proporcionando un marco teórico
fructı́fero para su estudio unificado. Pues bien: hay multitud de situaciones heterogéneas que respo-
den al patrón que acabamos de considerar, es decir, que pueden describirse como correspondencias
entre conjuntos. Veamos algunas muestras:
— la asignación del NIP hace corresponder a cada alumno de la Universidad de Zaragoza su Número
de Identificación Personal;
— en las tablas de datos recogidos en un experimento, se empareja cada valor de una ‘variable
independiente’ que vamos modificando a voluntad (por ejemplo, el tiempo), con el que alcanza una
‘variable dependiente’ ligada a la anterior (por ejemplo, la distancia recorrida durante ese tiempo
por una bola que se desplaza sobre un plano inclinado);
−−→
— una traslación por un vector ~v hace corresponder a cada punto P el punto Q tal que P Q = ~v ;
— un giro de centro C y ángulo α ‘transforma’ un punto P del plano en el punto Q tal que los
−−→ −−→
vectores CP , CQ tienen el mismo módulo y forman entre sı́ un ángulo α;
— un mapa es una representación de un trozo de la superficie terrestre que hace corresponder a
cada punto de ella un punto del mapa;
— una función como la raı́z cuadrada (real), por ejemplo, hace corresponder a cada número real
no negativo a otro número real no negativo b cuyo cuadrado b2 es a;
— la relación de paternidad entre personas empareja una persona P con otra persona Q si y sólo
si P es el padre de Q;
— la relación de orden ≤ entre números reales empareja un número real dado a con cada número
real b tal que a ≤ b;
— ciertos programas informáticos (‘procedures’, ‘functions’) asocian a cada input admisible de un
determinado tipo de datos, un output del mismo tipo o de otro tipo distinto.
En todos los casos disponemos de un conjunto A del que tomar los objetos (alumnos, números,
puntos, etc.) a los que ‘se hace corresponder’ elementos de un conjunto B (números, etc.) ‘me-
diante un criterio determinado’. Para dar una definición matemáticamente satisfactoria, habrá que
concretar mejor lo que queremos decir con ‘hacer corresponder mediante un criterio determinado’.
Y aquı́ viene en nuestra ayuda el concepto de par ordenado, puesto que, en definitiva, lo que
hacemos, eliminando detalles accesorios, es “emparejar cada elemento x de A con cierto (o ciertos)
elementos y de B” y “no emparejarlo” con otros: es decir, dentro del conjunto A × B de pares
ordenados con primer elemento en A y segundo elemento en B, seleccionamos un subconjunto G
de manera que a un x ∈ A corresponda un y ∈ B si y sólo si (x, y) ∈ G. Por ejemplo, en el caso del
NIP, el conjunto A es el de los alumnos de la Universidad de Zaragoza, B puede ser el conjunto de
los números naturales y G = {(x, y) ∈ A × B : y es el NIP de x}; en la traslación por un vector ~v ,
−−→
A es el conjunto de los puntos del espacio, B también (B = A), y G = {(P, Q) ∈ A × B : P Q = ~v };
en la relación de orden entre números reales, A = B = R, G = {(x, y) ∈ R × R : x ≤ y}, etc.
Como se ve, la noción de correspondencia entre conjuntos, dada por un primer conjunto A,
un segundo conjunto B y un subconjunto G de A × B, es muy general, casi ‘demasiado’ general.
Enseguida se advierten diferencias entre las distintas correspondencias que hemos examinado. En
1.3. CORRESPONDENCIAS Y APLICACIONES 21

algunas de ellas, un mismo elemento del conjunto A está en correspondencia con más de un elemento
de B, por lo que podrı́amos decir que, en cierto modo, son correspondencias ‘ambiguas’ o ‘poco
ajustadas’: ¿cuál es ‘el’ número de teléfono de un abonado que tenga más de un teléfono? ¿cómo
pensar que una variable fı́sica y ‘depende’ de otra variable fı́sica x si a un mismo valor de x le
pueden corresponder varios valores distintos de y?
En una correspondencia entre dos conjuntos A y B que evite esa ‘ambigüedad’, cada elemento
de A tendrá asociado un solo elemento de B; cuando esto suceda, diremos que la correspondencia
es una aplicación. En otras palabras, una aplicación de un conjunto A en un conjunto B es una
terna formada por A, B, y un subconjunto G de A × B que cumple la siguiente condición:
para cada x ∈ A hay un y ∈ B, y sólo uno, tal que (x, y) ∈ G. (∗)
Dicho de otro modo, han de cumplirse dos cosas: (1) a cada x ∈ A, sin excepción, le corresponde
un elemento y ∈ B tal que (x, y) ∈ G, (2) pero uno nada más.
El modelo paradigmático de aplicaciones son las funciones, que no son otra cosa que las aplica-
ciones entre conjuntos de números. Buena parte de la nomenclatura y notaciones que usaremos en
el estudio de las aplicaciones está copiada de las que tradicionalmente empleamos para funciones.
Por ejemplo, indicaremos que f es una aplicación entre un conjunto A y un conjunto B poniendo
f : A → B, llamaremos a G la gráfica de f , y en vez de decir que a un x ∈ A le corresponde un
y ∈ B mediante la aplicación f , diremos que y es el valor de f en x, escrito y = f (x). Con esta
notación, la condición (∗) que caracteriza a las correspondencias que son aplicaciones se expresa a
veces poniendo que
— f (x) está definido cuando y sólo cuando x ∈ A,
— si x1 , x2 ∈ A son tales que x1 = x2 , forzosamente f (x1 ) = f (x2 ).
(Suele decirse que f está bien definida en A para indicar abreviadamente que se cumplen estas dos
condiciones.)
Las transformaciones geométricas también son ejemplos de aplicaciones, y proporcionan otra
manera de interpretar lo que hace una aplicación: una traslación transforma o “convierte” un punto
en su trasladado, etc. La idea de transformación o conversión aparece también en contextos no
geométricos, donde se tienen procesos que pueden representarse mediante un esquema denominado
‘de caja negra’,
entrada caja salida
−→ negra −→
en el que introducimos una ‘entrada admisible’ en la caja negra y obtenemos (sin que nos importe
cómo) una ‘salida’: la ‘caja negra’ puede ser una transformación geométrica o una función o una
tabla, pero también puede ser un amplificador, por el que entra una onda y da como respuesta
otra onda, o puede ser la cuerda de un instrumento musical, que producirá al pulsarla, golpearla
o frotarla un sonido diferente según sea su longitud, o . . . (el lector puede inventar sus propios
ejemplos). Lo sustancial es la existencia de un conjunto predeterminado de entradas admisibles, y
de un emparejamiento de cada uno de ellos con una salida bien definida, perteneciente al mismo o
a otro conjunto.
Esta interpretación de las aplicaciones tiene su incidencia en el lenguaje: nos referiremos indis-
tintamente a f (x) como el valor de f en x o como la imagen de x por f .
Por supuesto, hay correspondencias que no son aplicaciones: la correspondencia entre el nombre
de una persona y la persona NO es una aplicación (y por eso en el DNI es necesario añadir el número
si queremos identificarla); en cambio, SÍ es una aplicación la correspondencia entre la persona y su
nombre ‘auténtico’.
La noción general de aplicación juega un papel unificador entre las diferentes variantes de la
misma que están presentes en todas partes de las Matemáticas: además de las funciones y de las
transformaciones geométricas, encontramos las aplicaciones lineales en Álgebra lineal, las aplica-
ciones continuas en Topologı́a, los homomorfismos en Álgebra abstracta, las variables aleatorias en
Probabilidad, etc. De las propiedades comunes a todas ellas nos ocupamos a continuación.
22 CAPÍTULO 1. CONJUNTOS

1.3.2. Aplicaciones: dominio, codominio, gráfica.


En términos conjuntistas,

Definición 1.3.1. Una correspondencia entre dos conjuntos A y B es una terna (A, B, G)
formada por el conjunto A, el conjunto B y un subconjunto G del producto cartesiano A × B.

Definición 1.3.2. Una aplicación f : A → B es una terna (A, B, Gf ), donde A, B son conjuntos
dados, llamados respectivamente el dominio o conjunto inicial y el codominio o conjunto
final de f , y Gf , denominado gráfico o gráfica de f , es un subconjunto del producto cartesiano
A × B tal que para todo x ∈ A existe un elemento único y ∈ B de modo que (x, y) ∈ Gf .

El elemento y unı́vocamente asociado a x suele denotarse por f (x) y se llama valor de la


aplicación f en el punto x o imagen de x por f .
En lo sucesivo, pondremos como es costumbre y = f (x) en vez de (x, y) ∈ Gf .
Informalmente, dar una aplicación f supone dar:

su dominio de definición A = dom f ;

su codominio B;

una regla de correspondencia o regla de definición que permita asignar inequı́vocamente a


cada elemento x de A, sin excepción, un elemento f (x) de B perfectamente determinado por
x y f.

Cambiar una cualquiera de estas tres cosas (el dominio, el conjunto final o la “regla de de-
finición”) hace que la aplicación cambie. Por ejemplo, si tenemos una aplicación f : A → B y
consideramos un subconjunto S de A, la restricción de f a S es la aplicación f |S : S → B tal
que f |S (x) = f (x) para cada x ∈ S, que no es la misma aplicación f (se ha cambiado el dominio),
aunque venga dada por “la misma regla de correspondencia” (a cada x de S, la restricción f |S hace
corresponder el mismo valor que f ¡pero f |S (x) no está definida para x ∈ / S!).
Como acabamos de ver, en la práctica raras veces se muestra una aplicación como una terna,
tal como requerirı́a su definición formal: lo habitual es especificar su dominio, su codominio y la
regla que permite determinar el valor de la aplicación en cada elemento del dominio.
Suele chocar al principiante que a veces la regla de definición de una aplicación aparece dividida
en varias subreglas parciales (expresadas frecuentemente, cuando intervienen conjuntos numéricos,
mediante fórmulas), tendiendo a interpretar incorrectamente que se han definido tantas aplicaciones
cuantas subreglas se enuncien. Por ejemplo, la aplicación f : R → R tal que
(
x, si x ≥ 0;
f (x) =
−x, si x < 0,

es una sola aplicación, la función valor absoluto, y no dos funciones, aunque sus valores coincidan
en parte de su dominio (¡no en todo!) con los que toman las dos aplicaciones distintas g : x ∈ R →
g(x) = x ∈ R y h : x ∈ R → h(x) = −x ∈ R.
En resumen:
Criterio de igualdad de aplicaciones. Dos aplicaciones f : A → B, g : C → D son iguales si
y sólo si

1. A = C (f y g tienen el mismo dominio);

2. B = D (f y g tienen el mismo conjunto de llegada);

3. para todo x ∈ A(= C), f (x) = g(x) (f y g toman el mismo valor en cada elemento de su
dominio común)
1.3. CORRESPONDENCIAS Y APLICACIONES 23

Ejercicio. Estudiar si son o no iguales las aplicaciones f : R → R, g : R → R dadas por

f (x) = 2x; g(x) = |x − 1| + |x + 1|.

¿Cambia la respuesta si comparamos las restricciones de f y g al intervalo [1, +∞)? ¿Y comparando


las restricciones a otros subconjuntos de R?
Ejercicio. Sea A = (0, +∞) = {x ∈ R : x > 0} y B = R. ¿Queda definida una aplicación
f : A → B si para cada x ∈ A ponemos

f (x) = log(log(sen x))?

¿Por qué?
Ejercicio. ¿En qué condiciones la correspondencia que asocia cada punto de una transparencia
con su proyección en la pantalla es una aplicación entre la transparencia y la pantalla?

1.3.3. Imagen y antiimagen de un conjunto.


La idea visual del ejercicio anterior se acomoda perfectamente con la nomenclatura que vamos
a introducir a continuación.

Definición 1.3.3. Sea f : A → B una aplicación y sean S ⊆ A, T ⊆ B. Llamamos conjunto


imagen de S por f al conjunto

f (S) = {f (x) : x ∈ S} , o, más explı́citamente, f (S) = {y ∈ B : existe x ∈ S tal que y = f (x)},

y conjunto antiimagen de T por f al conjunto

f −1 (T ) = {x : f (x) ∈ T },

que será un subconjunto (eventualmente vacı́o) de A.


El conjunto imagen del dominio de f suele denominarse, simplemente, conjunto imagen de
f o rango de f , y se denota a veces im f o rang f ; por tanto, se tiene

im f = f (A) = f (dom f ) = {f (x) : x ∈ dom f } .

Proposición 1.3.4. Dada f : A → B, sean A1 , A2 ⊆ A, B1 , B2 ⊆ B. Entonces:

(i) si A1 ⊆ A2 , también f (A1 ) ⊆ f (A2 );

(ii) si B1 ⊆ B2 , también f −1 (B1 ) ⊆ f −1 (B2 ).

Demostración. Ejercicio.

Proposición 1.3.5. Dada f : A → B, sean A1 , A2 ⊆ A, B1 , B2 ⊆ B. Entonces:

(i) f (A1 ∪ A2 ) = f (A1 ) ∪ f (A2 ).

(ii) f (A1 ∩ A2 ) ⊆ f (A1 ) ∩ f (A2 ), pudiendo ser f (A1 ∩ A2 ) 6= f (A1 ) ∩ f (A2 ).

(iii) f −1 (B1 ∪ B2 ) = f −1 (B1 ) ∪ f −1 (B2 ).

(iv) f −1 (B1 ∩ B2 ) = f −1 (B1 ) ∩ f −1 (B2 ).


24 CAPÍTULO 1. CONJUNTOS

Demostración. Probaremos solamente (ii), dejando la demostración de (i), (iii), (iv) como ejercicio.
De acuerdo con las definiciones anteriores, será:

y ∈ f (A1 ∩ A2 ) ⇐⇒ existe x ∈ A1 ∩ A2 tal que f (x) = y; (1.3)


(
existe a ∈ A1 tal que f (a) = y,
y ∈ f (A1 ) ∩ f (A2 ) ⇐⇒ y ∈ f (A1 ) e y ∈ f (A2 ) ⇐⇒ (1.4)
existe b ∈ A2 tal que f (b) = y.

A su vez, (1.3) significa que existe un mismo x, que está tanto en A1 como en A2 , tal que f (x) = y.
Por tanto, comparando vemos que (1.3) =⇒ (1.4) sin más que tomar a = b = x. Ası́ pues,
y ∈ f (A1 ∩ A2 ) =⇒ y ∈ f (A1 ) ∩ f (A2 ), o lo que es lo mismo,

f (A1 ∩ A2 ) ⊆ f (A1 ) ∩ f (A2 ) como querı́amos probar.

Por contra, no está claro que funcione la implicación inversa, ya que (en principio al menos)
podrı́amos encontrar f (a) = y = f (b) sin que a = b.

' $
' $
A1
A a •X f ' B$
' X $
z y
XXXXX

c •P 
*

PP 
& %
P

 PPP y0
q •

b • & %
&
A2 %
& %

¿Tenemos algún contraejemplo sencillo a (1.4) =⇒ (1.3)? Sı́: cualquier aplicación que tenga al
menos dos elementos a 6= b para los que f (a) = f (b); tomando A1 = {a}, A2 = {b}, es A1 ∩ A2 = ∅,
f (A1 ∩ A2 ) = ∅, f (A1 ) = {f (a)} = {f (b)} = f (A2 ), por lo que

f (A1 ) ∩ f (A2 ) = {f (a)} 6⊆ ∅ = f (A1 ∩ A2 ).

Si queremos dar ejemplos concretos, f puede ser una aplicación constante en un conjunto con más
de un elemento, o puede ser f : x ∈ R → f (x) = x2 ∈ R, y entonces podrı́amos tomar incluso A1
y A2 con infinitos elementos e intersección no vacı́a: por ejemplo, A1 = (−∞, 1), A2 = (−1, +∞),
f (A1 ∩ A2 ) = f ((−1, 1)) = [0, 1), f (A1 ) ∩ f (A2 ) = [0, +∞).

Ejercicio. Con las notaciones de la proposición anterior, ¿qué relaciones hay entre f (A1 \ A2 ) y
f (A1 ) \ f (A2 )? ¿y entre f −1 (B1 \ B2 ) y f −1 (B1 ) \ f −1 (B2 )?

1.3.4. Aplicaciones inyectivas, suprayectivas, biyectivas.


Definición 1.3.6. Una aplicación f se dice inyectiva si elementos distintos de su dominio tienen
imágenes distintas: es decir, si dados x, y ∈ dom f , de x 6= y se sigue f (x) 6= f (y); o, equivalente-
mente, si dados x, y ∈ dom f , de f (x) = f (y) se sigue x = y.
Una aplicación f : A → B se dice suprayectiva si f (A) = B (si el conjunto final y el conjunto
imagen de f coinciden) ; dicho de otra forma, si cada elemento de B es imagen de algún (o algunos)
elemento(s) de A, o sea, si para todo b ∈ B existe al menos un a ∈ A tal que f (a) = b.
Una aplicación se dice biyectiva si es simultáneamente inyectiva y suprayectiva. Equivalente-
mente, si para todo b ∈ B existe un a ∈ A , y uno sólo, tal que f (a) = b.
1.3. CORRESPONDENCIAS Y APLICACIONES 25

Ejemplos. Para cualquier conjunto A, la aplicación identidad idA : x ∈ A → idA (x) = x ∈ A es


trivialmente biyectiva.
La aplicación f : N → N tal que f (x) = x2 para cada x ∈ N es inyectiva, pero no suprayectiva
(¿por qué?); sin embargo, la aplicación g : Z → Z dada por la misma fórmula no es inyectiva.
La aplicación E : R → R tal que F (x) = ex para cada x ∈ R es inyectiva pero no suprayectiva:
su conjunto imagen F (R) es el intervalo (0, +∞). Sı́ es suprayectiva (e inyectiva) la aplicación
G : R → (0, +∞) dada por G(x) = ex para x ∈ R.
Este último ejemplo ilustra la necesidad de prestar atención al codominio de la función: el cambio
realizado lleva de una aplicación que no es suprayectiva a otra que sı́ lo es. Además, nos da la pista
para transformar cualquier aplicación no suprayectiva en otra ‘casi igual’ que sea suprayectiva:
basta pasar de f : A → B a f˜ : A → f (A) dada por f˜(a) = f (a) para cada a ∈ A, ajustando
solamente el conjunto de llegada (f˜ es la suprayección asociada a f ; cuando f es inyectiva, f˜
es biyectiva, la biyección asociada a f ).

Proposición 1.3.7. Dada f : A → B, sean A1 , A2 ⊆ A. Si f es inyectiva, entonces:

f (A1 ∩ A2 ) = f (A1 ) ∩ f (A2 ).

Demostración. Como ya hemos visto, se verifica ciertamente que f (A1 ∩ A2 ) ⊆ f (A1 ) ∩ f (A2 ). Pero
la inyectividad de f da que también f (A1 ) ∩ f (A2 ) ⊆ f (A1 ∩ A2 ), puesto que y ∈ f (A1 ) ∩ f (A2 )
implica que existe a ∈ A1 tal que f (a) = y y que existe b ∈ A2 tal que f (b) = y, lo que por ser f
inyectiva obliga a que a = b, y por tanto a = b ∈ A1 ∩ A2 =⇒ y = f (a) ∈ f (A1 ∩ A2 ).
En consecuencia, f (A1 ∩ A2 ) = f (A1 ) ∩ f (A2 ) en este caso.

Releyendo atentamente las proposiciones y contraejemplos anteriores vemos que hemos conseguido real-
mente un resultado más preciso: la inyectividad de f es necesaria (contraejemplos previos) y suficiente (última
proposición) para que la igualdad de los conjuntos del enunciado se verifique sin excepciones.
Ejercicio. Con las notaciones de la proposición anterior, ¿afecta a las relaciones entre f (A1 \ A2 )
y f (A1 ) \ f (A2 ) que f sea inyectiva o suprayectiva? La misma pregunta para f −1 (B1 \ B2 ) y
f −1 (B1 ) \ f −1 (B2 ).

1.3.5. Más sobre familias de conjuntos


Podemos extender resultados anteriores si en vez de considerar sólo dos conjuntos consideramos
familias arbitrarias de conjuntos. Además, ahora podemos dar una definición más precisa y más
general de lo que es una familia parametrizada por un conjunto de ı́ndices I.

Definición 1.3.8. Sean A, I conjuntos arbitrarios. Diremos que (ai )i∈I es una familia de ele-
mentos de A con conjunto de ı́ndices I o parametrizada por I si hay una aplicación
f : I → A con f (i) = ai para cada i ∈ I.
Los elementos de A pueden ser a su vez conjuntos, y tenemos entonces una familia indexada
(o parametrizada) de conjuntos .

Realmente, en este “cambio de escritura” lo único que varı́a es el punto de vista: se destacan los
valores de la aplicación f , y se dejan la aplicación y los elementos del dominio en segundo plano.
Habı́amos introducido la unión y la intersección de una familia cualquiera de conjuntos en (1.1)
y (1.2), página 18. Veamos que sus imágenes y antiimágenes por una aplicación funcionan igual
que para dos conjuntos.

Proposición 1.3.9. Dada f : A → B, sea (Ai )i∈I una familia de subconjuntos de A, (Bi )i∈I una
familia de subconjuntos de B. Entonces:
S  S
(i) f i∈I Ai = i∈I f (Ai ).
26 CAPÍTULO 1. CONJUNTOS

T  T
(ii) f i∈I Ai ⊆ i∈I f (Ai ).
(iii) Si f es inyectiva, !
\ \
f Ai = f (Ai ).
i∈I i∈I
En caso contrario, el contenido del apartado anterior puede ser estricto.
(iv) f −1 −1 (B ).
S  S
i∈I Bi = i∈I f i

(v) f −1 −1 (B ).
T  T
i∈I Bi = i∈I f i

Demostración. Examinemos con detalle el caso más delicado, la imagen de la intersección (los
demás se dejan como ejercicios).
Según las definiciones,
!
\ \
f Ai = {f (x) : x ∈ Ai } = {f (x) : x ∈ Ai para todos ı́ndices i ∈ I},
i∈I i∈I

mientras que
\
f (Ai ) = {y : y ∈ f (Ai ) para todos ı́ndices i ∈ I}
i∈I
= {y : hay un x ∈ Ai tal que y = f (x), para todos ı́ndices i ∈ I}.

A simple vista, los dos conjuntos parecen iguales, pero hay una diferencia fundamental: leı́do
con todo cuidado, observamos que el primer conjunto consta de los elementos y de B que son de la
forma y = f (x) para un mismo x que está simultáneamente en todos los conjuntos Ai cualquiera
que sea i ∈ I, mientras que el segundo consta de los elementos y de B tales que para cada i ∈ I
hay un x ∈ Ai , posiblemente distinto para cada i, con y = f (x); empleando cuantificadores en vez
del lenguaje ordinario, expresemos de manera más clara la ‘pequeña’ diferencia: dado y ∈ B,
!
\
y∈f Ai si y sólo si ∃x ∈ A tal que y = f (x) y ∀i ∈ I, x ∈ Ai ;
i∈I
\
y∈ f (Ai ) si y sólo si ∀i ∈ I, ∃xi ∈ Ai tal que y = f (xi ).
i∈I

La conclusión entonces es que se verifica siempre el contenido de (ii).


¿Qué añade la condición de que f sea inyectiva? Que, desde el momento en que se verifique
) = f (xj ) con xi ∈ Ai , xj ∈ Aj , necesariamente xi = xj ; ahora sı́ podrı́amos asegurar que si
f (xiT
y ∈ i∈I f (Ai ), existe un solo x tal que x ∈ Ai e y = f (x), y los dos conjuntos son iguales.
Pero si suprimimos la inyectividad, ya hemos visto contraejemplos sencillos para familias {A1 , A2 }
de dos conjuntos.

1.3.6. Composición de aplicaciones.


Definición 1.3.10. Sean A, B, C conjuntos arbitrarios. Dadas dos aplicaciones f : A → B y
g : B → C, la composición de f y g, denotada g ◦ f , es la aplicación g ◦ f : A → C dada por
(g ◦ f )(x) = g (f (x))
para cada x ∈ A.
Nótese que, efectivamente, es una aplicación bien definida. En palabras poco precisas, podrı́amos
decir que es el resultado de hacer actuar primero a f y luego a g.
1.3. CORRESPONDENCIAS Y APLICACIONES 27

Gráficamente, podrı́amos reflejar la construcción de g ◦ f en el siguiente diagrama:

' $ ' $
A B C
f ' $g
s r z = g(y) = g(f (x))
sr 
x r y = f (x)

& %
& %
g◦f & %

Nota. En otros contextos, especialmente en Análisis matemático, se usa una definición más general
de la composición: dadas dos aplicaciones f : A → B y g : C → D, se define g ◦ f como la aplicación
con dominio
dom(g ◦ f ) = f −1 (C) = f −1 (dom g)

y codominio D dada por


(g ◦ f )(x) = g (f (x))

para cada x ∈ dom(g ◦ f ). Obsérvese que tales x son justamente aquellos elementos de A para los
que g (f (x)) “tiene sentido”.
x
Ejemplo. Si f : R → R está dada por f (x) = x2 y g : R → R por g(x) = √ , g◦f y f ◦g
x2 + 1
son las aplicaciones de R en R dadas respectivamente por

x2 x2
(g ◦ f )(x) = g(f (x)) = √ , (f ◦ g)(x) = f (g(x)) = ,
x4 + 1 x2 + 1

distintas. Hay que ser cuidadoso, por tanto, con el orden de escritura en la composición.

1.3.7. Inversa de una aplicación biyectiva. Inyectividad e inversa parcial.


Consideraciones previas

Una correspondencia entre un conjunto A y un conjunto B puede ser “leı́da al revés” para
obtener una correspondencia entre B y A. Por ejemplo, si A es un conjunto de mujeres, B el
conjunto de todos sus parientes femeninos, y a cada x ∈ A asociamos un y ∈ B si y sólo si x es hija
de y, la correspondencia inversa asociarı́a un y ∈ B con un x ∈ A si y sólo si y es la madre de x.
Este ejemplo pone de manifiesto que aún cuando la correspondencia inicial sea una aplicación,
no siempre la correspondencia inversa es también una aplicación: para y ∈ B, es posible que en A
encontremos más de una hija de y o, en el extremo contrario, puede que no haya en A ninguna hija
de y.
Vemos ası́ que, si queremos hablar de la aplicación inversa de una aplicación dada f : A → B
puede haber dificultades por partida doble: bien porque un elemento y de B aparezca como imagen
por f de más de un elemento de A (es decir, porque f no sea inyectiva), o bien porque algún y de
B no sea imagen por f de ningún elemento de A (es decir, porque f no sea suprayectiva).
Hace falta, pues, que f sea biyectiva, y en tal caso podemos construir la aplicación inversa, que
denotaremos por f −1 , con dominio B = codom f y codominio A = dom f , ‘deshaciendo’ la acción
de f , como mostramos en el siguiente esquema.
28 CAPÍTULO 1. CONJUNTOS

' $
B
A ' $
f
rb
-
Dado b ∈ B . . .

& %
& %
' $
B
A ' $
f
srb . . . como f es biyectiva, existe un a ∈ A y uno sólo
a×r tal que f (a) = b . . .
& %
& %
' $
B
A ' $
f
srb . . . y, por definición, f −1 (b) es este único a ∈ A.
a×r
}
f −1 & %
& %
Nótese cómo la construcción de la inversa está ligada a la resolución de ecuaciones: f −1 tiene sentido
(es decir, f es biyectiva) si y sólo si para cada b ∈ B la ecuación f (x) = b tiene solución única,
y justamente dicha solución es f −1 (b). Y viceversa: si una ecuación puede expresarse en la forma
f (x) = b (b dato, x incógnita) para una aplicación f que tiene una inversa conocida, la ecuación
tiene una y una sóla solución, que es x = f −1 (b).

Definiciones y propiedades
Definición 1.3.11 (aplicación inversa). Dada una aplicación biyectiva f : A → B, llamaremos
aplicación inversa de f a la aplicación f −1 : B → A tal que para cada b ∈ B, f −1 (b) es el único
elemento a ∈ A para el que f (a) = b.

En términos más formales, f −1 serı́a la aplicación dada por la terna (B, A, Gf −1 ), donde
Gf −1 = {(b, a) : (a, b) ∈ Gf }, y Gf es, por supuesto, la gráfica de f .
Que f −1 es una aplicación de B en A bien definida es consecuencia directa de la biyectividad
de f , porque para cualquier b ∈ B existirá al menos un elemento a ∈ A tal que b = f (a) por ser f
suprayectiva, y ese a es único por ser f inyectiva, con lo que cada elemento de B sin excepción se
corresponde con un elemento inequı́vocamente determinado de A.

Nota. En los textos de Análisis matemático suele hablarse de la aplicación inversa de cualquier
aplicación inyectiva, definiéndola como la aplicación f −1 : f (A) → A tal que f −1 (y) = x si y
sólo si f (x) = y. Obsérvese que, en cualquier caso, esta serı́a la aplicación inversa de la biyección
asociada a f , es decir, de la aplicación biyectiva f˜ : A → f (A) tal que f˜(x) = f (x).
Ejemplos.

(i) La función raı́z cuadrada no es la inversa de la aplicación f : x ∈ R → f (x) = x2 ∈ R,


sino de la aplicación g : x ∈ [0, +∞) → g(x) = x2 ∈ [0, +∞), que técnicamente es —ojo al
trabalenguas— la biyección asociada a la restricción de f a [0, +∞). En la práctica no hay
necesidad de ser tan riguroso con el lenguaje, siempre y cuando no se genere confusión. De
manera similar, la función logaritmo no es la inversa de la aplicación f : x ∈ R → f (x) =
ex ∈ R, sino de la aplicación g : x ∈ R → g(x) = ex ∈ (0, +∞).
1.3. CORRESPONDENCIAS Y APLICACIONES 29

(ii) Análogamente, la función arco seno no es la inversa de la aplicación f : x ∈ R → f (x) =


sen x ∈ R, sino de la aplicación g : x ∈ [−π/2, π/2] → g(x) = sen x ∈ [−1, 1].
Proposición 1.3.12. Dadas una aplicación f : A → B y una aplicación g, entonces f es biyectiva
y g es la inversa de f si y sólo si se cumplen las siguientes condiciones:
1. dom g = B y codom g = A, es decir, g : B → A;
2. g(f (a)) = a para todo a ∈ A, es decir, g ◦ f = idA ;
3. f (g(b)) = b para todo b ∈ B, es decir, f ◦ g = idB .
Demostración. =⇒
Hemos de probar que dadas una aplicación biyectiva f : A → B y la aplicación g = f −1 inversa de
f , han de cumplirse las condiciones 1, 2, 3.
De acuerdo con la definición previa, g = f −1 ha de tener dominio B y codominio A, es decir,
se cumple la condición 1.
Para ver que se cumple también 2, tomemos un a ∈ A arbitrario: f (a) será un cierto elemento
b de B, y g(b) = f −1 (b) será el único elemento de A cuya imagen por f sea b, es decir, el a de
partida. Por tanto
g(f (a)) = g(b) = a,
como querı́amos probar. En términos de composiciones, g ◦ f = idA (ambas son aplicaciones de A
en A que transforman cada a ∈ A en el mismo a).
Veamos ahora que es cierto 3. Para b ∈ B arbitrario, g(b) = f −1 (b) será el único elemento a ∈ A
cuya imagen por f sea b, es decir, aquél para el que tengamos f (a) = b. Entonces

f (g(b)) = f (a) = b,

y ası́ f ◦ g = idB puesto que ambas son aplicaciones de B en B que transforman cada b ∈ B en el
propio b.
⇐=
Recı́procamente, supongamos ahora que tenemos aplicaciones f : A → B y g que satisfacen las
condiciones 1,2,3. Veamos que f es biyectiva y que su inversa es g.
f es inyectiva.- Pues sean a1 , a2 ∈ A tales que f (a1 ) = f (a2 ). Entonces, aplicando 2,

a1 = g(f (a1 )) = g(f (a2 )) = a2 ,

y ası́ efectivamente f es inyectiva.


f es suprayectiva.- Pues sea b ∈ B cualquiera. ¿De qué elemento de A será imagen por f ?
Obviamente, de a = g(b) ∈ A, ya que por la elección de a resulta de 3 que

f (a) = f (g(b)) = b.

g es la inversa de f .- Como acabamos de probar, f es biyectiva, luego tiene aplicación inversa


f −1 . ¿Coinciden f −1 y g? Para ello han de tener el mismo dominio, el mismo codominio, y la
misma regla de correspondencia (es decir, tiene que ser f −1 (x) = g(x) para cada x del dominio).
Por definición de inversa, f −1 tiene dominio B y codominio A, igual que g según la condición 1;
y para cada b ∈ B, como f (g(b)) = b (condición 3), g(b) es el (único) elemento de A cuya imagen
por f es b, o sea, f −1 (b):
g(b) = f −1 (b) para cada b ∈ B,
y finalmente g = f −1 .
Cualitativamente, este resultado viene a decir que lo que hace una aplicación (biyectiva) lo
deshace su inversa. Además, como los papeles de f y g son intercambiables, se sigue que si f es
biyectiva y g es la inversa de f , también g es biyectiva y f es la inversa de g.
30 CAPÍTULO 1. CONJUNTOS

Ejercicio. Estudiar para qué valores de x ∈ R es


√ √
( x)2 = x; x2 = x;

sen(arc sen x) = x; arc sen(sen x) = x.


¿Cómo encajan los resultados obtenidos con los de la proposición anterior?
Ejercicio. Sea E un espacio vectorial de dimensión 2 sobre un cuerpo K, {~i, ~j} una base de E, y
a cada ~v ∈ E de la forma ~v = x~i + y ~j (x, y ∈ K) hagamos corresponder el vector w ~ = y ~i + x ~j.
Probar que esta correspondencia es una aplicación bien definida de E en E, que es biyectiva, y
hallar su inversa.
Si E es el plano real e ~i, ~j son vectores perpendiculares de módulo 1, ¿cuál serı́a la interpretación
geométrica de f ?
Concluimos esta sección probando un resultado que nos sirve de excusa para presentar uno de
los axiomas más controvertidos de la Teorı́a de conjuntos, el axioma de elección.
Proposición 1.3.13. Una aplicación f : A → B es suprayectiva si y sólo si existe una aplicación
g : B → A tal que f ◦ g = idB .
Demostración. ⇐=
Todo b ∈ B es imagen por f de algún elemento a ∈ A: en efecto, bastará tomar a = g(b) para
obtener f (a) = f (g(b)) = idB (b) = b.
=⇒
Para todo b ∈ B es f −1 ({b}) = {a ∈ A : f (a) = b} 6= ∅ por ser f suprayectiva. Dado, pues, b ∈ B,
elegimos un a ∈ f −1 ({b}) que denotamos g(b). Tenemos ası́ bien definida una aplicación g : B → A,
tal que para cada b ∈ B es f (g(b)) = b por la propia construcción de g, luego f ◦ g = idB para esta
aplicación g.

Nota importante: el Axioma de Elección. Esta “inocente” elección de un elemento deter-


minado en cada conjunto f −1 ({b}), b ∈ B, comporta más dificultades de las que parece (cf. [G-H],
pp. 96 y ss.). De hecho, en la Teorı́a axiomática de conjuntos se requiere un nuevo axioma para
llevar a cabo este proceso, el llamado AXIOMA DE ELECCIÓN (abreviado AC, Axiom of Choice
en inglés), una de cuyas múltiples formulaciones es:

Axioma de elección . Dada una familia {Ai : i ∈ I} de conjuntos no vacı́os disjuntos dos a
dos, existe un conjunto S que consiste exactamente en un elemento de cada Ai .

Por evidente que parezca este enunciado, se deducen de él (en Álgebra, en Análisis, en Topologı́a,
en . . . ) una serie de consecuencias tan sorprendentes que a su utilización por Zermelo en 1904
siguió una discusión que no se aplacó hasta los resultados de Gödel en 1940 y de Cohen en 1966.
Ver una excelente explicación en [C-H], pp. 241 y ss.; más conciso, [Ap], pp. 312–313 y [GJPR], pp.
66–67.
Buscando en Internet “Axiom of Choice” se obtiene una lista inacabable de referencias. Para
empezar, recomendamos [1], [2].

Ejercicios
3.1. Dados dos conjuntos X e Y , expresar como subconjuntos de X × Y las aplicaciones definidas
de la siguiente manera:
(1) la aplicación que hace corresponder a todos los x ∈ X un único punto b ∈ Y (la aplicación
constante con valor fijo b).
(2) supuesto X = Y , la aplicación que hace corresponder a cada x ∈ X el mismo x (la aplicación
identidad ).
1.3. CORRESPONDENCIAS Y APLICACIONES 31

(3) supuesto X ⊆ Y , la aplicación que hace corresponder a cada x ∈ X el mismo x (la aplicación
inclusión de X en Y ). ¿Es igual a la anterior?
(4) supuesto X = A × B, Y = A la aplicación que hace corresponder a cada (a, b) ∈ X su primera
componente a (la proyección sobre la primera componente ).
(5) supuesto X = A × B, Y = B la aplicación que hace corresponder a cada (a, b) ∈ X su segunda
componente b (la proyección sobre la segunda componente ).
3.2. Sean A y B conjuntos no vacı́os y f : A → B. Para cada una de las condiciones:
(T1) Para todo b ∈ B existe a ∈ A tal que f (a) = b;
(T2) existe a ∈ A tal que f (a) = b para todo b ∈ B;
(T3) para todo a ∈ A existe b ∈ B tal que f (a) = b;
(T4) existe b ∈ B tal que f (a) = b para todo a ∈ A;
(T5) para todo b ∈ B existe un único a ∈ A tal que f (a) = b;
(T6) para todo a ∈ A existe un único b ∈ B tal que f (a) = b;
(T7) para todos a1 , a2 ∈ A es f (a1 ) 6= f (a2 );
(T8) para todos a1 , a2 ∈ A, si f (a1 ) = f (a2 ) entonces a1 = a2 ;
(T9) para todos a1 , a2 ∈ A, si f (a1 ) 6= f (a2 ) entonces a1 6= a2 ,
explicar cuáles de las hipótesis siguientes las implican:
(H1) f es inyectiva;
(H2) f es suprayectiva;
(H3) f es biyectiva;
(H4) f es constante;
(H5) f es arbitraria;
(H8) ninguna f lo cumple;
(H7) el conjunto B de llegada verifica . . . (completar).
(Por ejemplo: (H2) =⇒ (T1) porque, según la definición, f es suprayectiva cuando etc.)
3.3. Sean f : A1 → B1 , g : A2 → B2 . Definamos h : A1 × A2 → B1 × B2 poniendo
h(x, y) = (f (x), g(y)) para cada (x, y) ∈ A1 ×A2 . Probar que h está bien definida. ¿Qué condiciones
sobre f y g permiten asegurar que h es inyectiva? ¿y que es suprayectiva? ¿y que es biyectiva?
3.4. Sean A ⊆ X y f : X → Y . Sea i : A → X la inclusión de A en X, definida por i(x) = x
para cada x ∈ A. Probar que

(i) f |A = f ◦ i;

(ii) si g = f |A , para cada B ⊆ Y es g −1 (B) = A ∩ f −1 (B).

3.5. Dada f : A → B, probar:


(1) para cada S ⊆ A, S ⊆ f −1 [f (S)]. ¿Qué condición sobre f garantizarı́a que f −1 [f (S)] = S?.
Dar un contraejemplo que pruebe que esta igualdad no es cierta en general.
(2) para cada S ⊆ A y T ⊆ B, f [f −1 (T ) ∩ S] = T ∩ f (S); en particular, f [f −1 (T )] = T ∩ f (A).
x
3.6. Sea f : x ∈ R → f (x) = √ . Calcular f ◦ f . En general, si se define por recurrencia
1 + x2
f1 = f y fn+1 = f ◦ fn , n ∈ N, calcular fn .
3.7. Para conjuntos A, B, C, D y aplicaciones f : A → B, g : B → C, h : C → D, probar que
h ◦ (g ◦ f ) = (h ◦ g) ◦ f .
3.8. Sean f : A → B, g : B → C biyectivas. Probar que g ◦ f : A → C es biyectiva y que
(g ◦ f )−1 = f −1 ◦ g −1 .
3.9. Sean f : A → B y g : B → A tales que g ◦ f = idA . Probar que entonces f es inyectiva y g es
suprayectiva.
32 CAPÍTULO 1. CONJUNTOS

1.4. Relaciones
Para las correspondencias entre un conjunto A y él mismo suele emplearse el nombre de re-
laciones. Una vez más, el cambio de nombre refleja un cambio (más psicológico que matemático)
en la manera de ‘percibir’ estas particulares correspondencias. Nos detendremos especialmente en
dos clases de relaciones: las relaciones de equivalencia, cuyo modelo de referencia es la relación de
igualdad entre los elementos de un conjunto, y las relaciones de orden, de las que ya es conocida al
menos la relación ≤ entre números reales. Pasemos a la definición formal.

Definición 1.4.1. Una relación binaria en un conjunto A es un subconjunto R del producto


cartesiano A × A de A por sı́ mismo.
En vez de (a, b) ∈ R , escribiremos a R b, leı́do hh a está relacionado con b en la relación R ii.

Ejemplos.
(1) Sea R el conjunto de las rectas del plano. Se define en R la relación de incidencia poniendo:
para dos rectas r, s ∈ R, es r R s cuando y sólo cuando r y s tienen algún punto común.
(Esta relación se expresa brevemente diciendo hh r corta a sii)
(2) En el mismo conjunto, se define la relación de paralelismo k poniendo:
para dos rectas r, s ∈ R, es rks cuando y sólo cuando r y s son paralelas,
es decir, o no tienen ningún punto común o coinciden.
(3) Sea C el conjunto de las circunferencias del plano. Se define en C la relación de tangencia
poniendo:
para dos circunferencias C1 , C2 ∈ C, es C1 R C2 cuando y sólo cuando C1 y C2 son tangentes.
(4) En N, se define la relación de divisibilidad | poniendo:
para m, n ∈ N, es m | n cuando y sólo cuando m divide a n (i.e., n es un múltiplo de m).
(5) Análogamente se define la relación de divisibilidad en Z.
(6) Dado un conjunto X, se define en ℘(X) la relación de inclusión ⊆ poniendo:
para A, B ∈ ℘(X), es A ⊆ B cuando y sólo cuando A es un subconjunto de B.
Las propiedades más interesantes de las relaciones se recogen en la siguiente definición.

Definición 1.4.2. Sea R una relación (binaria) en un conjunto A. Diremos que R es

• reflexiva si para todo a ∈ A es a R a;

• simétrica si siempre que para a, b ∈ A es a R b, también es b R a;

• antisimétrica si para a, b ∈ A, que sea simultáneamente a R b y b R a obliga a que a = b;

• transitiva si siempre que para a, b, c ∈ A es a R b y b R c, también es a R c.

Ejercicio. ¿Cuáles de estas propiedades, y cuáles no, tienen las relaciones que hemos definido
anteriormente?

1.4.1. Relaciones de equivalencia y particiones. Conjunto cociente.


Definición 1.4.3. Una relación de equivalencia en un conjunto A es una relación (binaria)
en A que tiene las propiedades reflexiva, simétrica y transitiva.

Ejemplos.
1.- El prototipo es la relación de igualdad en cualquier conjunto: a R b cuando a = b.
2.- La relación de paralelismo entre rectas es la única relación de equivalencia de las seis que
habı́amos definido en el apartado anterior.
1.4. RELACIONES 33

−−−→ −−→ −−−→ −−→ −−−→ −−→


3.- Dados dos vectores fijos del plano M N , P Q , pongamos M N ∼ P Q si y sólo si M N y P Q
tienen el mismo módulo, dirección y sentido (se dice entonces que son vectores equipolentes). La
relación de equipolencia ∼ es una relación de equivalencia.
4.- La relación entre fracciones equivalentes, como puede hacer sospechar su propio nombre, es una
relación de equivalencia. (Recordemos que dos fracciones m/n y p/q son equivalentes si mq = np.
Comentaremos esta relación más adelante, cuando hablemos de los números racionales.)
5.- Un importante ejemplo de relación de equivalencia, que estudiaremos con más detalle posterior-
mente, es la congruencia en Z módulo m: fijado m ∈ N con m ≥ 2, diremos que dos enteros a, b ∈ Z
son congruentes módulo m, en sı́mbolos a ≡ b (mód m), cuando m | (b − a) es decir, cuando
exista un k ∈ Z tal que b − a = km. Puesto que a − a = 0 · m, b − a = km implica a − b = (−k)m,
y de b − a = km, c − b = `m se sigue c − a = (c − b) + (b − a) = (` + k)m, vemos que esta relación
tiene efectivamente las propiedades reflexiva, simétrica y transitiva.
Las congruencias son hh las matemáticas del tiempoii: la esfera del reloj marca las horas módulo
12, los dı́as de la semana van según congruencias módulo 7, los meses módulo 12 (el decimotercer
mes vuelve a ser enero); pero también conocemos ejemplos de otro tipo: los cuentakilómetros de
los coches funcionan según congruencias módulo 100 000.
Como se indica en [D-H], “el interés de las relaciones de equivalencia está en el hecho de que cons-
tituyen una abstracción de los procesos ordinarios de clasificación”: permiten repartir el conjunto
en ‘bloques’ disjuntos, las llamadas clases de equivalencia. A su vez, cada uno de esos ‘bloques’
puede considerarse como elemento de un nuevo conjunto, el conjunto cociente, ‘igualando’ (no
distinguiendo entre) los diferentes componentes de un mismo bloque. Pasemos a explicar estos
aspectos.
Definición 1.4.4. Sea R una relación de equivalencia en un conjunto A. Dado a ∈ A, la clase
de equivalencia de a en la relación R es el conjunto

[a] = {b ∈ A : a R b}.

Cada b ∈ [a] se dice que es un representante de la clase [a].


El conjunto cuyos elementos son las clases de equivalencia de R es el conjunto cociente de
A por R , denotado por A/ R , con lo cual

A/ R = {[a] : a ∈ A},

y ası́ A/ R ⊆ ℘(A).
Notemos que siempre a ∈ [a], por la propiedad reflexiva de R .
Ejemplos. Examinemos cuáles son las clases de equivalencia en las relaciones que hemos visto
anteriormente.
1.- Si a R b cuándo y sólo cuando a = b, [a] consta del único elemento a, es decir, [a] = {a} en
este caso. El conjunto cociente es el conjunto de los subconjuntos unipuntuales de A (que no es lo
mismo que A, aunque casi lo parezca).
2.- En la relación de paralelismo, cada clase de equivalencia consta de una recta y todas sus paralelas
(es lo que se llama un haz de rectas paralelas), todas las que tienen ‘la misma dirección’. Hay, pues,
tantas clases de equivalencia como ‘direcciones’.
3.- Cada clase de vectores equipolentes es lo que se denomina un vector libre .
4.- Las clases de equivalencia de fracciones las forman las fracciones ‘que representan un mismo
número racional’. De hecho, un número racional es una clase de equivalencia de fracciones y el
conjunto Q de los números racionales es el conjunto cociente del conjunto de fracciones por esta
relación de equivalencia. (Ver capı́tulo 3.)
5.- En la relación de congruencia módulo m, para cada a ∈ Z es

[a] = a + mZ = {b ∈ Z : b = a + km para algún k ∈ Z}.


34 CAPÍTULO 1. CONJUNTOS

Estas clases de equivalencia suelen denominarse clases de restos módulo m, porque dos enteros a
y b están en la misma clase si y sólo si dan el mismo resto al ser divididos por m, es decir, si y sólo
si a = pm + r, b = qm + r para enteros adecuados p, q y r, con 0 ≤ r < m (comprobarlo). Para
m = 2, encontramos dos clases de equivalencia: el conjunto de los enteros pares y el conjunto de
los enteros impares.
En general, el conjunto cociente, que se denota por Zm , ¿cuántos elementos tiene? Tantos como
restos encontramos al dividir por m: 0, 1, . . . m − 1; es decir, m elementos.
6.- Un ejemplo más cotidiano: consideremos un conjunto de folios de papel de distintos colores
(perfectamente diferenciables), y digamos que dos folios son equivalentes si son de igual color.
Formar una clase de equivalencia es formar un conjunto (un ‘cuaderno’) con las hojas de un mismo
color. El conjunto cociente será un conjunto de cuadernos, cada uno de los cuales tiene sus hojas
de un determinado color, diferente del color de las hojas de los demás cuadernos.

Una relación de equivalencia permite ‘partir en trozos’ el conjunto, tomando cada clase de
equivalencia como uno de los trozos. Concretamente, se tiene:
Proposición 1.4.5. Sea R una relación de equivalencia en un conjunto no vacı́o A. Entonces
cada elemento de A está en una y sólo una de las clases de equivalencia definidas por R .
Para probarlo, nos apoyaremos en el siguiente
Lema 1.4.6. Sea R una relación de equivalencia en un conjunto no vacı́o A. Dados b, c ∈ A es
[b] = [c] si y sólo si b R c.
Demostración. Suponiendo [b] = [c], como c ∈ [c] = [b], se sigue que b R c.
Recı́procamente, sea b R c. Si x ∈ [b], serı́a b R x, que con c R b (propiedad simétrica de R )
darı́a c R x por transitividad, o sea, x ∈ [c]; y análogamente, de x ∈ [c] obtenemos c R x, que con
b R c da b R x y finalmente x ∈ [b].

Ahora podemos demostrar la proposición anterior.


Demostración de la proposición 1.4.5.
Obviamente, cada elemento de A está al menos en una clase de equivalencia: a ∈ [a] para cada
a ∈ A por ser R reflexiva. Y no puede estar en más de una: si a ∈ [b] y a ∈ [c], esto significarı́a que
b R a y c R a (por definición), luego a R c (propiedad simétrica de R ) y finalmente b R c (propiedad
transitiva), con lo que aplicando el lema [b] = [c].

La ‘descomposición en bloques’ de un conjunto se denomina partición del conjunto.


Definición 1.4.7. Una partición de un conjunto no vacı́o A es una colección C de subconjuntos
no vacı́os de A tal que cada x ∈ A pertenece a uno y uno sólo de los S ∈ C. En otras palabras, C
verifica que:

1. C ⊆ ℘(A) \ {∅}, S∈C S = A,


S

2. si S, T ∈ C y S 6= T , S ∩ T = ∅.

Puesto que cada clase de equivalencia [a] contiene al menos al elemento a, la proposición 1.4.5
nos dice que el conjunto cociente A/ R (el conjunto de clases de equivalencia) es una partición de
A. Que definir una relación de equivalencia o definir una partición es ‘prácticamente lo mismo’ se
prueba en el siguiente teorema.
Teorema 1.4.8. Sea R una relación de equivalencia en un conjunto no vacı́o A. Entonces, el
conjunto de las clases de equivalencia es una partición de A.
Recı́procamente, si C es una partición de A, existe una relación de equivalencia R (y una sola)
tal que las clases de eqivalencia de R son exactamente los conjuntos de la partición C.
1.4. RELACIONES 35

Demostración. Sólo falta probar el recı́proco.


Supongamos, pues, que tenemos una partición C de A. ‘Arrancando’ de C, hemos de llegar a
construir una relación de equivalencia R sobre A cuyas clases de equivalencia sean precisamente
los conjuntos S ⊆ A que forman la partición C. Revisando el lema 1.4.6, no es difı́cil pensar en la
relación siguiente:

• pondremos a R b para dos elementos a, b ∈ A, si y sólo si existe un S ∈ C tal que a ∈ S y b ∈ S.

¿Tenemos ası́ ciertamente una relación de equivalencia? Dado a ∈ A, como C es una partición,
existe S ∈ C tal que a ∈ S, luego a R a cualquiera que sea a y ası́ R es reflexiva. De la propia
definición se sigue que es simétrica. Para ver que es transitiva, observemos que si a R b existe un
S ∈ C tal que a ∈ S y b ∈ S, y si b R c existe un T ∈ C tal que b ∈ T y c ∈ T ; pero entonces
b ∈ S ∩ T , lo que por ser C una partición obliga a que S = T , deduciéndose que a, c ∈ S = T y
a R c.
¿Son las clases de equivalencia de R exactamente los S ∈ C? Es decir: ¿cada clase de equiva-
lencia de R está en C? ¿y cada S ∈ C es una clase de equivalencia de R ?
Notemos que dados a ∈ A, S ∈ C, se tiene

a ∈ S si y sólo si [a] = S.

En efecto, trivialmente a ∈ [a] siempre, luego si [a] = S, a ∈ [a] = S Recı́procamente, si a ∈ S,


todo b ∈ S cumple a R b y por tanto b ∈ [a]; y al revés, si b ∈ [a], según la definición de R existe
un T ∈ C tal que a, b ∈ T ; pero entonces a ∈ S ∩ T , luego S = T y b ∈ S.
En consecuencia:

Dado a ∈ A, es [a] ∈ C, pues como C es una partición de A, debe existir S ∈ C tal que a ∈ S,
y ası́ [a] = S.

Dado S ∈ C, S = [a] para algún a ∈ A, pues S es no vacı́o y habrá al menos un a ∈ S, con lo


cual S = [a] para este a.

Finalmente, si queremos comprobar que la relación R que hemos construido es la única que
tiene estas clases de equivalencia, basta aplicar el lema 1.4.6.

Ejemplos.

1. Sea A el conjunto de los números enteros pares y B el conjunto de los números enteros
impares. Entonces {A, B} es una partición de Z, y la relación de equivalencia que define es
la congruencia módulo 2.

2. Poniendo A = {x ∈ R : x > 0}, B = {0}, C = {x ∈ R : x < 0}, {A, B, C} es una partición de


R. Si R es la relación de equivalencia que define, es x R y si y sólo si x = y = 0 o x 6= 0 6= y
y x e y tienen el mismo signo.

Ejercicio. Comprúebese, para cada una de las relaciones de equivalencia que hemos encontrado,
que las clases forman una partición del correspondiente conjunto.

1.4.2. Relaciones de orden.


Definición 1.4.9. Una relación de orden en un conjunto A es una relación (binaria) en A que
tiene las propiedades reflexiva, antisimétrica y transitiva.

Ejemplos.
1.- El prototipo es la relación de orden en cualquier subconjunto de R: a R b cuando a ≤ b.
36 CAPÍTULO 1. CONJUNTOS

2.- En todo conjunto se puede definir una relación de orden trivial: la igualdad, a R b si y sólo si
a = b.
3.- Dado un conjunto X, la inclusión entre subconjuntos de X es una relación de orden en ℘(X).
4.- La relación de divisibilidad en N es una relación de orden, pero no lo es la divisibilidad en Z
(falla ‘por poco’ la propiedad antisimétrica).
5.- En C puede definirse el orden lexicográfico de la siguiente manera:
para z1 , z2 ∈ C, es z1 ≤ z2 cuando y sólo cuando <e z1 < <e z2 , o <e z1 = <e z2 y =m z1 ≤ =m z2 .
Es fácil comprobar que tiene las propiedades reflexiva, antisimétrica y transitiva. ¿Cuál es la
representación gráfica del conjunto {z ∈ C : 0 ≤ z}?
6.- Ası́ mismo, en C puede definirse el orden producto de la siguiente manera:
para z1 , z2 ∈ C, es z1 ≤ z2 cuando y sólo cuando <e z1 ≤ <e z2 y =m z1 ≤ =m z2 .
También tiene las propiedades reflexiva, antisimétrica y transitiva. ¿Cuál es ahora la represen-
tación gráfica del conjunto {z ∈ C : 0 ≤ z}?

Definición 1.4.10. Un conjunto ordenado es un conjunto A dotado de una relación de orden.

De una manera más formal, un conjunto ordenado serı́a un par (A, R ), donde A es un conjunto y
R una relación de orden en A. Por ejemplo, (N, ≤) y (N, | ) son dos conjuntos ordenados (distintos,
aunque tengan el mismo conjunto base).

Definición 1.4.11. Una relación de orden R en un conjunto A es un orden total si para todo
par a, b de elementos de A se tiene que o bien a R b o bien b R a; en caso contrario, R es un
orden parcial .

Ejercicio. Dar ejempos de órdenes totales y de órdenes parciales.


Diagramas de Hasse. Las relaciones de orden R en conjuntos finitos pequeños F se pueden
visualizar cómodamente mediante diagramas de Hasse , que consisten en un dibujo en el que los
elementos del conjunto están representados por puntos, colocados de manera que si x, y ∈ F son
tales que x R y, el punto que representa a x queda por debajo del punto que representa a y; además,
dos puntos del diagrama se unen mediante un segmento cuando y sólo cuando representan a elemen-
tos x, y ∈ F tales que x R y pero no existe z ∈ F tal que x R z, z R y (es decir, cuando la relación
entre x e y no puede deducirse por transitividad). Por ejemplo, si F = {2, 3, 4, 5, 6, 7, 8, 15, 30}, la
relación de divisibilidad | en F podrı́a reflejarse ası́:
s8 s 30
@ @

@s 4 6 s s 15
@ @
@@ @
@ @
@s @s @s s
2 3 5 7

Ejercicio. ¿Cómo se verı́a en un diagrama de Hasse que la relación representada es un orden total?

Elementos distinguidos en una relación de orden


Algunos conceptos que el lector conoce para el orden de R pueden definirse igualmente en un
conjunto ordenado arbitrario.

Definiciones 1.4.12. Sea A un conjunto ordenado, y denotemos por ≤ su relación de orden. Sea
S un subconjunto de A.
Si para algún a ∈ A es a ≤ s para todo s ∈ S, diremos que a es una cota inferior de S y que
S está acotado inferiormente (por a).
Si para algún b ∈ A fuese b ≥ s para todo s ∈ S, diremos que b es una cota superior de S y
que S está acotado superiormente (por b).
1.4. RELACIONES 37

Cuando S está acotado a la vez superior e inferiormente, se dice que S está acotado .
Un m ∈ A es mı́nimo de un conjunto S si pertenece al conjunto y es una cota inferior del
mismo. Es decir, si m ∈ S y m ≤ s para todo s ∈ S. Pondremos entonces m = mı́n S.
Un M ∈ A es máximo de un conjunto S si pertenece al conjunto y es una cota superior del
mismo. Es decir, si M ∈ S y M ≥ s para todo s ∈ S. Pondremos entonces M = máx S.
Un elemento a ∈ A es ı́nfimo de un conjunto S si es el máximo del conjunto de cotas inferiores
de S. Pondremos entonces a = inf S.
Nótese que si a = inf S, será a = mı́n S si y sólo si a ∈ S.
Un elemento b ∈ A es supremo de un conjunto S si es el mı́nimo del conjunto de cotas
superiores de S. Pondremos entonces b = sup S
Nótese que si b = sup S, será b = máx S si y sólo si a ∈ S.
Otros conceptos importantes en las relaciones de orden son los siguientes.
Definición 1.4.13. Dado un conjunto ordenado (A, ≤) y un subconjunto S de A, un elemento
x ∈ S se dice maximal si para cada a ∈ S tal que x ≤ a, debe ser x = a; un elemento y ∈ S se
dice minimal si para cada b ∈ S tal que b ≤ y, debe ser b = y.
En un conjunto ordenado puede no haber elementos maximales o minimales, igual que no
siempre hay máximos o mı́nimos (Ver [D-H], p. 13; [GJPR], p. 29). En el diagrama de Hasse que
hemos dibujado anteriormente, son elementos minimales el 2, el 3, el 5 y el 7; son elementos
maximales el 7, el 8 y el 30; no hay un elemento máximo ni un elemento mı́nimo, ni tampoco
supremo ni ı́nfimo.

Ejercicios
4.1. Dados dos conjuntos A y B, probar que A × B = ∅ si y sólo si A = ∅ o B = ∅.
4.2. Sean A y B dos conjuntos. Si A × B 6= ∅, probar que A × B ⊆ C × D cuando y sólo cuando
A ⊆ C y B ⊆ D. ¿Por qué hemos necesitado suponer A × B 6= ∅?
4.3. Sea R una relación en un conjunto A. ¿Es cierto que para todo a ∈ A hay al menos un b ∈ B
tal que a R b? ¿Por qué?
4.4. Para cada punto P del plano, el haz de rectas de vértice P es el conjunto de las rectas
que pasan por P . ¿Pueden ser los haces de rectas las clases de equivalencia de alguna relación de
equivalencia? ¿Por qué?
4.5. Sea R la relación definida en N × N de la siguiente manera:
dados dos pares (m, n), (p, q) ∈ N × N, es (m, n) R (p, q) cuando y sólo cuando m + q = p + n.
Estudiar si R es reflexiva, simétrica, antisimétrica, transitiva. ¿Es R una relación de equivalen-
cia? En caso afirmativo, ¿cuáles son las correspondientes clases de equivalencia? Representarlas
gráficamente en el plano.
4.6. Sea R una relación en un conjunto A y S un subconjunto de A. Consideremos en S la relación
R 0 definida por: a R 0 b para a, b ∈ S si y sólo si a R b (la restricción de R a S). Probar que si
R es un relación de equivalencia en A, R 0 es una relación de equivalencia en S; y que si R es una
relación de orden en A, R 0 es una relación de orden en S.
4.7. Sea A un conjunto cualquiera y R una relación de orden en A. Definimos la relación inversa
R−1 poniendo
para x, y ∈ A, es x R−1 y cuando y sólo cuando y R x.
−1
Probar que R es también una relación de orden en A (el llamado orden inverso de R).
Si R es un orden total, ¿es R−1 un orden total? ¿por qué?
4.8. Sea A un conjunto ordenado y S un subconjunto de A. Probar que si existe el máximo o el
mı́nimo de S, es único.
38 CAPÍTULO 1. CONJUNTOS

4.9. ¿Qué puede decirse sobre la unicidad de los elementos maximales o minimales en una relación
de orden según sea o no un orden total?
4.10. Sea S = {z = x+iy ∈ C : x, y ∈ R, x2 +y 2 ≤ 1} el cı́rculo de centro 0 y radio 1. Considerando
en C el orden producto definido anteriormente, ¿tiene S elemento máximo? ¿y elemento mı́nimo?
¿y elementos maximales? ¿y elementos minimales? ¿cuáles son? ¿por qué?
Responder las preguntas anteriores considerando en C el orden lexicográfico.

1.5. Conjuntos finitos y numerables


1.5.1. Conjuntos finitos y numerables. Conjuntos equipotentes.
¿Cuántas letras minúsculas tiene el alfabeto griego? Veinticuatro. ¿Cómo lo sabemos? Las po-
nemos en una lista
α, β, γ, δ, ε, ζ, η, θ, ι, κ, λ, µ, ν, ξ, o, π, %, σ, τ , υ, ϕ, χ, ψ, ω,
y, simplemente, contamos:
uno, dos, tres, cuatro, cinco, . . . , veinticuatro.
¿Qué estamos haciendo desde el punto de vista matemático? Emparejamos cada una de las
letras con los números naturales correlativos,

α β γ δ ε ζ η θ ι κ λ µ ν ξ o π % σ τ υ ϕ χ ψ ω
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24

“una letra ↔ un número”, consecutivamente, teniendo buen cuidado de no repetir letras ni sal-
tar números, hasta agotar todas las letras disponibles. En definitiva, estamos estableciendo una
aplicación biyectiva entre el conjunto “alfabeto griego” y el conjunto de “los veinticuatro primeros
números naturales”, o viceversa (si nos fijamos en la aplicación inversa). Generalizando esta idea,
definiremos los conjuntos finitos y el número de elementos de un conjunto finito.
Notación. Para n ∈ N, pongamos N(n) = {k ∈ N : k ≤ n}.
Definición 1.5.1. Diremos que un conjunto A es finito si es vacı́o o existe un n ∈ N tal que hay
una biyección f : N(n) → A.
Qué es el número de elementos de un conjunto ası́ es ‘casi’ obvio. Sólo casi, porque nuestra
experiencia contando conjuntos muy grandes nos dice que no siempre se llega a la misma respuesta
(si vuestros amigos contaran los asistentes al último concierto de vuestro grupo favorito, ¿obtendrı́an
todos el mismo número?) El lema siguiente garantizará que si al contar el número de elementos de
un mismo conjunto se obtienen valores diferentes, es que hay un error.
Lema 1.5.2. Sean m, n ∈ N. Si existe una biyección f : N(m) → N(n), entonces m = n.
Demostración. Procederemos por inducción sobre el enunciado
Pn : Para todo m ∈ N, si existe una biyección f : N(m) → N(n), entonces m = n.
P1 es cierto: si f : N(m) → N(1) = {1} es una biyección, será f (x) = 1 para un único
x ∈ N(m); y si m 6= 1, N(m) tiene al menos un elemento y 6= x, para el que forzosamente f (y) = 1,
contradiciendo la inyectividad de f . Por tanto, m = 1.
Supuesto cierto Pn , también es cierto Pn+1 . Pues si para un m ∈ N existe una biyección
f : N(m) → N(n+1), entonces m 6= 1 (en caso contrario, f (N(m)) = f (N(1)) = {f (1)}, y en N(n+1)
habrı́a elementos distintos de f (1) que no estarı́an en la imagen de f ), y además f (x) = n + 1 para
un único x ∈ N(m). La aplicación f 0 : N(m) \ {x} → N(n) dada por f 0 (k) = f (k), k ∈ N(m) \ {x},
está bien definida y es biyectiva (¿por qué?). Definiendo ahora h : N(m − 1) → N(m) \ {x} por
(
k si k < x,
h(k) =
k + 1 si x < k ≤ m − 1,
1.5. CONJUNTOS FINITOS Y NUMERABLES 39

también h está bien definida y es biyectiva (¿por qué?), de modo que

g = f 0 ◦ h : N(m − 1) → N(n),

composición de dos aplicaciones biyectivas, es biyectiva (¿por qué?). Por la hipótesis de inducción,
esto obliga a que m − 1 = n, y ası́ m = n + 1.

Definición 1.5.3. Dado un conjunto finito A, el número de elementos de A es 0, si A = ∅, o


el único número natural n para el que existe una biyección f : N(n) → A. Suele indicarse por |A|
o por #A o por card A.

La unicidad de n es consecuencia del lema anterior: si A es finito y no vacı́o y existen biyecciones


f : N(n) → A, g : N(m) → A, entonces f −1 ◦ g : N(m) → N(n) es una biyección y por tanto m = n.
Ejercicio. Probar que si A ⊆ B y B es un conjunto finito, entonces A también es un conjunto
finito y |A| ≤ |B|, siendo |A| = |B| si y sólo si A = B.
Pasemos a los conjuntos infinitos. Igual que hay conjuntos finitos con distinto cardinal (con
distinto número de elementos), se puede establecer una noción de cardinal para conjuntos infinitos
que permite “comparar el tamaño” de los conjuntos infinitos. La teorı́a de cardinales sobrepasa los
propósitos de este curso y, afortunadamente, está expuesta excelentemente en [GJPR], cap. 2, a un
nivel asequible. Pero al menos, definiremos aquı́ los cardinales infinitos más sencillos.

Definición 1.5.4. Diremos que un conjunto A es numerable o que tiene cardinal ℵ0 si existe
una biyección f : N → A.
Diremos que A es contable si es finito o numerable.

Ejemplos. (Cf. [GJPR], pp. 57 y ss.)


— El conjunto A = {2n : n ∈ N} de los números naturales pares es numerable.
— El conjunto A = {n2 : n ∈ N} de los cuadrados de los números naturales es numerable (paradoja
de Galileo).
— Los conjuntos finitos no son numerables.
— El conjunto Z de los números enteros es numerable.
— El conjunto Q de los números racionales ¡es numerable! (enumeración diagonal de Cantor ; v.
[4]).
— El conjunto R de los números reales no es numerable. (Lo probaremos más adelante).

Definición 1.5.5. Dados dos conjuntos A y B, si existe una biyección f : A → B diremos que A
y B son equipotentes (escrito A ∼ B) o que tienen el mismo cardinal (escrito |A| = |B| o
#A = #B o card A = card B).

Como entonces f −1 : B → A es también una biyección, B ∼ A siempre que A ∼ B. Ası́ mismo,


hay reflexividad y transitividad (la identidad es una biyección, y la composición de dos biyecciones
es una biyección).3
Los conjuntos numerables (de cardinal ℵ0 ) son los equipotentes a N. Los conjuntos equipotentes
a R se dice que tienen el cardinal del continuo c.
Ejemplos. Los siguientes conjuntos tienen el cardinal del continuo (v. [GJPR], pp. 60 y ss.):
— cualquier subintervalo de R con más de un punto;
— el conjunto C de los números complejos;
— cualquier espacio vectorial de dimensión finita sobre R.
3
Pero ∼ no es una relación de equivalencia en ‘el conjunto de todos los conjuntos’, que no existe. Si nos limitamos
a los subconjuntos de un conjunto universal U , ∼ es una relación de equivalencia en ℘(U ).
40 CAPÍTULO 1. CONJUNTOS

1.5.2. APÉNDICE: Un mı́nimo de combinatoria.


En una descripción burda, la combinatoria se ocupa de contar de distintas maneras el número
de elementos de los conjuntos finitos. Es una parte muy importante de las Matemáticas, y sus
aplicaciones no cesan de aumentar. Aquı́ enunciaremos algunos de sus resultados más elementales, la
mayorı́a sin demostración. Para completar las demostraciones y ver más aplicaciones y comentarios,
recomendamos [D’A-W], [Lieb], y el capı́tulo sobre combinatoria de [1, pp. 94 y ss.].

Comenzaremos con dos de los temas más ‘clásicos’ de la Combinatoria.

Permutaciones

¿De cuántas maneras diferentes se pueden poner cuatro neumáticos a un coche? Hay cuatro posicio-
nes posibles: 1) delantera izquierda, 2) delantera derecha, 3) trasera izquierda, 4) trasera derecha.
Inicialmente, en la posición 1) podemos colocar uno cualquiera de los neumáticos, que distingui-
remos con las letras a, b, c, d: hay cuatro posibilidades diferentes. Elegida una de las cuatro, en
la posición 2) podemos colocar uno cualquiera de los tres neumáticos restantes: eso da 4 · 3 = 12
posibilidades. A partir de cada una de ellas, la elección de uno de los dos neumáticos restantes para
ocupar la posición 3) nos lleva a 12 · 2 = 24 posibilidades, y para la posición 4) ya sólo dispone-
mos de un neumático, ası́ que hay finalmente 4 · 3 · 2 · 1 = 4! = 24 maneras distintas de colocar
los neumáticos. Cada una de ellas se obtiene de las demás ‘intercambiando’ o ‘permutando’ los
neumáticos de lugar.

1) a b c d
2) b c d a c d a b d a b c
3) c d b d b c c d a d a c b d a d a b b c a c a b
4) d c d b c b d c d a c a d b d a b a c b c a b a

En los textos antiguos, las permutaciones de elementos de un conjunto se definı́an como ‘las
diversas ordenaciones que podemos formar con los elementos del conjunto, sin repetirlos ni olvidar
ninguno, de manera que dos cualesquiera contienen los mismos objetos y difieren solamente en el
orden de colocación de éstos’ (cf., por ejemplo, [Rey-P-T]). Por tanto, el paso de una permutación
a otra puede identificarse con una biyección del conjunto en sı́ mismo, que es la definición actual.

Definición 1.5.6. Una permutación de un conjunto A es una biyección de A en sı́ mismo.

Generalizando el razonamiento del ejemplo inicial, se obtiene:

Proposición 1.5.7. El número de permutaciones de un conjunto A con n elementos es n!.

Combinaciones

En el texto citado anteriormente, [Rey-P-T], p. 157, se lee: hh combinaciones de orden n de m objetos:


a1 , a2 , . . . , am , (o combinaciones n-arias), son los grupos de n objetos que se pueden formar con ellos,
de modo que dos cualesquiera difieran en algún objeto. Ası́ como las variaciones son sucesiones que
se diferencian entre sı́ por la naturaleza de sus objetos, o por su colocación, aquı́ ésta es indiferente,
y sólo aquélla importa.ii
Si pensamos esta definición en términos de conjuntos, vemos que se está hablando simplemente
de los distintos subconjuntos de n elementos que tiene un conjunto con m elementos. El número de
ellos se cuenta mediante los números combinatorios, que pasamos a definir. (Usaremos el convenio
de que 0! = 1.)
1.5. CONJUNTOS FINITOS Y NUMERABLES 41

Definición
  1.5.8. Dados dos enteros no negativos n y k, con n ≥ k, el número combinatorio
n
, leı́do n sobre k, es el número
k
 
n n!
= .
k k!(n − k)!

Pongamos ahora Ckn para denotar el número de subconjuntos con k elementos de un conjunto
con n elementos (el número de combinaciones de n elementos tomados de k en k). Como A ⊆ B
implica que |A| ≤ |B| (¿por qué?), esto supone que si k > n, Ckn = 0. Si k = n, obviamente Ckn = 1,
ası́ como C0n = 1. En los restantes casos,

Proposición 1.5.9. Dados dos enteros no negativos n y k con n ≥ k,


 
n n! n
Ck = = ,
k!(n − k)! k

donde Ckn denota el número de combinaciones de n elementos tomados de k en k.

Demostración. Consideremos un conjunto A que conste de n elementos. Contaremos todas las


permutaciones de A en las siguientes etapas.
(1) Elegimos un subconjunto {a1 , a2 , . . . , ak } de A de k elementos: esto puede hacerse de Ckn maneras
distintas.
(2) Permutamos los elementos de cada uno de los subconjuntos anteriores de todas las maneras
posibles: esto puede hacerse de k! formas distintas para cada uno de los subconjuntos seleccionados.
(3) A cada uno de los resultados anteriores, añadimos los n − k elementos que quedan de A,
ak+1 , ak+2 , . . . , an , en cada una de las (n − k)! formas posibles.
Obtenemos ası́ todas y cada una de las n! permutaciones de los elementos de A, sin repetir
ninguna. Por tanto n! = Ckn · k! · (n − k)!, de donde
 
n! n
Ckn = = .
k!(n − k)! k

Hay muchı́simas relaciones entre los números combinatorios, que expondremos según las vaya-
mos necesitando. Por ejemplo, es obvio que
   
n n! n! n
= = = ,
n−k (n − k)!(n − (n − k))! k!(n − k)! k

que responde a la idea de que con cada subconjunto B de A de k elementos tenemos emparejado
el subconjunto A \ B de n − k elementos (y viceversa), con lo cual tantos hay de un tipo como del
otro.
Otra expresión útil es la siguiente:
 
n n(n − 1) · · · (n − k + 1)
= ,
k k!

que se obtiene dividiendo por (n − k)! el numerador y el denominador en la fórmula inicial. Ası́ es
obvio que        
n+1 n+1 n n+1 n+1 n
= o que = .
k (n + 1) − k k k+1 k k
Los números combinatorios se llaman también coeficientes binómicos, debido al siguiente resul-
tado.
42 CAPÍTULO 1. CONJUNTOS

Proposición 1.5.10 (Fórmula del binomio de Newton). Dados n ∈ N y x, y ∈ R,

n  
n
X n
(x + y) = xk y n−k .
k
k=0

Demostración. Por definición, (x + y)n es el producto de n factores iguales a (x + y). Al desarro-


llar el producto, obtenemos solamente términos (repetidos) de la forma xk y n−k , provenientes de
multiplicar sumandos x tomados (¡una sola vez!) en k factores (0 ≤ k ≤ n) y sumandos y tomados
en los n − k restantes; por consiguiente, obtendremos nk sumandos iguales a xk y n−k , y quedará la


fórmula del enunciado.

(Posteriormente damos una demostración por inducción.)

Para obtener los coeficientes del binomio (los números combinatorios) se puede emplear el
llamado triángulo de Pascal o de Tartaglia, v. [6]:

1
1 1
1 2 1
1 3 3 1
1 4 6 4 1
1 5 10 10 5 1
1 6 15 20 15 6 1
1 7 21 35 35 21 7 1
1 8 28 56 70 56 28 8 1

etc. Detrás de este procedimiento de construcción está la igualdad


     
n n n! n! n! 1 1
+ = + = +
k k+1 k!(n − k)! (k + 1)!(n − k − 1)! k!(n − k − 1)! n − k k + 1
n! k+1+n−k n!(n + 1)
= · =
k!(n − k − 1)! (n − k)(k + 1) k!(k + 1) · (n − k − 1)!(n − k)
 
(n + 1)! n+1
= = ,
(k + 1)!(n − k)! k+1

que permite pasar de una fila a la siguiente obteniendo cada elemento como suma de los dos que
tiene encima.

Esta identidad justamente es la que se necesita para dar una demostración alternativa de la
fórmula del binomio mediante inducción.
En efecto: dados n ∈ N y x, y ∈ R, sea Pn el enunciado

n  
n
X n
(x + y) = xk y n−k .
k
k=0

P1 1
Para n = 1, P1 afirma que (x + y)1 = xk y 1−k = 1 · x0 y 1 + 1 · x1 y 0 , es decir, que

k=0 k
x + y = y + x, lo cual es obviamente cierto.
1.5. CONJUNTOS FINITOS Y NUMERABLES 43

Dado un número natural n arbitrario, supongamos que Pn es cierta. Entonces

n  
n+1 n
X n
(x + y) = (x + y) (x + y) = ( xk y n−k ) (x + y)
k
k=0
     

n n n−1 n k n−k n 
= y + xy + ··· + x y + ··· + xn−1 y + xn (x + y)
1 k n−1
     

n n 2 n−1 n k+1 n−k n 
= xy + x y + ··· + x y + ··· + xn y + xn+1
1 k n−1
     

n+1 n n n k n−k+1 n 
+ y + xy + ··· + x y + ··· + xn−1 y 2 + xn y
1 k n−1
       
n n n n
= y n+1 + + x yn + · · · + + xk y n−k+1 + · · ·
0 1 k−1 k
   
n n
+ + xn y + xn+1
n−1 n
     
n+1 n + 1 k n−k+1 n+1 n
= y n+1 + x yn + · · · + x y + ··· + x y + xn+1
1 k n
n+1
X n + 1
= xk y n−k+1
k
k=0

que es lo que afirma Pn+1 .

Principios generales

Como muestran los apartados anteriores, para contar los elementos de ciertos conjuntos finitos
suele interesar, en general, organizarlos de manera que se pueda diseñar una estrategia simple que
facilite el recuento. En el nivel más sencillo de aplicación de esta idea hay algunos principios básicos
que recogemos a continuación; para más detalles, nos remitimos a las referencias ya citadas ([1],
[D’A-W], [Lieb]).

Para empezar, veamos como se cuenta el número de elementos de un conjunto ‘por trozos’.

Lema 1.5.11. Sean A y B dos conjuntos finitos. Entonces

|A ∪ B| = |A| + |B| − |A ∩ B|.

En particular, si A y B son disjuntos,

|A ∪ B| = |A| + |B|.

Proposición 1.5.12 (Principio de adición). Sean A1 , . . . , An conjuntos finitos disjuntos dos


a dos, es decir,
Ai ∩ Aj = ∅ si i 6= j, 1 ≤ i, j ≤ n.

Entonces
|A1 ∪ A2 ∪ · · · ∪ An | = |A1 | + |A2 | + · · · + |An |.
44 CAPÍTULO 1. CONJUNTOS

Proposición 1.5.13 (Principio de inclusión y exclusión). Sean A1 , . . . , An conjuntos finitos.


Si

α1 = |A1 | + |A2 | + · · · + |An |


α2 = |A1 ∩ A2 | + |A1 ∩ A3 | + · · · + |An−1 ∩ An |,
α3 = |A1 ∩ A2 ∩ A3 | + |A1 ∩ A2 ∩ A4 | + · · · + |An−2 ∩ An−1 ∩ An |,
..
.
αn = |A1 ∩ A2 ∩ · · · ∩ An |

entonces
|A1 ∪ A2 ∪ · · · ∪ An | = α1 − α2 + · · · + (−1)n+1 αn .

Los ejercicios siguientes ilustran cómo el manejo del lenguaje de la teorı́a de conjuntos es
utilı́simo en el análisis de situaciones que a primera vista no se relacionarı́an con dicha teorı́a.

Ejercicios
5.1. ¿Puede creerse a un investigador que informa que, de cada 1000 habitantes, a 816 les gusta el
azúcar; a 723, el helado; a 645, los pasteles; y asimismo que a 562 les gusta el azúcar y el helado; a
463, el azúcar y los pasteles, y a 470, los pasteles y el helado, y sólo a 310 les gustan las tres cosas?
5.2. Tres monedas, una de cobre, otra de nı́quel y otra de plata, son lanzadas simultáneamente
al aire, y esto 100 veces. La de cobre muestra cara en 70 ocasiones, la de nı́quel muestra cara en
50 pruebas y la de plata muestra cara en 56 pruebas. La de cobre y la de nı́quel han mostrado
simultáneamente cara 31 veces y la de nı́quel y de plata han presentado tal circunstancaia 28 veces.
Probar que las tres monedas han mostrado cara simultáneamente por lo menos 9 veces y que las
tres han mostrado simultáneamente cruz a lo más 11 veces.
5.3. En una encarnizada batalla, por lo menos el 70 por ciento de los combatientes pierde un ojo;
al menos un 75 por ciento, una oreja; al menos un 80 por ciento, un brazo, y al menos un 85 por
ciento, una pierna. ¿Cuántos por lo menos han perdido las cuatro cosas? (Lewis Carroll.)
5.4. (Frases matemáticas célebres) Las matemáticas se componen de un 50 % de fórmulas, de un
50 % de demostraciones y de un 50 % de imaginación.

Proposición 1.5.14 (Principio de las cajas o principio del palomar). Si queremos repartir
n objetos en m cajas con rm < n, al menos una caja ha de recibir más de r objetos.

La demostración (muy fácil) junto con ejemplos y ejercicios de aplicación del mismo puede verse
en [D’A-W], cap. 10, pp. 158–162 y 167–169.
En el cálculo del número de permutaciones de n elementos hemos usado implı́citamente un
procedimiento que [Lieb, p. 116] expone ası́:

Proposición 1.5.15 (Principio de multiplicación). Sea P un proceso que consta de n etapas, y


supongamos que para cada r, la etapa résima puede llevarse a cabo de ar maneras distintas. Entonces
P puede llevarse a cabo de a1 a2 · · · an maneras distintas.

Ejemplo. Un sistema de seguridad usa palabras clave que constan de dos letras seguidas por dos
dı́gitos (decimales). ¿Cuántas palabras clave distintas pueden formarse?
Respuesta. 27 × 27 × 10 × 10, incluyendo la ñ y excluyendo la ch y la ll, que constan de dos
caracteres. (Cf. [Lieb, p. 115].)
1.5. CONJUNTOS FINITOS Y NUMERABLES 45

Usando este principio, o directamente por inducción, se comprueba:

Proposición 1.5.16 (Cardinal de un producto). Sean A y B dos conjuntos finitos, y A × B


su producto cartesiano. Entonces
|A × B| = |A| · |B|.

Contar en tablas. Para contar los elementos de un conjunto es a veces conveniente expresar el
conjunto como subconjunto de un producto cartesiano, representándolo en una tabla. Ası́, el número
total de elementos del conjunto puede obtenerse sumando el número de elementos del conjunto que
hay en cada una de las filas, o bien sumando el número de elementos del conjunto que hay en cada
una de las columnas.4 Con una idea tan simple pueden contestarse preguntas como la siguiente:
Ejemplo. De los alumnos de una clase 32 son varones y cada uno de ellos conoce exactamente a
5 compañeras. Si cada alumna conoce exactamente a 8 compañeros, ¿cuántas alumnas hay en la
clase?
Respuesta. 32 × 5 = n × 8 =⇒ n = 20. (V. [1, pp. 96–97])

Hay multitud de problemas curiosos que se resuelven usando los métodos ‘combinatorios’ ex-
puestos en este apartado. Como pasatiempo de vacaciones, recomendamos especialmente los de
[D’A-W] (repartidos por todo el libro) y [Lieb], cap. 15.

4
Este resultado, cuya demostración rigurosa es más complicada de formular de lo que en principio cabrı́a suponer,
puede verse como ‘un anticipo en versión finita’ del teorema de Fubini, un resultado muy importante sobre integración
que se estudiará en cursos superiores de Análisis matemático.
46 CAPÍTULO 1. CONJUNTOS
Bibliografı́a

[Ap] Apéry, R. & al.: Pensar la matemática. Tusquets, Barcelona, 1984.

[C-H] Cohen, P. J.; Hersh, R.: Teorı́a de conjuntos no cantoriana. En [Kl], pp. 238–247.

[D’A-W] D’Angelo, J. P.; West, D. B.: Mathematical Thinking. Problem-Solving and Proofs.
Prentice-Hall, Upper Saddle River, NJ, 1997.

[D-H] Dorronsoro, J.; Hernández, E.: Números, grupos y anillos. Addison-Wesley/UAM,


Madrid, 1996.

[GJPR] Goberna, M. A.; Jornet, V.; Puente, R.; Rodrı́guez, M.: Álgebra y fundamentos.
Una introducción. Ariel, Barcelona, 2000.

[G-H] Griffits, H. B.; Hilton, P. J.: Classical Mathematics. Van Nostrand Reinhold, London,
1970.

[Ham] Hamilton, A. G.: Numbers, sets and axioms: the apparatus of mathematics. Cambridge
Univ. Press, 1982.

[Kl] Kline, M. (ed.): Matemáticas en el mundo moderno. Blume, Madrid, 1974.

[Lieb] Liebeck, M.: A Concise Introduction to Pure Mathematics. Chapman & Hall/CRC,
Boca Raton, 2000.

[Lip] Lipschutz, S.: Teorı́a de Conjuntos y temas afines. (Col. Schaum) McGraw-Hill, Méxi-
co, 1969.

[O.U.] Open University: Introducción al cálculo y al álgebra (vol. 3: Álgebra). Reverté, Bar-
celona, 1977.

[Rey-P-T] Rey Pastor, J.; Pi Calleja, P.; Trejo. C. A.: Análisis matemático vol. I. Kapelusz,
Buenos Aires, (7a. ed.), 1963.

[S-T] Stewart, I.; Tall, D.: The Foundations of Mathematics. Oxford Univ. Press, 1977.

Documentos en Internet

[1] Eric Schechter, a home page for the Axiom of Choice.


http://math.vanderbilt.edu/~schectex/ccc/choice.html

[2] Nancy McGough, Relevance of the Axiom of Choice (FAQ).


http://db.uwaterloo.ca/~alopez-o/math-faq/node69.html

[3] F. J. Cobos: Curso de Introducción a la Matemática Discreta. Universidad de Sevilla,


2002-2003..
http://ma1.eii.us.es/Docencia/apuntes/ap imd.PDF

47
48 BIBLIOGRAFÍA

[4] Numerabilidad de Q, Math Forum Famous Problems.


http://mathforum.org/isaac/problems/cantor2.html

[5] Proceso diagonal de Cantor, desde un punto de vista computacional:


http://delta.cs.cinvestav.mx/~gmorales/complex/node7.html

[6] El triángulo de Pascal y alguna curiosidad adicional.


http://mathworld.wolfram.com/PascalsTriangle.html
Capı́tulo 2

Números naturales y enteros.

En el desarrollo del tema de los números enteros seguiremos básicamente el texto [D-H]. Sobre
números naturales, si es necesario puede ser útil como libro de consulta [S-T].
Los restantes libros de la bibliografı́a sirven de complemento en algunos puntos concretos que
señalaremos en su momento.

2.1. Números naturales.


Ya tuvimos una primera toma de contacto con el conjunto de los números naturales y una de
sus propiedades esenciales, el principio de inducción. Ahora que nos hemos familiarizado con los
conceptos básicos de la teorı́a de conjuntos, serı́a el momento oportuno de entrar en una funda-
mentación axiomática rigurosa de los números naturales basada, como es habitual, en los axiomas
de Peano, que (creemos) todo aspirante a matemático debe conocer. Sin embargo, la extensión
del programa nos impide disponer del tiempo necesario para llevar a cabo este propósito; como
solución intermedia, recogeremos aquı́ como lectura complementaria de lo visto en clase dichos
axiomas, junto con algunas definiciones y propiedades de los números naturales (enunciadas sin
demostraciones), destacando las que nos serán necesarias posteriormente para el estudio de los
números enteros.

2.1.1. Lectura preliminar


¿Qué ocurrirı́a si al ir profundizando en nuestros conocimientos matemáticos observásemos
incongruencias en algunos de los conceptos que tenı́amos por ‘intuitivamente claros’ o de los resul-
tados que tenı́amos por ‘evidentemente ciertos’ ? ¿No comenzarı́amos a dudar de todo y a intentar
“reconstruir el edificio de nuestros conocimientos”, cimentándolo sobre una base lo más explı́cita y
más sólida posible?
Esto les sucedió a los matemáticos del siglo XIX. Imaginemos la situación: desconfianza en
“todo lo previamente sabido”, hay que replantearlo empezando de cero. Ası́ comenzó un análisis
radical de los fundamentos de las matemáticas y la entronización del método axiomático.
Adoptemos, pues, la misma postura radical que nuestros predecesores decimonónicos: olvidemos
(o hagamos como que nos olvidamos de) nuestras intuiciones geométricas, nuestros conocimientos
de los números enteros, racionales, etc., y concentrémosnos en los números naturales. Cuestionemos
incluso los mismos números naturales. ¿Cómo reconstruir ahora toda la aritmética, la ‘ciencia de
los números naturales’, con la mayor economı́a de medios, partiendo de unos supuestos mı́nimos?
hh Dedekind, y Peano siguiéndole, diseccionaron el concepto de la progresión de los números

naturales y formularon una fundamentación axiomática de la aritmética, conocida ahora, impro-


piamente, como los axiomas de Peano.ii ([3]; ver también [2] y las referencias allı́ citadas.)
La idea esencial es esta: para ‘ir fabricando’ los números naturales, sólo necesitamos disponer
del primero, el 1 en nuestro convenio, y de una manera de pasar al siguiente, de este al siguiente,

49
50 CAPÍTULO 2. NÚMEROS NATURALES Y ENTEROS

de este al siguiente, etc. Ahora que disponemos del lenguaje de la teorı́a de conjuntos, usémoslo
para expresar este proceso.
Olvidando la suma (ya la reconstruiremos después), pongamos sgt (n) en vez de n + 1 para el
‘siguiente’ a n. ‘Pasar de un número natural al siguiente’ es asociar a cada n su siguiente sgt (n),
lo que en el lenguaje conjuntista no es más que definir una aplicación sgt : n ∈ N → sgt (n) ∈ N.
Obviamente, esta aplicación es inyectiva: si m 6= n, sgt (m) 6= sgt (n). Que 1 es ‘el primer número
natural’ es decir que no sigue a ninguno, 1 6= sgt (n) cualquiera que sea n ∈ N; o, en otros términos,
1 no está en el conjunto imagen de la aplicación sgt , 1 ∈ N \ sgt (N). También sabemos que el
principio de inducción tiene un enunciado ‘conjuntista’ en términos de esta aplicación:
dado S ⊆ N tal que 1 ∈ S y sgt (n) ∈ N siempre que n ∈ N, necesariamente S = N,
y gracias a él podemos cerrar el proceso, como descubrieran R. Dedekind [Ddk] y G. Peano
[Peano] entre otros.

2.1.2. Los axiomas de Peano


Los conceptos primitivos y las ‘propiedades fundamentales’ (axiomas) que permiten describir
axiomáticamente los números naturales están recogidos en el enunciado que sigue:

Existen un conjunto N, cuyos elementos se denominan números naturales, que contiene


un elemento distinguido 1, y una aplicación sgt : N → N tal que
(S1) sgt es inyectiva,
(S2) 1 ∈
/ sgt (N),
(S3) dado S ⊆ N con 1 ∈ S y sgt (S) ⊆ S, necesariamente S = N.

Es un hecho notable, y un tanto sorprendente, que todas las propiedades usuales de los números
naturales pueden deducirse de estas, como puso de manifiesto el matemático italiano G. Peano en
su obra [Peano]. Aunque Dedekind habı́a planteado con anterioridad un sistema similar (si bien más
complicado, ver [Ddk]), hoy se llaman en su honor axiomas de Peano para los números naturales.
En una formulación más ‘clásica’, más próxima a la original de Peano,1 suelen enunciarse ası́:

Existe un conjunto N, cuyos elementos se denominan números naturales, tal que


P1. Para todo número natural n existe otro número natural, sgt (n), que llamaremos siguiente o
sucesor de n.
P2. Existe un número natural, que denotamos por 1, tal que sgt (n) 6= 1 cualquiera que sea el
número natural n.
P3. Para números naturales cualesquiera m y n, es sgt (m) = sgt (n) si y sólo si m = n.
P4. (Axioma de inducción matemática). Un conjunto de números naturales que contenga a
1 y que con cada n contenga a sgt (n), debe incluir a todos los números naturales. Es decir,
dado S ⊆ N tal que 1 ∈ S y sgt (n) ∈ S siempre que n ∈ S, es S = N.

Que 1 es el único elemento de N que no está en el conjunto imagen de la aplicación sgt puede
demostrarse por inducción; ası́, el conjunto imagen de dicha aplicación es exactamente N \ {1} (V.
[S-T], p. 147).

Como es presumible, el ‘siguiente’ de un n ∈ N será n + 1 . . . ¡pero sólo cuando sepamos lo que


significa ese signo hh +ii, que habremos de definir a partir de los axiomas anteriores!

Pasemos a ver cómo se construyen por recurrencia las operaciones de suma y producto.

1
En alguna versión posterior, como la publicada en 1895 que reproducimos en [2], Peano parte de 0 como primer
número natural. Ası́ se hace también en las referencias [S-T], [Ham].
2.1. NÚMEROS NATURALES. 51

Proposición 2.1.1 (Suma en N). Dado un número natural m, definimos:

(i) m + 1 = sgt (m)

(ii) para cada n ∈ N, m + sgt (n) = sgt (m + n).

Entonces, dados dos números naturales cualesquiera m y n, m + n es un número natural per-


fectamente definido.

Demostración. Dado m, consideremos

S = {k ∈ N : ∃|x ∈ N tal que m + k = x}.

Evidentemente, 1 ∈ S. Y si k ∈ S, también sgt (k) ∈ S. Por el principio de inducción, S = N.


En particular, n ∈ S, como querı́amos demostrar.

¡Hemos dado una definición recurrente de la suma! También el producto puede definirse por
recurrencia, apoyándonos en la suma que acabamos de construir:

Proposición 2.1.2 (Producto en N). Dado un número natural m, definimos:

(i) m · 1 = m

(ii) para cada n ∈ N, m · sgt (n) = m · n + m.

Entonces, dados dos números naturales cualesquiera m y n, m · n es un número natural perfec-


tamente definido (que se denotará simplemente por mn en vez de m · n si no ha lugar a confusión).

Ya vimos que, en la práctica, el principio de inducción suele aplicarse en términos de “propieda-


des” más que en términos de conjuntos. Justificada ya la notación n + 1 para sgt (n), recuperamos
los enunciados tradicionales que utilizamos a principio de curso.

Empleando adecuadamente el principio de inducción se comprueba que las operaciones de suma


y producto de números naturales, es decir, las aplicaciones del producto cartesiano N × N en N
dadas por
+ : (m, n) ∈ N × N → m + n ∈ N, · : (m, n) ∈ N × N → m n ∈ N.

tienen las propiedades fundamentales que a continuación transcribimos.

Propiedades de la suma y el producto en N. Dados números naturales cualesquiera m, n,


p, se cumplen

N1. Propiedad asociativa de la suma. (m + n) + p = m + (n + p).


N2. Propiedad conmutativa de la suma. m + n = n + m.
N3. Propiedad cancelativa de la suma. m + n = m + p implica n = p.

N4. Propiedad asociativa del producto. (m n) p = m (n p).


N5. Propiedad conmutativa del producto. m n = n m.
N6. Existencia de elemento neutro (identidad) para el producto. Hay un número natural,
que denotamos por 1, tal que 1 · n = n · 1 = n.
N7. Propiedad cancelativa del producto. mn = mp implica n = p.

N8. Propiedad distributiva del producto respecto de la suma. m (n + p) = m n + m p.


52 CAPÍTULO 2. NÚMEROS NATURALES Y ENTEROS

2.1.3. El principio de buena ordenación.


Para “comparar el tamaño” de dos números naturales cualesquiera se define en N una ordenación
partiendo de la suma.
Definición 2.1.3. Dados dos números naturales cualesquiera m, n, escribiremos m ≤ n y diremos
que m es menor o igual que n (o lo que es lo mismo, que n es mayor o igual que m, lo que se
escribe n ≥ m), cuando m = n o n = m + p para algún número natural p.
Pondremos m < n (o n > m) para expresar que m es estrictamente menor que n (o sea,
que m es menor y distinto que n).
Como propiedades fundamentales de esta relación tenemos:
Propiedades del orden en N. Dados números naturales cualesquiera m, n, p, se cumplen
N9. Propiedad reflexiva. m ≤ m.
N10. Propiedad antisimétrica. si m ≤ n y n ≤ m, entonces m = n.
N11. Propiedad transitiva. si m ≤ n y n ≤ p, entonces m ≤ p.
N12. Propiedad de orden total. siempre es m ≤ n o n ≤ m.
La propiedad 12 significa, según la definición, que dados dos números naturales cualesquiera m,
n, o bien es m = n, o n = m + p para algún número natural p, o m = n + p para algún número
natural p.
Recordemos que no todas las relaciones de orden son totales, en el sentido que indica la citada
propiedad: no lo era, por ejemplo, la relación de inclusión entre conjuntos. Pero la propiedad más
caracterı́stica de la relación de orden en N, que la distingue de manera especial, es la de ser una
buena ordenación, lo que significa exactamente lo siguiente:
Proposición 2.1.4. Principio de buena ordenación. Todo conjunto no vacı́o de números
naturales posee un elemento mı́nimo, es decir, dado S ⊆ N no vacı́o, existe un elemento m en S
tal que m ≤ n para todo n ∈ S.
También son interesantes las siguientes propiedades de la ordenación de números naturales.
Pueden probarse por inducción, y/o como consecuencia de las que le preceden.

Otras propiedades
(1) Todos los números naturales son mayores o iguales que 1. Es decir, mı́n N = 1.
(Aplı́quese el principio de inducción a la proposición Pn : n ≥ 1.)
(2) Dados m, n ∈ N, se tiene m > n si y sólo si existe p ∈ N tal que m = n + p, lo que abreviaremos
poniendo hh m − n ∈ N ii.
(En este caso, todo es evidente salvo que m = n + p para algún p ∈ N implica m 6= n; para
probarlo, véase primero por inducción sobre m que m 6= m + 1 cualquiera que sea m ∈ N, y después
que para todo m ∈ N, m 6= m + p por inducción sobre p.)
(3) Dados m, n ∈ N, no puede verificarse n < m < n + 1. En palabras, entre dos números naturales
consecutivos no hay ningún número natural.
(Puesto que si m ∈ N serı́a m − n ∈ N por (2) y m − n < 1, contradiciendo (1).)

2.2. Números enteros.


2.2.1. Necesidad de los enteros. Propiedades de Z. Idea de anillo.
La “resta” m − n de números naturales no siempre es posible, según se desprende de las pro-
piedades que hemos visto anteriormente. Dicho de otra forma, la ecuación

x + a = b,
2.2. NÚMEROS ENTEROS. 53

a, b ∈ N, no siempre tiene solución x ∈ N. Lo que hacemos entonces es “inventarnos” las soluciones


y añadirlas como números: ası́ definimos hh el cero 0ii como un nuevo número, solución de x + a = a,
y los hh enteros negativos −nii (números falsos, los llamaba Descartes) como solución de x + a = b
cuando a = b + n. Nos encontramos ası́ con los conocidos

. . . , −3, −2, −1, 0, 1, 2, 3, . . . ,

cuya representación gráfica como puntos de una recta nos es también familiar.
Aunque puede darse una construcción ‘algebraico-conjuntista’ de los números enteros (ver
[GJPR], pp. 91 y ss.), nosotros nos contentaremos de momento con esta idea ‘ingenua’ adoptando
(al menos por ahora) la siguiente descripción.

Definición 2.2.1 (Descripción de los números enteros). Diremos que un x es un número


entero si x ∈ N o si x = 0 o si x = −n con n ∈ N.
El conjunto formado por todos los números enteros se denota por Z.

Si ponemos N0 = N ∪ {0}, −N = {x = −n : n ∈ N}, se tiene Z = N ∪ {0} ∪ (−N) = N0 ∪ (−N).


Nos referiremos a N0 como al conjunto de los enteros no negativos y a −N como al conjunto de los
enteros negativos, siendo el conjunto N de los números naturales el de los enteros positivos.
El lector recordará que la suma y el producto de números naturales se amplı́a a una suma y
producto de números enteros,

+ : (m, n) ∈ Z × Z → m + n ∈ Z, · : (m, n) ∈ Z × Z → m n ∈ Z,

con las propiedades fundamentales que a continuación enunciamos.

Propiedades de la suma y el producto en Z. Dados números enteros cualesquiera m, n, p,


se cumplen
Z1. Propiedad asociativa de la suma. (m + n) + p = m + (n + p).
Z2. Propiedad conmutativa de la suma. m + n = n + m.
Z3. Existencia de elemento neutro (cero) para la suma. Hay un número entero, que
denotamos por 0, tal que 0 + n = n + 0 = n.
Z4. Existencia de elemento opuesto para la suma. Hay un número entero (y uno sólo), que
denotamos por −n, tal que (−n) + n = n + (−n) = 0.
Las propiedades Z1 a Z4 pueden resumirse diciendo que Z es un grupo conmutativo para la
suma. La propiedad cancelativa de la suma en Z va incluida en Z4 (¿por qué?)
Z5. Propiedad asociativa del producto. (m n) p = m (n p).
Z6. Propiedad conmutativa del producto. m n = n m.
Z7. Existencia de elemento neutro (identidad) para el producto. Hay un número entero,
que denotamos por 1, tal que 1 · n = n · 1 = n.
Z8. Propiedad distributiva del producto respecto de la suma. m (n + p) = m n + m p.
Las propiedades Z1 a Z8 pueden resumirse diciendo que Z, para la suma y el producto, es un
anillo conmutativo con unidad. Otros ejemplos de anillos: matrices n × n, funciones reales sobre un
mismo dominio, polinomios, . . .
Z9. Propiedad cancelativa del producto. mn = mp implica n = p.
Los sistemas algebraicos que tienen las propiedades Z1 a Z9 se llaman dominios de integridad.
NO son dominios de integridad los anillos de matrices n × n para n ≥ 2, de funciones reales sobre
un dominio con más de un punto (¿por qué?).
La relación de orden en N puede extenderse a Z.
54 CAPÍTULO 2. NÚMEROS NATURALES Y ENTEROS

Definición 2.2.2. Dados dos números enteros cualesquiera m, n, escribiremos m ≤ n y diremos


que m es menor o igual que n (o lo que es lo mismo, que n es mayor o igual que m, lo que
se escribe n ≥ m), cuando m = n o n = m + p para algún número natural p; equivalentemente,
cuando exista p ∈ N0 tal que n = m + p.
Pondremos m < n (o n > m) para expresar que m es estrictamente menor que n (o sea,
que m es menor y distinto que n).
Con esta notación,

N = {n ∈ Z : n > 0}, N0 = {n ∈ Z : n ≥ 0}, −N = {n ∈ Z : n < 0}.

Como propiedades fundamentales de la relación de orden en Z tenemos:

Propiedades del orden en Z. Dados números naturales cualesquiera m, n, p, se cumplen


Z10. Propiedad reflexiva. m ≤ m.
Z11. Propiedad antisimétrica. Si m ≤ n y n ≤ m, entonces m = n.
Z12. Propiedad transitiva. Si m ≤ n y n ≤ p, entonces m ≤ p.
Z13. Propiedad de orden total. Siempre es m ≤ n o n ≤ m.
Nótese que no va a ser válido un principio de buena ordenación igual que para los números
naturales: por ejemplo, el propio conjunto Z no tiene elemento mı́nimo, pues para cada n ∈ Z es
n − 1 < n. Sin embargo, vamos a tener una propiedad análoga para cierta clase de subconjuntos:
Z14. Principio de buena ordenación de los conjuntos minorados (principio del mı́nimo).
Todo conjunto no vacı́o de números enteros acotado inferiormente posee un elemento mı́nimo,
es decir, dado S ⊆ Z no vacı́o tal que para algún k ∈ Z es k ≤ n para todo n ∈ S, existe un
elemento m en S tal que m ≤ n para todo n ∈ S.
Simétricamente:
Z15. Principio del máximo. Todo conjunto no vacı́o de números enteros acotado superiormente
posee un elemento máximo, es decir, dado S ⊆ Z no vacı́o tal que para algún k ∈ Z es k ≥ n
para todo n ∈ S, existe un elemento M en S tal que M ≥ n para todo n ∈ S.
Por ejemplo, máx(−N) = −1.
En Z puede hablarse del “siguiente” a un número entero, en el sentido de que entre n y n + 1 no
hay ningún otro número entero (¿por qué?). No se cumple, sin embargo, el principio de inducción,
sino una propiedad similar aunque más débil:
Z16. Un conjunto de números enteros que contenga un número k y que con cada n contenga a
n + 1, debe contener a todos los números enteros mayores o iguales que k. Es decir, dado
S ⊆ Z tal que k ∈ S y n + 1 ∈ S siempre que n ∈ S, se tiene S ⊇ {n ∈ Z : n ≥ k}.
(Puede precisarse un poco más: dados S ⊆ Z y k ∈ Z, se tiene S = {n ∈ Z : n ≥ k} si y sólo si
k−1∈ / S, k ∈ S y n + 1 ∈ S siempre que n ∈ S.)
Esta hh inducción que comienza en un entero arbitrarioii justifica usar definiciones recurrentes
que tengan base igualmente en un entero arbitrario, y no necesariamente en 1.

Otras propiedades y conceptos en torno a la ordenación de Z son similares a las que el lector
estará manejando en R. Por ejemplo,
Z17. Relación con la suma. a ≤ b =⇒ a + c ≤ b + c.
Z18. Relación con el producto. Si c ≥ 0, a ≤ b =⇒ a c ≤ b c. Si c < 0, a ≤ b =⇒ a c ≥ b c.
El valor absoluto de un número entero a es el número entero no negativo
(
a, si a ≥ 0;
|a| =
−a, si a ≤ 0.
2.2. NÚMEROS ENTEROS. 55

Con esta definición, si a, b, denotan números enteros cualesquiera, se verifican, entre otras, las
siguientes relaciones:

|1| = 1; | − 1| = 1.

| − a| = |a|.

−|a| ≤ a ≤ |a|.

|a b| = |a| |b|.

Ejercicios
6.1. En las propiedades básicas de Z hemos señalado que todo n ∈ Z tiene un opuesto −n tal que
n + (−n) = (−n) + n = 0. ¿Puede haber algún otro m ∈ Z tal que n + m = m + n = 0? ¿Por qué?
Sugerencia: ¿quién serı́a m + n + (−n)?
6.2. Por definición, −1 es el opuesto de 1. Probar que la igualdad (−1)(−1) = 1 es una consecuencia
de la propiedad distributiva.
6.3. Dado un entero cualquiera n, probar que (−1) · n es el opuesto de n.
6.4. Dado un entero arbitrario a, definimos

a0 = 1 ; an+1 = an · a.

Probar que an está bien definido para todo n ∈ N0 .

2.2.2. División entera.


Una herramienta importante en el estudio de Z es la ‘división con resto’.

Proposición 2.2.3 (Existencia de la división entera). Dados a, b ∈ Z, con b 6= 0, existen dos


números enteros c y r tales que

a = cb + r, 0 ≤ r < |b|.

Los enteros c y r, denominados respectivamente cociente y resto de la división entera de a por


b, son únicos. Además, si a y b son números naturales, c tiene que ser un número positivo o nulo.

Demostración. Veamos primero el caso b > 0. Entonces b ∈ N, y b ≥ 1.


Sea
F = {z ∈ Z : zb ≤ a}.
Este es un conjunto no vacı́o, pues si a ≥ 0 contiene a 0 y si a < 0 contiene a a, porque de b ≥ 1,
multiplicando por a (que es negativo) se sigue ab ≤ a. Además, está acotado superiormente por |a|,
puesto que si z ∈ F y z ≥ 0, de 1 ≤ b se pasa a z ≤ zb = a, y si z < 0 trivialmente z < 0 ≤ |a|.
Aplicando el principio del máximo, existe c = máx F . Ası́ c ∈ F y c + 1 ∈
/ F (ver la construcción
gráfica en la nota posterior); por tanto

cb ≤ a, (c + 1)b > a, o sea cb + b > a.

Tomando r = a − cb, se deduce de estas desigualdades que 0 ≤ r < b = |b| y a = cb + r.


Para demostrar la unicidad del cociente y del resto, supongamos que hemos encontrado enteros
c1 , c2 , r1 , r2 tales que

c1 b + r1 = a = c2 b + r2 , 0 ≤ r1 < |b| = b, 0 ≤ r2 < |b| = b.


56 CAPÍTULO 2. NÚMEROS NATURALES Y ENTEROS

De las dos igualdades se sigue que


r2 − r1 = (c1 − c2 )b.
Pero también resulta −b < −r1 ≤ r2 − r1 ≤ r2 < b, y ası́ −b < r2 − r1 = (c1 − c2 )b < b, lo cual
sólo es posible si c1 − c2 = 0 (¿por qué?) En definitiva, c1 = c2 y en consecuencia r1 = r2 , como
querı́amos probar.
El caso b < 0 se reduce al anterior sin más que observar que a = cb+r si y sólo si a = (−c)(−b)+r.

Nota. Las figuras que siguen ilustran gráficamente la situación. Para a ≥ 0, se ve que, simplemente,
‘estamos midiendo a con b como unidad de medida’, trasladando un segmento de longitud b hacia
la derecha el número máximo de veces que podamos, sin llegar a sobrepasar a (por la derecha);
para a < 0, trasladarı́amos la unidad de medida hacia la izquierda, justo hasta igualar o sobrepasar
a (por la izquierda).

Ejemplo. La división entera de 1 por 2 da cociente 0 y resto 1; la de −1 por 2 da cociente −1 y


resto 1; la de 1 por −2, cociente 0 y resto 1, y la de −1 por −2, cociente 1 y resto 1.

La división entera en maple y Mathematica


Los programas de cálculo simbólico, como maple y Mathematica , permiten obtener sin difi-
cultad el cociente y el resto de una división entera cuando el dividendo y el divisor no son negativos.
En caso contrario, las cosas se complican.
• maple :
— El cociente entero de un entero no negativo m por un entero no nulo n se obtiene escribiendo
iquo(m,n);
(‘integer quotient’ de m y n);
— El resto de la división entera de un entero no negativo m por un entero no nulo n se obtiene
escribiendo
irem(m,n);
(‘integer remainder’ de m y n);
— si m es un entero negativo, iquo(m,n) e irem(m,n) dan los enteros q y r tales que m = n · q + r,
|r| < |n| y r ≤ 0. ¿Cómo podremos entonces conseguir el cociente y el resto que hemos definido
nosotros? Piénselo el lector.
2.2. NÚMEROS ENTEROS. 57

• Mathematica :
— El cociente entero de un entero cualquiera m por un entero positivo n se obtiene escribiendo
Quotient[m,n]
— El resto de la división entera de un entero cualquiera m por un entero positivo n se obtiene
escribiendo
Mod[m,n]
— si n es un entero negativo, Quotient[m,n] y Mod[m,n] dan los enteros q y r tales que m = n·q+r,
|r| < |n| y r ≤ 0.
En el ejemplo anteriormente comentado, resultarı́a:

maple Mathematica
m n cociente resto iquo(m,n) irem(m,n) Quotient[m,n] Mod[m,n]
1 2 0 1 0 1 0 1
−1 2 −1 1 0 −1 −1 1
1 −2 0 1 0 1 −1 −1
−1 −2 1 1 0 −1 0 −1

Ejercicios
7.1. Sea a un entero cualquiera y sean b y m enteros positivos. Si q es el cociente y r es el resto de
la división entera de a por b, probar que q es el cociente y mr es el resto de la división entera de
ma por mb.
7.2. Sean a, b, c enteros con b > 0, c > 0. Si q es el cociente de la división entera de a por b y q 0 es
el cociente de la división entera de q por c, probar que q 0 es el cociente de la división entera de a
por bc.
7.3. Demostrar, utilizando el algoritmo de la división, que si un número entero es a la vez un
cuadrado y un cubo, entonces se puede escribir en la forma 7k o 7k + 1.

2.2.3. Representación decimal y binaria. Bases de numeración


Cuando escribimos hh el número 1984 ii , estamos usando una notación abreviada para el número
4 + 8 · 10 + 9 · 102 + 1 · 103 . Con el convenio subyacente, nos bastan las diez cifras o dı́gitos decimales
hh 0, 1, 2, 3, 4, 5, 6,7, 8, 9 ii para representar cualquier número entero no negativo (para representar

un número entero negativo arbitrario, añadimos un signo hh − ii a la izquierda de la representación


de su valor absoluto). Pero, ¿por qué utilizar esta representación precisamente? El propio nombre
dı́gito sugiere la respuesta clásica: porque contamos con los dedos, y eso hace aparecer el 10 como
un número base razonable. Sin embargo, nada impide intentar una representación binaria en lugar
de la decimal, es decir, que usemos los dı́gitos binarios hh 0, 1 ii para reescribir

1984 = c0 + c1 · 2 + c2 · 22 + · · · + cn · 2n ,

con ck = 0 ó 1. Observando que

N = c0 + c1 · 2 + c2 · 22 + · · · + cn · 2n = c0 + (c1 + c2 · 2 + · · · + cn · 2n−1 ) · 2
= c0 + (c1 + (c2 + · · · + cn · 2n−2 ) · 2) · 2 = · · · = c0 + (c1 + (c2 + (· · · + (cn · 2) · · · 2) · 2) · 2,

se vislumbra un procedimiento para ir obteniendo los ck : c0 es el resto de la división de N por 2; si


N1 es el cociente, c1 es el resto de la división de N1 por 2; si N2 es el cociente resultante, c2 es el
resto de la división de N2 por 2; si . . . etc., hasta cn−1 , mientras que cn es el último cociente. Por
tanto, dividiendo por 2 sucesivamente,
58 CAPÍTULO 2. NÚMEROS NATURALES Y ENTEROS

1984 992 496 248 124 62 31 15 7 3 1


restos 0 0 0 0 0 0 1 1 1 1

lo que deja

1984 = 0 + 0 · 2 + 0 · 22 + 0 · 23 + 0 · 24 + 0 · 25 + 1 · 26 + 1 · 27 + 1 · 28 + 1 · 29 ,

que por analogı́a escribirı́amos


11111000000(2

o con alguna notación similar que destaque que se trata de una representación binaria.
¿Qué interés puede tener una representación ası́, disponiendo como disponemos de nuestra
‘confortable’ notación decimal? El creador del sistema binario, Leibniz, lo veı́a, entre otras cosas,
como una imagen del ‘misterio de la creación’: el 1 representaba a Dios y el 0 la Nada, de la que
todas las cosas fueron creadas. Trescientos años más tarde, resulta que la mayorı́a de los ordenadores
actuales manejan los números a través de su representación binaria, que luego convierten en decimal.
La ventaja que esto ofrece es que cada número se registra en “bits” (binary digits) y cada bit se
corresponde con uno de dos estados posibles (pasa corriente o no pasa). Estas dos condiciones
corresponden a los valores 1 y 0, respectivamente. Ası́, un número representado por una sucesión
de 1 y 0 puede almacenarse en un ordenador como una cadena de bits.
Pero la gran ventaja del sistema binario, que sólo necesita dos caracteres, es a veces su gran
inconveniente: incluso los números pequeños requieren muchas cifras en su escritura. Los números
en representación binaria son, por tanto, muy largos y de manejo incómodo. Pese a ello, como los
ordenadores están formados por dispositivos digitales que sólo tienen dos estados estables posibles,
asimilados a 0 y a 1, puede decirse que casi todos ellos ‘trabajan’ en sistema binario.
Para paliar los inconvenientes del sistema binario hay distintas soluciones. Como comprobaremos
inmediatamente, cualquier entero b mayor o igual que 2 puede tomarse como base de un sistema de
numeración. Si la base b es una potencia de 2, la ‘traducción’ del sistema binario a esta base es muy
cómoda. Por esto, algunos programas de ordenador, sobre todo cuando se trabaja en lenguajes de
ensambladores o en lenguajes de alto nivel como C, emplean el sistema octal (base 8), con dı́gitos
hh 0, 1, 2, 3, 4, 5, 6, 7 ii, o el hexadecimal, usado también en el mundo de la comunicación (las cifras

hexadecimales son hh 0, 1, 2, 3, 4, 5, 6, 7, 8, 9, A, B, C, D, E, F ii).


Todas estas representaciones son ejemplos particulares de notaciones posicionales: un mismo
sı́mbolo (un dı́gito) tiene distinto valor según la posición que ocupe. Cada ‘lugar’ tiene un ‘peso’,
que en nuestro caso corresponde a las potencias sucesivas 1 = b0 , b = b1 , b2 , b3 , . . . , de la base b. 2
Que es posible usar cualquier entero b mayor o igual que 2 como base de un sistema de nume-
ración se sigue de una aplicación reiterada de la división entera.

Proposición 2.2.4 (Teorema fundamental de la numeración). Dado un entero b ≥ 2, todo


entero positivo n se escribe de manera única en la forma

n = ck bk + ck−1 bk−1 + · · · + c1 b + c0 , (2.1)

con cj ∈ Z, 0 ≤ cj < b (1 ≤ j ≤ k) y ck 6= 0. Para indicar esta igualdad escribiremos

n = (ck ck−1 . . . c1 c0 )b , ó también n = ck ck−1 . . . c1 c0 (b ,

y diremos que ésta es la representación de n en la base b.


2
El lector conoce representaciones que no son posicionales: la numeración romana, la ‘notación cientı́fica’. Obsérvese
que todas representaciones son convencionales, y es la clase de uso y manipulación a la que están destinadas la que
marca su conveniencia y utilidad.
2.2. NÚMEROS ENTEROS. 59

Demostración. Probaremos la existencia de representación mediante el principio de inducción com-


pleta. Llamemos Pn al enunciado
n admite una representación del tipo (2.1).
Entonces P1 es cierta, con k = 0 y c0 = 1.
Supongamos cierta Pm para todo m ≤ n, y demostremos que es cierta Pn+1 .
Dividiendo n + 1 por b, obtendremos n + 1 = mb + r, con 0 ≤ r < b y m ≥ 0.
Pero forzosamente m ≤ n, ya que en caso contrario serı́a m > n, luego m ≥ n + 1, y en tal caso
mb ≥ (n + 1)b > n + 1 (recordemos que b ≥ 2), con lo cual
n + 1 = mb + r ≥ mb > n + 1,
imposible.
Ası́ pues, si m = 0, n + 1 = r con 0 < r < b, que es una representación del tipo (2.1). Y si
m 6= 0, por la hipótesis de inducción tendremos
m = ck bk + ck−1 bk−1 + · · · + c1 b + c0 ,
con 0 ≤ cj < b (1 ≤ j ≤ k) y ck 6= 0, luego
n + 1 = mb + r = ck bk+1 + ck−1 bk + · · · + c1 b2 + c0 b + r,
que nos da la representación del tipo (2.1) que estábamos buscando.
Comprobada la existencia de representación, demostremos su unicidad. Como
n = ck bk + ck−1 bk−1 + · · · + c1 b + c0 = (ck bk−1 + ck−1 bk−2 + · · · + c1 )b + c0 , 0 ≤ c0 < b,
resulta que c0 es el resto de la división entera de n por b, determinado unı́vocamente por n y b,
luego c0 es único. A su vez, el cociente de esa división, unı́vocamente determinado por n y b, es
q = ck bk−1 + ck−1 bk−2 + · · · + c1 ,
y reiterando el argumento anterior vamos obteniendo que los c1 , . . . , ck−1 están unı́vocamente
determinados como restos de las sucesivas divisiones por b, y ck como cociente de la última división,
que se produce cuando llegamos a un cociente < b. Esto prueba la unicidad.
La demostración anterior proporciona además un algoritmo ‘teórico’ para calcular los cj me-
diante divisiones sucesivas ‘en escalera’ por la base b; esquemáticamente
n |b
c0 n1 |b
..
c1 n2 . |b
nk−1 |b
ck−1 ck |b
ck 0
En dirección contraria, de la representación de un número en base b podemos obtener el valor
‘teórico’ directamente de la propia definición
n = ck bk + ck−1 bk−1 + · · · + c1 b + c0
o, con un menor número de operaciones, mediante el conocido algoritmo de Horner-Ruffini:
ck ck−1 ck−2 ··· c1 c0
ck b 2
ck b + ck−1 b ··· ckbk−1 + · · · + c2 b k
ck b + · · · + c1 b
b)
ck ck b + ck−1 ck b2 + ck−1 b + ck−2 · · · ck bk−1 + · · · + c1 ck bk + · · · + c1 b + c0
Pero, en la práctica, los cálculos ‘de verdad’ con números ¡se realizan sobre sus representaciones!
Eso supone disponer de buenos algoritmos para llevar a cabo las operaciones aritméticas (i.e., para
sumar, restar, multiplicar, dividir). En base 10, sabemos cómo efectuar estas operaciones, aunque
quizá no nos hayamos preguntado el por qué de ese cómo. Ahora es buen momento.
60 CAPÍTULO 2. NÚMEROS NATURALES Y ENTEROS

Si se tiene presente el significado de la representación en base b, las ‘reglas tradicionales’ para


efectuar las operaciones aritméticas en base 10 quedan perfectamente justificadas (sumar “llevan-
do”, multiplicar por un número de varias cifras en filas sucesivas desplazadas un lugar a la izquierda,
etc.) Y, lo que es aún mejor, vemos que las mismas reglas son adaptables para efectuar estas ope-
raciones en cualquier base. Por ejemplo, como en base 2 es 0 + 0 = 0, 1 + 0 = 1, pero 1 + 1 = 10, si
sumamos dos números de varias cifras a la manera tradicional, sólo hemos de tener la precaución de
“llevar 1” cuando sumemos 1 + 1. Supongamos que se trata de calcular m + n, donde m = 100110(2
y n = 11011(2 ; entonces

m + n = (1 · 25 + 0 · 24 + 0 · 23 + 1 · 22 + 1 · 21 + 0) + (1 · 24 + 1 · 23 + 0 · 22 + 1 · 21 + 1)
= (1 + 0) · 25 + (0 + 1) · 24 + (0 + 1) · 23 + (1 + 0) · 22 + (1 + 1) · 21 + (0 + 1)
= (1 + 0) · 25 + (0 + 1) · 24 + (0 + 1) · 23 + (1 + 0) · 22 + (1 + 1) · 21 + 1
= (1 + 0) · 25 + (0 + 1) · 24 + (0 + 1) · 23 + (1 + 0) · 22 + (1 · 2 + 0) · 21 + 1
= (1 + 0) · 25 + (0 + 1) · 24 + (0 + 1) · 23 + (1 + (1 + 0)) · 22 + 0 · 21 + 1
= (1 + 0) · 25 + (0 + 1) · 24 + (0 + 1) · 23 + (1 · 2 + 0) · 22 + 0 · 21 + 1
= (1 + 0) · 25 + (0 + 1) · 24 + (1 + (0 + 1)) · 23 + 0 · 22 + 0 · 21 + 1
= etc.,

que es lo que que realmente queremos indicar cuando escribimos, prescindiendo del subı́ndice (2 por
comodidad,
“llevo” : +1 +1 +1 +1 +1
m: 1 0 0 1 1 0
n: 1 1 0 1 1
m+n: 1 0 0 0 0 0 1
Análogamente se van adaptando las operaciones más complicadas.

Cambios de base
Establecida la existencia y unicidad de representación en cualquier base b ≥ 2, la cuestión que
se suscita inmediatamente es: ¿cómo pasar de la representación de un número n en una base b a
la representación en una nueva base β? Cuando entre b y β no haya ninguna relación ‘especial’, no
podemos apelar a más recursos que los que hemos señalado en el apartado anterior. Por ejemplo,
ya hemos visto cómo expresar el número decimal 1984 en base 2, y si nos dan un número binario
como 11010011(2 , su representación decimal serı́a

1 1 0 1 0 0 1 1
2) 2 6 12 26 52 104 210
1 3 6 13 26 52 105 211
Pero en circunstancias especiales puede haber simplificaciones. Esto sucede, en particular, si
una de las bases es una potencia de la otra, como es el caso cuando se considera b = 2 y β = 8 = 23 ,
o b = 2 y β = 16 = 24 . En la primera situación, como

n = c0 + c1 · 2 + c2 · 22 + c3 · 23 + c4 · 24 + c5 · 25 + c6 · 26 + c7 · 27 + c8 · 28 + c9 · 29 + · · ·
= (c0 + c1 · 2 + c2 · 22 ) + (c3 + c4 · 2 + c5 · 22 ) · 23 + (c6 + c7 · 2 + c8 · 22 ) · (23 )2 + · · · ,

con los cj = 0 o 1, es obvio que si n = d0 + d1 · 8 + d2 · 82 + · · · , con los dk enteros no negativos


< 8, por la unicidad de representación, necesariamente

d0 = c0 + c1 · 2 + c2 · 22 , d1 = c3 + c4 · 2 + c5 · 22 , d2 = c6 + c7 · 2 + c8 · 22 , ...

lo que nos lleva a la siguiente regla:


2.2. NÚMEROS ENTEROS. 61

para cambiar la representación de un número en base 2 a base 8, se agrupan las ci-


fras binarias de tres en tres, de derecha a izquierda, y se sustituye cada grupo por su
expresión en base 8.

Por ejemplo:
1100100101010(2 → [1][100][100][101][010] → 14452(8 .

Y recı́procamente,

para cambiar la representación de un número en base 8 a base 2, cada dı́gito octal se


sustituye por las tres cifras binarias que lo representan en base 2 (incluyendo ceros a la
izquierda cuando sea preciso).

Por ejemplo,

537264(8 → [101][011][111][010][110][100] → 101011111010110100(2 .

Razonando análogamente, cuando b = 2, β = 16, se agrupan/sustituyen cifras en/por blo-


ques de cuatro. Facilita las cosas disponer de una tabla de ‘equivalencias en binario’ de las cifras
hexadecimales (D significa ‘decimal’, B ‘binario’, H ‘hexadecimal’):

D 0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15
B 0 1 10 11 100 101 110 111 1000 1001 1010 1011 1100 1101 1110 1111
H 0 1 2 3 4 5 6 7 8 9 A B C D E F

Recursos informáticos

Los programas de cálculo permiten, por lo general, obtener las cifras de cualquier representación
en una base dentro de tamaños ‘no disparatados’.

En maple , se dispone de la orden


convert(n,base,β);
donde n es un número decimal y β la nueva base, que da una lista con los dı́gitos de la representación
del número en base β. Por ejemplo, convert(17,base,3); da [2,2,1]. Otra opción es
convert(`,base,α,β);
donde ` es una lista de cifras en base α y β la nueva base, que devuelve una lista con los dı́gitos en
base β que representan el mismo número. Por ejemplo, convert([2,2,1],base,3,10); da [7,1].

En Mathematica , la orden
IntegerDigits[n,b]
da una lista de los dı́gitos en base b del número decimal n, mientras que
b^^n
donde n es la representación en base b de un número, da el valor decimal del número. Por ejemplo,
IntegerDigits[10!] da {3, 6, 2, 8, 8, 0, 0},
IntegerDigits[10!,2] da {1,1,0,1,1,1,0,1,0,1,1,1,1,1,0,0,0,0,0,0,0,0},
y 16^^16c91a3 da 23892387.

En la red es fácil encontrar applets de Java que realizan conversiones de base interactivamente.
P. ej., en la siguiente dirección puede pasarse ‘instantáneamente’ de base decimal a base binaria y
viceversa.
http://www.vincesplace.com/TraditionalCourses/cis121/assignments/BinaryNum/BinaryNum.htm
62 CAPÍTULO 2. NÚMEROS NATURALES Y ENTEROS

Ejercicios
8.1. Convertir a sistema decimal y binario los números hexadecimales ACABA y FE0.
8.2. En el sistema hexadecimal, ¿es cierto que B0B0 + A0A = BABA?
8.3. Sin pasar a representación decimal, ¿cómo efectuarı́as en base 2 las sumas 1011(2 + 11(2 y
101110(2 + 100011(2 ?

Para debatir. Puesto que 2 + 2 = 11 en base 3 y 2 + 2 = 10 en base 4, ¿habrá que cambiar la


frase hecha hh esto es tan cierto como que dos y dos son cuatroii a hh esto es tan cierto como que dos
y dos son cuatro . . . en base diezii? (Una buena discusión deberı́a empezar con la distinción entre
‘sı́mbolo’ o ‘representación’ y ‘cosa representada’.)

2.2.4. Máximo común divisor. Algoritmo de Euclides.


Definición 2.2.5. Sean a, b ∈ Z. Decimos que a divide a b, o que a es un divisor o un factor
de b, o que b es múltiplo de a, escrito a|b, si existe c ∈ Z tal que b = ac; expresado de otra forma,
si el resto de la división de b por a es 0. Diremos entonces que c es el cociente exacto b/a o el
cofactor de a.

Proposición 2.2.6. La divisibilidad tiene las siguientes propiedades: dados enteros arbitrarios a,
b, d, m, n,
(i) n|n (propiedad reflexiva)
(ii) d|n y n|m implica d|m (propiedad transitiva)
(iii) d|n y d|m implica d|(an + bm) (propiedad de linealidad)
(iv) d|n implica ad|an (propiedad de multiplicación)
(v) ad|an y a 6= 0 implica d|n (ley de cancelación)
(vi) 1|n, −1|n (1 y −1 dividen a cualquier entero)
(vii) m|n ⇐⇒ −m|n ⇐⇒ m| − n (y ası́ m|n ⇐⇒ |m|||n|)
(viii) n|0 (todo entero divide a 0)
(ix) 0|n implica n = 0 (0 sólo divide a 0)
(x) d|n y n 6= 0 implica |d| ≤ |n| (propiedad de comparación)
(xi) d|n y n|d implica |d| = |n| (antisimetrı́a ‘parcial’)
(xii) d|n y d 6= 0 implica (n/d)|n (n/d se llama también divisor conjugado de d)

Demostración. Probemos, por ejemplo, (x). Si d|n y n 6= 0, |n| = |d| · m para algún m ∈ Z; pero
necesariamente m ≥ 0 y m 6= 0, luego m ≥ 1 y |n| ≥ |d|.

Máximo común divisor


Si a, b, son números enteros no nulos, existe m = máx F , donde F = {k ∈ Z : k|a, k|b} (1 y −1 ∈ F ,
y k ∈ F =⇒ k ≤ mı́n{|a|, |b|}, y podemos aplicar el principio del máximo). Además, m ≥ 1 (1 ∈ F ),
luego m ∈ N; de hecho, m = máx{k ∈ N : k|a, k|b}. Esto justifica la siguiente definición.

Definición 2.2.7. Sean a, b, números enteros no nulos. Su máximo común divisor es el mayor
número, natural siempre, que divide a a y b simultáneamente. Lo denotaremos por mcd(a, b).
A veces se amplı́a la definición poniendo mcd(a, 0) = |a|, mcd(0, 0) = 0.

Para calcular el máximo común divisor de dos números no hace falta más herramienta que la
división entera, como justifican los siguientes resultados.

Lema 2.2.8. Si a, b, son números enteros no nulos tales que a = cb + r, se tiene que mcd(a, b) =
mcd(b, r).
2.2. NÚMEROS ENTEROS. 63

Demostración. Si k es un divisor común de a y b, como r = a − cb, por la propiedad (iii) de


linealidad k es un divisor de r, y por tanto todo divisor común de a y b es un divisor común de b
y r.
Recı́procamente, si k 0 es un divisor común de b y r, como a = cb + r, nuevamente por la
propiedad (iii) de linealidad k 0 es un divisor de a, y por tanto todo divisor común de b y r es un
divisor común de a y b.
En consecuencia, el conjunto de divisores comunes a a y b es el mismo que el de divisores
comunes a b y r. Aplicando la definición, mcd(a, b) = mcd(b, r), como querı́amos probar.

Lema 2.2.9. Si a, b, son números enteros no nulos tales que b | a, entonces mcd(a, b) = |b|.

Demostración. Ciertamente |b| es un divisor común de b y a en estas circunstancias; y si k es un


entero positivo que divide a b, k ≤ |b| según hemos señalado anteriormente, luego mcd(a, b) = |b|.

Supongamos ahora que tratamos de calcular el máximo común divisor de dos números de buen
tamaño, 1769 y 551 por ejemplo. Haciendo la división entera, 1769 = 3×551+116, y según el primer
lema, d = mcd(1769, 551) = mcd(551, 116). A su vez, 551 = 4 × 116 + 87, luego d = mcd(116, 87).
Pero 116 = 87 + 29 y 87 = 3 × 29, con lo que finalmente d = mcd(87, 29) = 29 (segundo lema).
¿Hemos tenido suerte? Si reflexionamos un momento sobre el proceso seguido, vemos que puede
aplicarse a enteros positivos arbitrarios a y b: pues tomando como a el mayor y b el menor (si son
iguales no necesitamos hacer cuentas), al efectuar la división entera de a por b obtenemos un resto
no negativo r1 estrictamente menor que b; si r1 = 0, ya tenemos el máximo común divisor de a
y b (= b, segundo lema); si no, d = mcd(a, b) = mcd(b, r1 ), con la ventaja de que hemos pasado a
números más pequeños, y dividiendo b por r1 pasarı́amos a d = mcd(a, b) = mcd(r1 , r2 ), donde r2
es el resto de la división de b por r1 , estrictamente menor que r1 . Reiterando, puesto que en el
peor de los casos irá disminuyendo al menos en 1 el valor de los restos, al cabo de un número finito
de pasos hemos de llegar a resto 0, y podemos aplicar el segundo lema para concluir que el divisor
actual (resto del paso anterior) es el máximo común divisor.
Formalizando este proceso, conocido ya por Euclides, tenemos (ver [C-C-S]):

Definición 2.2.10. Algoritmo de Euclides.

• Input: dos enteros positivos a y b.

• Output: el máximo común divisor de a y b.

Paso 1: Reemplazar (simultáneamente)


 a por b, y
 b por el resto de la división de a por b.
Paso 2: Repetir el Paso 1 hasta que b sea 0.
Paso 3: Devolver a.

Podemos esquematizarlo de la siguiente manera:

restos & r1 r2 r3 ······ rn−1 0


dividendos ← divisores a b r1 r2 ······ rn−2 rn−1 = d
cocientes c1 c2 c3 ······ cn−1 cn

y entonces d = mcd(a, b) como hemos probado anteriormente.


64 CAPÍTULO 2. NÚMEROS NATURALES Y ENTEROS

Proposición 2.2.11. Algoritmo de Euclides. Dados dos números enteros positivos a y b con
a > b, obtenemos su máximo común divisor d = mcd(a, b) procediendo por divisiones enteras
sucesivas, como se ha indicado anteriormente, hasta obtener resto nulo. El máximo común divisor
de a y b es entonces el último resto no nulo.
La hipótesis de que a y b sean enteros positivos no supone ninguna restricción esencial, dado
que mcd(a, b) = mcd(|a|, |b|). Por tanto, el algoritmo de Euclides basta para poder calcular el
máximo común divisor de dos enteros no nulos arbitrarios. Hay además una información importante
contenida en él, que merece la pena destacar como se verá en aplicaciones posteriores: el máximo
común divisor de a y b es una “combinación lineal de a y b con coeficientes enteros”.
Proposición 2.2.12. Identidad de Bézout. Sean a y b enteros no nulos, y d = mcd(a, b).
Entonces existen enteros u, v tales que

d = ua + vb.

Demostración. Supongamos primero que a y b son positivos, y apliquémosles el algoritmo de Eu-


clides, de modo que con la notación previa

r1 = a − c1 b, r2 = b − c2 r1 , rk = rk−2 − ck rk−1 (3 ≤ k < n),

siendo precisamente d = rn−1 . Por tanto

d = rn−1 = rn−3 − cn−1 rn−2 = sn−1 rn−3 + tn−1 rn−2 = sn−1 rn−3 + tn−1 (rn−4 − cn−2 rn−3 )
= sn−2 rn−4 + tn−2 rn−3 = · · · = sk rk−2 + tk rk−1 = · · · = s1 a + t1 b,

donde todos los sk , tk son enteros. Por tanto, u = s1 , v = t1 cumplen la tesis.


Si a o b son negativos, recordemos que también d = mcd(|a|, |b|), y si p. ej. a < 0, b > 0, sabiendo
que d = u|a| + v|b|, será igualmente d = (−u)(−a) + vb. De la misma forma pueden resolverse los
casos restantes.

Nota. Los coeficientes u y v no son únicos: obsérvese, por ejemplo, que

d = ua + vb = (u + nb)a + (v − na)b

cualquiera que sea n ∈ Z.


Una variante de la demostración anterior, más farragosa, permite fabricar un algoritmo para el
cálculo de unos valores de u, v. Manteniendo la notación para los cocientes y restos, y comenzando
por el principio,

a = 1 · a + 0 · b = u0 a + v0 b, b = 0 · a + 1 · b = u1 a + v1 b, r1 = 1 · a − c1 b = u2 a + v2 b,
r2 = −c2 a + (1 + c1 c2 )b = u3 a + v3 b,

y, en general, si rk = uk+1 a + vk+1 b, rk+1 = uk+2 a + vk+2 b, también

rk+2 = rk − ck+2 rk+1 = (uk+1 − ck+2 uk+2 )a + (vk+1 − ck+2 vk+2 )b = uk+3 a + vk+3 b

si ponemos uk+3 = uk+1 − ck+2 uk+2 , vk+3 = vk+1 − ck+2 vk+2 .


Para que intervengan sólo dos ı́ndices consecutivos, introducimos xk = uk+1 , yk = vk+1 , con lo
que queda
xk+2 = uk+1 − ck+2 xk+1 , yk+2 = vk+1 − ck+2 yk+1 ,
y finalmente
d = rn−1 = xn−1 a + yn−1 b = un a + vn b.
Ordenando el proceso anterior se obtiene el siguiente algoritmo:
2.2. NÚMEROS ENTEROS. 65

Definición 2.2.13. Algoritmo de Euclides extendido (Euclides-Bézout).

• Input: dos enteros positivos a y b.

• Output: dos enteros u y v tales que mcd(a, b) = ua + vb.

Paso 1: Hacer u = y = 1 y v = x = 0.
Paso 2: Determinar c y r tales que a = cb + r y 0 ≤ r < b.
Reemplazar
 a por b, y b por r,
 u por x y v por y,
 x por u − cx e y por v − cy.
Paso 3: Repetir el Paso 2 hasta que b sea 0.
Paso 4: Devolver u y v.

Visualizado en forma de tabla:

restos & r1 r2 r3 ······ rn−1 0


dividendos ← divisores a b r1 r2 ······ rn−2 rn−1 = d
cocientes c c1 c2 c3 ······ cn−1 cn
uk+1 =xk 1 0 1 ··· ······ un−1 u
vk+1 =yk 0 1 −c1 ··· ······ vn−1 v
xk+1 =uk −ck+1 xk 0 1 −c2 ··· ······ xn−1 = u
yk+1 =vk −ck+1 yk 1 −c1 1 + c1 c2 ··· ······ yn−1 =v

Ejemplo. Apliquemos este algoritmo a los números considerados anteriormente, a = 1769, b = 551,
para los que ya hemos visto que mcd(a, b) = 29 (volveremos a obtenerlo).

restos & 116 87 29 0


dividendos ← divisores 1769 551 116 87 29
cocientes c 3 4 1 3
uk+1 =xk 1 0 1 −4 5
vk+1 =yk 0 1 −3 13 -16
xk+1 =uk −ck+1 xk 0 1 −4 5 —
yk+1 =vk −ck+1 yk 1 −3 13 -16 —

Efectivamente, 29 = 5 · 1769 − 16 · 551.


El recı́proco de la proposición 3.2.15 no es cierto en general: por ejemplo, 441 − 18 · 24 = 9,
mientras que mcd(441, 24) = 3. Sin embargo, lo es en una situación especial.

Definición 2.2.14. Dos números enteros no nulos a y b se dicen relativamente primos o


primos entre sı́ si no tienen más divisores comunes que 1 y −1, es decir, si mcd(a, b) = 1.

Corolario 2.2.15. Dos números enteros no nulos a y b son relativamente primos si y sólo si
existen dos números enteros u y v tales que ua + vb = 1.

Demostración. Si a y b son relativamente primos, la igualdad del enunciado es un caso particular


de la identidad de Bézout.
Supongamos ahora que tenemos enteros u y v para los que se verifica ua + vb = 1. Si k es un
divisor común de a y b, por linealidad k es un divisor de 1 y por tanto |k| = 1 y mcd(a, b) = 1.
66 CAPÍTULO 2. NÚMEROS NATURALES Y ENTEROS

Ejemplo. Puesto que para todo entero positivo k es

−3(5k + 3) + 5(3k + 2) = 1,

se sigue que 5k + 3 y 3k + 2 son relativamente primos.


Ejercicio. Dados dos números enteros no nulos a y b relativamente primos, probar que el máximo
común divisor de a + b y a − b es 1 o 2.
Respuesta. Existen u, v ∈ Z tales que ua + vb = 1. Si k es un divisor común de a + b y a − b, por
linealidad k divide a (a + b) + (a − b) = 2a y a (a + b) − (a − b) = 2b; nuevamente por linealidad,
dividirá a 2au + 2bv = 2. Por tanto |k| = 1 o |k| = 2, de donde se sigue que mcd(a + b, a − b) = 1 o
mcd(a + b, a − b) = 2.

Ecuaciones diofánticas lineales


Una aplicación importante de la identidad de Bézout es el estudio de las soluciones de las ecuaciones
(lineales) diofánticas, es decir, ecuaciones en las que se buscan solamente soluciones enteras, que
aparecen en contextos más serios pero también en acertijos como el siguiente:
hh ¿Puede llenarse exactamente un depósito de agua de 56 l. transportándola con un cubo de 6 l.

y otro de 9 l.? ¿Y un depósito de 57 l.? En caso afirmativo, ¿cuál es el número mı́nimo de viajes
que hay que realizar con los cubos para llenar el depósito? ii
Planteamiento: ¿6x + 9y = 56 tiene soluciones x, y ∈ N0 ? ¿6x + 9y = 57 tiene soluciones x,
y ∈ N0 ? ¿cuáles?
Para responder en general, comenzamos por un lema.

Lema 2.2.16. Sean a, b, d, m, p, q números enteros, ab 6= 0.

(i) si d = mcd(a, b), a = pd, b = qd, entonces mcd(p, q) = 1 (es decir, p y q son relativamente
primos).

(ii) si mcd(p, q) = 1 y p | qm, entonces p | m.

Demostración.
(i) Existen u, v ∈ Z tales que ua + vb = d, luego d(up + vq) = d; cancelando d se deduce que
up + vq = 1, y por tanto que mcd(p, q) = 1.
(ii) Existen u, v ∈ Z tales que up + vq = 1, con lo cual upm + vqm = m. A su vez, existe n ∈ Z
tal que pn = qm. Sustituyendo qm por pn y sacando factor común p resulta p(um + vn) = m, es
decir, p divide a m como querı́amos demostrar.

Corolario 2.2.17 (Resolubilidad de ecuaciones diofánticas). Sean a 6= 0, b 6= 0, c, tres


números enteros y d = mcd(a, b). La ecuación

ax + by = c

tiene soluciones enteras si y sólo si d|c.

Demostración. Sea ax + by = c para ciertos enteros x, y. Como d|a y d|b, por la propiedad (iii) de
linealidad, d|c.
Recı́procamente, supongamos que d|c, es decir, c = kd para algún k ∈ Z. Puesto que existen
enteros u, v, para los que d = ua + vb, multiplicando por k obtenemos c = kd = kua + kvb, es decir,
x = ku, y = kv nos da una solución de la ecuación propuesta.

Nótese que la segunda parte de la demostración nos proporciona una solución concreta mediante
la identidad de Bézout. ¿Habrá otras? Vamos a comprobar que o bien no existe solución o bien hay
infinitas, que se pueden construir a partir de una cualquiera de ellas.
2.2. NÚMEROS ENTEROS. 67

Proposición 2.2.18. Sean a 6= 0, b 6= 0, c, tres números enteros; si el par (x0 , y0 ) ∈ Z × Z


constituye una solución particular de la ecuación diofántica ax + by = c, todas las soluciones
enteras de esta ecuación son de la forma

x = x0 + (b/d)n, y = y0 − (a/d)n, n ∈ Z,

donde d = mcd(a, b).

Demostración. Pongamos p = a/d, q = b/d.


Si ax0 + by0 = c, los x, y del enunciado son soluciones de la ecuación, es decir, si x = x0 + qn e
y = y0 − pn para algún entero n,

ax + by = a(x0 + qn) + b(y0 − pn) = (ax0 + by0 ) + aqn − bpn = c + (pd)qn − (qd)pn = c.

Recı́procamente, si x, y son soluciones enteras de la ecuación, son de la forma especificada en


el enunciado. En efecto: de

ax0 + by0 = c, ax + by = c, se sigue a(x − x0 ) + b(y − y0 ) = 0;

por tanto, dividiendo por d = mcd(a, b), podemos reescribir la última igualdad como

p(x − x0 ) = q(y0 − y). [∗]

Ası́, p divide a q(y0 − y). Pero, aplicando las dos partes del lema, mcd(p, q) = 1 y en consecuencia
p divide a y0 − y. Existe, pues, un n ∈ Z tal que y0 − y = pn, es decir, y = y0 − pn. Sustituyendo
este valor de y en la ecuación [∗], resulta finalmente x = x0 + qn, como querı́amos probar.

Ejemplo. De las ecuaciones que habı́amos dejado planteadas, 6x + 9y = 56 no tendrá solución y


6x + 9y = 57 sı́, puesto que mcd(6, 9) = 3. Como 57 = 19 · 3, 9 = 6 + 3, (−1)6 + 9 = 3, se sigue que
(−19)6 + 19 · 9 = 57, lo que da como únicas soluciones con coeficientes positivos

n 7 8 9
x = −19 + 3n 2 5 8
y = 19 − 2n 5 3 1

La primera combinación es la que requiere menor número de viajes.


Nota. Sistematizando el proceso desarrollado en las páginas anteriores, obtenemos (v. [C-C-S], pp.
5–6) el siguiente

Algoritmo de resolución de ecuaciones diofánticas lineales

• Input: enteros a, b, c, con a y b no ambos nulos.

• Output: todas las soluciones enteras x, y de la ecuación xa + yb = c.

Paso 1: Encontrar, usando el algoritmo de Euclides extendido, enteros u, v tales que


d := mcd(a, b) = ua + vb.
Paso 2: Si d no divide a c, devolver ‘NO HAY SOLUCIONES DE LA ECUACIÓN’.
Paso 3: Si d divide a c, devolver entonces x = (uc − nb)/d y y = (vc + na)/d, con n ∈ Z.
68 CAPÍTULO 2. NÚMEROS NATURALES Y ENTEROS

Mı́nimo común múltiplo

Emparejado con el concepto de máximo común divisor suele ir el de mı́nimo común múltiplo.
Dados a, b ∈ Z \ {0}, siempre hay enteros positivos que son múltiplos simultáneamente de a y b:
por ejemplo, |ab|. El conjunto F = {z ∈ N : a|z, b|z} es, pues, no vacı́o; por el principio de buena
ordenación, existe m = mı́n F , por lo que podemos enunciar la definición siguiente.

Definición 2.2.19. Sean a, b, números enteros no nulos. Su mı́nimo común múltiplo es el


menor número entero positivo que es múltiplo de a y b simultáneamente. Se escribe mcm(a, b).
(Si ab = 0, se pone a veces mcm(a, b) = 0.)

Si ab 6= 0 y a < 0 o b < 0, podemos reducir el cálculo de su mı́nimo común múltiplo al de los


números positivos |a|, |b|; y cuando a y b son positivos, podemos hallar su mı́nimo común múltiplo
conociendo el máximo común divisor, gracias a:

Proposición 2.2.20. Sean a, b, números enteros positivos. Entonces

mcm(a, b) · mcd(a, b) = ab.

Demostración. Sea d = mcd(a, b), a = pd, b = qd, con lo cual mcd(p, q) = 1.


Si n = p0 a = q 0 b es cualquier múltiplo (positivo) común de a y b, será n = p0 pd = q 0 qd, de donde
p0 p = q 0 q, luego p|q 0 q siendo p y q relativamente primos, y en consecuencia p|q 0 . Entonces q 0 = cp
para algún c y sustituyendo, n = cpb = c(ab/d), con lo que (ab/d) ≤ n.
Como (ab/d) = pb = qa es un múltiplo común de a y b, se sigue que mcm(a, b) = (ab/d).

1769 × 551
Ejemplo. mcm(1769, 551) = = 61 × 551 = 33611.
29

Cálculos con maple y Mathematica

Finalizamos este apartado indicando una serie de recursos de maple y Mathematica que
generalmente sustituyen con ventaja el cálculo ‘a mano’ de los objetos encontrados a lo largo del
mismo. Esto hace innecesario insistir en los ejercicios que se reducen a un mero cálculo, pero todo
matemático debe estar en condiciones de resolverlos incluso cuando falla el suministro eléctrico,
por lo que recomendamos ejercitarse manualmente (sin exagerar) en los algoritmos que hemos ido
exponiendo, y utilizar el ordenador para comprobar los resultados.
La explicación detallada del funcionamiento de las órdenes aquı́ recogidas se encuentra en los
manuales o en la ayuda de los propios programas.
• maple (a, b, c,. . . datos)

entrada salida comentario


igcd(a,b,...); mcd(a, b, . . . )
ilcm(a,b,...); mcm(a, b, . . . )
mcd(a, b)
igcdex(a,b,’s’,’t’);s;t; s mcd(a, b) = sa + tb
t
(x0 , y0 ) solución particular,
b0 = b/d, a0 = a/d,
isolve(a*x+b*y=c,x,y); {x = x0 − b0 Z1, y = y0 + a0 Z1}
(d = mcd(a, b)),
Z1 entero arbitrario
2.2. NÚMEROS ENTEROS. 69

• Mathematica (a, b, c,. . . datos)

entrada salida comentario


GCD[a,b,...] mcd(a, b, . . . )
LCM[a,b,...] mcm(a, b, . . . )
{g,{r,s}}=ExtendedGCD[n=a,m=b,...] g, r, s g = mcd(a, b) = ra + sb
Solve[a*x==c && Modulus==b,x] (ver ejemplo) algunos x soluciones de ax + by = c
Solve[b*y==c && Modulus==a,y] (ver ejemplo) algunos y soluciones de ax + by = c

Ejemplos.
(1) Identidad de Bézout con maple :

igcdex(1027,712,’s’,’t’);s;t;
1
-165
238

(2) Identidad de Bézout con Mathematica :

In[1]:= {g, {r, s}} = ExtendedGCD[n = 1027, m = 712]

Out[1]= {1, {-165, 238}}

(3) Ecuaciones diofánticas lineales con maple :

isolve(8*x+12*y=20);

{x = 1 - 3 _Z1, y = 1 + 2 _Z1}

(4) Ecuaciones diofánticas lineales con Mathematica :

In[1]:=
Solve[8 x == 20 && Modulus == 12, x ]

Out[1]=
{{Modulus -> 12, x -> 1}, {Modulus -> 12, x -> 4},
{Modulus -> 12, x -> 7}, {Modulus -> 12, x -> 10}}

In[2]:=
Solve[12 y == 20 && Modulus == 8, y ]

Out[2]=
{{Modulus -> 8, y -> 1}, {Modulus -> 8, y -> 3},
{Modulus -> 8, y -> 5}, {Modulus -> 8, y -> 7}}

Ejercicios
9.1. Probar que c|a, c|b =⇒ c| mcd(a, b); a|c, b|c =⇒ mcm(a, b)|c.
(N.B. Estas propiedades no están incluidas en las definiciones: hablamos en ellas de máximo y
mı́nimo para la relación de orden, y lo que se pide aquı́ es probar que son igualmente máximo y
mı́nimo para la relación de divisibilidad en N)
9.2. Calcular d = mcd(1320, 714) y escribir d = 1320x + 714y con x, y ∈ Z.
70 CAPÍTULO 2. NÚMEROS NATURALES Y ENTEROS

9.3. Calcular mcd(a, b) y encontrar todas las soluciones de ax + by = mcd(a, b) en los siguientes
casos:
(1) a = 63, b = 49; (2) a = 619, b = 93; (3) a = 521, b = 2187.

9.4. Hallar todas las soluciones enteras de las ecuaciones

(1) 2x + 3y = 7; (2) 21x − 35y = −14.

9.5. Definir el máximo común divisor y el mı́nimo común múltipo de tres números, mcd(a, b, c) y
mcm(a, b, c). Hallar mcd(1485, 71148, 7882875), mcm(1485, 71148, 7882875).
9.6. Calcular d = mcd(60, 126, 44) y encontrar enteros x, y, z que verifiquen d = 60x + 126y + 44z.
9.7. Para cada entero positivo n, calcular mcd(n, n + 1) y mcd(n, n + 2).
9.8. Demostrar que 3m + 11 y 2m + 7 son relativamente primos cualquiera que sea m ∈ N.
9.9. Sean a y b dos enteros positivos. Probar que si m = mcm(a, b), entonces mcd(m/a, m/b) = 1.
9.10. Dados a, b ∈ N, si d = mcd(a, b), probar que

{ax + by : x, y ∈ Z} = {dz : z ∈ Z}.

(Este último conjunto suele denotarse por dZ y el primero por aZ + bZ, con lo que la igualdad
anterior queda aZ + bZ = dZ.)
9.11. Si a, b son enteros relativamente primos, ¿quién es mcm(a, b)? ¿Por qué?
9.12. Si a, b son enteros relativamente primos y c es un entero tal que a|c y b|c, probar que ab|c.
¿Qué sucede si a, b no son relativamente primos? ¿por qué?
9.13. Una persona desea comprar 430 dólares en cheques de viaje. Estos solamente existen en
cheques de 20 y 50 dólares. ¿Cuántos cheques de cada cantidad deberá adquirir?
9.14. ¿De cuántas formas posibles se pueden tener 325 pesetas repartidas en monedas de 10 y de
25 pesetas?
9.15. Un tren sale de Parı́s a Niza cada 7 horas, a una hora en punto. Probar que algunos dı́as es
posible tomar este tren a las 9 de la mañana.
Siempre que hay un tren a las 9 de la mañana, Pierre lo coge para ir a visitar a su tı́a Marie.
¿Cada cuánto tiempo ve Marie a su sobrino?
Discutir el mismo problema con el tren a Burdeos, que sale de Parı́s cada 14 horas.
9.16. Demostrar que un cajero automático cargado de billetes de veinte y de cincuenta euros puede
dispensar cualquier cantidad de euros múltiplo de 10 que sea superior o igual a 40 euros.
Sugerencia: puede probarse por inducción, teniendo en cuenta que 2(−2) + 5 = 1 = 2 · 3 − 5.
9.17. El problema de los cocos. Cinco marineros suspicaces emplean el dı́a en recoger un montón
de cocos. Agotados, posponen el reparto del montón hasta la mañana siguiente. Desconfiados, cada
uno decide coger su parte durante la noche. El primer marinero divide el montón en cinco partes
iguales más un coco extra, que da a un mono. Coge un montón y deja el resto en un único montón.
Más tarde, el segundo marinero hace lo mismo; y, de nuevo, el mono recibe un coco sobrante. El
tercero, cuarto y quinto marineros también lo hacen; todas las veces queda un coco, que recibe
el mono. Por la mañana, dividen los cocos restantes en cinco montones iguales, y cada marinero
recibe su “parte”. (Cada marinero sabe que faltan algunos, pero nadie protesta, porque ¡todos son
culpables!) ¿Cuál es el menor número posible de cocos en el montón original?
(Este problema apareció en el Saturday Evening Post el 9 de octubre de 1926.)

Y para (que disfruten) los más atrevidos:


2.2. NÚMEROS ENTEROS. 71

9.18. Consideremos la sucesión de Fibonacci, definida por recurrencia mediante las fórmulas

φ0 = 0, φ1 = 1, φn = φn−1 + φn−2 , n ≥ 2.

Probar que:
(i) mcd(φn , φn+1 ) = 1 para todo n ≥ 1;

(ii) φn+m = φn−1 φm + φn φm+1 para todo n ≥ 1, m ≥ 0;

(iii) si r > 0, φn |φnr para todo n ≥ 1;

(iv) si mcd(m, n) = d, entonces mcd(φm , φn ) = φd .

9.19. Sea mcd(a, b) = 1. Probar que mcd(a + b, a2 − ab + b2 ) es 1 o 3.


9.20. Considérese una diana para dardos con dos regiones, una que vale a puntos y la otra b puntos,
donde a y b son enteros positivos sin factores comunes. ¿Cuál es la mayor puntuación total que no
puede obtenerse lanzando dardos a la diana?
9.21. Sean a, b enteros positivos primos entre sı́. Pobar que cualquier entero c ≥ (a − 1)(b − 1)
tiene la forma ax + by, donde x e y son enteros no negativos. Probar que el entero ab − a − b no
tiene esta forma.
(Teorema de Sylvester, v. [D’A-W] pp. 98 y ss.)

2.2.5. Números primos y factorización. Teorema fundamental de la Aritmética.


Definición 2.2.21. Un número entero positivo p distinto de 1 se dice primo si no tiene más
divisores positivos que él mismo y la unidad; en caso contrario diremos que es compuesto .
Dicho de otra forma, p es primo si p ∈ N \ {1} y a ∈ N, a|p, implica a = 1 o a = p.
Que un número n sea compuesto significa, según la definición, que admite al menos un divisor
positivo a tal que 1 < a < n.
Lema 2.2.22. Para todo entero n ≥ 2 existe un número primo p tal que p|n.
(Se dice entonces que p es un factor primo de n.)
Demostración. Ya lo probamos por inducción. Veamos cómo podrı́a formularse la demostración
con otra apariencia.
Si n es primo, basta tomar p = n. Si no lo es, admite un divisor positivo a1 tal que 1 < a1 < n.
Si a1 es primo, basta tomar p = a1 . Si no lo es, admite un divisor positivo a2 tal que 1 < a2 < a1 ,
que a su vez será divisor de n. Si a2 es primo, basta tomar p = a2 . Si no lo es, podemos continuar
el proceso: pero como cada vez vamos obteniendo divisores ak tales que 1 < ak < ak−1 , es decir,
cada uno estrictamente menor que el anterior, al cabo de un número finito de pasos encontraremos
un divisor primo (= 2, en el peor de los casos).

Teorema 2.2.23 (Euclides). El conjunto de los números primos es infinito.


Demostración. Supongamos, por el contrario, que fuese finito, y que p1 , p2 , . . . , pn fuesen todos
los diferentes números primos (n ∈ N). El número

N = p1 p2 · · · pn + 1

no figura en esa lista, pues es estrictamente mayor que cada uno de sus elementos (¿por qué?), y
tendrı́a que ser divisible por alguno de ellos según el lema anterior. Pero

N = pk (p1 p2 · · · pk−1 pk+1 · · · pn ) + 1


72 CAPÍTULO 2. NÚMEROS NATURALES Y ENTEROS

da resto 1 al dividirlo por cada pk , y no resto 0, luego N no tendrı́a factores primos, contradicción.

Un procedimiento cásico para hallar los número primos menores o iguales que un entero positivo
n es la criba de Eratóstenes, que consiste en ir suprimiendo de la lista de los n primeros números
naturales los que son múltiplos de 2, luego los que son múltiplos de 3, de 5, etc. (v. [D-H], p. 34.)
Lo presentamos aquı́ en forma de algoritmo.

Definición 2.2.24. Algoritmo: La criba de Eratóstenes.

• Input: un entero positivo n.

• Output: la lista de primos menores o iguales que n.

Paso 1: Construir la lista L := [2, . . . , n] y la lista vacı́a M .


Paso 2: Sea m el menor elemento de L.
 Añadir m a M .
 Suprimir de L todos los múltiplos de m.
Paso 3: Repetir el Paso 2 hasta que L esté vacı́a.
Paso 4: Devolver M .

En Internet abundan los applets de Java que ejecutan este proceso interactivamente. Por ejem-
plo, ver estas direcciones:
http://www.win.tue.nl/~ida/demo/c1s4ja.html
http://www.faust.fr.bw.schule.de/mhb/eratosiv.htm
http://www.shodor.org/succeedhi/succeedhi/sieve/model.html

Lema 2.2.25. Sean a y b números enteros no nulos y p un número primo tal que p|ab. Entonces
p|a o p|b.

Demostración. Puesto que p es primo, no tiene más divisores positivos que 1 y p. Por tanto, si
p 6 |a, mcd(p, a) = 1. Podemos entonces aplicar la parte (ii) del lema 2.2.16 para concluir que p|b.

Teorema 2.2.26 (Teorema fundamental de la aritmética). Todo número entero positivo


distinto de 1 puede descomponerse como producto de factores primos de manera única, salvo el
orden de dichos factores.

Demostración. Comencemos probando la existencia de la factorización. (Una presentación alterna-


tiva se encuentra en [D-H], p. 35.)
Notemos que si p es primo, admite la factorización trivial p = p. Sea Pn el enunciado
hh n ≥ 2 y los números enteros desde 2 hasta n admiten una descomposición en factores primos ii.

Puesto que 2 es primo, P2 es cierta. Supongamos ahora que es cierta para un n ≥ 2. Si n + 1 es


primo, Pn+1 es cierta; si no lo es, podremos descomponerlo en n + 1 = n1 n2 con 1 < n1 < n + 1,
1 < n2 < n+1. Pero entonces 2 ≤ n1 ≤ n, 2 ≤ n2 ≤ n, y por la hipótesis de inducción n1 = p1 · · · pj ,
n2 = pj+1 · · · pk , con p1 ,. . . , pj , pj+1 , . . . , pk primos. Por tanto

n + 1 = p1 · · · pj pj+1 · · · pk

es una factorización de n + 1 como producto de primos, es decir, Pn+1 es cierta.


Pasemos a probar la unicidad. (También podrı́a hacerse por inducción). Supongamos que

n = p 1 p 2 · · · pj = q 1 q 2 · · · q k
2.2. NÚMEROS ENTEROS. 73

son dos descomposiciones de n en factores primos. Entonces p1 |q1 (q2 · · · qk ) luego por el lema previo,
p1 |q1 o p1 |(q2 · · · qk ): en el primer caso, como p1 y q1 son primos, necesariamente p1 = q1 ; en
el segundo caso p1 |q2 o p1 |(q3 · · · qk ). Repitiendo el argumento anterior, en k pasos a lo sumo
encontraremos un factor qk1 igual a p1 . Lo mismo podemos hacer con p2 , . . . , pk , que nos llevarán
a factores qk2 = p2 , . . . , qkj = pj . Si no hubiésemos obtenido ası́ todos los factores de la segunda
descomposición, podrı́amos cancelar los factores comunes y quedarı́a

1 = q10 · · · q`0 ,

lo que es imposible. Por tanto, las dos factorizaciones coinciden, salvo quizá en el orden.

El lector habrá obtenido ya anteriormente factorizaciones de numerosos ejemplos, por lo que


no insistimos en este punto. Además, nada nuevo podemos añadir a lo que ya conoce: no hay
un algoritmo general para factorizar números que sea realmente efectivo, por lo que seguiremos
recurriendo a la división por los primeros primos 2, 3, 5, etc., aliviada ligeramente si se aplican
criterios de divisibilidad (hablaremos de ellos más adelante).
Dejamos como ejercicio la comprobación de que la descomposición en factores primos permite
obtener el máximo común divisor y el mı́nimo común múltiplo de la forma ya sabida.
Ejercicio. Sean a = pr11 · · · prkk , b = ps11 · · · pskk las descomposiciones en factores primos distintos de
a y b, “arregladas” para que aparezcan los mismos factores tomando, si es necesario, exponentes
nulos. Pongamos mj = mı́n{rj , sj }, Mj = máx{rj , sj }. Demostrar que
mk Mk
mcd(a, b) = pm
1 · · · pk ,
1
mcm(a, b) = pM
1 · · · pk ,
1

es decir, el máximo común divisor de a y b se obtiene hh multiplicando los factores primos comunes
elevados al menor exponenteii, y el mı́nimo común múltiplo de a y b se obtiene hh multiplicando los
factores primos comunes y no comunes elevados al mayor exponenteii.

Factorización con ordenador


Existen diferentes algoritmos para hallar los factores primos de un número. Si el número no
es demasiado grande, se usa la “búsqueda directa”, haciendo sucesivamente la división por los
primeros números primos, como lo hacemos sin ordenador.
Para números más grandes, hay distintos algoritmos (ninguno de carácter ‘general’) que aprove-
chan las caracterı́sticas especiales del número que se intenta factorizar, usando Teorı́a de Números
avanzada. Hay más información en [5].
En maple se obtienen los factores primos de un número con las órdenes ifactor e ifactors,
y en Mathematica , con FactorInteger o con FactorIntegerECM (requiere cargar el paquete
‘FactorIntegerECM‘). Su sintaxis precisa y las diferentes opciones disponibles pueden consultarse en
los manuales o en la ayuda de los programas.
Como cabe suponer, también en este punto abundan en Internet applets de Java que realizan
la factorización. Por ejemplo, en español, el ‘alpertron’ del argentino Darı́o Alpern [4], descrito ası́:

hh Applet capaz de encontrar factores de 20 ó 30 dı́gitos de números o expresiones numéricas de


hasta 1000 dı́gitos. Calcula además la cantidad y suma de los divisores, el indicador de Euler
y la función Moebius del número y su descomposición como suma de hasta cuatro cuadrados
perfectos. ii

Lectura: Conjetura de Goldbach.


Uno de los aspectos más fascinantes de la Teorı́a de Números —enteros— es que abunda en
problemas sencillos de enunciar que, sin embargo, son tremendamente difı́ciles de resolver, hasta
el punto de que algunos de ellos llevan planteados varios siglos y aún no han sido resueltos. Por
74 CAPÍTULO 2. NÚMEROS NATURALES Y ENTEROS

ejemplo, Christian Goldbach (1690–1764) envió en 1742 una carta a su amigo Euler, en la que, tras
comprobar unos pocos casos particulares, afirmaba:
todo número natural par distinto de 2 es suma de dos números primos.
Todavı́a no se sabe si esta afirmación es cierta o falsa. Una excelente novela de Apostolos
Doxiadis, El tı́o Petros y la conjetura deGoldbach, refleja (entre otras cosas) los esfuerzos para
probarla. Y, para animar a quien tenga buenas ideas sobre esta cuestión, las editoriales de la novela,
Bloomsbury Publishing Company (Estados Unidos) y Faber and Faber Limited (Gran Bretaña),
ofrecı́an un premio de un millón de dólares a quien obtuviese una solución antes de marzo de 2002.
Creo que la oferta no ha sido renovada.

Lectura: Conjetura de Fermat/Teorema de Wiles.


Quizá el problema más famoso en este terreno es el llamado “último teorema de Fermat”. Pierre
de Fermat, contemporáneo de Descartes y tan buen o mejor matemático que él, estudiaba hacia
1637 un ejemplar de la edición de G. C. Bachet de la Arithmetica de Diofanto, y tenı́a por costumbre
incluir comentarios propios en el margen del libro. En una página escribió:
Descomponer un cubo en suma de otros dos cubos, una cuarta potencia, o en general cualquier
potencia en suma de dos potencias del mismo orden mientras sea mayor al segundo, es imposible,
y ciertamente he encontrado una demostración magnı́fica de esto, pero el margen es demasiado
estrecho para contenerla.
¿Era un farol? Algunas otras de sus afirmaciones contenı́an las ideas de las demostraciones,
todas ellas de gran originalidad. Lo cierto es que sólo pudieron darse respuestas parciales para
valores particulares del exponente (hay abundantes referencias sobre ellas: una reciente, el capı́tulo
5 de [Casti]). En junio de 1993, el matemático inglés Andrew Wiles presentó en una conferencia
en Cambridge la demostración de un resultado —la conjetura de Shimura-Taniyama-Weil— que
implicarı́a que la afirmación de Fermat era cierta. La comunidad matemática vivió una etapa de
‘suspense’ cuando se descubrió un fallo que Wiles no pudo solucionar hasta 1994, publicando junto
con Richard Taylor en 1995 un artı́culo de más de 130 páginas, que parece haber vencido finalmente
todas las dificultades.
El teorema de Fermat también ha sido fuente de inspiración literaria: una novela de Denis
Guedj, El teorema del loro, da un repaso a la historia de las matemáticas mientras desarrolla una
intriga montada alrededor del loro de un hipotético ‘demostrador’ del teorema.

Ejercicios
10.1. Demostrar que si n ≥ 2 y n no es primo, entonces debe existir un primo p tal que p|n y
p2 ≤ n. ¿Qué interés tiene este resultado en relación con la criba de Eratóstenes?
10.2. Demostrar que todo número primo mayor que 3 es de la forma 6n + 1 o 6n + 5.
10.3. Demostrar que un entero de la forma 4n + 3 admite un divisor primo de esa forma y deducir
que existen infinitos números primos de la forma 4n + 3.
10.4. Probar que cualquier número primo p 6= 3 es de la forma 3q + 1 ó 3q + 2 para algún entero
q. Probar que existen infinitos primos de la forma 3q + 2.
10.5. Si p es primo, probar que p divide al coeficiente binómico
 
p
, 1 ≤ k ≤ p − 1.
k

Encontrar un contraejemplo para el caso de que p no sea primo.


10.6. Sean p, a, n ∈ Z. Demostrar que si p es primo y n es positivo y se verifica que p|an , entonces
p|a y, por tanto, pn |an . ¿Vale también si p es compuesto?
2.2. NÚMEROS ENTEROS. 75

10.7. Si mcd(a, b) = 1 y a2 − b2 es un cuadrado perfecto, probar que a + b y a − b son ambos


cuadrados perfectos o bien dobles de cuadrados perfectos.
10.8. ¿Cuál es la relación entre el número de ceros en que termina la expresión decimal de un
entero n y su descomposición en factores primos?
10.9. Probar que si 2n − 1 es primo, entonces n es primo. (Los primos de la forma 2n − 1 se llaman
primos de Mersenne ; se conocen 35 primos ası́.)
Sugerencia: ¿qué sucede si n no es primo?

2.2.6. Congruencias. Aritmética modular.


Volvemos sobre una importante relación que habı́amos introducido anteriormente.
Definición 2.2.27. Fijado un entero m ≥ 2, dos números enteros a y b son congruentes módulo
m, a ≡ b (mód m), si m|(b − a).
Equivalentemente, a ≡ b (mód m) si y sólo si a y b dan el mismo resto al dividirlos por m:
pues si a = pm + r, b = qm + r, 0 ≤ r < m, resulta b − a = (q − p)m; y recı́procamente, si
a ≡ b (mód m), para algún entero k es b − a = km, luego si a = pm + r, 0 ≤ r < m, entonces
b = a + km = (p + k)m + r, 0 ≤ r < m, y ası́ r es igualmente el resto de dividir b por m (estamos
usando la unicidad del resto en la división entera).
Proposición 2.2.28. Para cada entero m ≥ 2, la relación de congruencia es una relación de
equivalencia en Z.
Demostración. Ya lo hemos probado en el capı́tulo anterior.
Por consiguiente, fijado m, Z queda ‘partido’ en una colección disjunta de clases de equivalencia
[a] = {b ∈ Z : a ≡ b (mód m)}, que se denominan clases de restos módulo m.
Si representamos en un sistema cartesiano la
relación de congruencia, es decir, el conjunto de
los puntos (a, b) del retı́culo Z × Z tales que a ≡
b (mód m) para m = 3, por ejemplo, comprobamos
que aparecen exactamente los puntos de coordena-
das enteras que están sobre las rectas de pendiente
1 que cortan al eje OX en los valores enteros múlti-
plos de 3, o sea, sobre las rectas y = x + 3n, n ∈ Z.
Para representar ‘horizontalmente’ la clase [a0 ]
correspondiente a un a0 ∈ Z, aprovecharemos que,
por simetrı́a, [a0 ] = {x ∈ Z : x ≡ a (mód m)},
y ası́ tenemos que buscar los puntos (x, a0 ), que
aparecen sobre la recta y = a0 paralela al eje OX,
distanciados consecutivamente en 3 unidades (ver
figura anterior); sus proyecciones sobre el eje OX
son los puntos x de la clase de equivalencia [a0 ]
(figura adjunta). Como se puede observar, hay tan
sólo tres clases distintas:
• las proyecciones de los puntos marcados con cua-
drados (los múltiplos de 3),
• las de los puntos marcados con cı́rculos (los an-
teriores más 1 unidad) y
• las de los puntos marcados con triángulos (los
primeros más 2 unidades).
76 CAPÍTULO 2. NÚMEROS NATURALES Y ENTEROS

La situación general es similar:


Proposición 2.2.29. Para cada entero m ≥ 2, dado a ∈ Z, la clase de restos de a módulo m es

[a] = {a + mz : z ∈ Z} = a + mZ.

Demostración. Evidentemente, si b = a + mz, z ∈ Z, es a ≡ b (mód m) por la definición de


congruencia. Y si a ≡ b (mód m), por lo mismo debe existir un z ∈ Z tal que b − a = mz, es decir,
b = a + mz.

Definición 2.2.30. Fijado m ≥ 2, el conjunto de las clases de restos módulo m se denota por Zm
o Z/mZ.
Se trata, pues, del conjunto cociente de Z respecto de la relación de congruencia módulo m.
Proposición 2.2.31. Dado m ≥ 2,

Zm = {[0], [1], . . . , [m − 1]}.

Demostración. Para cada a ∈ Z, [a] = [r] para uno y un solo entero r tal que 0 ≤ r < m: el resto
de la división entera de a por m, según hemos comentado previamente.

Además del interés de las clases de restos en muchos usos de la vida cotidiana (la esfera del
reloj, los meses, los dı́as de la semana, los cuentakilómetros de los coches) y de sus aplicaciones
en cuestiones relacionadas con la divisibilidad, los conjuntos Zm son importantes porque pueden
dotarse de una estructura algebraica (de una suma y un producto). Esta estructura es suficiente-
mente similar a la de Z como para que nos sintamos cómodos operando en ella, y suficientemente
distinta como para proporcionar ejemplos sencillos de situaciones insospechadas: fallos a veces en
la propiedad cancelativa, con la existencia de ‘divisores de cero’, frente a la existencia, en otras
ocasiones, de inverso para el producto como en Q, R y C.
La definición de suma y producto de clases de restos es completamente natural: [a] + [b], [a] · [b],
‘deben ser’ [a + b], [a · b]. Pero un momento de reflexión basta para darse cuenta que necesitamos
un ajuste previo. Si a0 es otro representante de [a] y b0 es otro representante de [b], de modo que
[a] = [a0 ], [b] = [b0 ], ¿llegamos al mismo resultado que antes si tomamos [a0 + b0 ], [a0 · b0 ]? El objetivo
del siguiente lema es comprobar que la respuesta es afirmativa.
Lema 2.2.32. Dado m ≥ 2, sean a ≡ a0 (mód m), b ≡ b0 (mód m). Entonces

a + b ≡ a0 + b0 (mód m), ab ≡ a0 b0 (mód m).

Demostración. Que a ≡ a0 (mód m), b ≡ b0 (mód m), significa que existen p, q ∈ Z tales que
a0 − a = pm, b0 − b = qm. En consecuencia

(a0 + b0 ) − (a + b) = a0 − a + b0 − b = (p − q)m,

y ası́ a + b ≡ a0 + b0 (mód m).


Análogamente,
a0 b0 = (a + pm)(b + qm) = ab + (aq + pb + pqm)m,
de donde ab ≡ a0 b0 (mód m).

Definición 2.2.33. Dado m ≥ 2, sean [a], [b] ∈ Zm . Definimos [a] + [b] = [a + b], [a] · [b] = [a · b]
Notemos que según el lema previo, la aplicación suma (respectivamente, producto) de Zm × Zm
en Zm que hace corresponder a ([a], [b]) ∈ Zm × Zm la clase [a + b] (respectivamente, [ab]) está bien
definida.
2.2. NÚMEROS ENTEROS. 77

Proposición 2.2.34. Con la suma y el producto que acabamos de definir, Zm es un anillo conmu-
tativo con unidad.
Demostración. Que Zm es un anillo conmutativo con unidad significa que se cumple, cualesquiera
que sean las clases [a], [b], [c] ∈ Zm ,
1. Propiedad asociativa de la suma. ([a] + [b]) + [c] = [a] + ([b] + [c]).
(Cierto: ambas son la clase [a + b + c].)
2. Propiedad conmutativa de la suma. [a] + [b] = [b] + [a].
(Puesto que a + b = b + a.)
3. Existencia de elemento neutro (cero) para la suma. Hay una clase, [0] concretamente,
tal que [0] + [a] = [a] + [0] = [a].
(Puesto que 0 + a = a + 0 = a.)
4. Existencia de elemento opuesto para la suma. para cada [a] ∈ Z hay una clase (y una
sóla), la clase [−a], tal que [−a] + [a] = [a] + [−a] = [0].
(Evidente.)
5. Propiedad asociativa del producto. ([a] [b]) [c] = [a] ([b] [c]).
(Ambas son la clase [abc].)
6. Propiedad conmutativa del producto. [a] [b] = [b] [a].
(Inmediato.)
7. Existencia de elemento neutro (identidad) para el producto. Hay una clase, concreta-
mente [1], tal que [1] · [a] = [a] · [1] = [a].
(Inmediato.)
8. Propiedad distributiva del producto respecto de la suma. [a] ([b] + [c]) = [a] [b] + [a] [c].
(Ambas son la clase [a(b + c)] = [ab + ac].)

Ejemplos. Veamos las tablas completas de sumar y multiplicar para m = 6 y m = 7 (en el interior
de la tabla, por comodidad, hemos representado las clases sin los corchetes [ , ].)

+ [0] [1] [2] [3] [4] [5] × [0] [1] [2] [3] [4] [5]
[0] 0 1 2 3 4 5 [0] 0 0 0 0 0 0
[1] 1 2 3 4 5 0 Suma y [1] 0 1 2 3 4 5
[2] 2 3 4 5 0 1 producto [2] 0 2 4 0 2 4
[3] 3 4 5 0 1 2 módulo 6 [3] 0 3 0 3 0 3
[4] 4 5 0 1 2 3 [4] 0 4 2 0 4 2
[5] 5 0 1 2 3 4 [5] 0 5 4 3 2 1

+ [0] [1] [2] [3] [4] [5] [6] × [0] [1] [2] [3] [4] [5] [6]
[0] 0 1 2 3 4 5 6 [0] 0 0 0 0 0 0 0
[1] 1 2 3 4 5 6 0 [1] 0 1 2 3 4 5 6
Suma y
[2] 2 3 4 5 6 0 1 [2] 0 2 4 6 1 3 5
producto
[3] 3 4 5 6 0 1 2 [3] 0 3 6 2 5 1 4
módulo 7
[4] 4 5 6 0 1 2 3 [4] 0 4 1 5 2 6 3
[5] 5 6 0 1 2 3 4 [5] 0 5 3 1 6 4 2
[6] 6 0 1 2 3 4 5 [6] 0 6 5 4 3 2 1

Se observará que entre las tablas de sumar hay bastantes analogı́as: son simétricas respecto a
la diagonal principal, por ejemplo (¿debido a qué?), y en cada fila y cada columna aparece una
permutación de Zm (están todas las clases sin excepción, una sola vez, en ordenaciones diferentes:
¿hay alguna causa?). En las tablas de multiplicar hay mayores discrepancias, e incluso “fenómenos
extraños”. Descontando la anomalı́a que siempre introduce el [0] en la multiplicación, la tabla
de multiplicación módulo 7 mantiene las caracterı́sticas anteriores; por el contrario, en Z6 hay
78 CAPÍTULO 2. NÚMEROS NATURALES Y ENTEROS

“aberraciones” tales como que el producto de dos clases no nulas, [2] por [3] y otras, ¡es la clase
nula! Sin embargo, la multiplicación por [5] produce una permutación en Z6 como en la suma, e
incluso “tiene inversa”, la propia clase [5], de modo que [5]2 = [1] (lo cual es menos chocante si se
piensa que [5] = [−1]).
La explicación de estos hechos está en los resultados que vienen a continuación.
Lema 2.2.35. Sean a, b, m enteros y m ≥ 2. Si d = mcd(a, m), entonces la congruencia lineal
ax ≡ b (mód m) (Ξ)
tiene solución si, y sólo si, d|b.
Cuando d divida a b, si x0 es una solución, la solución general viene dada por
x = x0 + (m/d)n, n∈Z
En particular, las soluciones forman, exactamente, d clases de restos módulo m, con representantes
x0 , x0 + (m/d), x0 + 2(m/d), . . . , x0 + (d − 1)(m/d).
Demostración. Un x ∈ Z es solución de la ecuación (Ξ) si y sólo si m divide a b − ax, lo cual a su
vez equivale a que exista un y ∈ Z tal que b − ax = my, o sea, ax + my = b : en otras palabras, x es
solución de (Ξ) si y sólo si es solución (junto con algún y) de la ecuación diofántica ax + my = b.
Como ya sabemos, existe tal solución si y sólo si d = mcd(a, m)|b, y si hay solución, las infinitas
soluciones se deducen de una de ellas x0 (con su pareja y0 ) a través de las fórmulas x = x0 +(m/d)n
(con y = y0 − (a/d)n), n ∈ Z.
La única novedad en el enunciado es, por tanto, la afirmación final. Para probarla, observemos
primero que cada número x0 + k(m/d), 0 ≤ k ≤ d − 1 está en una clase de restos distinta, pues
x0 + j(m/d) ≡ x0 + k(m/d) (mód m) con 0 ≤ j < k ≤ d − 1 implicarı́a que m|(k − j)(m/d), siendo
0 ≤ (k − j)(m/d) ≤ k(m/d) < m, lo cual es imposible.
Por último, dada una solución cualquiera x = x0 + (m/d)n, n ∈ Z, dividiendo n por d resulta
n = qd + r, q ∈ Z, 0 ≤ r ≤ d − 1, y ası́ x0 + (m/d)n = x0 + qm + r(m/d) ≡ x0 + r(m/d) (mód m).

Corolario 2.2.36. Sean a, b, m enteros y m ≥ 2. Si a y m son relativamente primos, entonces la


congruencia lineal
ax ≡ b (mód m) (Ξ)
tiene una y una sola solución módulo m.
Demostración. Basta aplicar el lema anterior teniendo en cuenta que, por hipótesis, mcd(a, m) = 1.

Corolario 2.2.37. Sean a, m enteros y m ≥ 2. La congruencia


ax ≡ 1 (mód m)
tiene solución si, y sólo si, mcd(a, m) = 1, en cuyo caso, hay una sóla solución módulo m.
Formulando los resultados anteriores dentro de Zm , encontramos las causas de los fenómenos
observados en las tablas de multiplicar en Z6 y Z7 .
Corolario 2.2.38. Sean a, b, m enteros y m ≥ 2. Si d = mcd(a, m), entonces la ecuación en Zm
[a] · x = [b]
tiene solución x en Zm si, y sólo si, d|b.
Cuando d divida a b, hay exactamente d soluciones distintas en Zm , y si x0 ∈ Zm es una de
ellas, dichas soluciones son
x0 , x0 + [(m/d)], x0 + [2(m/d)], . . . , x0 + [(d − 1)(m/d)].
2.2. NÚMEROS ENTEROS. 79

Demostración. Es otra forma de enunciar el lema 2.2.35.

Corolario 2.2.39. Sean a y m enteros relativamente primos, y m ≥ 2. Entonces la aplicación


M : Zm → Zm dada por M (x) = [a] · x (la multiplicación por [a]) es una biyección.

Demostración. Según el corolario anterior, para cada [b] ∈ Zm existe un x ∈ Zm y uno sólo tal que
[a] · x = [b], es decir, tal que M (x) = [b], y por tanto M es biyectiva.

Esto explica las ‘permutaciones’. Los ceros ‘anómalos’ provienen de lo siguiente:

Corolario 2.2.40. Sean a y m enteros tales que m ≥ 2 y [a] 6= [0] en Zm . Si d = mcd(a, m) ≥ 2,


existe x ∈ Zm \ {[0]} tal que
[a] · x = [0].
(Decimos entonces que [a] y x son divisores de cero en Zm : su producto es nulo, pese a que
ambos son distintos de cero.)

Demostración. Tomando b = 0 y x0 = [0] en el corolario 2.2.38, vemos que la ecuación

[a] · x = [0]

tiene d − 1 (≥ 1) soluciones distintas de x0 = [0], que son

[(m/d)], [2(m/d)], . . . , [(d − 1)(m/d)].

Si en un anillo con unidad A todo elemento no nulo tiene inverso (o sea, hay un elemento que
multiplicado por él da la unidad), se dice que A es un cuerpo.

Teorema 2.2.41. Sea m un entero mayor o igual que 2. Entonces Zm es un cuerpo si y sólo si
m es primo.

Demostración. Que una clase [a] 6= [0] tenga inverso quiere decir que existe x ∈ Zm tal que
[a] · x = [1].
Pero si m es primo, como m 6 | a ya que [a] 6= [0], se sigue que mcd(a, m) = 1 y la ecuación
[a] · x = [1] tiene solución Zm (única, además).
En cambio, si m es compuesto, m = ab con 1 < a < m, 1 < b < m, por lo cual tiene que ser
[a] 6= [0] 6= [b]; y sin embargo [a] no tiene inverso, pues mcd(a, m) = a 6= 1 (más todavı́a: [a] y [b]
son divisores de cero, ya que [a][b] = [0], aunque [a] y [b] sean los dos distintos de [0], y esto es
imposible cuando [a] tiene inverso).

Nota.
 En losanillos
 de matrices
 también
 se encuentran divisores de cero. Por ejemplo, si A =
1 0 0 0 0 0
,B= , AB = sin que ninguno de los factores se anule.
1 0 1 1 0 0

Resolución de ecuaciones en congruencias con ordenador


En maple se dispone de msolve(eqns,m), donde eqns es una ecuación (no necesariamente
tan sencilla como las que hemos estudiado) o un conjunto de ecuaciones. La respuesta es una lista
de valores enteros no negativos, cada uno en una clase de restos módulo m, que dan hh todas las
soluciones módulo mii de la ecuación. Ejemplo:

msolve(8*x=20,12);
{x = 1}, {x = 4}, {x = 7}, {x = 10}
80 CAPÍTULO 2. NÚMEROS NATURALES Y ENTEROS

En Mathematica habı́amos encontrado ya la orden Solve[a*x==c && Modulus==b,x], cuya


respuesta (ahora lo vemos) es similar a la de maple . Ejemplo:

In[1]:=
Solve[8 x == 20 && Modulus == 12, x ]

Out[1]=
{{Modulus -> 12, x -> 1}, {Modulus -> 12, x -> 4},
{Modulus -> 12, x -> 7}, {Modulus -> 12, x -> 10}}

APLICACIONES
Criterios de divisibilidad.
Algunas aplicaciones de las congruencias nos son familiares desde bastantes años atrás.
hh Un número es divisible por 2 cuando termina en 0 o cifra par. ii

hh Un número es divisible por 5 cuando termina en 0 o en 5. ii

¿Suena conocido?
hh Un número es divisible por 3 cuando la suma de sus cifras es múltiplo de 3. ii

hh Un número es divisible por 9 cuando la suma de sus cifras es múltiplo de 9. ii

La razón de estas reglas es ahora muy evidente. Partimos de un número N escrito cn cn−1 . . . c1 c0
en base decimal, de manera que

N = c0 + c1 · 10 + · · · + cn−1 · 10n−1 + cn · 10n , cn 6= 0.

Que sea divisible por m equivale a que sea congruente con 0 (mód m). Observando que

10 ≡ 0, 102 ≡ 0, ..., 10n ≡ 0, ... (mód 2),


2 n
10 ≡ 0, 10 ≡ 0, ..., 10 ≡ 0, ... (mód 5),
2 n
10 ≡ 1, 10 ≡ 1, ..., 10 ≡ 1, ... (mód 3),
2 n
10 ≡ 1, 10 ≡ 1, ..., 10 ≡ 1, ... (mód 9),

se deduce

N ≡ c0 (mód 2), N ≡ c0 (mód 5), N ≡ c0 +c1 +c2 +· · · (mód 3), N ≡ c0 +c1 +c2 +· · · (mód 9),

y de aquı́ los criterios de divisibilidad que hemos recordado.


También se justifica ası́ la olvidada “prueba del nueve” para la división: al efectuar ‘a mano’
la división entera entre números grandes a y b, es fácil cometer errores tanto de cálculo como
de escritura. Una prueba cómoda (¡aunque no infalible!) para detectarlos, si hemos obtenido un
cociente c y un resto r, consiste en trazar un aspa como en la figura, y poner en a0 el resultado
de sumar las cifras de a. Si esta es mayor que 9, sustituimos a0 por la suma de sus cifras, y si
es 9 ponemos un cero; repitiendo este proceso si es necesario, llegaremos en unos cuantos pasos
a un valor menor que 9 que pondremos en la casilla de a0 (el valor final es, obviamente, el único
número entre 0 y 8 congruente con a módulo 9; por ejemplo, para a = 87462371, irı́amos obteniendo
8 + 7 + 4 + 6 + 2 + 3 + 7 + 1 = 38, 3 + 8 = 11, 1 + 1 = 2 —o más fácil, 8 + 7 + 4 + 6 + 2 + 3 + 7 + 1 =
(8 + 1) + (7 + 2) + 4 + (6 + 3) + 7 ≡ 4 + 7 = 11).
Con el mismo método de ‘reducción’ sumando cifras, ponemos en
a b
b0 el único número entre 0 y 8 congruente con a módulo 9, en c0 el
r c ‘reducido’ de c. Multiplicamos c0 por b0 , ‘reducimos’ el resultado,
y lo sumamos con las cifras de r prosiguiendo la reducción; la cifra
0 que se obtenga al final debe coincidir con a0 . Si no es ası́, hay un
@0 b 0 0
a @ (c b + r)0 error con toda seguridad; pero si coinciden, podrı́a haber todavı́a
c0 @ un error, aunque sea ‘un poco menos probable’.
2.2. NÚMEROS ENTEROS. 81

La razón: lo que se comprueba en el proceso anterior es si de a ≡ a0 , b ≡ b0 , c ≡ c0 (mód 9),


y a = cb + r, se sigue a0 ≡ c0 b0 + r (mód 9). Si no es ası́, por supuesto debe haber un error
en los números, porque de la igualdad se sigue la equivalencia; pero si se da la equivalencia, no
está garantizada la corrección del resultado.

17526
 431 17526
 431 17526 431
1286
 42 1286
 42 286 40
424 324
 286

@8 @8 @8
3 @ 4 ¡MAL! 3 @ 3 ¿BIEN? 3 @ 3 REVISADA
6@ 6@ 4@

Ejercicio. Probar que un número es divisible por 11 si y sólo si la suma de las cifras de lugar par
menos la suma de las cifras de lugar impar es múltiplo de 11.
Sugerencia: 10 ≡ −1 (mód 11).
Ejercicio. Probar que un número es divisible por 25 si y sólo si termina en 00, 25, 50 o 75.
Ejercicio. ¿Por qué nunca se enuncia un criterio sencillo de divisibilidad por 7, similar a los que
hemos considerado? (No obstante, ver [6].)
Dı́gitos de control. Las congruencias inciden en nuestra vida diaria de forma invisible, pero
constante, y en las situaciones más insospechadas. Ası́ lo explica el prof. M. Gasca ([G]):

hh Se dice que estamos en la Era de la Información. Veamos algunas de las cuestiones surgidas en
torno a ella y que en el fondo son problemas matemáticos más o menos intrincados. Se usan
mucho los códigos de barras para identificar un producto. Se trata de barras blancas y negras
que al ser leı́das rápidamente por láser se traducen en ceros y unos, sistema binario, que a
su vez se traducen a numeración decimal. En el caso del Código Universal de Productos, el
más frecuente, son unos 12 dı́gitos decimales, de los que uno advierte del grupo de productos
de que se trata, el grupo siguiente identifica al fabricante, otro grupo da idea del producto
concreto, a veces de su tamaño, etc., y el último dı́gito es de control.
Si han observado los números de sus cuentas bancarias de 20 dı́gitos, los 4 primeros son la
entidad, 4 para la Agencia, 2 de control y luego 10 para su cuenta personal. Observarán que
en ambos casos hablamos de dı́gitos de control. Es muy fácil al transmitir tantos números
bailar su orden o confundir una cifra. Mediante un algoritmo matemático muy simple el
ordenador detecta el error. Se entenderá mejor con el NIF. Hacienda tenı́a graves problemas
con la gente que daba, intencionadamente, un número erróneo de DNI, sin poder demostrar la
intencionalidad del error. Un algoritmo muy simple asigna a cada número de DNI una letra,
dando lugar al NIF. Para ello, Hacienda seleccionó 23 letras del alfabeto eliminando i, ñ, o y
u por causar confusiones, y les asignó un número aleatorio entre 0 y 22: la A tiene el 3, la W
el 2, etc. Dividiendo el número del DNI entre 23, prescindiendo de decimales en el cociente
y volviendo a multiplicar por 23, se obtiene un número igual o menor que el del DNI. La
diferencia entre el DNI y ese nuevo número es el que decide la letra. Si ahora Vd. cambiara
algo en su número de DNI, como bailar dos dı́gitos, es sumamente probable que la letra final
no saldrı́a la misma y el ordenador avisará del error. Entendiendo el proceso serı́a facilı́simo
cambiar el número y a la vez cambiar la letra para que concuerden y el ordenador no detecte
el error, pero si posteriormente se descubre, ya hay manifiesta mala fe.
En el caso de la cuenta bancaria, los dı́gitos son 2 porque se usa uno para el grupo de cifras
Banco-Agencia y otro para el número de la cuenta. ii

Por supuesto, podemos añadir otros ejemplos (ver [C-C-S], pp. 46 y ss.):
82 CAPÍTULO 2. NÚMEROS NATURALES Y ENTEROS

• ISBN
El ISBN es el International Standard Book Number, el NIF de los libros podrı́amos decir. Es un
código que se asigna a cada publicación que lo solicita, que permite identificarla rápidamente.
Consiste en 9 dı́gitos, seguidos de un décimo sı́mbolo que puede ser otro dı́gito (de 0 a 9) o
una X. Los nueve primeros dı́gitos dan la información del libro, como el año y el lugar de
publicación, y el sı́mbolo final es de control. Si el ISBN de un libro es a1 a2 . . . a9 b, se elige b
de manera que a1 + 2a2 + · · · + 9a9 ≡ b (mód 11), correspondiendo X al resto 10. En este caso
hay posibilidad de corregir pequeños errores: si en el n-ésimo sı́mbolo hay un error de +1 o
−1, entonces a1 + 2a2 + · · · + 9a9 + 10b (mód 11) es igual a +n o −n, respectivamente.

• Música digitalizada
En los CD’s, la música se almacena codificada en listas de ceros y unos. Usando un rayo
laser, el lector de CD’s lee la información del disco y la convierte en la señal que termina
transformada en sonido en los altavoces. Hay muchas causas que pueden originar errores de
lectura: rayas, suciedad o polvo en la superficie del disco, el rayo laser deja de apuntar al
lugar adecuado, etc. El almacenamiento de la información ha de hacerse de manera que el
lector pueda detectar y corregir esos errores.

• Comunicaciones
En todos los canales de comunicación hay que contar con el ‘ruido’, alteraciones de todo tipo
que hacen que la señal recibida no sea igual que la emitida: transmisiones de televisión o
telefonı́a por satélite, lı́neas de teléfono, fax, e-mails, televisión, etc. mediante cable,. . .
Para crear códigos que permitan corregir errores, se han utilizado ¡espacios vectoriales sobre
cuerpos Zp ! (ver Los códigos correctores, de G. Lachaud-S. Vladut y La doble corrección,
de C. Berrou y cols., en [MC1]).

En [COMAP], pp. 586 y ss., pueden verse también algunos detalles sobre corrección de errores
y compresión de datos.

El pequeño teorema de Fermat


Otra aplicación importante de las congruencias es que ciertos resultados permiten responder
afirmativamente a la pregunta: ¿es posible probar que un número no es primo sin conocer sus
factores? Veamos cómo (criterios de primalidad).
Teorema 2.2.42 (El pequeño teorema de Fermat). Dado un número primo p, sea a ∈ N tal
que p no divide a a. Entonces ap−1 ≡ 1 (mód p).
Demostración. Aplicando el corolario 2.2.39,
Zp = {[0], [1], . . . , [p − 1]} = {[0 · a], [1 · a], . . . , [(p − 1) · a]}.
Por tanto

0 6≡ 1 · 2 · · · (p − 1) ≡ a · 2a · · · (p − 1)a ≡ 1 · 2 · · · (p − 1)ap−1 (mód p)

y cancelando 1 ≡ ap−1 (mód p).

Corolario 2.2.43. Dado un número primo p, para cualquier a ∈ N es ap ≡ a (mód p).


Demostración. Si p|a, ap ≡ 0 ≡ a (mód p). En caso contrario, basta multiplicar por a ambos
términos de la equivalencia ap−1 ≡ 1 (mód p).

Por tanto, si encontramos valores de a para los que no se cumplen las equivalencias anteriores,
p NO podrá ser primo.
2.2. NÚMEROS ENTEROS. 83

Ejemplos.

1. 63 no es primo: si lo fuera, 262 ≡ 1 (mód 63), y sin embargo

262 = 260 · 22 = (26 )10 · 22 = (64)10 · 22 ≡ 4 (mód 63).

2. 341 no es primo: si lo fuese, como 73 = 343 ≡ 2 (mód 341) y 210 = 1024 ≡ 1 (mód 341), se
verificarı́a 7340 = 73·113+1 ≡ 2113 7 ≡ 2110+3 7 ≡ 8·7 ≡ 56 (mód 341). Como 56 6≡ 1 (mód 341),
341 no puede ser primo.

Ver comentarios en [D’A-W], p. 114.


La congruencia de Fermat también sirve, obviamente, para hallar restos.
Ejemplo. Como 31 es primo, 1130 ≡ 1 (mód 31), y ası́
11902 = 1130·30+2 = (1130 )30 · 112 ≡ 130 · 112 ≡ 121 ≡ 28 (mód 31).
Criptografı́a.
El pequeño teorema de Fermat, o sus generalizaciones como el teorema de Euler, están en la base
de algunos sistemas modernos de criptografı́a.

hh ¿Cómo transmitir mensajes secretos asegurándose que no serán comprendidos por un eventual
enemigo? Tal es el objetivo de la criptografı́a. En principio, el mensaje a transmitir tiene que
codificarse previamente por medio de una clave que el emisor y el receptor mantienen en
secreto. En general, esta clave puede ser fácilmente hh invertidaii, por lo que sirve tanto para
cifrar el mensaje inicial como para descifrar el mensaje cifrado. En tal caso, que es el clásico, el
emisor y el receptor comparten un mismo secreto, la clave que sirve para cifrar y descifrar. El
principio de la criptografı́a de clave pública, inventado en 1976 por Whitfield Diffie y Martin
Hellman, de la Universidad de Stanford, es muy distinto. El método supone que la clave del
cifrado no puede ser fácilmente invertida para hallar la clave del desciframiento. La primera
puede ser pública, mientras que sólo el receptor puede conocer la segunda. La seguridad es
entonces mucho mayor. Supongamos que Alicia quiere enviar a Bernardo un mensaje secreto
por medio de una clave pública. En tal caso, Bernardo tiene que comunicar a Alicia una
clave de cifrado que puede ser conocida por todo el mundo (es la clave pública). Alicia la
utiliza para cifrar su mensaje, que luego envı́a a Bernardo. Para descifrar el mensaje en clave,
Bernardo utiliza su clave privada, que es el único en conocer.
El sistema de cifrado de clave pública más conocido y utilizado es probablemente el siste-
ma RSA, inventado en 1978 por Ronald Rivest, Adi Shamir y Leonard Adelman, del MIT
(Massachusetts Institute of Technology, Estados Unidos). ii
[· · · ]
hhDesde aproximadamente 1980, es bastante fácil averiguar si un número, aunque sea muy
grande, es o no primo. En cambio, es mucho más difı́cil descomponer un número grande en
factores primos. En esta diferencia de dificultad se basan precisamente los modernos métodos
de criptografı́a. Muy esquemáticamente, la idea consiste en construir la clave del cifrado
(no secreta) por medio de un número N producto p × q de dos números primos grandes.
El desciframiento, en cambio, requiere el conocimiento de p y q por separado, unos valores
que sólo se comunican a las personas autorizadas. Para descifrar un mensaje en clave, un
espı́a tendrı́a que encontrar, conociendo N , sus dos factores primos p y q. Ahora bien, para
N lo bastante grande (digamos que del orden de 150 cifras) y convenientemente elegido, es
imposible realizar esta operación inversa en un tiempo aceptable. ii
[· · · ]
La importancia de la teorı́a de números en criptografı́a es tal que los matemáticos se ven
hh

confrontados a problemas deontológicos. Por ejemplo, si uno de ellos descubre un método de


84 CAPÍTULO 2. NÚMEROS NATURALES Y ENTEROS

factorización numérica mucho más eficaz que los precedentes, ¿qué debe hacer? ¿Comunicarlo
al primer ministro, exponerlo públicamente en una conferencia internacional para que nadie
pueda aprovecharse de él a expensas de otros o venderlo al mejor postor? Afortunadamen-
te, hasta dónde se sabe, las mejoras encontradas por los matemáticos no son lo bastante
revolucionarias como para que el problema se plantee en toda su acuidad. ii

(fragmentos del artı́culo La intriga de los números primos, de Henri Cohen, publicado en [MC1].)
En [C-C-S], pp. 15–16, se da la siguiente descripción simplificada, a modo de receta culinaria,
del sistema RSA.
ingredientes necesarios:

dos números primos p y q

un número de codificación v y otro de descodificación w tales que

vw ≡ 1 (mód (p − 1)(q − 1)).

Los primos p y q y el número de descodificación w son secretos. El número de codificación v


y el módulo m = p · q no hace falta que sean secretos, pueden ser públicos.

Codificar un número x transformándolo en otro y mediante

y ≡ xv (mód m).

Descodificar y recuperando x mediante

x ≡ y w (mód m).

¿Qué justifica la última afirmación? Se supone que p y q son muy grandes, y que x es menor que
ellos. Por eso (xq−1 )p−1 ≡ 1 (mód p), (xp−1 )q−1 ≡ 1 (mód q), de donde x(p−1)(q−1) ≡ 1 (mód pq)
(¿por qué?), y ası́

y w ≡ xvw ≡ xa(p−1)(q−1)+1 ≡ (x(p−1)(q−1) )a · x ≡ x (mód m).

Ver otra descripción ‘aproximada’ en [COMAP], pp. 580–584. Para mayor precisión, consultar
en la dirección [1] los apuntes de Fco. Javier Cobos Gavala, Universidad de Sevilla.

Ejercicios
11.1. A lo largo del texto se ha usado que para todo n ∈ N, de a ≡ b (mód m) se sigue an ≡
bn (mód m). Demostrarlo.
11.2. Demostrar, utilizando congruencias, que si un número entero es a la vez un cuadrado y un
cubo, entonces se puede escribir en la forma 7k o 7k + 1.
11.3. Probar que las seis primeras potencias de 10 pertenecen a distintas clases de congruencias
módulo 7. (Comentario: Gauss preguntó si las potencias de 10 dan n − 1 clases de congruencias
distintas módulo n para infinitos n; la pregunta sigue sin contestar. Los módulos 5 y 13 fallan, a
pesar incluso de que son primos.)
11.4. Sea k un número impar. Probar que k 2 ≡ 1 (mód 8).
11.5. ¿Hay algún cuadrado perfecto (entero de la forma k 2 , k ∈ Z), que sea congruente con 2
módulo 3? ¿Por qué?
11.6. Si x2 + y 2 = z 2 , demostrar:

(i) al menos uno de los valores x, y o z es divisible por 3;


2.2. NÚMEROS ENTEROS. 85

(ii) xyz es un múltiplo de 4;

(iii) al menos uno de los valores x, y o z es divisible por 5;

(iv) xyz es un múltiplo de 60.

(Los enteros x, y, z que cumplen la ecuación dada se llaman, por razones obvias, ternas pitagóri-
cas .)
11.7. Dado un entero n ≥ 2, probar que en cada clase de restos módulo n hay exactamente un
entero r que cumple −n/2 < r ≤ n/2.
(Estos números se llaman menores restos absolutos módulo n; cuando n es impar, son 0,
±1, ±2, . . . , ±(n − 1)/2; cuando n es par, 0, ±1, ±2, . . . , ±(n − 2)/2, n/2.)
11.8. Usando el problema anterior, hallar el menor resto no negativo de 28 × 33 (mód 35).
11.9. Decimos que k es un cuadrado módulo n si k ≡ j 2 (mód n) para algún j. Supongamos que
n = m2 + 1 para algún m ∈ N. Probar que si k es un cuadrado módulo n, también −k es un
cuadrado módulo n.
11.10. Si p es un primo, probar por inducción en n que np ≡ n (mód p). Deducir el pequeño
teorema de Fermat.
11.11. Calcular 132231 (mód 7), 246218 (mód 11), 145197 (mód 13).
11.12. Hallar los inversos de 13 en Z21 y Z31 .
11.13. Hallar los inversos de 4 y 12 en Z19 .
86 CAPÍTULO 2. NÚMEROS NATURALES Y ENTEROS
Bibliografı́a

[Casti] J. L. Casti: Mathematical Mountaintops: The Five Most Famous Problems of All Time.
Oxford U. P., 2001.

[C-C-S] Cohen, A. M.; Cuypers, H.; Sterk, H.: Algebra Interactive! (Learning algebra in an
exciting way). Springer, Berlin, 1999.
Versión on line:
http://www.win.tue.nl/~ida/home.html

[COMAP] COMAP: Principles and Practice of Mathematics. Springer, New York, 1997.

[D’A-W] D’Angelo, J. P.; West, D. B.: Mathematical Thinking. Problem-Solving and Proofs.
Prentice-Hall, Upper Saddle River, NJ, 1997.

[Ddk] Dedekind, R.: ¿Qué son y para qué sirven los números?. (edición e introducción de J.
Ferreirós) Alianza Editorial, Madrid, 1998.

[D-H] Dorronsoro, J.; Hernández, E.: Números, grupos y anillos. Addison-Wesley/UAM,


Madrid, 1996.

[G] Gasca, M.: Las Matemáticas en la vida del año 2000, Monografı́as de la Academia de
Ciencias de Zaragoza 19 (37–44) 1996.

[GJPR] Goberna, M. A.; Jornet, V.; Puente, R.; Rodrı́guez, M.: Álgebra y fundamentos.
Una introducción. Ariel, Barcelona, 2000.

[Ham] Hamilton, A. G.: Numbers, sets and axioms: the apparatus of mathematics. Cambridge
Univ. Press, 1982.

[Lieb] Liebeck, M.: A Concise Introduction to Pure Mathematics. Chapman & Hall/CRC, Boca
Raton, 2000.

[MC1] Mundo Cientı́fico: El universo de los números: Matemáticas para interpretar el mundo.
Extra núm. 1, s.f..

[Peano] Peano, G.: Arithmetices principia nova methodo exposita. Bocca, Romæ-Florentiæ, 1889..

[S-T] Stewart, I.; Tall, D.: The Foundations of Mathematics. Oxford Univ. Press, 1977.

Un libro de problemas resueltos muy interesante con muchos ejercicios accesibles, pero que
en buena parte requiere un mayor conocimiento en Teorı́a de Números, es

[Si] Sierpinski, W.: 250 Problems in Elementary Number Theory. Elsevier, New York; PWN,
Warszawa, 1970.

87
88 BIBLIOGRAFÍA

Documentos en Internet

[1] F. J. Cobos: Curso de Introducción a la Matemática Discreta. Universidad de Sevilla,


2002-2003.
http://ma1.eii.us.es/Docencia/apuntes/ap imd.PDF

[2] Axiomas de Peano.


http://www.unizar.es/analisis matematico/numyconj/axpeano.pdf

[3] Fundamentos de la aritmética, The Oxford Companion to Philosophy.


http://www.xrefer.com/entry/551320

[4] D. Alpern, Factorización usando curvas elı́pticas.


http://www.alpertron.com.ar/ECMC.HTM

[5] MathWorld, Prime Factorization Algorithms.


http://mathworld.wolfram.com/PrimeFactorizationAlgorithms.html

[6] Can it divide?, criterios de divisibilidad por veintidós números.


http://www.geocities.com/krishnakoradas/lesson11.htm
Capı́tulo 3

Números racionales. Polinomios.

Sobre los números racionales y su construcción seguimos fundamentalmente el texto [D’A-W].


Sobre polinomios, ver [Pest] y [GJPR]. Si bien [D-H] trata en detalle los polinomios, lo hace a un
nivel más elevado del que corresponde a este curso.
En cada momento daremos las referencias complementarias que sean pertinentes.

3.1. Números racionales.


La idea y el manejo de los números racionales, y más concretamente de las fracciones, nos es so-
bradamente familiar. Lo que pretendemos ahora es reflexionar sobre el significado de las fracciones
apoyados en la base conjuntista que poseemos actualmente, explicando el sentido de las manipu-
laciones que hemos aprendido ‘por decreto’ y sentando las bases para construcciones similares en
contextos más generales, que se utilizarán en otras asignaturas.

3.1.1. Insuficiencia de Z. Fracciones.


Consideremos los dos problemas siguientes:
(a) Hay que repartir veinte abrigos equitativamente, en igual número, entre seis familias.
¿Cuántos hay que dar a cada una?
(b) Se dividen veinte metros de tela a partes iguales entre seis sastres. ¿Cuánta tela tendrá cada
uno?
Ambos problemas se traducen matemáticamente en:
‘Hallar x tal que 6x = 20’.
¿Vale para ambos la misma respuesta? Evidentemente, no. En el primer caso, daremos tres
abrigos a cada familia (y sobrarán dos, no hay ‘solución exacta’); en el segundo, no podemos expresar
la respuesta satisfactoriamente con valores enteros, Z resulta insuficiente en estas y otras situaciones
en las que hay que resolver exactamente ecuaciones de la forma ax = b, a 6= 0. Lo que hacemos
es ‘sacar de la nada’ una solución, la ‘fracción’ que representamos por hh b/aii. Para otra ecuación
a0 y = b0 tendrı́amos la solución y = b0 /a0 . ¿Habrá, pues, tantas soluciones distintas como ecuaciones
distintas? Volviendo sobre el ejemplo de la tela, la experiencia nos dice que si se repartieran diez
metros entre sólo tres sastres, cada uno recibirı́a la misma cantidad que antes, y lo mismo sucederı́a
repartiendo treinta metros entre nueve, etc. Para reflejar fielmente esta situación, habrá que ‘igualar’
soluciones idénticas aunque provengan de ecuaciones distintas. ¿Bajo qué criterio? Si los nuevos
entes van a comportarse de manera coherente con los viejos números enteros, como x = b/a significa
que ax = b e y = b0 /a0 significa a0 y = b0 , también serı́a a0 ax = a0 b, aa0 y = ab0 , y ası́ x = y debe
corresponderse justamente con ba0 = b0 a. Llamamos fracciones equivalentes a las que verifican esta
relación, y decimos que definen el mismo número racional.
¿Qué estamos haciendo, desde nuestra perspectiva actual? Descorriendo todos los velos, en esto
queda el misterio de las fracciones: tomamos pares ordenados (m, n) ∈ Z × (Z \ {0}) y establecemos

89
90 CAPÍTULO 3. NÚMEROS RACIONALES. POLINOMIOS.

una ‘equivalencia’: (m, n) ∼ (p, q) si mq = np; si es una verdadera relación de equivalencia, la


identificación posterior no supone otra cosa que el paso a las clases de equivalencia (un número
racional = una clase de equivalencia de fracciones) y al conjunto cociente (este serı́a Q).
La manera de operar con los nuevos objetos está completamente determinada si no queremos
romper nuestras cómodas leyes. Para sumar fracciones, recurrimos al ‘arreglo’ anterior: x = b/a,
y = b0 /a0 lleva a a0 ax = a0 b, aa0 y = ab0 , y esto fuerza que aa0 (x + y) = a0 b + b0 a, es decir,
x + y = (ba0 + b0 a)/(aa0 ). El producto es más directo: de ax = b y a0 y = b0 se pasa, multiplicando,
a aa0 xy = bb0 , que deja xy = bb0 /aa0 .
¿“Pasan” estas operaciones a las clases de equivalencia, como sucedı́a en el caso de las congruen-
cias? Habrá que comprobar, igual que entonces, que sumando fracciones equivalentes se obtienen
sumas equivalentes, y que multiplicando fracciones equivalentes se obtienen productos equivalentes.
Enseguida nos ocuparemos de ello.
Para complementar esta visión ‘algebraica’ de los números racionales, puede verse una inter-
pretación geométrica como pendientes de rectas, en [D’A-W] pp. 123–124 o en [GJPR] p. 127, por
ejemplo.

3.1.2. Construcción de Q
Formalicemos las consideraciones anteriores.

Lema 3.1.1. Sea F = Z × (Z \ {0}), y ∼ la relación en F dada por


(m, n) ∼ (p, q) cuando y sólo cuando mq = pn.
Entonces ∼ es una relación de equivalencia en F .

Demostración. La relación ∼ es:

Reflexiva, pues (m, n) ∼ (m, n) cualquiera que sea (m, n) ∈ F , ya que trivialmente mn = mn

Simétrica, siempre que (m, n) ∼ (p, q) resulta (p, q) ∼ (m, n) porque lo primero significa que
mq = pn y lo segundo que pn = mq.

Transitiva, de (m, n) ∼ (p, q) y (p, q) ∼ (r, s) se sigue (m, n) ∼ (r, s), porque si mq = pn y
ps = rq, también mqps = pnrq. Si p 6= 0, como q 6= 0, cancelando pq ya queda ms = nr;
mientras que si p = 0, forzosamente m = 0 y r = 0, y en este caso ms = 0 = nr.

A los elementos de F los denominaremos fracciones .

Definición 3.1.2. El conjunto de los números racionales es el conjunto cociente Q = F/ ∼.


Sus elementos, los números racionales , son por tanto las clases de equivalencia [(m, n)].

Nota. Evitando arrastrar las poco intuitivas notaciones (m, n) para lo que siempre hemos escrito
m m
ó m/n, y [(m, n)] para lo que estamos acostumbrados a representar igualmente por ó m/n, de
n n
aquı́ en adelante volvemos a la notación clásica. No obstante, no hay que perder de vista entonces
que tenemos una misma notación para dos objetos distintos: la fracción (m, n) y el número racional
[(m, n)] del cual la fracción anterior es un representante. En cualquier caso, lo que no ha originado
confusión hasta ahora no deberı́a causarla tampoco de ahora en adelante.
Cuando sea necesario, indicaremos explı́citamente si nos estamos refiriendo a una fracción o a
un número racional. Por ejemplo:

Definición 3.1.3. Una fracción m/n se dice irreducible si n > 0 y mcd(m, n) = 1.

Ejercicio. Probar que toda fracción es equivalente a una y una sóla fracción irreducible; dicho
de otro modo, que todo número racional admite un único representante que sea una fracción
irreducible.
3.1. NÚMEROS RACIONALES. 91

m p
Definición 3.1.4. Dadas dos fracciones , llamaremos suma de ambas a la fracción
n q
m p mq + pn
+ =
n q nq
y producto a la fracción
mp mp
=
n q nq
Para definir la suma y el producto en Q dependemos del siguiente lema.
m m0 p p0 m m0 p p0
Lema 3.1.5. Dadas fracciones , 0 , , 0 tales que ∼ 0 , ∼ 0 , se verifica
n n q q n n q q

m p m0 p0 mp m0 p0
+ ∼ 0 + 0, ∼ 0 0.
n q n q n q n q

Demostración. Por hipótesis, mn0 = m0 n, pq 0 = p0 q. Por definición

m p mq + pn m0 p0 m0 q 0 + p0 n0
+ = , + = ,
n q nq n0 q0 n0 q 0
luego

(mq + pn)(n0 q 0 ) = mqn0 q 0 + pnn0 q 0 = (mn0 )(qq 0 ) + (pq 0 )(nn0 ),


(m0 q 0 + p0 n0 )(nq) = m0 q 0 nq + p0 n0 nq = (m0 n)(qq 0 ) + (p0 q)(nn0 )

son iguales, que es lo que necesitábamos probar.


Para el producto la demostración se deja como ejercicio.

m p
Definición 3.1.6. Dados dos números racionales , ∈ Q, llamaremos suma de ambos al
n q
número racional
m p mq + pn
+ =
n q nq
y producto al número racional
mp mp
=
n q nq
Notemos que según el lema  la aplicación suma (respectivamente, producto) de Q × Q en
 previo,
m p mq + np mp
Q que hace corresponder a , ∈ Q × Q el número racional (respectivamente, )
n q nq nq
está bien definida.

Proposición 3.1.7. Con la suma y el producto que hemos definido, Q es un cuerpo conmutativo.

Demostración. Enunciamos las propiedadesa comprobar,


 esbozando
 las demostraciones.

m p r m p r
1. Propiedad asociativa de la suma. + + = + + .
n q s n q s
mqs + nps + nqr
(Cierto: ambas operaciones dan como resultado .)
nqs
m p p m
2. Propiedad conmutativa de la suma. + = + .
n q q n
(Inmediato.)
3. Existencia de elemento neutro (cero) para la suma. Hay un número racional, que
m m m
denotamos provisionalmente por [0], tal que [0] + = + [0] = .
n n n
(Vale tomar [0] = 0/1.)
92 CAPÍTULO 3. NÚMEROS RACIONALES. POLINOMIOS.

m
4. Existencia de elemento opuesto para la suma. Para cada ∈ Q hay un número racional
n
−m −m m m −m
(y uno sólo), el número racional , tal que + = + = [0].
n n n n n
(Evidente.)
   
mp r m pr
5. Propiedad asociativa del producto. = .
n q s n q s
mpr
(Ambos son el número racional .)
nqs
mp pm
6. Propiedad conmutativa del producto. = .
n q q n
(Inmediato.)
7. Existencia de elemento neutro (identidad) para el producto. Hay un número racional,
m m m
denotado provisionalmente por [1], tal que [1] · = · [1] = .
n n n
(Tomar [1] = 1/1.)
m
4. Existencia de elemento inverso para el producto. Para cada ∈ Q\{0} hay un elemento
n
n n m m n
(y uno sólo) en Q, el número racional , tal que = = [1].
m m n n m
(Tiene sentido porque m 6= 0.)
 
m p r mp mr
8. Propiedad distributiva del producto respecto de la suma. + = + .
n q s n q n s
m(ps + qr) mpns + mrnq
(Ambos son iguales a = .)
nqs nqns

Los enteros como racionales.


¿Es inevitable la distinción entre hh el cero de Qii, [0], y hh el cero de Zii, 0? ¿o entre hh el uno de
Q y hh el uno de Zii? ¿No hemos creı́do siempre que los números enteros estaban incluı́dos en los
ii

racionales? ¿Quién no pondrı́a 6/3=2? Sin embargo, nos estamos refiriendo a objetos de naturaleza
distinta: un número racional es nada menos que un conjunto de pares de números enteros. Pero
desde que aprendimos las fracciones hemos ‘identificado’ 0/1 con 0; 1/1 con 1 o, en general, m/1
con m cualquiera que sea m ∈ Z. ¿Es incorrecto matemáticamente? No: hay una buena razón para
hacerlo, que se basa en el siguiente resultado.

Proposición 3.1.8. La aplicación h : Z → Q dada por

h(m) = m/1 ∈ Q, m ∈ Z,

tiene las siguiente propiedades:

(i) es inyectiva, h(m) 6= h(n) si m 6= n;

(ii) transforma sumas en sumas, h(m + n) = h(m) + h(n);

(iii) transforma productos en productos, h(m n) = h(m) h(n).

Demostración. Ejercicio.

Es decir, h es un isomorfismo entre Z y h(Z), lo que significa que para todo lo referido a
operaciones algebraicas (con sumas, restas, productos, potencias) Z y h(Z) son indistinguibles:
toda ‘operación’ en uno de estos sistemas puede ser reproducida fielmente en el otro, lo que hace
innecesario a estos efectos diferenciar m de h(m). Por ello, desde este momento, consideramos

Z⊆Q y m = m/1 para todo m ∈ Z.


3.1. NÚMEROS RACIONALES. 93

La idea de isomorfismo, “identificación de dos sistemas matemáticos que tienen las mismas
formas (de operar)”, abstrayendo ası́ su “esencia matemática”, es muy importante y está por todas
partes en Matemáticas. Uno y otro sistema puede verse como un ‘modelo’ distinto de un mismo
‘sistema abstracto’, dos caras de una misma moneda.(*)
Nota. Si se revisan cuidadosamente las demostraciones anteriores, se observará que, de entre todas
las propiedades de Z, sólo hemos necesitado las propiedades de la suma y el producto que hacen de
Z un dominio de integridad. Por tanto, la idea de sumergir un dominio de integridad en un ‘cuerpo
de fracciones’ es reutilizable en toda situación similar (por ejemplo, al tratar con polinomios). Ver
[GJPR], pp. 115 y ss.
La relación de orden en Z se puede extender a una relación de orden en Q.

Lema 3.1.9. Sean m/n, m0 /n0 fracciones equivalentes. Entonces mn > 0 si y sólo si m0 n0 > 0.

Demostración. Por hipótesis mn0 = m0 n, luego mnn0 = m0 n2 ; como n2 > 0, si mn > 0 se sigue que
m0 y n0 son ambos positivos o ambos negativos (no pueden ser nulos —¿por qué?), y en cualquier
caso m0 n0 > 0.

Definición 3.1.10. Sea m/n ∈ Q. Diremos que m/n es positivo si mn > 0.


Dados m/n, p/q ∈ Q, diremos que m/n es menor o igual que p/q, escrito m/n ≤ p/q, si
p/q − m/n es positivo o 0.

Obsérvese que el concepto de número racional positivo está bien definido, en virtud del lema
anterior. También, que un número racional m/n es positivo si y sólo si m/n > 0 (o sea, 0 ≤ m/n
y 0 6= m/n).

Proposición 3.1.11. La relación ≤ es una relación de orden en Q, y es un orden total.

Demostración. La manera más cómoda de comprobarlo pasa por examinar previamente algunas
propiedades del conjunto de los números racionales positivos, que denotaremos aquı́ por P (la
notación habitual es Q+∗ , demasiado complicada).
Primero, veamos que para todo número racional m/n se verifica una y sólo una de estas tres
alternativas: m/n = 0, m/n ∈ P , −m/n ∈ P (ley de tricotomı́a). En efecto, si no es m/n = 0,
tendremos que o bien mn > 0 (en cuyo caso m/n ∈ P ), o bien mn < 0, en cuyo caso (−m)n > 0 y
−m/n ∈ P ; y las alternativas son claramente excluyentes.
Después, P es estable o cerrado para la suma, es decir, si m/n, p/q ∈ P , también m/n+p/q ∈ P .
Supongamos m > 0, n > 0, p > 0, q > 0 (si no es ası́, basta sustituir la fracción m/n por la fracción
equivalente mn/n2 , o p/q por pq/q 2 ). Entonces m/n + p/q = (mq + pn)/pq ∈ P claramente, pues
(mq + pn)pq es un producto de enteros positivos.
Con esto, la relación ≤ es:

Reflexiva, pues m/n ≤ m/n cualquiera que sea m/n ∈ Q, ya que trivialmente m/n−m/n = 0.

Antisimétrica, siempre que m/n ≤ p/q y p/q ≤ m/n simultáneamente, ha de ser m/n = p/q,
porque en caso contrario, p/q − m/n y su opuesto m/n − p/q deberı́an ser simultáneamente
positivos, imposible.
(*)
Generalmente se identifican ambos modelos, como hemos hecho aquı́. Pero en algunas ocasiones, disponer de
varios ‘modelos’ sirve para ‘transferir intuición’ de uno a otro. La ventaja es obvia: si dos juegos distintos obedecen
a las mismas reglas, ganaremos con mayor facilidad jugando el que tenga la estrategia más evidente. Hay un ejemplo
precioso de ello en M. Gardner: Inspiración ¡ajá!. Labor, Barcelona, 1981 (reed. 1992)., pp. 116 y ss. Un feriante
tiene un mostrador con casillas numeradas del 1 al 9, y el juego consiste en ir poniendo monedas por turno (de 50
pesetas el feriante, de 5 pesetas el otro jugador); se lleva todo el dinero de la mesa el que primero ocupe tres casillas
distintas cuyos números sumen 15. El feriante gana siempre que quiere, porque sabe que, disponiendo los números en
un cuadrado mágico, el juego resulta isomorfo al ‘tres en raya’, sencillı́simo de jugar (merece la pena leer la exposición
original y los comentarios del maestro Martin Gardner).
94 CAPÍTULO 3. NÚMEROS RACIONALES. POLINOMIOS.

Transitiva, de m/n ≤ p/q y p/q ≤ r/s se sigue m/n ≤ r/s; esto es evidente si m/n = p/q o
p/q = r/s. Si no es este el caso, tendremos r/s − m/n = (r/s − p/q) + (p/q − m/n), suma de
dos racionales positivos, luego positivo.

Un orden total, pues dados m/n, p/q ∈ Q, o p/q − m/n es 0 (con lo cual m/n = p/q), o es
positivo (y ası́ m/n ≤ p/q) o −(p/q − m/n) = m/n − p/q es positivo (lo que da p/q ≤ m/n)

Nota. ¿Se respeta el orden antiguo en Z? Puesto que hemos identificado m ∈ Z con m/1 ∈ Q,
dados m y n ∈ Z disponemos de dos ‘criterios’ para escribir m ≤ n. Pero en la nueva definición,
m ≤ n significa literalmente m/1 ≤ n/1, o sea, que n/1 − m/1 = (n − m)/1 es 0 (en cuyo caso
n − m = 0, i.e. n = m) o es un número racional positivo, es decir, que (n − m) · 1 > 0, i.e., n > m;
en cualquier caso, m ≤ n en la relación de orden de Z.
En consecuencia, la aplicación h : Z → Q que permitı́a identificar Z con h(Z) conserva también
las desigualdades, por lo que Z y h(Z) son ası́ mismo ‘indistinguibles’ (isomorfos) por lo que respecta
a las propiedades de orden.
Es importante saber cómo “se suman y multiplican desigualdades”. Las reglas fundamentales
son las siguientes.

Proposición 3.1.12. Dados m/n, p/q, r/s ∈ Q, se tiene:

(Compatibilidad del orden con la suma) si m/n ≤ p/q, entonces m/n + r/s ≤ p/q + r/s;

(Compatibilidad del orden con el producto por elementos no negativos) si m/n ≤ p/q, y
además r/s ≥ 0, entonces m/n · r/s ≤ p/q · r/s.

En particular, de m/n ≥ 0 y p/q ≥ 0 se sigue m/n p/q ≥ 0.

Demostración. Para la suma basta tener en cuenta que (p/q + r/s) − (m/n + r/s) = p/q − m/n y
aplicar la definición.
Para el producto, notemos primero que si a/b y c/d son números racionales positivos, también
a/b · c/d = ac/bd es positivo, ya que (ac)(bd) = (ab)(cd) > 0. Por tanto, si m/n ≤ p/q, y r/s ≥ 0,
como
p/q · r/s − m/n · r/s = (p/q − m/n) · r/s,
el segundo término es un producto de factores positivos o nulos, y por lo anterior es positivo o nulo.

Un cuerpo en el que se ha definido un orden total que tenga las dos propiedades anteriores se
llama cuerpo conmutativo totalmente ordenado . Podemos resumir entonces las propiedades
vistas diciendo
Q es un cuerpo conmutativo totalmente ordenado.
La enumeración diagonal de Cantor hizo plausible la existencia de una aplicación biyectiva entre
N y Q (i. e., que Q es numerable). Sin embargo, aunque en este sentido N y Q tienen ‘la misma
cantidad de elementos’, los tienen ‘repartidos’ de manera totalmente distinta, como muestran los
siguientes resultados.

Proposición 3.1.13. Entre dos números racionales hay otro número racional.
a+b
Demostración. Dados a, b ∈ Q, si a < b es a < < b, porque
2
a+b a + b − 2a b−a 1
−a= = = (b − a) > 0,
2 2 2 2
3.1. NÚMEROS RACIONALES. 95

ya que b − a > 0 por hipótesis y 1/2 > 0 (¿por qué?). Análogamente

a+b 2b − (a + b) b−a
b− = = > 0.
2 2 2

Proposición 3.1.14. En Q no se cumplen los principios del máximo ni del mı́nimo.

Demostración. Por ejemplo, A = {x ∈ Q : 0 < x < 1} es un conjunto no vacı́o (¿por qué?) acotado
superiormente por 1 e inferiormente por 0. Pero no tiene elemento máximo ni elemento mı́nimo: si
fuese M = máx A, serı́a M ∈ A y por tanto 0 < M < 1; pero según acabamos de probar, existirı́a
x ∈ Q entre M y 1, con lo cual 0 < M < x < 1, es decir, x ∈ M y x > M , por lo que M no puede
ser el máximo de A. Análogamente se prueba con el mı́nimo.

Ejercicios
12.1. Hallar las fracciones irreducibles equivalentes a 36/50, 444/33, 231 107/999 999 989.
12.2. Sean a/m y b/n fracciones irreducibles. Probar que (an + bm)/(mn) es irreducible si y sólo
si m y n son relativamente primos.
12.3. Probar que en todo cuerpo K totalmente ordenado (en particular, en Q) se verifica:

(i) x2 ≥ 0 para cada x ∈ K, y x2 = 0 si y sólo si x = 0.

(ii) 1 > 0 (unidad y cero de K).

(iii) Para 2 = 1 + 1 (en K) y 1/2 = inverso de 2 en K, 0 < 1/2 < 1.

12.4. Sean m, n, p, q enteros positivos tales que m ≤ p ≤ q y p/q ≤ m/n. Probar que n−m ≤ q −p.
Comprobar que esta conclusión no siempre es cierta si m ≤ q < p y p/q ≤ m/n.
12.5. Sean m, n, p, q enteros positivos tales que m/n < p/q. Probar que

m/n < (m + p)/(n + q) < p/q.

12.6. Paradoja de Simpson. En un curso hay dos grupos, el grupo de la mañana y el grupo
de la tarde. En el grupo de la mañana hay A chicas y B chicos, y en el de la tarde hay C chicas
y D chicos. En el primer examen aprueban a chicas y b chicos del grupo de la mañana, y en el
de la tarde aprueban c chicas y d chicos. Tanto en el grupo de la mañana como en el de la tarde
el porcentaje de chicas aprobadas es menor que el de chicos aprobados. ¿Podemos afirmar que el
porcentaje global de aprobados será menor para las chicas que para los chicos?
Examinar el caso A = 14, B = 6, C = 6, D = 19, a = 11, b = 5, c = 2, d = 7. ¿Cómo se explica
esto?
(Ver [D’A-W], pp. 129–130, y [1].)
96 CAPÍTULO 3. NÚMEROS RACIONALES. POLINOMIOS.

3.2. Polinomios
Ya es de sobras conocido que las expresiones tales como

x2 + 1, −x3 − (5/2)x + 1, (47/8)x6 − 3x2 + (6/5)x + 2, . . .

y, en general,
an xn + an−1 xn−1 + · · · + a1 x + a0 ,
donde n ∈ N, a0 ,. . . , an ∈ Q, reciben el nombre de polinomios sobre Q o polinomios con coefi-
cientes racionales. Pero el nombre ‘polinomio’ encubre, en realidad, dos conceptos diferentes: el de
polinomio formal o polinomio en sentido estricto y el de función polinómica. En el primer sentido,
manejamos los polinomios como ‘fórmulas’ o ‘expresiones simbólicas’, sin darle a x ningún conte-
nido determinado —dejando la x ‘indeterminada’— y operando con ella, por ası́ decir, como un
objeto ‘que no se mezcla’ con los coeficientes.(**) En el segundo sentido, se piensa en la función
que a cada x de un cierto conjunto de números (u otros objetos: clases de restos, matrices, . . . )
hace corresponder el número (o . . . ) que resulta al calcular an xn + an−1 xn−1 + · · · + a1 x + a0 .
Distinguiremos, pues, entre estos conceptos, reservando el nombre de polinomio para el primero
y llamando función polinómica al segundo.
A lo largo del curso, en esta y otras asignaturas, se manejarán no solamente polinomios con
coeficientes en Q, sino también polinomios con coeficientes reales y complejos. Muchas de las pro-
piedades de los polinomios son comunes en todos estos casos, dependen únicamente de que los
coeficientes pertenezcan a un cuerpo. Para dejarlo más claramente de manifiesto, trataremos por
ello inicialmente con polinomios sobre un cuerpo conmutativo arbitrario K, que podrá ser en su mo-
mento Q, R o C (sin olvidar los cuerpos Zp , tan importantes en aplicaciones). Cuando sea oportuno,
iremos estudiando algunas propiedades especı́ficas de los polinomios con coeficientes racionales.

Mientras no se indique lo contrario, de aquı́ en adelante K representa un cuerpo conmutativo


cualquiera y X una indeterminada.

3.2.1. Definiciones. Suma y producto de polinomios.


Definición 3.2.1. Un polinomio sobre K en la indeterminada X es una expresión de la
forma
p(X) = a0 + a1 X + · · · + an−1 X n−1 + an X n ,
donde n ∈ N, a0 ,. . . , an ∈ K.
Para 1 ≤ k ≤ n, el elemento ak se llama coeficiente de X k en p = p(X); a0 es el término
independiente o constante de p (puede verse como el coeficiente de X 0 ); si k > n, se entiende
(cuando sea conveniente) que el coeficiente de X k en p es 0.
Cuando ak = 1 sólo se pone X k , y −X k si ak = −1; cuando ak = 0 el término +0 · X k
suele omitirse (ası́, para cada a ∈ K, a puede entenderse también como el polinomio ‘constante’
a + 0 · X + 0 · X 2 + 0 · X 3 + · · · ).
El polinomio nulo o cero es aquél cuyos coeficientes son todos cero; se denotará por 0.
Dados dos polinomios

p(X) = a0 + a1 X + · · · + an−1 X n−1 + an X n , q(X) = b0 + b1 X + · · · + bm−1 X m−1 + am X m ,

que p(X) y q(X) sean iguales significa que a0 = b0 , a1 = b1 y, en general, ak = bk para todo k ∈ N,
teniendo en cuenta el convenio anterior de que ak = 0 si k > n y bk = 0 si k > m.
(**)
Es posible dar un sentido preciso a estas nociones un tanto vagas de expresiones simbólicas o formales y de
indeterminada; nosotros nos conformaremos con la idea intuitiva, remitiendo para una definición más rigurosa p. ej.
al libro de Godement, R.: Cours d’algébre. Hermann, Paris, 1963., p. 353.
3.2. POLINOMIOS 97

Al conjunto de los polinomios sobre K en la indeterminada X (también llamados polinomios


con coeficientes en K) lo denotaremos por K[X].

Definición 3.2.2. Si un polinomio p(X) no tiene todos los coeficientes nulos, su grado es el
máximo n tal que an 6= 0, y este coeficiente an recibe entonces el nombre de coeficiente director .
Si el coeficiente director es igual a 1, se dice que p(X) es un polinomio mónico .

El grado de un polinomio p suele denotarse por deg p.


Observemos que al polinomio nulo no le asignamos ningún grado (en algunos textos se considera
deg 0 = −∞). Los polinomios de grado cero o constantes se corresponden con los elementos no nulos
de K.
La suma de polinomios se define sumando ordenadamente los coeficientes correspondientes a la
misma potencia de X. Concretamente,

Definición 3.2.3. Dados dos polinomios en K[X],

p = a0 + a1 X + a2 X 2 + · · · + an X n , q = b 0 + b 1 X + b2 X 2 + · · · + bm X m ,

su suma es el polinomio

p + q = (a0 + b0 ) + (a1 + b1 )X + (a2 + b2 )X 2 + · · ·

(se entiende ak = 0 o bk = 0 donde sea necesario).

Nota. Es cómodo disponer de una cierta flexibilidad a la hora de escribir polinomios, sin tener que
estar sujetos a la rigidez de la forma

p(X) = a0 + a1 X + · · · + an−1 X n−1 + an X n

que exige en principio nuestra definición.


Tras la introducción de la suma, es claro que el polinomio p(X) podrá escribirse igualmente
como
p(X) = an X n + an−1 X n−1 + · · · + a1 X + a0
por ejemplo, sin más que interpretar el segundo término como el polinomio suma de los polinomios
an X n , an−1 X n−1 , . . . , a1 X, a0 . Lo mismo puede decirse si los sumandos aparecen en cualquier otro
orden.
Aprovechando esta situación, en lo sucesivo emplearemos el siguiente
convenio: cuando escribamos un polinomio no nulo p 6= 0 en la forma

an X n + an−1 X n−1 + · · · + a1 X + a0 ,

sobreentenderemos que an es su coeficiente director, es decir, que n es su grado y que an 6= 0.


Ejercicio. Si p, q, p + q ∈ K[X] \ {0}, y

p(X) = an X n + an−1 X n−1 + · · · + a1 X + a0 , q(x) = bm X m + bm−1 X m−1 + · · · + b1 X + b0 ,

probar que el grado de p + q es menor o igual que máx{n, m}, siendo el menor estricto solamente
cuando p y q tienen el mismo grado (n = m) y sus coeficientes directores son opuestos, i.e.,
an + bn = 0.
El producto de polinomios se define por la ley ai X i · bj X j = ai bj X i+j , y buscando que sea
distributivo. Concretamente,
98 CAPÍTULO 3. NÚMEROS RACIONALES. POLINOMIOS.

Definición 3.2.4. Dados dos polinomios en K[X],

p = a0 + a1 X + a2 X 2 + · · · + an X n , q = b 0 + b 1 X + b2 X 2 + · · · + bm X m ,

su producto es el polinomio

p · q = c0 + c1 X + c2 X 2 + · · · + cn+m X n+m ,
P
donde ck = i+j=k ai bj , es decir, que si 0 ≤ k ≤ n + m, ck = a0 bk + a1 bk−1 + · · · + ak−1 b1 + ak b0 ,
conviniendo como antes que si alguno de los coeficientes ai , bj no aparecen en p o en q, los tomamos
iguales a cero.

Obsérvese que p · 0 = 0 = 0 · p y que si p y q no son nulos, el coeficiente director de pq es el


producto del coeficiente director de p por el coeficiente director de q (ası́ que también pq 6= 0) y el
grado de pq es la suma del grado de p más el grado de q, deg(pq) = deg p + deg q .

Proposición 3.2.5. Con las operaciones suma y producto anteriores, K[X] es un dominio de
integridad.

Demostración. Se deja como ejercicio el comprobar las diferentes propiedades. Por ejemplo, el
polinomio nulo es el elemento neutro para la suma; el polinomio constante 1 es la identidad para
el producto. La propiedad cancelativa se sigue de que pr = qr es lo mismo que (p − q)r = 0, y este
producto sólo puede ser 0 si r = 0 o p − q = 0.
El espacio vectorial K[X]. En K[X] tenemos definida una suma, y disponemos además de un producto por
escalares ‘natural’: dados a ∈ K, p ∈ K[X], podemos definir a · p como el producto del polinomio constante
a por p. Es fácil comprobar que con esta suma y este producto por escalares, K[X] es un espacio vectorial
sobre K. En cierto sentido, es “el menor espacio vectorial sobre K de dimensión infinita”: una base obvia
está formada por la sucesión de polinomios

1, X, X 2 , . . . , X n , . . .

3.2.2. División de polinomios.


Proposición 3.2.6 (División euclı́dea). Dados p, q ∈ K[X] con q no nulo, existen dos polino-
mios c y r tales que

p = cq + r, con r nulo ó de grado estrictamente menor que q.

Con esta condición, los polinomios c y r, denominados respectivamente cociente y resto de la


división de p por q, son únicos.

Demostración.
Existencia. Si p = 0 o el grado de p es estrictamente menor que el de q, claramente p = 0 · q + p,
y se sigue lo pedido.
Suponiendo, pues, deg p ≥ deg q, procedemos por inducción sobre el grado de p. Si deg p = 0 (y
en consecuencia deg q = 0), tendrı́amos p = a0 , q = b0 6= 0, p = a0 b−1
0 q + 0.
Si el enunciado es cierto cuando el grado del dividendo es menor o igual que n − 1, n ∈ N,
veamos que también lo es cuando deg p = n. Sean an y bm los coeficientes directores de p y q
respectivamente. El polinomio p1 = p − an b−1
m X
n−m q tiene obviamente grado estrictamente menor

al de p. Si p1 = 0 o deg p1 < deg q, tomar c = an b−1 m X


n−m , r = p resuelve la cuestión; y
1
si deg p1 ≥ deg q, por la hipótesis de inducción el resultado es cierto para p1 , luego existen c1 ,
r ∈ K[X] tales que p1 = c1 q + r con r = 0 ó con r de grado estrictamente menor que el de q.
3.2. POLINOMIOS 99

Denotemos por c = an b−1


m X
n−m +c . Entonces p = cq +r, siendo r = 0 ó de grado estrictamente
1
menor que el de q, como querı́amos.
Unicidad. Sean c, c, r, r ∈ K[X] tales que cq + r = p = cq + r con r = 0 ó deg r < deg q, y r = 0
ó deg r < deg q. Entonces
r − r = (c − c)q,
y si r − r 6= 0, por las propiedades de los grados anteriormente señaladas deberı́a ser

deg q ≤ deg(c − c) + deg q = deg((c − c)q) = deg(r − r) ≤ máx{deg r, deg r} < deg q,

imposible.
Por lo tanto r = r, y ası́ (c − c)q = 0; pero q 6= 0, luego c = c.

Nótese que el grado proporciona, para la división de polinomios, el control del tamaño del resto
que para los enteros nos daba la condición 0 ≤ r < |q|.
La propia demostración sugiere el método habitual para efectuar la división, obteniendo suce-
sivamente los términos del cociente de mayor a menor grado.
Ejemplos. Dividir p(X) por q(X) en los siguientes casos:

• p(X) = −6X 4 + 4X 2 + X − 5, q(X) = 2X 2 − 1;

• p(X) = X 6 + 2X 5 + 5X 4 + 7X 3 + X 2 + 3X + 5, q(X) = X 3 + 5X + 3;

• p(X) = X 7 + 1, q(X) = X + 1.

3.2.3. Máximo común divisor. Algoritmo de Euclides.


Definición 3.2.7. Sean p, q ∈ K[X]. Decimos que p divide a q, o que p es un divisor o factor
de q, o que q es múltiplo de p, escrito p|q, si existe c ∈ K[X] tal que q = pc; expresado de otra
forma, si el resto de la división de q por p es 0. Diremos entonces que c es el cociente exacto q/p
o el cofactor de p.

Observaciones. Como consecuencias inmediatas de la definición, se obtienen: dados polinomios


arbitrarios p, q, r, s, t ∈ K[X], y a ∈ K[X] de grado 0 (i.e., constante y no nulo)
(i) p|p (propiedad reflexiva)
(ii) p|q y q|r implica p|r (propiedad transitiva)
(iii) p|q y p|r implica p|(sq + tr) (propiedad de linealidad)
(iv) p|q implica pr|qr (propiedad de multiplicación)
(v) pr|qr y r 6= 0 implica p|q (ley de cancelación)
(vi) p|0 (todo polinomio divide a 0)
(vii) 0|p implica p = 0 (0 sólo divide a 0)
(viii) p|q y q 6= 0 implica deg p ≤ deg q (propiedad de comparación)
(ix) a|p siempre que deg a = 0 (los polinomios de grado 0 dividen a
cualquier polinomio)
(x) p|q y q|p si y sólo si p = aq para algún a de grado 0.
La situación reflejada en (x) se corresponde, en Z, con el hecho de que p|q y q|p simultáneamente
si y sólo si p = aq para a = 1 o a = −1. Con polinomios encontramos un mayor número de
posibilidades, lo que provoca una cierta ambigüedad en la definición de conceptos tales como el de
máximo común divisor o mı́nimo común múltiplo.

Definición 3.2.8. Dados p, q ∈ K[X], diremos que d ∈ K[X] es un máximo común divisor
de p y q si d|p, d|q, y si d0 ∈ K[X] también cumple d0 |p, d0 |q, entonces d0 |d (en palabras, si d es un
divisor común de p y q que a su vez es múltiplo de todos los divisores comunes de p y q).
100 CAPÍTULO 3. NÚMEROS RACIONALES. POLINOMIOS.

Obsérvese que hemos definido un máximo común divisor, y no el máximo comun divisor, porque
si d cumple la condición del enunciado, también la cumple ad para cualquier a de grado 0, dado
que d|ad y ad|d. Para seleccionar entre todos ellos un único polinomio, basta exigir ‘en condiciones
normales’ que sea mónico (con coeficiente director 1).
Lema 3.2.9. Dados p, q ∈ K[X] tales que p 6= 0 o q 6= 0, si d, d ∈ K[X] son máximos comunes
divisores de p y q, existe a ∈ K[X] de grado 0 (i.e., un polinomio constante no nulo) tal que d = ad.
Por tanto, si d y d son mónicos, entonces d = d.
Demostración. Aplicando la definición, necesariamente d 6= 0, d 6= 0, d|d y d|d. Por tanto, d = ad
para algún a de grado 0, y deg d = deg d; si estos polinomios son de grado n, y ambos fuesen mónicos,
tendrı́amos d = X n + bn−1 X n−1 + · · · = ad = a(X n + cn−1 X n−1 + · · · ) = aX n + acn−1 X n−1 + · · · ,
y forzosamente a = 1, d = d.

Examinando el caso excluido, p = q = 0, vemos que la definición dejarı́a como máximo común
divisor de p y q tan sólo al 0.
Definición 3.2.10. Dados p, q ∈ K[X] tales que p 6= 0 o q 6= 0, pondremos mcd(p, q) = d si d es
un (el) máximo común divisor mónico de p y q. Para p = q = 0, pondremos mcd(p, q) = 0.
Atención: la existencia de algún máximo común divisor no está garantizada todavı́a; la demos-
tración que hicimos en Z no es traspasable sin más a los polinomios. Afortunadamente, el algoritmo
de Euclides sigue siendo aplicable con el mismo esquema.
Lema 3.2.11. Si p, q, r, c ∈ K[X] son tales que p = cq + r, se tiene que mcd(p, q) = mcd(q, r).
Demostración. El caso q = 0 es trivial. Si q 6= 0, bastará ver que p y q tienen los mismos divisores
comunes que q y r, lo cual es cierto por la propiedad de linealidad.

Lema 3.2.12. Dados p, q ∈ K[X] tales que q|p, q es un máximo común divisor de p y q. En
particular, q es un máximo común divisor de q y 0.
Demostración. Consecuencia trivial de la definición.

Definición 3.2.13. Algoritmo de Euclides para polinomios.

• Input: dos polinomios a y b.

• Output: un máximo común divisor de a y b.

Paso 1: Reemplazar
 a por b, y
 b por el resto de la división de a por b.
Paso 2: Repetir el Paso 1 hasta que b sea 0.
Paso 3: Devolver a.

Proposición 3.2.14. Algoritmo de Euclides. Dados dos polinomios no nulos a y b con deg a ≥
deg b, obtenemos un máximo común divisor procediendo por divisiones enteras sucesivas, como se
ha indicado anteriormente, hasta obtener resto nulo. El último resto no nulo es un máximo común
divisor de a y b.
Demostración. Aplicar los lemas.

El caso de polinomios nulos ya lo hemos comentado.


Por las mismas razones que en Z se tiene una ‘identidad de Bézout’ (repasar las demostraciones).
3.2. POLINOMIOS 101

Proposición 3.2.15. Identidad de Bézout. Sean p y q ∈ K[X] no nulos, y d = mcd(p, q).


Entonces existen polinomios u, v tales que

d = up + vq.

Tenemos igualmente:

Definición 3.2.16. Algoritmo de Euclides extendido (Euclides-Bézout) para polinomios.

• Input: dos polinomios a y b.

• Output: dos polinomios u y v tales que, salvo constantes, mcd(a, b) = ua + vb.

Paso 1: Hacer u = y = 1 e v = x = 0.
Paso 2: Determinar c y r tales que a = cb + r y r = 0 o deg r < deg b.
Reemplazar
 a por b, y b por r,
 u por x y v por y,
 x por u − cx e y por v − cy.
Paso 3: Repetir el Paso 2 hasta que b sea 0.
Paso 4: Devolver u y v.

Visualizado en forma de tabla:

restos & r1 r2 r3 ······ rn−1 0


dividendos ← divisores a b r1 r2 ······ rn−2 rn−1 = d
cocientes c c1 c2 c3 ······ cn−1 cn
uk+1 =xk 1 0 1 ··· ······ un−1 u
vk+1 =yk 0 1 −c1 ··· ······ vn−1 v
xk+1 =uk −ck+1 xk 0 1 −c2 ··· ······ xn−1 = u
yk+1 =vk −ck+1 yk 1 −c1 1 + c1 c2 ··· ······ yn−1 =v

Ejercicios. Aplicar el algoritmo de Euclides-Bézout a los polinomios

• p(X) = X 6 − 2X 5 + 3X 4 − 4X 3 + 3X 2 − 2X + 1, q(X) = 3X 5 − 5X 4 + 6X 3 − 6X 2 + 3X − 1;

• p(X) = X 5 + X 4 + 2X 3 − 2X + 3, q(X) = X 4 + 3X 3 + 7X 2 + 8X + 6.

Midiendo el tamaño de los polinomios por el grado, también los máximos comunes divisores son
‘máximos’ en este sentido.

Proposición 3.2.17. Sean p, q, r ∈ K[X]. Si pq 6= 0 y r es un divisor común de p y q de grado


máximo, entonces r es un máximo común divisor de p y q.

Demostración. Sea d = mcd(p, q). Según la definición, r|d, y en consecuencia deg r ≤ deg d. Pero
por hipótesis deg d ≤ deg r, luego r = ad para algún a de grado 0 y r es un máximo común divisor
de p y q.

Los resultados sobre enteros que obtuvimos como consecuencia de la identidad de Bézout pueden
probarse para polinomios adaptando las demostraciones (comprobarlo).

Definición 3.2.18. Dos polinomios no nulos p y q se dicen relativamente primos o primos


entre sı́ si no tienen más divisores comunes que los polinomios de grado 0, es decir, si mcd(p, q) =
1.
102 CAPÍTULO 3. NÚMEROS RACIONALES. POLINOMIOS.

Corolario 3.2.19. Dos polinomios no nulos p y q son relativamente primos si y sólo si existen
dos polinomios u y v tales que up + vq = 1.

También:

Proposición 3.2.20. Sean p, q, d, r, s, t ∈ K[X], pq 6= 0.

(i) si d = mcd(p, q), p = dr, q = ds, entonces mcd(r, s) = 1 (es decir, r y s son relativamente
primos).

(ii) si mcd(r, s) = 1 y r | st, entonces r | t.

El concepto de máximo común divisor es aplicable a un número finito arbitrario de polinomios.

Definición 3.2.21. Sea {p1 , p2 , . . . , pm } una familia finita de polinomios de K[X] no nulos. Dire-
mos que un polinomio p ∈ K[X] es un máximo común divisor de la familia {p1 , p2 , . . . , pm }
si verifica:

(i) p divide a pi para i = 1, 2, . . . , m, y

(ii) si q ∈ K[X] divide a pi , para todo i = 1, 2, . . . , m, entonces q divide p.

Ası́ p es el “mayor” de los divisores comunes de todos los pi .

Igual que en Z, para hallar un máximo común divisor de una familia {p1 , p2 , . . . , pm } basta ir
obteniendo un máximo común divisor q1 de p1 y p2 , un máximo común divisor q2 de q1 y p3 , un
máximo común divisor q3 de q2 y p4 , . . .
Se puede probar:

Proposición 3.2.22. En K[X] existe un máximo común divisor de cualquier familia finita de
polinomios no nulos {p1 , p2 , . . . , pm }. Además podemos elegir un tal máximo común divisor que sea
mónico, y entonces es único.

Proposición 3.2.23 (Identidad de Bézout general). . Si p es un máximo común divisor de la


familia {p1 , p2 , . . . , pm }, entonces existen g1 , . . . , gm ∈ K[X] tales que p = g1 p1 + · · · + gm pm .

Como en Z, en K[X] puede definirse también el mı́nimo común múltiplo de dos polinomios (o
de una familia finita).

Definición 3.2.24. Un polinomio m se dice que es un mı́nimo común múltiplo de la familia


finita de polinomios no nulos {p1 , p2 , . . . , pr } si verifica:

1. pi divide a m para i = 1, 2, . . . , r, y

2. si q ∈ K[X] verifica que pi divide a q, (i = 1, 2, . . . , r), entonces m divide q.

Ası́, m es el “menor” de los múltiplos comunes de todos los pi .

Proposición 3.2.25. En K[X] existe un mı́nimo común múltiplo de cualquier familia finita de
polinomios no nulos {p1 , p2 , . . . , pr }. Además entre todos ellos existe uno y sólo uno que es mónico.

Ejercicio. Dados p, q ∈ K[X] tales que pq 6= 0, ¿es cierto que

mcm(p, q) · mcd(p, q) = pq?

En caso negativo, ¿qué relación es cierta?


3.2. POLINOMIOS 103

3.2.4. Funciones polinómicas. Raı́ces de polinomios.


Definición 3.2.26. Sea p(X) = a0 + a1 X + a2 X 2 + · · · + an X n ∈ K[X] un polinomio y a un
elemento de K. La evaluación o el valor de p(X) en a es el elemento de K, denotado por p(a),
dado por
p(a) = a0 + a1 a + a2 a2 + · · · + an an
(obtenido ‘sustituyendo la indeterminada X por el elemento a en la expresión del polinomio’).
La aplicación de K en K que a cada x ∈ K hace corresponder el valor de p(X) en x es la
función polinómica correspondiente al polinomio p, y suele denotarse igualmente con p si no es
motivo de confusión.
Un elemento c ∈ K se dice que es un cero o una raı́z del polinomio p si p(c) = 0.
Notas.
• La suma y el producto de polinomios están definidos justamente para que, cualesquiera que
sean p, q ∈ K[X], a ∈ K, se obtenga

(p + q)(a) = p(a) + q(a), (pq)(a) = p(a) q(a).

• En general, la función polinómica no determina el polinomio que la define: dos polinomios


distintos pueden dar lugar a la misma función (y esta es una razón más para distinguir ambos
conceptos). Por ejemplo, para K = Zp , p entero primo, el pequeño teorema de Fermat nos
dice que las funciones polinómicas corespondientes a los polinomios X p y X son iguales, o
que la asociada al polinomio no nulo X p − X es la función nula.

• El valor de un polinomio en un a ∈ K se halla mediante el conocido algoritmo de Hor-


ner/Ruffini, habida cuenta que

p(a) = a0 + a1 a + a2 a2 + · · · + an an = a0 + a(a1 + a(a2 + a(· · · + a(an−1 + aan ) · · · ))).

Los cálculos se disponen según el esquema


an an−1 ... ak ... a1 a0
a) a an ... a bk+1 ... a b2 a b1
an bn−1 ... bk ... b1 ( b0
donde bk = a bk+1 + ak y b0 = a0 + a b1 = a0 + a (a1 + a b2 ) = a0 + a (a1 + a (a2 + a b3 )) = . . . = p(a).
Ası́ se efectúan solamente n multiplicaciones y n sumas, mientras que el cálculo directo supone
n(n + 1)/2 multiplicaciones y n sumas; este algoritmo es fácil de programar y es muy estable
numéricamente (‘pequeños errores en los datos producen errores pequeños en el resultado’).
Teorema 3.2.27 (Teorema del resto). Sea p(X) ∈ K[X], a ∈ K. El resto de dividir p por X − a
es p(a). Consecuentemente, a es raı́z de p si y sólo si X − a divide a p.
Demostración. Por el algoritmo de la división, existen c, r ∈ K[X] tales que
p(X) = c(X)(X − a) + r(X), con r = 0 ó deg r < deg(X − a) = 1,
y ası́ r tiene que ser constante . Por tanto p(a) = c(a)(a − a) + r = r, de donde se sigue lo pedido.

Nota. El cociente es an X n−1 + bn−1 X n−2 + · · · + bk X k−1 + · · · + b1 con los bk del algoritmo de
Horner/Ruffini (comprobarlo multiplicando este polinomio por X − a).
Ejemplo. Sean p(X) = 7 − 9X + 4X 3 − 8X 4 , q(X) = 2X − 3. Para hallar el cociente y el resto
de la división de p por q, tendremos en cuenta que q(X) = 2(X − 3/2) y p = cq + r si y sólo si
1
p = 2c · q + r, luego usando el algoritmo de Horner/Ruffini
2
104 CAPÍTULO 3. NÚMEROS RACIONALES. POLINOMIOS.

−8 4 0 −9 7
3/2) −12 −12 −18 −81/2
−8 −8 −12 −27 (−67/2
con lo cual r = −67/2, 2c = −8X 3 − 8X 2 − 12X − 27, c = −4X 3 − 4X 2 − 6X − 27/2.
Ejercicios.
1. Sean p, q ∈ Q[X] dados por p(X) = X 4 − 6X 3 + 2X 2 + 3X − 4, q(X) = X 2 − X − 2 =
(X + 1)(X − 2). Probar que q no divide a p sin efectuar la división.
2. Si se divide un cierto polinomio p por X − 1 el resto es −2; si lo dividimos por X + 2 el resto
es 79. ¿Cuál es el resto que se obtiene al dividirlo por (X − 1)(X + 2)?
Corolario 3.2.28. Un polinomio de grado n puede tener a lo más n raı́ces distintas.
Demostración. Puesto que si c1 , . . . , ck son raı́ces distintas de un polinomio p, éste es divisible por
(X − c1 ) · · · (X − ck ), y por tanto debe tener grado mayor o igual que k.

Corolario 3.2.29. Sean p, q ∈ K[X] de la forma

p(X) = a0 + a1 X + · · · + an X n , q(X) = b0 + b1 X + · · · + bn X n ,

y supongamos que K tiene por lo menos n + 1 elementos distintos. Entonces:


(i) p es el polinomio nulo si y sólo si la función polinómica p se anula en n + 1 puntos distintos.
(ii) los polinomios p y q son iguales si y sólo si las funciones polinómicas p y q toman el mismo
valor en n + 1 puntos distintos.
Demostración.
(i) Si no fuese p = 0 tendrı́amos un polinomio de grado menor o igual que n con n + 1 raı́ces
distintas.
(ii) La función polinómica p − q se anula en n + 1 puntos distintos.
Las funciones polinómicas (especialmente sobre R y C) son muy útiles en las aplicaciones,
debido sobre todo a que es fácil calcular con ellas, y además sirven para aproximar funciones
más complicadas. Por ejemplo, siempre es posible encontrar explı́citamente un polinomio que tome
valores arbitrarios en una colección finita de puntos prescritos de antemano, como muestra el
siguiente resultado.
Proposición 3.2.30 (Teorema de interpolación de Lagrange). Dados n elementos distintos
x1 , . . . , xn ∈ K y n valores arbitrarios y1 , . . . , yn ∈ K (n ∈ N), existe un polinomio p ∈ K[X]
nulo o de grado n − 1 a lo más, y uno sólo, tal que p(x1 ) = y1 , . . . , p(xn ) = yn . Dicho polinomio
viene dado por la fórmula de interpolación de Lagrange
(X − x2 ) · · · (X − xn ) (X − x1 ) · · · (X − xk−1 )(X − xk+1 ) · · · (X − xn )
p(X) = y1 + · · · + yk
(x1 − x2 ) · · · (x1 − xn ) (xk − x1 ) · · · (xk − xk−1 )(xk − xk+1 ) · · · (xk − xn )
(X − x1 ) · · · (X − xn−1 )
+ · · · + yn .
(xn − x1 ) · · · (xn − xn−1 )
Demostración. El polinomio del enunciado es de grado n − 1 a lo más (o nulo si los yk son todos
nulos), y para cada k, 1 ≤ k ≤ n, cumple que f (xk ) = yk (todos los sumandos son nulos salvo el
k-ésimo, que es yk · 1).
La unicidad es consecuencia del corolario anterior.

Ejercicio. ¿Qué valores han de tener a, b, c ∈ Q para que p(X) = aX 2 + bX + c cumpla p(−1) = 1,
p(−2) = 2, p(−3) = 7?
3.2. POLINOMIOS 105

Raı́ces múltiples.
Sea c una raı́z de un polinomio no nulo p ∈ K[X]. Según hemos probado, tendremos p =
(X − c)p1 para algún p1 ∈ K[X]. Si c fuese también raı́z de p1 , análogamente p1 = (X − c)p2 y
p = (X − c)2 p2 . Reiterando, llegaremos a encontrar un m ∈ N tal que p = (X − c)m pm y c ya NO
es raı́z de pm (va incluida la posibilidad de que pm sea constante).
Definición 3.2.31. Sea c una raı́z de un polinomio p ∈ K[X]. Diremos que c es una raı́z de
multiplicidad m si p = (X − c)m q para algún q ∈ K[X] tal que q(c) 6= 0; dicho de otro modo, si
m es el mayor número natural tal que (X − c)m |p.
Cuando m = 1, suele decirse que a es una raı́z simple ; cuando m = 2, que es una raı́z doble ;
cuando m = 3, que es una raı́z triple , etc.
Diremos que a es una raı́z múltiple para indicar que su multiplicidad es mayor o igual que 2
(o sea, que no es simple).
Se sigue inmediatamente que para un polinomio p cuyas raı́ces sean c1 , . . . , ck , con multiplici-
dades respectivas m1 . . . , mk , hay una factorización
p = (X − c1 )m1 · · · (X − ck )mk q, donde q es un polinomio que no tiene raı́ces en K.
(cuando K = C, esto obliga a que q sea constante, como comentaremos posteriormente.)
Una herramienta importante en el estudio de las raı́ces múltiples es la derivación de polinomios,
que puede definirse ‘formalmente’ para cualquier polinomio sin necesidad del concepto de lı́mite, y
que obedece a las reglas conocidas para la derivación de los polinomios reales.
Definición 3.2.32. Dado un polinomio
p(X) = a0 + a1 X + a2 X 2 + · · · + an X n ∈ K[X],
su polinomio derivado es
p0 (X) = a1 + 2a2 X + 3a3 X 2 + · · · + nan X n−1 ∈ K[X].
El polinomio derivado de p0 es el segundo derivado p00 de p, y reiterando se obtienen los sucesivos
derivados p000 , . . . , p(k) , . . .
Las funciones polinómicas asociadas a estos polinomios son la derivada primera de la función
polinómica p, la derivada segunda, . . . , la derivada k-ésima, . . .
Lema 3.2.33. Dados p, q, a ∈ K[X], se tiene
(i) (p + q)0 = p0 + q 0 ;
(ii) (pq)0 = p0 q + q 0 p;
(iii) si a constante, a0 = 0 y (ap)0 = ap0 .
Demostración. Basta aplicar (con paciencia) la definición.

Proposición 3.2.34. Sea K un cuerpo conmutativo que contiene a Q. Dado p ∈ K[X] no nulo,
(i) las raı́ces múltiples de p, con multiplicidad m, son raı́ces de p0 con multiplicidad m − 1;
(ii) las raı́ces múltiples de p son exactamente las raı́ces del máximo común divisor de p y p0 ; y
un c ∈ K es raı́z de p con multiplicidad m si y sólo si es raı́z de mcd(p, p0 ) con multiplicidad
m − 1;
(iii) c ∈ K es una raı́z de p de orden m ≥ 1 si y sólo si la primera derivada no nula de p en c es
la de orden m:
p(c) = 0, p0 (c) = 0, . . . , p(m−1) (c) = 0, p(m) (c) 6= 0.
106 CAPÍTULO 3. NÚMEROS RACIONALES. POLINOMIOS.

Demostración.
(i) c ∈ K es una raı́z de p de orden m ≥ 1 si y sólo si p = (X − c)m q con q(c) 6= 0; pero entonces,
cuando m ≥ 2, p0 = m(X −c)m−1 q +(X −c)m q 0 = (X −c)m−1 [mq +(X −c)q 0 ] = (X −c)m−1 q1
y q1 (c) = mq(c) + 0 · q 0 (c) = mq(c) 6= 0 ya que m 6= 0, con lo cual c es una raı́z de p0 de
multiplicidad m − 1.
(ii) Si c ∈ K es una raı́z de p de multiplicidad m, es raı́z de p0 de multiplicidad m − 1 según
acabamos de probar, y (X − c)m−1 divide por tanto a p y a p0 , pero (X − c)m no, luego
(X − c)m−1 también divide a mcd(p, p0 ) y (X − c)m no lo divide, es decir, c es una raı́z de
mcd(p, p0 ) de multiplicidad m − 1.
Recı́procamente, si c es una raı́z de d = mcd(p, p0 ) de multiplicidad k, (X − c)k divide a d y
por tanto divide a p y a p0 , o sea, c es raı́z de p y p0 de multiplicidad al menos k, luego c es
entonces una raı́z de p de multiplicidad necesariamente igual a k + 1.
(iii) Si c ∈ K es una raı́z de p de orden m, aplicando reiteradamente (i), es una raı́z de orden
m − 1 de p0 , de orden m − 2 de p00 , . . . , de orden 1 de p(m−1) . En consecuencia, p(m−1) (c) = 0,
p(m) (c) 6= 0.
Supongamos ahora que
p(c) = 0, p0 (c) = 0, . . . , p(m−1) (c) = 0, p(m) (c) 6= 0.
Recorriendo a la inversa el camino anterior, c es una raı́z de p(m−1) necesariamente simple,
una raı́z de p(m−2) forzosamente doble, . . . , una raı́z de p obligatoriamente de multiplicidad
m.

Nótese que p0 puede tener raı́ces que no son raı́ces de p: por ejemplo, si p = X 2 − 1, p0 = 2X.
Ejercicio. Hallar todas las raı́ces múltiples de X 5 + 3X 4 + 4X 3 + 4X 2 + 3X + 1.

Raı́ces en Q.
El estudio y localización (exacta o aproximada) de los ceros de los polinomios es de gran
importancia en numerosos ámbitos de las Matemáticas, como irá comprobando el lector a lo largo
de sus estudios. La determinación de los valores que alcanzan las funciones polinómicas es también,
esencialmente, un problema de ceros, puesto que p(x) = y ∈ K para algún x ∈ K si y sólo si
p(x) − y = 0, i.e., si x es un cero del polinomio p(X) − y. En estos tipos de cuestiones intervienen de
manera decisiva las propiedades especı́ficas del cuerpo que se considera. Por ejemplo, en cualquier
cuerpo totalmente ordenado (Q, R, . . . ) se tiene para todo x ∈ K que x2 ≥ 0, x2 + 1 ≥ 1 > 0,
luego X 2 + 1 no tiene ningún cero en estos cuerpos. Tampoco X 2 − 2 tiene ceros en Q (¿por qué?),
aunque los tiene en R como sabemos.
No hay, en general, fórmulas ‘razonables’ que permitan expresar las raı́ces de un polinomio
cualquiera en función de sus coeficientes (la búsqueda de tales fórmulas ha desempeñado un papel
importantı́simo en la historia de las Matemáticas, ver p. ej. [2], [3], [4], [5]). En este apartado
expondremos algunos criterios muy sencillos que permiten limitar la búsqueda de las raı́ces de los
polinomios en Q. La herramienta básica es la divisibilidad de números enteros, dado que podemos
conocer las raı́ces de un polinomio en Q hallando las de un polinomio con coeficientes en Z. En
efecto, si tenemos un polinomio
p(X) = a0 + a1 X + a2 X 2 + · · · + an X n ∈ Q[X],
y los coeficientes a0 , . . . , an se expresan como fracciones bk /m con un denominador común m, lo
cual siempre es posible, será p(c) = 0 si y sólo si q(c) = 0, donde
q(X) = b0 + b1 X + · · · + bn X n ,
con coeficientes b0 , . . . , bn ∈ Z.
3.2. POLINOMIOS 107

Proposición 3.2.35. Sea q(X) = bn X n + bn−1 X n−1 + · · · + b1 X + b0 un polinomio con coeficientes


b0 , . . . , bn ∈ Z, de grado n ≥ 1. Los ceros enteros de q son divisores del término independiente b0 .
Si c = a/b ∈ Q es un cero de q escrito en forma irreducible [es decir, a, b ∈ Z y mcd(a, b) = 1], el
numerador a divide al término independiente b0 , y el denominador b divide al coeficiente director
bn .

Demostración. Si c ∈ Z es tal que q(c) = 0, se deduce que b0 = c(−bn cn−1 − · · · − b1 ) y por tanto
c divide a b0 .
Si q(c) = 0 para c = a/b, a, b ∈ Z y mcd(a, b) = 1, sustituyendo y multiplicando por bn resulta

0 = bn an + bn−1 an−1 b + · · · + b1 abn−1 + b0 bn = a(bn an−1 + bn−1 an−2 b + · · · + b1 bn−1 ) + b0 bn ,

luego a divide a b0 bn , lo que sólo es posible si a divide a b0 ; y análogamente b divide a bn an , luego


a bn .

Las raı́ces enteras deben cumplir otras condiciones fáciles de comprobar.

Proposición 3.2.36. Sea q(X) = bn X n + bn−1 X n−1 + · · · + b1 X + b0 un polinomio con coeficientes


b0 , . . . , bn ∈ Z, de grado n. Si c ∈ Z es un cero de q, necesariamente (c − 1)|q(1) y (c + 1)|q(−1).

Demostración. Aplicando el teorema del resto, q(X) = (X − c)q1 (X), lo que implica
q(1) = (1 − c)q1 (1) = (c − 1)(−q1 (1)) y (c − 1)|q(1).
Análogamente q(−1) = (−1 − c)q1 (−1) = (c + 1)(−q1 (−1)) y (c + 1)|q(−1).

Corolario 3.2.37. En Q hay polinomios sin raı́ces de grado arbitrario (≥ 2).

Demostración. Aplicar lo anterior a los polinomios X n − 2, por ejemplo.

Ejercicio. Hallar las raı́ces de


18X 3 + 3X 2 − 4X − 1.

3.2.5. Factorización de polinomios.


El papel jugado en Z por los números primos lo desempeñan en K[X] los polinomios irreducibles.

Definición 3.2.38. Diremos que un polinomio p no constante es irreducible si cuando p = rs


para polinomios r, s, necesariamente deg r = 0 o deg s = 0.
Dicho de otra forma, p es irreducible si es no constante y para cada polinomio no constante q,
q|p implica que p/q es constante.

Obviamente, los polinomios de grado 1 (polinomios lineales) son irreducibles. Los polinomios
que no son irreducibles deben admitir una factorización como producto de polinomios de grado
mayor o igual que 1.

Corolario 3.2.39. Dado p ∈ K[X],

(i) si p es un polinomio cuadrático (de grado 2), entonces p es irreducible si y sólo si no tiene
raı́ces en K;

(ii) si p es un polinomio cúbico (de grado 3), entonces p es irreducible si y sólo si no tiene raı́ces
en K;

(iii) si p es de grado mayor o igual que 4, entonces para que p sea irreducible es condición nece-
saria, pero no suficiente, que p no tenga raı́ces en K.

Demostración. Ejercicio.
108 CAPÍTULO 3. NÚMEROS RACIONALES. POLINOMIOS.

Ejercicio. Sea a ∈ K tal que 4a 6= 0. Probar que el polinomio p(X) = aX 2 + bX + c ∈ K[X] tiene
raı́ces en K si y sólo si su discriminante ∆ = b2 − 4ac es un cuadrado perfecto en K, es decir,
−b + δ −b − δ
si existe δ ∈ K tal que δ 2 = ∆, en cuyo caso las raı́ces de p(X) son , (que suelen
2a 2a
escribirse conjuntamente en la fórmula tradicional

−b ± b2 − 4ac
.)
2a
Indicación. Para x ∈ K,

p(x) = 0 ⇐⇒ 4ap(x) = 0 ⇐⇒ 4a2 x2 + 4abx + 4ac = 0 ⇐⇒ (2ax + b)2 − b2 + 4ac = 0


⇐⇒ (2ax + b)2 − ∆ = 0 ⇐⇒ (2ax + b)2 = ∆ ⇐⇒
(
NUNCA cuando ∆ ∈ / K 2 := {t2 : t ∈ K}, o bien
⇐⇒
⇐⇒ (2ax + b)2 = δ 2 ⇐⇒ 2ax + b = δ o 2ax + b = −δ.

–—o0o—–

La naturaleza de los polinomios irreducibles es muy variable, dependiendo del cuerpo particular
que se considere, y en general no se sabe cómo son los polinomios irreducibles sobre un cuerpo
cualquiera. No es éste el lugar para un estudio amplio del tema: por lo que a nosotros respecta, la
información fundamental es que en C[X] los polinomios irreducibles son los lineales (de grado 1),
debido al llamado Teorema fundamental del álgebra (D’Alembert-Gauss):
Todo polinomio no constante con coeficientes complejos posee una raı́z en C.
Como consecuencia, se puede afirmar:
[1] Todos los polinomios irreducibles de C[X] son de grado uno. Este hecho se indica diciendo
que C es algebráicamente cerrado. En particular, los polinomios mónicos irreducibles de
C[X] son de la forma X − t con t ∈ C.
[2] Los polinomios mónicos irreducibles de R[X] son de dos formas:
• de grado uno, de la forma X − t con t ∈ R.
• de grado dos, de la forma (X − t)2 + r2 con t, r ∈ R, r 6= 0.
[3] En Q[X] hay polinomios irreducibles del grado que se desee.

–—o0o—–

Sobre el esquema empleado en Z, puede probarse la existencia (con los ajustes pertinentes) de
descomposición de un polinomio en producto de factores irreducibles.
Lema 3.2.40. Un polinomio p no constante es irreducible si y sólo si cuando p|rs, necesariamente
p|r o p|s (en palabras, cuando divide a un producto de polinomios tiene que dividir al menos a uno
de los factores)
Demostración. Si p es irreducible y divide a rs, o bien mcd(p, r) = 1 (y entonces p|s según la
1
Proposición 3.2.20), o bien mcd(p, r) = d 6= 1, con lo cual p = ad, a constante no nula, y d = p;
  a
1 1
entonces, para algún q, r = qd = q p = q p, es decir, p|r.
a a
Recı́procamente, si p cumple la condición del enunciado tiene que ser irreducible, pues de p = rs
se sigue que p|rs, luego o bien p|r (y como r|p es deg p = deg r y por tanto deg s = 0) o bien p|s (y
análogamente deg r = 0).
3.2. POLINOMIOS 109

Corolario 3.2.41. Sean p, q ∈ K[X] mónicos e irreducibles tales que p divide a q. Entonces p = q.
Demostración. Puesto que p es irreducible, no es una constante, luego q = ap donde forzosamente
deg a = 0, puesto que q es irreducible. Como p y q son mónicos, necesariamente a = 1 y p = q.
Correspondiendo al teorema fundamental de la Aritmética tenemos el siguiente, que podrı́a
llamarse ‘teorema fundamental de la aritmética de polinomios’.
Teorema 3.2.42 (de factorización única). Para todo polinomio p ∈ K[X] no constante existen
a constante y q1 , . . . , qm ∈ K[X] mónicos e irreducibles tales que
p = aq1 · · · qm .
Además, a y los qj son únicos para cada p.
En palabras, p puede descomponerse como producto de una constante por factores mónicos
irreducibles de manera única, salvo el orden de dichos factores.
(Esto se expresa diciendo que el dominio de integridad K[X] es de factorización única .)
Demostración. Sea a el coeficiente director de p, entonces p = a−1 p es mónico y p = ap. Veamos
que todo polinomio mónico no constante p se puede expresar como producto de polinomios mónicos
irreducibles. Para ello procedamos por inducción sobre el grado deg p ≥ 1.
Si deg p = 1, es claro que p es irreducible.
Supongamos que deg p > 1, y que el resultado es cierto para todo polinomio mónico de grado
inferior al de p.
Si p es irreducible, se sigue lo pedido.
En caso contrario, se puede expresar p = g1 g2 con g1 , g2 ∈ K[X] no constantes, esto es, de grado
no inferior a 1. Además podemos elegirlos mónicos pues el producto de los coeficientes directores
de ambos polinomios vale 1. Puesto que deg g1 , deg g2 < deg p, por hipótesis de inducción g1 y g2
se pueden expresar como producto de polinomios mónicos irreducibles, luego lo mismo sucede con
p = g1 g2 .
Veamos la unicidad: sean aq1 q2 · · · qm = p = bp1 p2 · · · pr dos descomposiciones como las del
enunciado, donde qi , pj ∈ K[X] mónicos e irreducibles, a, b ∈ K. Puesto que el producto de
polinomios mónicos es mónico se sigue que a = b es el coeficiente director de p. Por tanto
q1 q2 · · · qm = p1 p2 · · · pr . Ahora q1 divide p1 p2 · · · pr , y como q1 es irreducible, divide a algún pj .
Cambiando la numeración, si es preciso, podemos suponer que q1 divide p1 , y como p1 y q1 son
mónicos, por el corolario anterior se sigue que p1 = q1 . Simplificando nos queda q2 · · · qm = p2 · · · pr .
Procediendo análogamente con q2 y reiterando el proceso se sigue que m = r y salvo el orden es
p2 = q 2 , p 3 = q 3 , . . . , p m = q m .

Ejemplo. Factoricemos p(X) = 14X 5 − 25X 4 − 85X 3 + 285X 2 − 179X + 30 en Q[X]. Buscamos
primero sus raı́ces enteras, que pueden ser ±1, ±2, ±3, ±5, ±6, ±10, ±15, ±30; pero p(1) = 40,
p(−1) = 550 (utilizar el algoritmo de Ruffini), luego sólo −3 es una posible raı́z; de nuevo mediante
el algoritmo de Ruffini comprobamos que p(−3) = 0 y que
q(X) = p(X)/(X + 3) = 14X 4 − 67X 3 + 116X 2 − 63X + 10,
polinomio que ya no puede tener raı́ces enteras y cuyas posibles raı́ces fraccionarias son ±1/2, ±5/2,
±1/7, ±2/7, etc. Afortunadamente, probando primero 1/2 resulta q(1/2) = 0,
r(X) = q(X)/(X − 1/2) = 14X 3 − 60X 2 + 86X − 20 = 2(7X 3 − 30X 2 + 43X − 10),
que sólo puede tener raı́ces fraccionarias entre ±1/7, ±2/7, etc. Probando nuevamente se obtiene
r(2/7) = 0, (1/2)r(X)/(X − 2/7) = 7X 2 − 28X + 35 = 7(X 2 − 4X + 5) = 7[(X − 2)2 + 1], que ya
no puede tener raı́ces en Q (¿por qué?) y por tanto es irreducible (¿por qué?). Finalmente, pues,
1 2
p(X) = 14X 5 − 25X 4 − 85X 3 + 285X 2 − 179X + 30 = 14(X + 3)(X − )(X − )(X 2 − 4X + 5).
2 7
110 CAPÍTULO 3. NÚMEROS RACIONALES. POLINOMIOS.

Corolario 3.2.43. Sean p1 , . . . , pm ∈ K[X] no nulos, factorizados como potencias de polinomios


mónicos irreducibles (distintos). Entonces:
(i) El mcm(p1 , . . . pm ) es el producto de los factores comunes y no comunes con mayor exponente.

(ii) El mcd(p1 , . . . pm ) es el producto de los factores comunes con menor exponente.


Demostración. Es una comprobación directa utilizando las definiciones y las propiedades anteriores.

Ejemplo. Sean p, q ∈ Q[X] los polinomios:

p(X) = X 5 + 3X 4 + 4X 3 + 4X 2 + 3X + 1, q(X) = X 6 + X 4 − X 2 − 1.

Determinemos mcd(p, q), mcm(p, q) a partir de su factorización. Procediendo como antes es fácil
ver que
p(X) = (X + 1)3 (X 2 + 1), q(X) = (X + 1)(X − 1)(X 2 + 1)2 ,
y ası́
mcd(p, q) = (X + 1)(X 2 + 1), mcm(p, q) = (X + 1)3 (X − 1)(X 2 + 1)2 .

Ejercicios
En los ejercicios siguientes, si no se especifica nada sobre K se supone K = Q.
13.1. Sea p ∈ Q[X] tal que p(1) = 1, p(2) = 4. Sea q(X) = X 2 − 3X + 2. Determinar el resto de la
división de p por q.
13.2. Hallar el cociente y el resto de la división de X 2 , X 3 , X 4 y X 5 por el polinomio q(X) =
X 3 − 2X 2 + 3X − 1.
13.3. Determinar polinomios u y v tales que

X 3 u(X) + (1 − X)2 v(X) = 1

(i) utilizando el algoritmo de Euclides-Bézout;

(ii) desarrollando (X + (1 − X))4 por la fórmula del binomio de Newton.

13.4. ¿Cuáles son las raı́ces del polinomio


1 1 1
p(X) = 1 − X + X(X − 1) + · · · + (−1)n X(X − 1) · · · (X − n + 1)
1! 2! n!
para cada n ∈ N?
Indicación : ¿Quién es (1 − t)m ?
13.5. Demostrar que si c/d es una fracción irreducible que representa uno de los ceros del polinomio
de coeficientes enteros
p(X) = an X n + · · · + a1 X + a0 ,
entonces c − md es un divisor de p(m) para todo entero m.
Determinar los ceros racionales del polinomio

p(X) = X 4 − 2X 3 − 8X 2 + 13X − 24.

13.6. Hallar un polinomio de grado 3 que al dividirlo por X − 1, X − 2 y X + 5 da, respectivamente,


restos 2, 1, 8. ¿Hay más de una solución?
13.7. ¿Puede ser un polinomio divisible por su derivada? Justificar la respuesta.
3.2. POLINOMIOS 111

13.8. Sean p(X) = X 5 + 2X 3 − 5X − 3, q(X) = X 2 − 2X − 12. Hallar el cociente y el resto de la


división de p por q, y deducir que p y q son relativamente primos.

13.9. Hallar el máximo común divisor y el mı́nimo común múltiplo de los polinomios

p(X) = 2X 4 + X 3 − 8X 2 − X + 6, q(X) = 2X 3 − 7X 2 + 8X − 3.

¿Cuáles son las raı́ces de p y q?

13.10. (1) Expresar el polinomio p(X) = 3X 4 − 5X 3 + 6X 2 + 7X − 5 como combinación lineal de


potencias de X − 2.
(Indicación : Dividir sucesivamente por X − 2.)
(2) ¿Cuánto valen p(2), p0 (2), p00 (2), p000 (2), p(iv) (2)?

13.11. Fórmula de Taylor. Sea p ∈ Q(X) un polinomio de grado n y a ∈ Q. Probar que

n
X p(k) (a)
p(X) = (X − a)k .
k!
k=0

13.12. Derivada n-ésima de un producto (Leibniz). Sea K un cuerpo cualquiera y p, q ∈


K[X]. Probar por inducción que

n  
X n
(pq)(n) = p(k) q (n−k) .
k
k=0

13.13. Sea K un cuerpo cualquiera. Demostrar que si an X n + an−1 X n−1 + · · · + a1 X + a0 ∈ K[X]


es irreducible, también lo es an + an−1 X + · · · + a1 X n−1 + a0 X n .

13.14. Descomponer el polinomio X 4 − 5X 2 + 6 en factores irreducibles en Q[X].

13.15. Probar que p(X) = X 4 + 4 no tiene raı́ces en Q y que puede factorizarse (en Q[X]) como
producto de dos polinomios de grado 2.

3.2.6. Polinomios, maple y Mathematica


Los polinomios aparecen en casi todas las áreas de la Matemática en una o varias de sus
múltiples facetas. Son también de fundamental importancia en numerosı́simas aplicaciones a las
demás ciencias. Por tanto, no es de extrañar que los programas de cálculo simbólico dispongan de
una amplia cantidad de recursos para su manipulación.
Como señala D. Duval en [Duval], hh los polinomios constituyen elementos básicos para el cálculo
formal; [· · · ] figuran explı́cita o implı́citamente en todos los cálculos, por lo que es imprescindible
saber manejarlos lo más eficazmente posible.ii
Es imposible dar una descripción breve de las órdenes de maple y Mathematica que se
encargan del manejo de los polinomios, y menos de los matices que admiten muchas de ellas. En
consecuencia, reseñaremos las más básicas y nos remitimos a los manuales o al menú de ayuda de
cada programa para más información.
En lo que sigue, A, B, etc., indican polinomios en una indeterminada x.
112 CAPÍTULO 3. NÚMEROS RACIONALES. POLINOMIOS.

Diferentes representaciones de un polinomio

maple Matematica RESULTADO


collect(A,x); Collect[A,x] Reorganiza el polinomio de manera que x sea
“la indeterminada dominante”, aunque haya
otros “parámetros variables”.
expand(A); Expand[A] Desarrolla productos y potencias.
? FactorTerms[A] Si lo hay, saca factor común numérico.
? FactorTerms[A,x] Si lo hay, saca factor común que no dependa
de x.
simplify(A); Simplify[A] “Simplifica” (a veces) la expresión de A.

Ejemplos: maple

collect(x + 4*y + 5*x*y, x); (1 + 5 y) x + 4 y


collect(x + 4*y + 5*x*y, y); (4 + 5 x) y + x
expand((2 + 4*x^2)^2*(x - 1)^3); 52 x3 − 28 x2 + 12 x − 4 + 64 x5 − 64 x4 + 16 x7 − 48 x6
simplify((x - 1)^2 + 4*x); x2 + 2 x + 1

Ejemplos: Matematica

Collect[x + 4 y + 5 x y, x] 4y + x(1 + 5y)


Collect[x + 4 y + 5 x y, y] x + (4 + 5x)y
Expand[(2 + 4 x^2)^2 (x - 1)^3] −4 + 12 x − 28 x2 + 52 x3 − 64 x4 + 64 x5 − 48 x6 + 16 x7
FactorTerms[2 + 4 x^2] 2 (1 + 2x2 )
FactorTerms[2 a b + 4 a x^2, x] 2 a (b + 2x2 )
Simplify[(x - 1)^2 + 4 x] (1 + x)2

División, mcd, mcm, identidad de Bézout. Derivación.

maple Matematica RESULTADO


quo(A,B,x); PolynomialQuotient[A,B,x] Cociente de la división de A por B.
rem(A,B,x); PolynomialRemainder[A,B,x] Resto de la división de A por B.
gcd(A,B); PolynomialGCD[A,B] Máximo común divisor de A y B.
lcm(A,B); PolynomialLCM[A,B] Mı́nimo común múltiplo de A y B.
gcdex(A,B,x,’s’,’t’); ? Máximo común divisor de A y B
s,t; y coeficientes de la identidad de
Bézout.
diff(A, x) D[A, x] A0 , polinomio derivado de A.

Ejemplos: maple

Para A:=2*x^4+x^3-8*x^2-x-6; y B:=2*x^3-7*x^2+8*x-3;


3.2. POLINOMIOS 113

quo(A,B); x+4
rem(A,B); 6 + 12x2 − 30x
gcd(A,B); 1
lcm(A,B); (2x4 + x3 − 8x2 − x − 6)(2x3 − 7x2 + 8x − 3)
1
gcdex(A,B,x,’u’,’v’); u,v; 5 5 1 2 1 1 1 1
− 4 + 4x − 2x , 2 − x + x2 + 2x3
2 2 1 1 8 8 1
diff((x + 1)^2*(x - 1)^3,x); 2(x + 1)(x − 1)3 + 3(x + 1)2 (x − 1)2
diff(expand((x + 1)^2*(x - 1)^3),x); 5x4 − 4x3 − 6 x2 + 4 x + 1
expand(diff((x + 1)^2*(x - 1)^3,x)); 5x4 − 4x3 − 6 x2 + 4 x + 1

Ejemplos: Matematica

Para A=2 x^4+x^3-8 x^2-x-6, B=2 x^3-7 x^2+8 x-3,

PolynomialQuotient[A,B, x] 4+x
PolynomialRemainder[A,B, x] 6 − 30x + 12x2
PolynomialGCD[A,B] 1
PolynomialLCM[A,B] (−3 + 8x − 7x2 + 2x3 )(−6 − x − 8x2 + x3 + 2x4 )
D[(x + 1)^2*(x - 1)^3,x] 2 (−1 + x)3 (1 + x) + 3 (−1 + x)2 (1 + x)2
D[Expand[(x + 1)^2*(x - 1)^3],x] 1 + 4 x − 6 x2 − 4x3 + 5x4
Expand[D[(x + 1)^2*(x - 1)^3,x]] 1 + 4 x − 6 x2 − 4x3 + 5x4

Raı́ces

Aquı́ aumenta la complicación de manera considerable. Ambos programas permiten distintos


tipos de búsqueda de raı́ces, sea en diferentes cuerpos, sea proporcionando valores numéricos apro-
ximados si no hay o no interesan valores simbólicos ‘exactos’. Nos limitamos, por ello, a recoger las
órdenes más simples.

maple Matematica RESULTADO


roots(A,x); Da las raı́ces (racionales) y su multiplicidad. Puede
omitirse la variable si es la ‘evidente’.
Roots[A == 0, x] Ver ejemplos. Puede omitirse la variable si es la
‘evidente’.
solve(A=0,x); Solve[A == 0, x] Ver ejemplos. Puede omitirse la variable si no hay
ambigüedad.
fsolve(A=0,x); NSolve[A == 0, x] (Puede omitirse la x si es la variable ‘evidente’.)
Busca soluciones aproximadas usando aritmética
de punto flotante, con diferentes opciones.

Ejemplos: maple

roots(x^3 + x^2 - 12); [[2, 1]]


3 1 √ 3 1 √
solve(x^3 + x^2 - 12=0); 2, − + I 15, − − I 15
2 2 2 2
fsolve(x^3 + x^2 - 12=0); 2.
fsolve(x^3 + x^2 - 12=0,x,complex); −1.500000000 − 1.936491673 I,
−1.500000000 + 1.936491673 I, 2.
114 CAPÍTULO 3. NÚMEROS RACIONALES. POLINOMIOS.

Ejemplos: Matematica
1 √ 1 √
Roots[x^3 + x^2 - 12 == 0] x == (−3 − ı̇ı 15)|| x == (−3 + ı̇ı 15)|| x == 2
2 2  
√ √
  
1 1
Solve[x^3 + x^2 - 12 == 0] {x → 2}, x → (−3 − ı̇ı 15) , x → (−3 + ı̇ı 15)
2 2
NSolve[x^3 + x^2 - 12 == 0] {{x → −1.5 − 1.93649 ı̇ı}, {x → −1.5 + 1.93649 ı̇ı}, {x → 2.}}

Factorización

Como las raı́ces, la factorización de polinomios depende del cuerpo en el que se toman los
coeficientes. La cantidad de situaciones posibles es inmensa, y sólo podemos dar idea somera de
algunas de ellas mediante ejemplos.

maple Matematica RESULTADO


factor(A); Factoriza respecto al menor cuerpo que contiene a los
coeficientes. Admite opciones.
Factor[A] hh Factoriza sobre los enterosii, dice el manual. Ver

ejemplos.
irreduc(A); true si A es irreducible sobre el menor cuerpo que
contiene a los coeficientes, false si es reducible. Ad-
mite opciones.

Ejemplos: maple

factor(4*x^2-1);
(2x − 1)(2x + 1)
factor(x^2 - 2*sqrt(2)*x + 2);

(x − 2)2
factor(x^6-12*x^4+44*x^2-48);
(x − 2)(x + 2)(x2 − 6)(x2 − 2)
factor(sqrt(2)*(x^6-12*x^4+44*x^2-48));
√ √ √
2 (x2 − 6)(x + 2)(x − 2)(x + 2)(x − 2)
factor(sqrt(2)*sqrt(3)*(x^6-12*x^4+44*x^2-48));
√ √ √ √ √ √ √ √
3 2 (x − 3 2)(x + 3 2) (x + 2)(x − 2)(x + 2)(x − 2)
factor(x^6-12*x^4+44*x^2-48,{sqrt(2),sqrt(3)}); (más ‘ortodoxo’)
√ √ √ √ √ √
(x − 3 2)(x + 3 2) (x + 2)(x − 2)(x + 2)(x − 2)
irreduc(x^3+5);
true
irreduc(x^3+5,5^(1/3));
false
factor(x^3+5,5^(1/3));
(x2 − x 5(1/3) + 5(2/3) ) (x + 5(1/3) )
3.2. POLINOMIOS 115

Ejemplos: Mathematica

Factor[4 x^2 + 1]
(−1 + 2 x) (1 + 2 x)
Factor[x^2 - 2 Sqrt[2] x + 2]
2 − 2 x + x2
Factor[x^2 - 2 Sqrt[2] x + 2, Extension -> Sqrt[2]]

( 2 − x)2
Factor[x^6 - 12 x^4 + 44 x^2 - 48]
(−2 + x) (2 + x) (−6 + x2 ) (−2 + x2 )
Factor[Sqrt[2] (x^6 - 12 x^4 + 44 x^2 - 48)]

2 (−2 + x) (2 + x) (−6 + x2 ) (−2 + x2 )
Factor[x^6 - 12 x^4 + 44 x^2 - 48, Extension -> {Sqrt[2],Sqrt[3]}]
√ √ √ √ √ √
( 2−x) ( 6−x) (−2+x) (2+x) ( 2+x) ( 6+x) (x+ 2)(x− 2)(x+2)(x−2)

(Para entender qué significan las extensiones de cuerpos y por qué son importantes, ver el
capı́tulo 7 de [GJPR].)
116 CAPÍTULO 3. NÚMEROS RACIONALES. POLINOMIOS.
Bibliografı́a

[C-C-S] Cohen, A. M.; Cuypers, H.; Sterk, H.: Algebra Interactive! (Learning algebra in an
exciting way). Springer, Berlin, 1999.

[D’A-W] D’Angelo, J. P.; West, D. B.: Mathematical Thinking. Problem-Solving and Proofs.
Prentice-Hall, Upper Saddle River, NJ, 1997.

[D-H] Dorronsoro, J.; Hernández, E.: Números, grupos y anillos. Addison-Wesley/UAM,


Madrid, 1996.

[Duval] Duval, D.: Cálculo simbólico y automatización. Mundo cientı́fico, Extra 1: El universo de
los números, pp. 78–86.

[GJPR] Goberna, M. A.; Jornet, V.; Puente, R.; Rodrı́guez, M.: Álgebra y fundamentos.
Una introducción. Ariel, Barcelona, 2000.

[Pest] Pestana, D. & al.: Curso práctico de Cálculo y Precálculo. Ariel, Barcelona, 2000.

El apartado sobre factorización de polinomios está en buena parte tomado de

[Bern] Bernal, E.: Algebra Lineal. Apuntes de la asignatura, Zaragoza, 1998–99.

Documentos en Internet

[1] M. Conthe: La paradoja de Simpson. Expansión, 08/10/2002.


http://www.expansiondirecto.com/edicion/componentes/noticia/
VersionImprimirExp cmp/0,3240,184488,00.html
http://www.expansiondirecto.com/edicion/componentes/noticia/
VersionImprimirExp cmp/0,3240,192294,00.html
(Cada una de las direcciones debe ir escrita en una sola lı́nea.)

[2] J. M. Albaigès, Abel-Galois: dos vidas, un destino.


http://www.grijalvo.com/Albaig%E8s/b JMAiO ABEL GALOIS.htm

[3] The MacTutor History of Mathematics archive: Quadratic, cubic and quartic equa-
tions.
http://www-history.mcs.st-and.ac.uk/history/HistTopics/Quadratic etc equations.html

[4] The MacTutor History of Mathematics archive: The development of group theory.
http://www-history.mcs.st-and.ac.uk/history/HistTopics/Development group theory.html

[5] E. T. Bell, Los grandes matemáticos: Abel.


http://www.geocities.com/grandesmatematicos/cap17.html

117
118 BIBLIOGRAFÍA
Capı́tulo 4

Números reales

En En
la asignatura de de
la asignatura Análisis matemático
Análisis matemático I se
I sehan
hantratado
tratadolas
laspropiedades
propiedades básicas
básicas de los números
números
reales desde
reales desde unun planteamiento axiomático más o menos explı́cito. Aquı́ Aquı́ nos
nos limitaremos,
limitaremos, porpor tanto,
tanto,
aa describir
describir aa grandes
grandes rasgos
rasgos las
las distintas
distintas construcciones
construcciones de de RR aa partir
partir de
de QQ yy la
la caracterización
caracterización
axiomática de
axiomática R, yy estudiaremos
de R, estudiaremos brevemente
brevemente la la representación
representación decimal
decimal (y(y otras)
otras) de
de los
los números
números
reales. La
reales. La bibliografı́a
bibliografı́a oportuna
oportuna se se irá
irá citando
citando aa lo
lo largo
largo de
de la
la exposición.
exposición.

4.1 LECTURA:
4.1. LECTURA: Construcciones
Construcciones de
de los
los números
números reales.
reales.
4.1.1 Insuficiencia
4.1.1. de Q
Insuficiencia de Q
Ya Ya hemoshemosvisto queque
visto desde
desdeel el
punto
puntodedevistavistaalgebraico,
algebraico,elelsistema
sistema de de los
los números racionales es
números racionales es
bastante incompleto:
bastante incompleto: sisi bien
bien en
en QQ eses posible
posible resolver
resolver siempre
siempre ecuaciones
ecuaciones deldel tipo
tipo ax
ax ++ bb == 0,
0, con
con
a 
= 0, hay ecuaciones tan simples como x 2 = 2 que no tienen solución. Esto fue descubierto ya
2
a 6= 0, hay ecuaciones tan simples como x = 2 que no tienen solución. Esto fue descubierto ya
por los
por los pitagóricos
pitagóricos en en el
el siglo
siglo VV antes
antes de de nuestra
nuestra era,
era, en
en su
su formulación
formulación geométrica,
geométrica, en
en términos
términos
de conmensurabilidad
de conmensurabilidad ee inconmensurabilidad
inconmensurabilidad de de longitudes
longitudes (ver
(ver notas
notas históricas
históricas en
en [[Ebb
Ebb],
], cap. 2;
cap. 2;
también, [ ], p. 79 y pp. 103–109). Dos segmentos AB y CD son
también, [Kl1], p. 79 y pp. 103–109). Dos segmentos AB y CD son conmensurables si pueden ser
Kl1 conmensurables si pueden
ser medidos
medidos exactamente
exactamente con con
una una unidad
unidad de longitud
de longitud común
común u, esu,decir,
es decir, si un
si hay haynúmero
un número “exacto”
“exacto”m ∈
m ∈ N de segmentos de longitud u que colocados uno tras otro sin solaparse
N de segmentos de longitud u que colocados uno tras otro sin solaparse cubren AB, y lo mismo cubren AB, y lo mismo
un número
un número nn de de segmentos
sementos parapara CD;
CD; la la razón
razón oo proporción
proporción entre
entre laslas longitudes
longitudes de de los
los segmentos
segmentos
AB yy CD
AB CD es es la
la misma
misma que que la
la razón
razón (el
(el cociente)
cociente) entre
entre los
los números
números m m yy n.
n. En
En caso
caso contrario,
contrario, sonson
inconmensurables.
inconmensurables.

Q
A
s
C
t ?
P

u
0 1/5 2/5 3/5 4/5 1 X ?
BDst

Figura
Figura 11 Figura
Figura 22 Figura
Figura 33
Fijado
Fijado unun segmento
segmento cualquiera,
cualquiera, es
es fácil
fácil construir
construir por
por semejanza
semejanza de
de triángulos
triángulos unun nuevo
nuevo segmento
segmento
cuya
cuya razón
razón con
con el
el primero
primero sea
sea igual
igual aa un
un valor
valor m/n
m/n arbitrariamente
arbitrariamente dado
dado (en
(en la
la figura
figura 11 se
se muestra
muestra

119
107
120 CAPÍTULO 4. NÚMEROS REALES

la construcción de un segmento de longitud 1/5: la recta OP Q y el segmento OP son arbitrarios;


el punto Q se obtiene trasladando OP cinco veces a lo largo de dicha recta; la paralela por P al
segmento que une Q con 1 corta a la recta OX en un punto a distancia 1/5 de O). En sentido
contrario, no es descabellado pensar que dos segmentos cualesquiera siempre son conmensurables:
el algoritmo de Euclides, con la división interpretada como “sustracción repetida de segmentos
iguales”, lleva gráficamente a una unidad de medida común —hasta donde el ojo puede apreciar, al
menos. Por ejemplo, en la figura 2, quitando a AB un segmento de longitud igual a CD queda un
segmento s, de longitud menor que CD; quitando a CD dos segmentos de longitud igual a s, queda
un segmento t, de longitud menor que s; quitando a s un segmento de longitud igual a t, queda
un segmento u tal que la longitud de t es exactamente tres veces la longitud de u (en t encajan
perfectamente tres segmentos de longitud u). Por tanto, u ‘mide’ a AB y CD (en el lenguaje clásico,
u es una parte alı́cuota común de AB y CD): la longitud de AB es 15 veces la longitud de u y la
longitud de CD es 11 veces la longitud de u; la proporción entre las longitudes de los segmentos
AB y CD es, en este caso, de 15 a 11.
Sin embargo, la intuición que el ojo sugiere es desmentida por la razón, y como es bien sabido, el
teorema de Pitágoras obliga a descartar la hipótesis de ‘conmensurabilidad universal’: la diagonal
del cuadrado (figura 3), de la que no dudamos que tenga una longitud, resulta inconmensurable
con el lado, pues si éste tiene una longitud m respecto de cualquier unidad, la diagonal ha de tener
una longitud n tal que n2 = m2 + m2 = 2m2 , lo cual lleva a un absurdo tras eliminar sucesivamente
factores 2 en m y n. (Ver la discusión sobre Aritmética y Geometrı́a en [A-K], p. 43).
Hizo falta mucho talento para solucionar este inconveniente (lo logró Eudoxo, contemporáneo
de Platón, con su teorı́a de las proporciones). Mucho más tarde, cuando la fiabilidad de la intuición
geométrica fue puesta en cuestión nuevamente tras el asentamiento de las geometrı́as no euclı́deas
y la crisis subsiguiente, se hizo necesaria una fundamentación del continuo, i.e., del conjunto de los
números reales (v. [Dur], pp. 70 y ss; [Kl3], cap. 41, pp. 1292 y ss.; [Ebb], cap. 2, pp. 34 y ss.).
No es este el lugar para recorrer la larguı́sima evolución histórica del concepto de número (real)
hasta las ideas actuales, por lo demás excelentemente expuesta en [Dur], pp. 60 y ss, o [Ebb], pp. 24
y ss, por ejemplo. Nos limitaremos en lo que sigue a señalar los principales puntos que subyacen a
una presentación rigurosa de los números reales, que quedan abiertos para tratar en una asignatura
posterior sobre Fundamentos de Análisis matemático.

4.1.2. Construcciones de R a partir de Q.


En la ampliación de un sistema numérico para llegar a otro mayor que subsane alguna deficiencia,
la idea directriz es ‘añadir lo mı́nimo que le falta’. Ası́, para construir Z a partir de N ‘se añaden’
los opuestos de los números naturales (y el 0, si no está incluido en N); para construir Q a partir
de Z, ‘se añaden’ los cocientes de enteros (con denominador no nulo). Para construir R a partir de
Q, hay dos procedimientos destacados:

• método de Cantor-Meray de las sucesiones fundamentales. Trata de suplir la inexis-


tencia de lı́mite de algunas sucesiones de Cauchy de números racionales no convergentes en Q,
identificando las sucesiones de Cauchy que “deberı́an converger a un mismo valor hipotético”,
porque sus diferencias convergen a 0, con ese “valor”. Se define ası́ una relación de equiva-
lencia en el conjunto de las sucesiones de Cauchy de números racionales: son equivalentes
aquellas cuya diferencia tenga lı́mite 0, de manera que R es el conjunto cociente y un número
real es una clase de equivalencia (que va a jugar el papel de ‘lı́mite’ de todas las sucesiones
de la clase). Las operaciones de suma y producto en R se definen a partir de las operaciones
de suma y producto de sucesiones, y se demuestra que con ellas R es un cuerpo. Hay que
definir ası́ mismo una relación de orden entre las sucesiones de Cauchy de Q, que permite
luego definir una ordenación en R con la cual resulta ser un cuerpo totalmente ordenado com-
pleto (en el sentido de que todo conjunto no vacı́o acotado superiormente posee supremo).
El desarrollo en detalle de este proceso se entiende mejor cuando se ha estudiado teorı́a de
4.2. AXIOMÁTICA DE R 121

anillos e ideales. Puede verse, por ejemplo, en [GJPR], [Ebb], [Ham], [S-T] (aquı́ hay además
un interesante apartado sobre la ‘conexión con la intuición’, p. 204).
Este es el método más empleado generalmente, sobre todo porque permite usar construcciones
parecidas en otras situaciones (compleción de espacios métricos en Topologı́a, por ejemplo.)
• método de Dedekind de las cortaduras. Se dirige a conseguir que se cumpla ‘el axioma
del supremo’, no válido en Q. Se parte de las cortaduras en Q, que son pares (A, B) de
subconjuntos de Q tales que:
• A y B son complementarios, A ∪ B = Q y A ∩ B = ∅;
• A=6 ∅=6 B;
• cada elemento de A es menor que cada elemento de B.
Cada cortadura está determinada por A o por B (v. comentarios en [Ebb]), de modo que
podemos quedarnos, por ejemplo, con el conjunto A, y decir como en [Spv], que
un número real es un conjunto A de números racionales con las propiedades siguientes:
• si x ∈ A e y ∈ Q es tal que y < x, entonces también y ∈ A;
• ∅=6 A 6= Q;
• no hay un elemento máximo en A, de manera que si x ∈ A, existe algún y ∈ A tal que
y > x.
De qué modo se definen la suma, el producto y la ordenación en el conjunto R de los números
reales puede verse en [Spv], pp. 811 y ss.; ver también [Ebb], pp. 36 y ss.
• otros métodos. ¿Por qué no usar “los decimales” para construir R? Es posible, pero tiene
más inconvenientes ‘técnicos’ que los métodos anteriores. La manera de hacerlo está indicada
en [Spv], pp. 826–827, ejercicio 2.
También se han empleado intervalos encajados o, equivalentemente, pares de sucesiones
monótonas —los extremos de los intervalos— (v. [Ebb], especialmente el comentario final,
p. 46).

4.2. LECTURA: Axiomática de R.


No se planteó explı́citamente un ‘sistema axiomático para los números reales’ hasta que fue for-
mulado esencialmente por Hilbert hacia 1900, en su obra Grundlagen der Geometrie (Fundamentos
de Geometrı́a). Actualmente, la descripción axiomática de R se resume en:
• R es un cuerpo conmutativo totalmente ordenado completo, es decir, tal que todo conjunto
no vacı́o acotado superiormente tiene supremo.
Ası́ se introduce R en la mayorı́a de los textos de Análisis matemático, para comenzar a estudiar
sus propiedades de manera inmediata. Una buena muestra es [Ap].

Unicidad y minimalidad de R.
En las sucesivas ampliaciones de los números se busca siempre, como hemos señalado anterior-
mente, solucionar algún defecto, pero con una propiedad de minimalidad. Ası́, en los contenidos
N ⊂ Z ⊂ Q,
Z es el menor grupo que contiene a N y Q es el menor cuerpo que contiene a Z; ahora, R no
sólo es el menor cuerpo completo que contiene a Q, sino que es el único salvo isomorfismos.
Una explicación detallada de este hecho puede verse en [Spv], cap. 29, y en [Ebb], p. 50; también,
en [S-T], cap. 10.
122 CAPÍTULO 4. NÚMEROS REALES

4.3. Representación decimal de los números reales


Estudiaremos el significado de la representación decimal de los números reales, justificando
algunos de los resultados que son conocidos desde la enseñanza secundaria.
En toda esta sección, cuando no se especifica lo contrario, hh númeroii significa número real.

4.3.1. Aperitivo.
Lee atentamente estos enunciados:

(1) 0.999 . . . es el número inmediatamente anterior a 1.

(2) 0.333 · · · = 1/3.

(3) Sea x = 0.999 . . . Entonces 10x = 9.999 . . ., de modo que 10x − x = 9.999 . . . − 0.999 . . . = 9
9
y de aquı́ 9x = 9, luego x = = 1, es decir, 1 = 0.999 . . .
9
Responde ahora cuidadosamente a estas cuestiones:

(i) ¿Es cierto (1)?


SÍ u
t NO u
t NO SÉ u
t

(ii) ¿Es cierto (2)? Si lo es, ¿por qué?


SÍ u
t NO u
t NO SÉ u
t

(iii) ¿Es cierto el resultado de (3)?


SÍ u
t NO u
t NO SÉ u
t

¿Qué consecuencias sacas?

Con los números decimales no valen las mismas reglas de operación que con los demás números
t
u

Los números reales no pueden manejarse como las letras en el Álgebra u


t

Otras (explicarlas) u
t

4.3.2. Representación decimal canónica


Las preguntas del apartado anterior tienen por objeto hacernos reflexionar, para que nos plan-
teemos la necesidad de aclarar esta cuestión:

¿en qué consiste la representación decimal de un número real?

Cuando el número real, en particular, es un entero, la cuestión quedó completamente dilucidada.


Pasar de los enteros a los racionales a/b con a ∈ N y b = 10n para algún n ∈ N (*) es ‘casi
automático’: por ejemplo,
123456789 5 6 7 8 9
= 1 · 103 + 2 · 102 + 3 · 101 + 4 · 100 + + + + +
105 10 102 103 104 105
consta de una ‘parte entera’ 1 · 103 + 2 · 102 + 3 · 101 + 4 · 100 , que hemos convenido en representar por
1234, y de una ‘parte fraccionaria’ 5 · 10−1 + 6 · 10−2 + 7 · 10−3 + 8 · 10−4 + 9 · 10−5 , que parece lógico
escribir a continuación de lo anterior como 56789, con algún “separador” en medio que indique que
(*)
a/b es una fracción decimal, no necesariamente irreducible, como en 25/100.
4.3. REPRESENTACIÓN DECIMAL 123

ahora las cifras son los coeficientes de las potencias negativas decrecientes de 10. En la tipografı́a
latina el separador tradicional es una coma, y en la anglosajona un punto; bajo la influencia de
los ordenadores se ha extendido el uso de este último y será el que (a regañadientes) adoptaremos
aquı́. Ası́ pues, la representación decimal del número inicial será hh 1234.56789 ii.
Al igual que para los enteros, hh −1234.56789 ii representará el número opuesto del anterior,
−123456789/105 .
Mantenemos, pues, una notación posicional, en la que cada cifra va multiplicada según su
posición por un factor (un peso), que en el caso de los enteros es una potencia positiva o nula de
1
10, admitiéndose ahora pesos fraccionarios del tipo n = 10−n (i.e., potencias negativas de 10).
10
Pero ası́ se escriben sólo algunos números reales muy especiales: en general, una representación
decimal finita em em−1 . . . e1 e0 .d1 d2 . . . dn (m entero no negativo, n ∈ N, con ek , dj entre 0 y 9 para
0 ≤ k ≤ m, 1 ≤ j ≤ n), corresponde a

d1 d2 dn
em · 10m + · · · + e1 · 10 + e0 + + + ··· + n
10 102 10

em · 10n+m + · · · + e1 · 10n+1 + e0 · 10n + d1 · 10n−1 + d2 · 10n−2 + · · · + dn


= .
10n
(análogo para hh −em etc. ii tomando los opuestos). Se trata, por supuesto, de números racionales;
sin embargo, no todos números racionales tendrán una representación decimal finita: esto es cierto
tan sólo para los que puedan expresarse como cociente de un entero por una potencia de 10.
Notemos, de paso, que cuando em em−1 . . . e1 e0 .d1 d2 . . . dn sea la expresión decimal de un número
x, entonces em em−1 . . . e1 e0 d1 d2 . . . dn (sin punto decimal) es justamente la representación en base
10 del número entero 10n x.
La etapa siguiente, inevitable como vemos, es pasar a “decimales infinitos”. Ahora bien: resulta
√3
más complicado aclarar qué queremos decir, por ejemplo, cuando escribimos 2 = 1.2599210499 . . . .

¿Qué significan los puntos suspensivos? ¿Por qué no es 3 2 = 9.9401299521 . . . o cualquier otra ex-
presión similar? ¿Con qué criterio se han elegido las cifras? √
Recapacitando un momento, hemos comenzado escribiendo ‘la parte entera’ √ de 3 2, que es 1;
luego hemos añadido la mayor cifra decimal, 2, tal que√1.2 no sobrepasa a 3 2; después añadimos
la mayor cifra decimal, 5, tal que 1.25 no sobrepasa a 3 2; y ası́ continuamos añadiendo cifras:
√3
√3
√3
1≤√ 2<2 1.259 ≤ √ 2 < 1.260 1.259921 ≤ √ 2 < 1.259922
3 3
1.2 ≤ √2 < 1.3 1.2599 ≤ √2 < 1.2600 1.2599210 ≤ 3 2 < 1.2599211
1.25 ≤ 3 2 < 1.26 1.25992 ≤ 3 2 < 1.25993 etc.

En resumen, vamos haciendo la selección de los dı́gitos de modo que se formen sucesivamente
decimales finitos, cada vez con una cifra más, de tal manera que dichos decimales finitos sean en
cada paso los que “mejor ajusten por abajo”, los que constituyan la aproximación inferior óptima
del número a representar.
La herramienta fundamental en este proceso de construir la representación decimal de cualquier
número real es la noción de parte entera de un numero real arbitrario. Recordemos su definición.

Lema 4.3.1 (Parte entera de un número real). Dado x ∈ R, existe un número entero (y uno
solo), que suele denotarse con bxc, tal que

bxc ≤ x < bxc + 1.

Denominaremos a bxc la parte entera de x.


Dicho en palabras, bxc es el mayor número entero menor o igual que x.
124 CAPÍTULO 4. NÚMEROS REALES

Demostración. Ver [1], pág. 8, Teor. 1.2.3.


La traducción gráfica de este resultado es simple: cada número
S real x queda en uno y sólo uno
de los intervalos [N, N + 1), N ∈ Z, o dicho de otro modo, R = N ∈ [N, N + 1) (unión disjunta:
Z

estos intervalos constituyen una partición de R). Cuando x ∈ [N, N + 1), y sólo entonces, N es la
parte entera de x.
Tenemos ası́ una pista para construir gráficamente, en general, las cifras decimales sucesivas
de cualquier número real x ≥ 0. Pues si ponemos N = bxc y d1 es la primera cifra decimal de
d1 d1 + 1
x, determinada por la condición de que N + ≤ x < N + , esto significará que x ∈
10 10
d1 d1 + 1
[N + , N + ), luego dividiendo el intervalo [N, N + 1) en diez subintervalos disjuntos, del
10 10
1
mismo tipo, de longitud ,
10
1 1 2 8 9 9
[N, N + ), [N + , N + ), . . . , [N + , N + ), [N + , N + 1),
10 10 10 10 10 10
basta localizar entre ellos el único que contiene a x.
x
[ )[ ) • • • • • [ × ) • • • • • [ )[ )
1 2 d1 d1 +1 8 9
N N + 10 N + 10 N + 10 N + 10 N + 10 N + 10 N +1
Obsérvese que si ‘ampliamos 10 veces la escala’, resulta 10N + d1 ≤ 10x < 10N + d1 + 1, de
modo que justamente 10N +d1 = b10xc, y obtenemos por tanto d1 = b10xc−10N = b10xc−10bxc.
d1 d1 + 1
Para hallar el segundo decimal, repetimos el proceso: el intervalo [N + , N + ) se divide
10 10
1
en diez subintervalos cerrados a izquierda y abiertos a derecha, disjuntos, cada uno de longitud ,
100
d1 d2 d1 d2 + 1
y localizamos el único de ellos que contiene a x. Sea éste [N + + ,N + + ); entonces
10 100 10 100
d1 d2 d1 d2 + 1
N+ + ≤x<N+ + , y multiplicando por 100,
10 100 10 100
100N + 10d1 + d2 ≤ 100x < 100N + 10d1 + d2 + 1,
es decir,
100N + 10d1 + d2 = b100xc y d2 = b100xc − 10(10N + d1 ) = b102 xc − 10b10xc.
Reiterando el proceso iremos obteniendo los sucesivos decimales de x. Análogamente, llegaremos a
d1 d2 dn d1 d2 dn + 1
N+ + 2 + ··· + n ≤ x < N + + 2 + ··· + y dn = b10n xc − 10b10n−1 xc.
10 10 10 10 10 10n
Esta va a ser la definición ‘oficial’ de las cifras decimales de un número real cualquiera.
Definición 4.3.2 (Cifras decimales). Dado un número real x ≥ 0 y n ∈ N, la n-ésima cifra
decimal de x es
dn = b10n xc − 10b10n−1 xc.

Si x ≥ 0 y em em−1 . . . e1 e0 es la representación en base 10 de bxc bxc = em 10m +· · ·+e1 10+e0 ,

ei ∈ {0, 1, 2, 3, 4, 5, 6, 7, 8, 9} (0 ≤ i ≤ m), em 6= 0 si bxc 6= 0 , la expresión

em em−1 . . . e1 e0 .d1 d2 . . . dn . . .
recibe el nombre de representación decimal o desarrollo decimal de x.
Cuando hay un M tal que dn = 0 para todo n > M , el desarrollo se abrevia simplemente a
x = em em−1 . . . e1 e0 .d1 d2 . . . dM .
Para x < 0, se toma la representación decimal de |x| con un signo − delante.
4.3. REPRESENTACIÓN DECIMAL 125

No hay que dejarse impresionar por esta definición; las sucesivas cifras decimales de x pueden
irse obteniendo recursivamente como en el comentario previo, según justificamos a continuación.

Proposición 4.3.3. Dado un número real x ≥ 0 y una sucesión (dn ) de números enteros, sea (qn )
la sucesión definida por
d1 dn
qn = bxc + + · · · + n , n ∈ N.
10 10
Las siguientes propiedades son equivalentes:

(i) para todo n ∈ N, dn = b10n xc − 10b10n−1 xc.


1
(ii) para todo n ∈ N, q n ≤ x < qn + .
10n
Demostración. (i) =⇒ (ii).
1
Habrá que probar que qn ≤ x < qn + n
, o lo que es lo mismo, que 10n qn ≤ 10n x < 10n qn + 1,
10
lo que a su vez, puesto que 10n qn es entero, es lo mismo que decir que 10n qn = b10n xc. Pero

10n qn = 10n bxc + 10n−1 d1 + 10n−2 d2 + · · · + 10dn−1 + dn


= 10n bxc + 10n−1 (b10xc − 10bxc) + 10n−2 (b102 xc − 10b10xc)
+ · · · + 10(b10n−1 xc − 10b10n−2 xc) + (b10n xc − 10b10n−1 xc)
= 10n bxc + 10n−1 b10xc − 10n bxc + 10n−2 b102 xc − 10n−1 b10xc
+ · · · + 10b10n−1 xc − 102 b10n−2 xc + b10n xc − 10b10n−1 xc
= b10n xc,

que es lo que querı́amos demostrar. (**)


(ii) =⇒ (i).
Como para todo n ∈ N es 10n qn un entero que según la hipótesis (ii) verifica
10n qn ≤ 10n x < 10n qn + 1,
resulta 10n qn = b10n xc.
dn
Puesto que obviamente qn = qn−1 + n (añadiendo q0 = bxc si es necesario),
10
se sigue que

dn = 10n qn − 10n qn−1 = 10n qn − 10 · 10n−1 qn−1 = b10n xc − 10b10n−1 xc.

Ejemplo. Cálculo de las cifras decimales de un número racional por división.


Para hallar las sucesivas cifras decimales de 57/13, por ejemplo, en la escuela procedı́amos ası́:

57 | 13 57. | 13 57. | 13 57. | 13


5 4 50 4.3 50 4.38 50 4.384
11 110 110
6 60
8 etc.
(**)
También puede hacerse por inducción: para n = 1,

10q1 = 10bxc + d1 = 10bxc + (b10xc − 10bxc) = b10xc,

y si 10n qn = b10n xc,

dn+1
10n+1 qn+1 = 10n+1 (qn + ) = 10 · 10n qn + dn+1 = 10b10n xc + (b10n+1 xc − 10b10n xc) = b10n+1 xc.
10n+1
126 CAPÍTULO 4. NÚMEROS REALES

¿Por qué ‘funciona’ este algoritmo? Analicémoslo en general. Supongamos que tenemos un número
x = a/b > 0 con a, b ∈ N (para simplificar). Efectuando la división entera de a por b, obtendrı́amos
a = N b + r0 con 0 ≤ r0 < b. Entonces N = ba/bc, porque de la condición sobre r0 se deduce que
N b ≤ a < N b + N = (N + 1)b y de aquı́ que N ≤ a/b < N + 1.
Para continuar, “bajamos un cero” que añadimos al resto r0 , y dividimos por b: es decir,
efectuamos la división entera de 10r0 por b, 10r0 = d1 b + r1 , 0 ≤ r1 < b. Como antes,
d1 b ≤ 10r0 < d1 b + b = (d1 + 1)b, y puesto que r0 = a − N b, esto da
d1 b ≤ 10a − 10N b < (d1 + 1)b,
10N b + d1 b ≤ 10a < 10N b + (d1 + 1)b,
10N + d1 ≤ 10(a/b) < 10N + d1 + 1,
y dividiendo or 10,
d1 a d1 1
N+ ≤ <N+ + ,
10 b 10 10
lo que prueba que el cociente d1 es la primera cifra decimal de a/b. Prosiguiendo de manera análoga,
los sucesivos cocientes son, efectivamente, las siguientes cifras decimales de a/b.
Corolario 4.3.4. Dado x ≥ 0, si para cada n ∈ N es dn su n-ésima cifra decimal, poniendo
d1 dn
qn = bxc + + · · · + n , se tiene
10 10
d1 dn
x = sup{qn = bxc + + · · · + n : n ∈ N} = lı́m qn .
10 10 n

Demostración. De
1
q n ≤ x < qn + n .
10
se sigue que
1
|x − qn | < n → 0 cuando n → +∞,
10
y ası́
lı́m qn = x.
n
Además (qn ) es una sucesión monótona no decreciente (¿quién es qn+1 − qn y qué signo tiene?), con
lo cual también sup{qn : n ∈ N} = lı́mn qn = x.
Hay ‘expresiones decimales’ que no aparecen como representación decimal de ningún número
según nuestra definición. Por ejemplo, 0.999 . . . , puesto que, con la notación anterior,
9 9 9 9

9 9 9
 − n·
lı́m qn = lı́m + + ··· + n = lı́m 10 10 10 = 10 = 1,
n n 10 102 10 n 1 9
1−
10 10
mientras que 1 = 1.000 . . . . Pero cualquier ‘expresión decimal’ ±em em−1 . . . e1 e0 .d1 d2 . . . dn . . . que
‘no acabe en una sucesión de nueves’ (i.e., que no cumpla dn = 9 para todos n mayores o iguales
que un cierto n0 ), es el desarrollo decimal de algún número real (¿te atreves a demostrarlo?).
Interpretaremos las ‘expresiones decimales anómalas’ como un lı́mite, igual que en el ejemplo
anterior. Para que no haya ambigüedad, si es necesario llamaremos a la representación decimal de x
tal como la hemos definido la representación decimal canónica de x. (Comparar con [B-S], pp. 73 y
ss., y [D’A-W], pp. 231 y ss.)
Ejercicio. Para cada n ∈ N, sean an , bn ∈ {0, 1, 2, 3, 4, 5, 6, 7, 8, 9}, y supongamos que
a  
1 a2 an  b1 b2 bn
lı́m + + · · · + n = lı́m + + ··· + n .
n 10 102 10 n 10 102 10
Probar que an = bn para todo n o, en caso contrario, existe un N ∈ N tal que an = bn para todo
n ≤ N y an = 0, bn = 9 (o an = 9, bn = 0) para todo n > N .
(Cf. [Lieb], p. 19.)
4.3. REPRESENTACIÓN DECIMAL 127

Una aplicación de la representación decimal (‘canónica’) es la demostración clásica de Cantor


de la no numerabilidad de R.
Proposición 4.3.5. R no es numerable.
Demostración. Ya vimos que si I es un intervalo en R, card I = card R. Basta, pues, probar que
[0, 1) no es numerable.
Supongamos lo contrario, es decir, que existe una biyección entre N y [0, 1), o sea, que hay una
sucesión (xn ) sin términos repetidos cuya imagen es [0, 1). Escribamos sus expresiones decimales,

x1 = 0.d1,1 d1,2 d1,3 . . .


x2 = 0.d2,1 d2,2 d2,3 . . .
x3 = 0.d3,1 d3,2 d3,3 . . .
.. ..
. .

y definamos entonces (
1 si dn,n = 0
dn =
0 en caso contrario.
La sucesión (qn ) definida por
d1 dn
+ · · · + n , n ∈ N,
qn =
10 10
es una sucesión monótona no decreciente (¿quién es qn+1 − qn y qué signo tiene?) acotada supe-
riormente por  
1 1 1
sup + ··· + n : n ∈ N = ,
10 10 9
luego convergente. Sea
x = lı́m qn .
n

Como 0 ≤ qn ≤ 1/9, también 0 ≤ x ≤ 1/9, y ası́ x ∈ [0, 1), por lo que x debe estar en la lista de
los xn . Pero la n-ésima cifra decimal de x es dn (¿por qué?), y la n-ésima cifra decimal de xn es
dn,n 6= dn por construcción, luego x 6= xn cualquiera que sea n y la aplicación de partida entre N y
[0, 1) no es suprayectiva, contra lo supuesto.

4.3.3. Decimales periódicos


¿Existe algún criterio para decidir si un número real es o no racional a partir de su desarrollo
decimal? La respuesta es conocida: veamos ahora la explicación.
Definición 4.3.6. Un decimal periódico es una expresión decimal de la forma

±em em−1 . . . e1 e0 .d1 d2 . . . dj p1 p2 . . . pk p1 p2 . . . pk . . . p1 p2 . . . pk . . .

en la que hay un grupo de cifras decimales p1 p2 . . . pk que se repite siempre desde un determinado
lugar. El grupo p1 p2 . . . pk es el periodo , y d1 d2 . . . dj es la parte no periódica , bien entendido
que el periodo se toma de tamaño mı́nimo y que no coincide con el final de la parte no periódica.
Suele abreviarse esta expresión poniendo ±em em−1 . . . e1 e0 .d1 d2 . . . dj p1 p2 . . . pk .
233
Ejemplo. = 10.5909090909 · · · = 10.5 90 tiene parte entera 10, parte no periódica 5 y parte
22
periódica 90.
Proposición 4.3.7. La representación decimal de cada número racional es periódica. Recı́proca-
mente, cada decimal periódico es la representación decimal de un número racional.
128 CAPÍTULO 4. NÚMEROS REALES

Demostración. Sea x ∈ Q. Como 0 = 0.0 es periódico y el caso x < 0 se reduce de manera obvia al
caso −x (> 0), podemos suponer que x = a/b, a, b ∈ N.
Como ya sabemos, podemos hallar las cifras decimales de x mediante divisiones enteras sucesi-
vas. Dividiendo a por b obtendremos un cociente N ≥ 0 y un resto r0 con 0 ≤ r0 < n. Si r0 = 0, la
expresión decimal de a/b será em em−1 . . . e1 e0 .0, donde em em−1 . . . e1 e0 es la representación decimal
de N .
En caso contrario, si fuese r0 6= 0, sea 10r0 = d1 b + r1 , 0 ≤ r1 < b. Si r1 = 0, a/b =
em em−1 . . . e1 e0 .a1 0; si r1 6= 0, 10r1 = d1 b + r2 , y seguimos el proceso inductivamente si no aparece
ningún resto 0.
En tal caso, cada resto (no nulo) r0 , r1 , . . . , rk , . . . , debe ser uno de los b − 1 enteros de que
disponemos entre 1 y b − 1. Por tanto, inevitablemente aparecerá en algún momento un resto (en
el peor de los casos, rb−1 ) que ya haya aparecido previamente. Las cifras decimales obtenidas entre
estas dos apariciones se repetirán ya indefinidamente, es decir, si j y k son los menores enteros tales
que rj = rk (j < k), dj+1 . . . dk será el periodo.
Partamos ahora de un decimal periódico

em em−1 . . . e1 e0 .d1 d2 . . . dj p1 p2 . . . pk

(lo suponemos positivo por comodidad). Construyamos como ya hemos hecho anteriormente un
número real x cuyo desarrollo decimal coincida con el dado, y consideremos

d1 dj p1 pk
r = em 10m + · · · + e1 10 + e0 + + · · · + j ∈ Q, s= j+1
+ · · · + j+k ∈ Q.
10 10 10 10
Entonces
 
1 1 1 s
x = lı́m r + s + s k + s 2k + · · · + s nk =r+ ∈ Q,
n 10 10 10 1 − (1/10k )

como querı́amos probar. Pero además

s (10k − 1)r + 10k s 10k (r + s) − r 10j+k (r + s) − 10j r


x=r+ = = =
1 − (1/10k ) 10k − 1 10k − 1 (10k − 1)10j

que examinado atentamente contiene la regla de conversión de los decimales periódicos en fraccio-
nes: ‘se forma el numerador escribiendo primero la parte entera seguida de la parte no periódica
y luego la parte periódica, restando después la parte entera seguida de la parte no periódica, y el
denominador escribiendo tantos nueves como cifras tiene la parte periódica seguido de tantos ceros
como cifras tiene la parte no periódica’.(***)

Ejercicios

14.1. ¿Puede expresarse 2 como decimal periódico? ¿Por qué?
14.2. Expresar 1/7 y 2/19 como decimales periódicos.
14.3. Encontrar el número racional representado por los decimales periódicos 1.25 137 y 37.14 653.
14.4. ¿Puede existir un número racional que tenga como desarrollo decimal

0.101001000100001000001 . . .?

(A cada cifra 1 sigue un bloque de ceros, con un cero más en cada paso.)
(***)
Pues 10j+k (r + s) = em 10m+j+k + · · · + e0 10j+k + d1 10j+k−1 + · · · + dj 10k + p1 10k−1 + · · · + pk ,
10j r = em 10m+j + · · · + e0 10j + d1 10j−1 + · · · + dj , 10k − 1 = 9 · 10k−1 + · · · + 9 · 10 + 9.
4.4. REPRESENTACIÓN EN OTRAS BASES 129

Y para los que tengan tiempo libre:


14.5. ([Lieb], p. 22.) El crı́tico cinematográfico Ivor Pocoseso está viendo la pelı́cula ‘11.9 Hombres
sin Piedad’. Pero se aburre, y empieza a preguntarse exactamente qué números racionales tienen
expresiones decimales que acaban en 000 . . . (o sea, en ceros repetidos indefinidamente). Nota que
este es el caso si el denominador es 2, 4, 5, 8, 10, y se plantea si habrá una regla general sencilla
que diga qué racionales tienen esta propiedad.
Ayuda a Ivor demostrando que un número racional m/n (en forma irreducible) tiene expresión
decimal que acaba en ceros repetidos indefinidamente si y sólo si el denominador n es de la forma
2p 5q , donde p y q son enteros no negativos.

4.4. Representación en otras bases


Al igual que en la representación de los números enteros, es necesario contemplar la represen-
tación de los números reales en bases distintas de 10.

4.4.1. Representación binaria


Como cabe suponer, si en vez de usar potencias enteras de 10 se utilizan potencias enteras
de 2, se obtiene la representación binaria de los números reales de una manera totalmente
análoga. Para buscarla gráficamente, si bxc = N , el intervalo [N, N + 1) se dividirá ahora en dos
subintervalos [N, N + 12 ), [N + 12 , N + 1), aquél de ellos en el que esté x en otros dos de longitud
1
, etc., llegándose ası́ a una representación para los x ≥ 0 de la forma
22
am am−1 . . . a1 a0 .b1 b2 . . . bn . . .
en la que bxc = am 2m + · · · + a1 2 + a0 , ai ∈ {0, 1} (0 ≤ i ≤ m), am 6= 0 si bxc 6= 0, y bn ∈ {0, 1}
(n-ésima cifra binaria de x) viene dada por bn = b2n xc − 2b2n−1 xc, de modo que si
b1 bn
qn = bxc + + ··· + n, n ∈ N,
2 2
se verifica
1
q n ≤ x < qn + ,
2n
y
x = sup{qn : n ∈ N} = lı́m qn .
n
Igual que en el caso decimal, x es racional si y sólo si su representación binaria es periódica.
Pero los racionales cuya representación binaria tiene nulas todas las cifras a partir de un cierto
lugar no son exactamente los mismos que gozan de esta propiedad en su desarrollo decimal: por
ejemplo,
3
= 0.6 0(10 = 0.1001(2 .
5
Nota. Ya vimos cómo expresar los números enteros en base 2, mediante divisiones sucesivas por
2. Para hallar ahora el desarrollo binario de x − bxc a partir de su desarrolo decimal, basta ir
multiplicando por 2 retirando la parte entera del producto; en el ejemplo anterior,
NÚMERO DECIMAL 0.6000 . . .
2 ∗ resto 1.2 0.4 0.8 1.6 1.2 0.4 ...
resto 0.2 0.4 0.8 0.6 0.2 0.4 ...
CIFRAS BINARIAS 1 0 0 1 1 0 ...
3
y observamos cómo ya se va repitiendo obligadamente el bloque ‘1001’, de modo que = 0.1001.
5
(Para los más atrevidos: ¿cuál es la justificación de este procedimiento?)
130 CAPÍTULO 4. NÚMEROS REALES

También podrı́amos llegar al mismo resultado dividiendo 3


11.00000. . . |101
por 5 en base 2, lo que se hace como en base decimal, con la
0 0 1000 0.10011. . .
precaución de que ahora 1 + 1 = 10. Por ejemplo, 3 = 11(2
00100110
se dividirı́a por 5 = 101(2 como muestra la figura, teniendo
00100001 en cuenta que en base 2 es 101 + 1 = 110, 101 + 11 = 1000;
00100· · · · · · ponemos ceros en el cociente y ‘bajamos ceros del dividendo’
00100· · · · · · en la manera acostumbrada.
A la inversa, si partimos de la expresión binaria ±am am−1 . . . a1 a0 .b1 b2 . . . bn . . . de un número
x, tendremos que hallar (expresando los números en base 10)
 
m b1 bn
± lı́m am 2 + · · · + a1 2 + a0 + + ··· + n .
n 2 2
Cuando x sea racional, y por tanto su desarrollo sea periódico, podemos calcular este lı́mite como
hicimos en la demostración de que todo decimal periódico es el desarrollo de un número racional.
Por ejemplo, si
x = −1010.0010 101(2 ,
escribiendo todos los números ahora en base 10,
        
3 1 1 1 1 1 1 1 1 1 1
x = − lı́m 2 + 2 + 3 + + + + + + + + + ···
n 2 25 27 28 210 211 213 214 216
 
1 1
··· + +
23n+5 23n+7
        
1 1 1 1 1 1 1 1 1 1 1 1
= − lı́m 8 + 2 + + + + 3 + + 6 + + 9 + + ···
n 8 25 27 2 25 27 2 25 27 2 25 27
 
1 1 1
· · · + 3n +
2 25 27
   
1 1 1 1 1 1 1
= − lı́m 8 + 2 + + + 1 + 3 + 6 + 9 + · · · + 3n
n 8 25 27 2 2 2 2
 
1
 
  1 − 3n+1  
 81 1 1 2  81 5 1  81 5
= − + + lı́m = − + 7 3 =− + 4
  
8 25 27 n 1  8 2 2 −1 8 2 ·7
1− 3
2 2 3
81 · 14 + 5 1139
= − =− .
16 · 7 112

Ejercicios
15.1. Hallar la representación binaria de los números cuya expresión decimal es:
(i) 2.0078125 (ii) 0.8 6 (iii) 3.141592654 . . .
15.2. Hallar la representación decimal de los números cuya expresión binaria es:
(i) 11.01 (ii) 1.0 10 (iii) 0.100011101 . . .

4.4.2. Representaciones en bases distintas de 10 y 2


Por las mismas razones expuestas al hablar de las bases de numeración para representar números
enteros, se emplean a veces el sistema octal (base 8) y el sistema hexadecimal (base 16).
Nada especial hay que añadir sobre la representación de números reales en estos sistemas. Son
una vez más, como el decimal y el binario, sistemas posicionales: el valor de cada cifra depende
de su posición. Para buscar la expresión de un número real en estos sistemas, o para pasar las
representaciones de un número de una base a otra, basta adaptar las ideas que hemos empleado
anteriormente.
Bibliografı́a

[A-K] Aleksandrov. A. D.; Kolmogorov, A. N.; Laurentiev, M. A. & al.: La matemática:


su contenido, métodos y significado (vol. I). Alianza Editorial, Madrid, 1973.

[Ap] Apostol, T.M.: Análisis Matemático (segunda edición). Reverté, Barcelona, 1991.

[B-S] Bartle, R. G.- Sherbert, D. R.: Introducción al Análisis Matemático de una Variable.
Limusa, México, 1990.

[D’A-W] D’Angelo, J. P.; West, D. B.: Mathematical Thinking. Problem-Solving and Proofs.
Prentice-Hall, Upper Saddle River, NJ, 1997.

[Dur] Durán, A. J.: Historia, con personajes, de los conceptos del cálculo. Alianza, Madrid,
1996.

[Ebb] Ebbinghaus, H.-D. & al.: Numbers. Springer, New York, 1991.

[GJPR] Goberna, M. A.; Jornet, V.; Puente, R.; Rodrı́guez, M.: Álgebra y fundamentos.
Una introducción. Ariel, Barcelona, 2000.

[Ham] Hamilton, A. G.: Numbers, sets and axioms: the apparatus of mathematics. Cambridge
Univ. Press, 1982.

[Kl1] Kline, M.: El pensamiento matemático de la Antigüedad a nuestros dı́as, I. Alianza


Editorial, Madrid, 1992.

[Kl3] Kline, M.: El pensamiento matemático de la Antigüedad a nuestros dı́as, III. Alianza
Editorial, Madrid, 1992.

[Lieb] Liebeck, M.: A Concise Introduction to Pure Mathematics. Chapman & Hall/CRC, Boca
Raton, 2000.

[Pest] Pestana, D. & al.: Curso práctico de Cálculo y Precálculo. Ariel, Barcelona, 2000.

[Spv] Spivak, M.: Calculus. Cálculo Infinitesimal. (segunda edición) Reverté, Barcelona, 1990.

[S-T] Stewart, I.; Tall, D.: The Foundations of Mathematics. Oxford Univ. Press, 1977.

Documentos en Internet

[1] Curso de Análisis matemático I. Capı́tulo 1: Números reales. Univ. de Zaragoza.


http://www.unizar.es/analisis matematico/analisis1/apuntes/01-reales.pdf

131
132 BIBLIOGRAFÍA
Capı́tulo 5

Números complejos.

Nuestra presentación de los números complejos es básicamente la del texto [Ap], completado
con [ApC]. Véase también [GJPR], [Her], cap. 4, [D’A-W], cap. 18; [Lieb], cap. 6. Para ejercicios
(resueltos y propuestos) son útiles [Spg], [Wil], ası́ como [D’A-W] y [Lieb].

5.1. El cuerpo complejo.


Como señala [Her], p. 195, hh las sucesivas ampliaciones de los sistemas de números se han
realizado para acomodar resultados sorprendentes en los sistemas de números conocidos. Estos
resultados sorprendentes provienen, en la mayor parte de los casos, de la resolución de ecuaciones
algebraicas.
Por ejemplo, la ecuación x + 7 = 5, en la que solamente aparecen números naturales, no posee
ningún número natural como solución; su solución es el número negativo −2. Los números naturales,
junto con los números negativos, forman el sistema de los números enteros. Este sistema de números
es insuficiente para resolver todas las ecuaciones algebraicas; la ecuación 3x = 5 no posee como
solución ningún número entero; su solución es el número fraccionario 5/3. Los números enteros,
junto con los números fraccionarios, forman el conjunto de los números racionales. Estos números
resultan insuficientes para resolver ecuaciones cuadráticas; por ejemplo, la ecuación√x2 = 2 √no tiene
un número racional como solución; sus soluciones son los números irracionales 2 y − 2. Los
números racionales, junto con los irracionales, forman el sistema de los números reales.ii
Entre los números irracionales hay, incluso, muchos que no son raı́ces de polinomios con coefi-
cientes racionales. Pese a ello, R no es ‘suficientemente completo’ desde el punto de vista algebraico:
un polinomio tan sencillo como X 2 + 1 sigue sin tener raı́ces en R. En pleno Renacimiento, los alge-
bristas italianos del siglo XVI (Tartaglia, Cardano, Bombelli: v. [Ebb], cap. 3), en su búsqueda de
raı́ces reales de ecuaciones cúbicas (de polinomios de grado 3), comenzaron un cálculo formal con
expresiones ‘imaginarias’, ‘ficticias’, en las que aparecı́an raı́ces cuadradas de números negativos,
comprobando que, aunque ignoraban qué significado atribuir a dichas expresiones, los resultados
que obtenı́an a partir de ellas eran consistentes y satisfactorios, resolviendo ası́ problemas de raı́ces
de ecuaciones de segundo y tercer grado en R. La ‘inevitabilidad’ de estas expresiones llevarı́a, tras
periodos de discusión y desconfianza sobre su naturaleza, a la introducción y aceptación final de
los números complejos. (Ver [GJPR], pp. 155–156.)
Definición 5.1.1. El cuerpo de los números complejos es el conjunto

C = {(a, b) : a, b ∈ R}

dotado de las operaciones


• suma: (a, b) + (c, d) = (a + c, b + d)

• producto: (a, b) (c, d) = (ac − bd, bc + ad).

133
134 CAPÍTULO 5. NÚMEROS COMPLEJOS

Los elementos de C reciben el nombre de números complejos .

Como conjunto, pues, C es simplemente R2 = R × R, que conocemos como espacio vectorial


sobre R, con la misma suma que acabamos de definir. La novedad (absolutamente trascendente
como veremos) está en la introducción de un producto ‘interno’, que aplica C × C en C (en R2
tenemos el producto por escalares ‘externos’, que aplica R × R2 en R2 ).
Veamos que está justificado llamar a C el cuerpo de los números complejos.

Proposición 5.1.2. Con la suma y el producto que hemos definido, C es un cuerpo conmutativo.

Demostración. Una vez más, enunciamos las propiedades a comprobar, si bien dejamos las demos-
traciones como ejercicio. (Ver [ApC], pp. 438 y ss.)
1. Propiedad asociativa de la suma. ((a1 , b1 )+(a2 , b2 ))+(a3 , b3 ) = (a1 , b1 )+((a2 , b2 )+(a3 , b3 )).
2. Propiedad conmutativa de la suma. (a1 , b1 ) + (a2 , b2 ) = (a2 , b2 ) + (a1 , b1 ).
3. Existencia de elemento neutro (cero) para la suma. Hay un número complejo, el (0, 0),
tal que para todo (a, b) ∈ C, (0, 0) + (a, b) = (a, b) + (0, 0) = (a, b).
4. Existencia de elemento opuesto para la suma. Para cada (a, b) ∈ C hay un número
complejo (y uno sólo), el número complejo (−a, −b), tal que
(−a, −b) + (a, b) = (a, b) + (−a, −b) = (0, 0).
5. Propiedad asociativa del producto. ((a1 , b1 ) (a2 , b2 )) (a3 , b3 ) = (a1 , b1 ) ((a2 , b2 ) (a3 , b3 )).
6. Propiedad conmutativa del producto. (a1 , b1 ) (a2 , b2 ) = (a2 , b2 ) (a1 , b1 ).
7. Existencia de elemento neutro (identidad) para el producto. Hay un número complejo,
el (1, 0), tal que para todo (a, b) ∈ C es (1, 0) (a, b) = (a, b) (1, 0) = (a, b).
8. Existencia de elemento inverso para el producto.   (a, b) ∈ C \ {0} hay un
Para cada
a −b
elemento (y uno sólo) en C, el número complejo , , tal que
a2 + b2 a2 + b2
a −b a −b
( 2 , ) (a, b) = (a, b) ( 2 , ) = (1, 0).
a + b2 a2 + b2 a + b2 a2 + b2
(Tiene sentido porque a 6= 0 o b 6= 0.)
9. Propiedad distributiva del producto respecto de la suma. (a1 , b1 ) ((a2 , b2 ) + (a3 , b3 )) =
(a1 , b1 ) (a2 , b2 ) + (a1 , b1 ) (a3 , b3 ).

El cuerpo C contiene un subconjunto que es ‘una copia isomorfa’ al cuerpo R, que identificaremos
con R. Precisemos esta afirmación:

Proposición 5.1.3. La aplicación h : R → C dada por

h(a) = (a, 0), a ∈ R,

es inyectiva y para cualesquiera a, b ∈ R cumple

• h(a + b) = h(a) + h(b);

• h(a b) = h(a) h(b)

Demostración. Ejercicio.

Procedemos, pues, a la identificación de a ∈ R con h(a) ∈ C, lo que nos permite usar la notación
simplificada a = (a, 0). Observando que todo elemento (a, b) ∈ C se puede escribir en la forma

(a, b) = (a, 0) + (b, 0)(0, 1),

si definimos la unidad imaginaria i como

i = (0, 1),
5.1. EL CUERPO COMPLEJO. 135

con esta nueva notación tenemos


(a, b) = a + ib.
Esta manera de escribir un número complejo (forma binómica ) se corresponde con la repre-
sentación del vector (a, b) de R2 en la base canónica {(1, 0), (0, 1)}. Por tanto, si a + ib = a0 + ib0
con a y b reales, necesariamente a = a0 y b = b0 . Como es sabido, la primera componente a del
número complejo z = (a, b) = a + ib se denomina la parte real de z, en sı́mbolos a = <e z, y la
segunda componente b se denomina la parte imaginaria de z, en sı́mbolos b = =m z. Ası́, tanto
la parte real como la parte imaginaria son números reales.
Los números reales están, pues, caracterizados como los z ∈ C tales que =m z = 0. La condición
<e z = 0 caracteriza a los llamados números imaginarios (imaginarios puros, en algunos textos).
Una ventaja de expresar los números complejos en forma binómica es que se hace más facil la
multiplicación. En efecto, teniendo en cuenta que

i2 = (0, 1)(0, 1) = (−1, 0) = −1

comprobamos que la ‘extraña fórmula’

(a, b) (c, d) = (ac − bd, bc + ad)

se traduce en la más ‘natural’

(a + ib)(c + id) = ac − bd + i(bc + ad),

donde para hacer esta operación sólo hace falta usar las reglas habituales de la multiplicación y las
identificaciones anteriormente expuestas. De pasada, hemos comprobado que el número complejo i
es una raı́z de X 2 + 1 en C (‘la otra’ es −i).
Ninguna de las relaciones de orden que pueden definirse en C hacen de él un cuerpo totalmente
ordenado: no hay posibilidad niguna de que se mantengan las mismas propiedades que en Q y en
R ligan la ordenación con la suma y el producto.
(En efecto: en todo cuerpo totalmente ordenado es x2 + 1 > 0 para cualquier elemento x, mientras
que en C tenemos i2 + 1 = 0.)

Conjugación. Módulo de un complejo.


Un instrumento muy importante en el manejo de los números complejos es la conjugación.
Definición 5.1.4. Dado un número complejo z, su complejo conjugado , denotado por z, está da-
do por
z = <e z − i =m z.
Proposición 5.1.5. La aplicación de C en C que asocia a cada número complejo su conjugado,
llamada conjugación , tiene las siguientes propiedades.
(i) Es un isomorfismo de cuerpo, es decir, es biyectiva y para cualesquiera z, w ∈ C se verifica

• z+w =z+w
• zw = z w

(ii) Es una involución, o sea, aplicada dos veces vuelve al elemento de partida:
z = z para todo z ∈ C.

(iii) Deja fijos exactamente los números reales:


z = z si y solo si z ∈ R.
136 CAPÍTULO 5. NÚMEROS COMPLEJOS

Demostración. Son consecuencias directas de la definición (comprobarlo).


Mediante el conjugado se puede expresar algebraicamente la parte real y la parte imaginaria de
cada z ∈ C,
z+z z−z
<e z = , =m z = .
2 2i
También permite expresar algebraicamente su módulo, que pasamos a definir, lo que facilita muchas
de las operaciones que deberemos efectuar con los números complejos.
Definición 5.1.6. El módulo de un número complejo z es el número real no negativo
√ p
|z| = z z = (<e z)2 + (=m z)2 .
Por tanto, |z|2 = z z. Nótese ası́ mismo que |z| = |z|.
z <e z =m z
Ejercicio. Para z 6= 0, probar que su inverso es 2
= 2
−i .
|z| |z| |z|2
Las propiedades más importantes del módulo, que comparte con el valor absoluto en R, son las
siguientes:
Proposición 5.1.7. Dados z, w ∈ C,
(i) |z| ≥ 0 siempre, y |z| = 0 si y sólo si z = 0.
(ii) |zw| = |z||w|.
(iii) |z + w| ≤ |z| + |w| (desigualdad triangular).
Demostración.
(i) Por la propia definición, |z| ≥ 0 para todo z ∈ C y |0| = 0. Si ahora z = a + ib (a, b ∈ R) es
tal que |z| = 0, es a2 + b2 = |z|2 = 0, y puesto que 0 ≤ a2 ≤ a2 + b2 = 0, a2 = 0 y a = 0
(simétricamente, b = 0).
(ii) |zw|2 = (zw)(zw) = (zw)(z w) = z z w w = |z|2 |w|2 = (|z||w|)2 , y como |zw| y |z||w| son
números reales no negativos, forzosamente |zw| = |z||w|.
(iii) |z + w|2 = (z + w)(z + w) = (z + w)(z + w) = z z + z w + w z + w w = |z|2 + z w + z w + |w|2 =
|z|2 + 2<e (z w) + |w|2 ,
mientras que
(|z| + |w|)2 = |z|2 + 2|z||w| + |w|2 = |z|2 + 2|z w| + |w|2 ,
y como (ver lema siguiente) <e (z w) ≤ |<e (z w)| ≤ |z w|,
se obtiene la desigualdad buscada.

En la demostración de la desigualdad triangular hemos necesitado:


Lema 5.1.8. Para cada z ∈ C,
<e z ≤ |<e z| ≤ |z|, =m z ≤ |=m z| ≤ |z|.
Demostración. Pongamos a = <e z, b = =m z. De
a2 ≤ a2 + b2 = |z|2 , b2 ≤ a2 + b2 = |z|2 ,
se sigue |a| ≤ |z|, |b| ≤ |z|, y finalmente
a ≤ |a| ≤ |z|, b ≤ |b| ≤ |z|.

Como en R, se prueba:
5.1. EL CUERPO COMPLEJO. 137

Corolario 5.1.9 (desigualdad triangular inversa). Dados z, w ∈ C,

|z − w| ≥ ||z| − |w||.

Demostración. Ejercicio.

Ejercicios
16.1. Expresar los siguientes números complejos en la forma a + ib, con a, b ∈ R:
5
i4 + i9 + i16

3 2 + 3i 1+i
a) (1 + i) ; b) ; c) ; d) √ .
3 − 4i 2 − i5 + i10 − i15 2

16.2. Calcular
4n 
1−i m
X 
.
1+i
m=1

Indicación. Calcular primero (1−i)/(1+i) y recordar que (1−w)(1+w+w2 +· · ·+wN ) = 1−wN +1 .


3 − 2ai
16.3. Dado z = , con a ∈ R, determinar el valor de a para que z ∈ R y calcular entonces el
4 − 3i
valor de z.

16.4. Calcular dos complejos cuya suma sea 1 + 4i, cuyo cociente sea imaginario y de manera que
la parte real de uno de ellos sea −1.

16.5. Hallar x, y ∈ R tales que z = x+iy sea una raı́z cuadrada de 2−5i, es decir, (x+iy)2 = 2−5i.
En general, dados a, b ∈ R, si z = x + iy es una raı́z cuadrada de a + bi, es decir, (x + iy)2 = a + bi,
expresar x e y en función de a, b.
1+z
16.6. Sea z ∈ C con z 6= 1. Probar que es imaginario si y sólo si |z| = 1.
1−z
z−a
16.7. Sean w, z ∈ C tales que w = con 0 < a < 1. Probar que |w| < 1 si y sólo si |z| < 1.
az − 1

a−b
16.8. Probar que si |a| = 1 o |b| = 1, entonces
= 1. ¿Qué excepción debe hacerse si
1 − ab
|a| = |b| = 1?
1+z
16.9. Sea w = con w = u + iv y z = x + iy (x, y, u, v ∈ R). Probar que
1−z

u2 + v 2 − 1 2v
x= 2 2
; y= .
(u + 1) + v (u + 1)2 + v 2

16.10. Sea z = a + ib (a, b ∈ R). Demostrar que existen p, m y n independientes de z (z 6= 0, −1)


tales que
(a2 + b2 )(a2 + b2 + 2a + 1)
= p + mz + nz 2 .
a2 − b2 + a − (1 + 2a)bi
Hallar p, m y n.
6 CAPÍTULO 1. NÚMEROS COMPLEJOS
138 CAPÍTULO 5. NÚMEROS COMPLEJOS

1.2 El plano complejo


5.2. El plano complejo
Para abordar este apartado utilizaremos frecuentemente un lenguaje geométrico meramente intui-
Ensin
tivo, este apartadoestrictamente
atenernos utilizaremos al frecuentemente un lenguaje
estilo más deductivo geométrico meramente
del planteamiento intuitivo,
del resto del sin
curso. Ası́,
atenernos
por ejemplo,estrictamente
hablaremosal deestilo más deductivo
ángulos, o daremosdel porplanteamiento
bueno que lasdel resto delseno
funciones curso. Ası́, por
y coseno del
ejemplo, hablaremos de ángulos, o daremos por bueno que las funciones seno y coseno
Análisis matemático se corresponden con las funciones definidas gráficamente en Trigonometrı́a, del Análisis
matemático
aunque para seello
corresponden
no tengamosconninguna
las funciones definidas
justificación gráficamente
rigurosa. en Trigonometrı́a,
Si hemos aunque
de ser totalmente para
honestos,
ello no tengamos
ni siquiera tenemosninguna
hasta justificación rigurosa. rigurosa
ahora una definición Si hemosdede lasser totalmente
funciones senohonestos,
y coseno:ninos
siquiera
hemos
tenemos hasta ahora una definición rigurosa de las funciones seno y coseno: nos hemos
conformado con admitir su existencia y propiedades. Es tarea de cursos superiores la construcción conformado
con
y eladmitir
estudiosudeexistencia y propiedades.
estas y otras Es tarea debásicas,
funciones elementales cursos superiores
por lo quelaseguiremos
construcción y el estudio
usándolas como
de estasahora.
hasta y otras funciones elementales básicas, por lo que seguiremos usándolas como hasta ahora.

LaLaidea
ideade
departida
partidaenenesta
estasección
secciónesesque
quetodo
todonúmero
númerocomplejo
complejozz== a+ib
(*)
(a,b b∈∈R)
a+ib(a, R)lolopodemos
podemos
representar en el plano como el punto de coordenadas (a, b), su afijo
representar en el plano como el punto de coordenadas (a, b), su afijo . . 1

Esto
Estosupone
suponeque quetenemos
tenemos fijado
fijado en
en elel plano
plano un
un sistema
sistema cartesiano
cartesiano de
de ejes
ejes coordenados.
coordenados. Los Los
puntos
puntos del eje de abscisas serán los complejos (x, 0), o sea, los números reales, por loque
del eje de abscisas serán los complejos (x, 0), o sea, los números reales, por lo quellamaremos
llamaremos
aaeste ejeeleleje
esteeje ejereal
real. .Análogamente,
Análogamente,elelejeejededeordenadas
ordenadasestará
estaráformado
formadopor
porlos
lospuntos
puntos(0,(0,y),
y),los
los
números y denominaremos a este eje el eje imaginario
números imaginarios puros iy, y denominaremos a este eje el eje imaginario . Nos referiremosaa
imaginarios puros iy, . Nos referiremos
este
estesistema
sistemacon conelelnombre
nombrede dediagrama
diagramade deArgand.
Argand.
EnEneste
estecontexto,
contexto,laladistancia
distanciaeuclı́dea
euclı́deaen
enelelplano,
plano,por
porejemplo,
ejemplo,permitirá
permitirádefinir
definirlaladistancia
distancia
entre dos complejos z y w, que vendrá dada
entre dos complejos z y w, que vendrá dada porpor

d(z, w)==|z|z−−w|,
d(z,w) w|,
p
2 2+ (y − v)2 .2
ya
yaque
quesisizz==x+iy,
x+iy,ww==u+iv, (x,y,y,u,u,v v∈∈R),
u+iv,(x, R),ambas
ambascantidades
cantidadesson igualesa a (x(x−−u)u)
soniguales + (y − v) .
En particular, para cada z ∈ C, su módulo mide la distancia de z a 0.
En particular, para cada z ∈ C, su módulo mide la distancia de z a 0.
Análogamente,
Análogamente,puesto
puestoquequetodo
todopunto
puntodel planozz6==00queda
delplano quedaunı́vocamente
unı́vocamentedeterminado
determinadopor por
sus coordenadas polares, es decir, su distancia al origen (i.e., su módulo) y por el ángulo
sus coordenadas polares, es decir, su distancia al origen (i.e., su módulo) y por el ángulo polar (el polar (el
que
queforma
formaelelsegmento
segmentode deextremos
extremos00yyzzcon
coneleleje
ejereal),
real),podremos
podremosutilizar
utilizarpara
paratales
taleszzlalallamada
llamada
representación
representación polar o módulo-argumental. La medida del ángulo polar (en radianes)eseslolo
polar o módulo-argumental. La medida del ángulo polar (en radianes)
que
quellamaremos
llamaremosargumento
argumentode dez.z.
Pongamosen
Pongamos enorden
ordenestos
estosconceptos.
conceptos.
Observando la figura, tenemos
Observando la figura, tenemos las lasigualdades
igualdades
<eezz==|z||z|cos
cosφ,φ, mzz==|z|
=m |z|sen
senφ,φ,
z=(a,b ) de donde
de donde
|z|
|z|(cosφφ++i isen
zz==|z|(cos senφ).
φ).
b= Im z Comosiempre
Como siempresucede
sucedecon conlalamedida
medidade deángulos,
ángulos,hay
hayaquı́
aquı́una
una
φ ambigüedad, puesto que φ y φ + 2kπ con k ∈ Z hacen el mismo
ambigüedad, puesto que φ y φ + 2kπ con k ∈ Z hacen el mismo
O a = Re z papelde
papel decara
caraaalaslasigualdades
igualdadesanteriores.
anteriores.Esto Estonos
noshace
haceabordar
abordar
las siguientes precisiones sobre la definición de
las siguientes precisiones sobre la definición de argumento.argumento.
Definición5.2.1
Definición 1.2.1(Argumentos). Dadoz z∈∈CC\ \{0},
(Argumentos).Dado {0},un
unargumento
argumentodedez zesescualquier
cualquierφφtal
talque
que

z = |z| cos φ, z = |z| sen φ.


<e z = |z| cos φ, =m z = |z| sen φ.
El conjunto de los argumentos de z lo denotaremos por arg z, es decir,
El conjunto de los argumentos de z lo denotaremos por arg z, es decir,
arg z = {φ ∈ R : cos φ = e z/|z|, sen φ = m z/|z|}.
arg z = {φ ∈ R : cos φ = <e z/|z|, sen φ = =m z/|z|}.
1
Esta observación fue hecha repetidamente por matemáticos que no lograron eco suficiente en la comunidad
(*)
Esta observación
matemática fueArgand,
(entre ellos hecha repetidamente
a cuyo nombrepor matemáticos
ha quedado que nohasta
asociada), lograron ecoadoptada
que fue suficientepor
enGauss
la comunidad
en 1831 y
matemática (entre
más tarde por ellos Argand,
Cauchy, zanjando aası́
cuyo nombre ha
la polémica quedado
sobre asociada),
la legitimidad dehasta que fue complejos
los números adoptada por
(verGauss en 1831
[DD-P], y
pp. 254
más tarde
y ss.) por Cauchy, zanjando ası́ la polémica sobre la legitimidad de los números complejos (ver [DD-P], pp. 254
y ss.)
5.2. EL PLANO COMPLEJO 139

Entonces, arg z es un conjunto! Pero ‘es obvio’ que si para dos valores φ0 , φ ∈ R, se cumple

cos φ = cos φ0 , sen φ = sen φ0 ,

debe existir un k ∈ Z de manera que


φ = φ0 + 2kπ;
en otras palabras, el conjunto arg z puede describirse, conocido uno cualquiera de sus elementos,
de la siguiente manera:

{φ0 + 2kπ : φ0 ∈ arg z, k ∈ Z} = φ0 + 2πZ.

De esta forma, en cualquier intervalo semiabierto de longitud 2π, por ejemplo (−π, π], existe un
único elemento perteneciente al conjunto arg z. A este elemento se le denota por

Arg z,

y se le llama argumento principal (precaución: en algunos textos se llama argumento principal


al que está en el intervalo [0, 2π)). Por tanto, para nosotros:

Definición 5.2.2 (Argumento principal). Dado z ∈ C \ {0},

Arg z = φ si y sólo si φ ∈ (−π, π] y cos φ = <e z/|z|, sen φ = =m z/|z|.

Definición 5.2.3. La representación polar o módulo-argumental de un número complejo no


nulo viene dada por su módulo y uno cualquiera de sus argumentos.

Para presentarla de una manera más compacta, introducimos la siguiente notación.

Definición 5.2.4. Dado φ ∈ R, pondremos

eiφ = cos φ + i sen φ.

Por tanto, dado z ∈ C \ {0}, si φ ∈ arg z será

z = |z| eiφ

(representación exponencial de un número complejo).

Nótese que para z = 0 se tiene z = |z| eiφ cualquiera que sea φ ∈ R.


Ejercicio. Para cada φ ∈ R, |eiφ | = 1. Recı́procamente, para todo z ∈ C con |z| = 1 existe φ ∈ R
tal que z = eiφ .
Ejercicio. Si φ ∈ R, entonces eiφ = 1 si y sólo si existe k ∈ Z tal que φ = 2kπ.
Ejercicio. Comprobar la fórmula de Euler

eiπ + 1 = 0.

(Se ha dicho que esta es una de las más bellas fórmulas de las Matemáticas, porque liga los números
fundamentales del Álgebra, la Geometrı́a y el Análisis).

Proposición 5.2.5 (Representación exponencial del producto de dos números comple-


jos). Dados z1 , z2 ∈ C, si z1 = |z1 | eiφ1 , z2 = |z2 | eiφ2 , con φ1 , φ2 ∈ R, se tiene

z1 z2 = |z1 z2 | ei(φ1 +φ2 ) = |z1 | |z2 | ei(φ1 +φ2 ) .


140 CAPÍTULO 5. NÚMEROS COMPLEJOS
8 CAPÍTULO 1. NÚMEROS COMPLEJOS

Demostración. Ya probamos que |z1 z2 | = |z1 | |z2 |.


Demostración. Ya probamos que |z1 z2 | = |z1 | |z2 |.
Operando
Operando
eiφ1iφe1iφ2iφ2 = (cos φ1 + i sen φ1 ) (cos φ2 + i sen φ2 )
e e = (cos φ1 + i sen φ1 ) (cos φ2 + i sen φ2 )
= cos φ1 cos φ2 − sen φ1 sen φ2 + i(cos φ1 sen φ2 + sen φ1 cos φ2 )
= cos φ1 cos φ2 − sen φ1 sen φ2 + i(cos φ1 sen φ2 + sen φ1 cos φ2 )
= cos(φ1 + φ2 ) + i sen(φ1 + φ2 ) = ei(φi(φ1 +φ2 )
,
1 +φ2 )
= cos(φ1 + φ2 ) + i sen(φ1 + φ2 ) = e ,
y queda finalmente
y queda finalmente z1 z2 = |z1 | |z2 | ei(φ1 +φ2 ) = |z1 z2 | ei(φ1 +φ2 ) .
z1 z2 = |z1 | |z2 | ei(φ1 +φ2 ) = |z1 z2 | ei(φ1 +φ2 ) .
Por tanto, mientras que la suma y la resta de números complejos no son otra cosa que la suma
Por tanto,
y la resta mientras
de vectores en elque la suma
plano, que no y lanecesita
resta degráficamente
números complejos
más queno la son otra cosa
traslación que la suma
de segmentos
y lafigura
(ver resta 1),
de vectores en el plano,
la construcción que del
gráfica no necesita
productográficamente
de dos números más que la traslación
complejos es undepoco
segmentos
más
(ver figura(ver
complicada 1), la construcción
figura 2): gráfica del producto de dos vectores es un poco más complicada (ver
figura 2):

z .w

z +w
uz
w
w-z
w
z u1 z
0 0 1
z-w

Figura 1 Figura 2
Figura 1 Figura 2

|w||w|
dados iφ ∈ C, para construir z · w hemos de girar z un ángulo φ (con centro de giro en
dados z, z,
ww== eiφe ∈ C, para construir z · w hemos de girar z un ángulo φ (con centro de giro en el
el origen)
origen) y efectuar
y efectuar una homotecia
una homotecia que multiplique
que multiplique el módulo
el módulo de z de
porz elpor
deelw.deComo
w. Como
se muestrase muestra
en
en la figura, para llevar esto a cabo basta girar el triángulo de vértices 0, 1, z hasta
la figura, para llevar esto a cabo basta girar el triángulo de vértices 0, 1, z hasta que el segmento que el segmento
dede extremos
extremos 0 y0 1y tenga
1 tenga la la dirección
dirección deldel segmento
segmento dede extremos
extremos 0 y0 w,
y w, obteniéndose
obteniéndose ası́ası́
el el triángulo
triángulo
de vértices 0, u , u ; z · w es el punto de corte de la recta que pasa por
de vértices 0, u1 , 1uz ; zz · w es el punto de corte de la recta que pasa por 0 y uz con 0 y u z con la paralela
la paralela por por
ww a la
a la recta
recta queque pasa
pasa porporu1uy1 uy u(¿por
z
z (¿por qué?)
qué?)
Corolario
Corolario 1.2.6
5.2.6 (Representación
(Representación exponencial
exponencial deldel cocientedededos
cociente dosnúmeros
númeroscomplejos).
complejos).
Dados z , z ∈ C, si
Dados z1 , 1z2 ∈2 C, si z1 =z = |z
1 |z1 | e
1 |
iφe1
iφ1 , z = |z |iφeiφ2 = 0, se tiene
, z2 =2 |z2 | e
2 2 6= 0, se tiene

z1 z1 =|z1|z| 1 |i(φi(φ1 −φ2 )


z= |z e| e 1 −φ2 ) . .
z2 2 |z2 | 2

Demostración.Basta
Demostración. Basta tener
tener enen cuenta
cuenta que,
que, según
según lo lo que
que acabamos
acabamos dede probar,
probar,

|z1|z| 1 |i(φi(φ1 −φ
|z1|z| 1 | i(φi(φ 1 −φ
e e 1 −φ 2) 2)
z2 z=
2 = |z2|z| e| e 1 −φ 2 +φ 2) 2)
2 +φ == |z1|z| e1 |iφe1iφ=
1 z .
=1 z1 .
|z2|z| 2 | |z2|z| 2 | 2

Nota.
Nota.LaLa
expresión eiφe,iφφ, ∈
expresión φ∈ comparte
R,R, propiedades
comparte algebraicas
propiedades dede
algebraicas la la
exponencial real:
exponencial real:

eiφeeiφiψeiψ
==ei(φ+ψ) ∈∈
, ,φ, φ,ψ ψ
ei(φ+ψ) R,R,

(eiφ )iφ−1−1
= ei(−φ) , φ ∈ R.
(e ) = ei(−φ) , φ ∈ R.
5.3. POLINOMIOS EN C Y EN R. 141

Ejercicios
17.1. Hallar los módulos y los argumentos √ √de los números complejos: −2x (x ∈ R \ {0}), iy
(y ∈ R \ {0}), 1 + i, −1 − i, (1 + i)(1 + i 3)( 3 − i), 2 + 5i, 2 − 5i, −2 + 5i, −2 − 5i (estos últimos,
en función del arc tg(5/2)). ¿Cuál es el argumento principal?
17.2. Si φ, ψ ∈ R, entonces eiφ = eiψ si y sólo si existe k ∈ Z tal que φ − ψ = 2kπ.
17.3. Hallar el módulo y el argumento principal de 1 + cos φ + i sen φ, donde −π ≤ φ ≤ π.
1 + cos x + i sen x
17.4. Hallar la parte real y la imaginaria, el módulo y un argumento de .
1 + cos y + i sen y
1
17.5. Sean α ∈ R y a ∈ C tales que 2 cos α = a + . Obtener 2 cos nα en función de a.
  a

 iα 1
Indicación. ¿Qué vale e − a e − ?
a
17.6. Si x + iy = (2 + cos α + i sen α)−1 con α, x, y ∈ R, hallar x e y en función de α y probar que
el punto (x, y) está siempre en la circunferencia de diámetro el segmento que une los puntos ( 31 , 0)
y (1, 0).
17.7. Sean z1 , z2 , z3 ∈ C distintos dos a dos. Explicar el significado geométrico de las relaciones:
z 3 − z1 z 3 − z1
(i) =m =0; (ii) <e =0.
z 2 − z1 z 2 − z1
z2
17.8. Sean z1 , z2 ∈ C con z1 6= 0. Probar que es imaginario si y sólo si |z1 + z2 | = |z1 − z2 |.
z1
Deducir que un paralelogramo tiene sus diagonales iguales si y sólo si es un rectángulo.
17.9. Demostrar que |z1 − z2 |2 + |z1 + z2 |2 = 2|z1 |2 + 2|z2 |2 . Deducir que “un cuadrilátero es un
paralelogramo si y sólo si la suma de los cuadrados de las longitudes de sus diagonales es igual a la
suma de los cuadrados de las longitudes de todos sus lados” (ley del paralelogramo).
17.10. Demostrar que el triángulo cuyos vértices son los puntos z1 , z2 , z3 sobre el diagrama de
Argand es equilátero si y sólo si

z12 + z22 + z32 = z1 z2 + z2 z3 + z3 z1 .

17.11. ¿Cuál es el lugar geométrico de los puntos del plano complejo tales que |z + 16| = 4|z + 1|?

5.3. Polinomios en C y en R.
Reflexionando sobre lo que hemos hecho hasta ahora, parece que nuestros logros son más bien
modestos. Hemos añadido a R básicamente un número, i, que nos genera ‘linealmente’ C, y que es
una raı́z del polinomio concreto X 2 + 1. ¿Qué sucederá con los demás polinomios? Lo que pasa lo
expone estupendamente el premio Nobel de Fı́sica, Richard Feynman, en un capı́tulo llamado
Algebra (de lectura absolutamente recomendada en su totalidad) de su libro [Fey], p. 22-10:

hh Ahora ustedes dirán: “¡Esto puede seguir indefinidamente! Hemos definido las potencias de
los imaginarios y todo lo demás y cuando estamos listos, viene alguien con otra ecuación
que no puede ser resuelta como x6 + 3x2 = −2. ¡Entonces tenemos que generalizar todo de
nuevo!” Pero resulta que con esta invención adicional que es simplemente la raı́z cuadrada
de −1, ¡toda ecuación algebraica puede ser resuelta! Este es un hecho fantástico que debemos
dejar que lo demuestre el Departamento de Matemáticas. Las demostraciones son hermosas
y muy interesantes, pero ciertamente no son evidentes por sı́ mismas. De hecho, la suposición
más evidente es que vamos a tener que inventar de nuevo, de nuevo y de nuevo. Pero el
142 CAPÍTULO 5. NÚMEROS COMPLEJOS

milagro más grande es que no tenemos que hacerlo. Esta es la última invención. Después
de esta invención de los números complejos, encontramos que las reglas siguen funcionando
con los números complejos y hemos terminado de inventar cosas nuevas. Podemos encontrar
la potencia compleja de cualquier número complejo, podemos resolver cualquier ecuación
escrita algebraicamente en términos de un número finito de esos sı́mbolos. No encontramos
más números nuevos. ii

5.3.1. Potencias y raı́ces de un número complejo


Comenzaremos construyendo las raı́ces de unos polinomios muy particulares, los de la forma
X n − z para un z cualquiera de C. Nuestro desarrollo de esta parte es, esencialmente, el de [Ap],
pp. 26–28.

Definición 5.3.1. Dados z ∈ C y n ∈ Z, se define


(
z 0 = 1, z n+1 = z n z si n ≥ 0,
z n = z −1 −n

si n < 0 y z 6= 0.

Corolario 5.3.2 (Fórmula de De Moivre.). Dado φ ∈ R, para todo n ∈ N es

(cos φ + i sen φ)n = cos(nφ) + i sen(nφ).

Demostración. Escrita en forma exponencial,

(eiφ )n = einφ ,

se obtiene cómodamente por inducción. Para n = 1 es trivialmente cierta, y si es cierta para un n,


entonces
(eiφ )n+1 = (eiφ )n eiφ = einφ eiφ = einφ+iφ = ei(n+1)φ .

Ejercicio. ¿Qué ocurre con la fórmula de De Moivre para n ∈ Z?

Proposición 5.3.3. Dados dos enteros m y n, tenemos, siempre que estén definidas las potencias,

z m z n = z m+n , (z m )n = z mn , (z1 z2 )n = z1n z2n .

Demostración. Para m, n ≥ 0, es un ejercicio de inducción (hacerlo). Para m o n < 0, aplicar la


definición y los resultados para exponentes no negativos (cf. [Ap], Teorema 1.50).

Teorema 5.3.4. Si z 6= 0 y n ∈ N, existen exactamente n números complejos distintos z0 , z1 , . . . ,


zn−1 (llamados raı́ces n-ésimas de z), tales que

zkn = z

para cada k = 0, 1, . . . , n − 1.
Además, si α es un argumento de z, estas raı́ces están dadas por las fórmulas

zk = r eiϕk , k = 0, 1, . . . , n − 1,

donde
α 2kπ
r = |z|1/n , ϕk = + (k = 0, 1, . . . , n − 1).
n n
1.3.POLINOMIOS
5.3. POLINOMIOS EN
EN CC
YY EN
EN R.R. 14311

Demostración.(Cf.
Demostración. (Cf.[Ap[Ap ], págs
], págs 27–28)
27–28)
Los n números complejos r eiϕ k , k = 0, 1, . . . , n − 1, son distintos entre sı́: pues si tomamos
Los n números complejos r eiϕ k, k = 0, 1, . . . , n − 1, son distintos entre sı́: pues si tomamos
iϕk = r eiϕj se sigue ei(ϕk −ϕj ) = 1 [porque r = 0
enteros k, j, con 0 ≤ k ≤
enteros k, j, con 0 ≤ k ≤ n − 1, 0 −iϕ n − 1, 0 ≤ j ≤ n −
≤ j ≤ n − 1, de r e 1, de r e
iϕ k = r eiϕj se sigue ei(ϕk −ϕj ) = 1 [porque r 6= 0
y basta multiplicar por (1/r) e j ] y de aquı́ ϕ − ϕ = 2mπ para algún m ∈ Z; pero entonces
−iϕ
y basta multiplicar por (1/r) e j ] y de aquı́ ϕk − k ϕ j= 2mπ para algún m ∈ Z; pero entonces
j
α 2kπ α 2jπ k −
α +2kπ −α −2jπ = 2mπ, es decir,k − j = m es un entero, y dado que j
+ − − = 2mπ, es decir, = m es un entero, y dado que
nn nn nn nn nn
−(n−(n −− 1)1) =0 − 0− −−
(n(n 1)1) ≤k − k− j j ≤(n(n −− −−
1)1) 0 0 =n n −− 1 1 < 1,
−1−1<< n = n ≤ n ≤ n = n < 1,
n n n n n
k−j
esosólo
eso sólopuede cumplirsesi sik − j ==
puedecumplirse 0, es decir, si k = j.
n n 0, es decir, si k = j.
Además,cada
Además, cadauno
unodedetales talesnúmeros
númerosesesuna unaraı́z
raı́zn-ésima
n-ésimadedez:z:
(r eiϕk )n = rn einϕk = |z| ei(α+2kπ) = |z| eiα = z.
(r eiϕk )n = rn einϕk = |z| ei(α+2kπ) = |z| eiα = z.
Por último, no hay otras raı́ces n-ésimas de z distintas de las anteriores, pues un polinomio de
Por último, no hay otras raı́ces n-ésimas de z distintas de las anteriores, pues un polinomio de
grado n puede tener a lo más n raı́ces distintas, y las raı́ces n-ésimas de z son justamente las raı́ces
grado n puede tener a lo más n −nz. raı́ces distintas, y las raı́ces n-ésimas de z son justamente las raı́ces
del polinomio P (X) = X n
del polinomio P (X) = X − z.
Obsérvese que todas las raı́ces n-ésimas de un complejo z tienen el mismo módulo, |z|1/n , y que
Obsérvese que todas las raı́ces n-ésimas de un complejo z tienen el mismo módulo, |z|1/n , y que
sus argumentos difieren en múltiplos de 2π/n radianes, de modo
sus argumentos difieren en múltiplos de 2π/n radianes, de modo
que sus afijos están sobre una circunferencia de centro el origen
eπi/5 que sus afijos1/n
y radio |z|
están sobre una circunferencia de centro el origen
, ocupando los vértices de un polı́gono regular de
y radio |z| 1/n , ocupando los vértices de un polı́gono regular de
e 2 π i/5 n lados.
n lados.
Ejemplo. Para cada n ∈ N existen n raı́ces n-ésimas de la
π/5 Ejemplo. Para cada n ∈ N2πi/n existen n raı́ces n-ésimas de la
unidad , los números 1, 2πi/n e e2(n−1)πi/n , situados sobre
, . . . ,2(n−1)πi/n
0 unidad , los números 1, e , ..., e , situados sobre
1 los vértices de un polı́gono regular de n lados inscrito en la
los vértices de un polı́gono regular de n lados inscrito en la
circunferencia unidad, de centro el origen y radio 1. Además,
circunferencia unidad, de centro el origen y radio 1. Además,
el polı́gono es simétrico respecto del eje real. Estas raı́ces son
e -2πi/5 el polı́gono es simétrico respecto del eje real. Estas raı́ces son
e -πi/5 las potencias sucesivas de e2πi/n , y pueden obtenerse numerosas
las potencias sucesivas de e2πi/n , y pueden obtenerse numerosas
relaciones algebraicas entre ellas.
relaciones algebraicas entre ellas.
√√
Problemasdedenotación
Problemas notaciónpara paralas lasraı́ces.
raı́ces. SiSi queremos
queremos mantener
mantener laslasnotaciones z 1/nó ón zn zque
notacionesz 1/n que
empleábamospara
empleábamos paralaslasraı́ces
raı́cesn-ésimas
n-ésimasnononegativas
negativasdedeloslosnúmeros
númerosreales
realesnononegativos,
negativos,¿cómo
¿cómopro- pro-
ceder ahora, que para cada z ∈ C \ {0} tenemos n raı́ces diferentes
ceder ahora, que para cada z ∈ C \ {0} tenemos n raı́ces diferentes sin ningún criterio sin ningún criterio incontestable
incontestable
√√
paradistinguir
para distinguirentre
entreellas?
ellas?EnEn particular:
particular: ¿qué
¿qué significa
significa z z 1/2
1/2 ? ? ¿qué
¿qué significa z? z?
significa
√√
Podrı́amosreservar
Podrı́amos reservarel elsı́mbolo z 1/nó ón zn zpara
sı́mboloz 1/n raı́zn-ésima
paralalaraı́z n-ésimaprincipal
principaldedez,z,definida
definidacomo como

|z||z|
1/ni(Arg
i(Arg z)/n
1/n
e e z)/n , ,
dondeArg
donde Arg
z zindica
indicael elargumento
argumentoprincipal
principaldedez z(el(elque
quequeda
quedaentre
entre−π−πy yπ),π),o outilizar
utilizaruno
unodedeellos
ellos
(o los dos) para el conjunto de todas las raı́ces n-ésimas
(o los dos) para el conjunto de todas las raı́ces n-ésimas de z. de z.
Los
Los convenios
convenios utilizados
utilizados varı́an
varı́an dede unos
unos textos
textos a otros,
a otros, por
por lolo cual,
cual, para
para nonocaercaer
enen ambigüedades,
ambigüedades,
merece la pena explicitar siempre el significado exacto atribuido
merece la pena explicitar siempre el significado exacto atribuido a los sı́mbolos que a los sı́mbolos queseseestén
estén
manejando, sin necesidad de decantarse por ninguno. Por ejemplo,
manejando, sin necesidad de decantarse por ninguno. Por ejemplo, pondrı́amos: pondrı́amos:

• •para c∈
paraa,a,b, b,c ∈ R,R,a a
6==
0,0,
2 2 + bz + c = 0
azaz+ bz + c = 0
si siy ysólo
sólosi si
√√b2 − 4ac
−b
−b ± ± b2 − 4ac ,
z=z= ,
2a2a
esesdecir,
decir,
√√b2 − 4ac √√b2 − 4ac
−b
−b + + b 2 − 4ac −b
−b − − b2 − 4ac ,
z=z= o oz =z= ,
√ 2a2a 2a2a
donde√b2b−
donde
2 − 4ac indica una cualquiera de las raı́ces cuadradas del complejo2b2 − 4ac.
4ac indica una cualquiera de las raı́ces cuadradas del complejo b − 4ac.
144 CAPÍTULO 5. NÚMEROS COMPLEJOS

Ejemplo. Cuando z sea un número real no negativo, z ∈ [0, +∞), como z = 0 o Arg z = 0, se
obtiene como raı́z cuadrada principal de z justamente su raı́z cuadrada real no negativa

Ejercicios
18.1. Dado x ∈ R, hallar la parte real y la imaginaria de:
a) (1 n
 + cos x + i sen x) ; n
1 + cos x + i sen x
b) .
1 + cos y + i sen y
1 + sen a + i cos a n
 
18.2. Calcular , n ∈ N y a ∈ R.
1 + sen a − i cos a
√ √
18.3. Calcular todos los valores de 4 −1, 6 1 + i.
18.4. Hallar los números complejos que son iguales a la potencia n-ésima de sus conjugados.
18.5. Probar que la suma de las potencias n-ésimas de las raı́ces k-ésimas de la unidad es k o 0,
según n sea o no múltiplo de k.
2π 4π 6π 8π
18.6. Probar que 1 + cos + cos + cos + cos = 0 y dar una interpretación geométrica.
5 5 5 5
Probar que √ √
π 5+1 2π 5−1
cos = , cos = .
5 4 5 4
18.7. Probar que
π 2π 3π 4π
1 − cos + cos − cos + cos = 0
5 5 5 5
π 2π 3π 4π
− sen + sen − sen + sen = 0
5 5 5 5

18.8. Probar que si n ∈ N se tiene


 π n  π n √ √ n nπ
1 + i tan + 1 − i tan =2 6 − 2 cos
12 12 12

18.9. Hallar la suma 1 + 2 cos θ + 2 cos 2θ + · · · + 2 cos nθ.


sen 6θ sen 5θ
18.10. Expresar en potencias de cos θ (θ ∈ R): cos 6θ, cos 3θ, , .
sen θ sen θ
Expresar en en potencias de sen θ(θ ∈ R): sen 3θ, sen 7θ.

2πi/13 13 − 1
18.11. Sea ω = e . Probar que ω + ω3 + ω4 + ω9 + ω 10 + ω 12 = .
2
Indicación: Si S es la suma, ¿quién es (2S + 1)2 ?
6
2
X
18.12. Sea z = e2πi/7 . Calcular zn .
n=1

5.3.2. Teorema fundamental del Álgebra y sus consecuencias


Desde el punto de vista algebraico, la principal ventaja del cuerpo complejo es que, al contrario
que R, C es algebraicamente cerrado, i.e., todo polinomio no constante con coeficientes complejos
tiene una raı́z en C.(**) Este hecho fue ‘presentido’ antes de que se llegara a formular adecuadamente
(**)
Sigue dándose una condición de minimalidad: es el menor cuerpo algebraicamente cerrado que contiene a .
C R

Con mayor precisión, si un cuerpo algebraicamente cerrado contiene un subcuerpo isomorfo a , debe contener un R

subcuerpo isomorfo a .C
5.3. POLINOMIOS EN C Y EN R. 145

y mucho antes de que se lograra una demostración incuestionable (ver [DD-P], pp. 248–253). No es
un resultado fácil de demostrar con argumentos elementales pero, en cursos posteriores, será una
consecuencia sencilla del análisis de las funciones complejas de variable compleja. No obstante,
puede verse una demostración relativamente asequible (bastante larga) en [A-K], pp. 344–352; ver
también [D’A-W], pp. 324 y ss.
Aquı́ nos limitaremos a dar su enunciado y a deducir las consecuencias que de él se derivan en
relación con el estudio de las raı́ces y de la factorización de los polinomios en C[X] y en R[X].

Teorema 5.3.5 (D’Alembert-Gauss). Todo polinomio no constante con coeficientes complejos


admite al menos una raı́z en C.

Corolario 5.3.6. Los polinomios irreducibles en C[X] son los de grado 1 (lineales), de manera que
todo polinomio en C[X] de grado n, n ∈ N, admite una factorización como producto de n factores
lineales.

Demostración. Ya comentamos que los polinomios de grado 1 son siempre irreducibles. Cualquier
otro polinomio p en C[X] de mayor grado ya no es irreducible, pues tendrı́a una raı́z z ∈ C y serı́a
por tanto de la forma p(X) = (X − z) q(X), con deg q = deg p − 1 6= 0.
La segunda conclusión se sigue del teorema de factorización única: necesariamente,

p(X) = a(X − z1 ) · · · (X − zn )

a 6= 0, z1 , . . . , zn ∈ C si deg p = n.

Corolario 5.3.7. Sea n ∈ N. Todo polinomio en C[X] de grado n posee exactamente n raı́ces, si
se cuenta cada una de ellas tantas veces como indique su multiplicidad.

Demostración. Dado p ∈ C[X] de grado n, agrupando los factores X − z repetidos en la descom-


posición anterior, si z1 , . . . , zk , son las distintas raı́ces de p, con multiplicidades m1 , . . . , mk ,
resulta
p(X) = a(X − z1 )m1 · · · (X − zk )mk
y por tanto m1 + · · · + mk = n.

Pasemos ahora a caracterizar los polinomios irreducibles en R[X].

Lema 5.3.8. Dado p ∈ R[X], si z ∈ C es tal que p(z) = 0, entonces p(z) = 0. En palabras, si
un polinomio con coeficientes reales tiene una raı́z compleja z, también su conjugado z es raı́z del
polinomio.

Demostración. Por las propiedades de la conjugación, si p(X) = a0 + a1 X + · · · + an X n , y a0 , a1 ,


. . . , an ∈ R, para todo z ∈ C es

p(z) = a0 + a1 z + · · · + an z n = a0 + a1 z + · · · + an z n = a0 + a1 z + · · · + an z n = p(z).

En particular, p(z) = 0 implica p(z) = p(z) = 0.

Corolario 5.3.9. Los polinomios irreducibles en R[X] son los polinomios lineales y los polinomios
cuadráticos de la forma
a[(X − b)2 + c2 ],
con a, b, c ∈ R, a 6= 0 y c 6= 0 (que son los polinomios cuadráticos sin raı́ces en R).
146 CAPÍTULO 5. NÚMEROS COMPLEJOS

Demostración. Los polinomios lineales son siempre irreducibles, y los polinomios cuadráticos del
enunciado son irreducibles en R[X] por ser de segundo grado y no tener raı́ces en R (nótese que las
raı́ces en C de a[(X − b)2 + c2 ] son b + ic y b − ic).
Cualquier polinomio irreducible q en R[X] es de esta forma. Pues si tiene alguna raı́z en R,
es lineal. Y si no, mirado en C[X], admitirá al menos una raı́z compleja b + ic con c 6= 0; pero
también tendrá por raı́z b − ic según el lema. Por tanto, es divisible (en principio en C[X]) por
(X − (b + ic))(X − (b − ic)) = (X − b)2 + c2 , que tiene coeficientes reales; el cociente de q por
(X − b)2 + c2 es el mismo en C[X] que en R[X] (¿por qué?), luego debe ser un a ∈ R[X] con
deg a = 0, o sea, una constante real no nula.
Nota. Los polinomios de segundo grado irreducibles en R[X] son, equivalentemente, los de la forma
AX 2 + BX + C con B 2 − 4AC < 0 (¿por qué?).

Ejercicios
19.1. Factorizar X 4 + 1 y X 4 + 4 en C[X], en R[X] y en Q[X].
19.2. Descomponer en factores irreducibles el polinomio X n + X n−1 + · · · + X + 1
(i) en C[X];
(ii) en R[X].
19.3. Mediante factorización, probar que todo polinomio real de grado impar admite al menos una
raı́z real.
19.4. Hallar dos números complejos cuya suma sea 4 y cuyo producto sea 8.
Indicación. ¿Quién es (X − a)(X − b)?
19.5. Si z1 , z2 son las dos soluciones de la ecuación az 2 + bz + c = 0, donde a, b, c ∈ R, demostrar
que z1n + z2n ∈ R para todo n ∈ N. Si la ecuación es en particular z 2 − 2z + 2 = 0, calcular z1n + z2n .
√ √
19.6. Sabiendo que la ecuación z 2 − ( 3 + i 3)z + p = 0 tiene por solución z = −1 + i, hallar p y
la otra raı́z.
19.7. ¿Qué condición han de cumplir los números reales a, b, c, d para que la ecuación
z 3 + az 2 + (b + ic)z + b + id = 0 admita una raı́z real?
19.8. Comprobar que z = 3 + 4i es una solución de la ecuación z 4 − 10z 3 + 62z 2 − 178z + 325 = 0
y hallar las otras tres raı́ces.
19.9. Considérese la ecuación z 3 − 2z + c = 0, donde c ∈ R. Hallar sus soluciones sabiendo que una
de ellas está en la bisectriz del primer cuadrante del plano complejo.
19.10. Resolver la ecuación (iz + 1)5 = (1 − z)5 .
19.11. Demostrar que el polinomio (X +i)n −(X −i)n tiene todas sus raı́ces reales y determinarlas.
19.12.
(i) Demostrar que si a ∈ R,
m−1
Y 
2m 2m 2 2 2kπ
(z + a) − (z − a) = 4amz z + a cotg .
2m
k=1

(ii) Usando el apartado anterior, probar que


m−1
Y kπ
cotg = 1.
2m
k=1

N
Y
( zk significa z1 · · · zN .)
k=1
5.4. FRACCIONES RACIONALES. 147

5.4. Fracciones racionales. Fracciones simples.


Como señalábamos al construir los números racionales a partir de los enteros, la misma cons-
trucción puede llevarse a cabo partiendo de cualquier dominio de integridad, para sumergirlo en un
‘cuerpo de fracciones’. En particular, el método puede aplicarse al dominio K[X] de los polinomios
en la indeterminada X con coeficientes en un cuerpo conmutativo K, obteniéndose ası́ el cuerpo de
las fracciones racionales (también llamado ‘de las fracciones algebraicas’, ver [Pest]). No daremos
ninguna demostración, puesto que basta repetir las empleadas en la construcción de Q, cambiando
simplemente ‘número entero’ por ‘polinomio’ (el lector puede comprobarlo en algún caso para una
mejor comprensión del proceso).

Lema 5.4.1. Sea Φ = K[X] × (K[X] \ {0}), y ∼ la relación en Φ dada por


(p1 , q1 ) ∼ (p2 , q2 ) cuando y sólo cuando p1 q2 = p2 q1 .
Entonces ∼ es una relación de equivalencia en Φ.

A los elementos de Φ los denominaremos fracciones algebraicas en la indeterminada X, con


coeficientes en K.

Definición 5.4.2. El cuerpo de las fracciones racionales es el conjunto cociente K(X) =


Φ/ ∼. Sus elementos, que denominaremos fracciones racionales , son las clases de equivalencia
[(p, q)].

Nota sobre nomenclatura y notación. No hay una denominación estándar universalmente


utilizada para los elementos de Φ y de K(X): es habitual llamar indistintamente a unos y otros
‘fracciones algebraicas’ o ‘fracciones racionales’. Para mayor complicación, el sı́mbolo empleado
normalmente para la relación de equivalencia ∼ en Φ es =. Igualmente, se emplea la notación
clásica p/q para los dos objetos distintos (p, q) ∈ Φ o [(p, q)] ∈ K(X). A veces, se dice que una
fracción racional admite una representación p/q para indicar que (p, q) es un representante de la
clase de equivalencia que constituye dicha fracción.
Es realmente notable que a pesar de todos estos ‘abusos’, no haya dificultades serias de enten-
dimiento si se considera en cada situación cuál es el sentido adecuado al contexto.
El lector queda advertido, pues, de que poco a poco iremos relajando la precisión adhiriéndonos
a la práctica habitual, aunque en este primer apartado intentaremos ser fieles a la notación y
nomenclatura introducidas. Como muestra, por ejemplo:

Definición 5.4.3. Una fracción algebraica p/q se dice irreducible si p y q son relativamente
primos, es decir, si mcd(p, q) = 1.

(Evidentemente, aquı́ p/q ∈ Φ, aunque no se indique explı́citamente.)


Ejercicio. Probar que toda fracción algebraica es equivalente a una fracción irreducible; dicho de
otro modo, que toda fracción racional admite un representante que es una fracción irreducible.
Concretamente, dados polinomios p, q ∈ K[X] con q 6= 0 y mcd(p, q) = d, si p = p1 d, q = q1 d,
p/q ∼ p1 /q1 y p1 /q1 es irreducible.
p1 p 2
Definición 5.4.4. Dadas , ∈ Φ, su suma es
q1 q2

p1 p2 p1 q 2 + p 2 q 1
+ = (∈ Φ),
q1 q2 q1 q2

y su producto
p1 p2 p1 p2
= (∈ Φ).
q1 q2 q1 q2
148 CAPÍTULO 5. NÚMEROS COMPLEJOS

p1 r 1 p2 r 2 p1 r 1 p2 r2
Lema 5.4.5. Dados , , , en Φ tales que ∼ , ∼ , se verifica
q1 s1 q2 s2 q1 s1 q2 s2
p1 p2 r1 r2 p1 p2 r1 r2
+ ∼ + , ∼ .
q1 q2 s1 s2 q1 q2 s1 s2
p1 p 2
Definición 5.4.6. Dadas dos fracciones racionales , ∈ K(X), llamaremos suma de ambas
q1 q2
a la fracción racional
p1 p 2 p 1 q 2 + p2 q 1
+ = [∈ K(X)],
q1 q2 q1 q2
y producto a la fracción racional
p1 p2 p1 p2
= [∈ K(X)].
q1 q 2 q1 q2

Según el lema previo, la


 aplicación suma (respectivamente, producto) de K(X)×K(X) en K(X)
p1 p 2 p1 q 2 + p2 q 1
que hace corresponder a , ∈ K(X) × K(X) la fracción racional (respectiva-
q 1 q 2 q1 q2
p1 p2 
mente, está bien definida.
q1 q2

Proposición 5.4.7. Con la suma y el producto que hemos definido, K(X) es un cuerpo conmuta-
tivo.

Proposición 5.4.8. La aplicación h : K[X] → K(X) dada por

h(p) = p/1 ∈ K(X), p ∈ K[X],

tiene las siguientes propiedades:

(i) es inyectiva, h(p1 ) 6= h(p2 ) si p1 6= p2 ;

(ii) transforma sumas en sumas, h(p1 + p2 ) = h(p1 ) + h(p2 );

(iii) transforma productos en productos, h(p1 p2 ) = h(p1 ) h(p2 ).

Es decir, h es un isomorfismo entre K[X] y h(K[X]) por lo que, desde este momento, conside-
ramos
K[X] ⊆ K(X) y p = p/1 para todo p ∈ K[X].

5.4.1. LECTURA: funciones racionales.


Igual que hemos hablado de funciones polinómicas, obtenidas mediante evaluación de polino-
mios, ¿podemos definir funciones racionales mediante evaluación de fracciones racionales? Ahora
las cosas se complican: mientras que no hay ningún problema en evaluar p(x) para cada p ∈ K[X]
y x ∈ K, no podemos decir lo mismo sobre la evaluación de p/q ∈ K(X) en cualquier x ∈ K. Si
bien hemos exigido que q 6= 0, eso no impide que puedan existir x ∈ K para los que q(x) = 0 (las
posibles raı́ces de q), lo que hace que p(x)/q(x) no tenga sentido en K. Es, pues, necesario ajustar
nuestro planteamiento.

Definición 5.4.9. Una función racional es un cociente de funciones polinómicas.


Por tanto, su dominio será todo K salvo un número finito de elementos, a lo más (los que anulen
al denominador).
5.4. FRACCIONES RACIONALES. 149

En consecuencia, dos representantes distintos de una misma fracción racional originan dos
X +1
funciones racionales diferentes: por ejemplo, mientras que las fracciones racionales y
X2 − 1
X −2
son iguales, las funciones racionales f y g, cocientes respectivamente de las funciones
X 2 − 3X + 2
polinómicas x + 1 y x2 − 1, x − 2 y x2 − 3x + 2, son distintas puesto que dom f = K \ {1, −1},
dom g = K \ {1, 2}. Evidentemente, en los x pertenecientes a la intersección de sus dominios
1
ambas toman el mismo valor, igual a su vez a .
x−1
Esto es lo que sucede en general:
Sea p/q ∈ Φ y r/s una fracción irreducible equivalente a p/q; el conjunto S de ceros de s está con-
tenido en el conjunto de ceros de q, y la función racional asociada a p/q es la restricción a K \ S
de la función racional asociada a r/s.

5.4.2. Fracciones simples


Las fracciones racionales admiten una representación ‘estándar’ que es muy útil en ciertas
aplicaciones. En lo que sigue, para simplificar los enunciados, suponemos que deg p ≤ deg q significa
hh p = 0 o deg p ≤ deg q ii.

Lema 5.4.10. Dada una fracción p(X)/q(X), existen polinomios p0 (X), p1 (X) unı́vocamente de-
terminados tales que deg p1 < deg q y

p(X) p1 (X)
= p0 (X) + .
q(X) q(X)

Demostración. La igualdad del enunciado puede reescribirse

p(X) p0 (X)q(X) + p1 (X)


= ,
q(X) q(X)

lo que significa, por definición, que (***)

p(X)q(X) = [p0 (X)q(X) + p1 (X)]q(X),

que equivale, cancelando q (o, para la implicación inversa, multiplicando por q), a

p(X) = p0 (X)q(X) + p1 (X).

Por tanto, el lema es sólo otra manera de enunciar la existencia y unicidad de la división de
polinomios.

Lema 5.4.11. Si q(X) ∈ K[X] es de la forma q(X) = q1 (X)q2 (X) con mcd(q1 , q2 ) = 1, toda
fracción racional p(X)/q(X) puede descomponerse en suma de fracciones con denominadores q1 y
q2 ; es decir, existen polinomios p1 y p2 tales que

p(X) p1 (X) p2 (X)


= + .
q(X) q1 (X) q2 (X)

Demostración. Puesto que existen dos polinomios u y v tales que uq1 + vq2 = 1,

p p(uq1 + vq2 ) pv pu
= = + .
q q1 q2 q1 q2

(***)
Aquı́ estamos mirando p/q como elemento de K(X).
150 CAPÍTULO 5. NÚMEROS COMPLEJOS

Ejemplo. En R(X),
1 1
= √ √ .
X4 + 1 (X + 2X + 1)(X 2 − 2X + 1)
2
√ √
Llamemos A = X 2 + 2X + 1, B = X 2 − 2X + 1. Puesto que
√ √
A = B + 2 2X, B = (X − 2)X + 1,
(algoritmo de Euclides ‘salvo constantes’) se sigue que
√ √
√ √ 1 X− 2 X− 2
1 = B − (X − 2)X = B − (X − 2) √ (A − B) = B(1 + √ )−A √
2 2 2 2 2 2
√ √
X+ 2 X− 2
= √ B− √ A,
2 2 2 2
y de aquı́
√ √ √ √
1 (X + 2)B (X − 2)A 1 X+ 2 1 X− 2
= √ − √ = √ √ − √ √ .
X4 + 1 2 2AB 2 2AB 2 2 X 2 + 2X + 1 2 2 X 2 − 2X + 1
—Análogamente, para
X +1 X +1
= ,
X3 − 1 (X − 1)(X 2 + X + 1)
de X 2 + X + 1 = (X − 1)(X + 2) + 3 se sigue que
X +1 1 X + 1 1 (X + 1)(X + 2) 1 (X − 1) + 2 1 (X 2 + X + 1) + (2X + 1)
= − = −
X3 − 1 3 X − 1 3 X2 + X + 1 3 X −1 3 X2 + X + 1
1 2 1 2X + 1
= − .
3 X − 1 3 X2 + X + 1
Este segundo ejemplo sugiere que el lema anterior puede refinarse cuando el numerador es un
polinomio de menor grado que el denominador .
Lema 5.4.12. Si q(X) ∈ K[X] es de la forma q(X) = q1 (X)q2 (X) con mcd(q1 , q2 ) = 1, toda
fracción algebraica p(X)/q(X) con deg p < deg q puede descomponerse, de manera única, en
suma de fracciones con denominadores q1 y q2 y numeradores p1 y p2 tales que deg p1 < deg q1 ,
deg p2 < deg q2 ; es decir, existen polinomios unı́vocamente determinados p1 y p2 tales que
deg p1 < deg q1 , deg p2 < deg q2 y
p(X) p1 (X) p2 (X)
= + .
q(X) q1 (X) q2 (X)
Demostración. Sean p1 y p2 como en el lema anterior. Si deg p1 ≥ deg q o deg p2 ≥ deg q, dividiendo
serı́a p1 = c1 q1 + r1 , p2 = c2 q2 + r2 , deg r1 < deg q1 , deg r2 < deg q2 o nulos. Haciendo operaciones
p = (c1 +c2 )q +r1 q2 +r2 q1 ; deg(r1 q2 ) < deg q1 +deg q2 = deg q, deg(r2 q1 ) < deg q2 +deg q1 = deg q,
lo que significa que c1 + c2 es el cociente de la división de p por q, necesariamente nulo porque
deg p < deg q (el resto serı́a r1 q2 + r2 q1 ). Por tanto
p(X) r1 (X) r2 (X)
= + , deg r1 < deg q1 , deg r2 < deg q2 .
q(X) q1 (X) q2 (X)
La unicidad se sigue de que si también
p(X) s1 (X) s2 (X)
= + , deg p1 < deg q1 , deg s2 < deg q2 ,
q(X) q1 (X) q2 (X)
se deduce que r1 q2 + r2 q1 = s1 q2 + s2 q1 , es decir, (r2 − s2 )q1 = (s1 − r1 )q2 , y como q1 y q2 son
relativamente primos, q1 |(s1 − r1 ); pero entonces s1 − r1 = 0, pues en caso contrario,
deg q1 ≤ deg(s1 − r1 ) ≤ máx{deg s1 , deg r1 } < deg q1 , imposible. Por lo mismo, r2 − s2 = 0.
5.5. NÚMEROS COMPLEJOS Y GEOMETRÍA PLANA 151

Lema 5.4.13. Toda fracción racional de la forma p(X)/[q(X)]m puede expresarse como

p(X) p1 (X) pk (X) pm (x)


m
= p0 (X) + + ··· + k
+ ··· +
[q(X)] q(X) [q(X)] [q(X)]m

con deg pk < deg q, 1 ≤ k ≤ m.

Demostración. Dividiendo repetidamente por q se obtiene

p = c1 q + pm = (c2 q + pm−1 )q + pm = · · · = (· · · (p0 q + p1 )q + · · · + pm−1 )q + pm ,

con deg pk < deg q, 1 ≤ k ≤ m, lo que equivale a la igualdad del enunciado.

Nota. Los polinomios p0 , p1 , . . . , pm están unı́vocamente determinados (probarlo como ejercicio).

Definición 5.4.14. Un elemento de K(X) es una fracción simple si puede escribirse en la forma
p(X)/[q(X)]k , donde q(X) es irreducible en K[X] y el grado de p(X) ∈ K[X] es estrictamente
menor que el de q(X).
a
Ejemplo. En C(X) las fracciones simples son sólo de la forma , con a, b ∈ C. En R(X)
(X − b)k
a1 + a2 X
aparecen además fracciones del tipo , a1 , a2 , b, c ∈ R.
[(X − b)2 + c2 ]k

Proposición 5.4.15 (Descomposición en fracciones simples). Todo elemento p/q de K(X)


admite una expresión única como suma de un polinomio en X más una suma de fracciones simples.

Demostración. Es consecuencia de los lemas anteriores.

Ejercicio. Simplificar y descomponer en fracciones simples en C(X) y en R(X) las siguientes


fracciones:
(X + 1)3 X 3 − 27 X 2 + 5X + 6
(a) ; (b) ; (c) ;
X2 − 1 X2 − 9 X2 − 4
2X − 3 1 X 5 + 5X 3 − X + 6
(d) ; (e) ; (f) .
(X − 1)(X − 2)(X − 3) (X 2 − 9)2 X3 − 1

Nota. Los programas de cálculo simbólico (maple, Mathematica ) permiten generalmente efec-
tuar estas operaciones. Por ello, recomendamos calcular ‘a mano’ los coeficientes numéricos pedidos
en alguno de los ejercicios anteriores, y plantear cuando menos la forma del resultado en todos los
demás. Solo después es aconsejable pasar al ordenador.
(Para maple , la sintaxis es hh convert((a0 + a1 ∗ x + · · · )/(b0 + b1 ∗ x + · · · ),parfrac,x);ii y
para Mathematica , hh Apart[(a0 + a1 x + · · · )/(b0 + b1 x + · · · )]ii)

5.5. LECTURA: Números complejos y geometrı́a plana.


En los ejercicios de un apartado anterior hemos apuntado tı́midamente la interrelación entre la
geometrı́a del plano y el cálculo con números complejos. Lamentablemente, no podemos extendernos
en esta dirección, pero como un auténtico regalo para cualquier aficionado a las Matemáticas pro-
ponemos la lectura de un libro muy especial, Liang-shin Hahn: Complex Numbers and Geometry.
Mathematical Association of America, 1994., (que contiene resultados geométricos más profundos
que los que aparecen aquı́), y ofrecemos una lista de ejercicios suplementarios ‘fuera de con-curso’
para esos ratos en los que apetece salirse de la rutina (algunos de ellos pertenecen a otro libro
interesante en este aspecto, [Wil]).
152 CAPÍTULO 5. NÚMEROS COMPLEJOS

Ejercicios
20.1. Desigualdades triangulares. Probar que la longitud del lado de un triángulo es menor
que la suma de las longitudes de los otros dos y mayor que su diferencia.
20.2. Mediatriz de un segmento. Probar que “el lugar geométrico de los puntos que equidistan
de dos puntos fijos A y B es la recta perpendicular al segmento AB por su punto medio.”
20.3. Demostrar que:

(i) Si z1 + z2 + z3 = 0 y |z1 | = |z2 | = |z3 | = 1, los puntos z1 , z2 y z3 son vértices de un triángulo


equilátero inscrito en la circunferencia unidad.

(ii) Si z1 + z2 + z3 + z4 = 0 y |z1 | = |z2 | = |z3 | = |z4 |, los puntos z1 , z2 , z3 y z4 o bien son vértices
de un rectángulo o bien coinciden de dos en dos.

20.4. ¿Bajo qué condición tres puntos z1 , z2 y z3 , distintos dos a dos, estarán sobre una misma
recta?
20.5. ¿Bajo qué condición cuatro puntos z1 , z2 , z3 y z4 , distintos dos a dos, estarán sobre una
misma circunferencia o sobre una misma recta?
20.6. Demostrar que las alturas de un triángulo son concurrentes (es decir, que las tres se cortan
en un mismo punto, el ortocentro del triángulo).
20.7. ¿Puede probarse algebraicamente que un paralelogramo tiene las diagonales perpendiculares
si y sólo si es un rombo? ¿Y que tiene las diagonales iguales si y sólo si es un rectángulo?
Bibliografı́a

[A-K] Aleksandrov. A. D.; Kolmogorov, A. N.; Laurentiev, M. A. & al.: La matemática:


su contenido, métodos y significado (vol. I). Alianza Editorial, Madrid, 1973.

[ApC] Apostol, T.M.: Calculus, vol. I (segunda edición). Reverté, Barcelona, 1989.

[Ap] Apostol, T.M.: Análisis Matemático (segunda edición). Reverté, Barcelona, 1991.

[DD-P] Dahan-Dalmedico, A.; Peiffer, J.: Une histoire des mathématiques. Éditions du Seuil,
Paris, 1986.

[D’A-W] D’Angelo, J. P.; West, D. B.: Mathematical Thinking. Problem-Solving and Proofs.
Prentice-Hall, Upper Saddle River, NJ, 1997.

[Ebb] Ebbinghaus, H.-D. & al.: Numbers. Springer, New York, 1991.

[Fey] Feynman, R. & al.: Fı́sica. Volumen I: Mecánica, radiación y calor. Addison-Wesley
Iberoamericana, Wilmington, Delaware, 1987.

[GJPR] Goberna, M. A.; Jornet, V.; Puente, R.; Rodrı́guez, M.: Álgebra y fundamentos.
Una introducción. Ariel, Barcelona, 2000.

[Her] Hernández, E.: Álgebra y geometrı́a. Addison-Wesley/UAM, Madrid, 1994.

[Lieb] Liebeck, M.: A Concise Introduction to Pure Mathematics. Chapman & Hall/CRC, Boca
Raton, 2000.

[Pest] Pestana, D. & al.: Curso práctico de Cálculo y Precálculo. Ariel, Barcelona, 2000.

[Spg] Spiegel, M.R.: Variable compleja. McGraw Hill (colección Schaum), 1971..

[S-T] Stewart, I.; Tall, D.: The Foundations of Mathematics. Oxford Univ. Press, 1977.

[Wil] Williams, J.: Álgebra de números complejos. Limusa-Wiley, México, 1974.

153
154 BIBLIOGRAFÍA
Capı́tulo 6

Aritmética de punto flotante.

Estudiaremos (muy superficialmente) la representación de los números reales en los ordenadores


y su ‘aritmética’. Las referencias pertinentes a la bibliografı́a irán apareciendo a lo largo de la
exposición.
En todo este capı́tulo, cuando no se especifica lo contrario, hh númeroii significa número real.

6.1. Aperitivo.
Lee atentamente estos enunciados:

(1) Según tu calculadora, ¿qué vale


1 1 1 1 1 1
+ + , 1− − − ?
3 3 3 3 3 3

(2) Comprueba con tu calculadora que



1+ 5
a) a = = 1, 6180339 . . .
2

1+ 5
a−1 −1 0, 6180339 . . .
b) b = = 2 √ = = 1, 6180333 . . .,
2−a 1+ 5 0, 3819661 . . .
2−
2
de modo que a > b.

Responde ahora cuidadosamente a estas cuestiones:

(i) ¿Cómo se explica el resultado de (1)?

(ii) ¿Son correctas las operaciones de (2)?


SÍ u
t NO u
t NO SÉ u
t

(iii) En (2), lo cierto es que:


a>bu
t a=bu
t a<bu
t .

¿Qué consecuencias sacas?

155
156 CAPÍTULO 6. ARITMÉTICA DE PUNTO FLOTANTE.

6.2. Representación en punto flotante


En una reunión se plantea la siguiente pregunta:
“¿Cuánto vale π?”
El ingeniero dice: “Es aproximadamente 3 y 1/7.”
El fı́sico responde: “Es 3.141592.”
El matemático piensa un momento, y replica:
“Es igual a π.”
(Del folklore)
Hemos mostrado la posibilidad teórica de representar los números reales mediante sucesiones de
dı́gitos en distintas bases. Ahora vamos a enfrentarnos con su representación práctica en un orde-
nador, con las limitaciones efectivas que la realidad impone.

6.2.1. Números de máquina


El conjunto de los números reales no puede representarse plenamente en un ordenador (¡ni
siquiera el de los números enteros!). Si queremos guardar las cifras decimales (o más frecuentemente,
binarias) de un número en un ordenador, sólo disponemos de un número finito de ‘huecos’ para
hacerlo. Podemos, simplemente, ignorar las cifras del desarrollo a partir de un cierto lugar; pero se
aprovecha mejor el espacio evitando “ceros innecesarios” como en la ‘notación cientı́fica’, con una
representación en punto flotante:

número = signo × mantisa × base exponente

Por ejemplo, para la constante de gravitación universal G = 6.673 × 10−11 , la mantisa es 6.673, la
base es 10 y el exponente −11.
Este y otros ejemplos de magnitudes muy grandes o muy pequeñas, como

Masa del electrón 9.109 × 10−28 g.


Masa del sol 1.989 × 1030 kg.
Constante de Plank 6.626 × 10−34 J·s
Número de Avogadro 6.022 × 1023 mol−1

ponen de manifiesto el ahorro de cifras que conlleva esta notación.


Pero cada número admite infinitas representaciones de este tipo:
−111/2 = −55.5 × 100 = −5.55 × 101 = −0.555 × 102 = . . ., o también
−111/2 = −555 × 10−1 = −5550 × 10−2 = . . .
Para tener unicidad hace falta normalizar la representación. Habitualmente, como hemos hecho
en los ejemplos de notación cientı́fica,
el primer dı́gito no nulo de la mantisa aparece a la izquierda del punto,
la parte entera del valor absoluto consta de una sola cifra: −111/2 = −5.55 × 101 .
Esto excluye el número 0, que queda como excepción, y ha de ser representado aparte.
En matemáticas es también frecuente otra normalización,
colocando la primera cifra no nula inmediatamente después del punto;
el valor absoluto de la mantisa es siempre menor o igual que 1 y su parte entera es nula:
−111/2 = −0.555 × 102 .
La diferencia entre ambas normalizaciones es inesencial: todo se reduce a sumar o restar 1 al
exponente. Lo importante es que el punto decimal flota para eliminar los ceros ‘innecesarios’:
2/111 = 0.018018018 . . . = 1.8018018 × 10−2 , o bien 2/111 = 0.18018018 × 10−1 .
6.2. REPRESENTACIÓN EN PUNTO FLOTANTE 157

La normalización ahorra espacio: Si se emplea base 2 en vez de base 10, como todas las mantisas
comenzarán por hh 1. etc.ii, podemos sobreentender no sólo el punto, sino también el 1 (‘técnica
del bit fantasma’). En la segunda normalización, todas las mantisas —en cualquier base— van a
comenzar por hh 0. etc.ii, lo que hace innecesario explicitar el 0 y el punto.
Finalmente, el tamaño de las palabras del ordenador fuerza a limitar:
la precisión, la cantidad p de dı́gitos disponibles para colocar en ellos la mantisa;
la cantidad p0 de dı́gitos disponibles para el exponente, que estará por tanto comprendido
entre un valor mı́nimo y un valor máximo.
Con tales condicionantes, fijada una base β, los números de máquina , verdaderamente dis-
ponibles en el ordenador, serán
 
E d2 d3 dp
y = ±β d1 + + 2 + · · · + p−1 ,
β β β
donde cada dı́gito dk satisface 0 ≤ dk ≤ β − 1 y d1 6= 0, y el exponente E toma sus valores entre
un mı́nimo Emin y un máximo Emax .
Paralelamente, con la segunda normalización obtendrı́amos
 
e d1 d2 dp
y = ±β + 2 + ··· + p ,
β β β
con 0 ≤ dk ≤ β − 1 y d1 6= 0, y emin ≤ e ≤ emax . Se pasa de una a otra, por tanto, tomando
e = E + 1. Ambas son equivalentes, en el sentido de que generan exactamente los mismos números
(con la relación señalada entre los exponentes, y con Emin = emin − 1, Emax = emax − 1).
Aún ası́:
— hay multitud de implementaciones posibles
— cada fabricante elige la que mejor le parece
— esto dificulta enormemente la transportabilidad de los programas de cálculo.
Para unificar, se han propuesto diversas estandarizaciones:
norma IEEE 754 (completada con la IEEE 854); denominada también IEC 559. Es la más
utilizada. Hay en la red ‘applets’ que muestran el formato archivado por el ordenador ([2]). La
normalización elegida para la mantisa (denominada significando en esta norma) es la primera,
d1 .d2 . . . dp , con β = 2 o β = 10 como bases permitidas.
norma ISO/IEC 10967-1 Language Independent Aritmetic, Part 1 [LIA-1], posterior y menos
restrictiva. Usa la segunda normalización 0.d1 d2 . . . dp para la mantisa (denominada ahora
fracción), y admite cualquier base β que sea un número natural par.

Sistemas numéricos en punto flotante


Para analizar las dificultades y la complejidad de la representación y manejo en el ordenador
de números en punto flotante, se establecen ‘modelos ideales’, que sean ‘simples pero realistas’.
Siguiendo a Higham (v. [Hig] §2.1, pp. 40 y ss.), usaremos lo que él denomina sistemas numéricos
en punto flotante.
Previamente, notemos: cuando escribimos
 
d1 d2 dp
y = ±β e + 2 + ··· + p ,
β β β
d1 d2 dp
la fracción f = + 2 + · · · + p se puede representar también como m × β −p , donde m es un
β β β
entero de p dı́gitos del intervalo [β p−1 , β p − 1]; concretamente m = d1 β p−1 + d2 β p−2 + · · · + dp . Ası́
y = ±f × β e = ±(m × β −p ) × β e = ±m × β e−p .
158 CAPÍTULO 6. ARITMÉTICA DE PUNTO FLOTANTE.

Por ser la notación más cómoda, ésta es la forma de los valores que vamos a usar para definir los
sistemas numéricos en punto flotante.

Definición 6.2.1. Un sistema numérico en punto flotante es un subconjunto finito de R,


F = F (β, p, emin , emax ), caracterizado por cuatro parámetros enteros:

• β∈Z (la base o radix de F )


• p∈Z (la precisión de F )
• emin ∈ Z (el menor exponente de F )
• emax ∈ Z (el mayor exponente de F )
Dados valores especı́ficos de β, p, emin , emax , se define

FN = {y = ±m × β e−p : m, e ∈ Z, β p−1 ≤ m ≤ β p − 1, emin ≤ e ≤ emax },

y finalmente
F = {0} ∪ FN

El mayor y el menor número positivo de F son

f max := máx{y ∈ F : y > 0} = β emax (1 − β −p )


f minN := mı́n{y ∈ FN : y > 0} = β emin −1

Llamaremos rango de F al conjunto [−f max, −f minN ] ∪ {0} ∪ [f minN , f max] (que contiene
a F estrictamente).
Nótese que ahora la mantisa m de un número y = 0.d1 d2 . . . dp × β e de FN es el entero
d1 d2 . . . dp (escritos en base β).
Llamaremos a d1 el dı́gito más significativo y a dp el dı́gito menos significativo de y.

En la norma LIA-1, los parámetros β y p han de satisfacer

β ≥ 2 y p ≥ 2,

y β tiene que ser par.


Ası́ mismo, “para que haya bastantes elementos en F ”, los parámetros emin , emax y p han de
satisfacer

p − 2 ≤ −emin ≤ β p − 1,
p ≤ emax ≤ β p − 1.

En IEEE 754 y 854 se consideran cuatro formatos distintos: precisión simple, precisión doble,
precisión simple extendida, precisión doble extendida, con valores para los parámetros (ver [Hig],
p. 41):

formato β p emin emax


IEEE simple 2 24 −125 128
IEEE doble 2 53 −1021 1024
IEEE simple extendida 2 ≥ 32 ≤ −1021 ≥ 1024
IEEE doble extendida 2 ≥ 64 ≤ −16381 ≥ 16384

(reajustados a la normalización hh 0.d1 . . .ii).


6.2. REPRESENTACIÓN EN PUNTO FLOTANTE 159

Ejemplos
1.- Si β = 2, p = 5 [= 22 + 1], y = 11/2 = 22 + 1 + 1/2 = 23 (2−1 + 2−3 + 2−4 ), tendrı́amos
(con mantisa y exponente en base 2, escrito el cero como O y el uno como I para distinguir)
y = O.IOIIO × 2II = IOIIO × 2II−IOI ; la mantisa m es IOIIO y el exponente e es II.
2.- ‘Minimodelo’ con β = 2, p = 3, emin = −1, emax = 3. Los números no negativos de F serı́an (en
escritura decimal) el 0 y

fracción
1/2 1/2 + 1/8 1/2 + 1/4 1/2 + 1/4 + 1/8 exponente
0.25 0.3125 0.3750 0.4375 × 2−1
0.5 0.625 0.750 0.875 × 20
1.0 1.25 1.50 1.75 × 21
2.0 2.5 3.0 3.5 × 22
4.0 5.0 6.0 7.0 × 23

que se distribuyen gráficamente ası́:

0 0.25 0.5 1.0 2.0 3.0 4.0 5.0 6.0 7.0

Junto con sus opuestos (los simétricos respecto del origen) forman el sistema F = F (2, 3, −1, 3).
Este ejemplo ilustra cómo el espaciado de los números de F salta un factor 2 (= β) con cada
potencia de 2 (= β).

6.2.2. Aproximación por redondeo


Elegido un determinado sistema numérico en punto flotante para implementar en el ordenador,
el resto de los números reales (¡casi todos!) no existen para él. Esta situación no es nueva en
absoluto: cada vez que hemos usado un valor numérico de π, hemos puesto π = 3.14, o π = 3.1416,
o π = 3.141592654 (cuando disponemos de calculadora); no hemos podido manejar su ‘valor exacto’,
que, como decı́a el matemático, ‘es π’. La realidad fuerza inevitablemente a tomar aproximaciones,
por lo que, si no podemos evitar los errores que generan, tratemos al menos de minimizarlos.
Eso hacemos cuando ponemos π = 3.1416 (aproximación por exceso) y no π = 3.1415 (aproxi-
mación por defecto o por corte): tomamos el valor más próximo a π entre los que tienen cinco cifras
decimales.
Para simplificar(*) , definiremos:
Definición 6.2.2 (Redondeo y desbordamiento.). Dado F = F (β, p, emin , emax ), el redondeo
( respecto de F ) es la aplicación f l : R → F ∪ {overflow, underflow} dada por
f l(x) = overflow si |x| > f max = máx F
(hay un desbordamiento por exceso )

f l(x) = underflow si 0 < |x| < f minN = mı́n{|y| : y ∈ F, y 6= 0}


(hay un desbordamiento por defecto ).

f l(x) = elemento de F más próximo a x si x está en el rango de F .


Cuando haya dos números en F a la misma distancia de x, convendremos en tomar como
f l(x) el que tenga el último dı́gito dp par.

(*)
La norma IEEE 754 contempla distintos modos de redondeo: redondeo hacia +∞ (round down), redondeo hacia
−∞ (round up), redondeo hacia 0 (round towards zero) y redondeo al más próximo (round to nearest). Ver [Gold]
160 CAPÍTULO 6. ARITMÉTICA DE PUNTO FLOTANTE.

Ejercicio. Para x, y en el rango de F ,


(i) x ≤ y implica f l(x) ≤ f l(y);

(ii) f l(−x) = − f l(x);

(iii) f l(β n · x) = β n · f l(x) (supuesto β n · x en el rango de F ).


Ejemplos. (1) En nuestro ‘minimodelo’ con β = 2, p = 3, emin = −1, emax = 3, se produce
desbordamiento por exceso siempre que |x| > 7, y por defecto si 0 < |x| < 0.25.

underflow overflow

0 0.25 0.5 1.0 2.0 3.0 4.0 5.0 6.0 7.0

Para x = 4.5, serı́a f l(x) = 4; para x = 5.5, serı́a f l(x) = 6 (¿por qué?).
(2) Para β = 10, p = 6:
a = 0.31415926525 . . . × 101 f l(a) = 0.314159 × 101
b = −0.81412781 f l(b) = −0.814128 × 100
c = 0.112399972 f l(c) = 0.124000 × 100
d = 0.999999721 f l(d) = 0.100000 × 101
Obsérvese cómo el último dı́gito de la mantisa de b ha sido modificado. El cambio puede afectar
incluso a varios dı́gitos (como en c) y a veces hasta al exponente, como en el ejemplo d.

Medidas del error de redondeo


Al redondear un número, es decir, al sustituir un x ∈ R por f l(x) como valor aproximado,
cometemos un error cuyo tamaño conviene saber controlar. Puesto que cada x en el rango de
F que no pertenezca a F estará en un intervalo (y1 , y2 ) con extremos en F y uno sólo, y f l(x)
será precisamente uno de esos extremos,
y1 —————————————— y2
x
el valor de | f l(x) − x| = mı́n{|x − y| : y ∈ F } será, en el peor de los casos, la mitad de la longitud
y2 − y1 del intervalo. Basta, por tanto, controlar el espaciado entre los números de F . En general,
se observa que el espaciado es uniforme entre potencias consecutivas de β, y que se multiplica por
β al saltar a una nueva potencia de β.
Para concretar más, se utiliza el épsilon de la máquina, que es la distancia M desde 1.0 al
siguiente número de F más grande que él. Por tanto,
Definición 6.2.3. Épsilon de la máquina . Para un sistema numérico en punto flotante F =
F (β, p, emin , emax ), el épsilon de la máquina es el número

M = β 1−p ,

Por tanto, M es el espaciado de los números en punto flotante entre 1.0 y β, mientras que el
espaciado de los números entre 1.0 y 1/β es β −p = M /β. En general,
Lema 6.2.4. La distancia entre un número en punto flotante normalizado y y otro número en
punto flotante normalizado adyacente a y es como mı́nimo β −1 M |y| y como máximo M |y| (salvo
que uno de ellos sea cero).
Demostración. Ver [Hig], pp. 41.
6.2. REPRESENTACIÓN EN PUNTO FLOTANTE 161

Pero según dice [Hig], ‘la cantidad más útil asociada con F , que está por todas partes en el
mundo del análisis de los errores de redondeo’, es la llamada unidad de redondeo, que no es otra
cosa que la mitad del épsilon de la máquina.

Definición 6.2.5. Dado un sistema numérico en punto flotante F = F (β, p, emin , emax ), el número
1 1
u = β 1−p = M se llama unidad de redondeo del sistema F .
2 2

En el estándar IEEE con simple precisión se tiene u = 2−24 ≈ 5.96 × 10−8 ; en doble precisión,
u = 2−53 ≈ 1.11 × 10−16 .
A partir del lema anterior, se obtiene:

Proposición 6.2.6. Si x ∈ R está en el rango de F , entonces

1
| f l(x) − x| ≤ u |x| = β 1−p |x|;
2

precisando más,
1
f l(x) = x(1 + δ), |δ| < u = β 1−p .
2
Demostración. Ver [Hig], p. 42, Th. 2.2.

Esta proposición nos da cotas superiores del error absoluto y del error relativo en la aproxima-
ción de x por f l(x). Recordamos la definición de estos conceptos.

Definición 6.2.7. Sea x un número real. Si x


e es otro número real, que tomamos como una aproxi-
mación de x, se llama error absoluto (de la aproximación) a la diferencia

Ea (x) = |x − x
e|,

y error relativo (cuando x 6= 0) al cociente



Ea (x) |x − xe| x
e x
= 1 − = − 1 .
e
Er (x) = =
|x| |x| x x

e = x + α con |α| = Ea (x); y para x 6= 0, x


Ası́ x e = x(1 + ρ) con |ρ| = Er (x).
La proposición 6.2.6 significa, por tanto, que el error relativo del redondeo es siempre estricta-
mente menor que la unidad de redondeo.

Nota. En algunos textos, el error se expresa en términos de la unidad en el último lugar, que se
define para un y ∈ F por

ulp(y) = ulp(±0.d1 d2 . . . dp × β e ) = 0.00 . . . 01 × β e = β e−p

(ulp: unity in the last place). Ası́, por ejemplo, si F corresponde a β = 10 y p = 3, y se redondea
.0314159 a .314 × 10−1 , entonces hay un error de .159 unidades en el último lugar. Dada la distri-
bución de los elementos de F , es preferible usar el error relativo, más preciso; mientras que para
x = 0.9994999999 tendrı́amos f l(x) = 0.999 × 100 , con ulp(f l(x)) = 10−3 y un error de 0.4999999
ulp ≈ 0.5 ulp, el error relativo es 0.0005002502252 ≈ 0.1u, y sin embargo para x = 1.005 serı́a
f l(x) = 0.100 × 101 , con ulp(f l(x)) = 10−2 , un error de 0.5 ulp igualmente, pero el error relativo
correspondiente serı́a 0.004975124378 ≈ u, aproximadamente diez veces mayor que el anterior (este
es el fenómeno llamado wobbling precision, ‘precisión bamboleante’ u ‘oscilante’).
162 CAPÍTULO 6. ARITMÉTICA DE PUNTO FLOTANTE.

6.3. Aritmética ‘aproximada’


Prácticamente en todas las operaciones que realiza un ordenador los datos llegan inevitablemen-
te afectados de errores, o se generan errores de redondeo en el curso de los cálculos. Al efectuar las
operaciones más elementales, las aritméticas (sumas, restas, multiplicaciones, divisiones) los errores
de los resultados ¿son del mismo orden que los iniciales o, por el contrario, se produce un aumento
significativo en los mismos? ¿son las propias operaciones una nueva fuente de error, se realicen
como se realicen? Responder con precisión a esta pregunta es una tarea ciertamente complicada, y
es el objeto de estudios especı́ficos fuera de lugar en esta asignatura. Pero podemos hacernos una
idea de las dificultades y los problemas que se suscitan examinando qué sucede en nuestro modelo
de sistemas de números en punto flotante.
Para empezar, ¿cómo se propagan los errores en una suma?

Lema 6.3.1. Sean x, y, αx , αy , εa (x), εa (y), números reales tales que |αx | ≤ εa (x), |αy | ≤ εa (y),
y sean 
x
e = x + αx
. Entonces Ea = |(x + y) − (e x + ye)| ≤ |αx | + |αy |,
ye = y + αy
pudiendo tomar Ea cualquier valor desde Ea = 0 hasta Ea = εa (x) + εa (y).
Análogamente, si x + y 6= 0, y para ρx , ρy , es

x
e = x(1 + ρx ) |(x + y) − (e
x + ye)| |x ρx + y ρy |
, entonces Er = = ,
ye = y(1 + ρy ) |x + y| |x + y|

y nada puede decirse en general: Er puede tomar cualquier valor en [0, +∞).

Demostración. Por la desigualdad triangular

Ea = |(x + y) − (e
x + ye)| = | − (αx + αy )| ≤ |αx | + |αy |.

Como cualquier valor r ∈ [0, εa (x) + εa (y)] puede ponerse en la forma r = s + t con 0 ≤ s ≤ εa (x),
0 ≤ t ≤ εa (y) (¿por qué?), Ea puede alcanzar el valor r.
En cuanto a Er , sustituyendo xe y ye por su expresión en términos de x e y aparece la igualdad
del enunciado. Que Er puede alcanzar cualquier valor no negativo es claro: tomemos, por ejemplo,
x > 0, h > 0 cualesquiera, y = −x + h, ρx ≥ 0 arbitrario, ρy = 0; ası́ x + y = h y
xρx
Er = ,
h
que puede tomar tanto el valor Er = 0 para ρx = 0 como cualquier valor positivo R (basta que sea
xρx
ρx > 0, h = ).
R
Vemos, pues, que aunque el error absoluto de los sumandos esté acotado por un cierto εa , el de la
suma puede llegar a ser 2εa , y al cabo de N sumas, N εa , y que el error relativo queda descontrolado.
Como generalmente lo que importa es el error relativo, afinaremos el resultado anterior.

Proposición 6.3.2. Sean x, y, ρx , ρy , εr (x), εr (y), números reales tales que x + y 6= 0 y |ρx | ≤
εr (x), |ρy | ≤ εr (y), y sean 
x
e = x(1 + ρx )
.
ye = y(1 + ρy )
Si x e y tienen el mismo signo,

Er ≤ máx{|ρx |, |ρy |},

pudiendo tomar Er cualquier valor desde Er = 0 hasta Er = máx{εr (x), εr (y)}.


6.3. ARITMÉTICA ‘APROXIMADA’ 163

Demostración. Cuando x e y tienen el mismo signo, |x + y| = |x| + |y| (¿por qué?). Poniendo
máx{|ρx |, |ρy |} = ρ, aplicando la igualdad previa y la desigualdad triangular

|x ρx + y ρy | |x| |ρx | + |y| |ρy | |x| ρ + |y| ρ


Er = ≤ ≤ = ρ.
|x| + |y| |x| + |y| |x| + |y|

Para concluir, tomando x = y 6= 0, ρx = ρy = ρ con ρ ∈ [0, máx{εr (x), εr (y)}] arbitrario, se


obtiene Er = ρ.

En este caso, vemos que el error de la suma de datos erróneos no supera el error de los sumandos.
Por contra, con x e y de signos opuestos el desastre es total.

Proposición 6.3.3. Sean x, y, ρx , ρy , números reales tales que x + y 6= 0 y



x
e = x(1 + ρx )
.
ye = y(1 + ρy )

Si x e y tienen signos opuestos, y no hay circunstancias especiales en los valores de los datos,
Er puede tomar cualquier valor no negativo, por grande que este sea.

Demostración. Revisar la demostración del lema 6.3.1.

Esta es una causa de error insalvable, ‘intrı́nseca’ a la operación, que ningún ordenador ni
programa alguno pueden evitar.
Obsérvese la disparidad del comportamiento cuando los sumandos ‘se añaden o refuerzan’ (tie-
nen el mismo signo) o ‘se oponen’ (tienen signos opuestos). En el primer caso el error relativo de la
suma es, como mucho, el del ‘peor’ de los sumandos; en el segundo caso, el error relativo de la suma
se dispara cuando la suma es ‘casi cero’, aún con pequeñı́smos errores relativos en los sumandos
(suele llamarse a este fenómeno cancelación catastrófica).
Para empeorar un poco más las cosas, cuando manejamos un sistema F de números en punto
flotante, y es x e + ye ∈ F (el resultado exacto de la suma
e = f l(x), ye = f l(y), no siempre resulta x
de dos números de F no siempre está en F ), con lo cual necesitará ser redondeado, y lo mejor que
la máquina podrá ofrecer como suma de estos números, será f l(e x + ye) (la situación real puede ser
más complicada). En la construcción ‘más favorable’ de la ‘suma de máquina’, tendrı́amos, pues,

x ⊕ y = f l(f l(x) + f l(y)),

añadiendo otro error al que puede achacarse exclusivamente al redondeo de x e y (y suponiendo


que no haya desbordamiento).
Similarmente, la ‘mejor versión’ en este planteamiento de las restantes operaciones aritméti-
cas(**) , corresponderı́a a

x y = f l(f l(x) − f l(y))


x y = f l(f l(x) · f l(y))
x y = f l(f l(x)/ f l(y))

(Para que tengan sentido, se supone que todos los números que intervienen están en el rango de
F : es trivial dar ejemplos en los que x, y cumplen esta condición, mientras que x  y da overflow
o underflow para  = alguna de las operaciones anteriores.)
(**)
En la aritmética de punto flotante del estándar IEEE se estipula que, al menos para elementos de F , hh cada
operación debe ser efectuada como si produjese primero un resultado intermedio correcto en precisión infinita y con
rango no acotado, y luego se ajustase este resultado intermedio a la precisión destinada ii, de modo que finalmente
se obtenga la respuesta exacta correctamente redondeada.
164 CAPÍTULO 6. ARITMÉTICA DE PUNTO FLOTANTE.

Veamos algunos ejemplos de los errores que se originan al realizar estas operaciones. Con base
10 y precisión p = 5, tomamos

y = 5/7 f l(y) = 0.71428×100


u = 0.714251 f l(u) = 0.71425×100
v = 98765.9 f l(v) = 0.98765×105
w = 0.111111×10−4 f l(w) = 0.11111×10−4

Calculando, obtenemos:

Operación Resultado Error absoluto Error relativo


y u 0.30000 × 10 −4 0.472 × 10−5 0.136
(y u) w 0.27000 × 10 1 0.425 0.136
(y u) w 0.29629 × 10 1 0.466 0.136
u⊕v 0.98766 × 105 0.162 × 101 0.164 × 10−4
y w 0.64286 × 105 0.779 0.122×10−4

Se observa que el comportamiento es bastante desigual. Además, con estas nuevas operaciones
se pierden algunas de las buenı́simas propiedades algebraicas y estructurales de R. Comprobémoslo.
Siguiendo con base 10 y precisión p = 5, prescindiendo del 0 previo al punto por comodidad de
escritura, tomamos
x = 1000000 f l(x) = .10000 × 107
y = −1000000 f l(y) = −.10000 × 107
z=1 f l(z) = .10000 × 101

Calculando, resulta:

x+y x⊕y y+z y⊕z x+y+z (x ⊕ y) ⊕ z x ⊕ (y ⊕ z)


0 0
.00000 × 10 −999999 −.10000 × 10 7 1 .10000 × 10 (= 1) .00000 × 100 (= 0)
1

¡No hay asociatividad para la ‘suma flotante’ ⊕! Ni funciona tampoco la propiedad cancelativa: en
este mismo ejemplo,
y ⊕ z = y ⊕ 0 6=⇒ z = 0.

También podemos observar que para x = 3 × 107 , por ejemplo,

f l(1/x) = .33333 × 10−7 , x (1/x) = f l((.30000 × 108 )(.33333 × 10−7 )) = .99999,

mientras que si y = .33334 × 10−7 , z = .33335 × 10−7 ,

x y = y x = x z = z x = .10000 × 101 = 1.

Esto implica que tampoco el producto es asociativo: para estos valores,

z (x y) = z 1 = z 6= y = 1 y = (z x) y.

Además, x tiene dos inversos, y y z, ninguno de los cuales coincide, por cierto, con f l(1/x).
6.3. ARITMÉTICA ‘APROXIMADA’ 165

Comparando, en general, con las propiedades fundamentales de R, encontramos:


PROPIEDADES VALIDEZ
de cuerpo
Suma cerrada NO Puede haber underflow/overflow
Suma asociativa NO a veces (a ⊕ b) ⊕ c 6= a ⊕ (b ⊕ c)
Suma conmutativa SI siempre a ⊕ b = b ⊕ a
Elemento neutro SI siempre 0 ∈ F y a ⊕ 0 = 0 ⊕ a = a para todo a
Elemento opuesto SI siempre −a ∈ F y a ⊕ (−a) = (−a) ⊕ a = 0

Producto cerrado NO Puede haber underflow/overflow


Producto asociativo NO a veces (a b) c 6= a (b c)
Producto conmutativo SI siempre a b = b a
Elemento unidad SI siempre 1 ∈ F y 1 a = a 1 = a para todo a
Elemento inverso ?? ???

Distributiva NO a veces a (b ⊕ c) 6= (a b) ⊕ (a c)
de cuerpo ordenado
Reflexiva SI siempre a ≤ a
Simétrica SI siempre a ≤ b y b ≤ a implica a = b (a, b ∈ F )
Transitiva SI siempre a ≤ b, b ≤ c implica a ≤ c
Invariancia por traslación SI siempre a ≤ b implica a ⊕ c ≤ b ⊕ c
Invariancia por escalado SI siempre a ≤ b, 0 ≤ c implica a c ≤ b c
Completitud SI trivial: F es finito
Arquimediana SI trivial: F es acotado
Densidad NO F es finito
topológicas
Conexión NO todos los puntos son aislados
Revisemos ahora el funcionamiento de estas operaciones y el error cometido al tomarlas como
aproximaciones de las operaciones exactas.

Errores en sumas y restas


Estudiaremos solamente x ⊕ y y x y cuando x y y son elementos positivos del rango de F ,
porque todos los demás casos puede reducirse a éste teniendo en cuenta que f l(−x) = − f l(x),
x y = x ⊕ (−y), etc.
Proposición 6.3.4. Dados x, y ≥ f minN , tales que x ⊕ y ∈ F , si
f l(x) = x(1 + ρx ) (|ρx | < u),
f l(y) = y(1 + ρy ) (|ρy | < u),
se tiene
|(x + y) − (x ⊕ y)|
Er = < 2u + u2 ,
|x + y|
y ası́
x ⊕ y = (x + y)(1 + ρ), |ρ| < 2u + u2 ≈ M .
Demostración. Si z = f l(x) + f l(y) = x + y + xρx + yρy , x ⊕ y = f l(z) = z(1 + ρz ) = z + zρz
(|ρz | < u), será
x ⊕ y − (x + y) = x ⊕ y − z + z − (x + y) = zρz + xρx + yρy
= (x + y + xρx + yρy )ρz + xρx + yρy = (x + y)ρz + (xρx + yρy )(ρz + 1),
166 CAPÍTULO 6. ARITMÉTICA DE PUNTO FLOTANTE.

de donde

|(x ⊕ y) − (x + y)| xρx + yρy
Er = = ρz + (1 + ρz ) ≤ |ρz | + máx{|ρx |, |ρy |}(1 + |ρz |)
|x + y| x+y
< u + u(1 + u) = 2u + u2 ≈ 2u = M (u2 ≈ 0).

Esta es una estimación ‘pesimista’ del error, que puede mejorarse en circunstancias especiales.
Ası́, cuando x, y ∈ FN ( ⇐⇒ ρx = ρy = 0), Er = |ρz | < u; o si ρz = 0 (i.e., si f l(x) + f l(y) ∈ FN ),
Er ≤ máx{|ρx |, |ρy |} < u. Sin embargo, en otras circunstancias, el error puede superar a u.
Ejemplos.
1.- Para β = 10, p = 5, x = y = 1.00005, Er = .4999750012 × 10−4 ≈ u.
2.- Para β = 2, p = 3 (cf. ‘minimodelo’), x ligeramente mayor que 1.125 (con lo cual f l(x) = 1.25),
y ligeramente mayor que 4.5 (con lo cual f l(y) = 5), x + y ‘ligeramente mayor’ que 5.625, x ⊕ y = 7,
queda Er ≈ 0.244 ≈ 2u = M = 0.25

En la sustracción habrá que imponer restricciones adicionales, si hemos de evitar cancelaciones


catastróficas. Si x, y ∈ F , obviamente sólo hay error de redondeo y el error relativo de x y
estará acotado por u. Pero, en general, el resultado puede presentar un error relativo desmesurada-
mente grande: si a = f max = β emax (1 − β −p ), d = β emax −p es la distancia de a al anterior elemento
a+b
de F , b = a − d es tal elemento, c = el punto medio del segmento[b, a],
2
b —————————————— a
y c x
h h
tomando cualquier h > 0 menor que d/2, para x = c + , y = c − , serı́a (ver figura)
2 2
x − y = h, f l(x) = a, f l(y) = b, x y = f l(d) = d,

y por tanto
|(x − y) − (x y)| |h − d| d
Er = = = − 1,
|x − y| |h| h
que tiende a +∞ cuando h tiende a 0+ (el argumento puede trasladarse a otros intervalos de F ).
Vemos ası́ que la cancelación catastrófica es insalvable cuando se manejan datos aproximados,
por ejemplo datos que sean resultados redondeados (aproximados) de una operación anterior.
Nótese que incluso si x e y (distintos) son ‘suficientemente próximos’ y están ‘adecuadamente
situados’ para que f l(x) = f l(y), con lo cual x y = 0, el error relativo alcanza un desastroso
100 %: Er = 1 en este caso.
En general, cuando (x + y)/(|x − y|) no es ‘demasiado grande’, hay cancelación benigna, que
no aumenta exageradamente el error previo, puesto que, conservando la notación anterior y proce-
diendo de la forma acostumbrada,

x y xρx − yρy x+y
Er = − 1 = ρz +
(1 + ρz ) ≤ |ρz | + máx{|ρx |, |ρy |} (1 + |ρz |)
x−y x−y |x − y|
x+y x+y
< u+ u(1 + u) = u + (u + u2 ).
|x − y| |x − y|

Errores en productos y cocientes


La notación en punto flotante está mejor adaptada al producto que a la suma, en cierto sentido,
y jugando con los exponentes es más fácil evitar el desbordamiento. Pero hemos de pensar que
incluso partiendo de números de F su producto exacto tiene ‘demasiadas cifras’, y casi siempre
será necesario el redondeo. Analicemos el tamaño del error relativo que introduce la operación .
6.3. ARITMÉTICA ‘APROXIMADA’ 167

Proposición 6.3.5. Dados números reales no nulos x e y, tales que x y ∈ F , si

f l(x) = x(1 + ρx ) (|ρx | < u),


f l(y) = y(1 + ρy ) (|ρy | < u),

se tiene
|(x y) − (x y)|
Er = < 3u + 3u2 + u3 ,
|x y|
o sea
x y = (x y)(1 + ρ), |ρ| < 3u + 3u2 + u3 ≈ 3u.

Demostración. Poniendo z = f l(x) f l(y) = xy(1 + ρx )(1 + ρy ), x y = f l(z) = z(1 + ρz ) (|ρz | < u),
queda x y = xy(1 + ρx )(1 + ρy )(1 + ρz ), y ası́

|(x y) − (x y)|
Er = = |(1 + ρx )(1 + ρy )(1 + ρz ) − 1|
|x y|
= |ρx + ρy + ρz + ρx ρy + ρx ρz + ρy ρz + ρx ρy ρz |
< 3u + 3u2 + u3 ≈ 3u,

suponiendo 3u2 + u3 ≈ 0.

Análogamente, para la operación :

Proposición 6.3.6. Dados números reales x e y, tales que x y ∈ F , si

f l(x) = x(1 + ρx ) (|ρx | < u),


f l(y) = y(1 + ρy ) (|ρy | < u),

se tiene
|(x/y) − (x y)| 3u + u2
Er = < ,
|x/y| 1−u
o sea
3u + u2
x y = (x/y)(1 + ρ), |ρ| < ≈ 3u.
1−u

1 + ρx
Demostración. Poniendo z = f l(x)/ f l(y) = (x/y) , x y = f l(z) = z(1 + ρz ) (|ρz | < u),
1 + ρy
(1 + ρx )(1 + ρz )
queda x y = (x/y) , y ası́, usando que |1 + ρy | ≥ 1 − |ρy | > 1 − u > 0,
1 + ρy

|(x y) − (x/y)| (1 + ρx )(1 + ρz )
Er = = − 1
|x/y| 1 + ρy

(1 + ρx )(1 + ρz ) − (1 + ρy ) ρx + ρz − ρy + ρx ρz
= =
1 + ρy 1 + ρy
3u + u2
< ≈ 3u
1−u

suponiendo 4u2 /(1 − u) ≈ 0.


168 CAPÍTULO 6. ARITMÉTICA DE PUNTO FLOTANTE.

6.4. Estrategias de cálculo para reducir los errores de redondeo


La computación en punto flotante es inexacta por naturaleza, y no es difı́cil
utilizarla mal de modo que las respuestas computadas consistan casi enteramente
en ‘ruido’.
Uno de los principales problemas del análisis numérico es determinar cómo
serán de exactos los resultados de ciertos métodos numéricos; aquı́ está involu-
crado un problema de ‘salto de credibilidad’: no sabemos cuántas respuestas del
ordenador creer.
Los usuarios novatos del ordenador resuelven este problema confiando implı́ci-
tamente en el ordenador como autoridad infalible; tienden a creer que todos los
dı́gitos de una respuesta impresa son significativos.
Los usuarios desilusionados del ordenador mantienen justamente la actitud
opuesta, constantemente temen que sus respuestas carezcan casi de sentido.
(D. E. Knuth)
El análisis elemental de las operaciones que acabamos de efectuar muestra que es necesario un
estudio previo a cualquier proceso de cálculo con ordenador, para evitar una acumulación exage-
rada de errores, especialmente cuando haya que realizar operaciones consecutivas (a veces en gran
número) con el ordenador. Hay tarea para personas con ingenio hasta en los casos más simples,
como señala J. M. Muller en su artı́culo Ordenadores en busca de aritmética [MC1, pp. 92–99], al-
tamente recomendable: hh . . . Si el lector deduce que no hay que depositar jamás una confianza ciega
en los resultados facilitados por un ordenador y que la implantación rápida de una operación tan
elemental como la suma compete todavı́a al campo de la investigación, me daré por absolutamente
satisfecho. ii
Los ejemplos siguientes ilustran algunas de las dificultades y muestran caminos para paliar sus
consecuencias.

6.4.1. Reformulación del problema: Ejemplos


Cálculo de una diferencia de cuadrados

Consideremos la evaluación de x2 − y 2 cuando x = 1.21, y = 1.20 en un sistema con β = 10 y


p = 3. Resulta

x y x2 y2 x2 − y 2 Error relativo
Valor exacto 1.21 1.20 1.4641 1.4400 0.0241
Redondeo 0.121 × 10 0.120 × 10 0.146 0.144 0.200 × 10−1 0, 170 . . . ≈ 34u

1 −2
ya que en este caso u = 10 = 0.005.
2
Pero x2 − y 2 = (x − y)(x + y). ¿Qué sucede si rehacemos el cálculo usando la segunda expresión?

x y x−y x+y (x − y)(x + y) Error relativo


Valor exacto 1.21 1.20 0.01 2.41 0.0241
Redondeo 0.121 × 10 0.120 × 10 0.1 × 10−1 0.241 × 10 0.241 × 10−1 0

¡El resultado es exacto! Todas las cantidades x, y, x + y, x − y, (x + y)(x − y) son ‘números de


máquina’ y no hemos introducido ningún error, mientras que al calcular x x ha sido necesario el
redondeo y x x − y y ha originado una cancelación con los dos últimos dı́gitos falsos. Si bien
el ejemplo es un poco ‘tramposo’, incluso cuando x e y deban redondearse la segunda expresión es
preferible para el cálculo, puesto que si f l(x) y f l(y) tienen varias cifras iniciales coincidentes, sus
cuadrados tendrán iguales doble número de dı́gitos, y la cancelación es ‘aún más catastrófica’.
6.4. ESTRATEGIAS DE CÁLCULO 169

Raı́ces de una ecuación de segundo grado


Para resolver una ecuación de segundo grado con raı́ces reales

ax2 + bx + c = 0,

a, b, c ∈ R, a 6= 0, b2 − 4ac ≥ 0, disponemos de las conocidı́simas fórmulas


√ √
−b + b2 − 4ac −b − b2 − 4ac
x1 = , x2 = .
2a 2a
¿Qué problemas podrá haber en el cálculo efectivo con unas fórmulas tan familiares? Comenzando
por el discriminante b2 − 4ac, vemos la amenaza de una ‘cancelación catastrófica’√cuando b√
2 y 4ac

tengan valores parecidos. ¿La salvaremos como antes, reescribiendo b2 −4ac = (b− 4ac)(b+ 4ac)?
Los resultados no son muy halagüeños. Incluso ignorando el problema del cálculo de una raı́z
cuadrada aproximada, los resultados en ambos casos pueden ser muy mediocres. Siguiendo con
β = 10, p = 3 como antes, veamos qué sucede en el siguiente ejemplo:

a b c b2 4ac b2 − 4ac Error relativo


V.E. 1.22 3.34 2.28 11.1556 11.1264 0.0292
P.F. 0.122 × 10 0.334 × 10 0.228 × 10 0.112 × 102 0.111 × 102 0.100 485u

(en la primera fila están los valores exactos, en la segunda los resultados en punto flotante). Análo-
gamente

4ac S ≈ 4ac b−S b+S (b − S)(b + S)
V.E. 11.1264 3.335625878 0.004374122 6.675625878 0.02920000202
P.F. 0.111 × 102 0.333 × 10 0.1 × 10−1 0.667 × 10 0.667 × 10−1

¡No coincide ni la primera cifra significativa! (aunque al menos ha disminuido el error a 257u,
aproximadamente).
Queda√otra cancelación catastrófica al acecho. ¿Qué sucede si b2 es mucho mayor que 4ac?
Entonces b2 − 4ac ≈ |b|, con lo cual, si b > 0, podemos tener dificultades con la fórmula para x1 ,
y si b < 0, con la fórmula para x2 .
Afortunadamente, este √ problema es más sencillo de solventar. Supongamos, por ejemplo, que
b > 0. Entonces D = b + b2 − 4ac es una suma de cantidades positivas, con lo que el error no
superará al error de los datos en mucho más de 2u, y pasaremos a calcular x2 = −D/2a. Para el
cálculo de x1 disponemos de otras fórmulas más adecuadas:
c −2c
x1 = = √ .
ax2 b + b2 − 4ac
Cuando b < 0, basta usar la fórmula tradicional para x1 y hallar x2 a partir de
c 2c
x2 = = √ .
ax1 −b + b2 − 4ac

Sumas en cadena
Los errores en una sola operación (no ‘catastrófica’) en punto flotante se amplifican según se
van encadenando más y más operaciones, si bien el aumento es en general tan pequeño que hace
falta un número muy grande de operaciones inexactas para llegar a errores visibles. No obstante,
puesto que no hay asociatividad, incluso en sumas de varios sumandos positivos no es indiferente
la manera de llevar a cabo las operaciones: el orden y la manera de agrupar puede inicidir en que
el error final sea más grande o más pequeño.
170 CAPÍTULO 6. ARITMÉTICA DE PUNTO FLOTANTE.

Veamos una ilustración clara (muy simplificada). Con precisión p = 3 y base 10, y sumandos
100, 0.9, 0.9, 0.9, podemos proceder ası́:
(((100 ⊕ 0.9) ⊕ 0.9) ⊕ 0.9 = (100 ⊕ 0.9) ⊕ 0.9 = 100 ⊕ 0.9 = 100
(100 ⊕ 0.9) ⊕ (0.9 ⊕ 0.9) = 100 ⊕ 1.8 = 102
((0.9 ⊕ 0.9) ⊕ 0.9) ⊕ 100 = (1.8 ⊕ 0.9) ⊕ 100 = 2.7 ⊕ 100 = 103
valor exacto: 100 + 0.9 + 0.9 + 0.9 = 100.9 + 0.9 + 0.9 = 101.8 + 0.9 = 102.7
En las evaluaciones primera y tercera hemos procedido recurrentemente: en cada etapa sumamos
la suma parcial previa con el sumando siguiente. En la segunda hemos emparejado los sumandos,
reduciendo el número de operaciones.
Observamos que el primer procedimiento da mayor error, el segundo es ‘menos costoso’, y que
el tercero da el valor redondeado del resultado exacto, el mejor valor posible.
La causa del éxito final es aquı́ muy aparente: al sumar números de tamaño muy distinto, hay
que tener precaución de que ‘el pez grande no se coma al chico’, como sucede en la evaluación
100 ⊕ 0.9 = 100. Parece conveniente ordenar los sumandos de menor a mayor para homogeneizar
tamaños en la medida de lo posible, permitiendo ası́ que la adición de los sumandos pequeños
lleve a un valor que no desaparezca cuando lleguen los sumandos ‘grandes’. (Esta es una pequeña
muestra de las dificultades que tienen que superar los programadores incluso en situaciones que no
parecen a priori tan complicadas). Además, los dos primeros sumandos está involucrados en n − 1
operaciones y el último en una sóla, con lo que el error absoluto final es menor.
Por otra parte, cuando la rapidez de cálculo es importante, la opción del emparejamiento parece
ventajosa. Además, al disminuir el número de operaciones efecuadas, cabe suponer que disminuirá el
crecimiento de los errores (con datos de magnitudes similares, al menos). Nótese que en una suma
de n = 2k sumandos, cada sumando estarı́a ahora involucrado en k = log2 (n) operaciones, lo que
lleva a un error absoluto del orden de n log2 (n) veces el máximo de los errores de los sumandos,
ver [1] p. 15.
Sobre las dificultades de la implementación de algoritmos eficaces en la adición de muchos
sumandos, ver más detalles en [3], Floating point summation, y [4], ası́ cómo en el artı́culo de J. P.
Muller ya citado [MC1]. En [Brz], pp. 10–11, hay un ejemplo de ‘corrección de la aritmética’ para
efectuar sumas.

Costo operativo y eficiencia: Evaluación de polinomios


hh Un mismo problema suele poder resolverse por diversos métodos numéricos. ¿Cómo decidirse
por uno? El tamaño de los errores es ciertamente un criterio útil: podrı́amos elegir el método
que diese menores errores. No obstante hay un criterio mejor: nos quedaremos con el método
que, dando errores dentro de unos lı́mites predeterminados, necesite el menor trabajo. Esta
preocupación por estudiar la eficiencia de los diversos métodos es un rasgo distintivo del
análisis numérico. La eficiencia depende tanto del tamaño de los errores como del costo ope-
rativo del método. Aquellas tareas para las que, en un momento histórico dado, no se dispone
de un método aceptablemente eficiente no se pueden llevar a cabo.
Ejemplo. Método de Horner (1744–1834) para evaluar polinomios. Supongamos que desea-
mos hallar el valor de un polinomio cuártico a0 + a1 x + a2 x2 + a3 x3 + a4 x4 (los ai son números
reales conocidos) para un valor dado de x0 de la variable x. El método más ingenuo halla
sucesivamente los productos x20 = x0 ∗ x0 , x30 = x20 ∗ x0 , x40 = x30 ∗ x0 con un coste operativo de
tres multiplicaciones, luego los productos ai ∗ xi0 (otras cuatro multiplicaciones), y finalmente
hace las cuatro sumas/restas. (Que sean efectivamente sumas o restas depende del signo con-
creto que vayan teniendo los sumandos; para sumar 48 y -27 hay que restar.) En total cuatro
sumas/restas y siete multiplicaciones. Sin embargo haciendo las operaciones en orden
 h i
a0 + x0 ∗ a1 + x0 ∗ a2 + x0 ∗ [a3 + x0 ∗ a4 ] (1.6)
6.4. ESTRATEGIAS DE CÁLCULO 171

sólo son precisas cuatro sumas/restas y cuatro multiplicaciones. Para un polinomio de grado
N el método ingenuo requiere N sumas/restas y 2N − 1 multiplicaciones, el método (1.6)
llamado de Horner o de multiplicación encajada usa N sumas/restas y N multiplicaciones.
Como ninguno de los dos métodos genera errores —excepto los derivados de usar mantisa de
longitud finita— el de Horner, que tiene menor costo operativo es más eficiente. Si sólo se va
a evaluar una vez un polinomio y se usa un ordenador no hay diferencia entre usar uno u otro
método. Si, como a veces ocurre, dentro de un programa grande hay que evaluar millones de
veces, usar uno u otro método puede significar tener que esperar el resultado dos horas o sólo
una. Si calculamos con papel y lápiz en un examen usar un mal método puede implicar no
tener el resultado a tiempo. ii
([S-S], pp. 13 y 14.)

6.4.2. Refinamientos en la representación y en la precisión


Dos recursos que permiten mejorar la exactitud de los cálculos son el uso de números desnorma-
lizados y de precisión múltiple.

Números desnormalizados
Para paliar los problemas que ocasiona el redondeo de números ‘cercanos al cero’, se amplı́a
a veces el sistema F de números en punto flotante incluyendo los números desnormalizados
(también llamados subnormales en inglés). Tanto los estándares IEEE 754 y 854 como LIA-1 y unas
cuantas implementaciones ‘no-IEEE’ incluyen números desnormalizados. Siguiendo con la notación
habitual, un número en punto flotante desnormalizado es un número real de la forma

y = ±m × β emin −p

donde m es un entero del intervalo [1, β p−1 − 1]. La fracción correspondiente g queda en el intervalo
[β −p , 1/β −β −p ]; su dı́gito más significativo es 0, y su exponente emin . Los números desnormalizados
rellenan parcialmente los “huecos de subdesbordamiento” que se producen entre ±β emin −1 y 0.
Tomados juntos, componen el conjunto que en LIA-1 se denota FD . La admisión o no de números
desnormalizados se controla mediante el parámetro booleano denorm, que toma el valor true o false
según se permitan números desnormalizados o no. En el primer caso, se redefine F = {0}∪FN ∪FD ;
en el segundo, se mantiene la definición previa.
El mı́nimo número positivo en punto flotante desnormalizado es β emin −p = f minN · εM . Los
valores de FD están igualmente espaciados, con el mismo espacio que el de los números de F entre
β emin −1 y β emin , que es β emin −p = f minN · εM . Volviendo al ejemplo con β = 2, p = 3, emin = −1,
emax = 3, la representación gráfica de F con los números desnormalizados incluidos (2−4 = 0.0625,
2 × 2−4 = 0.125, 3 × 2−4 = 0.1875) serı́a

0.0625

0 0.25 0.5 1.0 2.0 3.0 4.0 5.0 6.0 7.0

Los valores de FD tienen un máximo absoluto de error de representación de β emin −p . Sin embargo,
como los números desnormalizados tienen menos de p dı́gitos de precisión, el error relativo de
representación puede variar ampliamente. Este error relativo va desde M = β 1−p en el extremo
superior de FD hasta 1 en el extremo inferior de FD . Cerca de 0, el error relativo crece sin tope.
Siempre que una adición o sustracción de números de F produce un resultado en FD , dicho
resultado es exacto, el error relativo es cero. Un ejemplo trivial: en el modelo anterior,
1 0.875 = 0.125 con números desnormalizados incluidos, 1 0.875 = 0 en caso contrario.
172 CAPÍTULO 6. ARITMÉTICA DE PUNTO FLOTANTE.

hh Incluso para una “sustracción efectiva” no se pierde exactitud, porque la disminución del

número de dı́gitos significativos es exactamente la misma que el número de dı́gitos cancelados


en la sustracción. Para la multiplicación, división, escalado, y algunas conversiones, los dı́gitos
significativos (y por tanto la exactitud) pueden perderse si el resultado está en FD . ii ([LIA-1],
p. 33.)
La ventaja fundamental que proporcionan los números desnormalizados es la siguiente:

Incluyendo en F los números desnormalizados, si x, y ∈ F , para que x y = 0 es


necesario y suficiente que x = y.

Obviamente, esto no es cierto cuando F no contiene a FD .

Mayor precisión
Mientras que habitualmente es posible disponer de dı́gitos extra en una computación (aumen-
tando la precisión p, pasando por ejemplo de precisión simple a doble precisión), esto siempre es
costoso en tiempo y en espacio. Además, aunque intuitivamente al aumentar la precisión parece
lógico esperar que la exactitud aumente, esto no siempre es ası́. En muchos casos el error estimado
de un algoritmo es efectivamente proporcional a la precisión, como hemos visto en casi todas las
operaciones aritméticas; pero como las cotas del error no siempre se alcanzan, no hay garantı́a de
que un resultado concreto calculado con precisión p sea menos exacto que el calculado con preci-
sión p + q mayor (v. [Hig], pp. 19–20). No obstante, es una técnica frecuente en la estimación de la
exactitud recalcular (al menos en la ‘etapa de ensayo’ de un algoritmo) aumentando la precisión y
observar cuántos dı́gitos de la respuesta ası́ obtenida coinciden con la original.

Dı́gitos de seguridad (Guard digits)


Cuando se entra en los pormenores de la implementación efectiva de las operaciones en punto
flotante, las complicaciones aumentan tremendamente. Por ejemplo, contra lo que cabrı́a suponer,
la suma es mucho más complicada que la multiplicación y la división. Para empezar, no se conoce a
priori el exponente del resultado, y hay que proceder a redondeos y reescalados para determinarlos;
básicamente, el ordenador procede como nosotros, reescalando las mantisas para poder ‘alinearlas’y
sumarlas a continuación; el resultado puede tener una mantisa que comience por 0 (perdiendo
la normalización) y/o más de p cifras. Se ve la necesidad de añadir cifras extras en las etapas
intermedias para disminuir errores. Ası́ se describe el proceso en [Brz], pp. 33 y ss.:

hh Cada operación aritmética efectuada con el ordenador está igualmente manchada por un error
de afectación. Es decir, que se tiene:

|(a  b) − f l(a  b)| ≤ 5|(a  b)|10−p ,

donde  designa una de las cuatro operaciones aritméticas (suma, resta, multiplicación, divi-
sión). Este resultado da la diferencia máxima que puede existir entre el resultado exacto de
una operación aritmética y el resultado encontrado por el ordenador. Ası́, para un ordenador
que trabaje con mantisas de ocho dı́gitos, el error relativo es inferior a 5 · 10−8 . Se puede
pensar que este es un error muy débil, despreciable incluso, y sin embargo vamos a ver que
sus consecuencias puede ser catastróficas (no siempre, afortunadamente para nosotros). Para
comprender bien lo que pasa, hay que saber que las operaciones aritméticas se efectúan en
memorias especiales, el acumulador , cuyas mantisas comportan al menos p + 1 dı́gitos.
Se completan los operandos con ceros a la derecha, se efectúa la operación en el acumula-
dor, y después se reenvı́a el resultado a la memoria redondeándolo. Este error de redondeo
es preponderante sobre el que se hace en el acumulador, lo que explica que cada operación
6.4. ESTRATEGIAS DE CÁLCULO 173

esté manchada solamente con un error de afectación. Demos un ejemplo para ilustrar nuestro
propósito: calculemos a = b × c

memoria acumulador
b 0.842345 → 0.8423450
c 0.516287 · 10−2 → 0.5162870 · 10−2
a 0.434892 · 10−2 ← 0.4348917 · 10−2

Para una suma, tras la transferencia de los operandos al acumulador, el ordenador comienza
por modificar el exponente del operando menor (en valor absoluto) para que tenga el mismo
valor que el de el más grande; de hecho, el ordenador alinea como nosotros las cifras de las
potencias idénticas de 10, unas sobre otras:

memoria acumulador
b 0.842345 → 0.8423450
c 0.516287 · 10−2 → 0.0051629
a 0.847508 ← 0.8475079

Y lo mismo, evidentemente, para una sustracción. ii

Extrañamente, hay fabricantes (como cray) que construyen algunas de sus máquinas sin au-
mentar los bits disponibles para los datos intermedios, limitándose a recortar éstos al tamaño
correspondiente a la precisión, lo que puede suponer un error relativo añadido hasta de β − 1, es
decir, del 100 % cuando β = 2 y del 900 % cuando β = 10. En efecto:
[Gold] Con sumandos en F :
Proposición 6.4.1. Usando un formato de punto flotante con parámetros β y p, y computando
diferencias usando p dı́gitos, el error relativo del resultado puede llegar a ser β − 1.
1 α α
Demostración. Para x = = 0.10 · · · 0 × 100 , α = β − 1, y = 2 + · · · + p+1 = 0.αα · · · α × 10−1
β β β
resulta x − y = β −p−1 , x y = β −p , Er = β − 1.

En cambio:
Proposición 6.4.2. Si x e y son números en punto flotante en un formato con parámetros β y
p, y si la sustracción se hace con p + 1 dı́gitos (i.e., con un dı́gito ‘de seguridad’) entonces el error
relativo de redondeo del resultado es menor que 2, donde  es el épsilon de la máquina.
(La adición está incluida en el teorema anterior ya que x e y pueden ser positivos o negativos.)
Para máquinas que trabajan sin dı́gitos extras hay muchos algoritmos que dejan de funcionar
correctamente, como lo hacen en caso contrario. Existen además resultados como el siguiente,
válidos cuando se opera con digitos ‘de seguridad’ (v. [Hig], p. 50):
Teorema 6.4.3 (Sterbenz). Sean x e y números en punto flotante con y/2 ≤ x ≤ 2y. Si la
sustracción se realiza con un dı́gito de seguridad, entonces x − y es computado exactamente (supo-
niendo que |x − y| ≥ f minN .)

6.4.3. Buscar algoritmos estables


hh Se puede oir a veces el siguiente argumento ingenuo:

¿Por qúe perder el tiempo con todos esos pequeños errores de punto flotante? Incluso
IEEE en precisión simple nos da 7 dı́gitos significativos por lo menos, y seguro que
esto es suficiente para la mayorı́a de las aplicaciones, y además está la precisión
doble, y seguramente esta tiene que bastar.
174 CAPÍTULO 6. ARITMÉTICA DE PUNTO FLOTANTE.

Un contraargumento es que los errores pueden propagarse y crecer rápidamente, y como


son inevitables “pequeños” errores de redondeo, existe siempre el peligro de que nuestras
computaciones produzcan basura.

Los problemas que tienen una tendencia inherente a la “amplificación de errores” se llaman
mal condicionados; requieren usar paquetes de aritmética multiprecisión y un estrecho control
de errores.
Un ejemplo clásico de problema mal condicionado es cierto polinomio de grado 20; tras multi-
plicar uno de sus coeficientes (el que multiplica a la potencia 19) por un factor 1.0000000005,
la localización de la mayor parte de las raı́ces cambia completamente.
En el anterior ejemplo, simplemente entrar los datos (los coeficientes del polinomio) en el
ordenador puede ser suficiente para estropear todo el cálculo, por cuanto la conversión de
la representación decimal externa a la interna, binaria, puede introducir errores demasiado
grandes.
Un problema bien condicionado puede tener un algoritmo que amplifique los errores: tal
algoritmo se dice que es inestable. En términos sencillos, un algoritmo inestable transforma
un “pequeño” cambio en las cantidades de entrada en un cambio “grande” en las cantidades
de salida. ii
([4], § 4-7.)

La estabilidad de un algoritmo es una de sus propiedades más importantes, pero no es sencilla


de definir con precisión. En [1], p. 13, se describe ası́:
hh Supongamos que g(x) es la solución exacta de un problema con inputs x, y g ∗ (x) es el valor

calculado por un algoritmo particular. La solución calculada g ∗ (x) puede ser pensada a menudo
como la solución exacta de un problema perturbado con inputs x e, esto es, g ∗ (x) = g(e
x). Si siempre
hay un x ∗
e cercano a x tal que g (x) = g(e x), entonces el algoritmo se dice estable . Si no, el algoritmo
es inestable . ii
Nótese que la estabilidad es una propiedad relativa al algoritmo empleado para resolver un pro-
blema, mientras que el condicionamiento se refiere al propio problema: un problema de computación
se dice mal condicionado si pequeñas perturbaciones en el problema producen perturbaciones
grandes en la solución exacta. Además del ejemplo anteriormente señalado sobre cálculo de raı́ces
de un polinomio, otro problema tı́pico mal condicionado es el de la resolución de un sistema lineal
cuando la matriz de los coeficientes es casi singular: pequeños cambios en dichos coeficientes o en los
términos independientes pueden llevar a soluciones exactas muy diferentes; como al almacenar los
datos en la máquina se producen errores de redondeo, es sustancialmente imposible dar soluciones
precisas a los problemas mal condicionados con cualquier algoritmo que se utilice. Por contra, a
veces un algoritmo inestable puede modificarse convenientemente para lograr uno estable.

Estos son los consejos a los programadores de un experto ([Hig], pp. 30 y 31):

hh Diseño de algoritmos estables


No hay una receta simple para diseñar algoritmos numéricamente estables. Mientras que esto
ayuda a mantener a los analistas numéricos en el negocio (¡incluso probando que los algoritmos de
los demás son inestables!) no es una buena noticia para los cientı́ficos computacionales en general.
El mejor consejo es ser consciente de la necesidad de la estabillidad numérica cuando se diseña un
algoritmo y no concentrarse exclusivamente en otros aspectos, tales como el costo computacional
y la paralelizabilidad.
Se pueden dar unas pocas pautas.
1. Intentar evitar restar cantidades contaminadas de error (aunque tales restas pueden ser ine-
vitables).
6.4. ESTRATEGIAS DE CÁLCULO 175

2. Minimizar el tamaño de las cantidades intermedias en relación a la solución final. La razón


es que si las cantidades intermedias son muy grandes, entonces la respuesta final puede ser
el resultado de cancelación sustractiva dañina. Mirándolo de otra manera, los números in-
termedios grandes arrollan los datos iniciales, con el resultado de pérdida de información.
El ejemplo clásico de algoritmo en el que esta consideración es importante es la eliminación
gaussiana, pero un ejemplo aún más simple es la sumación recursiva.

3. Buscar diferentes formulaciones de una computación que sean matemáticamente pero no


numéricamente equivalentes. Por ejemplo, el método clásico de Gram-Schmidt es inestable,
pero una modificación trivial produce el método de Gram-Schmidt estable modificado (MGS).
Hay dos maneras de usar el método MGS para resolver un problema de mı́nimos cuadrados,
el más obvio de los cuales es inestable.

4. Es ventajoso expresar la actualización de fórmulas como

valor nuevo = valor viejo + pequeña corrección

si la pequeña corrección puede calcularse con muchas cifras significativas correctas. Los méto-
dos numéricos a menudo están expresados de manera natural en esta forma; los ejemplos
incluyen métodos para resolver ecuaciones diferenciales ordinarias, donde la corrección es
proporcional al tamaño de paso, y el método de Newton para resolver un sistema no lineal.
Un ejemplo clásico del uso de esta estrategia de actualización es el refinamiento iterativo
para mejorar la solución calculada de un sistema lineal Ax = b, en el que calculando resi-
duos r = b − Ay en precisión extendida y resolviendo ecuaciones actualizadas que tienen los
residuos como términos independientes es posible calcular una solución con un alto grado de
exactitud. Para otro ejemplo (en el que la corrección no es necesariamente pequeña), ver el
Problema . . .

5. Usar sólo transformaciones bien condicionadas del problema. En cálculos matriciales, esto
viene a ser multiplicar por matrices ortogonales donde sea posible, en vez de no ortogonales,
y posiblemente, matrices mal condicionadas. Ver §6.2 para una explicación simple de este
consejo en términos de normas.

6. Tomar precauciones para evitar desbordamientos innecesarios.

Concerniente al segundo punto, una buena recomendación es mirar los números generados
durante una computación. Esto era práctica común en los primeros tiempos del cálculo electrónico.
¡En algunas máquinas era inevitable, porque los contenidos almacenados se mostraban como luces o
monitores! Wilkinson ganó en penetración sobre la estabilidad numérica inspeccionando el progreso
de un algoritmo, y alterando a veces su curso (para un proceso iterativo con parámetros) . . . ii

hh Concepciones equivocadas
Algunos mitos y concepciones equivocadas comunes han sido señalados en este capı́tulo (ninguno
de ellos por vez primera—ver notas y referencias). Los destacamos en la siguiente lista.

1. La cancelación en la sustracción de dos números casi iguales es siempre una mala cosa.

2. Los errores de redondeo pueden cargarse una computación sólo si se acumulan un vasto
número de ellos.

3. Una computación corta libre de cancelación y desbordamiento tiene que ser exacta.

4. Aumentar la precisión con la que se efectúa una computación aumenta la exactitud de la


respuesta.
176 CAPÍTULO 6. ARITMÉTICA DE PUNTO FLOTANTE.

5. La respuesta final calculada a partir de un algoritmo no puede ser más exacta que ninguna
de las cantidades intermedias, esto es, los errores no pueden cancelarse.

6. Los errores de redondeo sólo pueden estorbar, no ayudar, al éxito de un cálculo. ii

De marcado carácter práctico son también las recomendaciones y consejos que se encuentran a
lo largo del manual [4], dirigidas especı́ficamente a los usuarios de FORTRAN.

6.4.4. Compensaciones estadı́sticas


Hemos buscado hasta aquı́ las situaciones más desfavorables, para poner de manifiesto los pro-
blemas que puede originar la computación con ordenadores. hh Afortunadamente, en numerosos casos
prácticos, los errores se compensan de una operación a otra. ii ([Brz]) Suele hacerse la hipótesis
de que los errores relativos en cada operación aritmética en punto flotante se distribuyen ‘uni-
formemente’ desde el punto de vista estadı́stico en el intervalo (−M , M ), y que los errores son
independientes, lo que lleva a una distribución normal que sugiere un error tı́pico en N operaciones
de tamaño N 1/2 M —la desviación estándar—, muy inferior al tamaño N 2 M de las estimaciones
‘más pesimistas’. Sin embargo, los errores no tienden a ser independientes, y la estimación N 1/2 M
es, en general, demasiado ‘optimista’.
En todo caso, los siguientes párrafos parecen dejar las cosas en el punto justo:
[Hig], p. 16: hh Desde que se desarrollaron las primeras computadoras electrónicas en los 1940s, se
ha hecho a menudo comentarios del tipo siguiente: “La enorme velocidad de las máquinas actuales
significa que en un problema tı́pico se efectúan muchos millones de operaciones en punto flotante.
Esto significa a su vez que los errores de redondeo pueden acumularse potencialmente de manera
desatrosa”. Este sentimiento es cierto, pero engañoso. Las más de las veces, la inestabilidad no
está causada por la acumulación de millones de errores de redondeo, sino por el crecimiento insidioso
de tan sólo unos pocos errores de redondeo. ii
[Hig], pp. 21–22: hh No es inusual que los errores de redondeo se cancelen en algoritmos estables,
con el resultado de que la respuesta final computada es mucho más exacta que las cantidades
intermedias. Este fenómeno no es apreciado universalmente, quizás porque tendemos a mirar los
números intermedios en un algoritmo sólo cuando algo va mal, no cuando la respuesta computada
es satisfactoria. ii
[Hig], p. 29: hh Los errores de redondeo, y su efecto acumulado en una computación, no son alea-
torios. Este hecho subyace en el éxito de muchas computaciones, [· · · ] Aquı́ daremos simplemente
un ejemplo numérico revelador (debido a W. Kahan).
Defı́nase la función racional
622 − x(751 − x(324 − x(59 − 4x)))
r(x) = ,
112 − x(151 − x(72 − x(14 − x)))

que está expresada en una forma que corresponde a la evaluación de los polinomios cuárticos
del numerador y el denominador mediante la regla de Horner. Hemos calculado r(x) mediante la
regla de Horner en aritmética de doble precisión para 361 números en punto flotante consecutivos
comenzando con a = 1.606, o sea x = a + (k − 1)2−52 , k = 1 : 361; la función r(x) es virtualmente
constante en este intervalo. La figura 1.6 dibuja los valores computados de la función junto con
una aproximación mucho más exacta a r(x) (calculada a partir de una representación en fracción
continua). El patrón sorprendente formado por los valores calculados mediante la regla de Horner
muestra claramente que los errores de redondeo en este ejemplo no son aleatorios. ii
(Ver también [Hig], p. 52–53).
Bibliografı́a

[Brz] Brezinski, C.: Introduction à la pratique du calcul numérique. Dunod/Bordas, Paris, 1988.

[Hig] Higham, N.: Accuracy and Stability of Numerical Algorithms. SIAM, Philadelphia, 1996.

[MC1] Mundo Cientı́fico: El universo de los números: Matemáticas para interpretar el mundo.
Extra núm. 1, s.f..

[S-S] Sanz-Serna, J. M.: Diez lecciones de Cálculo Numérico. Universidad de Valladolid, 1998.

Documentos en Internet

[Gold] Goldberg, D.: What Every Computer Scientist Should Know About Floating-Point Arit-
hmetic. Computing Surveys, 1991.
http://docs.sun.com/db/doc/800-7895
La referencia universal.

[LIA-1] ISO/IEC: Information technology – language independent arithmetic. Part 1: Integer and
floating point arithmetic, 1994. ISO/IEC 10967-1:1994(E).
ftp://crl.dec.com/pub/misc/lia-1-is.ps.Z.
–—oOo—–

[1] Gray, R.: Advanced Statistical Computing. Course Notes, 2002.


http://biowww.dfci.harvard.edu/~gray/248-02/report.pdf

[2] IEEE-754 Floating-Point Conversion: From Decimal Floating-Point To 32-bit and 64-bit
Hexadecimal Representations Along with Their Binary Equivalents (1998)
http://babbage.cs.qc.edu/courses/cs341/IEEE-754.html

[3] Moore, D.: Introduction to Computacional Science. CAAM 420, Lecture Notes, 2000.
http://www.owlnet.rice.edu/~caam420/lectures

[4] UNFP: User Notes on Fortran Programming. (An open cooperative practical guide),
1998.
http://www.ibiblio.org/pub/languages/fortran/ch4-6.html

177

También podría gustarte