Documentos de Académico
Documentos de Profesional
Documentos de Cultura
0. El principio de inducción 1
0.1. Revisión de los números naturales . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1
0.2. Principio de inducción . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2
0.3. Principio de inducción ‘completa’ . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 6
0.4. Principio de inducción ‘desplazada’ . . . . . . . . . . . . . . . . . . . . . . . . . . . . 7
0.5. Ejercicios . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 7
0.6. APÉNDICE: Definiciones recursivas. . . . . . . . . . . . . . . . . . . . . . . . . . . . 9
1. Conjuntos 13
1.1. Conjuntos. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 13
1.1.1. Idea intuitiva de conjunto: pertenencia. Igualdad e inclusión entre conjuntos.
Conjunto potencia. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 13
1.1.2. Operaciones con conjuntos: unión, intersección, complemento. . . . . . . . . 16
1.2. Pares ordenados. Producto cartesiano de conjuntos. . . . . . . . . . . . . . . . . . . . 19
1.3. Correspondencias y aplicaciones . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 20
1.3.1. Comentarios previos: Ideas intuitivas y ejemplos. . . . . . . . . . . . . . . . . 20
1.3.2. Aplicaciones: dominio, codominio, gráfica. . . . . . . . . . . . . . . . . . . . . 22
1.3.3. Imagen y antiimagen de un conjunto. . . . . . . . . . . . . . . . . . . . . . . 23
1.3.4. Aplicaciones inyectivas, suprayectivas, biyectivas. . . . . . . . . . . . . . . . . 24
1.3.5. Más sobre familias de conjuntos . . . . . . . . . . . . . . . . . . . . . . . . . . 25
1.3.6. Composición de aplicaciones. . . . . . . . . . . . . . . . . . . . . . . . . . . . 26
1.3.7. Inversa de una aplicación biyectiva. Inyectividad e inversa parcial. . . . . . . 27
1.4. Relaciones . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 32
1.4.1. Relaciones de equivalencia y particiones. Conjunto cociente. . . . . . . . . . . 32
1.4.2. Relaciones de orden. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 35
1.5. Conjuntos finitos y numerables . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 38
1.5.1. Conjuntos finitos y numerables. Conjuntos equipotentes. . . . . . . . . . . . . 38
1.5.2. APÉNDICE: Un mı́nimo de combinatoria. . . . . . . . . . . . . . . . . . . . . 40
i
ii ÍNDICE GENERAL
El principio de inducción
1
2 CAPÍTULO 0. EL PRINCIPIO DE INDUCCIÓN
y que de esta manera podemos ‘atrapar’ todos los números naturales sin que escape ninguno.
Dicho en la jerga profesional, lo que importa es la propiedad de inducción del conjunto de
los números naturales. Antes de desarrollar esta idea, introducimos la siguiente
Notación.
(1 + x)n ≥ 1 + nx (∗ )
(1 + x)n+1 ≥ 1 + (n + 1) x.
En efecto: multiplicando los dos términos de la desigualdad (∗ ) por el número real no negativo
1 + x, se mantiene el sentido de la desigualdad y ası́
(1 + x)n+1 ≥ 1 + (n + 1) x.
¿No habrá alguna forma de sacarle partido a este hecho? Pensemos un momento: el conjunto de los
números naturales para los que Pn se cumple tiene la propiedad de que con cada n que esté en él,
debe estar también n + 1. De acuerdo con la inductividad de N, bastarı́a que 1 estuviese en dicho
conjunto, para que todos los números naturales estuviesen en dicho conjunto —lo que significarı́a
que Pn serı́a cierta para todo número natural n. Pero P1 dice que ha de ser (1 + x)1 ≥ 1 + 1 · x,
o sea, 1 + x ≥ 1 + x, trivialmente cierto (incluso para cualquier número real x sin restricción).
Ası́ pues, acabamos de demostrar que Pn es cierta para todo número natural n.
Por tanto, ¡hemos encontrado una demostración indirecta, más abordable, del resultado que
buscábamos probar!
Esta misma situación se repite suficientes veces como para que el método empleado merecezca
un enunciado destacado, con nombre propio.
1. Principio de inducción. Para cada número natural n, sea Pn una proposición que puede ser
cierta o falsa, de tal manera que
P1 es cierta, y
para cada n ∈ N, suponiendo que Pn es cierta se puede demostrar que Pn+1 es cierta.
Entonces se cumple que
F Pn es cierta para todo n ∈ N.
Veamos la aplicación de este principio en algunos ejemplos.
Ejemplos.
1. Demostrar que, cualquiera que sea el número natural n,
n
X n (n + 1) (2n + 1)
k2 = .
6
k=1
n
X
(La expresión k 2 es una manera abreviada de indicar 12 + 22 + · · · + k 2 + · · · + n2 .)
k=1
4 CAPÍTULO 0. EL PRINCIPIO DE INDUCCIÓN
No se ve una manera obvia de calcular directamente la suma que nos proponen (lo que no quiere
decir que no exista). Pero sı́ podemos probar fácilmente por inducción que se cumple la igualdad
para todo n. Para ello, tomemos como Pn la proposición del enunciado:
n
X n (n + 1) (2n + 1)
Pn :: k2 = .
6
k=1
1
X n (n + 1) (2n + 1) 1 (1 + 1) (2 · 1 + 1)
P1 es cierta: para n = 1, k 2 = 12 = 1, mientras que = =
6 6
k=1
1·2·3
= 1.
6
Si es cierta Pn para un n, ¿también es cierta Pn+1 ?
n+1
X (n + 1) (n + 1 + 1) (2(n + 1) + 1) (n + 1) (n + 2) (2n + 3)
Pn+1 :: k2 = =
6 6
k=1
Sı́: porque
n+1
X
k 2 = 12 + 22 + · · · + k 2 + · · · + n2 + (n + 1)2
k=1
n
X ∗ n (n + 1) (2n + 1)
= k 2 + (n + 1)2 = + (n + 1)2
6
k=1
n (n + 1) (2n + 1) + 6(n + 1)2 (n + 1) [n (2n + 1) + 6(n + 1)]
= =
6 6
(n + 1) [2n2 + n + 6n + 6] (n + 1) [2n2 + 7n + 6]
= = .
6 6
∗
En la igualdad = hemos empleado la hh hipótesis de inducciónii (esto es, que suponemos Pn cierta).
Y por último, también
que, aplicando la hipótesis de inducción, es múltiplo de 13 por ser suma de múltiplos de 13.
(ii) Para cada número natural n, tomamos
para n = 1, 22 + 5 = 4 + 5 = 3 · 3,
suma de múltiplos de 3.
Alternativamente:
22(n+1) + 15(n + 1) − 1 = 4 22n + 15n − 1 − 45n + 18, que será divisible por 9.
22(n+1) +15(n+1)−1 = 4·22n +15n+15−1 = 22n +3·22n +15n−1+15 = 22n +15n−1+3 22n + 5 ,
y como 22n + 5 es múltiplo de 3 según hemos probado, lo anterior sea múltiplo de 9 (aplicando la
hipótesis de inducción).
3. Obsérvese que
1 1
1− = ,
2
2
1 1 1
1− 1− = ,
2 3 3
1 1 1 1
1− 1− 1− = .
2 3 4 4
Se pide: conjeturar una ley general sencilla que incluya las anteriores como casos particulares, y
demostrarla mediante el principio de inducción.
Parece que se cumple
1 1 1 1 1 1
Pn :: 1− 1− 1− ··· 1 − 1− = .
2 3 4 n n+1 n+1
para cada n ∈ N, suponiendo que P1 , P2 , . . . , Pn son ciertas se puede demostrar que Pn+1 es
cierta.
Entonces se cumple que
F Pn es cierta para todo n ∈ N.
Veamos la ventaja conseguida en un ejemplo. Recordemos que un número natural p distinto
de 1 es primo si no tiene más divisores en N que 1 y el propio p; abordemos ahora el siguiente
ejercicio:
4. Probar que para todo número natural n ≥ 2 existe un número primo p que divide a n.
Con el principio de inducción utilizado como hasta ahora, un intento razonable serı́a tomar
Trivialmente, P1 es cierta. Pero si para un n es cierta Pn , ¿deberá ser cierta Pn+1 ? ¿de qué sirve
que n sea divisible por un número primo p, si eso no implica que p divida a n + 1, ni que ningún
número primo ligado con p (el siguiente, por ejemplo) divida a n + 1?
Sin embargo, pasemos al principio de inducción completa: ahora, partimos de un n tal que no
sólo es cierta Pn , sino también P1 , P2 , y Pk para cualquier k ≤ n. Entonces:
— si n + 1 es primo, basta tomar p = n + 1 para ver que Pn+1 es cierta;
— y si n + 1 no es primo, tendrá un divisor positivo k distinto de 1 y de n + 1; pero los divisores
de un número son menores o iguales que dicho número (¿por qué?); ası́ pues, será k < n + 1, por lo
que k valdrá a lo más n. En consecuencia, Pk es cierta, por nuestra ‘nueva’ hipótesis de inducción.
Y como k 6= 1, esto significa que k admite un divisor primo p, que a su vez será divisor de n + 1;
por tanto Pn+1 es igualmente cierta en este caso. En consecuencia, Pn es cierta para todo n, como
querı́amos demostrar.
Comentarios
La estrategia de demostración que el principio de inducción proporciona recuerda lo que los
franceses llaman reculer pour mieux sauter, retroceder para saltar más. Comparando las dos versio-
nes que hemos enunciado, podrı́amos decir que en la primera tomamos una “pequeña carrerilla”,
de un sólo paso, mientras que en la inducción completa la “carrerilla”se toma desde el principio.
Siguiendo con las comparaciones, también se llama al ‘primer’ principio de inducción el principio
de las fichas de dominó: si pensamos en una colección infinita de fichas de dominó puestas una tras
otra, para tirarlas todas basta con asegurarse de que cae la primera y de que estén colocadas de
forma que cada ficha tire a la siguiente.
1
Su justificación es sencilla: basta observar que el conjunto S = {n ∈ : P1 , P2 , . . . , Pn son todas ciertas}
N
0.5. Ejercicios
0.1. Demostrar que para cada número natural n tal que n2 + 5n + 1 es un número par, también
(n + 1)2 + 5(n + 1) + 1 es un número par. ¿Se sigue de aquı́ por inducción que n2 + 5n + 1 es siempre
un número par? ¿Cuál es la conclusión correcta? Demostrarlo.
0.2. ¿Para qué números naturales n es cierta la desigualdad 2n > n2 ? Demostrarlo por inducción.
0.3. Sea S = {n ∈ N : 2n < 2n }. Probar que n + 1 ∈ S siempre que n ∈ S. ¿Se deduce de aquı́ que
S = N? ¿Por qué? Si no, ¿quién es S? ¿Por qué?
0.4. Demostrar que para todo n ∈ N,
n 2
X
3 n(n + 1)
k = .
2
k=1
8 CAPÍTULO 0. EL PRINCIPIO DE INDUCCIÓN
1 = 1;
1 − 4 = −(1 + 2);
1 − 4 + 9 = 1 + 2 + 3;
1 − 4 + 9 − 16 = −(1 + 2 + 3 + 4).
Conjeturar una fórmula general sencilla que incluya las anteriores como casos particulares, y de-
mostrarla mediante el principio de inducción.
0.7. Definamos los números a1 , a2 , a3 , . . . por a1 = 9, a2 = 36, an+1 = 6an − 9an−1 si n ≥ 2.
Probar que an está bien definido para todo n y que an = 3n (n + 2).
0.8. Sea u1 = 2, u2 = 3, un+1 = 3un − 2un−1 si n ≥ 2. Probar que un está bien definido para todo
n y que un = 2n−1 + 1.
0.9. (a) Conjetura una fórmula para 1 + 3 + · · · + (2n − 1) evaluando la suma para n = 1, 2, 3 y 4.
(b) Prueba tu fórmula usando el principio de inducción.
0.10. (a) Conjetura una fórmula que simplifique el producto
1 1 1 1
1− 1− 1− ··· 1 − 2 .
4 9 16 n
es decir, los n + 1 alumnos han obtenido la misma calificación, como querı́amos demostrar.
0.6. APÉNDICE: DEFINICIONES RECURSIVAS. 9
¿Para qué números naturales está bien definido Sn mediante la fórmula anterior? Desde luego para
1, y también para el siguiente de cada número natural para el que esté bien definido; es decir, para
todos los números naturales, por inducción.
Análogamente, si se trata de definir la expresión an para un número dado a y un exponente
n ∈ N cualquiera, en vez de plantearla como “el producto de n factores iguales a a”, podemos
definir recursivamente
a1 = a, an+1 = an · a,
y vale repetir el argumento anterior para concluir que ası́ an está bien definido para todo n ∈ N.
Estos ejemplos muestran que en una definición recursiva, la construcción del objeto que se
define se hace siguiendo siempre unas mismas reglas, pero estas reglas hacen referencia al propio
objeto. Por ello, para no caer en un cı́rculo vicioso, el primero o primeros casos se definen siempre de
manera expresa, sin apelar a las reglas. Consecuentemente, en cada definición recursiva encontramos
siempre dos partes,
1
X n+1
X n
X
ak = a1 y ak = ak + an+1 para cada n ∈ N,
k=1 k=1 k=1
10 CAPÍTULO 0. EL PRINCIPIO DE INDUCCIÓN
Como se señala en [G-H], hh cuando el reemplazamiento de los puntos suspensivos es una tarea
rutinaria para los seres humanos, a menudo los puntos sustituyen la definición inductiva que se
espera que dé el lector. El uso de puntos suspensivos hace a menudo que las fórmulas sean más
fáciles de entender, pero, nuevamente, sólo para lectores humanos. Y en trabajos más avanzados [o
más cuidadosos], la definición por inducción tiene que ser dada [explı́citamente].ii
Por lo que a los ordenadores se refiere, hay lenguajes de programación como C que admiten
procesos recursivos y otros, como algunos ‘dialectos’ de Fortran, que no los admiten. En esta última
situación, hay que transformar los procesos recursivos en procesos iterativos, de carácter cı́clico,
que hacen uso de bucles en los que intervienen valores calculados en el ciclo previo. Todo programa
recursivo puede reescribirse como un programa iterativo, aunque ciertos problemas se resuelven
de manera más simple y natural mediante recursión (generalmente, a costa de mayor consumo de
memoria). Un ejemplo muy ilustrativo es el conocido problema ‘de la torre de Hanoi’, que puede
verse en [5] o [6].
Bibliografı́a
[B-S] Bartle, R. G.- Sherbert, D. R.: Introducción al Análisis Matemático de una Variable.
Limusa, México, 1990.
Trata el principio de inducción en la Sección 1.3 (págs. 31 a 35). Muy detallado en sus comentarios.
Tiene una buena selección de ejemplos y ejercicios.
[D’A-W] D’Angelo, J. P.; West, D. B.: Mathematical Thinking. Problem-Solving and Proofs.
Prentice-Hall, Upper Saddle River, NJ, 1997.
Dedica al principio de inducción su capı́tulo 4 (págs. 56 a 73). Es un libro muy original en su plantea-
miento, y contiene una gran cantidad de ejercicios y problemas (algunos con cierto grado de dificultad).
[Ebb] Ebbinghaus, H.-D. & al.: Numbers. Springer, New York, 1991.
Es un excelente libro de consulta, a medio camino entre la historia de las ideas sobre los números y
la exposición ‘de teoremas’. Alcanza niveles que superan ampliamente el contenido de este curso, pero
merece la pena conocerlo. En la pág. 15 se encuentra el principio de inducción. No tiene ejercicios.
[G-H] Griffits, H. B.; Hilton, P. J.: Classical Mathematics. Van Nostrand Reinhold, London,
1970.
Una obra ambiciosa: el tı́tulo completo es A Comprehensive Textbook of Classical Mathematics. A
Contemporary Interpretation. Baste con decir que cumple sobradamente su propósito. Tanto su plan-
teamiento como su exposición no han perdido nada de su valor con el tiempo, sino todo lo contrario.
Excelentes comentarios y ejercicios. Imprescindibles y más completos de lo habitual su tratamiento y
comentarios sobre inducción, a la que dedica el capı́tulo 5.
[Lieb] Liebeck, M.: A Concise Introduction to Pure Mathematics. Chapman & Hall/CRC, Boca
Raton, 2000.
De planteamiento muy similar al de esta asignatura, difiere en algunos contenidos y en el orden de expo-
sición. El principio de inducción aparece su capı́tulo 8 (págs. 55 a 68). Tiene ejercicios muy interesantes,
y el capı́tulo 9 está dedicado a demostrar por inducción la fórmula de Euler hh caras + vértices = aristas
+2ii, que aplica luego al estudio de los cinco sólidos platónicos (cubo, tetraedro, octaedro, icosaedro y
dodecaedro).
[Pest] Pestana, D. & al.: Curso práctico de Cálculo y Precálculo. Ariel, Barcelona, 2000.
Orientado fundamentalmente a servir de base para el Análisis matemático, parte de su contenido coincide
con el de nuestra asignatura. Muy claro y muy práctico, explica el principio de inducción en la página
30, dentro de un capı́tulo titulado Métodos de demostración que merece ser leı́do en su totalidad.
11
12 BIBLIOGRAFÍA
Documentos en Internet
[3] Historia del cero, The MacTutor History of Mathematics archive, St Andrews University,
Escocia.
http://www-groups.dcs.st-and.ac.uk/~history/HistTopics/Zero.html
En Matemáticas, los conjuntos aparecen inevitablemente, bien de forma explı́cita o bien de forma
implı́cita, y podemos encontrar ejemplos en abundancia. Acabamos de examinar una propiedad ‘de
los números naturales’, el principio de inducción, que no es una propiedad de cada número natural
(del 1, o del 2, o del 46) sino del conjunto de los números naturales. Igualmente, cuando se dice
que hay “infinitos números primos”, no expresamos una propiedad de cada número primo, sino del
conjunto que forman: “el conjunto de los números primos es infinito”. Muchos objetos geométricos
son conjuntos: rectas, planos, circunferencias, cualquier figura geométrica es un conjunto de puntos;
hablamos del “conjunto de soluciones” de una ecuación o de un sistema de ecuaciones; un espacio
vectorial es un conjunto en el que se ha definido una suma y un producto por escalares que cumplen
unas ciertas reglas, etc.
Sin embargo, el estudio de los conjuntos como objetos matemáticos en sı́ mismos, es decir, la
Teorı́a de conjuntos como disciplina matemática, no aparece hasta la segunda mitad del siglo XIX,
creada por G. Cantor.
La formalización de la Teorı́a de conjuntos como una teorı́a axiomática resultó extremadamente
difı́cil, pese a lo simple y poco problemática que parecı́a la noción de conjunto. Sus primeros
desarrollos hicieron aparecer las famosas paradojas de Burali-Forti, de Cantor, de Russell; las
discusiones sobre el axioma de elección y la hipótesis del continuo . . . (ver [GJPR], [Ap])
Pero lo que a nosotros nos interesa de la Teorı́a de conjuntos es que proporciona un lenguaje
básico para formular enunciados y argumentos que el lenguaje ordinario harı́a farragosos o incom-
prensibles. No nos vamos a enfrentar a ella como “estudiosos”, sino como “usuarios”: nos vamos a
limitar a una Teorı́a intuitiva de conjuntos, planteando este capı́tulo sustancialmente como el texto
[D-H]. Para completar las explicaciones y ver más ejemplos, son interesantes [D’A-W], [G-H],[Ham],
[Lieb], [S-T], ası́ como [Lip], [O.U.], etc., y es esencial [GJPR].
1.1. Conjuntos.
1.1.1. Idea intuitiva de conjunto: pertenencia. Igualdad e inclusión entre con-
juntos. Conjunto potencia.
En un enfoque intuitivo de la teorı́a de conjuntos, como el que aquı́ vamos a emplear, la noción de
conjunto no difiere esencialmente de lo que por tal se entiende en el lenguaje ordinario: una colección
de objetos, reales o abstractos (los elementos del conjunto) agrupados como un todo, percibidos
simultáneamente como un nuevo objeto. Desde el punto de vista matemático, esta descripción de
lo que entendemos como conjunto no sirve como definición: es demasiado vaga e imprecisa, y utiliza
otras palabras (‘colección’, ‘agrupamiento’) que no son más que sinónimos de la palabra ‘conjunto’.
13
14 CAPÍTULO 1. CONJUNTOS
Tampoco nos ayuda recurrir a los diccionarios; en el de la Real Academia Española, por ejemplo,
encontramos lo siguiente:
conjunto : . . . k 4. m. Agregado de varias personas o cosas. k . . . k 6. La totalidad de los elementos
o cosas poseedores de una propiedad común, que los distingue de otros. Por ejemplo, los números
pares. k . . . k 9. (Mat.) La totalidad de los entes matemáticos que tienen determinada propiedad.
El CONJUNTO de los números primos. k . . .
Es muy difı́cil plantear una definición de ‘conjunto’ que no recurra a sinónimos hasta caer en
un cı́rculo vicioso: es un concepto tan básico que sólo podemos dar descripciones aproximativas del
mismo. De hecho, cuando fue preciso establecer una teorı́a de conjuntos rigurosa desde el punto
de vista matemático, una Teorı́a axiomática de conjuntos, la noción de ‘conjunto’ quedó entre los
términos no definidos.1
Proseguiremos, entonces, con nuestras ideas intuitivas de conjunto y de elementos de un con-
junto. Si A es un conjunto y a es uno de sus elementos, diremos que a pertenece a A, y escribiremos
a ∈ A,
A = {2, 4, 6, 8, 10}.
Pero lo más habitual es que los conjuntos vengan descritos por una propiedad que caracteriza a
sus elementos: por ejemplo, como citaba el diccionario, el conjunto de todos los enteros positivos
pares. Este conjunto se escribe
{x : P (x) es cierta },
℘(A) = {S : S ⊆ A}
Ejercicios
1.1. Sea A = {2n + 1 : n ∈ N}. Decir si las siguientes afirmaciones son ciertas o falsas, justificando
la respuesta:
(ii) {(x, y, z) ∈ R3 : x = y, x + y + z = 1}
= {(x, y, z) ∈ R3 : x = t/2, y = t/2, z = 1 − t para algún t ∈ R}.
A ∪ B = {x : x ∈ A o x ∈ B},
formado por los elementos que pertenecen al menos a uno de los dos conjuntos (pueden pertenecer
a los dos).
La intersección de A y B es el conjunto
A ∩ B = {x : x ∈ A y x ∈ B},
A \ B = {x : x ∈ A y x ∈
/ B},
Cuando todos los conjuntos que se manejan son subconjuntos de un conjunto X dado explı́ci-
tamente o inequı́vocamente sobreentendido, se pone Ac en vez de X \ A, abreviando hh el comple-
mentario de A respecto de X ii por el complementario de A, sin más.
Diagramas de Venn. Las operaciones con conjuntos permiten realizar “cálculos” que se intuyen
mejor utilizando diagramas de Venn , que consisten en dibujar en el plano regiones, limitadas por
circunferencias o curvas adecuadas, que representan a los conjuntos. Por ejemplo, en los diagramas
1.1. CONJUNTOS. 17
hemos representado dos conjuntos A y B como las regiones limitadas por una elipse grande y una
circunferencia pequeña. Las zonas rayadas representan, sucesivamente, A, B, A ∪ B, A ∩ B, A \ B.
Los “cálculos” con conjuntos comparten algunas reglas (¡no todas!) con las operaciones entre
números.
Proposición 1.1.5. Dados tres conjuntos cualesquiera A, B y C, se tienen las siguientes igualda-
des:
(i) (A ∪ B) ∪ C = A ∪ (B ∪ C).
(ii) (A ∩ B) ∩ C = A ∩ (B ∩ C).
(iii) A ∩ (B ∪ C) = (A ∩ B) ∪ (A ∩ C).
(iv) A ∪ (B ∩ C) = (A ∪ B) ∩ (A ∪ C).
Demostración. Ver [D-H], pp. 10-11.
(i) (A ∪ B)c = Ac ∩ B c .
(ii) (A ∩ B)c = Ac ∪ B c .
Demostración. Ejercicio.
Las definiciones de unión e intersección de dos conjuntos pueden ampliarse a una colección
arbitraria de conjuntos.
Definición 1.1.7. Sea C una colección no vacı́a de conjuntos (un conjunto no vacı́o cuyos elementos
son a su vez conjuntos). La unión de C es el conjunto
[ [
C= A = {x : x ∈ A para algún A ∈ C},
A∈C
formado por los elementos x que pertenecen a uno al menos de los conjuntos de C.
La intersección de C es el conjunto
\ \
C= A = {x : x ∈ A para todos A ∈ C},
A∈C
S T
en vez de C, C, respectivamente. Ası́ mismo, cuando C = {An : n ∈ N}, suele emplearse
[ \
An , An ,
n∈ N n∈ N
Cuando C viene dado de este modo, diremos que se trata de una familia de conjuntos
parametrizada por I o con conjunto de ı́ndices I. Daremos una definición más ‘formal’
posteriormente.
Demostración. Ejercicio.
Ejercicios
2.1. Sea A un subconjunto de un conjunto dado X. Comprobar que (Ac )c = A.
2.2. Probar que dados dos subconjuntos A, B de un conjunto X, entonces X \ A = B si y sólo si
A ∪ B = X, A ∩ B = ∅.
2.3. Dados dos conjuntos A, B, demostrar que:
(1) A ⊆ B si y sólo si A ∪ B = B.
(2) A ⊆ B si y sólo si A ∩ B = A.
(3) A ⊆ B si y sólo si A \ B = ∅.
2.4. Sean A, B, C, D conjuntos tales que A ⊆ B y C ⊆ D. Probar que A ∪ C ⊆ B ∪ D y
A ∩ C ⊆ B ∩ D.
2.5. Dado un conjunto X, sean A, B, C ⊆ X.
(1) Probar que A \ B = A ∩ B c .
(2) Aplicando lo anterior y las leyes de De Morgan, dar otra expresión de A \ (B \ C).
(3) ¿Es lo mismo A \ (B \ C) que (A \ B) \ C? ¿Por qué?
2.6. Dados dos conjuntos A, B, probar que (A \ B) ∪ (B \ A) = (A ∪ B) \ (A ∩ B) (este conjunto
se denomina diferencia simétrica o discrepancia de A y B.)
1.2. PARES ORDENADOS. PRODUCTO CARTESIANO DE CONJUNTOS. 19
A1 ⊇ A2 ⊇ . . . ⊇ Ak ⊇ Ak+1 ⊇ . . .
1 1
2.10. Para cada n ∈ N, sea An = 0, 1 − n , Bn = 0, 1 − n . Comprobar que An está estricta-
2 3
mente contenido en Bn para todo n. ¿Está la unión de los An estrictamente contenida en la unión
de los Bn ? S S
(No: probar que n∈ An = n∈ Bn = [0, 1).)
N N
A × B = {(a, b) : a ∈ A, b ∈ B}
formado por todos los pares ordenados cuyo primer elemento está en A y el segundo en B.
Ejemplos. El conjunto de las coordenadas de los puntos del plano es R × R. Pero quizá el primer
producto cartesiano de su vida (de un conjunto de letras por un conjunto de números) lo haya
manejado el lector en el ‘juego de los barcos’. (Más ejemplos en [G-H], cap. 3.)
Ejercicio. Dados tres conjuntos A, B, C, probar que
(i) A × (B ∪ C) = (A × B) ∪ (A × C).
(ii) A × (B ∩ C) = (A × B) ∩ (A × C).
(iii) A × (B \ C) = (A × B) \ (A × C).
2
Concretamente, Kuratowski dio la siguiente definición formal:
(a, b) = {{a}, {a, b}}.
Si se revisa el ejercicio 1.3, se verá cómo esta definición encaja adecuadamente con la idea intuitiva.
20 CAPÍTULO 1. CONJUNTOS
algunas de ellas, un mismo elemento del conjunto A está en correspondencia con más de un elemento
de B, por lo que podrı́amos decir que, en cierto modo, son correspondencias ‘ambiguas’ o ‘poco
ajustadas’: ¿cuál es ‘el’ número de teléfono de un abonado que tenga más de un teléfono? ¿cómo
pensar que una variable fı́sica y ‘depende’ de otra variable fı́sica x si a un mismo valor de x le
pueden corresponder varios valores distintos de y?
En una correspondencia entre dos conjuntos A y B que evite esa ‘ambigüedad’, cada elemento
de A tendrá asociado un solo elemento de B; cuando esto suceda, diremos que la correspondencia
es una aplicación. En otras palabras, una aplicación de un conjunto A en un conjunto B es una
terna formada por A, B, y un subconjunto G de A × B que cumple la siguiente condición:
para cada x ∈ A hay un y ∈ B, y sólo uno, tal que (x, y) ∈ G. (∗)
Dicho de otro modo, han de cumplirse dos cosas: (1) a cada x ∈ A, sin excepción, le corresponde
un elemento y ∈ B tal que (x, y) ∈ G, (2) pero uno nada más.
El modelo paradigmático de aplicaciones son las funciones, que no son otra cosa que las aplica-
ciones entre conjuntos de números. Buena parte de la nomenclatura y notaciones que usaremos en
el estudio de las aplicaciones está copiada de las que tradicionalmente empleamos para funciones.
Por ejemplo, indicaremos que f es una aplicación entre un conjunto A y un conjunto B poniendo
f : A → B, llamaremos a G la gráfica de f , y en vez de decir que a un x ∈ A le corresponde un
y ∈ B mediante la aplicación f , diremos que y es el valor de f en x, escrito y = f (x). Con esta
notación, la condición (∗) que caracteriza a las correspondencias que son aplicaciones se expresa a
veces poniendo que
— f (x) está definido cuando y sólo cuando x ∈ A,
— si x1 , x2 ∈ A son tales que x1 = x2 , forzosamente f (x1 ) = f (x2 ).
(Suele decirse que f está bien definida en A para indicar abreviadamente que se cumplen estas dos
condiciones.)
Las transformaciones geométricas también son ejemplos de aplicaciones, y proporcionan otra
manera de interpretar lo que hace una aplicación: una traslación transforma o “convierte” un punto
en su trasladado, etc. La idea de transformación o conversión aparece también en contextos no
geométricos, donde se tienen procesos que pueden representarse mediante un esquema denominado
‘de caja negra’,
entrada caja salida
−→ negra −→
en el que introducimos una ‘entrada admisible’ en la caja negra y obtenemos (sin que nos importe
cómo) una ‘salida’: la ‘caja negra’ puede ser una transformación geométrica o una función o una
tabla, pero también puede ser un amplificador, por el que entra una onda y da como respuesta
otra onda, o puede ser la cuerda de un instrumento musical, que producirá al pulsarla, golpearla
o frotarla un sonido diferente según sea su longitud, o . . . (el lector puede inventar sus propios
ejemplos). Lo sustancial es la existencia de un conjunto predeterminado de entradas admisibles, y
de un emparejamiento de cada uno de ellos con una salida bien definida, perteneciente al mismo o
a otro conjunto.
Esta interpretación de las aplicaciones tiene su incidencia en el lenguaje: nos referiremos indis-
tintamente a f (x) como el valor de f en x o como la imagen de x por f .
Por supuesto, hay correspondencias que no son aplicaciones: la correspondencia entre el nombre
de una persona y la persona NO es una aplicación (y por eso en el DNI es necesario añadir el número
si queremos identificarla); en cambio, SÍ es una aplicación la correspondencia entre la persona y su
nombre ‘auténtico’.
La noción general de aplicación juega un papel unificador entre las diferentes variantes de la
misma que están presentes en todas partes de las Matemáticas: además de las funciones y de las
transformaciones geométricas, encontramos las aplicaciones lineales en Álgebra lineal, las aplica-
ciones continuas en Topologı́a, los homomorfismos en Álgebra abstracta, las variables aleatorias en
Probabilidad, etc. De las propiedades comunes a todas ellas nos ocupamos a continuación.
22 CAPÍTULO 1. CONJUNTOS
Definición 1.3.1. Una correspondencia entre dos conjuntos A y B es una terna (A, B, G)
formada por el conjunto A, el conjunto B y un subconjunto G del producto cartesiano A × B.
Definición 1.3.2. Una aplicación f : A → B es una terna (A, B, Gf ), donde A, B son conjuntos
dados, llamados respectivamente el dominio o conjunto inicial y el codominio o conjunto
final de f , y Gf , denominado gráfico o gráfica de f , es un subconjunto del producto cartesiano
A × B tal que para todo x ∈ A existe un elemento único y ∈ B de modo que (x, y) ∈ Gf .
su codominio B;
Cambiar una cualquiera de estas tres cosas (el dominio, el conjunto final o la “regla de de-
finición”) hace que la aplicación cambie. Por ejemplo, si tenemos una aplicación f : A → B y
consideramos un subconjunto S de A, la restricción de f a S es la aplicación f |S : S → B tal
que f |S (x) = f (x) para cada x ∈ S, que no es la misma aplicación f (se ha cambiado el dominio),
aunque venga dada por “la misma regla de correspondencia” (a cada x de S, la restricción f |S hace
corresponder el mismo valor que f ¡pero f |S (x) no está definida para x ∈ / S!).
Como acabamos de ver, en la práctica raras veces se muestra una aplicación como una terna,
tal como requerirı́a su definición formal: lo habitual es especificar su dominio, su codominio y la
regla que permite determinar el valor de la aplicación en cada elemento del dominio.
Suele chocar al principiante que a veces la regla de definición de una aplicación aparece dividida
en varias subreglas parciales (expresadas frecuentemente, cuando intervienen conjuntos numéricos,
mediante fórmulas), tendiendo a interpretar incorrectamente que se han definido tantas aplicaciones
cuantas subreglas se enuncien. Por ejemplo, la aplicación f : R → R tal que
(
x, si x ≥ 0;
f (x) =
−x, si x < 0,
es una sola aplicación, la función valor absoluto, y no dos funciones, aunque sus valores coincidan
en parte de su dominio (¡no en todo!) con los que toman las dos aplicaciones distintas g : x ∈ R →
g(x) = x ∈ R y h : x ∈ R → h(x) = −x ∈ R.
En resumen:
Criterio de igualdad de aplicaciones. Dos aplicaciones f : A → B, g : C → D son iguales si
y sólo si
3. para todo x ∈ A(= C), f (x) = g(x) (f y g toman el mismo valor en cada elemento de su
dominio común)
1.3. CORRESPONDENCIAS Y APLICACIONES 23
¿Por qué?
Ejercicio. ¿En qué condiciones la correspondencia que asocia cada punto de una transparencia
con su proyección en la pantalla es una aplicación entre la transparencia y la pantalla?
f −1 (T ) = {x : f (x) ∈ T },
Demostración. Ejercicio.
Demostración. Probaremos solamente (ii), dejando la demostración de (i), (iii), (iv) como ejercicio.
De acuerdo con las definiciones anteriores, será:
A su vez, (1.3) significa que existe un mismo x, que está tanto en A1 como en A2 , tal que f (x) = y.
Por tanto, comparando vemos que (1.3) =⇒ (1.4) sin más que tomar a = b = x. Ası́ pues,
y ∈ f (A1 ∩ A2 ) =⇒ y ∈ f (A1 ) ∩ f (A2 ), o lo que es lo mismo,
Por contra, no está claro que funcione la implicación inversa, ya que (en principio al menos)
podrı́amos encontrar f (a) = y = f (b) sin que a = b.
' $
' $
A1
A a •X f ' B$
' X $
z y
XXXXX
•
c •P
*
PP
& %
P
PPP y0
q •
b • & %
&
A2 %
& %
¿Tenemos algún contraejemplo sencillo a (1.4) =⇒ (1.3)? Sı́: cualquier aplicación que tenga al
menos dos elementos a 6= b para los que f (a) = f (b); tomando A1 = {a}, A2 = {b}, es A1 ∩ A2 = ∅,
f (A1 ∩ A2 ) = ∅, f (A1 ) = {f (a)} = {f (b)} = f (A2 ), por lo que
Si queremos dar ejemplos concretos, f puede ser una aplicación constante en un conjunto con más
de un elemento, o puede ser f : x ∈ R → f (x) = x2 ∈ R, y entonces podrı́amos tomar incluso A1
y A2 con infinitos elementos e intersección no vacı́a: por ejemplo, A1 = (−∞, 1), A2 = (−1, +∞),
f (A1 ∩ A2 ) = f ((−1, 1)) = [0, 1), f (A1 ) ∩ f (A2 ) = [0, +∞).
Ejercicio. Con las notaciones de la proposición anterior, ¿qué relaciones hay entre f (A1 \ A2 ) y
f (A1 ) \ f (A2 )? ¿y entre f −1 (B1 \ B2 ) y f −1 (B1 ) \ f −1 (B2 )?
Demostración. Como ya hemos visto, se verifica ciertamente que f (A1 ∩ A2 ) ⊆ f (A1 ) ∩ f (A2 ). Pero
la inyectividad de f da que también f (A1 ) ∩ f (A2 ) ⊆ f (A1 ∩ A2 ), puesto que y ∈ f (A1 ) ∩ f (A2 )
implica que existe a ∈ A1 tal que f (a) = y y que existe b ∈ A2 tal que f (b) = y, lo que por ser f
inyectiva obliga a que a = b, y por tanto a = b ∈ A1 ∩ A2 =⇒ y = f (a) ∈ f (A1 ∩ A2 ).
En consecuencia, f (A1 ∩ A2 ) = f (A1 ) ∩ f (A2 ) en este caso.
Releyendo atentamente las proposiciones y contraejemplos anteriores vemos que hemos conseguido real-
mente un resultado más preciso: la inyectividad de f es necesaria (contraejemplos previos) y suficiente (última
proposición) para que la igualdad de los conjuntos del enunciado se verifique sin excepciones.
Ejercicio. Con las notaciones de la proposición anterior, ¿afecta a las relaciones entre f (A1 \ A2 )
y f (A1 ) \ f (A2 ) que f sea inyectiva o suprayectiva? La misma pregunta para f −1 (B1 \ B2 ) y
f −1 (B1 ) \ f −1 (B2 ).
Definición 1.3.8. Sean A, I conjuntos arbitrarios. Diremos que (ai )i∈I es una familia de ele-
mentos de A con conjunto de ı́ndices I o parametrizada por I si hay una aplicación
f : I → A con f (i) = ai para cada i ∈ I.
Los elementos de A pueden ser a su vez conjuntos, y tenemos entonces una familia indexada
(o parametrizada) de conjuntos .
Realmente, en este “cambio de escritura” lo único que varı́a es el punto de vista: se destacan los
valores de la aplicación f , y se dejan la aplicación y los elementos del dominio en segundo plano.
Habı́amos introducido la unión y la intersección de una familia cualquiera de conjuntos en (1.1)
y (1.2), página 18. Veamos que sus imágenes y antiimágenes por una aplicación funcionan igual
que para dos conjuntos.
Proposición 1.3.9. Dada f : A → B, sea (Ai )i∈I una familia de subconjuntos de A, (Bi )i∈I una
familia de subconjuntos de B. Entonces:
S S
(i) f i∈I Ai = i∈I f (Ai ).
26 CAPÍTULO 1. CONJUNTOS
T T
(ii) f i∈I Ai ⊆ i∈I f (Ai ).
(iii) Si f es inyectiva, !
\ \
f Ai = f (Ai ).
i∈I i∈I
En caso contrario, el contenido del apartado anterior puede ser estricto.
(iv) f −1 −1 (B ).
S S
i∈I Bi = i∈I f i
(v) f −1 −1 (B ).
T T
i∈I Bi = i∈I f i
Demostración. Examinemos con detalle el caso más delicado, la imagen de la intersección (los
demás se dejan como ejercicios).
Según las definiciones,
!
\ \
f Ai = {f (x) : x ∈ Ai } = {f (x) : x ∈ Ai para todos ı́ndices i ∈ I},
i∈I i∈I
mientras que
\
f (Ai ) = {y : y ∈ f (Ai ) para todos ı́ndices i ∈ I}
i∈I
= {y : hay un x ∈ Ai tal que y = f (x), para todos ı́ndices i ∈ I}.
A simple vista, los dos conjuntos parecen iguales, pero hay una diferencia fundamental: leı́do
con todo cuidado, observamos que el primer conjunto consta de los elementos y de B que son de la
forma y = f (x) para un mismo x que está simultáneamente en todos los conjuntos Ai cualquiera
que sea i ∈ I, mientras que el segundo consta de los elementos y de B tales que para cada i ∈ I
hay un x ∈ Ai , posiblemente distinto para cada i, con y = f (x); empleando cuantificadores en vez
del lenguaje ordinario, expresemos de manera más clara la ‘pequeña’ diferencia: dado y ∈ B,
!
\
y∈f Ai si y sólo si ∃x ∈ A tal que y = f (x) y ∀i ∈ I, x ∈ Ai ;
i∈I
\
y∈ f (Ai ) si y sólo si ∀i ∈ I, ∃xi ∈ Ai tal que y = f (xi ).
i∈I
' $ ' $
A B C
f ' $g
s r z = g(y) = g(f (x))
sr
x r y = f (x)
& %
& %
g◦f & %
Nota. En otros contextos, especialmente en Análisis matemático, se usa una definición más general
de la composición: dadas dos aplicaciones f : A → B y g : C → D, se define g ◦ f como la aplicación
con dominio
dom(g ◦ f ) = f −1 (C) = f −1 (dom g)
para cada x ∈ dom(g ◦ f ). Obsérvese que tales x son justamente aquellos elementos de A para los
que g (f (x)) “tiene sentido”.
x
Ejemplo. Si f : R → R está dada por f (x) = x2 y g : R → R por g(x) = √ , g◦f y f ◦g
x2 + 1
son las aplicaciones de R en R dadas respectivamente por
x2 x2
(g ◦ f )(x) = g(f (x)) = √ , (f ◦ g)(x) = f (g(x)) = ,
x4 + 1 x2 + 1
distintas. Hay que ser cuidadoso, por tanto, con el orden de escritura en la composición.
Una correspondencia entre un conjunto A y un conjunto B puede ser “leı́da al revés” para
obtener una correspondencia entre B y A. Por ejemplo, si A es un conjunto de mujeres, B el
conjunto de todos sus parientes femeninos, y a cada x ∈ A asociamos un y ∈ B si y sólo si x es hija
de y, la correspondencia inversa asociarı́a un y ∈ B con un x ∈ A si y sólo si y es la madre de x.
Este ejemplo pone de manifiesto que aún cuando la correspondencia inicial sea una aplicación,
no siempre la correspondencia inversa es también una aplicación: para y ∈ B, es posible que en A
encontremos más de una hija de y o, en el extremo contrario, puede que no haya en A ninguna hija
de y.
Vemos ası́ que, si queremos hablar de la aplicación inversa de una aplicación dada f : A → B
puede haber dificultades por partida doble: bien porque un elemento y de B aparezca como imagen
por f de más de un elemento de A (es decir, porque f no sea inyectiva), o bien porque algún y de
B no sea imagen por f de ningún elemento de A (es decir, porque f no sea suprayectiva).
Hace falta, pues, que f sea biyectiva, y en tal caso podemos construir la aplicación inversa, que
denotaremos por f −1 , con dominio B = codom f y codominio A = dom f , ‘deshaciendo’ la acción
de f , como mostramos en el siguiente esquema.
28 CAPÍTULO 1. CONJUNTOS
' $
B
A ' $
f
rb
-
Dado b ∈ B . . .
& %
& %
' $
B
A ' $
f
srb . . . como f es biyectiva, existe un a ∈ A y uno sólo
a×r tal que f (a) = b . . .
& %
& %
' $
B
A ' $
f
srb . . . y, por definición, f −1 (b) es este único a ∈ A.
a×r
}
f −1 & %
& %
Nótese cómo la construcción de la inversa está ligada a la resolución de ecuaciones: f −1 tiene sentido
(es decir, f es biyectiva) si y sólo si para cada b ∈ B la ecuación f (x) = b tiene solución única,
y justamente dicha solución es f −1 (b). Y viceversa: si una ecuación puede expresarse en la forma
f (x) = b (b dato, x incógnita) para una aplicación f que tiene una inversa conocida, la ecuación
tiene una y una sóla solución, que es x = f −1 (b).
Definiciones y propiedades
Definición 1.3.11 (aplicación inversa). Dada una aplicación biyectiva f : A → B, llamaremos
aplicación inversa de f a la aplicación f −1 : B → A tal que para cada b ∈ B, f −1 (b) es el único
elemento a ∈ A para el que f (a) = b.
En términos más formales, f −1 serı́a la aplicación dada por la terna (B, A, Gf −1 ), donde
Gf −1 = {(b, a) : (a, b) ∈ Gf }, y Gf es, por supuesto, la gráfica de f .
Que f −1 es una aplicación de B en A bien definida es consecuencia directa de la biyectividad
de f , porque para cualquier b ∈ B existirá al menos un elemento a ∈ A tal que b = f (a) por ser f
suprayectiva, y ese a es único por ser f inyectiva, con lo que cada elemento de B sin excepción se
corresponde con un elemento inequı́vocamente determinado de A.
Nota. En los textos de Análisis matemático suele hablarse de la aplicación inversa de cualquier
aplicación inyectiva, definiéndola como la aplicación f −1 : f (A) → A tal que f −1 (y) = x si y
sólo si f (x) = y. Obsérvese que, en cualquier caso, esta serı́a la aplicación inversa de la biyección
asociada a f , es decir, de la aplicación biyectiva f˜ : A → f (A) tal que f˜(x) = f (x).
Ejemplos.
f (g(b)) = f (a) = b,
y ası́ f ◦ g = idB puesto que ambas son aplicaciones de B en B que transforman cada b ∈ B en el
propio b.
⇐=
Recı́procamente, supongamos ahora que tenemos aplicaciones f : A → B y g que satisfacen las
condiciones 1,2,3. Veamos que f es biyectiva y que su inversa es g.
f es inyectiva.- Pues sean a1 , a2 ∈ A tales que f (a1 ) = f (a2 ). Entonces, aplicando 2,
f (a) = f (g(b)) = b.
Axioma de elección . Dada una familia {Ai : i ∈ I} de conjuntos no vacı́os disjuntos dos a
dos, existe un conjunto S que consiste exactamente en un elemento de cada Ai .
Por evidente que parezca este enunciado, se deducen de él (en Álgebra, en Análisis, en Topologı́a,
en . . . ) una serie de consecuencias tan sorprendentes que a su utilización por Zermelo en 1904
siguió una discusión que no se aplacó hasta los resultados de Gödel en 1940 y de Cohen en 1966.
Ver una excelente explicación en [C-H], pp. 241 y ss.; más conciso, [Ap], pp. 312–313 y [GJPR], pp.
66–67.
Buscando en Internet “Axiom of Choice” se obtiene una lista inacabable de referencias. Para
empezar, recomendamos [1], [2].
Ejercicios
3.1. Dados dos conjuntos X e Y , expresar como subconjuntos de X × Y las aplicaciones definidas
de la siguiente manera:
(1) la aplicación que hace corresponder a todos los x ∈ X un único punto b ∈ Y (la aplicación
constante con valor fijo b).
(2) supuesto X = Y , la aplicación que hace corresponder a cada x ∈ X el mismo x (la aplicación
identidad ).
1.3. CORRESPONDENCIAS Y APLICACIONES 31
(3) supuesto X ⊆ Y , la aplicación que hace corresponder a cada x ∈ X el mismo x (la aplicación
inclusión de X en Y ). ¿Es igual a la anterior?
(4) supuesto X = A × B, Y = A la aplicación que hace corresponder a cada (a, b) ∈ X su primera
componente a (la proyección sobre la primera componente ).
(5) supuesto X = A × B, Y = B la aplicación que hace corresponder a cada (a, b) ∈ X su segunda
componente b (la proyección sobre la segunda componente ).
3.2. Sean A y B conjuntos no vacı́os y f : A → B. Para cada una de las condiciones:
(T1) Para todo b ∈ B existe a ∈ A tal que f (a) = b;
(T2) existe a ∈ A tal que f (a) = b para todo b ∈ B;
(T3) para todo a ∈ A existe b ∈ B tal que f (a) = b;
(T4) existe b ∈ B tal que f (a) = b para todo a ∈ A;
(T5) para todo b ∈ B existe un único a ∈ A tal que f (a) = b;
(T6) para todo a ∈ A existe un único b ∈ B tal que f (a) = b;
(T7) para todos a1 , a2 ∈ A es f (a1 ) 6= f (a2 );
(T8) para todos a1 , a2 ∈ A, si f (a1 ) = f (a2 ) entonces a1 = a2 ;
(T9) para todos a1 , a2 ∈ A, si f (a1 ) 6= f (a2 ) entonces a1 6= a2 ,
explicar cuáles de las hipótesis siguientes las implican:
(H1) f es inyectiva;
(H2) f es suprayectiva;
(H3) f es biyectiva;
(H4) f es constante;
(H5) f es arbitraria;
(H8) ninguna f lo cumple;
(H7) el conjunto B de llegada verifica . . . (completar).
(Por ejemplo: (H2) =⇒ (T1) porque, según la definición, f es suprayectiva cuando etc.)
3.3. Sean f : A1 → B1 , g : A2 → B2 . Definamos h : A1 × A2 → B1 × B2 poniendo
h(x, y) = (f (x), g(y)) para cada (x, y) ∈ A1 ×A2 . Probar que h está bien definida. ¿Qué condiciones
sobre f y g permiten asegurar que h es inyectiva? ¿y que es suprayectiva? ¿y que es biyectiva?
3.4. Sean A ⊆ X y f : X → Y . Sea i : A → X la inclusión de A en X, definida por i(x) = x
para cada x ∈ A. Probar que
(i) f |A = f ◦ i;
1.4. Relaciones
Para las correspondencias entre un conjunto A y él mismo suele emplearse el nombre de re-
laciones. Una vez más, el cambio de nombre refleja un cambio (más psicológico que matemático)
en la manera de ‘percibir’ estas particulares correspondencias. Nos detendremos especialmente en
dos clases de relaciones: las relaciones de equivalencia, cuyo modelo de referencia es la relación de
igualdad entre los elementos de un conjunto, y las relaciones de orden, de las que ya es conocida al
menos la relación ≤ entre números reales. Pasemos a la definición formal.
Ejemplos.
(1) Sea R el conjunto de las rectas del plano. Se define en R la relación de incidencia poniendo:
para dos rectas r, s ∈ R, es r R s cuando y sólo cuando r y s tienen algún punto común.
(Esta relación se expresa brevemente diciendo hh r corta a sii)
(2) En el mismo conjunto, se define la relación de paralelismo k poniendo:
para dos rectas r, s ∈ R, es rks cuando y sólo cuando r y s son paralelas,
es decir, o no tienen ningún punto común o coinciden.
(3) Sea C el conjunto de las circunferencias del plano. Se define en C la relación de tangencia
poniendo:
para dos circunferencias C1 , C2 ∈ C, es C1 R C2 cuando y sólo cuando C1 y C2 son tangentes.
(4) En N, se define la relación de divisibilidad | poniendo:
para m, n ∈ N, es m | n cuando y sólo cuando m divide a n (i.e., n es un múltiplo de m).
(5) Análogamente se define la relación de divisibilidad en Z.
(6) Dado un conjunto X, se define en ℘(X) la relación de inclusión ⊆ poniendo:
para A, B ∈ ℘(X), es A ⊆ B cuando y sólo cuando A es un subconjunto de B.
Las propiedades más interesantes de las relaciones se recogen en la siguiente definición.
Ejercicio. ¿Cuáles de estas propiedades, y cuáles no, tienen las relaciones que hemos definido
anteriormente?
Ejemplos.
1.- El prototipo es la relación de igualdad en cualquier conjunto: a R b cuando a = b.
2.- La relación de paralelismo entre rectas es la única relación de equivalencia de las seis que
habı́amos definido en el apartado anterior.
1.4. RELACIONES 33
[a] = {b ∈ A : a R b}.
A/ R = {[a] : a ∈ A},
y ası́ A/ R ⊆ ℘(A).
Notemos que siempre a ∈ [a], por la propiedad reflexiva de R .
Ejemplos. Examinemos cuáles son las clases de equivalencia en las relaciones que hemos visto
anteriormente.
1.- Si a R b cuándo y sólo cuando a = b, [a] consta del único elemento a, es decir, [a] = {a} en
este caso. El conjunto cociente es el conjunto de los subconjuntos unipuntuales de A (que no es lo
mismo que A, aunque casi lo parezca).
2.- En la relación de paralelismo, cada clase de equivalencia consta de una recta y todas sus paralelas
(es lo que se llama un haz de rectas paralelas), todas las que tienen ‘la misma dirección’. Hay, pues,
tantas clases de equivalencia como ‘direcciones’.
3.- Cada clase de vectores equipolentes es lo que se denomina un vector libre .
4.- Las clases de equivalencia de fracciones las forman las fracciones ‘que representan un mismo
número racional’. De hecho, un número racional es una clase de equivalencia de fracciones y el
conjunto Q de los números racionales es el conjunto cociente del conjunto de fracciones por esta
relación de equivalencia. (Ver capı́tulo 3.)
5.- En la relación de congruencia módulo m, para cada a ∈ Z es
Estas clases de equivalencia suelen denominarse clases de restos módulo m, porque dos enteros a
y b están en la misma clase si y sólo si dan el mismo resto al ser divididos por m, es decir, si y sólo
si a = pm + r, b = qm + r para enteros adecuados p, q y r, con 0 ≤ r < m (comprobarlo). Para
m = 2, encontramos dos clases de equivalencia: el conjunto de los enteros pares y el conjunto de
los enteros impares.
En general, el conjunto cociente, que se denota por Zm , ¿cuántos elementos tiene? Tantos como
restos encontramos al dividir por m: 0, 1, . . . m − 1; es decir, m elementos.
6.- Un ejemplo más cotidiano: consideremos un conjunto de folios de papel de distintos colores
(perfectamente diferenciables), y digamos que dos folios son equivalentes si son de igual color.
Formar una clase de equivalencia es formar un conjunto (un ‘cuaderno’) con las hojas de un mismo
color. El conjunto cociente será un conjunto de cuadernos, cada uno de los cuales tiene sus hojas
de un determinado color, diferente del color de las hojas de los demás cuadernos.
Una relación de equivalencia permite ‘partir en trozos’ el conjunto, tomando cada clase de
equivalencia como uno de los trozos. Concretamente, se tiene:
Proposición 1.4.5. Sea R una relación de equivalencia en un conjunto no vacı́o A. Entonces
cada elemento de A está en una y sólo una de las clases de equivalencia definidas por R .
Para probarlo, nos apoyaremos en el siguiente
Lema 1.4.6. Sea R una relación de equivalencia en un conjunto no vacı́o A. Dados b, c ∈ A es
[b] = [c] si y sólo si b R c.
Demostración. Suponiendo [b] = [c], como c ∈ [c] = [b], se sigue que b R c.
Recı́procamente, sea b R c. Si x ∈ [b], serı́a b R x, que con c R b (propiedad simétrica de R )
darı́a c R x por transitividad, o sea, x ∈ [c]; y análogamente, de x ∈ [c] obtenemos c R x, que con
b R c da b R x y finalmente x ∈ [b].
2. si S, T ∈ C y S 6= T , S ∩ T = ∅.
Puesto que cada clase de equivalencia [a] contiene al menos al elemento a, la proposición 1.4.5
nos dice que el conjunto cociente A/ R (el conjunto de clases de equivalencia) es una partición de
A. Que definir una relación de equivalencia o definir una partición es ‘prácticamente lo mismo’ se
prueba en el siguiente teorema.
Teorema 1.4.8. Sea R una relación de equivalencia en un conjunto no vacı́o A. Entonces, el
conjunto de las clases de equivalencia es una partición de A.
Recı́procamente, si C es una partición de A, existe una relación de equivalencia R (y una sola)
tal que las clases de eqivalencia de R son exactamente los conjuntos de la partición C.
1.4. RELACIONES 35
¿Tenemos ası́ ciertamente una relación de equivalencia? Dado a ∈ A, como C es una partición,
existe S ∈ C tal que a ∈ S, luego a R a cualquiera que sea a y ası́ R es reflexiva. De la propia
definición se sigue que es simétrica. Para ver que es transitiva, observemos que si a R b existe un
S ∈ C tal que a ∈ S y b ∈ S, y si b R c existe un T ∈ C tal que b ∈ T y c ∈ T ; pero entonces
b ∈ S ∩ T , lo que por ser C una partición obliga a que S = T , deduciéndose que a, c ∈ S = T y
a R c.
¿Son las clases de equivalencia de R exactamente los S ∈ C? Es decir: ¿cada clase de equiva-
lencia de R está en C? ¿y cada S ∈ C es una clase de equivalencia de R ?
Notemos que dados a ∈ A, S ∈ C, se tiene
a ∈ S si y sólo si [a] = S.
Dado a ∈ A, es [a] ∈ C, pues como C es una partición de A, debe existir S ∈ C tal que a ∈ S,
y ası́ [a] = S.
Finalmente, si queremos comprobar que la relación R que hemos construido es la única que
tiene estas clases de equivalencia, basta aplicar el lema 1.4.6.
Ejemplos.
1. Sea A el conjunto de los números enteros pares y B el conjunto de los números enteros
impares. Entonces {A, B} es una partición de Z, y la relación de equivalencia que define es
la congruencia módulo 2.
Ejercicio. Comprúebese, para cada una de las relaciones de equivalencia que hemos encontrado,
que las clases forman una partición del correspondiente conjunto.
Ejemplos.
1.- El prototipo es la relación de orden en cualquier subconjunto de R: a R b cuando a ≤ b.
36 CAPÍTULO 1. CONJUNTOS
2.- En todo conjunto se puede definir una relación de orden trivial: la igualdad, a R b si y sólo si
a = b.
3.- Dado un conjunto X, la inclusión entre subconjuntos de X es una relación de orden en ℘(X).
4.- La relación de divisibilidad en N es una relación de orden, pero no lo es la divisibilidad en Z
(falla ‘por poco’ la propiedad antisimétrica).
5.- En C puede definirse el orden lexicográfico de la siguiente manera:
para z1 , z2 ∈ C, es z1 ≤ z2 cuando y sólo cuando <e z1 < <e z2 , o <e z1 = <e z2 y =m z1 ≤ =m z2 .
Es fácil comprobar que tiene las propiedades reflexiva, antisimétrica y transitiva. ¿Cuál es la
representación gráfica del conjunto {z ∈ C : 0 ≤ z}?
6.- Ası́ mismo, en C puede definirse el orden producto de la siguiente manera:
para z1 , z2 ∈ C, es z1 ≤ z2 cuando y sólo cuando <e z1 ≤ <e z2 y =m z1 ≤ =m z2 .
También tiene las propiedades reflexiva, antisimétrica y transitiva. ¿Cuál es ahora la represen-
tación gráfica del conjunto {z ∈ C : 0 ≤ z}?
De una manera más formal, un conjunto ordenado serı́a un par (A, R ), donde A es un conjunto y
R una relación de orden en A. Por ejemplo, (N, ≤) y (N, | ) son dos conjuntos ordenados (distintos,
aunque tengan el mismo conjunto base).
Definición 1.4.11. Una relación de orden R en un conjunto A es un orden total si para todo
par a, b de elementos de A se tiene que o bien a R b o bien b R a; en caso contrario, R es un
orden parcial .
@s 4 6 s s 15
@ @
@@ @
@ @
@s @s @s s
2 3 5 7
Ejercicio. ¿Cómo se verı́a en un diagrama de Hasse que la relación representada es un orden total?
Definiciones 1.4.12. Sea A un conjunto ordenado, y denotemos por ≤ su relación de orden. Sea
S un subconjunto de A.
Si para algún a ∈ A es a ≤ s para todo s ∈ S, diremos que a es una cota inferior de S y que
S está acotado inferiormente (por a).
Si para algún b ∈ A fuese b ≥ s para todo s ∈ S, diremos que b es una cota superior de S y
que S está acotado superiormente (por b).
1.4. RELACIONES 37
Cuando S está acotado a la vez superior e inferiormente, se dice que S está acotado .
Un m ∈ A es mı́nimo de un conjunto S si pertenece al conjunto y es una cota inferior del
mismo. Es decir, si m ∈ S y m ≤ s para todo s ∈ S. Pondremos entonces m = mı́n S.
Un M ∈ A es máximo de un conjunto S si pertenece al conjunto y es una cota superior del
mismo. Es decir, si M ∈ S y M ≥ s para todo s ∈ S. Pondremos entonces M = máx S.
Un elemento a ∈ A es ı́nfimo de un conjunto S si es el máximo del conjunto de cotas inferiores
de S. Pondremos entonces a = inf S.
Nótese que si a = inf S, será a = mı́n S si y sólo si a ∈ S.
Un elemento b ∈ A es supremo de un conjunto S si es el mı́nimo del conjunto de cotas
superiores de S. Pondremos entonces b = sup S
Nótese que si b = sup S, será b = máx S si y sólo si a ∈ S.
Otros conceptos importantes en las relaciones de orden son los siguientes.
Definición 1.4.13. Dado un conjunto ordenado (A, ≤) y un subconjunto S de A, un elemento
x ∈ S se dice maximal si para cada a ∈ S tal que x ≤ a, debe ser x = a; un elemento y ∈ S se
dice minimal si para cada b ∈ S tal que b ≤ y, debe ser b = y.
En un conjunto ordenado puede no haber elementos maximales o minimales, igual que no
siempre hay máximos o mı́nimos (Ver [D-H], p. 13; [GJPR], p. 29). En el diagrama de Hasse que
hemos dibujado anteriormente, son elementos minimales el 2, el 3, el 5 y el 7; son elementos
maximales el 7, el 8 y el 30; no hay un elemento máximo ni un elemento mı́nimo, ni tampoco
supremo ni ı́nfimo.
Ejercicios
4.1. Dados dos conjuntos A y B, probar que A × B = ∅ si y sólo si A = ∅ o B = ∅.
4.2. Sean A y B dos conjuntos. Si A × B 6= ∅, probar que A × B ⊆ C × D cuando y sólo cuando
A ⊆ C y B ⊆ D. ¿Por qué hemos necesitado suponer A × B 6= ∅?
4.3. Sea R una relación en un conjunto A. ¿Es cierto que para todo a ∈ A hay al menos un b ∈ B
tal que a R b? ¿Por qué?
4.4. Para cada punto P del plano, el haz de rectas de vértice P es el conjunto de las rectas
que pasan por P . ¿Pueden ser los haces de rectas las clases de equivalencia de alguna relación de
equivalencia? ¿Por qué?
4.5. Sea R la relación definida en N × N de la siguiente manera:
dados dos pares (m, n), (p, q) ∈ N × N, es (m, n) R (p, q) cuando y sólo cuando m + q = p + n.
Estudiar si R es reflexiva, simétrica, antisimétrica, transitiva. ¿Es R una relación de equivalen-
cia? En caso afirmativo, ¿cuáles son las correspondientes clases de equivalencia? Representarlas
gráficamente en el plano.
4.6. Sea R una relación en un conjunto A y S un subconjunto de A. Consideremos en S la relación
R 0 definida por: a R 0 b para a, b ∈ S si y sólo si a R b (la restricción de R a S). Probar que si
R es un relación de equivalencia en A, R 0 es una relación de equivalencia en S; y que si R es una
relación de orden en A, R 0 es una relación de orden en S.
4.7. Sea A un conjunto cualquiera y R una relación de orden en A. Definimos la relación inversa
R−1 poniendo
para x, y ∈ A, es x R−1 y cuando y sólo cuando y R x.
−1
Probar que R es también una relación de orden en A (el llamado orden inverso de R).
Si R es un orden total, ¿es R−1 un orden total? ¿por qué?
4.8. Sea A un conjunto ordenado y S un subconjunto de A. Probar que si existe el máximo o el
mı́nimo de S, es único.
38 CAPÍTULO 1. CONJUNTOS
4.9. ¿Qué puede decirse sobre la unicidad de los elementos maximales o minimales en una relación
de orden según sea o no un orden total?
4.10. Sea S = {z = x+iy ∈ C : x, y ∈ R, x2 +y 2 ≤ 1} el cı́rculo de centro 0 y radio 1. Considerando
en C el orden producto definido anteriormente, ¿tiene S elemento máximo? ¿y elemento mı́nimo?
¿y elementos maximales? ¿y elementos minimales? ¿cuáles son? ¿por qué?
Responder las preguntas anteriores considerando en C el orden lexicográfico.
α β γ δ ε ζ η θ ι κ λ µ ν ξ o π % σ τ υ ϕ χ ψ ω
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24
“una letra ↔ un número”, consecutivamente, teniendo buen cuidado de no repetir letras ni sal-
tar números, hasta agotar todas las letras disponibles. En definitiva, estamos estableciendo una
aplicación biyectiva entre el conjunto “alfabeto griego” y el conjunto de “los veinticuatro primeros
números naturales”, o viceversa (si nos fijamos en la aplicación inversa). Generalizando esta idea,
definiremos los conjuntos finitos y el número de elementos de un conjunto finito.
Notación. Para n ∈ N, pongamos N(n) = {k ∈ N : k ≤ n}.
Definición 1.5.1. Diremos que un conjunto A es finito si es vacı́o o existe un n ∈ N tal que hay
una biyección f : N(n) → A.
Qué es el número de elementos de un conjunto ası́ es ‘casi’ obvio. Sólo casi, porque nuestra
experiencia contando conjuntos muy grandes nos dice que no siempre se llega a la misma respuesta
(si vuestros amigos contaran los asistentes al último concierto de vuestro grupo favorito, ¿obtendrı́an
todos el mismo número?) El lema siguiente garantizará que si al contar el número de elementos de
un mismo conjunto se obtienen valores diferentes, es que hay un error.
Lema 1.5.2. Sean m, n ∈ N. Si existe una biyección f : N(m) → N(n), entonces m = n.
Demostración. Procederemos por inducción sobre el enunciado
Pn : Para todo m ∈ N, si existe una biyección f : N(m) → N(n), entonces m = n.
P1 es cierto: si f : N(m) → N(1) = {1} es una biyección, será f (x) = 1 para un único
x ∈ N(m); y si m 6= 1, N(m) tiene al menos un elemento y 6= x, para el que forzosamente f (y) = 1,
contradiciendo la inyectividad de f . Por tanto, m = 1.
Supuesto cierto Pn , también es cierto Pn+1 . Pues si para un m ∈ N existe una biyección
f : N(m) → N(n+1), entonces m 6= 1 (en caso contrario, f (N(m)) = f (N(1)) = {f (1)}, y en N(n+1)
habrı́a elementos distintos de f (1) que no estarı́an en la imagen de f ), y además f (x) = n + 1 para
un único x ∈ N(m). La aplicación f 0 : N(m) \ {x} → N(n) dada por f 0 (k) = f (k), k ∈ N(m) \ {x},
está bien definida y es biyectiva (¿por qué?). Definiendo ahora h : N(m − 1) → N(m) \ {x} por
(
k si k < x,
h(k) =
k + 1 si x < k ≤ m − 1,
1.5. CONJUNTOS FINITOS Y NUMERABLES 39
g = f 0 ◦ h : N(m − 1) → N(n),
composición de dos aplicaciones biyectivas, es biyectiva (¿por qué?). Por la hipótesis de inducción,
esto obliga a que m − 1 = n, y ası́ m = n + 1.
Definición 1.5.4. Diremos que un conjunto A es numerable o que tiene cardinal ℵ0 si existe
una biyección f : N → A.
Diremos que A es contable si es finito o numerable.
Definición 1.5.5. Dados dos conjuntos A y B, si existe una biyección f : A → B diremos que A
y B son equipotentes (escrito A ∼ B) o que tienen el mismo cardinal (escrito |A| = |B| o
#A = #B o card A = card B).
Permutaciones
¿De cuántas maneras diferentes se pueden poner cuatro neumáticos a un coche? Hay cuatro posicio-
nes posibles: 1) delantera izquierda, 2) delantera derecha, 3) trasera izquierda, 4) trasera derecha.
Inicialmente, en la posición 1) podemos colocar uno cualquiera de los neumáticos, que distingui-
remos con las letras a, b, c, d: hay cuatro posibilidades diferentes. Elegida una de las cuatro, en
la posición 2) podemos colocar uno cualquiera de los tres neumáticos restantes: eso da 4 · 3 = 12
posibilidades. A partir de cada una de ellas, la elección de uno de los dos neumáticos restantes para
ocupar la posición 3) nos lleva a 12 · 2 = 24 posibilidades, y para la posición 4) ya sólo dispone-
mos de un neumático, ası́ que hay finalmente 4 · 3 · 2 · 1 = 4! = 24 maneras distintas de colocar
los neumáticos. Cada una de ellas se obtiene de las demás ‘intercambiando’ o ‘permutando’ los
neumáticos de lugar.
1) a b c d
2) b c d a c d a b d a b c
3) c d b d b c c d a d a c b d a d a b b c a c a b
4) d c d b c b d c d a c a d b d a b a c b c a b a
En los textos antiguos, las permutaciones de elementos de un conjunto se definı́an como ‘las
diversas ordenaciones que podemos formar con los elementos del conjunto, sin repetirlos ni olvidar
ninguno, de manera que dos cualesquiera contienen los mismos objetos y difieren solamente en el
orden de colocación de éstos’ (cf., por ejemplo, [Rey-P-T]). Por tanto, el paso de una permutación
a otra puede identificarse con una biyección del conjunto en sı́ mismo, que es la definición actual.
Combinaciones
Definición
1.5.8. Dados dos enteros no negativos n y k, con n ≥ k, el número combinatorio
n
, leı́do n sobre k, es el número
k
n n!
= .
k k!(n − k)!
Pongamos ahora Ckn para denotar el número de subconjuntos con k elementos de un conjunto
con n elementos (el número de combinaciones de n elementos tomados de k en k). Como A ⊆ B
implica que |A| ≤ |B| (¿por qué?), esto supone que si k > n, Ckn = 0. Si k = n, obviamente Ckn = 1,
ası́ como C0n = 1. En los restantes casos,
Hay muchı́simas relaciones entre los números combinatorios, que expondremos según las vaya-
mos necesitando. Por ejemplo, es obvio que
n n! n! n
= = = ,
n−k (n − k)!(n − (n − k))! k!(n − k)! k
que responde a la idea de que con cada subconjunto B de A de k elementos tenemos emparejado
el subconjunto A \ B de n − k elementos (y viceversa), con lo cual tantos hay de un tipo como del
otro.
Otra expresión útil es la siguiente:
n n(n − 1) · · · (n − k + 1)
= ,
k k!
que se obtiene dividiendo por (n − k)! el numerador y el denominador en la fórmula inicial. Ası́ es
obvio que
n+1 n+1 n n+1 n+1 n
= o que = .
k (n + 1) − k k k+1 k k
Los números combinatorios se llaman también coeficientes binómicos, debido al siguiente resul-
tado.
42 CAPÍTULO 1. CONJUNTOS
n
n
X n
(x + y) = xk y n−k .
k
k=0
Para obtener los coeficientes del binomio (los números combinatorios) se puede emplear el
llamado triángulo de Pascal o de Tartaglia, v. [6]:
1
1 1
1 2 1
1 3 3 1
1 4 6 4 1
1 5 10 10 5 1
1 6 15 20 15 6 1
1 7 21 35 35 21 7 1
1 8 28 56 70 56 28 8 1
que permite pasar de una fila a la siguiente obteniendo cada elemento como suma de los dos que
tiene encima.
Esta identidad justamente es la que se necesita para dar una demostración alternativa de la
fórmula del binomio mediante inducción.
En efecto: dados n ∈ N y x, y ∈ R, sea Pn el enunciado
n
n
X n
(x + y) = xk y n−k .
k
k=0
P1 1
Para n = 1, P1 afirma que (x + y)1 = xk y 1−k = 1 · x0 y 1 + 1 · x1 y 0 , es decir, que
k=0 k
x + y = y + x, lo cual es obviamente cierto.
1.5. CONJUNTOS FINITOS Y NUMERABLES 43
n
n+1 n
X n
(x + y) = (x + y) (x + y) = ( xk y n−k ) (x + y)
k
k=0
n n n−1 n k n−k n
= y + xy + ··· + x y + ··· + xn−1 y + xn (x + y)
1 k n−1
n n 2 n−1 n k+1 n−k n
= xy + x y + ··· + x y + ··· + xn y + xn+1
1 k n−1
n+1 n n n k n−k+1 n
+ y + xy + ··· + x y + ··· + xn−1 y 2 + xn y
1 k n−1
n n n n
= y n+1 + + x yn + · · · + + xk y n−k+1 + · · ·
0 1 k−1 k
n n
+ + xn y + xn+1
n−1 n
n+1 n + 1 k n−k+1 n+1 n
= y n+1 + x yn + · · · + x y + ··· + x y + xn+1
1 k n
n+1
X n + 1
= xk y n−k+1
k
k=0
Principios generales
Como muestran los apartados anteriores, para contar los elementos de ciertos conjuntos finitos
suele interesar, en general, organizarlos de manera que se pueda diseñar una estrategia simple que
facilite el recuento. En el nivel más sencillo de aplicación de esta idea hay algunos principios básicos
que recogemos a continuación; para más detalles, nos remitimos a las referencias ya citadas ([1],
[D’A-W], [Lieb]).
Para empezar, veamos como se cuenta el número de elementos de un conjunto ‘por trozos’.
|A ∪ B| = |A| + |B|.
Entonces
|A1 ∪ A2 ∪ · · · ∪ An | = |A1 | + |A2 | + · · · + |An |.
44 CAPÍTULO 1. CONJUNTOS
entonces
|A1 ∪ A2 ∪ · · · ∪ An | = α1 − α2 + · · · + (−1)n+1 αn .
Los ejercicios siguientes ilustran cómo el manejo del lenguaje de la teorı́a de conjuntos es
utilı́simo en el análisis de situaciones que a primera vista no se relacionarı́an con dicha teorı́a.
Ejercicios
5.1. ¿Puede creerse a un investigador que informa que, de cada 1000 habitantes, a 816 les gusta el
azúcar; a 723, el helado; a 645, los pasteles; y asimismo que a 562 les gusta el azúcar y el helado; a
463, el azúcar y los pasteles, y a 470, los pasteles y el helado, y sólo a 310 les gustan las tres cosas?
5.2. Tres monedas, una de cobre, otra de nı́quel y otra de plata, son lanzadas simultáneamente
al aire, y esto 100 veces. La de cobre muestra cara en 70 ocasiones, la de nı́quel muestra cara en
50 pruebas y la de plata muestra cara en 56 pruebas. La de cobre y la de nı́quel han mostrado
simultáneamente cara 31 veces y la de nı́quel y de plata han presentado tal circunstancaia 28 veces.
Probar que las tres monedas han mostrado cara simultáneamente por lo menos 9 veces y que las
tres han mostrado simultáneamente cruz a lo más 11 veces.
5.3. En una encarnizada batalla, por lo menos el 70 por ciento de los combatientes pierde un ojo;
al menos un 75 por ciento, una oreja; al menos un 80 por ciento, un brazo, y al menos un 85 por
ciento, una pierna. ¿Cuántos por lo menos han perdido las cuatro cosas? (Lewis Carroll.)
5.4. (Frases matemáticas célebres) Las matemáticas se componen de un 50 % de fórmulas, de un
50 % de demostraciones y de un 50 % de imaginación.
Proposición 1.5.14 (Principio de las cajas o principio del palomar). Si queremos repartir
n objetos en m cajas con rm < n, al menos una caja ha de recibir más de r objetos.
La demostración (muy fácil) junto con ejemplos y ejercicios de aplicación del mismo puede verse
en [D’A-W], cap. 10, pp. 158–162 y 167–169.
En el cálculo del número de permutaciones de n elementos hemos usado implı́citamente un
procedimiento que [Lieb, p. 116] expone ası́:
Ejemplo. Un sistema de seguridad usa palabras clave que constan de dos letras seguidas por dos
dı́gitos (decimales). ¿Cuántas palabras clave distintas pueden formarse?
Respuesta. 27 × 27 × 10 × 10, incluyendo la ñ y excluyendo la ch y la ll, que constan de dos
caracteres. (Cf. [Lieb, p. 115].)
1.5. CONJUNTOS FINITOS Y NUMERABLES 45
Contar en tablas. Para contar los elementos de un conjunto es a veces conveniente expresar el
conjunto como subconjunto de un producto cartesiano, representándolo en una tabla. Ası́, el número
total de elementos del conjunto puede obtenerse sumando el número de elementos del conjunto que
hay en cada una de las filas, o bien sumando el número de elementos del conjunto que hay en cada
una de las columnas.4 Con una idea tan simple pueden contestarse preguntas como la siguiente:
Ejemplo. De los alumnos de una clase 32 son varones y cada uno de ellos conoce exactamente a
5 compañeras. Si cada alumna conoce exactamente a 8 compañeros, ¿cuántas alumnas hay en la
clase?
Respuesta. 32 × 5 = n × 8 =⇒ n = 20. (V. [1, pp. 96–97])
Hay multitud de problemas curiosos que se resuelven usando los métodos ‘combinatorios’ ex-
puestos en este apartado. Como pasatiempo de vacaciones, recomendamos especialmente los de
[D’A-W] (repartidos por todo el libro) y [Lieb], cap. 15.
4
Este resultado, cuya demostración rigurosa es más complicada de formular de lo que en principio cabrı́a suponer,
puede verse como ‘un anticipo en versión finita’ del teorema de Fubini, un resultado muy importante sobre integración
que se estudiará en cursos superiores de Análisis matemático.
46 CAPÍTULO 1. CONJUNTOS
Bibliografı́a
[C-H] Cohen, P. J.; Hersh, R.: Teorı́a de conjuntos no cantoriana. En [Kl], pp. 238–247.
[D’A-W] D’Angelo, J. P.; West, D. B.: Mathematical Thinking. Problem-Solving and Proofs.
Prentice-Hall, Upper Saddle River, NJ, 1997.
[GJPR] Goberna, M. A.; Jornet, V.; Puente, R.; Rodrı́guez, M.: Álgebra y fundamentos.
Una introducción. Ariel, Barcelona, 2000.
[G-H] Griffits, H. B.; Hilton, P. J.: Classical Mathematics. Van Nostrand Reinhold, London,
1970.
[Ham] Hamilton, A. G.: Numbers, sets and axioms: the apparatus of mathematics. Cambridge
Univ. Press, 1982.
[Lieb] Liebeck, M.: A Concise Introduction to Pure Mathematics. Chapman & Hall/CRC,
Boca Raton, 2000.
[Lip] Lipschutz, S.: Teorı́a de Conjuntos y temas afines. (Col. Schaum) McGraw-Hill, Méxi-
co, 1969.
[O.U.] Open University: Introducción al cálculo y al álgebra (vol. 3: Álgebra). Reverté, Bar-
celona, 1977.
[Rey-P-T] Rey Pastor, J.; Pi Calleja, P.; Trejo. C. A.: Análisis matemático vol. I. Kapelusz,
Buenos Aires, (7a. ed.), 1963.
[S-T] Stewart, I.; Tall, D.: The Foundations of Mathematics. Oxford Univ. Press, 1977.
Documentos en Internet
47
48 BIBLIOGRAFÍA
En el desarrollo del tema de los números enteros seguiremos básicamente el texto [D-H]. Sobre
números naturales, si es necesario puede ser útil como libro de consulta [S-T].
Los restantes libros de la bibliografı́a sirven de complemento en algunos puntos concretos que
señalaremos en su momento.
49
50 CAPÍTULO 2. NÚMEROS NATURALES Y ENTEROS
de este al siguiente, etc. Ahora que disponemos del lenguaje de la teorı́a de conjuntos, usémoslo
para expresar este proceso.
Olvidando la suma (ya la reconstruiremos después), pongamos sgt (n) en vez de n + 1 para el
‘siguiente’ a n. ‘Pasar de un número natural al siguiente’ es asociar a cada n su siguiente sgt (n),
lo que en el lenguaje conjuntista no es más que definir una aplicación sgt : n ∈ N → sgt (n) ∈ N.
Obviamente, esta aplicación es inyectiva: si m 6= n, sgt (m) 6= sgt (n). Que 1 es ‘el primer número
natural’ es decir que no sigue a ninguno, 1 6= sgt (n) cualquiera que sea n ∈ N; o, en otros términos,
1 no está en el conjunto imagen de la aplicación sgt , 1 ∈ N \ sgt (N). También sabemos que el
principio de inducción tiene un enunciado ‘conjuntista’ en términos de esta aplicación:
dado S ⊆ N tal que 1 ∈ S y sgt (n) ∈ N siempre que n ∈ N, necesariamente S = N,
y gracias a él podemos cerrar el proceso, como descubrieran R. Dedekind [Ddk] y G. Peano
[Peano] entre otros.
Es un hecho notable, y un tanto sorprendente, que todas las propiedades usuales de los números
naturales pueden deducirse de estas, como puso de manifiesto el matemático italiano G. Peano en
su obra [Peano]. Aunque Dedekind habı́a planteado con anterioridad un sistema similar (si bien más
complicado, ver [Ddk]), hoy se llaman en su honor axiomas de Peano para los números naturales.
En una formulación más ‘clásica’, más próxima a la original de Peano,1 suelen enunciarse ası́:
Que 1 es el único elemento de N que no está en el conjunto imagen de la aplicación sgt puede
demostrarse por inducción; ası́, el conjunto imagen de dicha aplicación es exactamente N \ {1} (V.
[S-T], p. 147).
Pasemos a ver cómo se construyen por recurrencia las operaciones de suma y producto.
1
En alguna versión posterior, como la publicada en 1895 que reproducimos en [2], Peano parte de 0 como primer
número natural. Ası́ se hace también en las referencias [S-T], [Ham].
2.1. NÚMEROS NATURALES. 51
¡Hemos dado una definición recurrente de la suma! También el producto puede definirse por
recurrencia, apoyándonos en la suma que acabamos de construir:
(i) m · 1 = m
Otras propiedades
(1) Todos los números naturales son mayores o iguales que 1. Es decir, mı́n N = 1.
(Aplı́quese el principio de inducción a la proposición Pn : n ≥ 1.)
(2) Dados m, n ∈ N, se tiene m > n si y sólo si existe p ∈ N tal que m = n + p, lo que abreviaremos
poniendo hh m − n ∈ N ii.
(En este caso, todo es evidente salvo que m = n + p para algún p ∈ N implica m 6= n; para
probarlo, véase primero por inducción sobre m que m 6= m + 1 cualquiera que sea m ∈ N, y después
que para todo m ∈ N, m 6= m + p por inducción sobre p.)
(3) Dados m, n ∈ N, no puede verificarse n < m < n + 1. En palabras, entre dos números naturales
consecutivos no hay ningún número natural.
(Puesto que si m ∈ N serı́a m − n ∈ N por (2) y m − n < 1, contradiciendo (1).)
x + a = b,
2.2. NÚMEROS ENTEROS. 53
cuya representación gráfica como puntos de una recta nos es también familiar.
Aunque puede darse una construcción ‘algebraico-conjuntista’ de los números enteros (ver
[GJPR], pp. 91 y ss.), nosotros nos contentaremos de momento con esta idea ‘ingenua’ adoptando
(al menos por ahora) la siguiente descripción.
+ : (m, n) ∈ Z × Z → m + n ∈ Z, · : (m, n) ∈ Z × Z → m n ∈ Z,
Otras propiedades y conceptos en torno a la ordenación de Z son similares a las que el lector
estará manejando en R. Por ejemplo,
Z17. Relación con la suma. a ≤ b =⇒ a + c ≤ b + c.
Z18. Relación con el producto. Si c ≥ 0, a ≤ b =⇒ a c ≤ b c. Si c < 0, a ≤ b =⇒ a c ≥ b c.
El valor absoluto de un número entero a es el número entero no negativo
(
a, si a ≥ 0;
|a| =
−a, si a ≤ 0.
2.2. NÚMEROS ENTEROS. 55
Con esta definición, si a, b, denotan números enteros cualesquiera, se verifican, entre otras, las
siguientes relaciones:
|1| = 1; | − 1| = 1.
| − a| = |a|.
−|a| ≤ a ≤ |a|.
|a b| = |a| |b|.
Ejercicios
6.1. En las propiedades básicas de Z hemos señalado que todo n ∈ Z tiene un opuesto −n tal que
n + (−n) = (−n) + n = 0. ¿Puede haber algún otro m ∈ Z tal que n + m = m + n = 0? ¿Por qué?
Sugerencia: ¿quién serı́a m + n + (−n)?
6.2. Por definición, −1 es el opuesto de 1. Probar que la igualdad (−1)(−1) = 1 es una consecuencia
de la propiedad distributiva.
6.3. Dado un entero cualquiera n, probar que (−1) · n es el opuesto de n.
6.4. Dado un entero arbitrario a, definimos
a0 = 1 ; an+1 = an · a.
a = cb + r, 0 ≤ r < |b|.
Nota. Las figuras que siguen ilustran gráficamente la situación. Para a ≥ 0, se ve que, simplemente,
‘estamos midiendo a con b como unidad de medida’, trasladando un segmento de longitud b hacia
la derecha el número máximo de veces que podamos, sin llegar a sobrepasar a (por la derecha);
para a < 0, trasladarı́amos la unidad de medida hacia la izquierda, justo hasta igualar o sobrepasar
a (por la izquierda).
• Mathematica :
— El cociente entero de un entero cualquiera m por un entero positivo n se obtiene escribiendo
Quotient[m,n]
— El resto de la división entera de un entero cualquiera m por un entero positivo n se obtiene
escribiendo
Mod[m,n]
— si n es un entero negativo, Quotient[m,n] y Mod[m,n] dan los enteros q y r tales que m = n·q+r,
|r| < |n| y r ≤ 0.
En el ejemplo anteriormente comentado, resultarı́a:
maple Mathematica
m n cociente resto iquo(m,n) irem(m,n) Quotient[m,n] Mod[m,n]
1 2 0 1 0 1 0 1
−1 2 −1 1 0 −1 −1 1
1 −2 0 1 0 1 −1 −1
−1 −2 1 1 0 −1 0 −1
Ejercicios
7.1. Sea a un entero cualquiera y sean b y m enteros positivos. Si q es el cociente y r es el resto de
la división entera de a por b, probar que q es el cociente y mr es el resto de la división entera de
ma por mb.
7.2. Sean a, b, c enteros con b > 0, c > 0. Si q es el cociente de la división entera de a por b y q 0 es
el cociente de la división entera de q por c, probar que q 0 es el cociente de la división entera de a
por bc.
7.3. Demostrar, utilizando el algoritmo de la división, que si un número entero es a la vez un
cuadrado y un cubo, entonces se puede escribir en la forma 7k o 7k + 1.
1984 = c0 + c1 · 2 + c2 · 22 + · · · + cn · 2n ,
N = c0 + c1 · 2 + c2 · 22 + · · · + cn · 2n = c0 + (c1 + c2 · 2 + · · · + cn · 2n−1 ) · 2
= c0 + (c1 + (c2 + · · · + cn · 2n−2 ) · 2) · 2 = · · · = c0 + (c1 + (c2 + (· · · + (cn · 2) · · · 2) · 2) · 2,
lo que deja
1984 = 0 + 0 · 2 + 0 · 22 + 0 · 23 + 0 · 24 + 0 · 25 + 1 · 26 + 1 · 27 + 1 · 28 + 1 · 29 ,
o con alguna notación similar que destaque que se trata de una representación binaria.
¿Qué interés puede tener una representación ası́, disponiendo como disponemos de nuestra
‘confortable’ notación decimal? El creador del sistema binario, Leibniz, lo veı́a, entre otras cosas,
como una imagen del ‘misterio de la creación’: el 1 representaba a Dios y el 0 la Nada, de la que
todas las cosas fueron creadas. Trescientos años más tarde, resulta que la mayorı́a de los ordenadores
actuales manejan los números a través de su representación binaria, que luego convierten en decimal.
La ventaja que esto ofrece es que cada número se registra en “bits” (binary digits) y cada bit se
corresponde con uno de dos estados posibles (pasa corriente o no pasa). Estas dos condiciones
corresponden a los valores 1 y 0, respectivamente. Ası́, un número representado por una sucesión
de 1 y 0 puede almacenarse en un ordenador como una cadena de bits.
Pero la gran ventaja del sistema binario, que sólo necesita dos caracteres, es a veces su gran
inconveniente: incluso los números pequeños requieren muchas cifras en su escritura. Los números
en representación binaria son, por tanto, muy largos y de manejo incómodo. Pese a ello, como los
ordenadores están formados por dispositivos digitales que sólo tienen dos estados estables posibles,
asimilados a 0 y a 1, puede decirse que casi todos ellos ‘trabajan’ en sistema binario.
Para paliar los inconvenientes del sistema binario hay distintas soluciones. Como comprobaremos
inmediatamente, cualquier entero b mayor o igual que 2 puede tomarse como base de un sistema de
numeración. Si la base b es una potencia de 2, la ‘traducción’ del sistema binario a esta base es muy
cómoda. Por esto, algunos programas de ordenador, sobre todo cuando se trabaja en lenguajes de
ensambladores o en lenguajes de alto nivel como C, emplean el sistema octal (base 8), con dı́gitos
hh 0, 1, 2, 3, 4, 5, 6, 7 ii, o el hexadecimal, usado también en el mundo de la comunicación (las cifras
m + n = (1 · 25 + 0 · 24 + 0 · 23 + 1 · 22 + 1 · 21 + 0) + (1 · 24 + 1 · 23 + 0 · 22 + 1 · 21 + 1)
= (1 + 0) · 25 + (0 + 1) · 24 + (0 + 1) · 23 + (1 + 0) · 22 + (1 + 1) · 21 + (0 + 1)
= (1 + 0) · 25 + (0 + 1) · 24 + (0 + 1) · 23 + (1 + 0) · 22 + (1 + 1) · 21 + 1
= (1 + 0) · 25 + (0 + 1) · 24 + (0 + 1) · 23 + (1 + 0) · 22 + (1 · 2 + 0) · 21 + 1
= (1 + 0) · 25 + (0 + 1) · 24 + (0 + 1) · 23 + (1 + (1 + 0)) · 22 + 0 · 21 + 1
= (1 + 0) · 25 + (0 + 1) · 24 + (0 + 1) · 23 + (1 · 2 + 0) · 22 + 0 · 21 + 1
= (1 + 0) · 25 + (0 + 1) · 24 + (1 + (0 + 1)) · 23 + 0 · 22 + 0 · 21 + 1
= etc.,
que es lo que que realmente queremos indicar cuando escribimos, prescindiendo del subı́ndice (2 por
comodidad,
“llevo” : +1 +1 +1 +1 +1
m: 1 0 0 1 1 0
n: 1 1 0 1 1
m+n: 1 0 0 0 0 0 1
Análogamente se van adaptando las operaciones más complicadas.
Cambios de base
Establecida la existencia y unicidad de representación en cualquier base b ≥ 2, la cuestión que
se suscita inmediatamente es: ¿cómo pasar de la representación de un número n en una base b a
la representación en una nueva base β? Cuando entre b y β no haya ninguna relación ‘especial’, no
podemos apelar a más recursos que los que hemos señalado en el apartado anterior. Por ejemplo,
ya hemos visto cómo expresar el número decimal 1984 en base 2, y si nos dan un número binario
como 11010011(2 , su representación decimal serı́a
1 1 0 1 0 0 1 1
2) 2 6 12 26 52 104 210
1 3 6 13 26 52 105 211
Pero en circunstancias especiales puede haber simplificaciones. Esto sucede, en particular, si
una de las bases es una potencia de la otra, como es el caso cuando se considera b = 2 y β = 8 = 23 ,
o b = 2 y β = 16 = 24 . En la primera situación, como
n = c0 + c1 · 2 + c2 · 22 + c3 · 23 + c4 · 24 + c5 · 25 + c6 · 26 + c7 · 27 + c8 · 28 + c9 · 29 + · · ·
= (c0 + c1 · 2 + c2 · 22 ) + (c3 + c4 · 2 + c5 · 22 ) · 23 + (c6 + c7 · 2 + c8 · 22 ) · (23 )2 + · · · ,
d0 = c0 + c1 · 2 + c2 · 22 , d1 = c3 + c4 · 2 + c5 · 22 , d2 = c6 + c7 · 2 + c8 · 22 , ...
Por ejemplo:
1100100101010(2 → [1][100][100][101][010] → 14452(8 .
Y recı́procamente,
Por ejemplo,
D 0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15
B 0 1 10 11 100 101 110 111 1000 1001 1010 1011 1100 1101 1110 1111
H 0 1 2 3 4 5 6 7 8 9 A B C D E F
Recursos informáticos
Los programas de cálculo permiten, por lo general, obtener las cifras de cualquier representación
en una base dentro de tamaños ‘no disparatados’.
En Mathematica , la orden
IntegerDigits[n,b]
da una lista de los dı́gitos en base b del número decimal n, mientras que
b^^n
donde n es la representación en base b de un número, da el valor decimal del número. Por ejemplo,
IntegerDigits[10!] da {3, 6, 2, 8, 8, 0, 0},
IntegerDigits[10!,2] da {1,1,0,1,1,1,0,1,0,1,1,1,1,1,0,0,0,0,0,0,0,0},
y 16^^16c91a3 da 23892387.
En la red es fácil encontrar applets de Java que realizan conversiones de base interactivamente.
P. ej., en la siguiente dirección puede pasarse ‘instantáneamente’ de base decimal a base binaria y
viceversa.
http://www.vincesplace.com/TraditionalCourses/cis121/assignments/BinaryNum/BinaryNum.htm
62 CAPÍTULO 2. NÚMEROS NATURALES Y ENTEROS
Ejercicios
8.1. Convertir a sistema decimal y binario los números hexadecimales ACABA y FE0.
8.2. En el sistema hexadecimal, ¿es cierto que B0B0 + A0A = BABA?
8.3. Sin pasar a representación decimal, ¿cómo efectuarı́as en base 2 las sumas 1011(2 + 11(2 y
101110(2 + 100011(2 ?
Proposición 2.2.6. La divisibilidad tiene las siguientes propiedades: dados enteros arbitrarios a,
b, d, m, n,
(i) n|n (propiedad reflexiva)
(ii) d|n y n|m implica d|m (propiedad transitiva)
(iii) d|n y d|m implica d|(an + bm) (propiedad de linealidad)
(iv) d|n implica ad|an (propiedad de multiplicación)
(v) ad|an y a 6= 0 implica d|n (ley de cancelación)
(vi) 1|n, −1|n (1 y −1 dividen a cualquier entero)
(vii) m|n ⇐⇒ −m|n ⇐⇒ m| − n (y ası́ m|n ⇐⇒ |m|||n|)
(viii) n|0 (todo entero divide a 0)
(ix) 0|n implica n = 0 (0 sólo divide a 0)
(x) d|n y n 6= 0 implica |d| ≤ |n| (propiedad de comparación)
(xi) d|n y n|d implica |d| = |n| (antisimetrı́a ‘parcial’)
(xii) d|n y d 6= 0 implica (n/d)|n (n/d se llama también divisor conjugado de d)
Demostración. Probemos, por ejemplo, (x). Si d|n y n 6= 0, |n| = |d| · m para algún m ∈ Z; pero
necesariamente m ≥ 0 y m 6= 0, luego m ≥ 1 y |n| ≥ |d|.
Definición 2.2.7. Sean a, b, números enteros no nulos. Su máximo común divisor es el mayor
número, natural siempre, que divide a a y b simultáneamente. Lo denotaremos por mcd(a, b).
A veces se amplı́a la definición poniendo mcd(a, 0) = |a|, mcd(0, 0) = 0.
Para calcular el máximo común divisor de dos números no hace falta más herramienta que la
división entera, como justifican los siguientes resultados.
Lema 2.2.8. Si a, b, son números enteros no nulos tales que a = cb + r, se tiene que mcd(a, b) =
mcd(b, r).
2.2. NÚMEROS ENTEROS. 63
Lema 2.2.9. Si a, b, son números enteros no nulos tales que b | a, entonces mcd(a, b) = |b|.
Supongamos ahora que tratamos de calcular el máximo común divisor de dos números de buen
tamaño, 1769 y 551 por ejemplo. Haciendo la división entera, 1769 = 3×551+116, y según el primer
lema, d = mcd(1769, 551) = mcd(551, 116). A su vez, 551 = 4 × 116 + 87, luego d = mcd(116, 87).
Pero 116 = 87 + 29 y 87 = 3 × 29, con lo que finalmente d = mcd(87, 29) = 29 (segundo lema).
¿Hemos tenido suerte? Si reflexionamos un momento sobre el proceso seguido, vemos que puede
aplicarse a enteros positivos arbitrarios a y b: pues tomando como a el mayor y b el menor (si son
iguales no necesitamos hacer cuentas), al efectuar la división entera de a por b obtenemos un resto
no negativo r1 estrictamente menor que b; si r1 = 0, ya tenemos el máximo común divisor de a
y b (= b, segundo lema); si no, d = mcd(a, b) = mcd(b, r1 ), con la ventaja de que hemos pasado a
números más pequeños, y dividiendo b por r1 pasarı́amos a d = mcd(a, b) = mcd(r1 , r2 ), donde r2
es el resto de la división de b por r1 , estrictamente menor que r1 . Reiterando, puesto que en el
peor de los casos irá disminuyendo al menos en 1 el valor de los restos, al cabo de un número finito
de pasos hemos de llegar a resto 0, y podemos aplicar el segundo lema para concluir que el divisor
actual (resto del paso anterior) es el máximo común divisor.
Formalizando este proceso, conocido ya por Euclides, tenemos (ver [C-C-S]):
Proposición 2.2.11. Algoritmo de Euclides. Dados dos números enteros positivos a y b con
a > b, obtenemos su máximo común divisor d = mcd(a, b) procediendo por divisiones enteras
sucesivas, como se ha indicado anteriormente, hasta obtener resto nulo. El máximo común divisor
de a y b es entonces el último resto no nulo.
La hipótesis de que a y b sean enteros positivos no supone ninguna restricción esencial, dado
que mcd(a, b) = mcd(|a|, |b|). Por tanto, el algoritmo de Euclides basta para poder calcular el
máximo común divisor de dos enteros no nulos arbitrarios. Hay además una información importante
contenida en él, que merece la pena destacar como se verá en aplicaciones posteriores: el máximo
común divisor de a y b es una “combinación lineal de a y b con coeficientes enteros”.
Proposición 2.2.12. Identidad de Bézout. Sean a y b enteros no nulos, y d = mcd(a, b).
Entonces existen enteros u, v tales que
d = ua + vb.
d = rn−1 = rn−3 − cn−1 rn−2 = sn−1 rn−3 + tn−1 rn−2 = sn−1 rn−3 + tn−1 (rn−4 − cn−2 rn−3 )
= sn−2 rn−4 + tn−2 rn−3 = · · · = sk rk−2 + tk rk−1 = · · · = s1 a + t1 b,
d = ua + vb = (u + nb)a + (v − na)b
a = 1 · a + 0 · b = u0 a + v0 b, b = 0 · a + 1 · b = u1 a + v1 b, r1 = 1 · a − c1 b = u2 a + v2 b,
r2 = −c2 a + (1 + c1 c2 )b = u3 a + v3 b,
rk+2 = rk − ck+2 rk+1 = (uk+1 − ck+2 uk+2 )a + (vk+1 − ck+2 vk+2 )b = uk+3 a + vk+3 b
Paso 1: Hacer u = y = 1 y v = x = 0.
Paso 2: Determinar c y r tales que a = cb + r y 0 ≤ r < b.
Reemplazar
a por b, y b por r,
u por x y v por y,
x por u − cx e y por v − cy.
Paso 3: Repetir el Paso 2 hasta que b sea 0.
Paso 4: Devolver u y v.
Ejemplo. Apliquemos este algoritmo a los números considerados anteriormente, a = 1769, b = 551,
para los que ya hemos visto que mcd(a, b) = 29 (volveremos a obtenerlo).
Corolario 2.2.15. Dos números enteros no nulos a y b son relativamente primos si y sólo si
existen dos números enteros u y v tales que ua + vb = 1.
−3(5k + 3) + 5(3k + 2) = 1,
y otro de 9 l.? ¿Y un depósito de 57 l.? En caso afirmativo, ¿cuál es el número mı́nimo de viajes
que hay que realizar con los cubos para llenar el depósito? ii
Planteamiento: ¿6x + 9y = 56 tiene soluciones x, y ∈ N0 ? ¿6x + 9y = 57 tiene soluciones x,
y ∈ N0 ? ¿cuáles?
Para responder en general, comenzamos por un lema.
(i) si d = mcd(a, b), a = pd, b = qd, entonces mcd(p, q) = 1 (es decir, p y q son relativamente
primos).
Demostración.
(i) Existen u, v ∈ Z tales que ua + vb = d, luego d(up + vq) = d; cancelando d se deduce que
up + vq = 1, y por tanto que mcd(p, q) = 1.
(ii) Existen u, v ∈ Z tales que up + vq = 1, con lo cual upm + vqm = m. A su vez, existe n ∈ Z
tal que pn = qm. Sustituyendo qm por pn y sacando factor común p resulta p(um + vn) = m, es
decir, p divide a m como querı́amos demostrar.
ax + by = c
Demostración. Sea ax + by = c para ciertos enteros x, y. Como d|a y d|b, por la propiedad (iii) de
linealidad, d|c.
Recı́procamente, supongamos que d|c, es decir, c = kd para algún k ∈ Z. Puesto que existen
enteros u, v, para los que d = ua + vb, multiplicando por k obtenemos c = kd = kua + kvb, es decir,
x = ku, y = kv nos da una solución de la ecuación propuesta.
Nótese que la segunda parte de la demostración nos proporciona una solución concreta mediante
la identidad de Bézout. ¿Habrá otras? Vamos a comprobar que o bien no existe solución o bien hay
infinitas, que se pueden construir a partir de una cualquiera de ellas.
2.2. NÚMEROS ENTEROS. 67
x = x0 + (b/d)n, y = y0 − (a/d)n, n ∈ Z,
ax + by = a(x0 + qn) + b(y0 − pn) = (ax0 + by0 ) + aqn − bpn = c + (pd)qn − (qd)pn = c.
por tanto, dividiendo por d = mcd(a, b), podemos reescribir la última igualdad como
Ası́, p divide a q(y0 − y). Pero, aplicando las dos partes del lema, mcd(p, q) = 1 y en consecuencia
p divide a y0 − y. Existe, pues, un n ∈ Z tal que y0 − y = pn, es decir, y = y0 − pn. Sustituyendo
este valor de y en la ecuación [∗], resulta finalmente x = x0 + qn, como querı́amos probar.
n 7 8 9
x = −19 + 3n 2 5 8
y = 19 − 2n 5 3 1
Emparejado con el concepto de máximo común divisor suele ir el de mı́nimo común múltiplo.
Dados a, b ∈ Z \ {0}, siempre hay enteros positivos que son múltiplos simultáneamente de a y b:
por ejemplo, |ab|. El conjunto F = {z ∈ N : a|z, b|z} es, pues, no vacı́o; por el principio de buena
ordenación, existe m = mı́n F , por lo que podemos enunciar la definición siguiente.
1769 × 551
Ejemplo. mcm(1769, 551) = = 61 × 551 = 33611.
29
Finalizamos este apartado indicando una serie de recursos de maple y Mathematica que
generalmente sustituyen con ventaja el cálculo ‘a mano’ de los objetos encontrados a lo largo del
mismo. Esto hace innecesario insistir en los ejercicios que se reducen a un mero cálculo, pero todo
matemático debe estar en condiciones de resolverlos incluso cuando falla el suministro eléctrico,
por lo que recomendamos ejercitarse manualmente (sin exagerar) en los algoritmos que hemos ido
exponiendo, y utilizar el ordenador para comprobar los resultados.
La explicación detallada del funcionamiento de las órdenes aquı́ recogidas se encuentra en los
manuales o en la ayuda de los propios programas.
• maple (a, b, c,. . . datos)
Ejemplos.
(1) Identidad de Bézout con maple :
igcdex(1027,712,’s’,’t’);s;t;
1
-165
238
isolve(8*x+12*y=20);
{x = 1 - 3 _Z1, y = 1 + 2 _Z1}
In[1]:=
Solve[8 x == 20 && Modulus == 12, x ]
Out[1]=
{{Modulus -> 12, x -> 1}, {Modulus -> 12, x -> 4},
{Modulus -> 12, x -> 7}, {Modulus -> 12, x -> 10}}
In[2]:=
Solve[12 y == 20 && Modulus == 8, y ]
Out[2]=
{{Modulus -> 8, y -> 1}, {Modulus -> 8, y -> 3},
{Modulus -> 8, y -> 5}, {Modulus -> 8, y -> 7}}
Ejercicios
9.1. Probar que c|a, c|b =⇒ c| mcd(a, b); a|c, b|c =⇒ mcm(a, b)|c.
(N.B. Estas propiedades no están incluidas en las definiciones: hablamos en ellas de máximo y
mı́nimo para la relación de orden, y lo que se pide aquı́ es probar que son igualmente máximo y
mı́nimo para la relación de divisibilidad en N)
9.2. Calcular d = mcd(1320, 714) y escribir d = 1320x + 714y con x, y ∈ Z.
70 CAPÍTULO 2. NÚMEROS NATURALES Y ENTEROS
9.3. Calcular mcd(a, b) y encontrar todas las soluciones de ax + by = mcd(a, b) en los siguientes
casos:
(1) a = 63, b = 49; (2) a = 619, b = 93; (3) a = 521, b = 2187.
9.5. Definir el máximo común divisor y el mı́nimo común múltipo de tres números, mcd(a, b, c) y
mcm(a, b, c). Hallar mcd(1485, 71148, 7882875), mcm(1485, 71148, 7882875).
9.6. Calcular d = mcd(60, 126, 44) y encontrar enteros x, y, z que verifiquen d = 60x + 126y + 44z.
9.7. Para cada entero positivo n, calcular mcd(n, n + 1) y mcd(n, n + 2).
9.8. Demostrar que 3m + 11 y 2m + 7 son relativamente primos cualquiera que sea m ∈ N.
9.9. Sean a y b dos enteros positivos. Probar que si m = mcm(a, b), entonces mcd(m/a, m/b) = 1.
9.10. Dados a, b ∈ N, si d = mcd(a, b), probar que
(Este último conjunto suele denotarse por dZ y el primero por aZ + bZ, con lo que la igualdad
anterior queda aZ + bZ = dZ.)
9.11. Si a, b son enteros relativamente primos, ¿quién es mcm(a, b)? ¿Por qué?
9.12. Si a, b son enteros relativamente primos y c es un entero tal que a|c y b|c, probar que ab|c.
¿Qué sucede si a, b no son relativamente primos? ¿por qué?
9.13. Una persona desea comprar 430 dólares en cheques de viaje. Estos solamente existen en
cheques de 20 y 50 dólares. ¿Cuántos cheques de cada cantidad deberá adquirir?
9.14. ¿De cuántas formas posibles se pueden tener 325 pesetas repartidas en monedas de 10 y de
25 pesetas?
9.15. Un tren sale de Parı́s a Niza cada 7 horas, a una hora en punto. Probar que algunos dı́as es
posible tomar este tren a las 9 de la mañana.
Siempre que hay un tren a las 9 de la mañana, Pierre lo coge para ir a visitar a su tı́a Marie.
¿Cada cuánto tiempo ve Marie a su sobrino?
Discutir el mismo problema con el tren a Burdeos, que sale de Parı́s cada 14 horas.
9.16. Demostrar que un cajero automático cargado de billetes de veinte y de cincuenta euros puede
dispensar cualquier cantidad de euros múltiplo de 10 que sea superior o igual a 40 euros.
Sugerencia: puede probarse por inducción, teniendo en cuenta que 2(−2) + 5 = 1 = 2 · 3 − 5.
9.17. El problema de los cocos. Cinco marineros suspicaces emplean el dı́a en recoger un montón
de cocos. Agotados, posponen el reparto del montón hasta la mañana siguiente. Desconfiados, cada
uno decide coger su parte durante la noche. El primer marinero divide el montón en cinco partes
iguales más un coco extra, que da a un mono. Coge un montón y deja el resto en un único montón.
Más tarde, el segundo marinero hace lo mismo; y, de nuevo, el mono recibe un coco sobrante. El
tercero, cuarto y quinto marineros también lo hacen; todas las veces queda un coco, que recibe
el mono. Por la mañana, dividen los cocos restantes en cinco montones iguales, y cada marinero
recibe su “parte”. (Cada marinero sabe que faltan algunos, pero nadie protesta, porque ¡todos son
culpables!) ¿Cuál es el menor número posible de cocos en el montón original?
(Este problema apareció en el Saturday Evening Post el 9 de octubre de 1926.)
9.18. Consideremos la sucesión de Fibonacci, definida por recurrencia mediante las fórmulas
φ0 = 0, φ1 = 1, φn = φn−1 + φn−2 , n ≥ 2.
Probar que:
(i) mcd(φn , φn+1 ) = 1 para todo n ≥ 1;
N = p1 p2 · · · pn + 1
no figura en esa lista, pues es estrictamente mayor que cada uno de sus elementos (¿por qué?), y
tendrı́a que ser divisible por alguno de ellos según el lema anterior. Pero
da resto 1 al dividirlo por cada pk , y no resto 0, luego N no tendrı́a factores primos, contradicción.
Un procedimiento cásico para hallar los número primos menores o iguales que un entero positivo
n es la criba de Eratóstenes, que consiste en ir suprimiendo de la lista de los n primeros números
naturales los que son múltiplos de 2, luego los que son múltiplos de 3, de 5, etc. (v. [D-H], p. 34.)
Lo presentamos aquı́ en forma de algoritmo.
En Internet abundan los applets de Java que ejecutan este proceso interactivamente. Por ejem-
plo, ver estas direcciones:
http://www.win.tue.nl/~ida/demo/c1s4ja.html
http://www.faust.fr.bw.schule.de/mhb/eratosiv.htm
http://www.shodor.org/succeedhi/succeedhi/sieve/model.html
Lema 2.2.25. Sean a y b números enteros no nulos y p un número primo tal que p|ab. Entonces
p|a o p|b.
Demostración. Puesto que p es primo, no tiene más divisores positivos que 1 y p. Por tanto, si
p 6 |a, mcd(p, a) = 1. Podemos entonces aplicar la parte (ii) del lema 2.2.16 para concluir que p|b.
n + 1 = p1 · · · pj pj+1 · · · pk
n = p 1 p 2 · · · pj = q 1 q 2 · · · q k
2.2. NÚMEROS ENTEROS. 73
son dos descomposiciones de n en factores primos. Entonces p1 |q1 (q2 · · · qk ) luego por el lema previo,
p1 |q1 o p1 |(q2 · · · qk ): en el primer caso, como p1 y q1 son primos, necesariamente p1 = q1 ; en
el segundo caso p1 |q2 o p1 |(q3 · · · qk ). Repitiendo el argumento anterior, en k pasos a lo sumo
encontraremos un factor qk1 igual a p1 . Lo mismo podemos hacer con p2 , . . . , pk , que nos llevarán
a factores qk2 = p2 , . . . , qkj = pj . Si no hubiésemos obtenido ası́ todos los factores de la segunda
descomposición, podrı́amos cancelar los factores comunes y quedarı́a
1 = q10 · · · q`0 ,
lo que es imposible. Por tanto, las dos factorizaciones coinciden, salvo quizá en el orden.
es decir, el máximo común divisor de a y b se obtiene hh multiplicando los factores primos comunes
elevados al menor exponenteii, y el mı́nimo común múltiplo de a y b se obtiene hh multiplicando los
factores primos comunes y no comunes elevados al mayor exponenteii.
ejemplo, Christian Goldbach (1690–1764) envió en 1742 una carta a su amigo Euler, en la que, tras
comprobar unos pocos casos particulares, afirmaba:
todo número natural par distinto de 2 es suma de dos números primos.
Todavı́a no se sabe si esta afirmación es cierta o falsa. Una excelente novela de Apostolos
Doxiadis, El tı́o Petros y la conjetura deGoldbach, refleja (entre otras cosas) los esfuerzos para
probarla. Y, para animar a quien tenga buenas ideas sobre esta cuestión, las editoriales de la novela,
Bloomsbury Publishing Company (Estados Unidos) y Faber and Faber Limited (Gran Bretaña),
ofrecı́an un premio de un millón de dólares a quien obtuviese una solución antes de marzo de 2002.
Creo que la oferta no ha sido renovada.
Ejercicios
10.1. Demostrar que si n ≥ 2 y n no es primo, entonces debe existir un primo p tal que p|n y
p2 ≤ n. ¿Qué interés tiene este resultado en relación con la criba de Eratóstenes?
10.2. Demostrar que todo número primo mayor que 3 es de la forma 6n + 1 o 6n + 5.
10.3. Demostrar que un entero de la forma 4n + 3 admite un divisor primo de esa forma y deducir
que existen infinitos números primos de la forma 4n + 3.
10.4. Probar que cualquier número primo p 6= 3 es de la forma 3q + 1 ó 3q + 2 para algún entero
q. Probar que existen infinitos primos de la forma 3q + 2.
10.5. Si p es primo, probar que p divide al coeficiente binómico
p
, 1 ≤ k ≤ p − 1.
k
[a] = {a + mz : z ∈ Z} = a + mZ.
Definición 2.2.30. Fijado m ≥ 2, el conjunto de las clases de restos módulo m se denota por Zm
o Z/mZ.
Se trata, pues, del conjunto cociente de Z respecto de la relación de congruencia módulo m.
Proposición 2.2.31. Dado m ≥ 2,
Demostración. Para cada a ∈ Z, [a] = [r] para uno y un solo entero r tal que 0 ≤ r < m: el resto
de la división entera de a por m, según hemos comentado previamente.
Además del interés de las clases de restos en muchos usos de la vida cotidiana (la esfera del
reloj, los meses, los dı́as de la semana, los cuentakilómetros de los coches) y de sus aplicaciones
en cuestiones relacionadas con la divisibilidad, los conjuntos Zm son importantes porque pueden
dotarse de una estructura algebraica (de una suma y un producto). Esta estructura es suficiente-
mente similar a la de Z como para que nos sintamos cómodos operando en ella, y suficientemente
distinta como para proporcionar ejemplos sencillos de situaciones insospechadas: fallos a veces en
la propiedad cancelativa, con la existencia de ‘divisores de cero’, frente a la existencia, en otras
ocasiones, de inverso para el producto como en Q, R y C.
La definición de suma y producto de clases de restos es completamente natural: [a] + [b], [a] · [b],
‘deben ser’ [a + b], [a · b]. Pero un momento de reflexión basta para darse cuenta que necesitamos
un ajuste previo. Si a0 es otro representante de [a] y b0 es otro representante de [b], de modo que
[a] = [a0 ], [b] = [b0 ], ¿llegamos al mismo resultado que antes si tomamos [a0 + b0 ], [a0 · b0 ]? El objetivo
del siguiente lema es comprobar que la respuesta es afirmativa.
Lema 2.2.32. Dado m ≥ 2, sean a ≡ a0 (mód m), b ≡ b0 (mód m). Entonces
Demostración. Que a ≡ a0 (mód m), b ≡ b0 (mód m), significa que existen p, q ∈ Z tales que
a0 − a = pm, b0 − b = qm. En consecuencia
(a0 + b0 ) − (a + b) = a0 − a + b0 − b = (p − q)m,
Definición 2.2.33. Dado m ≥ 2, sean [a], [b] ∈ Zm . Definimos [a] + [b] = [a + b], [a] · [b] = [a · b]
Notemos que según el lema previo, la aplicación suma (respectivamente, producto) de Zm × Zm
en Zm que hace corresponder a ([a], [b]) ∈ Zm × Zm la clase [a + b] (respectivamente, [ab]) está bien
definida.
2.2. NÚMEROS ENTEROS. 77
Proposición 2.2.34. Con la suma y el producto que acabamos de definir, Zm es un anillo conmu-
tativo con unidad.
Demostración. Que Zm es un anillo conmutativo con unidad significa que se cumple, cualesquiera
que sean las clases [a], [b], [c] ∈ Zm ,
1. Propiedad asociativa de la suma. ([a] + [b]) + [c] = [a] + ([b] + [c]).
(Cierto: ambas son la clase [a + b + c].)
2. Propiedad conmutativa de la suma. [a] + [b] = [b] + [a].
(Puesto que a + b = b + a.)
3. Existencia de elemento neutro (cero) para la suma. Hay una clase, [0] concretamente,
tal que [0] + [a] = [a] + [0] = [a].
(Puesto que 0 + a = a + 0 = a.)
4. Existencia de elemento opuesto para la suma. para cada [a] ∈ Z hay una clase (y una
sóla), la clase [−a], tal que [−a] + [a] = [a] + [−a] = [0].
(Evidente.)
5. Propiedad asociativa del producto. ([a] [b]) [c] = [a] ([b] [c]).
(Ambas son la clase [abc].)
6. Propiedad conmutativa del producto. [a] [b] = [b] [a].
(Inmediato.)
7. Existencia de elemento neutro (identidad) para el producto. Hay una clase, concreta-
mente [1], tal que [1] · [a] = [a] · [1] = [a].
(Inmediato.)
8. Propiedad distributiva del producto respecto de la suma. [a] ([b] + [c]) = [a] [b] + [a] [c].
(Ambas son la clase [a(b + c)] = [ab + ac].)
Ejemplos. Veamos las tablas completas de sumar y multiplicar para m = 6 y m = 7 (en el interior
de la tabla, por comodidad, hemos representado las clases sin los corchetes [ , ].)
+ [0] [1] [2] [3] [4] [5] × [0] [1] [2] [3] [4] [5]
[0] 0 1 2 3 4 5 [0] 0 0 0 0 0 0
[1] 1 2 3 4 5 0 Suma y [1] 0 1 2 3 4 5
[2] 2 3 4 5 0 1 producto [2] 0 2 4 0 2 4
[3] 3 4 5 0 1 2 módulo 6 [3] 0 3 0 3 0 3
[4] 4 5 0 1 2 3 [4] 0 4 2 0 4 2
[5] 5 0 1 2 3 4 [5] 0 5 4 3 2 1
+ [0] [1] [2] [3] [4] [5] [6] × [0] [1] [2] [3] [4] [5] [6]
[0] 0 1 2 3 4 5 6 [0] 0 0 0 0 0 0 0
[1] 1 2 3 4 5 6 0 [1] 0 1 2 3 4 5 6
Suma y
[2] 2 3 4 5 6 0 1 [2] 0 2 4 6 1 3 5
producto
[3] 3 4 5 6 0 1 2 [3] 0 3 6 2 5 1 4
módulo 7
[4] 4 5 6 0 1 2 3 [4] 0 4 1 5 2 6 3
[5] 5 6 0 1 2 3 4 [5] 0 5 3 1 6 4 2
[6] 6 0 1 2 3 4 5 [6] 0 6 5 4 3 2 1
Se observará que entre las tablas de sumar hay bastantes analogı́as: son simétricas respecto a
la diagonal principal, por ejemplo (¿debido a qué?), y en cada fila y cada columna aparece una
permutación de Zm (están todas las clases sin excepción, una sola vez, en ordenaciones diferentes:
¿hay alguna causa?). En las tablas de multiplicar hay mayores discrepancias, e incluso “fenómenos
extraños”. Descontando la anomalı́a que siempre introduce el [0] en la multiplicación, la tabla
de multiplicación módulo 7 mantiene las caracterı́sticas anteriores; por el contrario, en Z6 hay
78 CAPÍTULO 2. NÚMEROS NATURALES Y ENTEROS
“aberraciones” tales como que el producto de dos clases no nulas, [2] por [3] y otras, ¡es la clase
nula! Sin embargo, la multiplicación por [5] produce una permutación en Z6 como en la suma, e
incluso “tiene inversa”, la propia clase [5], de modo que [5]2 = [1] (lo cual es menos chocante si se
piensa que [5] = [−1]).
La explicación de estos hechos está en los resultados que vienen a continuación.
Lema 2.2.35. Sean a, b, m enteros y m ≥ 2. Si d = mcd(a, m), entonces la congruencia lineal
ax ≡ b (mód m) (Ξ)
tiene solución si, y sólo si, d|b.
Cuando d divida a b, si x0 es una solución, la solución general viene dada por
x = x0 + (m/d)n, n∈Z
En particular, las soluciones forman, exactamente, d clases de restos módulo m, con representantes
x0 , x0 + (m/d), x0 + 2(m/d), . . . , x0 + (d − 1)(m/d).
Demostración. Un x ∈ Z es solución de la ecuación (Ξ) si y sólo si m divide a b − ax, lo cual a su
vez equivale a que exista un y ∈ Z tal que b − ax = my, o sea, ax + my = b : en otras palabras, x es
solución de (Ξ) si y sólo si es solución (junto con algún y) de la ecuación diofántica ax + my = b.
Como ya sabemos, existe tal solución si y sólo si d = mcd(a, m)|b, y si hay solución, las infinitas
soluciones se deducen de una de ellas x0 (con su pareja y0 ) a través de las fórmulas x = x0 +(m/d)n
(con y = y0 − (a/d)n), n ∈ Z.
La única novedad en el enunciado es, por tanto, la afirmación final. Para probarla, observemos
primero que cada número x0 + k(m/d), 0 ≤ k ≤ d − 1 está en una clase de restos distinta, pues
x0 + j(m/d) ≡ x0 + k(m/d) (mód m) con 0 ≤ j < k ≤ d − 1 implicarı́a que m|(k − j)(m/d), siendo
0 ≤ (k − j)(m/d) ≤ k(m/d) < m, lo cual es imposible.
Por último, dada una solución cualquiera x = x0 + (m/d)n, n ∈ Z, dividiendo n por d resulta
n = qd + r, q ∈ Z, 0 ≤ r ≤ d − 1, y ası́ x0 + (m/d)n = x0 + qm + r(m/d) ≡ x0 + r(m/d) (mód m).
Demostración. Según el corolario anterior, para cada [b] ∈ Zm existe un x ∈ Zm y uno sólo tal que
[a] · x = [b], es decir, tal que M (x) = [b], y por tanto M es biyectiva.
[a] · x = [0]
Si en un anillo con unidad A todo elemento no nulo tiene inverso (o sea, hay un elemento que
multiplicado por él da la unidad), se dice que A es un cuerpo.
Teorema 2.2.41. Sea m un entero mayor o igual que 2. Entonces Zm es un cuerpo si y sólo si
m es primo.
Demostración. Que una clase [a] 6= [0] tenga inverso quiere decir que existe x ∈ Zm tal que
[a] · x = [1].
Pero si m es primo, como m 6 | a ya que [a] 6= [0], se sigue que mcd(a, m) = 1 y la ecuación
[a] · x = [1] tiene solución Zm (única, además).
En cambio, si m es compuesto, m = ab con 1 < a < m, 1 < b < m, por lo cual tiene que ser
[a] 6= [0] 6= [b]; y sin embargo [a] no tiene inverso, pues mcd(a, m) = a 6= 1 (más todavı́a: [a] y [b]
son divisores de cero, ya que [a][b] = [0], aunque [a] y [b] sean los dos distintos de [0], y esto es
imposible cuando [a] tiene inverso).
Nota.
En losanillos
de matrices
también
se encuentran divisores de cero. Por ejemplo, si A =
1 0 0 0 0 0
,B= , AB = sin que ninguno de los factores se anule.
1 0 1 1 0 0
msolve(8*x=20,12);
{x = 1}, {x = 4}, {x = 7}, {x = 10}
80 CAPÍTULO 2. NÚMEROS NATURALES Y ENTEROS
In[1]:=
Solve[8 x == 20 && Modulus == 12, x ]
Out[1]=
{{Modulus -> 12, x -> 1}, {Modulus -> 12, x -> 4},
{Modulus -> 12, x -> 7}, {Modulus -> 12, x -> 10}}
APLICACIONES
Criterios de divisibilidad.
Algunas aplicaciones de las congruencias nos son familiares desde bastantes años atrás.
hh Un número es divisible por 2 cuando termina en 0 o cifra par. ii
¿Suena conocido?
hh Un número es divisible por 3 cuando la suma de sus cifras es múltiplo de 3. ii
La razón de estas reglas es ahora muy evidente. Partimos de un número N escrito cn cn−1 . . . c1 c0
en base decimal, de manera que
Que sea divisible por m equivale a que sea congruente con 0 (mód m). Observando que
se deduce
N ≡ c0 (mód 2), N ≡ c0 (mód 5), N ≡ c0 +c1 +c2 +· · · (mód 3), N ≡ c0 +c1 +c2 +· · · (mód 9),
17526
431 17526
431 17526 431
1286
42 1286
42 286 40
424 324
286
@8 @8 @8
3 @ 4 ¡MAL! 3 @ 3 ¿BIEN? 3 @ 3 REVISADA
6@ 6@ 4@
Ejercicio. Probar que un número es divisible por 11 si y sólo si la suma de las cifras de lugar par
menos la suma de las cifras de lugar impar es múltiplo de 11.
Sugerencia: 10 ≡ −1 (mód 11).
Ejercicio. Probar que un número es divisible por 25 si y sólo si termina en 00, 25, 50 o 75.
Ejercicio. ¿Por qué nunca se enuncia un criterio sencillo de divisibilidad por 7, similar a los que
hemos considerado? (No obstante, ver [6].)
Dı́gitos de control. Las congruencias inciden en nuestra vida diaria de forma invisible, pero
constante, y en las situaciones más insospechadas. Ası́ lo explica el prof. M. Gasca ([G]):
hh Se dice que estamos en la Era de la Información. Veamos algunas de las cuestiones surgidas en
torno a ella y que en el fondo son problemas matemáticos más o menos intrincados. Se usan
mucho los códigos de barras para identificar un producto. Se trata de barras blancas y negras
que al ser leı́das rápidamente por láser se traducen en ceros y unos, sistema binario, que a
su vez se traducen a numeración decimal. En el caso del Código Universal de Productos, el
más frecuente, son unos 12 dı́gitos decimales, de los que uno advierte del grupo de productos
de que se trata, el grupo siguiente identifica al fabricante, otro grupo da idea del producto
concreto, a veces de su tamaño, etc., y el último dı́gito es de control.
Si han observado los números de sus cuentas bancarias de 20 dı́gitos, los 4 primeros son la
entidad, 4 para la Agencia, 2 de control y luego 10 para su cuenta personal. Observarán que
en ambos casos hablamos de dı́gitos de control. Es muy fácil al transmitir tantos números
bailar su orden o confundir una cifra. Mediante un algoritmo matemático muy simple el
ordenador detecta el error. Se entenderá mejor con el NIF. Hacienda tenı́a graves problemas
con la gente que daba, intencionadamente, un número erróneo de DNI, sin poder demostrar la
intencionalidad del error. Un algoritmo muy simple asigna a cada número de DNI una letra,
dando lugar al NIF. Para ello, Hacienda seleccionó 23 letras del alfabeto eliminando i, ñ, o y
u por causar confusiones, y les asignó un número aleatorio entre 0 y 22: la A tiene el 3, la W
el 2, etc. Dividiendo el número del DNI entre 23, prescindiendo de decimales en el cociente
y volviendo a multiplicar por 23, se obtiene un número igual o menor que el del DNI. La
diferencia entre el DNI y ese nuevo número es el que decide la letra. Si ahora Vd. cambiara
algo en su número de DNI, como bailar dos dı́gitos, es sumamente probable que la letra final
no saldrı́a la misma y el ordenador avisará del error. Entendiendo el proceso serı́a facilı́simo
cambiar el número y a la vez cambiar la letra para que concuerden y el ordenador no detecte
el error, pero si posteriormente se descubre, ya hay manifiesta mala fe.
En el caso de la cuenta bancaria, los dı́gitos son 2 porque se usa uno para el grupo de cifras
Banco-Agencia y otro para el número de la cuenta. ii
Por supuesto, podemos añadir otros ejemplos (ver [C-C-S], pp. 46 y ss.):
82 CAPÍTULO 2. NÚMEROS NATURALES Y ENTEROS
• ISBN
El ISBN es el International Standard Book Number, el NIF de los libros podrı́amos decir. Es un
código que se asigna a cada publicación que lo solicita, que permite identificarla rápidamente.
Consiste en 9 dı́gitos, seguidos de un décimo sı́mbolo que puede ser otro dı́gito (de 0 a 9) o
una X. Los nueve primeros dı́gitos dan la información del libro, como el año y el lugar de
publicación, y el sı́mbolo final es de control. Si el ISBN de un libro es a1 a2 . . . a9 b, se elige b
de manera que a1 + 2a2 + · · · + 9a9 ≡ b (mód 11), correspondiendo X al resto 10. En este caso
hay posibilidad de corregir pequeños errores: si en el n-ésimo sı́mbolo hay un error de +1 o
−1, entonces a1 + 2a2 + · · · + 9a9 + 10b (mód 11) es igual a +n o −n, respectivamente.
• Música digitalizada
En los CD’s, la música se almacena codificada en listas de ceros y unos. Usando un rayo
laser, el lector de CD’s lee la información del disco y la convierte en la señal que termina
transformada en sonido en los altavoces. Hay muchas causas que pueden originar errores de
lectura: rayas, suciedad o polvo en la superficie del disco, el rayo laser deja de apuntar al
lugar adecuado, etc. El almacenamiento de la información ha de hacerse de manera que el
lector pueda detectar y corregir esos errores.
• Comunicaciones
En todos los canales de comunicación hay que contar con el ‘ruido’, alteraciones de todo tipo
que hacen que la señal recibida no sea igual que la emitida: transmisiones de televisión o
telefonı́a por satélite, lı́neas de teléfono, fax, e-mails, televisión, etc. mediante cable,. . .
Para crear códigos que permitan corregir errores, se han utilizado ¡espacios vectoriales sobre
cuerpos Zp ! (ver Los códigos correctores, de G. Lachaud-S. Vladut y La doble corrección,
de C. Berrou y cols., en [MC1]).
En [COMAP], pp. 586 y ss., pueden verse también algunos detalles sobre corrección de errores
y compresión de datos.
Por tanto, si encontramos valores de a para los que no se cumplen las equivalencias anteriores,
p NO podrá ser primo.
2.2. NÚMEROS ENTEROS. 83
Ejemplos.
2. 341 no es primo: si lo fuese, como 73 = 343 ≡ 2 (mód 341) y 210 = 1024 ≡ 1 (mód 341), se
verificarı́a 7340 = 73·113+1 ≡ 2113 7 ≡ 2110+3 7 ≡ 8·7 ≡ 56 (mód 341). Como 56 6≡ 1 (mód 341),
341 no puede ser primo.
hh ¿Cómo transmitir mensajes secretos asegurándose que no serán comprendidos por un eventual
enemigo? Tal es el objetivo de la criptografı́a. En principio, el mensaje a transmitir tiene que
codificarse previamente por medio de una clave que el emisor y el receptor mantienen en
secreto. En general, esta clave puede ser fácilmente hh invertidaii, por lo que sirve tanto para
cifrar el mensaje inicial como para descifrar el mensaje cifrado. En tal caso, que es el clásico, el
emisor y el receptor comparten un mismo secreto, la clave que sirve para cifrar y descifrar. El
principio de la criptografı́a de clave pública, inventado en 1976 por Whitfield Diffie y Martin
Hellman, de la Universidad de Stanford, es muy distinto. El método supone que la clave del
cifrado no puede ser fácilmente invertida para hallar la clave del desciframiento. La primera
puede ser pública, mientras que sólo el receptor puede conocer la segunda. La seguridad es
entonces mucho mayor. Supongamos que Alicia quiere enviar a Bernardo un mensaje secreto
por medio de una clave pública. En tal caso, Bernardo tiene que comunicar a Alicia una
clave de cifrado que puede ser conocida por todo el mundo (es la clave pública). Alicia la
utiliza para cifrar su mensaje, que luego envı́a a Bernardo. Para descifrar el mensaje en clave,
Bernardo utiliza su clave privada, que es el único en conocer.
El sistema de cifrado de clave pública más conocido y utilizado es probablemente el siste-
ma RSA, inventado en 1978 por Ronald Rivest, Adi Shamir y Leonard Adelman, del MIT
(Massachusetts Institute of Technology, Estados Unidos). ii
[· · · ]
hhDesde aproximadamente 1980, es bastante fácil averiguar si un número, aunque sea muy
grande, es o no primo. En cambio, es mucho más difı́cil descomponer un número grande en
factores primos. En esta diferencia de dificultad se basan precisamente los modernos métodos
de criptografı́a. Muy esquemáticamente, la idea consiste en construir la clave del cifrado
(no secreta) por medio de un número N producto p × q de dos números primos grandes.
El desciframiento, en cambio, requiere el conocimiento de p y q por separado, unos valores
que sólo se comunican a las personas autorizadas. Para descifrar un mensaje en clave, un
espı́a tendrı́a que encontrar, conociendo N , sus dos factores primos p y q. Ahora bien, para
N lo bastante grande (digamos que del orden de 150 cifras) y convenientemente elegido, es
imposible realizar esta operación inversa en un tiempo aceptable. ii
[· · · ]
La importancia de la teorı́a de números en criptografı́a es tal que los matemáticos se ven
hh
factorización numérica mucho más eficaz que los precedentes, ¿qué debe hacer? ¿Comunicarlo
al primer ministro, exponerlo públicamente en una conferencia internacional para que nadie
pueda aprovecharse de él a expensas de otros o venderlo al mejor postor? Afortunadamen-
te, hasta dónde se sabe, las mejoras encontradas por los matemáticos no son lo bastante
revolucionarias como para que el problema se plantee en toda su acuidad. ii
(fragmentos del artı́culo La intriga de los números primos, de Henri Cohen, publicado en [MC1].)
En [C-C-S], pp. 15–16, se da la siguiente descripción simplificada, a modo de receta culinaria,
del sistema RSA.
ingredientes necesarios:
y ≡ xv (mód m).
x ≡ y w (mód m).
¿Qué justifica la última afirmación? Se supone que p y q son muy grandes, y que x es menor que
ellos. Por eso (xq−1 )p−1 ≡ 1 (mód p), (xp−1 )q−1 ≡ 1 (mód q), de donde x(p−1)(q−1) ≡ 1 (mód pq)
(¿por qué?), y ası́
Ver otra descripción ‘aproximada’ en [COMAP], pp. 580–584. Para mayor precisión, consultar
en la dirección [1] los apuntes de Fco. Javier Cobos Gavala, Universidad de Sevilla.
Ejercicios
11.1. A lo largo del texto se ha usado que para todo n ∈ N, de a ≡ b (mód m) se sigue an ≡
bn (mód m). Demostrarlo.
11.2. Demostrar, utilizando congruencias, que si un número entero es a la vez un cuadrado y un
cubo, entonces se puede escribir en la forma 7k o 7k + 1.
11.3. Probar que las seis primeras potencias de 10 pertenecen a distintas clases de congruencias
módulo 7. (Comentario: Gauss preguntó si las potencias de 10 dan n − 1 clases de congruencias
distintas módulo n para infinitos n; la pregunta sigue sin contestar. Los módulos 5 y 13 fallan, a
pesar incluso de que son primos.)
11.4. Sea k un número impar. Probar que k 2 ≡ 1 (mód 8).
11.5. ¿Hay algún cuadrado perfecto (entero de la forma k 2 , k ∈ Z), que sea congruente con 2
módulo 3? ¿Por qué?
11.6. Si x2 + y 2 = z 2 , demostrar:
(Los enteros x, y, z que cumplen la ecuación dada se llaman, por razones obvias, ternas pitagóri-
cas .)
11.7. Dado un entero n ≥ 2, probar que en cada clase de restos módulo n hay exactamente un
entero r que cumple −n/2 < r ≤ n/2.
(Estos números se llaman menores restos absolutos módulo n; cuando n es impar, son 0,
±1, ±2, . . . , ±(n − 1)/2; cuando n es par, 0, ±1, ±2, . . . , ±(n − 2)/2, n/2.)
11.8. Usando el problema anterior, hallar el menor resto no negativo de 28 × 33 (mód 35).
11.9. Decimos que k es un cuadrado módulo n si k ≡ j 2 (mód n) para algún j. Supongamos que
n = m2 + 1 para algún m ∈ N. Probar que si k es un cuadrado módulo n, también −k es un
cuadrado módulo n.
11.10. Si p es un primo, probar por inducción en n que np ≡ n (mód p). Deducir el pequeño
teorema de Fermat.
11.11. Calcular 132231 (mód 7), 246218 (mód 11), 145197 (mód 13).
11.12. Hallar los inversos de 13 en Z21 y Z31 .
11.13. Hallar los inversos de 4 y 12 en Z19 .
86 CAPÍTULO 2. NÚMEROS NATURALES Y ENTEROS
Bibliografı́a
[Casti] J. L. Casti: Mathematical Mountaintops: The Five Most Famous Problems of All Time.
Oxford U. P., 2001.
[C-C-S] Cohen, A. M.; Cuypers, H.; Sterk, H.: Algebra Interactive! (Learning algebra in an
exciting way). Springer, Berlin, 1999.
Versión on line:
http://www.win.tue.nl/~ida/home.html
[COMAP] COMAP: Principles and Practice of Mathematics. Springer, New York, 1997.
[D’A-W] D’Angelo, J. P.; West, D. B.: Mathematical Thinking. Problem-Solving and Proofs.
Prentice-Hall, Upper Saddle River, NJ, 1997.
[Ddk] Dedekind, R.: ¿Qué son y para qué sirven los números?. (edición e introducción de J.
Ferreirós) Alianza Editorial, Madrid, 1998.
[G] Gasca, M.: Las Matemáticas en la vida del año 2000, Monografı́as de la Academia de
Ciencias de Zaragoza 19 (37–44) 1996.
[GJPR] Goberna, M. A.; Jornet, V.; Puente, R.; Rodrı́guez, M.: Álgebra y fundamentos.
Una introducción. Ariel, Barcelona, 2000.
[Ham] Hamilton, A. G.: Numbers, sets and axioms: the apparatus of mathematics. Cambridge
Univ. Press, 1982.
[Lieb] Liebeck, M.: A Concise Introduction to Pure Mathematics. Chapman & Hall/CRC, Boca
Raton, 2000.
[MC1] Mundo Cientı́fico: El universo de los números: Matemáticas para interpretar el mundo.
Extra núm. 1, s.f..
[Peano] Peano, G.: Arithmetices principia nova methodo exposita. Bocca, Romæ-Florentiæ, 1889..
[S-T] Stewart, I.; Tall, D.: The Foundations of Mathematics. Oxford Univ. Press, 1977.
Un libro de problemas resueltos muy interesante con muchos ejercicios accesibles, pero que
en buena parte requiere un mayor conocimiento en Teorı́a de Números, es
[Si] Sierpinski, W.: 250 Problems in Elementary Number Theory. Elsevier, New York; PWN,
Warszawa, 1970.
87
88 BIBLIOGRAFÍA
Documentos en Internet
89
90 CAPÍTULO 3. NÚMEROS RACIONALES. POLINOMIOS.
3.1.2. Construcción de Q
Formalicemos las consideraciones anteriores.
Reflexiva, pues (m, n) ∼ (m, n) cualquiera que sea (m, n) ∈ F , ya que trivialmente mn = mn
Simétrica, siempre que (m, n) ∼ (p, q) resulta (p, q) ∼ (m, n) porque lo primero significa que
mq = pn y lo segundo que pn = mq.
Transitiva, de (m, n) ∼ (p, q) y (p, q) ∼ (r, s) se sigue (m, n) ∼ (r, s), porque si mq = pn y
ps = rq, también mqps = pnrq. Si p 6= 0, como q 6= 0, cancelando pq ya queda ms = nr;
mientras que si p = 0, forzosamente m = 0 y r = 0, y en este caso ms = 0 = nr.
Nota. Evitando arrastrar las poco intuitivas notaciones (m, n) para lo que siempre hemos escrito
m m
ó m/n, y [(m, n)] para lo que estamos acostumbrados a representar igualmente por ó m/n, de
n n
aquı́ en adelante volvemos a la notación clásica. No obstante, no hay que perder de vista entonces
que tenemos una misma notación para dos objetos distintos: la fracción (m, n) y el número racional
[(m, n)] del cual la fracción anterior es un representante. En cualquier caso, lo que no ha originado
confusión hasta ahora no deberı́a causarla tampoco de ahora en adelante.
Cuando sea necesario, indicaremos explı́citamente si nos estamos refiriendo a una fracción o a
un número racional. Por ejemplo:
Ejercicio. Probar que toda fracción es equivalente a una y una sóla fracción irreducible; dicho
de otro modo, que todo número racional admite un único representante que sea una fracción
irreducible.
3.1. NÚMEROS RACIONALES. 91
m p
Definición 3.1.4. Dadas dos fracciones , llamaremos suma de ambas a la fracción
n q
m p mq + pn
+ =
n q nq
y producto a la fracción
mp mp
=
n q nq
Para definir la suma y el producto en Q dependemos del siguiente lema.
m m0 p p0 m m0 p p0
Lema 3.1.5. Dadas fracciones , 0 , , 0 tales que ∼ 0 , ∼ 0 , se verifica
n n q q n n q q
m p m0 p0 mp m0 p0
+ ∼ 0 + 0, ∼ 0 0.
n q n q n q n q
m p mq + pn m0 p0 m0 q 0 + p0 n0
+ = , + = ,
n q nq n0 q0 n0 q 0
luego
m p
Definición 3.1.6. Dados dos números racionales , ∈ Q, llamaremos suma de ambos al
n q
número racional
m p mq + pn
+ =
n q nq
y producto al número racional
mp mp
=
n q nq
Notemos que según el lema la aplicación suma (respectivamente, producto) de Q × Q en
previo,
m p mq + np mp
Q que hace corresponder a , ∈ Q × Q el número racional (respectivamente, )
n q nq nq
está bien definida.
Proposición 3.1.7. Con la suma y el producto que hemos definido, Q es un cuerpo conmutativo.
m
4. Existencia de elemento opuesto para la suma. Para cada ∈ Q hay un número racional
n
−m −m m m −m
(y uno sólo), el número racional , tal que + = + = [0].
n n n n n
(Evidente.)
mp r m pr
5. Propiedad asociativa del producto. = .
n q s n q s
mpr
(Ambos son el número racional .)
nqs
mp pm
6. Propiedad conmutativa del producto. = .
n q q n
(Inmediato.)
7. Existencia de elemento neutro (identidad) para el producto. Hay un número racional,
m m m
denotado provisionalmente por [1], tal que [1] · = · [1] = .
n n n
(Tomar [1] = 1/1.)
m
4. Existencia de elemento inverso para el producto. Para cada ∈ Q\{0} hay un elemento
n
n n m m n
(y uno sólo) en Q, el número racional , tal que = = [1].
m m n n m
(Tiene sentido porque m 6= 0.)
m p r mp mr
8. Propiedad distributiva del producto respecto de la suma. + = + .
n q s n q n s
m(ps + qr) mpns + mrnq
(Ambos son iguales a = .)
nqs nqns
racionales? ¿Quién no pondrı́a 6/3=2? Sin embargo, nos estamos refiriendo a objetos de naturaleza
distinta: un número racional es nada menos que un conjunto de pares de números enteros. Pero
desde que aprendimos las fracciones hemos ‘identificado’ 0/1 con 0; 1/1 con 1 o, en general, m/1
con m cualquiera que sea m ∈ Z. ¿Es incorrecto matemáticamente? No: hay una buena razón para
hacerlo, que se basa en el siguiente resultado.
h(m) = m/1 ∈ Q, m ∈ Z,
Demostración. Ejercicio.
Es decir, h es un isomorfismo entre Z y h(Z), lo que significa que para todo lo referido a
operaciones algebraicas (con sumas, restas, productos, potencias) Z y h(Z) son indistinguibles:
toda ‘operación’ en uno de estos sistemas puede ser reproducida fielmente en el otro, lo que hace
innecesario a estos efectos diferenciar m de h(m). Por ello, desde este momento, consideramos
La idea de isomorfismo, “identificación de dos sistemas matemáticos que tienen las mismas
formas (de operar)”, abstrayendo ası́ su “esencia matemática”, es muy importante y está por todas
partes en Matemáticas. Uno y otro sistema puede verse como un ‘modelo’ distinto de un mismo
‘sistema abstracto’, dos caras de una misma moneda.(*)
Nota. Si se revisan cuidadosamente las demostraciones anteriores, se observará que, de entre todas
las propiedades de Z, sólo hemos necesitado las propiedades de la suma y el producto que hacen de
Z un dominio de integridad. Por tanto, la idea de sumergir un dominio de integridad en un ‘cuerpo
de fracciones’ es reutilizable en toda situación similar (por ejemplo, al tratar con polinomios). Ver
[GJPR], pp. 115 y ss.
La relación de orden en Z se puede extender a una relación de orden en Q.
Lema 3.1.9. Sean m/n, m0 /n0 fracciones equivalentes. Entonces mn > 0 si y sólo si m0 n0 > 0.
Demostración. Por hipótesis mn0 = m0 n, luego mnn0 = m0 n2 ; como n2 > 0, si mn > 0 se sigue que
m0 y n0 son ambos positivos o ambos negativos (no pueden ser nulos —¿por qué?), y en cualquier
caso m0 n0 > 0.
Obsérvese que el concepto de número racional positivo está bien definido, en virtud del lema
anterior. También, que un número racional m/n es positivo si y sólo si m/n > 0 (o sea, 0 ≤ m/n
y 0 6= m/n).
Demostración. La manera más cómoda de comprobarlo pasa por examinar previamente algunas
propiedades del conjunto de los números racionales positivos, que denotaremos aquı́ por P (la
notación habitual es Q+∗ , demasiado complicada).
Primero, veamos que para todo número racional m/n se verifica una y sólo una de estas tres
alternativas: m/n = 0, m/n ∈ P , −m/n ∈ P (ley de tricotomı́a). En efecto, si no es m/n = 0,
tendremos que o bien mn > 0 (en cuyo caso m/n ∈ P ), o bien mn < 0, en cuyo caso (−m)n > 0 y
−m/n ∈ P ; y las alternativas son claramente excluyentes.
Después, P es estable o cerrado para la suma, es decir, si m/n, p/q ∈ P , también m/n+p/q ∈ P .
Supongamos m > 0, n > 0, p > 0, q > 0 (si no es ası́, basta sustituir la fracción m/n por la fracción
equivalente mn/n2 , o p/q por pq/q 2 ). Entonces m/n + p/q = (mq + pn)/pq ∈ P claramente, pues
(mq + pn)pq es un producto de enteros positivos.
Con esto, la relación ≤ es:
Reflexiva, pues m/n ≤ m/n cualquiera que sea m/n ∈ Q, ya que trivialmente m/n−m/n = 0.
Antisimétrica, siempre que m/n ≤ p/q y p/q ≤ m/n simultáneamente, ha de ser m/n = p/q,
porque en caso contrario, p/q − m/n y su opuesto m/n − p/q deberı́an ser simultáneamente
positivos, imposible.
(*)
Generalmente se identifican ambos modelos, como hemos hecho aquı́. Pero en algunas ocasiones, disponer de
varios ‘modelos’ sirve para ‘transferir intuición’ de uno a otro. La ventaja es obvia: si dos juegos distintos obedecen
a las mismas reglas, ganaremos con mayor facilidad jugando el que tenga la estrategia más evidente. Hay un ejemplo
precioso de ello en M. Gardner: Inspiración ¡ajá!. Labor, Barcelona, 1981 (reed. 1992)., pp. 116 y ss. Un feriante
tiene un mostrador con casillas numeradas del 1 al 9, y el juego consiste en ir poniendo monedas por turno (de 50
pesetas el feriante, de 5 pesetas el otro jugador); se lleva todo el dinero de la mesa el que primero ocupe tres casillas
distintas cuyos números sumen 15. El feriante gana siempre que quiere, porque sabe que, disponiendo los números en
un cuadrado mágico, el juego resulta isomorfo al ‘tres en raya’, sencillı́simo de jugar (merece la pena leer la exposición
original y los comentarios del maestro Martin Gardner).
94 CAPÍTULO 3. NÚMEROS RACIONALES. POLINOMIOS.
Transitiva, de m/n ≤ p/q y p/q ≤ r/s se sigue m/n ≤ r/s; esto es evidente si m/n = p/q o
p/q = r/s. Si no es este el caso, tendremos r/s − m/n = (r/s − p/q) + (p/q − m/n), suma de
dos racionales positivos, luego positivo.
Un orden total, pues dados m/n, p/q ∈ Q, o p/q − m/n es 0 (con lo cual m/n = p/q), o es
positivo (y ası́ m/n ≤ p/q) o −(p/q − m/n) = m/n − p/q es positivo (lo que da p/q ≤ m/n)
Nota. ¿Se respeta el orden antiguo en Z? Puesto que hemos identificado m ∈ Z con m/1 ∈ Q,
dados m y n ∈ Z disponemos de dos ‘criterios’ para escribir m ≤ n. Pero en la nueva definición,
m ≤ n significa literalmente m/1 ≤ n/1, o sea, que n/1 − m/1 = (n − m)/1 es 0 (en cuyo caso
n − m = 0, i.e. n = m) o es un número racional positivo, es decir, que (n − m) · 1 > 0, i.e., n > m;
en cualquier caso, m ≤ n en la relación de orden de Z.
En consecuencia, la aplicación h : Z → Q que permitı́a identificar Z con h(Z) conserva también
las desigualdades, por lo que Z y h(Z) son ası́ mismo ‘indistinguibles’ (isomorfos) por lo que respecta
a las propiedades de orden.
Es importante saber cómo “se suman y multiplican desigualdades”. Las reglas fundamentales
son las siguientes.
(Compatibilidad del orden con la suma) si m/n ≤ p/q, entonces m/n + r/s ≤ p/q + r/s;
(Compatibilidad del orden con el producto por elementos no negativos) si m/n ≤ p/q, y
además r/s ≥ 0, entonces m/n · r/s ≤ p/q · r/s.
Demostración. Para la suma basta tener en cuenta que (p/q + r/s) − (m/n + r/s) = p/q − m/n y
aplicar la definición.
Para el producto, notemos primero que si a/b y c/d son números racionales positivos, también
a/b · c/d = ac/bd es positivo, ya que (ac)(bd) = (ab)(cd) > 0. Por tanto, si m/n ≤ p/q, y r/s ≥ 0,
como
p/q · r/s − m/n · r/s = (p/q − m/n) · r/s,
el segundo término es un producto de factores positivos o nulos, y por lo anterior es positivo o nulo.
Un cuerpo en el que se ha definido un orden total que tenga las dos propiedades anteriores se
llama cuerpo conmutativo totalmente ordenado . Podemos resumir entonces las propiedades
vistas diciendo
Q es un cuerpo conmutativo totalmente ordenado.
La enumeración diagonal de Cantor hizo plausible la existencia de una aplicación biyectiva entre
N y Q (i. e., que Q es numerable). Sin embargo, aunque en este sentido N y Q tienen ‘la misma
cantidad de elementos’, los tienen ‘repartidos’ de manera totalmente distinta, como muestran los
siguientes resultados.
Proposición 3.1.13. Entre dos números racionales hay otro número racional.
a+b
Demostración. Dados a, b ∈ Q, si a < b es a < < b, porque
2
a+b a + b − 2a b−a 1
−a= = = (b − a) > 0,
2 2 2 2
3.1. NÚMEROS RACIONALES. 95
a+b 2b − (a + b) b−a
b− = = > 0.
2 2 2
Demostración. Por ejemplo, A = {x ∈ Q : 0 < x < 1} es un conjunto no vacı́o (¿por qué?) acotado
superiormente por 1 e inferiormente por 0. Pero no tiene elemento máximo ni elemento mı́nimo: si
fuese M = máx A, serı́a M ∈ A y por tanto 0 < M < 1; pero según acabamos de probar, existirı́a
x ∈ Q entre M y 1, con lo cual 0 < M < x < 1, es decir, x ∈ M y x > M , por lo que M no puede
ser el máximo de A. Análogamente se prueba con el mı́nimo.
Ejercicios
12.1. Hallar las fracciones irreducibles equivalentes a 36/50, 444/33, 231 107/999 999 989.
12.2. Sean a/m y b/n fracciones irreducibles. Probar que (an + bm)/(mn) es irreducible si y sólo
si m y n son relativamente primos.
12.3. Probar que en todo cuerpo K totalmente ordenado (en particular, en Q) se verifica:
12.4. Sean m, n, p, q enteros positivos tales que m ≤ p ≤ q y p/q ≤ m/n. Probar que n−m ≤ q −p.
Comprobar que esta conclusión no siempre es cierta si m ≤ q < p y p/q ≤ m/n.
12.5. Sean m, n, p, q enteros positivos tales que m/n < p/q. Probar que
12.6. Paradoja de Simpson. En un curso hay dos grupos, el grupo de la mañana y el grupo
de la tarde. En el grupo de la mañana hay A chicas y B chicos, y en el de la tarde hay C chicas
y D chicos. En el primer examen aprueban a chicas y b chicos del grupo de la mañana, y en el
de la tarde aprueban c chicas y d chicos. Tanto en el grupo de la mañana como en el de la tarde
el porcentaje de chicas aprobadas es menor que el de chicos aprobados. ¿Podemos afirmar que el
porcentaje global de aprobados será menor para las chicas que para los chicos?
Examinar el caso A = 14, B = 6, C = 6, D = 19, a = 11, b = 5, c = 2, d = 7. ¿Cómo se explica
esto?
(Ver [D’A-W], pp. 129–130, y [1].)
96 CAPÍTULO 3. NÚMEROS RACIONALES. POLINOMIOS.
3.2. Polinomios
Ya es de sobras conocido que las expresiones tales como
y, en general,
an xn + an−1 xn−1 + · · · + a1 x + a0 ,
donde n ∈ N, a0 ,. . . , an ∈ Q, reciben el nombre de polinomios sobre Q o polinomios con coefi-
cientes racionales. Pero el nombre ‘polinomio’ encubre, en realidad, dos conceptos diferentes: el de
polinomio formal o polinomio en sentido estricto y el de función polinómica. En el primer sentido,
manejamos los polinomios como ‘fórmulas’ o ‘expresiones simbólicas’, sin darle a x ningún conte-
nido determinado —dejando la x ‘indeterminada’— y operando con ella, por ası́ decir, como un
objeto ‘que no se mezcla’ con los coeficientes.(**) En el segundo sentido, se piensa en la función
que a cada x de un cierto conjunto de números (u otros objetos: clases de restos, matrices, . . . )
hace corresponder el número (o . . . ) que resulta al calcular an xn + an−1 xn−1 + · · · + a1 x + a0 .
Distinguiremos, pues, entre estos conceptos, reservando el nombre de polinomio para el primero
y llamando función polinómica al segundo.
A lo largo del curso, en esta y otras asignaturas, se manejarán no solamente polinomios con
coeficientes en Q, sino también polinomios con coeficientes reales y complejos. Muchas de las pro-
piedades de los polinomios son comunes en todos estos casos, dependen únicamente de que los
coeficientes pertenezcan a un cuerpo. Para dejarlo más claramente de manifiesto, trataremos por
ello inicialmente con polinomios sobre un cuerpo conmutativo arbitrario K, que podrá ser en su mo-
mento Q, R o C (sin olvidar los cuerpos Zp , tan importantes en aplicaciones). Cuando sea oportuno,
iremos estudiando algunas propiedades especı́ficas de los polinomios con coeficientes racionales.
que p(X) y q(X) sean iguales significa que a0 = b0 , a1 = b1 y, en general, ak = bk para todo k ∈ N,
teniendo en cuenta el convenio anterior de que ak = 0 si k > n y bk = 0 si k > m.
(**)
Es posible dar un sentido preciso a estas nociones un tanto vagas de expresiones simbólicas o formales y de
indeterminada; nosotros nos conformaremos con la idea intuitiva, remitiendo para una definición más rigurosa p. ej.
al libro de Godement, R.: Cours d’algébre. Hermann, Paris, 1963., p. 353.
3.2. POLINOMIOS 97
Definición 3.2.2. Si un polinomio p(X) no tiene todos los coeficientes nulos, su grado es el
máximo n tal que an 6= 0, y este coeficiente an recibe entonces el nombre de coeficiente director .
Si el coeficiente director es igual a 1, se dice que p(X) es un polinomio mónico .
p = a0 + a1 X + a2 X 2 + · · · + an X n , q = b 0 + b 1 X + b2 X 2 + · · · + bm X m ,
su suma es el polinomio
Nota. Es cómodo disponer de una cierta flexibilidad a la hora de escribir polinomios, sin tener que
estar sujetos a la rigidez de la forma
an X n + an−1 X n−1 + · · · + a1 X + a0 ,
probar que el grado de p + q es menor o igual que máx{n, m}, siendo el menor estricto solamente
cuando p y q tienen el mismo grado (n = m) y sus coeficientes directores son opuestos, i.e.,
an + bn = 0.
El producto de polinomios se define por la ley ai X i · bj X j = ai bj X i+j , y buscando que sea
distributivo. Concretamente,
98 CAPÍTULO 3. NÚMEROS RACIONALES. POLINOMIOS.
p = a0 + a1 X + a2 X 2 + · · · + an X n , q = b 0 + b 1 X + b2 X 2 + · · · + bm X m ,
su producto es el polinomio
p · q = c0 + c1 X + c2 X 2 + · · · + cn+m X n+m ,
P
donde ck = i+j=k ai bj , es decir, que si 0 ≤ k ≤ n + m, ck = a0 bk + a1 bk−1 + · · · + ak−1 b1 + ak b0 ,
conviniendo como antes que si alguno de los coeficientes ai , bj no aparecen en p o en q, los tomamos
iguales a cero.
Proposición 3.2.5. Con las operaciones suma y producto anteriores, K[X] es un dominio de
integridad.
Demostración. Se deja como ejercicio el comprobar las diferentes propiedades. Por ejemplo, el
polinomio nulo es el elemento neutro para la suma; el polinomio constante 1 es la identidad para
el producto. La propiedad cancelativa se sigue de que pr = qr es lo mismo que (p − q)r = 0, y este
producto sólo puede ser 0 si r = 0 o p − q = 0.
El espacio vectorial K[X]. En K[X] tenemos definida una suma, y disponemos además de un producto por
escalares ‘natural’: dados a ∈ K, p ∈ K[X], podemos definir a · p como el producto del polinomio constante
a por p. Es fácil comprobar que con esta suma y este producto por escalares, K[X] es un espacio vectorial
sobre K. En cierto sentido, es “el menor espacio vectorial sobre K de dimensión infinita”: una base obvia
está formada por la sucesión de polinomios
1, X, X 2 , . . . , X n , . . .
Demostración.
Existencia. Si p = 0 o el grado de p es estrictamente menor que el de q, claramente p = 0 · q + p,
y se sigue lo pedido.
Suponiendo, pues, deg p ≥ deg q, procedemos por inducción sobre el grado de p. Si deg p = 0 (y
en consecuencia deg q = 0), tendrı́amos p = a0 , q = b0 6= 0, p = a0 b−1
0 q + 0.
Si el enunciado es cierto cuando el grado del dividendo es menor o igual que n − 1, n ∈ N,
veamos que también lo es cuando deg p = n. Sean an y bm los coeficientes directores de p y q
respectivamente. El polinomio p1 = p − an b−1
m X
n−m q tiene obviamente grado estrictamente menor
deg q ≤ deg(c − c) + deg q = deg((c − c)q) = deg(r − r) ≤ máx{deg r, deg r} < deg q,
imposible.
Por lo tanto r = r, y ası́ (c − c)q = 0; pero q 6= 0, luego c = c.
Nótese que el grado proporciona, para la división de polinomios, el control del tamaño del resto
que para los enteros nos daba la condición 0 ≤ r < |q|.
La propia demostración sugiere el método habitual para efectuar la división, obteniendo suce-
sivamente los términos del cociente de mayor a menor grado.
Ejemplos. Dividir p(X) por q(X) en los siguientes casos:
• p(X) = X 6 + 2X 5 + 5X 4 + 7X 3 + X 2 + 3X + 5, q(X) = X 3 + 5X + 3;
• p(X) = X 7 + 1, q(X) = X + 1.
Definición 3.2.8. Dados p, q ∈ K[X], diremos que d ∈ K[X] es un máximo común divisor
de p y q si d|p, d|q, y si d0 ∈ K[X] también cumple d0 |p, d0 |q, entonces d0 |d (en palabras, si d es un
divisor común de p y q que a su vez es múltiplo de todos los divisores comunes de p y q).
100 CAPÍTULO 3. NÚMEROS RACIONALES. POLINOMIOS.
Obsérvese que hemos definido un máximo común divisor, y no el máximo comun divisor, porque
si d cumple la condición del enunciado, también la cumple ad para cualquier a de grado 0, dado
que d|ad y ad|d. Para seleccionar entre todos ellos un único polinomio, basta exigir ‘en condiciones
normales’ que sea mónico (con coeficiente director 1).
Lema 3.2.9. Dados p, q ∈ K[X] tales que p 6= 0 o q 6= 0, si d, d ∈ K[X] son máximos comunes
divisores de p y q, existe a ∈ K[X] de grado 0 (i.e., un polinomio constante no nulo) tal que d = ad.
Por tanto, si d y d son mónicos, entonces d = d.
Demostración. Aplicando la definición, necesariamente d 6= 0, d 6= 0, d|d y d|d. Por tanto, d = ad
para algún a de grado 0, y deg d = deg d; si estos polinomios son de grado n, y ambos fuesen mónicos,
tendrı́amos d = X n + bn−1 X n−1 + · · · = ad = a(X n + cn−1 X n−1 + · · · ) = aX n + acn−1 X n−1 + · · · ,
y forzosamente a = 1, d = d.
Examinando el caso excluido, p = q = 0, vemos que la definición dejarı́a como máximo común
divisor de p y q tan sólo al 0.
Definición 3.2.10. Dados p, q ∈ K[X] tales que p 6= 0 o q 6= 0, pondremos mcd(p, q) = d si d es
un (el) máximo común divisor mónico de p y q. Para p = q = 0, pondremos mcd(p, q) = 0.
Atención: la existencia de algún máximo común divisor no está garantizada todavı́a; la demos-
tración que hicimos en Z no es traspasable sin más a los polinomios. Afortunadamente, el algoritmo
de Euclides sigue siendo aplicable con el mismo esquema.
Lema 3.2.11. Si p, q, r, c ∈ K[X] son tales que p = cq + r, se tiene que mcd(p, q) = mcd(q, r).
Demostración. El caso q = 0 es trivial. Si q 6= 0, bastará ver que p y q tienen los mismos divisores
comunes que q y r, lo cual es cierto por la propiedad de linealidad.
Lema 3.2.12. Dados p, q ∈ K[X] tales que q|p, q es un máximo común divisor de p y q. En
particular, q es un máximo común divisor de q y 0.
Demostración. Consecuencia trivial de la definición.
Paso 1: Reemplazar
a por b, y
b por el resto de la división de a por b.
Paso 2: Repetir el Paso 1 hasta que b sea 0.
Paso 3: Devolver a.
Proposición 3.2.14. Algoritmo de Euclides. Dados dos polinomios no nulos a y b con deg a ≥
deg b, obtenemos un máximo común divisor procediendo por divisiones enteras sucesivas, como se
ha indicado anteriormente, hasta obtener resto nulo. El último resto no nulo es un máximo común
divisor de a y b.
Demostración. Aplicar los lemas.
d = up + vq.
Tenemos igualmente:
Paso 1: Hacer u = y = 1 e v = x = 0.
Paso 2: Determinar c y r tales que a = cb + r y r = 0 o deg r < deg b.
Reemplazar
a por b, y b por r,
u por x y v por y,
x por u − cx e y por v − cy.
Paso 3: Repetir el Paso 2 hasta que b sea 0.
Paso 4: Devolver u y v.
• p(X) = X 6 − 2X 5 + 3X 4 − 4X 3 + 3X 2 − 2X + 1, q(X) = 3X 5 − 5X 4 + 6X 3 − 6X 2 + 3X − 1;
• p(X) = X 5 + X 4 + 2X 3 − 2X + 3, q(X) = X 4 + 3X 3 + 7X 2 + 8X + 6.
Midiendo el tamaño de los polinomios por el grado, también los máximos comunes divisores son
‘máximos’ en este sentido.
Demostración. Sea d = mcd(p, q). Según la definición, r|d, y en consecuencia deg r ≤ deg d. Pero
por hipótesis deg d ≤ deg r, luego r = ad para algún a de grado 0 y r es un máximo común divisor
de p y q.
Los resultados sobre enteros que obtuvimos como consecuencia de la identidad de Bézout pueden
probarse para polinomios adaptando las demostraciones (comprobarlo).
Corolario 3.2.19. Dos polinomios no nulos p y q son relativamente primos si y sólo si existen
dos polinomios u y v tales que up + vq = 1.
También:
(i) si d = mcd(p, q), p = dr, q = ds, entonces mcd(r, s) = 1 (es decir, r y s son relativamente
primos).
Definición 3.2.21. Sea {p1 , p2 , . . . , pm } una familia finita de polinomios de K[X] no nulos. Dire-
mos que un polinomio p ∈ K[X] es un máximo común divisor de la familia {p1 , p2 , . . . , pm }
si verifica:
Igual que en Z, para hallar un máximo común divisor de una familia {p1 , p2 , . . . , pm } basta ir
obteniendo un máximo común divisor q1 de p1 y p2 , un máximo común divisor q2 de q1 y p3 , un
máximo común divisor q3 de q2 y p4 , . . .
Se puede probar:
Proposición 3.2.22. En K[X] existe un máximo común divisor de cualquier familia finita de
polinomios no nulos {p1 , p2 , . . . , pm }. Además podemos elegir un tal máximo común divisor que sea
mónico, y entonces es único.
Como en Z, en K[X] puede definirse también el mı́nimo común múltiplo de dos polinomios (o
de una familia finita).
1. pi divide a m para i = 1, 2, . . . , r, y
Proposición 3.2.25. En K[X] existe un mı́nimo común múltiplo de cualquier familia finita de
polinomios no nulos {p1 , p2 , . . . , pr }. Además entre todos ellos existe uno y sólo uno que es mónico.
Nota. El cociente es an X n−1 + bn−1 X n−2 + · · · + bk X k−1 + · · · + b1 con los bk del algoritmo de
Horner/Ruffini (comprobarlo multiplicando este polinomio por X − a).
Ejemplo. Sean p(X) = 7 − 9X + 4X 3 − 8X 4 , q(X) = 2X − 3. Para hallar el cociente y el resto
de la división de p por q, tendremos en cuenta que q(X) = 2(X − 3/2) y p = cq + r si y sólo si
1
p = 2c · q + r, luego usando el algoritmo de Horner/Ruffini
2
104 CAPÍTULO 3. NÚMEROS RACIONALES. POLINOMIOS.
−8 4 0 −9 7
3/2) −12 −12 −18 −81/2
−8 −8 −12 −27 (−67/2
con lo cual r = −67/2, 2c = −8X 3 − 8X 2 − 12X − 27, c = −4X 3 − 4X 2 − 6X − 27/2.
Ejercicios.
1. Sean p, q ∈ Q[X] dados por p(X) = X 4 − 6X 3 + 2X 2 + 3X − 4, q(X) = X 2 − X − 2 =
(X + 1)(X − 2). Probar que q no divide a p sin efectuar la división.
2. Si se divide un cierto polinomio p por X − 1 el resto es −2; si lo dividimos por X + 2 el resto
es 79. ¿Cuál es el resto que se obtiene al dividirlo por (X − 1)(X + 2)?
Corolario 3.2.28. Un polinomio de grado n puede tener a lo más n raı́ces distintas.
Demostración. Puesto que si c1 , . . . , ck son raı́ces distintas de un polinomio p, éste es divisible por
(X − c1 ) · · · (X − ck ), y por tanto debe tener grado mayor o igual que k.
p(X) = a0 + a1 X + · · · + an X n , q(X) = b0 + b1 X + · · · + bn X n ,
Ejercicio. ¿Qué valores han de tener a, b, c ∈ Q para que p(X) = aX 2 + bX + c cumpla p(−1) = 1,
p(−2) = 2, p(−3) = 7?
3.2. POLINOMIOS 105
Raı́ces múltiples.
Sea c una raı́z de un polinomio no nulo p ∈ K[X]. Según hemos probado, tendremos p =
(X − c)p1 para algún p1 ∈ K[X]. Si c fuese también raı́z de p1 , análogamente p1 = (X − c)p2 y
p = (X − c)2 p2 . Reiterando, llegaremos a encontrar un m ∈ N tal que p = (X − c)m pm y c ya NO
es raı́z de pm (va incluida la posibilidad de que pm sea constante).
Definición 3.2.31. Sea c una raı́z de un polinomio p ∈ K[X]. Diremos que c es una raı́z de
multiplicidad m si p = (X − c)m q para algún q ∈ K[X] tal que q(c) 6= 0; dicho de otro modo, si
m es el mayor número natural tal que (X − c)m |p.
Cuando m = 1, suele decirse que a es una raı́z simple ; cuando m = 2, que es una raı́z doble ;
cuando m = 3, que es una raı́z triple , etc.
Diremos que a es una raı́z múltiple para indicar que su multiplicidad es mayor o igual que 2
(o sea, que no es simple).
Se sigue inmediatamente que para un polinomio p cuyas raı́ces sean c1 , . . . , ck , con multiplici-
dades respectivas m1 . . . , mk , hay una factorización
p = (X − c1 )m1 · · · (X − ck )mk q, donde q es un polinomio que no tiene raı́ces en K.
(cuando K = C, esto obliga a que q sea constante, como comentaremos posteriormente.)
Una herramienta importante en el estudio de las raı́ces múltiples es la derivación de polinomios,
que puede definirse ‘formalmente’ para cualquier polinomio sin necesidad del concepto de lı́mite, y
que obedece a las reglas conocidas para la derivación de los polinomios reales.
Definición 3.2.32. Dado un polinomio
p(X) = a0 + a1 X + a2 X 2 + · · · + an X n ∈ K[X],
su polinomio derivado es
p0 (X) = a1 + 2a2 X + 3a3 X 2 + · · · + nan X n−1 ∈ K[X].
El polinomio derivado de p0 es el segundo derivado p00 de p, y reiterando se obtienen los sucesivos
derivados p000 , . . . , p(k) , . . .
Las funciones polinómicas asociadas a estos polinomios son la derivada primera de la función
polinómica p, la derivada segunda, . . . , la derivada k-ésima, . . .
Lema 3.2.33. Dados p, q, a ∈ K[X], se tiene
(i) (p + q)0 = p0 + q 0 ;
(ii) (pq)0 = p0 q + q 0 p;
(iii) si a constante, a0 = 0 y (ap)0 = ap0 .
Demostración. Basta aplicar (con paciencia) la definición.
Proposición 3.2.34. Sea K un cuerpo conmutativo que contiene a Q. Dado p ∈ K[X] no nulo,
(i) las raı́ces múltiples de p, con multiplicidad m, son raı́ces de p0 con multiplicidad m − 1;
(ii) las raı́ces múltiples de p son exactamente las raı́ces del máximo común divisor de p y p0 ; y
un c ∈ K es raı́z de p con multiplicidad m si y sólo si es raı́z de mcd(p, p0 ) con multiplicidad
m − 1;
(iii) c ∈ K es una raı́z de p de orden m ≥ 1 si y sólo si la primera derivada no nula de p en c es
la de orden m:
p(c) = 0, p0 (c) = 0, . . . , p(m−1) (c) = 0, p(m) (c) 6= 0.
106 CAPÍTULO 3. NÚMEROS RACIONALES. POLINOMIOS.
Demostración.
(i) c ∈ K es una raı́z de p de orden m ≥ 1 si y sólo si p = (X − c)m q con q(c) 6= 0; pero entonces,
cuando m ≥ 2, p0 = m(X −c)m−1 q +(X −c)m q 0 = (X −c)m−1 [mq +(X −c)q 0 ] = (X −c)m−1 q1
y q1 (c) = mq(c) + 0 · q 0 (c) = mq(c) 6= 0 ya que m 6= 0, con lo cual c es una raı́z de p0 de
multiplicidad m − 1.
(ii) Si c ∈ K es una raı́z de p de multiplicidad m, es raı́z de p0 de multiplicidad m − 1 según
acabamos de probar, y (X − c)m−1 divide por tanto a p y a p0 , pero (X − c)m no, luego
(X − c)m−1 también divide a mcd(p, p0 ) y (X − c)m no lo divide, es decir, c es una raı́z de
mcd(p, p0 ) de multiplicidad m − 1.
Recı́procamente, si c es una raı́z de d = mcd(p, p0 ) de multiplicidad k, (X − c)k divide a d y
por tanto divide a p y a p0 , o sea, c es raı́z de p y p0 de multiplicidad al menos k, luego c es
entonces una raı́z de p de multiplicidad necesariamente igual a k + 1.
(iii) Si c ∈ K es una raı́z de p de orden m, aplicando reiteradamente (i), es una raı́z de orden
m − 1 de p0 , de orden m − 2 de p00 , . . . , de orden 1 de p(m−1) . En consecuencia, p(m−1) (c) = 0,
p(m) (c) 6= 0.
Supongamos ahora que
p(c) = 0, p0 (c) = 0, . . . , p(m−1) (c) = 0, p(m) (c) 6= 0.
Recorriendo a la inversa el camino anterior, c es una raı́z de p(m−1) necesariamente simple,
una raı́z de p(m−2) forzosamente doble, . . . , una raı́z de p obligatoriamente de multiplicidad
m.
Nótese que p0 puede tener raı́ces que no son raı́ces de p: por ejemplo, si p = X 2 − 1, p0 = 2X.
Ejercicio. Hallar todas las raı́ces múltiples de X 5 + 3X 4 + 4X 3 + 4X 2 + 3X + 1.
Raı́ces en Q.
El estudio y localización (exacta o aproximada) de los ceros de los polinomios es de gran
importancia en numerosos ámbitos de las Matemáticas, como irá comprobando el lector a lo largo
de sus estudios. La determinación de los valores que alcanzan las funciones polinómicas es también,
esencialmente, un problema de ceros, puesto que p(x) = y ∈ K para algún x ∈ K si y sólo si
p(x) − y = 0, i.e., si x es un cero del polinomio p(X) − y. En estos tipos de cuestiones intervienen de
manera decisiva las propiedades especı́ficas del cuerpo que se considera. Por ejemplo, en cualquier
cuerpo totalmente ordenado (Q, R, . . . ) se tiene para todo x ∈ K que x2 ≥ 0, x2 + 1 ≥ 1 > 0,
luego X 2 + 1 no tiene ningún cero en estos cuerpos. Tampoco X 2 − 2 tiene ceros en Q (¿por qué?),
aunque los tiene en R como sabemos.
No hay, en general, fórmulas ‘razonables’ que permitan expresar las raı́ces de un polinomio
cualquiera en función de sus coeficientes (la búsqueda de tales fórmulas ha desempeñado un papel
importantı́simo en la historia de las Matemáticas, ver p. ej. [2], [3], [4], [5]). En este apartado
expondremos algunos criterios muy sencillos que permiten limitar la búsqueda de las raı́ces de los
polinomios en Q. La herramienta básica es la divisibilidad de números enteros, dado que podemos
conocer las raı́ces de un polinomio en Q hallando las de un polinomio con coeficientes en Z. En
efecto, si tenemos un polinomio
p(X) = a0 + a1 X + a2 X 2 + · · · + an X n ∈ Q[X],
y los coeficientes a0 , . . . , an se expresan como fracciones bk /m con un denominador común m, lo
cual siempre es posible, será p(c) = 0 si y sólo si q(c) = 0, donde
q(X) = b0 + b1 X + · · · + bn X n ,
con coeficientes b0 , . . . , bn ∈ Z.
3.2. POLINOMIOS 107
Demostración. Si c ∈ Z es tal que q(c) = 0, se deduce que b0 = c(−bn cn−1 − · · · − b1 ) y por tanto
c divide a b0 .
Si q(c) = 0 para c = a/b, a, b ∈ Z y mcd(a, b) = 1, sustituyendo y multiplicando por bn resulta
Demostración. Aplicando el teorema del resto, q(X) = (X − c)q1 (X), lo que implica
q(1) = (1 − c)q1 (1) = (c − 1)(−q1 (1)) y (c − 1)|q(1).
Análogamente q(−1) = (−1 − c)q1 (−1) = (c + 1)(−q1 (−1)) y (c + 1)|q(−1).
Obviamente, los polinomios de grado 1 (polinomios lineales) son irreducibles. Los polinomios
que no son irreducibles deben admitir una factorización como producto de polinomios de grado
mayor o igual que 1.
(i) si p es un polinomio cuadrático (de grado 2), entonces p es irreducible si y sólo si no tiene
raı́ces en K;
(ii) si p es un polinomio cúbico (de grado 3), entonces p es irreducible si y sólo si no tiene raı́ces
en K;
(iii) si p es de grado mayor o igual que 4, entonces para que p sea irreducible es condición nece-
saria, pero no suficiente, que p no tenga raı́ces en K.
Demostración. Ejercicio.
108 CAPÍTULO 3. NÚMEROS RACIONALES. POLINOMIOS.
Ejercicio. Sea a ∈ K tal que 4a 6= 0. Probar que el polinomio p(X) = aX 2 + bX + c ∈ K[X] tiene
raı́ces en K si y sólo si su discriminante ∆ = b2 − 4ac es un cuadrado perfecto en K, es decir,
−b + δ −b − δ
si existe δ ∈ K tal que δ 2 = ∆, en cuyo caso las raı́ces de p(X) son , (que suelen
2a 2a
escribirse conjuntamente en la fórmula tradicional
√
−b ± b2 − 4ac
.)
2a
Indicación. Para x ∈ K,
–—o0o—–
La naturaleza de los polinomios irreducibles es muy variable, dependiendo del cuerpo particular
que se considere, y en general no se sabe cómo son los polinomios irreducibles sobre un cuerpo
cualquiera. No es éste el lugar para un estudio amplio del tema: por lo que a nosotros respecta, la
información fundamental es que en C[X] los polinomios irreducibles son los lineales (de grado 1),
debido al llamado Teorema fundamental del álgebra (D’Alembert-Gauss):
Todo polinomio no constante con coeficientes complejos posee una raı́z en C.
Como consecuencia, se puede afirmar:
[1] Todos los polinomios irreducibles de C[X] son de grado uno. Este hecho se indica diciendo
que C es algebráicamente cerrado. En particular, los polinomios mónicos irreducibles de
C[X] son de la forma X − t con t ∈ C.
[2] Los polinomios mónicos irreducibles de R[X] son de dos formas:
• de grado uno, de la forma X − t con t ∈ R.
• de grado dos, de la forma (X − t)2 + r2 con t, r ∈ R, r 6= 0.
[3] En Q[X] hay polinomios irreducibles del grado que se desee.
–—o0o—–
Sobre el esquema empleado en Z, puede probarse la existencia (con los ajustes pertinentes) de
descomposición de un polinomio en producto de factores irreducibles.
Lema 3.2.40. Un polinomio p no constante es irreducible si y sólo si cuando p|rs, necesariamente
p|r o p|s (en palabras, cuando divide a un producto de polinomios tiene que dividir al menos a uno
de los factores)
Demostración. Si p es irreducible y divide a rs, o bien mcd(p, r) = 1 (y entonces p|s según la
1
Proposición 3.2.20), o bien mcd(p, r) = d 6= 1, con lo cual p = ad, a constante no nula, y d = p;
a
1 1
entonces, para algún q, r = qd = q p = q p, es decir, p|r.
a a
Recı́procamente, si p cumple la condición del enunciado tiene que ser irreducible, pues de p = rs
se sigue que p|rs, luego o bien p|r (y como r|p es deg p = deg r y por tanto deg s = 0) o bien p|s (y
análogamente deg r = 0).
3.2. POLINOMIOS 109
Corolario 3.2.41. Sean p, q ∈ K[X] mónicos e irreducibles tales que p divide a q. Entonces p = q.
Demostración. Puesto que p es irreducible, no es una constante, luego q = ap donde forzosamente
deg a = 0, puesto que q es irreducible. Como p y q son mónicos, necesariamente a = 1 y p = q.
Correspondiendo al teorema fundamental de la Aritmética tenemos el siguiente, que podrı́a
llamarse ‘teorema fundamental de la aritmética de polinomios’.
Teorema 3.2.42 (de factorización única). Para todo polinomio p ∈ K[X] no constante existen
a constante y q1 , . . . , qm ∈ K[X] mónicos e irreducibles tales que
p = aq1 · · · qm .
Además, a y los qj son únicos para cada p.
En palabras, p puede descomponerse como producto de una constante por factores mónicos
irreducibles de manera única, salvo el orden de dichos factores.
(Esto se expresa diciendo que el dominio de integridad K[X] es de factorización única .)
Demostración. Sea a el coeficiente director de p, entonces p = a−1 p es mónico y p = ap. Veamos
que todo polinomio mónico no constante p se puede expresar como producto de polinomios mónicos
irreducibles. Para ello procedamos por inducción sobre el grado deg p ≥ 1.
Si deg p = 1, es claro que p es irreducible.
Supongamos que deg p > 1, y que el resultado es cierto para todo polinomio mónico de grado
inferior al de p.
Si p es irreducible, se sigue lo pedido.
En caso contrario, se puede expresar p = g1 g2 con g1 , g2 ∈ K[X] no constantes, esto es, de grado
no inferior a 1. Además podemos elegirlos mónicos pues el producto de los coeficientes directores
de ambos polinomios vale 1. Puesto que deg g1 , deg g2 < deg p, por hipótesis de inducción g1 y g2
se pueden expresar como producto de polinomios mónicos irreducibles, luego lo mismo sucede con
p = g1 g2 .
Veamos la unicidad: sean aq1 q2 · · · qm = p = bp1 p2 · · · pr dos descomposiciones como las del
enunciado, donde qi , pj ∈ K[X] mónicos e irreducibles, a, b ∈ K. Puesto que el producto de
polinomios mónicos es mónico se sigue que a = b es el coeficiente director de p. Por tanto
q1 q2 · · · qm = p1 p2 · · · pr . Ahora q1 divide p1 p2 · · · pr , y como q1 es irreducible, divide a algún pj .
Cambiando la numeración, si es preciso, podemos suponer que q1 divide p1 , y como p1 y q1 son
mónicos, por el corolario anterior se sigue que p1 = q1 . Simplificando nos queda q2 · · · qm = p2 · · · pr .
Procediendo análogamente con q2 y reiterando el proceso se sigue que m = r y salvo el orden es
p2 = q 2 , p 3 = q 3 , . . . , p m = q m .
Ejemplo. Factoricemos p(X) = 14X 5 − 25X 4 − 85X 3 + 285X 2 − 179X + 30 en Q[X]. Buscamos
primero sus raı́ces enteras, que pueden ser ±1, ±2, ±3, ±5, ±6, ±10, ±15, ±30; pero p(1) = 40,
p(−1) = 550 (utilizar el algoritmo de Ruffini), luego sólo −3 es una posible raı́z; de nuevo mediante
el algoritmo de Ruffini comprobamos que p(−3) = 0 y que
q(X) = p(X)/(X + 3) = 14X 4 − 67X 3 + 116X 2 − 63X + 10,
polinomio que ya no puede tener raı́ces enteras y cuyas posibles raı́ces fraccionarias son ±1/2, ±5/2,
±1/7, ±2/7, etc. Afortunadamente, probando primero 1/2 resulta q(1/2) = 0,
r(X) = q(X)/(X − 1/2) = 14X 3 − 60X 2 + 86X − 20 = 2(7X 3 − 30X 2 + 43X − 10),
que sólo puede tener raı́ces fraccionarias entre ±1/7, ±2/7, etc. Probando nuevamente se obtiene
r(2/7) = 0, (1/2)r(X)/(X − 2/7) = 7X 2 − 28X + 35 = 7(X 2 − 4X + 5) = 7[(X − 2)2 + 1], que ya
no puede tener raı́ces en Q (¿por qué?) y por tanto es irreducible (¿por qué?). Finalmente, pues,
1 2
p(X) = 14X 5 − 25X 4 − 85X 3 + 285X 2 − 179X + 30 = 14(X + 3)(X − )(X − )(X 2 − 4X + 5).
2 7
110 CAPÍTULO 3. NÚMEROS RACIONALES. POLINOMIOS.
p(X) = X 5 + 3X 4 + 4X 3 + 4X 2 + 3X + 1, q(X) = X 6 + X 4 − X 2 − 1.
Determinemos mcd(p, q), mcm(p, q) a partir de su factorización. Procediendo como antes es fácil
ver que
p(X) = (X + 1)3 (X 2 + 1), q(X) = (X + 1)(X − 1)(X 2 + 1)2 ,
y ası́
mcd(p, q) = (X + 1)(X 2 + 1), mcm(p, q) = (X + 1)3 (X − 1)(X 2 + 1)2 .
Ejercicios
En los ejercicios siguientes, si no se especifica nada sobre K se supone K = Q.
13.1. Sea p ∈ Q[X] tal que p(1) = 1, p(2) = 4. Sea q(X) = X 2 − 3X + 2. Determinar el resto de la
división de p por q.
13.2. Hallar el cociente y el resto de la división de X 2 , X 3 , X 4 y X 5 por el polinomio q(X) =
X 3 − 2X 2 + 3X − 1.
13.3. Determinar polinomios u y v tales que
13.9. Hallar el máximo común divisor y el mı́nimo común múltiplo de los polinomios
p(X) = 2X 4 + X 3 − 8X 2 − X + 6, q(X) = 2X 3 − 7X 2 + 8X − 3.
n
X p(k) (a)
p(X) = (X − a)k .
k!
k=0
n
X n
(pq)(n) = p(k) q (n−k) .
k
k=0
13.15. Probar que p(X) = X 4 + 4 no tiene raı́ces en Q y que puede factorizarse (en Q[X]) como
producto de dos polinomios de grado 2.
Ejemplos: maple
Ejemplos: Matematica
Ejemplos: maple
quo(A,B); x+4
rem(A,B); 6 + 12x2 − 30x
gcd(A,B); 1
lcm(A,B); (2x4 + x3 − 8x2 − x − 6)(2x3 − 7x2 + 8x − 3)
1
gcdex(A,B,x,’u’,’v’); u,v; 5 5 1 2 1 1 1 1
− 4 + 4x − 2x , 2 − x + x2 + 2x3
2 2 1 1 8 8 1
diff((x + 1)^2*(x - 1)^3,x); 2(x + 1)(x − 1)3 + 3(x + 1)2 (x − 1)2
diff(expand((x + 1)^2*(x - 1)^3),x); 5x4 − 4x3 − 6 x2 + 4 x + 1
expand(diff((x + 1)^2*(x - 1)^3,x)); 5x4 − 4x3 − 6 x2 + 4 x + 1
Ejemplos: Matematica
PolynomialQuotient[A,B, x] 4+x
PolynomialRemainder[A,B, x] 6 − 30x + 12x2
PolynomialGCD[A,B] 1
PolynomialLCM[A,B] (−3 + 8x − 7x2 + 2x3 )(−6 − x − 8x2 + x3 + 2x4 )
D[(x + 1)^2*(x - 1)^3,x] 2 (−1 + x)3 (1 + x) + 3 (−1 + x)2 (1 + x)2
D[Expand[(x + 1)^2*(x - 1)^3],x] 1 + 4 x − 6 x2 − 4x3 + 5x4
Expand[D[(x + 1)^2*(x - 1)^3,x]] 1 + 4 x − 6 x2 − 4x3 + 5x4
Raı́ces
Ejemplos: maple
Ejemplos: Matematica
1 √ 1 √
Roots[x^3 + x^2 - 12 == 0] x == (−3 − ı̇ı 15)|| x == (−3 + ı̇ı 15)|| x == 2
2 2
√ √
1 1
Solve[x^3 + x^2 - 12 == 0] {x → 2}, x → (−3 − ı̇ı 15) , x → (−3 + ı̇ı 15)
2 2
NSolve[x^3 + x^2 - 12 == 0] {{x → −1.5 − 1.93649 ı̇ı}, {x → −1.5 + 1.93649 ı̇ı}, {x → 2.}}
Factorización
Como las raı́ces, la factorización de polinomios depende del cuerpo en el que se toman los
coeficientes. La cantidad de situaciones posibles es inmensa, y sólo podemos dar idea somera de
algunas de ellas mediante ejemplos.
ejemplos.
irreduc(A); true si A es irreducible sobre el menor cuerpo que
contiene a los coeficientes, false si es reducible. Ad-
mite opciones.
Ejemplos: maple
factor(4*x^2-1);
(2x − 1)(2x + 1)
factor(x^2 - 2*sqrt(2)*x + 2);
√
(x − 2)2
factor(x^6-12*x^4+44*x^2-48);
(x − 2)(x + 2)(x2 − 6)(x2 − 2)
factor(sqrt(2)*(x^6-12*x^4+44*x^2-48));
√ √ √
2 (x2 − 6)(x + 2)(x − 2)(x + 2)(x − 2)
factor(sqrt(2)*sqrt(3)*(x^6-12*x^4+44*x^2-48));
√ √ √ √ √ √ √ √
3 2 (x − 3 2)(x + 3 2) (x + 2)(x − 2)(x + 2)(x − 2)
factor(x^6-12*x^4+44*x^2-48,{sqrt(2),sqrt(3)}); (más ‘ortodoxo’)
√ √ √ √ √ √
(x − 3 2)(x + 3 2) (x + 2)(x − 2)(x + 2)(x − 2)
irreduc(x^3+5);
true
irreduc(x^3+5,5^(1/3));
false
factor(x^3+5,5^(1/3));
(x2 − x 5(1/3) + 5(2/3) ) (x + 5(1/3) )
3.2. POLINOMIOS 115
Ejemplos: Mathematica
Factor[4 x^2 + 1]
(−1 + 2 x) (1 + 2 x)
Factor[x^2 - 2 Sqrt[2] x + 2]
2 − 2 x + x2
Factor[x^2 - 2 Sqrt[2] x + 2, Extension -> Sqrt[2]]
√
( 2 − x)2
Factor[x^6 - 12 x^4 + 44 x^2 - 48]
(−2 + x) (2 + x) (−6 + x2 ) (−2 + x2 )
Factor[Sqrt[2] (x^6 - 12 x^4 + 44 x^2 - 48)]
√
2 (−2 + x) (2 + x) (−6 + x2 ) (−2 + x2 )
Factor[x^6 - 12 x^4 + 44 x^2 - 48, Extension -> {Sqrt[2],Sqrt[3]}]
√ √ √ √ √ √
( 2−x) ( 6−x) (−2+x) (2+x) ( 2+x) ( 6+x) (x+ 2)(x− 2)(x+2)(x−2)
(Para entender qué significan las extensiones de cuerpos y por qué son importantes, ver el
capı́tulo 7 de [GJPR].)
116 CAPÍTULO 3. NÚMEROS RACIONALES. POLINOMIOS.
Bibliografı́a
[C-C-S] Cohen, A. M.; Cuypers, H.; Sterk, H.: Algebra Interactive! (Learning algebra in an
exciting way). Springer, Berlin, 1999.
[D’A-W] D’Angelo, J. P.; West, D. B.: Mathematical Thinking. Problem-Solving and Proofs.
Prentice-Hall, Upper Saddle River, NJ, 1997.
[Duval] Duval, D.: Cálculo simbólico y automatización. Mundo cientı́fico, Extra 1: El universo de
los números, pp. 78–86.
[GJPR] Goberna, M. A.; Jornet, V.; Puente, R.; Rodrı́guez, M.: Álgebra y fundamentos.
Una introducción. Ariel, Barcelona, 2000.
[Pest] Pestana, D. & al.: Curso práctico de Cálculo y Precálculo. Ariel, Barcelona, 2000.
Documentos en Internet
[3] The MacTutor History of Mathematics archive: Quadratic, cubic and quartic equa-
tions.
http://www-history.mcs.st-and.ac.uk/history/HistTopics/Quadratic etc equations.html
[4] The MacTutor History of Mathematics archive: The development of group theory.
http://www-history.mcs.st-and.ac.uk/history/HistTopics/Development group theory.html
117
118 BIBLIOGRAFÍA
Capı́tulo 4
Números reales
En En
la asignatura de de
la asignatura Análisis matemático
Análisis matemático I se
I sehan
hantratado
tratadolas
laspropiedades
propiedades básicas
básicas de los números
números
reales desde
reales desde unun planteamiento axiomático más o menos explı́cito. Aquı́ Aquı́ nos
nos limitaremos,
limitaremos, porpor tanto,
tanto,
aa describir
describir aa grandes
grandes rasgos
rasgos las
las distintas
distintas construcciones
construcciones de de RR aa partir
partir de
de QQ yy la
la caracterización
caracterización
axiomática de
axiomática R, yy estudiaremos
de R, estudiaremos brevemente
brevemente la la representación
representación decimal
decimal (y(y otras)
otras) de
de los
los números
números
reales. La
reales. La bibliografı́a
bibliografı́a oportuna
oportuna se se irá
irá citando
citando aa lo
lo largo
largo de
de la
la exposición.
exposición.
4.1 LECTURA:
4.1. LECTURA: Construcciones
Construcciones de
de los
los números
números reales.
reales.
4.1.1 Insuficiencia
4.1.1. de Q
Insuficiencia de Q
Ya Ya hemoshemosvisto queque
visto desde
desdeel el
punto
puntodedevistavistaalgebraico,
algebraico,elelsistema
sistema de de los
los números racionales es
números racionales es
bastante incompleto:
bastante incompleto: sisi bien
bien en
en QQ eses posible
posible resolver
resolver siempre
siempre ecuaciones
ecuaciones deldel tipo
tipo ax
ax ++ bb == 0,
0, con
con
a
= 0, hay ecuaciones tan simples como x 2 = 2 que no tienen solución. Esto fue descubierto ya
2
a 6= 0, hay ecuaciones tan simples como x = 2 que no tienen solución. Esto fue descubierto ya
por los
por los pitagóricos
pitagóricos en en el
el siglo
siglo VV antes
antes de de nuestra
nuestra era,
era, en
en su
su formulación
formulación geométrica,
geométrica, en
en términos
términos
de conmensurabilidad
de conmensurabilidad ee inconmensurabilidad
inconmensurabilidad de de longitudes
longitudes (ver
(ver notas
notas históricas
históricas en
en [[Ebb
Ebb],
], cap. 2;
cap. 2;
también, [ ], p. 79 y pp. 103–109). Dos segmentos AB y CD son
también, [Kl1], p. 79 y pp. 103–109). Dos segmentos AB y CD son conmensurables si pueden ser
Kl1 conmensurables si pueden
ser medidos
medidos exactamente
exactamente con con
una una unidad
unidad de longitud
de longitud común
común u, esu,decir,
es decir, si un
si hay haynúmero
un número “exacto”
“exacto”m ∈
m ∈ N de segmentos de longitud u que colocados uno tras otro sin solaparse
N de segmentos de longitud u que colocados uno tras otro sin solaparse cubren AB, y lo mismo cubren AB, y lo mismo
un número
un número nn de de segmentos
sementos parapara CD;
CD; la la razón
razón oo proporción
proporción entre
entre laslas longitudes
longitudes de de los
los segmentos
segmentos
AB yy CD
AB CD es es la
la misma
misma que que la
la razón
razón (el
(el cociente)
cociente) entre
entre los
los números
números m m yy n.
n. En
En caso
caso contrario,
contrario, sonson
inconmensurables.
inconmensurables.
Q
A
s
C
t ?
P
u
0 1/5 2/5 3/5 4/5 1 X ?
BDst
Figura
Figura 11 Figura
Figura 22 Figura
Figura 33
Fijado
Fijado unun segmento
segmento cualquiera,
cualquiera, es
es fácil
fácil construir
construir por
por semejanza
semejanza de
de triángulos
triángulos unun nuevo
nuevo segmento
segmento
cuya
cuya razón
razón con
con el
el primero
primero sea
sea igual
igual aa un
un valor
valor m/n
m/n arbitrariamente
arbitrariamente dado
dado (en
(en la
la figura
figura 11 se
se muestra
muestra
119
107
120 CAPÍTULO 4. NÚMEROS REALES
anillos e ideales. Puede verse, por ejemplo, en [GJPR], [Ebb], [Ham], [S-T] (aquı́ hay además
un interesante apartado sobre la ‘conexión con la intuición’, p. 204).
Este es el método más empleado generalmente, sobre todo porque permite usar construcciones
parecidas en otras situaciones (compleción de espacios métricos en Topologı́a, por ejemplo.)
• método de Dedekind de las cortaduras. Se dirige a conseguir que se cumpla ‘el axioma
del supremo’, no válido en Q. Se parte de las cortaduras en Q, que son pares (A, B) de
subconjuntos de Q tales que:
• A y B son complementarios, A ∪ B = Q y A ∩ B = ∅;
• A=6 ∅=6 B;
• cada elemento de A es menor que cada elemento de B.
Cada cortadura está determinada por A o por B (v. comentarios en [Ebb]), de modo que
podemos quedarnos, por ejemplo, con el conjunto A, y decir como en [Spv], que
un número real es un conjunto A de números racionales con las propiedades siguientes:
• si x ∈ A e y ∈ Q es tal que y < x, entonces también y ∈ A;
• ∅=6 A 6= Q;
• no hay un elemento máximo en A, de manera que si x ∈ A, existe algún y ∈ A tal que
y > x.
De qué modo se definen la suma, el producto y la ordenación en el conjunto R de los números
reales puede verse en [Spv], pp. 811 y ss.; ver también [Ebb], pp. 36 y ss.
• otros métodos. ¿Por qué no usar “los decimales” para construir R? Es posible, pero tiene
más inconvenientes ‘técnicos’ que los métodos anteriores. La manera de hacerlo está indicada
en [Spv], pp. 826–827, ejercicio 2.
También se han empleado intervalos encajados o, equivalentemente, pares de sucesiones
monótonas —los extremos de los intervalos— (v. [Ebb], especialmente el comentario final,
p. 46).
Unicidad y minimalidad de R.
En las sucesivas ampliaciones de los números se busca siempre, como hemos señalado anterior-
mente, solucionar algún defecto, pero con una propiedad de minimalidad. Ası́, en los contenidos
N ⊂ Z ⊂ Q,
Z es el menor grupo que contiene a N y Q es el menor cuerpo que contiene a Z; ahora, R no
sólo es el menor cuerpo completo que contiene a Q, sino que es el único salvo isomorfismos.
Una explicación detallada de este hecho puede verse en [Spv], cap. 29, y en [Ebb], p. 50; también,
en [S-T], cap. 10.
122 CAPÍTULO 4. NÚMEROS REALES
4.3.1. Aperitivo.
Lee atentamente estos enunciados:
(3) Sea x = 0.999 . . . Entonces 10x = 9.999 . . ., de modo que 10x − x = 9.999 . . . − 0.999 . . . = 9
9
y de aquı́ 9x = 9, luego x = = 1, es decir, 1 = 0.999 . . .
9
Responde ahora cuidadosamente a estas cuestiones:
Con los números decimales no valen las mismas reglas de operación que con los demás números
t
u
Otras (explicarlas) u
t
ahora las cifras son los coeficientes de las potencias negativas decrecientes de 10. En la tipografı́a
latina el separador tradicional es una coma, y en la anglosajona un punto; bajo la influencia de
los ordenadores se ha extendido el uso de este último y será el que (a regañadientes) adoptaremos
aquı́. Ası́ pues, la representación decimal del número inicial será hh 1234.56789 ii.
Al igual que para los enteros, hh −1234.56789 ii representará el número opuesto del anterior,
−123456789/105 .
Mantenemos, pues, una notación posicional, en la que cada cifra va multiplicada según su
posición por un factor (un peso), que en el caso de los enteros es una potencia positiva o nula de
1
10, admitiéndose ahora pesos fraccionarios del tipo n = 10−n (i.e., potencias negativas de 10).
10
Pero ası́ se escriben sólo algunos números reales muy especiales: en general, una representación
decimal finita em em−1 . . . e1 e0 .d1 d2 . . . dn (m entero no negativo, n ∈ N, con ek , dj entre 0 y 9 para
0 ≤ k ≤ m, 1 ≤ j ≤ n), corresponde a
d1 d2 dn
em · 10m + · · · + e1 · 10 + e0 + + + ··· + n
10 102 10
En resumen, vamos haciendo la selección de los dı́gitos de modo que se formen sucesivamente
decimales finitos, cada vez con una cifra más, de tal manera que dichos decimales finitos sean en
cada paso los que “mejor ajusten por abajo”, los que constituyan la aproximación inferior óptima
del número a representar.
La herramienta fundamental en este proceso de construir la representación decimal de cualquier
número real es la noción de parte entera de un numero real arbitrario. Recordemos su definición.
Lema 4.3.1 (Parte entera de un número real). Dado x ∈ R, existe un número entero (y uno
solo), que suele denotarse con bxc, tal que
estos intervalos constituyen una partición de R). Cuando x ∈ [N, N + 1), y sólo entonces, N es la
parte entera de x.
Tenemos ası́ una pista para construir gráficamente, en general, las cifras decimales sucesivas
de cualquier número real x ≥ 0. Pues si ponemos N = bxc y d1 es la primera cifra decimal de
d1 d1 + 1
x, determinada por la condición de que N + ≤ x < N + , esto significará que x ∈
10 10
d1 d1 + 1
[N + , N + ), luego dividiendo el intervalo [N, N + 1) en diez subintervalos disjuntos, del
10 10
1
mismo tipo, de longitud ,
10
1 1 2 8 9 9
[N, N + ), [N + , N + ), . . . , [N + , N + ), [N + , N + 1),
10 10 10 10 10 10
basta localizar entre ellos el único que contiene a x.
x
[ )[ ) • • • • • [ × ) • • • • • [ )[ )
1 2 d1 d1 +1 8 9
N N + 10 N + 10 N + 10 N + 10 N + 10 N + 10 N +1
Obsérvese que si ‘ampliamos 10 veces la escala’, resulta 10N + d1 ≤ 10x < 10N + d1 + 1, de
modo que justamente 10N +d1 = b10xc, y obtenemos por tanto d1 = b10xc−10N = b10xc−10bxc.
d1 d1 + 1
Para hallar el segundo decimal, repetimos el proceso: el intervalo [N + , N + ) se divide
10 10
1
en diez subintervalos cerrados a izquierda y abiertos a derecha, disjuntos, cada uno de longitud ,
100
d1 d2 d1 d2 + 1
y localizamos el único de ellos que contiene a x. Sea éste [N + + ,N + + ); entonces
10 100 10 100
d1 d2 d1 d2 + 1
N+ + ≤x<N+ + , y multiplicando por 100,
10 100 10 100
100N + 10d1 + d2 ≤ 100x < 100N + 10d1 + d2 + 1,
es decir,
100N + 10d1 + d2 = b100xc y d2 = b100xc − 10(10N + d1 ) = b102 xc − 10b10xc.
Reiterando el proceso iremos obteniendo los sucesivos decimales de x. Análogamente, llegaremos a
d1 d2 dn d1 d2 dn + 1
N+ + 2 + ··· + n ≤ x < N + + 2 + ··· + y dn = b10n xc − 10b10n−1 xc.
10 10 10 10 10 10n
Esta va a ser la definición ‘oficial’ de las cifras decimales de un número real cualquiera.
Definición 4.3.2 (Cifras decimales). Dado un número real x ≥ 0 y n ∈ N, la n-ésima cifra
decimal de x es
dn = b10n xc − 10b10n−1 xc.
Si x ≥ 0 y em em−1 . . . e1 e0 es la representación en base 10 de bxc bxc = em 10m +· · ·+e1 10+e0 ,
ei ∈ {0, 1, 2, 3, 4, 5, 6, 7, 8, 9} (0 ≤ i ≤ m), em 6= 0 si bxc 6= 0 , la expresión
em em−1 . . . e1 e0 .d1 d2 . . . dn . . .
recibe el nombre de representación decimal o desarrollo decimal de x.
Cuando hay un M tal que dn = 0 para todo n > M , el desarrollo se abrevia simplemente a
x = em em−1 . . . e1 e0 .d1 d2 . . . dM .
Para x < 0, se toma la representación decimal de |x| con un signo − delante.
4.3. REPRESENTACIÓN DECIMAL 125
No hay que dejarse impresionar por esta definición; las sucesivas cifras decimales de x pueden
irse obteniendo recursivamente como en el comentario previo, según justificamos a continuación.
Proposición 4.3.3. Dado un número real x ≥ 0 y una sucesión (dn ) de números enteros, sea (qn )
la sucesión definida por
d1 dn
qn = bxc + + · · · + n , n ∈ N.
10 10
Las siguientes propiedades son equivalentes:
dn+1
10n+1 qn+1 = 10n+1 (qn + ) = 10 · 10n qn + dn+1 = 10b10n xc + (b10n+1 xc − 10b10n xc) = b10n+1 xc.
10n+1
126 CAPÍTULO 4. NÚMEROS REALES
¿Por qué ‘funciona’ este algoritmo? Analicémoslo en general. Supongamos que tenemos un número
x = a/b > 0 con a, b ∈ N (para simplificar). Efectuando la división entera de a por b, obtendrı́amos
a = N b + r0 con 0 ≤ r0 < b. Entonces N = ba/bc, porque de la condición sobre r0 se deduce que
N b ≤ a < N b + N = (N + 1)b y de aquı́ que N ≤ a/b < N + 1.
Para continuar, “bajamos un cero” que añadimos al resto r0 , y dividimos por b: es decir,
efectuamos la división entera de 10r0 por b, 10r0 = d1 b + r1 , 0 ≤ r1 < b. Como antes,
d1 b ≤ 10r0 < d1 b + b = (d1 + 1)b, y puesto que r0 = a − N b, esto da
d1 b ≤ 10a − 10N b < (d1 + 1)b,
10N b + d1 b ≤ 10a < 10N b + (d1 + 1)b,
10N + d1 ≤ 10(a/b) < 10N + d1 + 1,
y dividiendo or 10,
d1 a d1 1
N+ ≤ <N+ + ,
10 b 10 10
lo que prueba que el cociente d1 es la primera cifra decimal de a/b. Prosiguiendo de manera análoga,
los sucesivos cocientes son, efectivamente, las siguientes cifras decimales de a/b.
Corolario 4.3.4. Dado x ≥ 0, si para cada n ∈ N es dn su n-ésima cifra decimal, poniendo
d1 dn
qn = bxc + + · · · + n , se tiene
10 10
d1 dn
x = sup{qn = bxc + + · · · + n : n ∈ N} = lı́m qn .
10 10 n
Demostración. De
1
q n ≤ x < qn + n .
10
se sigue que
1
|x − qn | < n → 0 cuando n → +∞,
10
y ası́
lı́m qn = x.
n
Además (qn ) es una sucesión monótona no decreciente (¿quién es qn+1 − qn y qué signo tiene?), con
lo cual también sup{qn : n ∈ N} = lı́mn qn = x.
Hay ‘expresiones decimales’ que no aparecen como representación decimal de ningún número
según nuestra definición. Por ejemplo, 0.999 . . . , puesto que, con la notación anterior,
9 9 9 9
9 9 9
− n·
lı́m qn = lı́m + + ··· + n = lı́m 10 10 10 = 10 = 1,
n n 10 102 10 n 1 9
1−
10 10
mientras que 1 = 1.000 . . . . Pero cualquier ‘expresión decimal’ ±em em−1 . . . e1 e0 .d1 d2 . . . dn . . . que
‘no acabe en una sucesión de nueves’ (i.e., que no cumpla dn = 9 para todos n mayores o iguales
que un cierto n0 ), es el desarrollo decimal de algún número real (¿te atreves a demostrarlo?).
Interpretaremos las ‘expresiones decimales anómalas’ como un lı́mite, igual que en el ejemplo
anterior. Para que no haya ambigüedad, si es necesario llamaremos a la representación decimal de x
tal como la hemos definido la representación decimal canónica de x. (Comparar con [B-S], pp. 73 y
ss., y [D’A-W], pp. 231 y ss.)
Ejercicio. Para cada n ∈ N, sean an , bn ∈ {0, 1, 2, 3, 4, 5, 6, 7, 8, 9}, y supongamos que
a
1 a2 an b1 b2 bn
lı́m + + · · · + n = lı́m + + ··· + n .
n 10 102 10 n 10 102 10
Probar que an = bn para todo n o, en caso contrario, existe un N ∈ N tal que an = bn para todo
n ≤ N y an = 0, bn = 9 (o an = 9, bn = 0) para todo n > N .
(Cf. [Lieb], p. 19.)
4.3. REPRESENTACIÓN DECIMAL 127
y definamos entonces (
1 si dn,n = 0
dn =
0 en caso contrario.
La sucesión (qn ) definida por
d1 dn
+ · · · + n , n ∈ N,
qn =
10 10
es una sucesión monótona no decreciente (¿quién es qn+1 − qn y qué signo tiene?) acotada supe-
riormente por
1 1 1
sup + ··· + n : n ∈ N = ,
10 10 9
luego convergente. Sea
x = lı́m qn .
n
Como 0 ≤ qn ≤ 1/9, también 0 ≤ x ≤ 1/9, y ası́ x ∈ [0, 1), por lo que x debe estar en la lista de
los xn . Pero la n-ésima cifra decimal de x es dn (¿por qué?), y la n-ésima cifra decimal de xn es
dn,n 6= dn por construcción, luego x 6= xn cualquiera que sea n y la aplicación de partida entre N y
[0, 1) no es suprayectiva, contra lo supuesto.
en la que hay un grupo de cifras decimales p1 p2 . . . pk que se repite siempre desde un determinado
lugar. El grupo p1 p2 . . . pk es el periodo , y d1 d2 . . . dj es la parte no periódica , bien entendido
que el periodo se toma de tamaño mı́nimo y que no coincide con el final de la parte no periódica.
Suele abreviarse esta expresión poniendo ±em em−1 . . . e1 e0 .d1 d2 . . . dj p1 p2 . . . pk .
233
Ejemplo. = 10.5909090909 · · · = 10.5 90 tiene parte entera 10, parte no periódica 5 y parte
22
periódica 90.
Proposición 4.3.7. La representación decimal de cada número racional es periódica. Recı́proca-
mente, cada decimal periódico es la representación decimal de un número racional.
128 CAPÍTULO 4. NÚMEROS REALES
Demostración. Sea x ∈ Q. Como 0 = 0.0 es periódico y el caso x < 0 se reduce de manera obvia al
caso −x (> 0), podemos suponer que x = a/b, a, b ∈ N.
Como ya sabemos, podemos hallar las cifras decimales de x mediante divisiones enteras sucesi-
vas. Dividiendo a por b obtendremos un cociente N ≥ 0 y un resto r0 con 0 ≤ r0 < n. Si r0 = 0, la
expresión decimal de a/b será em em−1 . . . e1 e0 .0, donde em em−1 . . . e1 e0 es la representación decimal
de N .
En caso contrario, si fuese r0 6= 0, sea 10r0 = d1 b + r1 , 0 ≤ r1 < b. Si r1 = 0, a/b =
em em−1 . . . e1 e0 .a1 0; si r1 6= 0, 10r1 = d1 b + r2 , y seguimos el proceso inductivamente si no aparece
ningún resto 0.
En tal caso, cada resto (no nulo) r0 , r1 , . . . , rk , . . . , debe ser uno de los b − 1 enteros de que
disponemos entre 1 y b − 1. Por tanto, inevitablemente aparecerá en algún momento un resto (en
el peor de los casos, rb−1 ) que ya haya aparecido previamente. Las cifras decimales obtenidas entre
estas dos apariciones se repetirán ya indefinidamente, es decir, si j y k son los menores enteros tales
que rj = rk (j < k), dj+1 . . . dk será el periodo.
Partamos ahora de un decimal periódico
em em−1 . . . e1 e0 .d1 d2 . . . dj p1 p2 . . . pk
(lo suponemos positivo por comodidad). Construyamos como ya hemos hecho anteriormente un
número real x cuyo desarrollo decimal coincida con el dado, y consideremos
d1 dj p1 pk
r = em 10m + · · · + e1 10 + e0 + + · · · + j ∈ Q, s= j+1
+ · · · + j+k ∈ Q.
10 10 10 10
Entonces
1 1 1 s
x = lı́m r + s + s k + s 2k + · · · + s nk =r+ ∈ Q,
n 10 10 10 1 − (1/10k )
que examinado atentamente contiene la regla de conversión de los decimales periódicos en fraccio-
nes: ‘se forma el numerador escribiendo primero la parte entera seguida de la parte no periódica
y luego la parte periódica, restando después la parte entera seguida de la parte no periódica, y el
denominador escribiendo tantos nueves como cifras tiene la parte periódica seguido de tantos ceros
como cifras tiene la parte no periódica’.(***)
Ejercicios
√
14.1. ¿Puede expresarse 2 como decimal periódico? ¿Por qué?
14.2. Expresar 1/7 y 2/19 como decimales periódicos.
14.3. Encontrar el número racional representado por los decimales periódicos 1.25 137 y 37.14 653.
14.4. ¿Puede existir un número racional que tenga como desarrollo decimal
0.101001000100001000001 . . .?
(A cada cifra 1 sigue un bloque de ceros, con un cero más en cada paso.)
(***)
Pues 10j+k (r + s) = em 10m+j+k + · · · + e0 10j+k + d1 10j+k−1 + · · · + dj 10k + p1 10k−1 + · · · + pk ,
10j r = em 10m+j + · · · + e0 10j + d1 10j−1 + · · · + dj , 10k − 1 = 9 · 10k−1 + · · · + 9 · 10 + 9.
4.4. REPRESENTACIÓN EN OTRAS BASES 129
Ejercicios
15.1. Hallar la representación binaria de los números cuya expresión decimal es:
(i) 2.0078125 (ii) 0.8 6 (iii) 3.141592654 . . .
15.2. Hallar la representación decimal de los números cuya expresión binaria es:
(i) 11.01 (ii) 1.0 10 (iii) 0.100011101 . . .
[Ap] Apostol, T.M.: Análisis Matemático (segunda edición). Reverté, Barcelona, 1991.
[B-S] Bartle, R. G.- Sherbert, D. R.: Introducción al Análisis Matemático de una Variable.
Limusa, México, 1990.
[D’A-W] D’Angelo, J. P.; West, D. B.: Mathematical Thinking. Problem-Solving and Proofs.
Prentice-Hall, Upper Saddle River, NJ, 1997.
[Dur] Durán, A. J.: Historia, con personajes, de los conceptos del cálculo. Alianza, Madrid,
1996.
[Ebb] Ebbinghaus, H.-D. & al.: Numbers. Springer, New York, 1991.
[GJPR] Goberna, M. A.; Jornet, V.; Puente, R.; Rodrı́guez, M.: Álgebra y fundamentos.
Una introducción. Ariel, Barcelona, 2000.
[Ham] Hamilton, A. G.: Numbers, sets and axioms: the apparatus of mathematics. Cambridge
Univ. Press, 1982.
[Kl3] Kline, M.: El pensamiento matemático de la Antigüedad a nuestros dı́as, III. Alianza
Editorial, Madrid, 1992.
[Lieb] Liebeck, M.: A Concise Introduction to Pure Mathematics. Chapman & Hall/CRC, Boca
Raton, 2000.
[Pest] Pestana, D. & al.: Curso práctico de Cálculo y Precálculo. Ariel, Barcelona, 2000.
[Spv] Spivak, M.: Calculus. Cálculo Infinitesimal. (segunda edición) Reverté, Barcelona, 1990.
[S-T] Stewart, I.; Tall, D.: The Foundations of Mathematics. Oxford Univ. Press, 1977.
Documentos en Internet
131
132 BIBLIOGRAFÍA
Capı́tulo 5
Números complejos.
Nuestra presentación de los números complejos es básicamente la del texto [Ap], completado
con [ApC]. Véase también [GJPR], [Her], cap. 4, [D’A-W], cap. 18; [Lieb], cap. 6. Para ejercicios
(resueltos y propuestos) son útiles [Spg], [Wil], ası́ como [D’A-W] y [Lieb].
C = {(a, b) : a, b ∈ R}
133
134 CAPÍTULO 5. NÚMEROS COMPLEJOS
Proposición 5.1.2. Con la suma y el producto que hemos definido, C es un cuerpo conmutativo.
Demostración. Una vez más, enunciamos las propiedades a comprobar, si bien dejamos las demos-
traciones como ejercicio. (Ver [ApC], pp. 438 y ss.)
1. Propiedad asociativa de la suma. ((a1 , b1 )+(a2 , b2 ))+(a3 , b3 ) = (a1 , b1 )+((a2 , b2 )+(a3 , b3 )).
2. Propiedad conmutativa de la suma. (a1 , b1 ) + (a2 , b2 ) = (a2 , b2 ) + (a1 , b1 ).
3. Existencia de elemento neutro (cero) para la suma. Hay un número complejo, el (0, 0),
tal que para todo (a, b) ∈ C, (0, 0) + (a, b) = (a, b) + (0, 0) = (a, b).
4. Existencia de elemento opuesto para la suma. Para cada (a, b) ∈ C hay un número
complejo (y uno sólo), el número complejo (−a, −b), tal que
(−a, −b) + (a, b) = (a, b) + (−a, −b) = (0, 0).
5. Propiedad asociativa del producto. ((a1 , b1 ) (a2 , b2 )) (a3 , b3 ) = (a1 , b1 ) ((a2 , b2 ) (a3 , b3 )).
6. Propiedad conmutativa del producto. (a1 , b1 ) (a2 , b2 ) = (a2 , b2 ) (a1 , b1 ).
7. Existencia de elemento neutro (identidad) para el producto. Hay un número complejo,
el (1, 0), tal que para todo (a, b) ∈ C es (1, 0) (a, b) = (a, b) (1, 0) = (a, b).
8. Existencia de elemento inverso para el producto. (a, b) ∈ C \ {0} hay un
Para cada
a −b
elemento (y uno sólo) en C, el número complejo , , tal que
a2 + b2 a2 + b2
a −b a −b
( 2 , ) (a, b) = (a, b) ( 2 , ) = (1, 0).
a + b2 a2 + b2 a + b2 a2 + b2
(Tiene sentido porque a 6= 0 o b 6= 0.)
9. Propiedad distributiva del producto respecto de la suma. (a1 , b1 ) ((a2 , b2 ) + (a3 , b3 )) =
(a1 , b1 ) (a2 , b2 ) + (a1 , b1 ) (a3 , b3 ).
El cuerpo C contiene un subconjunto que es ‘una copia isomorfa’ al cuerpo R, que identificaremos
con R. Precisemos esta afirmación:
Demostración. Ejercicio.
Procedemos, pues, a la identificación de a ∈ R con h(a) ∈ C, lo que nos permite usar la notación
simplificada a = (a, 0). Observando que todo elemento (a, b) ∈ C se puede escribir en la forma
i = (0, 1),
5.1. EL CUERPO COMPLEJO. 135
donde para hacer esta operación sólo hace falta usar las reglas habituales de la multiplicación y las
identificaciones anteriormente expuestas. De pasada, hemos comprobado que el número complejo i
es una raı́z de X 2 + 1 en C (‘la otra’ es −i).
Ninguna de las relaciones de orden que pueden definirse en C hacen de él un cuerpo totalmente
ordenado: no hay posibilidad niguna de que se mantengan las mismas propiedades que en Q y en
R ligan la ordenación con la suma y el producto.
(En efecto: en todo cuerpo totalmente ordenado es x2 + 1 > 0 para cualquier elemento x, mientras
que en C tenemos i2 + 1 = 0.)
• z+w =z+w
• zw = z w
(ii) Es una involución, o sea, aplicada dos veces vuelve al elemento de partida:
z = z para todo z ∈ C.
Como en R, se prueba:
5.1. EL CUERPO COMPLEJO. 137
|z − w| ≥ ||z| − |w||.
Demostración. Ejercicio.
Ejercicios
16.1. Expresar los siguientes números complejos en la forma a + ib, con a, b ∈ R:
5
i4 + i9 + i16
3 2 + 3i 1+i
a) (1 + i) ; b) ; c) ; d) √ .
3 − 4i 2 − i5 + i10 − i15 2
16.2. Calcular
4n
1−i m
X
.
1+i
m=1
16.4. Calcular dos complejos cuya suma sea 1 + 4i, cuyo cociente sea imaginario y de manera que
la parte real de uno de ellos sea −1.
16.5. Hallar x, y ∈ R tales que z = x+iy sea una raı́z cuadrada de 2−5i, es decir, (x+iy)2 = 2−5i.
En general, dados a, b ∈ R, si z = x + iy es una raı́z cuadrada de a + bi, es decir, (x + iy)2 = a + bi,
expresar x e y en función de a, b.
1+z
16.6. Sea z ∈ C con z 6= 1. Probar que es imaginario si y sólo si |z| = 1.
1−z
z−a
16.7. Sean w, z ∈ C tales que w = con 0 < a < 1. Probar que |w| < 1 si y sólo si |z| < 1.
az − 1
a−b
16.8. Probar que si |a| = 1 o |b| = 1, entonces
= 1. ¿Qué excepción debe hacerse si
1 − ab
|a| = |b| = 1?
1+z
16.9. Sea w = con w = u + iv y z = x + iy (x, y, u, v ∈ R). Probar que
1−z
u2 + v 2 − 1 2v
x= 2 2
; y= .
(u + 1) + v (u + 1)2 + v 2
LaLaidea
ideade
departida
partidaenenesta
estasección
secciónesesque
quetodo
todonúmero
númerocomplejo
complejozz== a+ib
(*)
(a,b b∈∈R)
a+ib(a, R)lolopodemos
podemos
representar en el plano como el punto de coordenadas (a, b), su afijo
representar en el plano como el punto de coordenadas (a, b), su afijo . . 1
Esto
Estosupone
suponeque quetenemos
tenemos fijado
fijado en
en elel plano
plano un
un sistema
sistema cartesiano
cartesiano de
de ejes
ejes coordenados.
coordenados. Los Los
puntos
puntos del eje de abscisas serán los complejos (x, 0), o sea, los números reales, por loque
del eje de abscisas serán los complejos (x, 0), o sea, los números reales, por lo quellamaremos
llamaremos
aaeste ejeeleleje
esteeje ejereal
real. .Análogamente,
Análogamente,elelejeejededeordenadas
ordenadasestará
estaráformado
formadopor
porlos
lospuntos
puntos(0,(0,y),
y),los
los
números y denominaremos a este eje el eje imaginario
números imaginarios puros iy, y denominaremos a este eje el eje imaginario . Nos referiremosaa
imaginarios puros iy, . Nos referiremos
este
estesistema
sistemacon conelelnombre
nombrede dediagrama
diagramade deArgand.
Argand.
EnEneste
estecontexto,
contexto,laladistancia
distanciaeuclı́dea
euclı́deaen
enelelplano,
plano,por
porejemplo,
ejemplo,permitirá
permitirádefinir
definirlaladistancia
distancia
entre dos complejos z y w, que vendrá dada
entre dos complejos z y w, que vendrá dada porpor
d(z, w)==|z|z−−w|,
d(z,w) w|,
p
2 2+ (y − v)2 .2
ya
yaque
quesisizz==x+iy,
x+iy,ww==u+iv, (x,y,y,u,u,v v∈∈R),
u+iv,(x, R),ambas
ambascantidades
cantidadesson igualesa a (x(x−−u)u)
soniguales + (y − v) .
En particular, para cada z ∈ C, su módulo mide la distancia de z a 0.
En particular, para cada z ∈ C, su módulo mide la distancia de z a 0.
Análogamente,
Análogamente,puesto
puestoquequetodo
todopunto
puntodel planozz6==00queda
delplano quedaunı́vocamente
unı́vocamentedeterminado
determinadopor por
sus coordenadas polares, es decir, su distancia al origen (i.e., su módulo) y por el ángulo
sus coordenadas polares, es decir, su distancia al origen (i.e., su módulo) y por el ángulo polar (el polar (el
que
queforma
formaelelsegmento
segmentode deextremos
extremos00yyzzcon
coneleleje
ejereal),
real),podremos
podremosutilizar
utilizarpara
paratales
taleszzlalallamada
llamada
representación
representación polar o módulo-argumental. La medida del ángulo polar (en radianes)eseslolo
polar o módulo-argumental. La medida del ángulo polar (en radianes)
que
quellamaremos
llamaremosargumento
argumentode dez.z.
Pongamosen
Pongamos enorden
ordenestos
estosconceptos.
conceptos.
Observando la figura, tenemos
Observando la figura, tenemos las lasigualdades
igualdades
<eezz==|z||z|cos
cosφ,φ, mzz==|z|
=m |z|sen
senφ,φ,
z=(a,b ) de donde
de donde
|z|
|z|(cosφφ++i isen
zz==|z|(cos senφ).
φ).
b= Im z Comosiempre
Como siempresucede
sucedecon conlalamedida
medidade deángulos,
ángulos,hay
hayaquı́
aquı́una
una
φ ambigüedad, puesto que φ y φ + 2kπ con k ∈ Z hacen el mismo
ambigüedad, puesto que φ y φ + 2kπ con k ∈ Z hacen el mismo
O a = Re z papelde
papel decara
caraaalaslasigualdades
igualdadesanteriores.
anteriores.Esto Estonos
noshace
haceabordar
abordar
las siguientes precisiones sobre la definición de
las siguientes precisiones sobre la definición de argumento.argumento.
Definición5.2.1
Definición 1.2.1(Argumentos). Dadoz z∈∈CC\ \{0},
(Argumentos).Dado {0},un
unargumento
argumentodedez zesescualquier
cualquierφφtal
talque
que
Entonces, arg z es un conjunto! Pero ‘es obvio’ que si para dos valores φ0 , φ ∈ R, se cumple
De esta forma, en cualquier intervalo semiabierto de longitud 2π, por ejemplo (−π, π], existe un
único elemento perteneciente al conjunto arg z. A este elemento se le denota por
Arg z,
z = |z| eiφ
eiπ + 1 = 0.
(Se ha dicho que esta es una de las más bellas fórmulas de las Matemáticas, porque liga los números
fundamentales del Álgebra, la Geometrı́a y el Análisis).
z .w
z +w
uz
w
w-z
w
z u1 z
0 0 1
z-w
Figura 1 Figura 2
Figura 1 Figura 2
|w||w|
dados iφ ∈ C, para construir z · w hemos de girar z un ángulo φ (con centro de giro en
dados z, z,
ww== eiφe ∈ C, para construir z · w hemos de girar z un ángulo φ (con centro de giro en el
el origen)
origen) y efectuar
y efectuar una homotecia
una homotecia que multiplique
que multiplique el módulo
el módulo de z de
porz elpor
deelw.deComo
w. Como
se muestrase muestra
en
en la figura, para llevar esto a cabo basta girar el triángulo de vértices 0, 1, z hasta
la figura, para llevar esto a cabo basta girar el triángulo de vértices 0, 1, z hasta que el segmento que el segmento
dede extremos
extremos 0 y0 1y tenga
1 tenga la la dirección
dirección deldel segmento
segmento dede extremos
extremos 0 y0 w,
y w, obteniéndose
obteniéndose ası́ası́
el el triángulo
triángulo
de vértices 0, u , u ; z · w es el punto de corte de la recta que pasa por
de vértices 0, u1 , 1uz ; zz · w es el punto de corte de la recta que pasa por 0 y uz con 0 y u z con la paralela
la paralela por por
ww a la
a la recta
recta queque pasa
pasa porporu1uy1 uy u(¿por
z
z (¿por qué?)
qué?)
Corolario
Corolario 1.2.6
5.2.6 (Representación
(Representación exponencial
exponencial deldel cocientedededos
cociente dosnúmeros
númeroscomplejos).
complejos).
Dados z , z ∈ C, si
Dados z1 , 1z2 ∈2 C, si z1 =z = |z
1 |z1 | e
1 |
iφe1
iφ1 , z = |z |iφeiφ2 = 0, se tiene
, z2 =2 |z2 | e
2 2 6= 0, se tiene
Demostración.Basta
Demostración. Basta tener
tener enen cuenta
cuenta que,
que, según
según lo lo que
que acabamos
acabamos dede probar,
probar,
|z1|z| 1 |i(φi(φ1 −φ
|z1|z| 1 | i(φi(φ 1 −φ
e e 1 −φ 2) 2)
z2 z=
2 = |z2|z| e| e 1 −φ 2 +φ 2) 2)
2 +φ == |z1|z| e1 |iφe1iφ=
1 z .
=1 z1 .
|z2|z| 2 | |z2|z| 2 | 2
Nota.
Nota.LaLa
expresión eiφe,iφφ, ∈
expresión φ∈ comparte
R,R, propiedades
comparte algebraicas
propiedades dede
algebraicas la la
exponencial real:
exponencial real:
eiφeeiφiψeiψ
==ei(φ+ψ) ∈∈
, ,φ, φ,ψ ψ
ei(φ+ψ) R,R,
(eiφ )iφ−1−1
= ei(−φ) , φ ∈ R.
(e ) = ei(−φ) , φ ∈ R.
5.3. POLINOMIOS EN C Y EN R. 141
Ejercicios
17.1. Hallar los módulos y los argumentos √ √de los números complejos: −2x (x ∈ R \ {0}), iy
(y ∈ R \ {0}), 1 + i, −1 − i, (1 + i)(1 + i 3)( 3 − i), 2 + 5i, 2 − 5i, −2 + 5i, −2 − 5i (estos últimos,
en función del arc tg(5/2)). ¿Cuál es el argumento principal?
17.2. Si φ, ψ ∈ R, entonces eiφ = eiψ si y sólo si existe k ∈ Z tal que φ − ψ = 2kπ.
17.3. Hallar el módulo y el argumento principal de 1 + cos φ + i sen φ, donde −π ≤ φ ≤ π.
1 + cos x + i sen x
17.4. Hallar la parte real y la imaginaria, el módulo y un argumento de .
1 + cos y + i sen y
1
17.5. Sean α ∈ R y a ∈ C tales que 2 cos α = a + . Obtener 2 cos nα en función de a.
a
iα
iα 1
Indicación. ¿Qué vale e − a e − ?
a
17.6. Si x + iy = (2 + cos α + i sen α)−1 con α, x, y ∈ R, hallar x e y en función de α y probar que
el punto (x, y) está siempre en la circunferencia de diámetro el segmento que une los puntos ( 31 , 0)
y (1, 0).
17.7. Sean z1 , z2 , z3 ∈ C distintos dos a dos. Explicar el significado geométrico de las relaciones:
z 3 − z1 z 3 − z1
(i) =m =0; (ii) <e =0.
z 2 − z1 z 2 − z1
z2
17.8. Sean z1 , z2 ∈ C con z1 6= 0. Probar que es imaginario si y sólo si |z1 + z2 | = |z1 − z2 |.
z1
Deducir que un paralelogramo tiene sus diagonales iguales si y sólo si es un rectángulo.
17.9. Demostrar que |z1 − z2 |2 + |z1 + z2 |2 = 2|z1 |2 + 2|z2 |2 . Deducir que “un cuadrilátero es un
paralelogramo si y sólo si la suma de los cuadrados de las longitudes de sus diagonales es igual a la
suma de los cuadrados de las longitudes de todos sus lados” (ley del paralelogramo).
17.10. Demostrar que el triángulo cuyos vértices son los puntos z1 , z2 , z3 sobre el diagrama de
Argand es equilátero si y sólo si
17.11. ¿Cuál es el lugar geométrico de los puntos del plano complejo tales que |z + 16| = 4|z + 1|?
5.3. Polinomios en C y en R.
Reflexionando sobre lo que hemos hecho hasta ahora, parece que nuestros logros son más bien
modestos. Hemos añadido a R básicamente un número, i, que nos genera ‘linealmente’ C, y que es
una raı́z del polinomio concreto X 2 + 1. ¿Qué sucederá con los demás polinomios? Lo que pasa lo
expone estupendamente el premio Nobel de Fı́sica, Richard Feynman, en un capı́tulo llamado
Algebra (de lectura absolutamente recomendada en su totalidad) de su libro [Fey], p. 22-10:
hh Ahora ustedes dirán: “¡Esto puede seguir indefinidamente! Hemos definido las potencias de
los imaginarios y todo lo demás y cuando estamos listos, viene alguien con otra ecuación
que no puede ser resuelta como x6 + 3x2 = −2. ¡Entonces tenemos que generalizar todo de
nuevo!” Pero resulta que con esta invención adicional que es simplemente la raı́z cuadrada
de −1, ¡toda ecuación algebraica puede ser resuelta! Este es un hecho fantástico que debemos
dejar que lo demuestre el Departamento de Matemáticas. Las demostraciones son hermosas
y muy interesantes, pero ciertamente no son evidentes por sı́ mismas. De hecho, la suposición
más evidente es que vamos a tener que inventar de nuevo, de nuevo y de nuevo. Pero el
142 CAPÍTULO 5. NÚMEROS COMPLEJOS
milagro más grande es que no tenemos que hacerlo. Esta es la última invención. Después
de esta invención de los números complejos, encontramos que las reglas siguen funcionando
con los números complejos y hemos terminado de inventar cosas nuevas. Podemos encontrar
la potencia compleja de cualquier número complejo, podemos resolver cualquier ecuación
escrita algebraicamente en términos de un número finito de esos sı́mbolos. No encontramos
más números nuevos. ii
(eiφ )n = einφ ,
Proposición 5.3.3. Dados dos enteros m y n, tenemos, siempre que estén definidas las potencias,
zkn = z
para cada k = 0, 1, . . . , n − 1.
Además, si α es un argumento de z, estas raı́ces están dadas por las fórmulas
zk = r eiϕk , k = 0, 1, . . . , n − 1,
donde
α 2kπ
r = |z|1/n , ϕk = + (k = 0, 1, . . . , n − 1).
n n
1.3.POLINOMIOS
5.3. POLINOMIOS EN
EN CC
YY EN
EN R.R. 14311
Demostración.(Cf.
Demostración. (Cf.[Ap[Ap ], págs
], págs 27–28)
27–28)
Los n números complejos r eiϕ k , k = 0, 1, . . . , n − 1, son distintos entre sı́: pues si tomamos
Los n números complejos r eiϕ k, k = 0, 1, . . . , n − 1, son distintos entre sı́: pues si tomamos
iϕk = r eiϕj se sigue ei(ϕk −ϕj ) = 1 [porque r = 0
enteros k, j, con 0 ≤ k ≤
enteros k, j, con 0 ≤ k ≤ n − 1, 0 −iϕ n − 1, 0 ≤ j ≤ n −
≤ j ≤ n − 1, de r e 1, de r e
iϕ k = r eiϕj se sigue ei(ϕk −ϕj ) = 1 [porque r 6= 0
y basta multiplicar por (1/r) e j ] y de aquı́ ϕ − ϕ = 2mπ para algún m ∈ Z; pero entonces
−iϕ
y basta multiplicar por (1/r) e j ] y de aquı́ ϕk − k ϕ j= 2mπ para algún m ∈ Z; pero entonces
j
α 2kπ α 2jπ k −
α +2kπ −α −2jπ = 2mπ, es decir,k − j = m es un entero, y dado que j
+ − − = 2mπ, es decir, = m es un entero, y dado que
nn nn nn nn nn
−(n−(n −− 1)1) =0 − 0− −−
(n(n 1)1) ≤k − k− j j ≤(n(n −− −−
1)1) 0 0 =n n −− 1 1 < 1,
−1−1<< n = n ≤ n ≤ n = n < 1,
n n n n n
k−j
esosólo
eso sólopuede cumplirsesi sik − j ==
puedecumplirse 0, es decir, si k = j.
n n 0, es decir, si k = j.
Además,cada
Además, cadauno
unodedetales talesnúmeros
númerosesesuna unaraı́z
raı́zn-ésima
n-ésimadedez:z:
(r eiϕk )n = rn einϕk = |z| ei(α+2kπ) = |z| eiα = z.
(r eiϕk )n = rn einϕk = |z| ei(α+2kπ) = |z| eiα = z.
Por último, no hay otras raı́ces n-ésimas de z distintas de las anteriores, pues un polinomio de
Por último, no hay otras raı́ces n-ésimas de z distintas de las anteriores, pues un polinomio de
grado n puede tener a lo más n raı́ces distintas, y las raı́ces n-ésimas de z son justamente las raı́ces
grado n puede tener a lo más n −nz. raı́ces distintas, y las raı́ces n-ésimas de z son justamente las raı́ces
del polinomio P (X) = X n
del polinomio P (X) = X − z.
Obsérvese que todas las raı́ces n-ésimas de un complejo z tienen el mismo módulo, |z|1/n , y que
Obsérvese que todas las raı́ces n-ésimas de un complejo z tienen el mismo módulo, |z|1/n , y que
sus argumentos difieren en múltiplos de 2π/n radianes, de modo
sus argumentos difieren en múltiplos de 2π/n radianes, de modo
que sus afijos están sobre una circunferencia de centro el origen
eπi/5 que sus afijos1/n
y radio |z|
están sobre una circunferencia de centro el origen
, ocupando los vértices de un polı́gono regular de
y radio |z| 1/n , ocupando los vértices de un polı́gono regular de
e 2 π i/5 n lados.
n lados.
Ejemplo. Para cada n ∈ N existen n raı́ces n-ésimas de la
π/5 Ejemplo. Para cada n ∈ N2πi/n existen n raı́ces n-ésimas de la
unidad , los números 1, 2πi/n e e2(n−1)πi/n , situados sobre
, . . . ,2(n−1)πi/n
0 unidad , los números 1, e , ..., e , situados sobre
1 los vértices de un polı́gono regular de n lados inscrito en la
los vértices de un polı́gono regular de n lados inscrito en la
circunferencia unidad, de centro el origen y radio 1. Además,
circunferencia unidad, de centro el origen y radio 1. Además,
el polı́gono es simétrico respecto del eje real. Estas raı́ces son
e -2πi/5 el polı́gono es simétrico respecto del eje real. Estas raı́ces son
e -πi/5 las potencias sucesivas de e2πi/n , y pueden obtenerse numerosas
las potencias sucesivas de e2πi/n , y pueden obtenerse numerosas
relaciones algebraicas entre ellas.
relaciones algebraicas entre ellas.
√√
Problemasdedenotación
Problemas notaciónpara paralas lasraı́ces.
raı́ces. SiSi queremos
queremos mantener
mantener laslasnotaciones z 1/nó ón zn zque
notacionesz 1/n que
empleábamospara
empleábamos paralaslasraı́ces
raı́cesn-ésimas
n-ésimasnononegativas
negativasdedeloslosnúmeros
númerosreales
realesnononegativos,
negativos,¿cómo
¿cómopro- pro-
ceder ahora, que para cada z ∈ C \ {0} tenemos n raı́ces diferentes
ceder ahora, que para cada z ∈ C \ {0} tenemos n raı́ces diferentes sin ningún criterio sin ningún criterio incontestable
incontestable
√√
paradistinguir
para distinguirentre
entreellas?
ellas?EnEn particular:
particular: ¿qué
¿qué significa
significa z z 1/2
1/2 ? ? ¿qué
¿qué significa z? z?
significa
√√
Podrı́amosreservar
Podrı́amos reservarel elsı́mbolo z 1/nó ón zn zpara
sı́mboloz 1/n raı́zn-ésima
paralalaraı́z n-ésimaprincipal
principaldedez,z,definida
definidacomo como
|z||z|
1/ni(Arg
i(Arg z)/n
1/n
e e z)/n , ,
dondeArg
donde Arg
z zindica
indicael elargumento
argumentoprincipal
principaldedez z(el(elque
quequeda
quedaentre
entre−π−πy yπ),π),o outilizar
utilizaruno
unodedeellos
ellos
(o los dos) para el conjunto de todas las raı́ces n-ésimas
(o los dos) para el conjunto de todas las raı́ces n-ésimas de z. de z.
Los
Los convenios
convenios utilizados
utilizados varı́an
varı́an dede unos
unos textos
textos a otros,
a otros, por
por lolo cual,
cual, para
para nonocaercaer
enen ambigüedades,
ambigüedades,
merece la pena explicitar siempre el significado exacto atribuido
merece la pena explicitar siempre el significado exacto atribuido a los sı́mbolos que a los sı́mbolos queseseestén
estén
manejando, sin necesidad de decantarse por ninguno. Por ejemplo,
manejando, sin necesidad de decantarse por ninguno. Por ejemplo, pondrı́amos: pondrı́amos:
• •para c∈
paraa,a,b, b,c ∈ R,R,a a
6==
0,0,
2 2 + bz + c = 0
azaz+ bz + c = 0
si siy ysólo
sólosi si
√√b2 − 4ac
−b
−b ± ± b2 − 4ac ,
z=z= ,
2a2a
esesdecir,
decir,
√√b2 − 4ac √√b2 − 4ac
−b
−b + + b 2 − 4ac −b
−b − − b2 − 4ac ,
z=z= o oz =z= ,
√ 2a2a 2a2a
donde√b2b−
donde
2 − 4ac indica una cualquiera de las raı́ces cuadradas del complejo2b2 − 4ac.
4ac indica una cualquiera de las raı́ces cuadradas del complejo b − 4ac.
144 CAPÍTULO 5. NÚMEROS COMPLEJOS
Ejemplo. Cuando z sea un número real no negativo, z ∈ [0, +∞), como z = 0 o Arg z = 0, se
obtiene como raı́z cuadrada principal de z justamente su raı́z cuadrada real no negativa
Ejercicios
18.1. Dado x ∈ R, hallar la parte real y la imaginaria de:
a) (1 n
+ cos x + i sen x) ; n
1 + cos x + i sen x
b) .
1 + cos y + i sen y
1 + sen a + i cos a n
18.2. Calcular , n ∈ N y a ∈ R.
1 + sen a − i cos a
√ √
18.3. Calcular todos los valores de 4 −1, 6 1 + i.
18.4. Hallar los números complejos que son iguales a la potencia n-ésima de sus conjugados.
18.5. Probar que la suma de las potencias n-ésimas de las raı́ces k-ésimas de la unidad es k o 0,
según n sea o no múltiplo de k.
2π 4π 6π 8π
18.6. Probar que 1 + cos + cos + cos + cos = 0 y dar una interpretación geométrica.
5 5 5 5
Probar que √ √
π 5+1 2π 5−1
cos = , cos = .
5 4 5 4
18.7. Probar que
π 2π 3π 4π
1 − cos + cos − cos + cos = 0
5 5 5 5
π 2π 3π 4π
− sen + sen − sen + sen = 0
5 5 5 5
Con mayor precisión, si un cuerpo algebraicamente cerrado contiene un subcuerpo isomorfo a , debe contener un R
subcuerpo isomorfo a .C
5.3. POLINOMIOS EN C Y EN R. 145
y mucho antes de que se lograra una demostración incuestionable (ver [DD-P], pp. 248–253). No es
un resultado fácil de demostrar con argumentos elementales pero, en cursos posteriores, será una
consecuencia sencilla del análisis de las funciones complejas de variable compleja. No obstante,
puede verse una demostración relativamente asequible (bastante larga) en [A-K], pp. 344–352; ver
también [D’A-W], pp. 324 y ss.
Aquı́ nos limitaremos a dar su enunciado y a deducir las consecuencias que de él se derivan en
relación con el estudio de las raı́ces y de la factorización de los polinomios en C[X] y en R[X].
Corolario 5.3.6. Los polinomios irreducibles en C[X] son los de grado 1 (lineales), de manera que
todo polinomio en C[X] de grado n, n ∈ N, admite una factorización como producto de n factores
lineales.
Demostración. Ya comentamos que los polinomios de grado 1 son siempre irreducibles. Cualquier
otro polinomio p en C[X] de mayor grado ya no es irreducible, pues tendrı́a una raı́z z ∈ C y serı́a
por tanto de la forma p(X) = (X − z) q(X), con deg q = deg p − 1 6= 0.
La segunda conclusión se sigue del teorema de factorización única: necesariamente,
p(X) = a(X − z1 ) · · · (X − zn )
a 6= 0, z1 , . . . , zn ∈ C si deg p = n.
Corolario 5.3.7. Sea n ∈ N. Todo polinomio en C[X] de grado n posee exactamente n raı́ces, si
se cuenta cada una de ellas tantas veces como indique su multiplicidad.
Lema 5.3.8. Dado p ∈ R[X], si z ∈ C es tal que p(z) = 0, entonces p(z) = 0. En palabras, si
un polinomio con coeficientes reales tiene una raı́z compleja z, también su conjugado z es raı́z del
polinomio.
p(z) = a0 + a1 z + · · · + an z n = a0 + a1 z + · · · + an z n = a0 + a1 z + · · · + an z n = p(z).
Corolario 5.3.9. Los polinomios irreducibles en R[X] son los polinomios lineales y los polinomios
cuadráticos de la forma
a[(X − b)2 + c2 ],
con a, b, c ∈ R, a 6= 0 y c 6= 0 (que son los polinomios cuadráticos sin raı́ces en R).
146 CAPÍTULO 5. NÚMEROS COMPLEJOS
Demostración. Los polinomios lineales son siempre irreducibles, y los polinomios cuadráticos del
enunciado son irreducibles en R[X] por ser de segundo grado y no tener raı́ces en R (nótese que las
raı́ces en C de a[(X − b)2 + c2 ] son b + ic y b − ic).
Cualquier polinomio irreducible q en R[X] es de esta forma. Pues si tiene alguna raı́z en R,
es lineal. Y si no, mirado en C[X], admitirá al menos una raı́z compleja b + ic con c 6= 0; pero
también tendrá por raı́z b − ic según el lema. Por tanto, es divisible (en principio en C[X]) por
(X − (b + ic))(X − (b − ic)) = (X − b)2 + c2 , que tiene coeficientes reales; el cociente de q por
(X − b)2 + c2 es el mismo en C[X] que en R[X] (¿por qué?), luego debe ser un a ∈ R[X] con
deg a = 0, o sea, una constante real no nula.
Nota. Los polinomios de segundo grado irreducibles en R[X] son, equivalentemente, los de la forma
AX 2 + BX + C con B 2 − 4AC < 0 (¿por qué?).
Ejercicios
19.1. Factorizar X 4 + 1 y X 4 + 4 en C[X], en R[X] y en Q[X].
19.2. Descomponer en factores irreducibles el polinomio X n + X n−1 + · · · + X + 1
(i) en C[X];
(ii) en R[X].
19.3. Mediante factorización, probar que todo polinomio real de grado impar admite al menos una
raı́z real.
19.4. Hallar dos números complejos cuya suma sea 4 y cuyo producto sea 8.
Indicación. ¿Quién es (X − a)(X − b)?
19.5. Si z1 , z2 son las dos soluciones de la ecuación az 2 + bz + c = 0, donde a, b, c ∈ R, demostrar
que z1n + z2n ∈ R para todo n ∈ N. Si la ecuación es en particular z 2 − 2z + 2 = 0, calcular z1n + z2n .
√ √
19.6. Sabiendo que la ecuación z 2 − ( 3 + i 3)z + p = 0 tiene por solución z = −1 + i, hallar p y
la otra raı́z.
19.7. ¿Qué condición han de cumplir los números reales a, b, c, d para que la ecuación
z 3 + az 2 + (b + ic)z + b + id = 0 admita una raı́z real?
19.8. Comprobar que z = 3 + 4i es una solución de la ecuación z 4 − 10z 3 + 62z 2 − 178z + 325 = 0
y hallar las otras tres raı́ces.
19.9. Considérese la ecuación z 3 − 2z + c = 0, donde c ∈ R. Hallar sus soluciones sabiendo que una
de ellas está en la bisectriz del primer cuadrante del plano complejo.
19.10. Resolver la ecuación (iz + 1)5 = (1 − z)5 .
19.11. Demostrar que el polinomio (X +i)n −(X −i)n tiene todas sus raı́ces reales y determinarlas.
19.12.
(i) Demostrar que si a ∈ R,
m−1
Y
2m 2m 2 2 2kπ
(z + a) − (z − a) = 4amz z + a cotg .
2m
k=1
N
Y
( zk significa z1 · · · zN .)
k=1
5.4. FRACCIONES RACIONALES. 147
Definición 5.4.3. Una fracción algebraica p/q se dice irreducible si p y q son relativamente
primos, es decir, si mcd(p, q) = 1.
p1 p2 p1 q 2 + p 2 q 1
+ = (∈ Φ),
q1 q2 q1 q2
y su producto
p1 p2 p1 p2
= (∈ Φ).
q1 q2 q1 q2
148 CAPÍTULO 5. NÚMEROS COMPLEJOS
p1 r 1 p2 r 2 p1 r 1 p2 r2
Lema 5.4.5. Dados , , , en Φ tales que ∼ , ∼ , se verifica
q1 s1 q2 s2 q1 s1 q2 s2
p1 p2 r1 r2 p1 p2 r1 r2
+ ∼ + , ∼ .
q1 q2 s1 s2 q1 q2 s1 s2
p1 p 2
Definición 5.4.6. Dadas dos fracciones racionales , ∈ K(X), llamaremos suma de ambas
q1 q2
a la fracción racional
p1 p 2 p 1 q 2 + p2 q 1
+ = [∈ K(X)],
q1 q2 q1 q2
y producto a la fracción racional
p1 p2 p1 p2
= [∈ K(X)].
q1 q 2 q1 q2
Proposición 5.4.7. Con la suma y el producto que hemos definido, K(X) es un cuerpo conmuta-
tivo.
Es decir, h es un isomorfismo entre K[X] y h(K[X]) por lo que, desde este momento, conside-
ramos
K[X] ⊆ K(X) y p = p/1 para todo p ∈ K[X].
En consecuencia, dos representantes distintos de una misma fracción racional originan dos
X +1
funciones racionales diferentes: por ejemplo, mientras que las fracciones racionales y
X2 − 1
X −2
son iguales, las funciones racionales f y g, cocientes respectivamente de las funciones
X 2 − 3X + 2
polinómicas x + 1 y x2 − 1, x − 2 y x2 − 3x + 2, son distintas puesto que dom f = K \ {1, −1},
dom g = K \ {1, 2}. Evidentemente, en los x pertenecientes a la intersección de sus dominios
1
ambas toman el mismo valor, igual a su vez a .
x−1
Esto es lo que sucede en general:
Sea p/q ∈ Φ y r/s una fracción irreducible equivalente a p/q; el conjunto S de ceros de s está con-
tenido en el conjunto de ceros de q, y la función racional asociada a p/q es la restricción a K \ S
de la función racional asociada a r/s.
Lema 5.4.10. Dada una fracción p(X)/q(X), existen polinomios p0 (X), p1 (X) unı́vocamente de-
terminados tales que deg p1 < deg q y
p(X) p1 (X)
= p0 (X) + .
q(X) q(X)
que equivale, cancelando q (o, para la implicación inversa, multiplicando por q), a
Por tanto, el lema es sólo otra manera de enunciar la existencia y unicidad de la división de
polinomios.
Lema 5.4.11. Si q(X) ∈ K[X] es de la forma q(X) = q1 (X)q2 (X) con mcd(q1 , q2 ) = 1, toda
fracción racional p(X)/q(X) puede descomponerse en suma de fracciones con denominadores q1 y
q2 ; es decir, existen polinomios p1 y p2 tales que
Demostración. Puesto que existen dos polinomios u y v tales que uq1 + vq2 = 1,
p p(uq1 + vq2 ) pv pu
= = + .
q q1 q2 q1 q2
(***)
Aquı́ estamos mirando p/q como elemento de K(X).
150 CAPÍTULO 5. NÚMEROS COMPLEJOS
Ejemplo. En R(X),
1 1
= √ √ .
X4 + 1 (X + 2X + 1)(X 2 − 2X + 1)
2
√ √
Llamemos A = X 2 + 2X + 1, B = X 2 − 2X + 1. Puesto que
√ √
A = B + 2 2X, B = (X − 2)X + 1,
(algoritmo de Euclides ‘salvo constantes’) se sigue que
√ √
√ √ 1 X− 2 X− 2
1 = B − (X − 2)X = B − (X − 2) √ (A − B) = B(1 + √ )−A √
2 2 2 2 2 2
√ √
X+ 2 X− 2
= √ B− √ A,
2 2 2 2
y de aquı́
√ √ √ √
1 (X + 2)B (X − 2)A 1 X+ 2 1 X− 2
= √ − √ = √ √ − √ √ .
X4 + 1 2 2AB 2 2AB 2 2 X 2 + 2X + 1 2 2 X 2 − 2X + 1
—Análogamente, para
X +1 X +1
= ,
X3 − 1 (X − 1)(X 2 + X + 1)
de X 2 + X + 1 = (X − 1)(X + 2) + 3 se sigue que
X +1 1 X + 1 1 (X + 1)(X + 2) 1 (X − 1) + 2 1 (X 2 + X + 1) + (2X + 1)
= − = −
X3 − 1 3 X − 1 3 X2 + X + 1 3 X −1 3 X2 + X + 1
1 2 1 2X + 1
= − .
3 X − 1 3 X2 + X + 1
Este segundo ejemplo sugiere que el lema anterior puede refinarse cuando el numerador es un
polinomio de menor grado que el denominador .
Lema 5.4.12. Si q(X) ∈ K[X] es de la forma q(X) = q1 (X)q2 (X) con mcd(q1 , q2 ) = 1, toda
fracción algebraica p(X)/q(X) con deg p < deg q puede descomponerse, de manera única, en
suma de fracciones con denominadores q1 y q2 y numeradores p1 y p2 tales que deg p1 < deg q1 ,
deg p2 < deg q2 ; es decir, existen polinomios unı́vocamente determinados p1 y p2 tales que
deg p1 < deg q1 , deg p2 < deg q2 y
p(X) p1 (X) p2 (X)
= + .
q(X) q1 (X) q2 (X)
Demostración. Sean p1 y p2 como en el lema anterior. Si deg p1 ≥ deg q o deg p2 ≥ deg q, dividiendo
serı́a p1 = c1 q1 + r1 , p2 = c2 q2 + r2 , deg r1 < deg q1 , deg r2 < deg q2 o nulos. Haciendo operaciones
p = (c1 +c2 )q +r1 q2 +r2 q1 ; deg(r1 q2 ) < deg q1 +deg q2 = deg q, deg(r2 q1 ) < deg q2 +deg q1 = deg q,
lo que significa que c1 + c2 es el cociente de la división de p por q, necesariamente nulo porque
deg p < deg q (el resto serı́a r1 q2 + r2 q1 ). Por tanto
p(X) r1 (X) r2 (X)
= + , deg r1 < deg q1 , deg r2 < deg q2 .
q(X) q1 (X) q2 (X)
La unicidad se sigue de que si también
p(X) s1 (X) s2 (X)
= + , deg p1 < deg q1 , deg s2 < deg q2 ,
q(X) q1 (X) q2 (X)
se deduce que r1 q2 + r2 q1 = s1 q2 + s2 q1 , es decir, (r2 − s2 )q1 = (s1 − r1 )q2 , y como q1 y q2 son
relativamente primos, q1 |(s1 − r1 ); pero entonces s1 − r1 = 0, pues en caso contrario,
deg q1 ≤ deg(s1 − r1 ) ≤ máx{deg s1 , deg r1 } < deg q1 , imposible. Por lo mismo, r2 − s2 = 0.
5.5. NÚMEROS COMPLEJOS Y GEOMETRÍA PLANA 151
Lema 5.4.13. Toda fracción racional de la forma p(X)/[q(X)]m puede expresarse como
Definición 5.4.14. Un elemento de K(X) es una fracción simple si puede escribirse en la forma
p(X)/[q(X)]k , donde q(X) es irreducible en K[X] y el grado de p(X) ∈ K[X] es estrictamente
menor que el de q(X).
a
Ejemplo. En C(X) las fracciones simples son sólo de la forma , con a, b ∈ C. En R(X)
(X − b)k
a1 + a2 X
aparecen además fracciones del tipo , a1 , a2 , b, c ∈ R.
[(X − b)2 + c2 ]k
Nota. Los programas de cálculo simbólico (maple, Mathematica ) permiten generalmente efec-
tuar estas operaciones. Por ello, recomendamos calcular ‘a mano’ los coeficientes numéricos pedidos
en alguno de los ejercicios anteriores, y plantear cuando menos la forma del resultado en todos los
demás. Solo después es aconsejable pasar al ordenador.
(Para maple , la sintaxis es hh convert((a0 + a1 ∗ x + · · · )/(b0 + b1 ∗ x + · · · ),parfrac,x);ii y
para Mathematica , hh Apart[(a0 + a1 x + · · · )/(b0 + b1 x + · · · )]ii)
Ejercicios
20.1. Desigualdades triangulares. Probar que la longitud del lado de un triángulo es menor
que la suma de las longitudes de los otros dos y mayor que su diferencia.
20.2. Mediatriz de un segmento. Probar que “el lugar geométrico de los puntos que equidistan
de dos puntos fijos A y B es la recta perpendicular al segmento AB por su punto medio.”
20.3. Demostrar que:
(ii) Si z1 + z2 + z3 + z4 = 0 y |z1 | = |z2 | = |z3 | = |z4 |, los puntos z1 , z2 , z3 y z4 o bien son vértices
de un rectángulo o bien coinciden de dos en dos.
20.4. ¿Bajo qué condición tres puntos z1 , z2 y z3 , distintos dos a dos, estarán sobre una misma
recta?
20.5. ¿Bajo qué condición cuatro puntos z1 , z2 , z3 y z4 , distintos dos a dos, estarán sobre una
misma circunferencia o sobre una misma recta?
20.6. Demostrar que las alturas de un triángulo son concurrentes (es decir, que las tres se cortan
en un mismo punto, el ortocentro del triángulo).
20.7. ¿Puede probarse algebraicamente que un paralelogramo tiene las diagonales perpendiculares
si y sólo si es un rombo? ¿Y que tiene las diagonales iguales si y sólo si es un rectángulo?
Bibliografı́a
[ApC] Apostol, T.M.: Calculus, vol. I (segunda edición). Reverté, Barcelona, 1989.
[Ap] Apostol, T.M.: Análisis Matemático (segunda edición). Reverté, Barcelona, 1991.
[DD-P] Dahan-Dalmedico, A.; Peiffer, J.: Une histoire des mathématiques. Éditions du Seuil,
Paris, 1986.
[D’A-W] D’Angelo, J. P.; West, D. B.: Mathematical Thinking. Problem-Solving and Proofs.
Prentice-Hall, Upper Saddle River, NJ, 1997.
[Ebb] Ebbinghaus, H.-D. & al.: Numbers. Springer, New York, 1991.
[Fey] Feynman, R. & al.: Fı́sica. Volumen I: Mecánica, radiación y calor. Addison-Wesley
Iberoamericana, Wilmington, Delaware, 1987.
[GJPR] Goberna, M. A.; Jornet, V.; Puente, R.; Rodrı́guez, M.: Álgebra y fundamentos.
Una introducción. Ariel, Barcelona, 2000.
[Lieb] Liebeck, M.: A Concise Introduction to Pure Mathematics. Chapman & Hall/CRC, Boca
Raton, 2000.
[Pest] Pestana, D. & al.: Curso práctico de Cálculo y Precálculo. Ariel, Barcelona, 2000.
[Spg] Spiegel, M.R.: Variable compleja. McGraw Hill (colección Schaum), 1971..
[S-T] Stewart, I.; Tall, D.: The Foundations of Mathematics. Oxford Univ. Press, 1977.
153
154 BIBLIOGRAFÍA
Capı́tulo 6
6.1. Aperitivo.
Lee atentamente estos enunciados:
155
156 CAPÍTULO 6. ARITMÉTICA DE PUNTO FLOTANTE.
Por ejemplo, para la constante de gravitación universal G = 6.673 × 10−11 , la mantisa es 6.673, la
base es 10 y el exponente −11.
Este y otros ejemplos de magnitudes muy grandes o muy pequeñas, como
La normalización ahorra espacio: Si se emplea base 2 en vez de base 10, como todas las mantisas
comenzarán por hh 1. etc.ii, podemos sobreentender no sólo el punto, sino también el 1 (‘técnica
del bit fantasma’). En la segunda normalización, todas las mantisas —en cualquier base— van a
comenzar por hh 0. etc.ii, lo que hace innecesario explicitar el 0 y el punto.
Finalmente, el tamaño de las palabras del ordenador fuerza a limitar:
la precisión, la cantidad p de dı́gitos disponibles para colocar en ellos la mantisa;
la cantidad p0 de dı́gitos disponibles para el exponente, que estará por tanto comprendido
entre un valor mı́nimo y un valor máximo.
Con tales condicionantes, fijada una base β, los números de máquina , verdaderamente dis-
ponibles en el ordenador, serán
E d2 d3 dp
y = ±β d1 + + 2 + · · · + p−1 ,
β β β
donde cada dı́gito dk satisface 0 ≤ dk ≤ β − 1 y d1 6= 0, y el exponente E toma sus valores entre
un mı́nimo Emin y un máximo Emax .
Paralelamente, con la segunda normalización obtendrı́amos
e d1 d2 dp
y = ±β + 2 + ··· + p ,
β β β
con 0 ≤ dk ≤ β − 1 y d1 6= 0, y emin ≤ e ≤ emax . Se pasa de una a otra, por tanto, tomando
e = E + 1. Ambas son equivalentes, en el sentido de que generan exactamente los mismos números
(con la relación señalada entre los exponentes, y con Emin = emin − 1, Emax = emax − 1).
Aún ası́:
— hay multitud de implementaciones posibles
— cada fabricante elige la que mejor le parece
— esto dificulta enormemente la transportabilidad de los programas de cálculo.
Para unificar, se han propuesto diversas estandarizaciones:
norma IEEE 754 (completada con la IEEE 854); denominada también IEC 559. Es la más
utilizada. Hay en la red ‘applets’ que muestran el formato archivado por el ordenador ([2]). La
normalización elegida para la mantisa (denominada significando en esta norma) es la primera,
d1 .d2 . . . dp , con β = 2 o β = 10 como bases permitidas.
norma ISO/IEC 10967-1 Language Independent Aritmetic, Part 1 [LIA-1], posterior y menos
restrictiva. Usa la segunda normalización 0.d1 d2 . . . dp para la mantisa (denominada ahora
fracción), y admite cualquier base β que sea un número natural par.
Por ser la notación más cómoda, ésta es la forma de los valores que vamos a usar para definir los
sistemas numéricos en punto flotante.
y finalmente
F = {0} ∪ FN
Llamaremos rango de F al conjunto [−f max, −f minN ] ∪ {0} ∪ [f minN , f max] (que contiene
a F estrictamente).
Nótese que ahora la mantisa m de un número y = 0.d1 d2 . . . dp × β e de FN es el entero
d1 d2 . . . dp (escritos en base β).
Llamaremos a d1 el dı́gito más significativo y a dp el dı́gito menos significativo de y.
β ≥ 2 y p ≥ 2,
p − 2 ≤ −emin ≤ β p − 1,
p ≤ emax ≤ β p − 1.
En IEEE 754 y 854 se consideran cuatro formatos distintos: precisión simple, precisión doble,
precisión simple extendida, precisión doble extendida, con valores para los parámetros (ver [Hig],
p. 41):
Ejemplos
1.- Si β = 2, p = 5 [= 22 + 1], y = 11/2 = 22 + 1 + 1/2 = 23 (2−1 + 2−3 + 2−4 ), tendrı́amos
(con mantisa y exponente en base 2, escrito el cero como O y el uno como I para distinguir)
y = O.IOIIO × 2II = IOIIO × 2II−IOI ; la mantisa m es IOIIO y el exponente e es II.
2.- ‘Minimodelo’ con β = 2, p = 3, emin = −1, emax = 3. Los números no negativos de F serı́an (en
escritura decimal) el 0 y
fracción
1/2 1/2 + 1/8 1/2 + 1/4 1/2 + 1/4 + 1/8 exponente
0.25 0.3125 0.3750 0.4375 × 2−1
0.5 0.625 0.750 0.875 × 20
1.0 1.25 1.50 1.75 × 21
2.0 2.5 3.0 3.5 × 22
4.0 5.0 6.0 7.0 × 23
Junto con sus opuestos (los simétricos respecto del origen) forman el sistema F = F (2, 3, −1, 3).
Este ejemplo ilustra cómo el espaciado de los números de F salta un factor 2 (= β) con cada
potencia de 2 (= β).
(*)
La norma IEEE 754 contempla distintos modos de redondeo: redondeo hacia +∞ (round down), redondeo hacia
−∞ (round up), redondeo hacia 0 (round towards zero) y redondeo al más próximo (round to nearest). Ver [Gold]
160 CAPÍTULO 6. ARITMÉTICA DE PUNTO FLOTANTE.
underflow overflow
Para x = 4.5, serı́a f l(x) = 4; para x = 5.5, serı́a f l(x) = 6 (¿por qué?).
(2) Para β = 10, p = 6:
a = 0.31415926525 . . . × 101 f l(a) = 0.314159 × 101
b = −0.81412781 f l(b) = −0.814128 × 100
c = 0.112399972 f l(c) = 0.124000 × 100
d = 0.999999721 f l(d) = 0.100000 × 101
Obsérvese cómo el último dı́gito de la mantisa de b ha sido modificado. El cambio puede afectar
incluso a varios dı́gitos (como en c) y a veces hasta al exponente, como en el ejemplo d.
M = β 1−p ,
Por tanto, M es el espaciado de los números en punto flotante entre 1.0 y β, mientras que el
espaciado de los números entre 1.0 y 1/β es β −p = M /β. En general,
Lema 6.2.4. La distancia entre un número en punto flotante normalizado y y otro número en
punto flotante normalizado adyacente a y es como mı́nimo β −1 M |y| y como máximo M |y| (salvo
que uno de ellos sea cero).
Demostración. Ver [Hig], pp. 41.
6.2. REPRESENTACIÓN EN PUNTO FLOTANTE 161
Pero según dice [Hig], ‘la cantidad más útil asociada con F , que está por todas partes en el
mundo del análisis de los errores de redondeo’, es la llamada unidad de redondeo, que no es otra
cosa que la mitad del épsilon de la máquina.
Definición 6.2.5. Dado un sistema numérico en punto flotante F = F (β, p, emin , emax ), el número
1 1
u = β 1−p = M se llama unidad de redondeo del sistema F .
2 2
En el estándar IEEE con simple precisión se tiene u = 2−24 ≈ 5.96 × 10−8 ; en doble precisión,
u = 2−53 ≈ 1.11 × 10−16 .
A partir del lema anterior, se obtiene:
1
| f l(x) − x| ≤ u |x| = β 1−p |x|;
2
precisando más,
1
f l(x) = x(1 + δ), |δ| < u = β 1−p .
2
Demostración. Ver [Hig], p. 42, Th. 2.2.
Esta proposición nos da cotas superiores del error absoluto y del error relativo en la aproxima-
ción de x por f l(x). Recordamos la definición de estos conceptos.
Ea (x) = |x − x
e|,
Nota. En algunos textos, el error se expresa en términos de la unidad en el último lugar, que se
define para un y ∈ F por
(ulp: unity in the last place). Ası́, por ejemplo, si F corresponde a β = 10 y p = 3, y se redondea
.0314159 a .314 × 10−1 , entonces hay un error de .159 unidades en el último lugar. Dada la distri-
bución de los elementos de F , es preferible usar el error relativo, más preciso; mientras que para
x = 0.9994999999 tendrı́amos f l(x) = 0.999 × 100 , con ulp(f l(x)) = 10−3 y un error de 0.4999999
ulp ≈ 0.5 ulp, el error relativo es 0.0005002502252 ≈ 0.1u, y sin embargo para x = 1.005 serı́a
f l(x) = 0.100 × 101 , con ulp(f l(x)) = 10−2 , un error de 0.5 ulp igualmente, pero el error relativo
correspondiente serı́a 0.004975124378 ≈ u, aproximadamente diez veces mayor que el anterior (este
es el fenómeno llamado wobbling precision, ‘precisión bamboleante’ u ‘oscilante’).
162 CAPÍTULO 6. ARITMÉTICA DE PUNTO FLOTANTE.
Lema 6.3.1. Sean x, y, αx , αy , εa (x), εa (y), números reales tales que |αx | ≤ εa (x), |αy | ≤ εa (y),
y sean
x
e = x + αx
. Entonces Ea = |(x + y) − (e x + ye)| ≤ |αx | + |αy |,
ye = y + αy
pudiendo tomar Ea cualquier valor desde Ea = 0 hasta Ea = εa (x) + εa (y).
Análogamente, si x + y 6= 0, y para ρx , ρy , es
x
e = x(1 + ρx ) |(x + y) − (e
x + ye)| |x ρx + y ρy |
, entonces Er = = ,
ye = y(1 + ρy ) |x + y| |x + y|
y nada puede decirse en general: Er puede tomar cualquier valor en [0, +∞).
Ea = |(x + y) − (e
x + ye)| = | − (αx + αy )| ≤ |αx | + |αy |.
Como cualquier valor r ∈ [0, εa (x) + εa (y)] puede ponerse en la forma r = s + t con 0 ≤ s ≤ εa (x),
0 ≤ t ≤ εa (y) (¿por qué?), Ea puede alcanzar el valor r.
En cuanto a Er , sustituyendo xe y ye por su expresión en términos de x e y aparece la igualdad
del enunciado. Que Er puede alcanzar cualquier valor no negativo es claro: tomemos, por ejemplo,
x > 0, h > 0 cualesquiera, y = −x + h, ρx ≥ 0 arbitrario, ρy = 0; ası́ x + y = h y
xρx
Er = ,
h
que puede tomar tanto el valor Er = 0 para ρx = 0 como cualquier valor positivo R (basta que sea
xρx
ρx > 0, h = ).
R
Vemos, pues, que aunque el error absoluto de los sumandos esté acotado por un cierto εa , el de la
suma puede llegar a ser 2εa , y al cabo de N sumas, N εa , y que el error relativo queda descontrolado.
Como generalmente lo que importa es el error relativo, afinaremos el resultado anterior.
Proposición 6.3.2. Sean x, y, ρx , ρy , εr (x), εr (y), números reales tales que x + y 6= 0 y |ρx | ≤
εr (x), |ρy | ≤ εr (y), y sean
x
e = x(1 + ρx )
.
ye = y(1 + ρy )
Si x e y tienen el mismo signo,
Demostración. Cuando x e y tienen el mismo signo, |x + y| = |x| + |y| (¿por qué?). Poniendo
máx{|ρx |, |ρy |} = ρ, aplicando la igualdad previa y la desigualdad triangular
En este caso, vemos que el error de la suma de datos erróneos no supera el error de los sumandos.
Por contra, con x e y de signos opuestos el desastre es total.
Si x e y tienen signos opuestos, y no hay circunstancias especiales en los valores de los datos,
Er puede tomar cualquier valor no negativo, por grande que este sea.
Esta es una causa de error insalvable, ‘intrı́nseca’ a la operación, que ningún ordenador ni
programa alguno pueden evitar.
Obsérvese la disparidad del comportamiento cuando los sumandos ‘se añaden o refuerzan’ (tie-
nen el mismo signo) o ‘se oponen’ (tienen signos opuestos). En el primer caso el error relativo de la
suma es, como mucho, el del ‘peor’ de los sumandos; en el segundo caso, el error relativo de la suma
se dispara cuando la suma es ‘casi cero’, aún con pequeñı́smos errores relativos en los sumandos
(suele llamarse a este fenómeno cancelación catastrófica).
Para empeorar un poco más las cosas, cuando manejamos un sistema F de números en punto
flotante, y es x e + ye ∈ F (el resultado exacto de la suma
e = f l(x), ye = f l(y), no siempre resulta x
de dos números de F no siempre está en F ), con lo cual necesitará ser redondeado, y lo mejor que
la máquina podrá ofrecer como suma de estos números, será f l(e x + ye) (la situación real puede ser
más complicada). En la construcción ‘más favorable’ de la ‘suma de máquina’, tendrı́amos, pues,
(Para que tengan sentido, se supone que todos los números que intervienen están en el rango de
F : es trivial dar ejemplos en los que x, y cumplen esta condición, mientras que x y da overflow
o underflow para = alguna de las operaciones anteriores.)
(**)
En la aritmética de punto flotante del estándar IEEE se estipula que, al menos para elementos de F , hh cada
operación debe ser efectuada como si produjese primero un resultado intermedio correcto en precisión infinita y con
rango no acotado, y luego se ajustase este resultado intermedio a la precisión destinada ii, de modo que finalmente
se obtenga la respuesta exacta correctamente redondeada.
164 CAPÍTULO 6. ARITMÉTICA DE PUNTO FLOTANTE.
Veamos algunos ejemplos de los errores que se originan al realizar estas operaciones. Con base
10 y precisión p = 5, tomamos
Calculando, obtenemos:
Se observa que el comportamiento es bastante desigual. Además, con estas nuevas operaciones
se pierden algunas de las buenı́simas propiedades algebraicas y estructurales de R. Comprobémoslo.
Siguiendo con base 10 y precisión p = 5, prescindiendo del 0 previo al punto por comodidad de
escritura, tomamos
x = 1000000 f l(x) = .10000 × 107
y = −1000000 f l(y) = −.10000 × 107
z=1 f l(z) = .10000 × 101
Calculando, resulta:
¡No hay asociatividad para la ‘suma flotante’ ⊕! Ni funciona tampoco la propiedad cancelativa: en
este mismo ejemplo,
y ⊕ z = y ⊕ 0 6=⇒ z = 0.
x y = y x = x z = z x = .10000 × 101 = 1.
z (x y) = z 1 = z 6= y = 1 y = (z x) y.
Además, x tiene dos inversos, y y z, ninguno de los cuales coincide, por cierto, con f l(1/x).
6.3. ARITMÉTICA ‘APROXIMADA’ 165
Distributiva NO a veces a (b ⊕ c) 6= (a b) ⊕ (a c)
de cuerpo ordenado
Reflexiva SI siempre a ≤ a
Simétrica SI siempre a ≤ b y b ≤ a implica a = b (a, b ∈ F )
Transitiva SI siempre a ≤ b, b ≤ c implica a ≤ c
Invariancia por traslación SI siempre a ≤ b implica a ⊕ c ≤ b ⊕ c
Invariancia por escalado SI siempre a ≤ b, 0 ≤ c implica a c ≤ b c
Completitud SI trivial: F es finito
Arquimediana SI trivial: F es acotado
Densidad NO F es finito
topológicas
Conexión NO todos los puntos son aislados
Revisemos ahora el funcionamiento de estas operaciones y el error cometido al tomarlas como
aproximaciones de las operaciones exactas.
de donde
|(x ⊕ y) − (x + y)| xρx + yρy
Er = = ρz + (1 + ρz ) ≤ |ρz | + máx{|ρx |, |ρy |}(1 + |ρz |)
|x + y| x+y
< u + u(1 + u) = 2u + u2 ≈ 2u = M (u2 ≈ 0).
Esta es una estimación ‘pesimista’ del error, que puede mejorarse en circunstancias especiales.
Ası́, cuando x, y ∈ FN ( ⇐⇒ ρx = ρy = 0), Er = |ρz | < u; o si ρz = 0 (i.e., si f l(x) + f l(y) ∈ FN ),
Er ≤ máx{|ρx |, |ρy |} < u. Sin embargo, en otras circunstancias, el error puede superar a u.
Ejemplos.
1.- Para β = 10, p = 5, x = y = 1.00005, Er = .4999750012 × 10−4 ≈ u.
2.- Para β = 2, p = 3 (cf. ‘minimodelo’), x ligeramente mayor que 1.125 (con lo cual f l(x) = 1.25),
y ligeramente mayor que 4.5 (con lo cual f l(y) = 5), x + y ‘ligeramente mayor’ que 5.625, x ⊕ y = 7,
queda Er ≈ 0.244 ≈ 2u = M = 0.25
y por tanto
|(x − y) − (x y)| |h − d| d
Er = = = − 1,
|x − y| |h| h
que tiende a +∞ cuando h tiende a 0+ (el argumento puede trasladarse a otros intervalos de F ).
Vemos ası́ que la cancelación catastrófica es insalvable cuando se manejan datos aproximados,
por ejemplo datos que sean resultados redondeados (aproximados) de una operación anterior.
Nótese que incluso si x e y (distintos) son ‘suficientemente próximos’ y están ‘adecuadamente
situados’ para que f l(x) = f l(y), con lo cual x y = 0, el error relativo alcanza un desastroso
100 %: Er = 1 en este caso.
En general, cuando (x + y)/(|x − y|) no es ‘demasiado grande’, hay cancelación benigna, que
no aumenta exageradamente el error previo, puesto que, conservando la notación anterior y proce-
diendo de la forma acostumbrada,
x y xρx − yρy x+y
Er = − 1 = ρz +
(1 + ρz ) ≤ |ρz | + máx{|ρx |, |ρy |} (1 + |ρz |)
x−y x−y |x − y|
x+y x+y
< u+ u(1 + u) = u + (u + u2 ).
|x − y| |x − y|
se tiene
|(x y) − (x y)|
Er = < 3u + 3u2 + u3 ,
|x y|
o sea
x y = (x y)(1 + ρ), |ρ| < 3u + 3u2 + u3 ≈ 3u.
Demostración. Poniendo z = f l(x) f l(y) = xy(1 + ρx )(1 + ρy ), x y = f l(z) = z(1 + ρz ) (|ρz | < u),
queda x y = xy(1 + ρx )(1 + ρy )(1 + ρz ), y ası́
|(x y) − (x y)|
Er = = |(1 + ρx )(1 + ρy )(1 + ρz ) − 1|
|x y|
= |ρx + ρy + ρz + ρx ρy + ρx ρz + ρy ρz + ρx ρy ρz |
< 3u + 3u2 + u3 ≈ 3u,
suponiendo 3u2 + u3 ≈ 0.
se tiene
|(x/y) − (x y)| 3u + u2
Er = < ,
|x/y| 1−u
o sea
3u + u2
x y = (x/y)(1 + ρ), |ρ| < ≈ 3u.
1−u
1 + ρx
Demostración. Poniendo z = f l(x)/ f l(y) = (x/y) , x y = f l(z) = z(1 + ρz ) (|ρz | < u),
1 + ρy
(1 + ρx )(1 + ρz )
queda x y = (x/y) , y ası́, usando que |1 + ρy | ≥ 1 − |ρy | > 1 − u > 0,
1 + ρy
|(x y) − (x/y)| (1 + ρx )(1 + ρz )
Er = = − 1
|x/y| 1 + ρy
(1 + ρx )(1 + ρz ) − (1 + ρy ) ρx + ρz − ρy + ρx ρz
= =
1 + ρy 1 + ρy
3u + u2
< ≈ 3u
1−u
x y x2 y2 x2 − y 2 Error relativo
Valor exacto 1.21 1.20 1.4641 1.4400 0.0241
Redondeo 0.121 × 10 0.120 × 10 0.146 0.144 0.200 × 10−1 0, 170 . . . ≈ 34u
1 −2
ya que en este caso u = 10 = 0.005.
2
Pero x2 − y 2 = (x − y)(x + y). ¿Qué sucede si rehacemos el cálculo usando la segunda expresión?
ax2 + bx + c = 0,
tengan valores parecidos. ¿La salvaremos como antes, reescribiendo b2 −4ac = (b− 4ac)(b+ 4ac)?
Los resultados no son muy halagüeños. Incluso ignorando el problema del cálculo de una raı́z
cuadrada aproximada, los resultados en ambos casos pueden ser muy mediocres. Siguiendo con
β = 10, p = 3 como antes, veamos qué sucede en el siguiente ejemplo:
(en la primera fila están los valores exactos, en la segunda los resultados en punto flotante). Análo-
gamente
√
4ac S ≈ 4ac b−S b+S (b − S)(b + S)
V.E. 11.1264 3.335625878 0.004374122 6.675625878 0.02920000202
P.F. 0.111 × 102 0.333 × 10 0.1 × 10−1 0.667 × 10 0.667 × 10−1
¡No coincide ni la primera cifra significativa! (aunque al menos ha disminuido el error a 257u,
aproximadamente).
Queda√otra cancelación catastrófica al acecho. ¿Qué sucede si b2 es mucho mayor que 4ac?
Entonces b2 − 4ac ≈ |b|, con lo cual, si b > 0, podemos tener dificultades con la fórmula para x1 ,
y si b < 0, con la fórmula para x2 .
Afortunadamente, este √ problema es más sencillo de solventar. Supongamos, por ejemplo, que
b > 0. Entonces D = b + b2 − 4ac es una suma de cantidades positivas, con lo que el error no
superará al error de los datos en mucho más de 2u, y pasaremos a calcular x2 = −D/2a. Para el
cálculo de x1 disponemos de otras fórmulas más adecuadas:
c −2c
x1 = = √ .
ax2 b + b2 − 4ac
Cuando b < 0, basta usar la fórmula tradicional para x1 y hallar x2 a partir de
c 2c
x2 = = √ .
ax1 −b + b2 − 4ac
Sumas en cadena
Los errores en una sola operación (no ‘catastrófica’) en punto flotante se amplifican según se
van encadenando más y más operaciones, si bien el aumento es en general tan pequeño que hace
falta un número muy grande de operaciones inexactas para llegar a errores visibles. No obstante,
puesto que no hay asociatividad, incluso en sumas de varios sumandos positivos no es indiferente
la manera de llevar a cabo las operaciones: el orden y la manera de agrupar puede inicidir en que
el error final sea más grande o más pequeño.
170 CAPÍTULO 6. ARITMÉTICA DE PUNTO FLOTANTE.
Veamos una ilustración clara (muy simplificada). Con precisión p = 3 y base 10, y sumandos
100, 0.9, 0.9, 0.9, podemos proceder ası́:
(((100 ⊕ 0.9) ⊕ 0.9) ⊕ 0.9 = (100 ⊕ 0.9) ⊕ 0.9 = 100 ⊕ 0.9 = 100
(100 ⊕ 0.9) ⊕ (0.9 ⊕ 0.9) = 100 ⊕ 1.8 = 102
((0.9 ⊕ 0.9) ⊕ 0.9) ⊕ 100 = (1.8 ⊕ 0.9) ⊕ 100 = 2.7 ⊕ 100 = 103
valor exacto: 100 + 0.9 + 0.9 + 0.9 = 100.9 + 0.9 + 0.9 = 101.8 + 0.9 = 102.7
En las evaluaciones primera y tercera hemos procedido recurrentemente: en cada etapa sumamos
la suma parcial previa con el sumando siguiente. En la segunda hemos emparejado los sumandos,
reduciendo el número de operaciones.
Observamos que el primer procedimiento da mayor error, el segundo es ‘menos costoso’, y que
el tercero da el valor redondeado del resultado exacto, el mejor valor posible.
La causa del éxito final es aquı́ muy aparente: al sumar números de tamaño muy distinto, hay
que tener precaución de que ‘el pez grande no se coma al chico’, como sucede en la evaluación
100 ⊕ 0.9 = 100. Parece conveniente ordenar los sumandos de menor a mayor para homogeneizar
tamaños en la medida de lo posible, permitiendo ası́ que la adición de los sumandos pequeños
lleve a un valor que no desaparezca cuando lleguen los sumandos ‘grandes’. (Esta es una pequeña
muestra de las dificultades que tienen que superar los programadores incluso en situaciones que no
parecen a priori tan complicadas). Además, los dos primeros sumandos está involucrados en n − 1
operaciones y el último en una sóla, con lo que el error absoluto final es menor.
Por otra parte, cuando la rapidez de cálculo es importante, la opción del emparejamiento parece
ventajosa. Además, al disminuir el número de operaciones efecuadas, cabe suponer que disminuirá el
crecimiento de los errores (con datos de magnitudes similares, al menos). Nótese que en una suma
de n = 2k sumandos, cada sumando estarı́a ahora involucrado en k = log2 (n) operaciones, lo que
lleva a un error absoluto del orden de n log2 (n) veces el máximo de los errores de los sumandos,
ver [1] p. 15.
Sobre las dificultades de la implementación de algoritmos eficaces en la adición de muchos
sumandos, ver más detalles en [3], Floating point summation, y [4], ası́ cómo en el artı́culo de J. P.
Muller ya citado [MC1]. En [Brz], pp. 10–11, hay un ejemplo de ‘corrección de la aritmética’ para
efectuar sumas.
sólo son precisas cuatro sumas/restas y cuatro multiplicaciones. Para un polinomio de grado
N el método ingenuo requiere N sumas/restas y 2N − 1 multiplicaciones, el método (1.6)
llamado de Horner o de multiplicación encajada usa N sumas/restas y N multiplicaciones.
Como ninguno de los dos métodos genera errores —excepto los derivados de usar mantisa de
longitud finita— el de Horner, que tiene menor costo operativo es más eficiente. Si sólo se va
a evaluar una vez un polinomio y se usa un ordenador no hay diferencia entre usar uno u otro
método. Si, como a veces ocurre, dentro de un programa grande hay que evaluar millones de
veces, usar uno u otro método puede significar tener que esperar el resultado dos horas o sólo
una. Si calculamos con papel y lápiz en un examen usar un mal método puede implicar no
tener el resultado a tiempo. ii
([S-S], pp. 13 y 14.)
Números desnormalizados
Para paliar los problemas que ocasiona el redondeo de números ‘cercanos al cero’, se amplı́a
a veces el sistema F de números en punto flotante incluyendo los números desnormalizados
(también llamados subnormales en inglés). Tanto los estándares IEEE 754 y 854 como LIA-1 y unas
cuantas implementaciones ‘no-IEEE’ incluyen números desnormalizados. Siguiendo con la notación
habitual, un número en punto flotante desnormalizado es un número real de la forma
y = ±m × β emin −p
donde m es un entero del intervalo [1, β p−1 − 1]. La fracción correspondiente g queda en el intervalo
[β −p , 1/β −β −p ]; su dı́gito más significativo es 0, y su exponente emin . Los números desnormalizados
rellenan parcialmente los “huecos de subdesbordamiento” que se producen entre ±β emin −1 y 0.
Tomados juntos, componen el conjunto que en LIA-1 se denota FD . La admisión o no de números
desnormalizados se controla mediante el parámetro booleano denorm, que toma el valor true o false
según se permitan números desnormalizados o no. En el primer caso, se redefine F = {0}∪FN ∪FD ;
en el segundo, se mantiene la definición previa.
El mı́nimo número positivo en punto flotante desnormalizado es β emin −p = f minN · εM . Los
valores de FD están igualmente espaciados, con el mismo espacio que el de los números de F entre
β emin −1 y β emin , que es β emin −p = f minN · εM . Volviendo al ejemplo con β = 2, p = 3, emin = −1,
emax = 3, la representación gráfica de F con los números desnormalizados incluidos (2−4 = 0.0625,
2 × 2−4 = 0.125, 3 × 2−4 = 0.1875) serı́a
0.0625
↓
Los valores de FD tienen un máximo absoluto de error de representación de β emin −p . Sin embargo,
como los números desnormalizados tienen menos de p dı́gitos de precisión, el error relativo de
representación puede variar ampliamente. Este error relativo va desde M = β 1−p en el extremo
superior de FD hasta 1 en el extremo inferior de FD . Cerca de 0, el error relativo crece sin tope.
Siempre que una adición o sustracción de números de F produce un resultado en FD , dicho
resultado es exacto, el error relativo es cero. Un ejemplo trivial: en el modelo anterior,
1 0.875 = 0.125 con números desnormalizados incluidos, 1 0.875 = 0 en caso contrario.
172 CAPÍTULO 6. ARITMÉTICA DE PUNTO FLOTANTE.
hh Incluso para una “sustracción efectiva” no se pierde exactitud, porque la disminución del
Mayor precisión
Mientras que habitualmente es posible disponer de dı́gitos extra en una computación (aumen-
tando la precisión p, pasando por ejemplo de precisión simple a doble precisión), esto siempre es
costoso en tiempo y en espacio. Además, aunque intuitivamente al aumentar la precisión parece
lógico esperar que la exactitud aumente, esto no siempre es ası́. En muchos casos el error estimado
de un algoritmo es efectivamente proporcional a la precisión, como hemos visto en casi todas las
operaciones aritméticas; pero como las cotas del error no siempre se alcanzan, no hay garantı́a de
que un resultado concreto calculado con precisión p sea menos exacto que el calculado con preci-
sión p + q mayor (v. [Hig], pp. 19–20). No obstante, es una técnica frecuente en la estimación de la
exactitud recalcular (al menos en la ‘etapa de ensayo’ de un algoritmo) aumentando la precisión y
observar cuántos dı́gitos de la respuesta ası́ obtenida coinciden con la original.
hh Cada operación aritmética efectuada con el ordenador está igualmente manchada por un error
de afectación. Es decir, que se tiene:
donde designa una de las cuatro operaciones aritméticas (suma, resta, multiplicación, divi-
sión). Este resultado da la diferencia máxima que puede existir entre el resultado exacto de
una operación aritmética y el resultado encontrado por el ordenador. Ası́, para un ordenador
que trabaje con mantisas de ocho dı́gitos, el error relativo es inferior a 5 · 10−8 . Se puede
pensar que este es un error muy débil, despreciable incluso, y sin embargo vamos a ver que
sus consecuencias puede ser catastróficas (no siempre, afortunadamente para nosotros). Para
comprender bien lo que pasa, hay que saber que las operaciones aritméticas se efectúan en
memorias especiales, el acumulador , cuyas mantisas comportan al menos p + 1 dı́gitos.
Se completan los operandos con ceros a la derecha, se efectúa la operación en el acumula-
dor, y después se reenvı́a el resultado a la memoria redondeándolo. Este error de redondeo
es preponderante sobre el que se hace en el acumulador, lo que explica que cada operación
6.4. ESTRATEGIAS DE CÁLCULO 173
esté manchada solamente con un error de afectación. Demos un ejemplo para ilustrar nuestro
propósito: calculemos a = b × c
memoria acumulador
b 0.842345 → 0.8423450
c 0.516287 · 10−2 → 0.5162870 · 10−2
a 0.434892 · 10−2 ← 0.4348917 · 10−2
Para una suma, tras la transferencia de los operandos al acumulador, el ordenador comienza
por modificar el exponente del operando menor (en valor absoluto) para que tenga el mismo
valor que el de el más grande; de hecho, el ordenador alinea como nosotros las cifras de las
potencias idénticas de 10, unas sobre otras:
memoria acumulador
b 0.842345 → 0.8423450
c 0.516287 · 10−2 → 0.0051629
a 0.847508 ← 0.8475079
Extrañamente, hay fabricantes (como cray) que construyen algunas de sus máquinas sin au-
mentar los bits disponibles para los datos intermedios, limitándose a recortar éstos al tamaño
correspondiente a la precisión, lo que puede suponer un error relativo añadido hasta de β − 1, es
decir, del 100 % cuando β = 2 y del 900 % cuando β = 10. En efecto:
[Gold] Con sumandos en F :
Proposición 6.4.1. Usando un formato de punto flotante con parámetros β y p, y computando
diferencias usando p dı́gitos, el error relativo del resultado puede llegar a ser β − 1.
1 α α
Demostración. Para x = = 0.10 · · · 0 × 100 , α = β − 1, y = 2 + · · · + p+1 = 0.αα · · · α × 10−1
β β β
resulta x − y = β −p−1 , x y = β −p , Er = β − 1.
En cambio:
Proposición 6.4.2. Si x e y son números en punto flotante en un formato con parámetros β y
p, y si la sustracción se hace con p + 1 dı́gitos (i.e., con un dı́gito ‘de seguridad’) entonces el error
relativo de redondeo del resultado es menor que 2, donde es el épsilon de la máquina.
(La adición está incluida en el teorema anterior ya que x e y pueden ser positivos o negativos.)
Para máquinas que trabajan sin dı́gitos extras hay muchos algoritmos que dejan de funcionar
correctamente, como lo hacen en caso contrario. Existen además resultados como el siguiente,
válidos cuando se opera con digitos ‘de seguridad’ (v. [Hig], p. 50):
Teorema 6.4.3 (Sterbenz). Sean x e y números en punto flotante con y/2 ≤ x ≤ 2y. Si la
sustracción se realiza con un dı́gito de seguridad, entonces x − y es computado exactamente (supo-
niendo que |x − y| ≥ f minN .)
¿Por qúe perder el tiempo con todos esos pequeños errores de punto flotante? Incluso
IEEE en precisión simple nos da 7 dı́gitos significativos por lo menos, y seguro que
esto es suficiente para la mayorı́a de las aplicaciones, y además está la precisión
doble, y seguramente esta tiene que bastar.
174 CAPÍTULO 6. ARITMÉTICA DE PUNTO FLOTANTE.
Los problemas que tienen una tendencia inherente a la “amplificación de errores” se llaman
mal condicionados; requieren usar paquetes de aritmética multiprecisión y un estrecho control
de errores.
Un ejemplo clásico de problema mal condicionado es cierto polinomio de grado 20; tras multi-
plicar uno de sus coeficientes (el que multiplica a la potencia 19) por un factor 1.0000000005,
la localización de la mayor parte de las raı́ces cambia completamente.
En el anterior ejemplo, simplemente entrar los datos (los coeficientes del polinomio) en el
ordenador puede ser suficiente para estropear todo el cálculo, por cuanto la conversión de
la representación decimal externa a la interna, binaria, puede introducir errores demasiado
grandes.
Un problema bien condicionado puede tener un algoritmo que amplifique los errores: tal
algoritmo se dice que es inestable. En términos sencillos, un algoritmo inestable transforma
un “pequeño” cambio en las cantidades de entrada en un cambio “grande” en las cantidades
de salida. ii
([4], § 4-7.)
calculado por un algoritmo particular. La solución calculada g ∗ (x) puede ser pensada a menudo
como la solución exacta de un problema perturbado con inputs x e, esto es, g ∗ (x) = g(e
x). Si siempre
hay un x ∗
e cercano a x tal que g (x) = g(e x), entonces el algoritmo se dice estable . Si no, el algoritmo
es inestable . ii
Nótese que la estabilidad es una propiedad relativa al algoritmo empleado para resolver un pro-
blema, mientras que el condicionamiento se refiere al propio problema: un problema de computación
se dice mal condicionado si pequeñas perturbaciones en el problema producen perturbaciones
grandes en la solución exacta. Además del ejemplo anteriormente señalado sobre cálculo de raı́ces
de un polinomio, otro problema tı́pico mal condicionado es el de la resolución de un sistema lineal
cuando la matriz de los coeficientes es casi singular: pequeños cambios en dichos coeficientes o en los
términos independientes pueden llevar a soluciones exactas muy diferentes; como al almacenar los
datos en la máquina se producen errores de redondeo, es sustancialmente imposible dar soluciones
precisas a los problemas mal condicionados con cualquier algoritmo que se utilice. Por contra, a
veces un algoritmo inestable puede modificarse convenientemente para lograr uno estable.
Estos son los consejos a los programadores de un experto ([Hig], pp. 30 y 31):
si la pequeña corrección puede calcularse con muchas cifras significativas correctas. Los méto-
dos numéricos a menudo están expresados de manera natural en esta forma; los ejemplos
incluyen métodos para resolver ecuaciones diferenciales ordinarias, donde la corrección es
proporcional al tamaño de paso, y el método de Newton para resolver un sistema no lineal.
Un ejemplo clásico del uso de esta estrategia de actualización es el refinamiento iterativo
para mejorar la solución calculada de un sistema lineal Ax = b, en el que calculando resi-
duos r = b − Ay en precisión extendida y resolviendo ecuaciones actualizadas que tienen los
residuos como términos independientes es posible calcular una solución con un alto grado de
exactitud. Para otro ejemplo (en el que la corrección no es necesariamente pequeña), ver el
Problema . . .
5. Usar sólo transformaciones bien condicionadas del problema. En cálculos matriciales, esto
viene a ser multiplicar por matrices ortogonales donde sea posible, en vez de no ortogonales,
y posiblemente, matrices mal condicionadas. Ver §6.2 para una explicación simple de este
consejo en términos de normas.
Concerniente al segundo punto, una buena recomendación es mirar los números generados
durante una computación. Esto era práctica común en los primeros tiempos del cálculo electrónico.
¡En algunas máquinas era inevitable, porque los contenidos almacenados se mostraban como luces o
monitores! Wilkinson ganó en penetración sobre la estabilidad numérica inspeccionando el progreso
de un algoritmo, y alterando a veces su curso (para un proceso iterativo con parámetros) . . . ii
hh Concepciones equivocadas
Algunos mitos y concepciones equivocadas comunes han sido señalados en este capı́tulo (ninguno
de ellos por vez primera—ver notas y referencias). Los destacamos en la siguiente lista.
1. La cancelación en la sustracción de dos números casi iguales es siempre una mala cosa.
2. Los errores de redondeo pueden cargarse una computación sólo si se acumulan un vasto
número de ellos.
3. Una computación corta libre de cancelación y desbordamiento tiene que ser exacta.
5. La respuesta final calculada a partir de un algoritmo no puede ser más exacta que ninguna
de las cantidades intermedias, esto es, los errores no pueden cancelarse.
De marcado carácter práctico son también las recomendaciones y consejos que se encuentran a
lo largo del manual [4], dirigidas especı́ficamente a los usuarios de FORTRAN.
que está expresada en una forma que corresponde a la evaluación de los polinomios cuárticos
del numerador y el denominador mediante la regla de Horner. Hemos calculado r(x) mediante la
regla de Horner en aritmética de doble precisión para 361 números en punto flotante consecutivos
comenzando con a = 1.606, o sea x = a + (k − 1)2−52 , k = 1 : 361; la función r(x) es virtualmente
constante en este intervalo. La figura 1.6 dibuja los valores computados de la función junto con
una aproximación mucho más exacta a r(x) (calculada a partir de una representación en fracción
continua). El patrón sorprendente formado por los valores calculados mediante la regla de Horner
muestra claramente que los errores de redondeo en este ejemplo no son aleatorios. ii
(Ver también [Hig], p. 52–53).
Bibliografı́a
[Brz] Brezinski, C.: Introduction à la pratique du calcul numérique. Dunod/Bordas, Paris, 1988.
[Hig] Higham, N.: Accuracy and Stability of Numerical Algorithms. SIAM, Philadelphia, 1996.
[MC1] Mundo Cientı́fico: El universo de los números: Matemáticas para interpretar el mundo.
Extra núm. 1, s.f..
[S-S] Sanz-Serna, J. M.: Diez lecciones de Cálculo Numérico. Universidad de Valladolid, 1998.
Documentos en Internet
[Gold] Goldberg, D.: What Every Computer Scientist Should Know About Floating-Point Arit-
hmetic. Computing Surveys, 1991.
http://docs.sun.com/db/doc/800-7895
La referencia universal.
[LIA-1] ISO/IEC: Information technology – language independent arithmetic. Part 1: Integer and
floating point arithmetic, 1994. ISO/IEC 10967-1:1994(E).
ftp://crl.dec.com/pub/misc/lia-1-is.ps.Z.
–—oOo—–
[2] IEEE-754 Floating-Point Conversion: From Decimal Floating-Point To 32-bit and 64-bit
Hexadecimal Representations Along with Their Binary Equivalents (1998)
http://babbage.cs.qc.edu/courses/cs341/IEEE-754.html
[3] Moore, D.: Introduction to Computacional Science. CAAM 420, Lecture Notes, 2000.
http://www.owlnet.rice.edu/~caam420/lectures
[4] UNFP: User Notes on Fortran Programming. (An open cooperative practical guide),
1998.
http://www.ibiblio.org/pub/languages/fortran/ch4-6.html
177