Está en la página 1de 334

Carlos Ivorra

ANALISIS
NO

ESTANDAR

Si una cantidad no negativa fuera tan peque


na
que resultara menor que cualquier otra dada, ciertamente no podra ser sino cero. A quienes preguntan que es una cantidad innitamente peque
na en
matematicas, nosotros respondemos que es, de hecho, cero. As pues, no hay tantos misterios ocultos
en este concepto como se suele creer. Esos supuestos misterios han convertido el calculo de lo innitamente peque
no en algo sospechoso para mucha gente.
Las dudas que puedan quedar las resolveremos por
completo en las paginas siguientes, donde explicaremos este calculo.
Leonhard Euler

Indice General
Introducci
on

vii

Captulo I: Preliminares conjuntistas


1.1 Conjuntos . . . . . . . . . . . . . . . . . .
1.2 Los conceptos conjuntistas b
asicos . . . .
1.3 Elementos de teora de conjuntos . . . . .
1.3.1 Funciones . . . . . . . . . . . . . .
1.3.2 Relaciones . . . . . . . . . . . . . .
1.3.3 Conjuntos nitos . . . . . . . . . .
1.3.4 Estructuras algebraicas y de orden
1.3.5 Elementos de aritmetica . . . . . .
1.4 La teora de conjuntos no est
andar . . . .

.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.

1
2
7
12
12
16
18
21
27
30

Captulo II: Los n


umeros reales
2.1 Los n
umeros naturales . . . . . . .
2.2 Cuerpos ordenados . . . . . . . . .
2.3 Convergencia de sucesiones . . . .
2.4 La incompletitud de Q . . . . . . .
2.5 La construccion de R . . . . . . . .
2.6 Consecuencias de la completitud de

.
.
.
.
.
.

.
.
.
.
.
.

.
.
.
.
.
.

.
.
.
.
.
.

.
.
.
.
.
.

.
.
.
.
.
.

.
.
.
.
.
.

.
.
.
.
.
.

.
.
.
.
.
.

.
.
.
.
.
.

.
.
.
.
.
.

.
.
.
.
.
.

.
.
.
.
.
.

43
43
47
53
59
63
70

Captulo III: Calculo diferencial de una variable


3.1 La gr
aca de una funci
on . . . . . . . . . . . .
3.2 Funciones continuas . . . . . . . . . . . . . . .
3.3 Funciones derivables . . . . . . . . . . . . . . .
3.4 Derivadas sucesivas, la f
ormula de Taylor . . .
3.5 Exponenciales y logaritmos . . . . . . . . . . .
3.6 Lmites de funciones . . . . . . . . . . . . . . .

.
.
.
.
.
.

.
.
.
.
.
.

.
.
.
.
.
.

.
.
.
.
.
.

.
.
.
.
.
.

.
.
.
.
.
.

.
.
.
.
.
.

.
.
.
.
.
.

.
.
.
.
.
.

77
. 77
. 78
. 85
. 99
. 102
. 109

. .
. .
. .
. .
. .
R

.
.
.
.
.
.

.
.
.
.
.
.

Captulo IV: C
alculo integral de una variable
4.1 La integral de Riemann . . . . . . . . . . . . . . . . . . . . . . .
4.2 Las funciones trigonometricas . . . . . . . . . . . . . . . . . . . .
4.3 C
alculo de longitudes, areas y vol
umenes . . . . . . . . . . . . . .
v

117
117
133
141

vi

INDICE GENERAL

Captulo V: Series innitas


5.1 Series numericas . . . . . . . . . . . . . . . . . . . . . . . . . . .
5.2 Sucesiones funcionales . . . . . . . . . . . . . . . . . . . . . . . .
5.3 Series de potencias . . . . . . . . . . . . . . . . . . . . . . . . . .

153
153
163
174

Captulo VI: C
alculo diferencial de varias
6.1 Espacios metricos y espacios normados
6.2 Elementos de topologa . . . . . . . . .
6.3 Funciones continuas . . . . . . . . . .
6.4 Derivadas y diferenciales . . . . . . . .
6.5 El teorema de la funci
on implcita . .
6.6 Optimizaci
on cl
asica . . . . . . . . . .

variables
. . . . . . .
. . . . . . .
. . . . . . .
. . . . . . .
. . . . . . .
. . . . . . .

.
.
.
.
.
.

.
.
.
.
.
.

.
.
.
.
.
.

.
.
.
.
.
.

.
.
.
.
.
.

.
.
.
.
.
.

.
.
.
.
.
.

.
.
.
.
.
.

179
179
183
189
195
208
212

Captulo VII: C
alculo integral de varias variables
7.1 Resultados b
asicos . . . . . . . . . . . . . . . . . .
7.2 Dominios de integraci
on . . . . . . . . . . . . . . .
7.3 C
alculo de integrales . . . . . . . . . . . . . . . . .
7.4 El teorema de la media . . . . . . . . . . . . . . . .
7.5 El teorema de cambio de variable . . . . . . . . . .

7.6 Areas
de supercies . . . . . . . . . . . . . . . . . .
7.7 Apendice: Descomposicion de aplicaciones lineales

.
.
.
.
.
.
.

.
.
.
.
.
.
.

.
.
.
.
.
.
.

.
.
.
.
.
.
.

.
.
.
.
.
.
.

.
.
.
.
.
.
.

.
.
.
.
.
.
.

.
.
.
.
.
.
.

219
219
223
231
235
238
250
257

Ap
endice A: La teora de Nelson

261

Ap
endice B: La teora de Hrbacek

271

Ap
endice C: El teorema de conservaci
on
C.1 Modelos internos . . . . . . . . . . . . . . . . . . . . .
C.2 Ultrapotencias . . . . . . . . . . . . . . . . . . . . . .
C.3 Lmites inductivos . . . . . . . . . . . . . . . . . . . .
C.4 El teorema de conservacion para la teora de Hrbacek

.
.
.
.

.
.
.
.

.
.
.
.

.
.
.
.

.
.
.
.

.
.
.
.

285
285
291
297
303

Bibliografa

315

Indice de Materias

316

Introducci
on
En la historia de las matem
aticas nos encontramos con muchos momentos en que los matematicos han manejado con seguridad por no decir con
virtuosismo conceptos cuya naturaleza y propiedades b
asicas eran incapaces
de precisar. El ejemplo tpico lo tenemos en los algebristas de los siglos XVI
y XVII, que eran capaces de encontrar races reales de polinomios pasando, en
caso de ser necesario, por races imaginarias de otros polinomios que aparecan
a lo largo del c
alculo. Los n
umeros imaginarios eran concebidos como unos conceptos cticios en los que, sin saber como ni por que, se poda conar, en el
sentido de que al incluirlos en los c
alculos llevaban a conclusiones correctas.
Naturalmente, la raz
on por la que los c
alculos con n
umeros complejos eran
correctos es que es posible construir los n
umeros complejos, de tal modo que
lo que hacan los algebristas aunque no lo supieran era usar una serie de
teoremas que no saban demostrar o siquiera enunciar (los n
umeros complejos
forman un cuerpo, etc.)
Hay muchos otros casos similares: los fsicos han estado derivando funciones
no derivables durante mucho tiempo, con la convicci
on de que las derivadas eran
unas funciones generalizadas que no saban denir, pero en la que tambien se
poda conar. La raz
on por la que estos calculos con funciones misteriosas que
no eran funciones no llevaban a paradojas y contradicciones es, por supuesto,
que es posible construir unos objetos (las distribuciones) con las propiedades
que los fsicos postulaban implcitamente en el uso que hacan de sus funciones
generalizadas. Tambien Kummer uso unos divisores primos ideales que no
existan, y que nalmente formaliz
o Dedekind a traves de la nocion de ideal de
un anillo, los propios n
umeros reales no estuvieron exentos de polemicas sobre
sus propiedades hasta que Dedekind y Cantor dieron las primeras construcciones
explcitas, etc.
El an
alisis no estandar es la respuesta u
ltima a una asignatura pendiente
que tena la matematica. En su origen, el c
alculo diferencial se bas
o tambien en
unos n
umeros ideales que nadie saba denir porque tenan que ser no nulos
y a la vez menores que cualquier cantidad positiva. Eran los innitesimos. Por
ejemplo, Leibniz explicaba as el calculo de la derivada de f (x) = x2 : tomamos
un innitesimo dx, calculamos el incremento df = f (x+dx)f (x) y lo dividimos
entre la cantidad (no nula) dx. Resulta
df
= 2x + dx.
dx
vii

viii

Introducci
on

Ahora bien, puesto que dx es una cantidad innitesimal, la presencia del


u
ltimo termino es insignicante, por lo que podemos eliminarla y as
df
= 2x + dx = 2x.
dx
Leibniz era consciente de las contradicciones de este argumento: primero
suponemos que dx = 0 pero luego lo eliminamos como si fuera dx = 0. Pese a
ello, tambien era consciente de que los resultados a los que se llegaba con este
tipo de razonamientos eran correctos y estaba convencido de que los argumentos
con innitesimos tenan que poder reformularse como argumentos del estilo de
Arqumedes, lo cual hoy es facil traducir a mediante pasos al lmite.
Uno de los grandes virtuosos de los innitesimos fue Euler, quien pareca
convencido de que bastaba concebirlos como n
umeros arbitrariamente peque
nos
(pero no nulos) en lugar de como n
umeros innitamente peque
nos. Sin embargo
sus razonamientos estan bastante lejos del estilo moderno -.
Al contrario de lo que sucedi
o con los n
umeros reales, los n
umeros complejos,
las distribuciones o los n
umeros ideales de Kummer, los matematicos del siglo
XIX y la primera mitad del siglo XX fueron incapaces de construir unos objetos
que se comportaran como deban comportarse los innitesimos, y el resultado
fue que los erradicaron de la matem
atica teorica. Cauchy introdujo (con innitesimos a
un) la noci
on de lmite y mostro que los restantes conceptos del
an
alisis podan expresarse en terminos de lmites. Posteriormente Weierstrass
introdujo las deniciones y los razonamientos -. Ahora bien, la rebelda de los
innitesimos a dejarse formalizar no los haca menos pr
acticos, por lo que los
fsicos siguieron usandolos, con la convicci
on de que son mucho m
as intuitivos
y comodos que los epsilons y las deltas.
El hecho de que los innitesimos funcionaran indicaba claramente que
deban poder construirse. Hubo algunos intentos previos poco satisfactorios,
pero solo a nales de los 60, Abraham Robinson consigui
o este objetivo. Del
trabajo de Robinson se sigue que es posible formalizar el c
alculo diferencial
deniendo las derivadas como cocientes de incrementos innitesimales, porque,
si bien en R no hay innitesimos (como tampoco hay n
umeros con raz cuadrada
negativa), lo cierto es que es posible extender R a un cuerpo que los tenga (igual
que puede extenderse a C, donde los n
umeros negativos s que tienen races
cuadradas).
Por desgracia, los innitesimos de Robinson se construan y se manejaban
mediante tecnicas de logica matematica, que resultan bastante complejas y articiales para los matematicos no familiarizados con esta disciplina. No obstante,
a nales de los 60 y principios de los 70 surgieron aproximaciones axiom
aticas
al an
alisis no estandar, es decir, aproximaciones que, en lugar de construir los
innitesimos que es complicado, lo que hacen es postular mediante unos
axiomas sencillos su existencia y sus propiedades. Es como si en un curso de introducci
on al an
alisis no construimos los n
umeros reales, sino que postulamos la
existencia de un cuerpo ordenado completo. El resultado es que partimos exactamente del mismo punto a donde habramos llegado si hubiesemos empezado
por la construcci
on de R. Naturalmente, al eliminar la construcci
on perdemos

ix
una informaci
on, y es que el axioma que postula la existencia de R es en realidad
un axioma inesencial, en el sentido de que todo lo que se demuestra con el, se
puede demostrar tambien sin el (simplemente, demostrandolo y convirtiendolo
as en un teorema). Lo mismo sucede con el analisis no estandar.
De entre las distintas versiones axiomaticas del analisis no estandar, aqu
vamos a exponer una especialmente fuerte, en el sentido de que no vamos a
postular axiom
aticamente la mera existencia por ejemplo de un cuerpo que
contiene al cuerpo de los n
umeros reales y que ademas tiene innitesimos, sino
que vamos a presentar toda una teora de conjuntos no est
andar, a
nadiendo
a los axiomas usuales de la teora de conjuntos otros axiomas que postulan
la existencia de elementos ideales en todos los conjuntos innitos. Dado que
no vamos a comparar este enfoque con otros posibles, el lector no tendr
a la
oportunidad de constatarlo (salvo que compare con otros textos), pero esta
version supone una simplicaci
on enorme de la teora, tanto en sus aspectos
tecnicos como en los conceptuales.
Ahora bien, tal y como explic
abamos un poco m
as arriba, debemos tener
presente que los objetos cuya existencia postulan estos axiomas pueden ser construidos, de modo que los axiomas del an
alisis no estandar no son como otros
axiomas que pueden a
nadirse a la teora de conjuntos (tales como la hip
otesis
del continuo, el axioma de Martin, etc.) sino que son eliminables, en el sentido
de que cualquier armaci
on estandar que pueda demostrarse con ellos, puede
demostrarse tambien sin ellos.
De este modo, la teora de conjuntos no est
andar no es una teora nueva que
proporcione nuevos resultados, sino una teora alternativa que permite probar
los mismos resultados que la teora clasica pero de forma distinta. As, mientras
que una teora matematica usual se valora normalmente en funci
on de los
resultados nuevos que permite demostrar, este criterio no es aplicable para
valorar la teora de conjuntos no est
andar (ya que la respuesta es que no permite
demostrar nada nuevo), sino que su valor depender
a mas bien de la comparaci
on
entre las tecnicas clasicas y las tecnicas no estandar. El prop
osito de este libro
es, precisamente, poner al lector en condiciones de realizar esa comparacion y
para que pueda sopesar por s mismo las ventajas y los inconvenientes de la
teora de conjuntos no est
andar frente a la teora de conjuntos cl
asica.
En esta comparacion, probablemente, el factor de m
as peso es un hecho
externo a la teora misma: por razones historicas, la teora de conjuntos cl
asica
esta profundamente arraigada, mientras que la teora de conjuntos no est
andar
no es mas que una curiosidad, y es casi impensable que alg
un da pase a ser
mas que eso. No obstante, siempre queda el cuanto menos divertimento
teorico de juzgar ambas teoras en pie de igualdad, prescindiendo de su grado de
popularidad. Entonces, los dos platos de la balanza quedan bastante igualados:
Por una parte, la teora de conjuntos no est
andar da lugar a pruebas
mas intuitivas?, elegantes?, sencillas? que la teora clasica.
Por otra parte, la teora de conjuntos no est
andar requiere un marco
de razonamiento l
ogico un poco?, bastante?, mucho? mas complejo que la teora de conjuntos cl
asica.

Introducci
on

Lo que el lector deber


a juzgar es cuales de las palabras entre interrogantes
son apropiadas (o si hay que cambiarlas por otras). Si considera que la teora no
estandar no es ni intuitiva, ni elegante, ni sencilla, ni nada parecido, concluir
a
que lo mejor es olvidarse de ella, al igual que si considera que sus sutilezas
l
ogicas la vuelven inmajenable en la pr
actica.
Quiz
a convenga destacar que no hay contradicci
on en armar que las pruebas
no estandar pueden ser m
as sencillas y que su logica subyacente puede ser mas
complicada. Esto quiere decir que, para alguien que haya asimilado esa l
ogica
subyacente, las pruebas pueden resultar mucho m
as sencillas, y la cuestion es,
entonces, si la (presunta) simplicaci
on (o cualquier otra ventaja) que supone
el uso de la teora no estandar compensa el (presunto) esfuerzo de familiarizarse
con ella. Probablemente, esta es la pregunta principal sobre la que deber
a
meditar el lector.
Aunque una valoraci
on adecuada de la teora de conjuntos no est
andar requiere, evidentemente, un examen a fondo de sus principios y su funcionamiento
(que es lo que pretende ofrecer este libro), podemos formarnos una primera impresi
on considerando el teorema siguiente, de Sierpinski:
Si a1 , . . . , an , b son n
umeros reales positivos, la ecuaci
on
a1
an
+ +
=b
x1
xn
tiene a lo sumo un n
umero nito de soluciones naturales.
Ahora vamos a ver el aspecto de una demostracion no estandar. Evidentemente, a menos que el lector ya este familiarizado con la teora de conjuntos no
estandar, no estar
a en condiciones de entenderla con detalle, pero aqu se trata
simplemente de comparar su aspecto con el de una demostracion cl
asica. (Lo
que s puede tratar de hacer el lector es demostrar el teorema por s mismo por
medios clasicos y comparar las pruebas.)
n: Podemos suponer que n, a1 , . . . , an y b son estandar.1 Si el
Demostracio
on fuera innito,
conjunto de n-tuplas (x1 , . . . , xn ) Nn que cumplen la ecuaci
tendra que contener un elemento no estandar. Una n-tupla (con n estandar)
que tenga todas sus componentes estandar ser
a estandar, luego tenemos una
soluci
on (x1 , . . . , xn ) en la que alg
un xi es innitamente grande.
Ahora bien, no puede ser que todos los xi sean innitamente grandes, ya que
entonces el miembro izquierdo de la ecuacion sera innitamente peque
no, y el
miembro derecho no. Por consiguiente, tambien existe alg
un xi que no es innitamente grande. Reordenando los ndices, podemos suponer que x1 , . . . , xr son
innitamente grandes y xr+1 , . . . , xn no lo son. Pero esto nos lleva igualmente
a una contradicci
on, ya que podemos despejar
a1
ar
ar+1
an
+ +
=b

x1
xr
xr+1
xn
y, nuevamente, el miembro izquierdo es innitesimal, y el derecho no.
1 Esto implica, en particular, que no son n
umeros innitamente peque
nos o innitamente
grandes.

xi
La prueba puede parecer extremadamente simple, pero en esta apariencia
hay algo de enga
noso, y esto nos lleva precisamente hacia el otro plato de la
balanza. Las sutilezas logicas inherentes a la teora de conjuntos no est
andar
estan relacionadas con las causas por las que los matematicos tuvieron que
abandonar el uso de innitesimos a la hora de fundamentar el an
alisis: si no se
toman las precauciones debidas, los innitesimos dan lugar a contradicciones.
El problema es an
alogo al que tuvieron que resolver los matem
aticos para
fundamentar la teora de conjuntos. Si no se toman las precauciones debidas,
determinados conjuntos como el conjunto de todos los conjuntos, el conjunto de todos los cardinales, etc. dan lugar a contradicciones por el mero
hecho de aceptar su existencia. Cantor llamaba a estos conjuntos parad
ojicos
multiplicidades inconsistentes, y hay esencialmente dos formas de abordar el
problema de extirpar de la teora matematica las contradicciones que generan:
La teora de conjuntos de Zermelo-Fraenkel (ZFC) es una teora axiom
atica
en la que, simplemente, las multiplicidades inconsistentes no existen: a
partir de sus axiomas se puede demostrar que no existe ning
un conjunto
que contenga a todos los conjuntos, ni existe ning
un conjunto que contenga
a todos los cardinales, etc. No obstante, informalmente se puede hablar de
la clase de todos los conjuntos o la clase de todos los cardinales, pero
solo en armaciones que claramente pueden reformularse eliminando estos
conceptos (por ejemplo, si decimos que la clase de todos los cardinales esta
contenida en la clase de todos los conjuntos, esto es equivalente a decir
que todo cardinal es un conjunto, y as hemos eliminado toda menci
on a
clases inexistentes).
La teora de conjuntos de von Neumann-Bernays-G
odel introduce formalmente la diferencia entre conjuntos y clases propias, de modo que las
multiplicidades inconsistentes de Cantor se corresponden con las clases
propias. Las contradicciones aparecen si se confunden ambos conceptos
y se tratan las clases propias como si fueran conjuntos. Estableciendo la
distinci
on, los argumentos que originalmente daban lugar a contradicciones se transforman en los argumentos que demuestran que determinadas
clases son propias y no son conjuntos.
A la hora de fundamentar el uso de innitesimos, nos encontramos con problemas similares: determinados conjuntos como el conjunto de todos los
n
umeros reales innitesimales dan lugar a contradicciones, y en este libro presentaremos dos teoras axiomaticas que resuelven el problema:
La teora de Nelson resuelve el problema negando la existencia de los
conjuntos problem
aticos. As por ejemplo, a partir de sus axiomas se
demuestra, desde luego, que existen n
umeros reales innitesimales, pero
tambien que no existe ning
un conjunto cuyos elementos sean los n
umeros
reales innitesimales. Esto es tecnicamente analogo al caso de la teora de
conjuntos de ZFC, en la que se demuestra que existen los n
umeros cardinales (nitos e innitos), pero se demuestra que no existe ning
un conjunto

xii

Introducci
on
cuyos elementos sean todos los cardinales. La u
nica diferencia (de car
acter
psicol
ogico) es que uno puede estudiar algebra, an
alisis, topologa, etc. y
hablar de cardinales de conjuntos nitos e innitos, sin tener realmente
necesidad de hablar en ning
un momento del conjunto de todos los cardinales, por lo que apenas se nota la prohibici
on que la teora impone como
precio para excluir las contradicciones. En cambio, cuando uno habla de
n
umeros reales innitesimales, resulta tentador en muchas ocasiones razonar considerando el conjunto de todos los innitesimales, y la prohibici
on
de hacerlo puede resultar desconcertante.
La teora de Hrbacek distingue entre conjuntos internos y conjuntos externos de un modo similar a como la teora NBG distingue entre conjuntos y clases propias. Es posible hablar del conjunto de todos los n
umeros
innitesimales, pero los argumentos que, a partir de este concepto, dan
lugar a contradicciones se convierten ahora en razonamientos que prueban
que tal conjunto es externo. En realidad, la teora de Nelson permite hablar de conjuntos externos en el mismo sentido informal (pero riguroso)
en que es posible hablar de clases en ZFC, es decir, como conceptos que
es posible introducir en las armaciones a condici
on de que estas puedan
reformularse eliminando toda menci
on a ellos.

Volviendo a la demostraci
on que hemos dado m
as arriba del teorema de Sierpinski, uno de los pasos que hemos dado, aunque es correcto, no es, en realidad,
evidente. Se trata del punto en que hemos reordenado los subndices para poner
en primer lugar los n
umeros innitos y luego los nitos. La reordenaci
on en
s es intrascendente. Lo que no es trivial es que, implcitamente, ah estamos
considerando el conjunto
I = {i n | xi es innitamente grande}.
En general, conjuntos como este son los que dan lugar a contradicciones si no
se toman las precauciones debidas. Por ejemplo, si aceptamos sin mas reexion
la existencia del conjunto I, deberamos aceptar igualmente la existencia de
J = {i N | i es innitamente grande},
y este conjunto nos lleva a una contradicci
on, ya que es f
acil probar que si
i J, entonces i 1 J, luego tendramos un subconjunto de N no vaco y
sin mnimo elemento. En la teora de conjuntos de Nelson se demuestra que I
existe, mientras que J no existe, pero, por la misma raz
on que no es obvio que
J no exista, tampoco es obvio que I s que exista.2
El precio que hay que pagar para trabajar consistentemente en la teora
de conjuntos no est
andar el precio que el lector deber
a juzgar si es caro o
barato es asimilar las sutilezas logicas que determinan que I s que existe
pero J no.
2 Cuando el lector est
e familiarizado con la teora de conjuntos no est
andar podr
a entender
la raz
on por la que I s que existe: I = {i n | xi A}, donde A = {x1 , . . . , xn }, que es un
conjunto est
andar por el teorema A.7.

xiii
En la teora de Hrbacek, esta sutileza desaparece de la prueba del teorema
de Sierpinski, ya que tanto I como J existen trivialmente. La diferencia entre
ambos es ahora que I es interno, mientras que J es externo, pero que I sea
interno o externo es irrelevante para la demostraci
on del teorema. Lo u
nico
necesario era hacer referencia a I para despejar en la ecuaci
on. Sin embargo, la
teora axiom
atica de Hrbacek requiere bastante m
as familiaridad con la l
ogica
matematica que la teora de Nelson.
De todos modos, debemos tener presente que cualquier teora axiom
atica
es ardua para un lector sin la suciente preparaci
on matematica. Incluso hay
muchos matematicos que son expertos en su campo y que solo tienen un vago
conocimiento de lo que es la logica matematica (formal) y la teora axiom
atica
de conjuntos. Por ello, no sera justo comparar una exposici
on de la teora
de conjuntos no est
andar seg
un los patrones de rigor propios de la l
ogica matematica con una exposici
on de la teora clasica al nivel semiformal que emplean
todos los libros de matematicas (excepto los que tratan temas directamente relacionados con la l
ogica matematica o estan escritos por pedantes). Debido a
estas consideraciones, la estructura de este libro es la siguiente:
El primer captulo est
a dedicado a describir informalmente la l
ogica de
la teora de conjuntos cl
asica (en sus tres primeras secciones) y la de la
teora de conjuntos no est
andar (en la cuarta secci
on). Su objetivo es
preparar al lector para que pueda manejar la teora no estandar con el
mismo nivel de seguridad con que un estudiante de matem
aticas medio
maneja la teora estandar. En el caso de la teora estandar, para conseguir
este dominio informal es posible prescindir pr
acticamente por completo de
toda alusi
on a la l
ogica matematica, pero la teora no estandar requiere,
como mnimo, unas nociones b
asicas sobre la logica subyacente para no
caer en contradicciones.
Es importante insistir en que todas las explicaciones, ejemplos, analogas,
etc. presentadas en este primer captulo (incluso en las secciones sobre la
teora cl
asica) solo pretenden sugerir al lector una forma pragm
atica de
concebir la teora no estandar para desenvolverse en ella con soltura. En
particular, no pretenden defender ninguna posici
on los
oca sobre como
han de concebirse las matematicas en general o los innitesimos en particular.
La seccion 1.3 contiene un resumen (con demostraciones) de los resultados b
asicos sobre funciones, relaciones, estructuras algebraicas, n
umeros
naturales, etc., en denitiva, de los hechos y conceptos que el lector debe
conocer para leer este libro. Su nalidad es servir de ayuda a un hipotetico
lector obstinado en que la teora no estandar contradice en algo a la teora
estandar. La seccion 1.3 le dar
a la oportunidad de buscar concretamente
que resultado contradice a la teora no estandar, y tal vez el no encontrar
ninguno le ayude a entender que la contradicci
on solo esta en su imaginaci
on. (Si encuentra alguno, entonces su problema es m
as grave, pero
puede estar seguro de que sera su problema, no un problema de la teora

xiv

Introducci
on
no estandar.) Los lectores que no sean especialmente suspicaces pueden
saltarse esa seccion sin riesgo a echar nada en falta m
as adelante.
Segundo captulo pretende familiarizar al lector con el uso pr
actico de la
teora de conjuntos no est
andar siempre a un nivel informal, lo m
as
parecido posible al nivel de cualquier libro de matem
aticas serio, pero
no tecnico, a traves del estudio de los n
umeros naturales, los n
umeros
racionales y la construccion de los n
umeros reales.
Los captulos siguientes desarrollan los contenidos tpicos de un curso universitario de an
alisis matematico: calculo diferencial e integral para funciones de una y varias variables. La exposici
on pretende ser natural o, mejor
dicho, pretende ser lo que sera una exposici
on natural si la teora de conjuntos no est
andar fuera considerada una teora normal en la pr
actica
matematica. Desarrollamos la teora no estandar como si la teora clasica
no existiese, exactamente igual que los libros clasicos desarrollan la teora
clasica como si la teora no estandar no existiese. En particular, cada concepto se dene de la forma que resulta natural en el contexto de la teora
no estandar, sin mostrar la equivalencia con la denici
on cl
asica correspondiente, salvo que ello tenga interes en la propia teora no estandar.
El lector no necesita ning
un conocimiento matematico previo m
as alla
de cierta familiaridad con los conceptos matematicos basicos (los mismos
que se exponen en el primer captulo), excepto para las secciones 6.5, 6.6
y 7.5, en las que necesitara conocer algunos hechos basicos del algebra
lineal (matrices, determinantes, espacios vectoriales, y poco mas).
Los apendices A y B presentan con rigor la axiom
atica de Nelson y la
de Hrbacek, respectivamente. Aqu el lector necesitara cierta familiaridad
con la l
ogica matematica y con la teora axiom
atica de conjuntos.3 Toda
la teora desarrollada en los captulos precedentes puede formalizarse en
la teora de Nelson sin mas esfuerzo que el necesario para formalizar en
ZFC cualquier exposici
on razonable del an
alisis clasico.
El apendice C contiene la demostracion del teorema de conservacion, seg
un
el cual, todo teorema estandar que pueda demostrarse en la teora de
conjuntos no est
andar puede demostrarse tambien en la teora de conjuntos cl
asica. En particular, si la teora clasica es consistente, la teora
no estandar tambien lo es. La prueba es metamatematica y nitista. Eso
quiere decir, en terminos mas llanos, que cualquiera que arme convencido
que la teora de conjuntos no est
andar no sirve porque es contradictoria,
no tiene ni idea de la estupidez que est
a diciendo. Para este apendice, el
lector necesitara un buen conocimiento de la l
ogica matematica y de la
teora de conjuntos.

3 Los dos cap


tulos I, II y VIII de mi libro de L
ogica son m
as que sucientes, al menos
para la teora de Nelson. En el caso de la teora de Hrbacek, el primer captulo de mi libro de
Pruebas de consistencia sera conveniente tambien.

xv
Hay un aspecto de la comparaci
on entre la teora clasica y la teora no
estandar en el que no vamos a entrar aqu, y es si la teora no estandar ofrece
ventajas frente al teora clasica de cara a la investigacion. Hasta la fecha no
hay ning
un resultado demostrado con tecnicas no estandar y que no pueda
demostrarse de forma razonablemente pareja en dicultad mediante tecnicas
estandar. Los defensores del an
alisis no estandar citan ejemplos como este,
aunque la verdad sea dicha no hay muchos otros que citar:
El quinto problema de Hilbert consista en determinar si todo grupo topol
ogico localmente eucldeo es un grupo de Lie. El problema fue resuelto armativamente en 1952 por Montgomery, Zippin y Gleason. En 1964 Kaplanski
public
o otra demostracion. Sin embargo, en 1976 se celebr
o un congreso sobre
los problemas de Hilbert en el que un especialista de cada rama deba explicar
la soluci
on de los que ya haban sido resueltos, pero el correspondiente a este
problema dijo que las demostraciones conocidas eran tan tecnicas y tan complejas que no poda siquiera esbozarlas. En 1990 J. Hirschfeld public
o4 una prueba
no estandar mucho m
as simple y, cuanto menos, esbozable.
Para terminar, a
nadiremos u
nicamente que la exposici
on del c
alculo diferencial e integral que contiene este libro s
olo es una muestra reducida de las
posibilidades de la teora de conjuntos no est
andar. Al igual que es posible
una exposici
on no est
andar del an
alisis matematico, podemos desarrollar una
topologa no estandar, una geometra diferencial no est
andar, una teora de la
medida no estandar, un an
alisis funcional no est
andar y, en general, cualquier
rama de la matematica que estudie conjuntos innitos es susceptible de un enfoque no estandar. Las teoras axiomaticas que presentamos aqu son sucientes
para formalizar tales enfoques. La pregunta sigue siendo si merece la pena.
Dejamos al lector la u
ltima palabra.

4 J. Hirschfeld, The nostandard treatment of Hilberts fth problem, Trans. Amer. Math.
Soc. 321 (1) (1990).

Captulo I

Preliminares conjuntistas
Suponemos que el lector tiene cierta familiaridad con las matem
aticas elementales, especialmente con la manipulacion de expresiones algebraicas (como
que am an = am+n o que a/b + c/d = (ad + bc)/bd, etc.) Mas en general, supondremos que el lector conoce los n
umeros naturales, enteros y racionales, y
tambien sera conveniente cierta familiaridad con los n
umeros reales.
El prop
osito de este primer captulo es conectar estos conocimientos informales que suponemos al lector con otros conceptos mas abstractos en que es
necesario enmarcarlos para abordar con el rigor necesario otros temas mas delicados, como el analisis matematico, especialmente desde el punto de vista no
estandar que vamos a adoptar. Con el rigor necesario no nos referimos al
rigor absoluto, consistente en trabajar en un sistema axiom
atico formal, lo cual
exigira un esfuerzo al lector que incluso muchos licenciados en matematicas no
son capaces de realizar, sino al rigor necesario para que el lector pueda distinguir
informalmente un razonamiento v
alido de otro que no lo es, que es como de
hecho trabaja la mayora de los matematicos profesionales cuya especialidad
no esta relacionada con la fundamentaci
on de las matematicas.
De todos modos, conviene tener presente que, del mismo modo que lo que
determina la validez de los razonamientos que hacen los matematicos profesionales es el hecho de que podran expresarse con todo rigor en el seno de una
teora axiom
atica formal (por ejemplo, la teora de conjuntos ZFC), y ello sin
perjuicio de que muchos matem
aticos no sepan en que consiste exactamente esta
teora, tambien sucede que los patrones de razonamiento que vamos a tratar de
inculcar al lector en este libro se corresponden con los que pueden expresarse
con todo rigor en otra teora axiom
atica formal. En otras palabras, lo que trataremos de conseguir es que el lector pueda razonar correctamente en el seno de la
matematica no estandar de forma intuitiva, sin necesidad de asimilar para ello
las sutilezas y los tecnicismos de la logica matematica, pero de tal modo que el
resultado pr
actico sea el mismo que si el lector conociera todos esos tecnicismos.
Quiz
a esta comparacion pueda ser u
til: un ciudadano honrado puede respetar la ley sin haber ledo nunca un c
odigo legal. Su buen juicio le permite
determinar que conductas seran sin duda ilegales y cu
ales son admisibles. Solo
1

Captulo 1. Preliminares conjuntistas

en caso de verse en una situacion delicada que escape a lo que le es familiar


necesitara asesoramiento legal. Del mismo modo, el lector debera tener presente que, en cualquier momento en que se de cuenta de que no domina una
situaci
on y no este seguro de si un razonamiento es legal o ilegal, deber
a
consultar a un experto en leyes, es decir, a alguien que s domine el sistema
axiom
atico formal que determina sin margen de ambig
uedad lo que puede y lo
que no puede hacerse.

1.1

Conjuntos

Invitamos al lector a que conciba todo cuanto vamos a ver aqu como una
pelcula de cine. Seg
un su argumento, una pelcula puede ser fant
astica, en el
sentido de que lo que se narra en ella no tiene nada que ver con la realidad; puede
ser hist
orica, en el sentido de que todo cuanto se narra en ella es una replica de lo
que ha sucedido realmente en una determinada epoca y un determinado lugar; o
bien puede combinar en diferentes proporciones elementos reales con elementos
fant
asticos (por ejemplo, si narra una historia cticia elmente enmarcada en
un contexto hist
orico real).
Dejamos al lector la libertad de clasicar nuestra pelcula en el genero
que considere oportuno. Los lectores que consideren que nuestra pelcula es
hist
orica son los que los l
osofos llaman platonistas; los que consideren que es
pura fantasa son los llamados formalistas; mientras que los que adopten una
postura intermedia se distribuir
an en una amplia gama de posibilidades entre
el platonismo y el formalismo, entre las cuales, una de las m
as populares es el
nitismo.
En cualquier caso, el lector debe tener presente que cualquier espectador que
quiera entender una pelcula ha de ser consciente de que cada pelcula tiene su
propia realidad interna, y que es necesario remitir a ella los juicios sobre cada
escena, y no a la realidad externa a la pelcula. Por ejemplo, pensemos en un
espectador sensato que sabe que creer en fantasmas es ridculo, pero va a ver
una pelcula en la que un personaje advierte a otros que no deben entrar en una
determinada casa, porque en ella habitan fantasmas. Para entender la pelcula,
deber
a estar abierto a dos posibilidades:
Puede tratarse de una pelcula de fantasmas, de modo que, internamente,
sea verdad que en la casa hay fantasmas, en cuyo caso el espectador debera
concluir que los incredulos que se adentran en la casa son unos insensatos que
no saben lo que hacen.
Pero tambien puede tratarse de una pelcula realista, en la que el personaje
que previene contra los fantasmas lo hace, digamos, porque est
a buscando un
tesoro oculto en la casa y emplea ciertos trucos para ahuyentar a otras personas
que pudieran encontrarlo antes. En tal caso, los incredulos que se adentran en
la casa son personajes mas inteligentes que los bobos a los que el malo ha
conseguido acobardar.
Lo importante es que el juicio que el espectador se forme sobre los personajes no debe depender de su opini
on personal sobre si existen o no fantasmas

1.1. Conjuntos

(su concepcion de la realidad externa) sino de la realidad interna que presenta


la pelcula. De otro modo, si, por ejemplo, la pelcula es de fantasmas y el espectador se niega a aceptar internamente la existencia de fantasmas, no podr
a
entender el nal, cuando los fantasmas se maniesten abiertamente y no dejen
lugar a dudas de su existencia (interna).
Los personajes de nuestra pelcula se llaman conjuntos. Los matematicos los
llaman habitualmente conjuntos, sin m
as, pero nosotros necesitamos introducir
una precisi
on y, por ello, los llamaremos conjuntos internos. Del mismo modo
que un personaje de una pelcula pretende ser (y es internamente) una persona
(aunque externamente pueda no existir, por ejemplo, porque sea una imagen
creada por ordenador), los conjuntos internos de nuestra pelcula pretenden ser
(y son internamente) colecciones de objetos. De que objetos? Nuestra pelcula
es, en este sentido, bastante economica: los objetos que forman parte de un
conjunto interno son otros conjuntos internos. En nuestra pelcula no hay nada
mas que conjuntos internos.
As pues, un conjunto interno B es, en nuestra pelcula, una colecci
on de
conjuntos internos. Si A es uno de estos conjuntos internos que forman parte
de B, representaremos este hecho con la notacion
A B.
Habitualmente se lee A pertenece a B, aunque tambien podemos decir que
A es un elemento de B o que A est
a en B, etc. Para indicar lo contrario
se escribe A
/ B.
Una pelcula coherente ha de respetar unas normas, que pueden jarse arbitrariamente (siempre que no se incurra en contradicciones) pero que, una vez
jadas, se han de respetar. Por ejemplo, en una pelcula que narre una cticia
conspiraci
on para matar al presidente de los Estados Unidos, podr
an aparecer
personajes cticios, incluso un presidente de los Estados Unidos cticio, pero no
podr
a aparecer un asesino con cuatro manos. En otro tipo de pelculas s que
podr
a aparecer un personaje con cuatro manos, pero en esta no. Por el contrario, para que la trama del complot resulte interesante, tendr
a que someterse al
principio de que todos los personajes sean seres humanos normales.
Nuestra pelcula tambien tiene sus leyes internas, llamadas axiomas. Son
principios que los conjuntos internos respetan para que el argumento resulte a
la vez coherente e interesante. Del mismo modo que muchas pelculas exigen
que sus personajes tengan el aspecto y el comportamiento de seres humanos
normales, nosotros vamos a pedir a nuestros conjuntos internos que se comporten como lo que queremos que sean internamente, es decir, meras colecciones
de elementos. El principio que garantiza esto se conoce como axioma de extensionalidad:
Axioma de extensionalidad
entonces son iguales.

Si dos conjuntos tienen los mismos elementos,

Captulo 1. Preliminares conjuntistas

En la pr
actica, esto signica que si tenemos dos conjuntos A y B y queremos
probar que A = B, bastar
a con que tomemos un elemento arbitrario x A y
logremos probar que tambien x B, y viceversa.
Conviene introducir la notaci
on A B para referirse a la mitad de este
hecho. Diremos que un conjunto interno A es un subconjunto de un conjunto
interno B (y se representa como acabamos de indicar) si todo elemento de A
es tambien un elemento de B. En estos terminos, el axioma de extensionalidad
arma que la igualdad A = B equivale a las dos inclusiones A B y B A.
Desde un punto de vista m
as teorico, el axioma de extensionalidad puede
verse as: llamamos extensi
on de un conjunto interno B a todos los conjuntos
internos A que cumplen A B. El axioma de extensionalidad arma que dos
conjuntos internos son iguales si y s
olo si tienen la misma extension. Es este
axioma el que nos permite armar que un conjunto no es ni m
as ni menos que
su extension1 y, por consiguiente, que es una colecci
on de conjuntos internos.
En este punto es crucial que hagamos una observaci
on: el hecho de que los
conjuntos internos sean colecciones de conjuntos internos no nos garantiza que
toda coleccion de conjuntos internos sea (la extensi
on de) un conjunto interno.
De hecho, sucede que es logicamente imposible que esto sea as. Vamos a ver
por que.
Podemos especicar una coleccion de conjuntos internos a traves de una
propiedad com
un a todos ellos. Por ejemplo, vamos a considerar la propiedad
P (x) x
/ x. M
as claramente: dado un conjunto interno x, diremos que
cumple la propiedad P (x) si no se pertenece a s mismo. Nadie dice que tenga
que haber conjuntos internos que se pertenezcan a s mismos. Si no los hay, lo
que tenemos es que todos los conjuntos cumplen la propiedad P (x).
En cualquier caso, podemos llamar R a la coleccion de todos los conjuntos
internos que cumplen P (x). Ciertamente, se trata de una coleccion de conjuntos
internos denida con toda precisi
on. Pero nos formulamos la pregunta siguiente:
Es R la extension de un conjunto interno? o, dicho de otro modo, existe un
conjunto interno R cuyos elementos sean precisamente los conjuntos internos
que no se pertenecen a s mismos?
La respuesta es negativa. Si existiera tal conjunto R, tendra que darse
una de estas dos alternativas: o bien R R, o bien R
/ R. Pero sucede que
ambas nos llevan a una contradicci
on. Si suponemos que R R, entonces, por
denici
on de R, tenemos que R es un conjunto interno que cumple la propiedad
P (R), es decir, que cumple R
/ R, y estabamos suponiendo lo contrario. Es
imposible. Por otra parte, si R
/ R, entonces R es un conjunto interno que
1 Conviene tener presente que esto no es una necesidad l
ogica. En nuestra pelcula
podramos haber decidido que los conjuntos tuvieran otras propiedades relevantes adem
as
de su extensi
on. Por ejemplo, podramos haber decidido que hubiera conjuntos blancos y
negros, de modo que podra haber dos conjuntos distintos A y B que tuvieran ambos un u
nico
elemento C, pero que fueran distintos porque A fuera blanco y B fuera negro. Lo que arma
el axioma de extensionalidad es que un conjunto interno no tiene ninguna otra propiedad
distintiva m
as que su extensi
on.

1.1. Conjuntos

cumple la propiedad P (R), luego debera ser R R, lo cual es nuevamente


absurdo.
Los matematicos suelen expresar esto diciendo que no existe ning
un conjunto
que contenga a los conjuntos que no se pertenecen a s mismos, pero, dicho as, es
difcil de digerir, porque parece que se nos este negando la posibilidad de pensar
en la coleccion de los conjuntos que verican una determinada propiedad que
no tiene nada de ambiguo.
Sin embargo, bien entendida, esta paradoja no tiene nada de extra
no. Lo
que acabamos de probar es que la coleccion R no es la extension de ning
un
conjunto interno. Los matem
aticos expresan esto de forma mas afortunada
diciendo que R es una clase propia, una coleccion de objetos formada por
personajes de nuestra pelcula pero que no es ella misma un personaje de nuestra
pelcula, una colecci
on externa a ella, que est
a detr
as de las camaras.
Quiz
a esta comparacion sirva de ayuda: imaginemos un decorado para una
pelcula de romanos. Es una sala de un palacio y en un punto hay un jarr
on con
ores, y dentro del jarr
on con ores esta oculto un micr
ofono. Podemos decir
que el jarr
on es un objeto interno de la pelcula. El espectador lo ver
a y deber
a
entender que es un jarr
on. En cambio, el micr
ofono es un objeto externo. El
espectador no debe verlo o, si lo ve, debe aparentar ser otra cosa, por ejemplo,
una or.
Podemos decir que el microfono no existe internamente, en el sentido de que,
si existiera, la pelcula se volvera contradictoria, ya que en un palacio romano
del siglo I a.C. no puede haber un micr
ofono. En la pr
actica, que no exista
internamente no signica que no exista, porque lo cierto es que est
a ah, sino
que no puede verse y que ning
un personaje de la pelcula puede aludir a el como
podra aludir al jarr
on con ores.
Igualmente, la clase R esta ah, pero es externa a nuestra pelcula. Si
la consideramos como parte de sus personajes llegamos a una contradiccion,
como sera una contradicci
on que Julio Cesar llevara un crucijo. Podemos
demostrar que R no existe igual que podemos demostrar que Julio Cesar no
lleva crucijo, sin perjuicio de que, si, en una determinada escena, Julio Cesar
lleva una coraza, debajo de la coraza pueda llevar un crucijo colgado del cuello
si el actor es cristiano.
Observemos que, visto as, la clase R no es contradictoria. Haciendo un uso
externo del signo , podemos decir que R
/ R, y no hay contradicci
on porque
R es la clase de todos los conjuntos internos que no se pertenecen a s mismos.
Para pertenecer a R hay que cumplir dos requisitos: 1) ser un conjunto interno
y 2) no pertenecerse a s mismo. Tenemos que R cumple 2), pero le falla 1),
y por eso no podemos concluir que R R, y no llegamos, pues, a ninguna
contradicci
on.
M
as en general, hemos de tener presente que un conjunto interno es una
coleccion de conjuntos internos, luego en ning
un caso puede pertenecerle una
coleccion de conjuntos que no sea un conjunto interno. Una colecci
on de conjuntos externa puede estar formada por algunos conjuntos internos, pero no puede
formar parte de un conjunto interno.
Esto nos plantea el problema de especicar con que colecciones de conjuntos

Captulo 1. Preliminares conjuntistas

internos podemos contar en nuestra pelcula. No podemos armar que, para


toda propiedad P (x), existe un conjunto interno formado por todos los conjuntos
internos que cumplan P (x), ya que, tomando P (x) x
/ x, esto nos permitira
concluir que R es un conjunto interno y nuestra pelcula se derrumbara, como
si Julio Cesar exhibiera un crucijo.
Los matematicos tuvieron que pensar durante mucho tiempo sobre que propiedades P (x) son admisibles para denir conjuntos y cu
ales no. Aparte de
x
/ x, hay muchas otras propiedades que dan lugar a clases propias, es decir,
a colecciones de conjuntos internos que daran lugar a contradicciones si les
concedieramos la existencia interna en nuestra pelcula.
Afortunadamente, las u
nicas propiedades que dan lugar a clases propias son
las que deniran conjuntos demasiado grandes. Por ejemplo, puede probarse
que no existe un conjunto interno que contenga a todos los conjuntos internos o,
equivalentemente, que la clase de todos los conjuntos internos no es un conjunto
interno, como tampoco lo es la clase de todos los conjuntos internos que tienen
un u
nico elemento, etc.
Decimos afortunadamente porque la pr
actica matematica usual no requiere considerar tales colecciones enormes. Podemos hablar de conjuntos internos con un elemento sin necesidad de tratar con la clase enorme de todos los
conjuntos internos con un elemento, podemos hablar de conjuntos internos sin
necesidad de hablar de la clase enorme de todos los conjuntos internos, etc.
El axioma m
as general que vamos a aceptar sobre formacion de conjuntos a
partir de propiedades es el siguiente:
Axioma de especicaci
on Si A, x1 , . . . , xn son conjuntos internos y consideramos una propiedad interna P (x, x1 , . . . , xn ), entonces existe un conjunto
interno cuyos elementos son los conjuntos internos x A que cumplen la propiedad P . Lo representaremos por
{x A | P (x, x1 , . . . , xn )}.
Aqu hemos empleado por primera vez la expresion propiedad interna para
referirnos, concretamente, a cualquier propiedad que pueda expresarse exclusivamente en terminos del signo y de conceptos logicos, como y, o,
si. . . entonces. . . , existe, para todo, =, etc.
Esto signica que, por ejemplo, no podemos denir el conjunto de todos los
conjuntos que son verdes, ya que verdes no es un concepto denido a partir
de y de conceptos logicos.
La clave del axioma de especicacion es que solo permite que una propiedad seleccione algunos conjuntos internos de entre los conjuntos internos que
pertenecen a un conjunto interno dado A. Aunque podamos escribir
{x | P (x, x1 , . . . , xn )}
para referirnos a la colecci
on de todos los conjuntos internos x que cumplen la
propiedad P , no podemos pretender que tal coleccion de conjuntos internos sea

1.2. Los conceptos conjuntistas b


asicos

la extension de un conjunto interno. Al contrario, podemos encontrarnos con


una contradicci
on que demuestre que tal coleccion de conjuntos es una clase
propia, externa a nuestra pelcula.
As, dado un conjunto interno A, podemos considerar como personaje de
nuestra pelcula al conjunto
RA = {x A | x
/ x},
y este conjunto no da lugar a ninguna contradicci
on. Sera una contradicci
on
que cumpliera RA RA , por lo que podemos deducir que RA
/ RA , de donde
a su vez se desprende que RA
/ A (pues si fuera RA A podramos concluir
on).
que RA RA , y tendramos otra contradicci
No obstante, el axioma de especicacion no es suciente para garantizar
la existencia de todos los conjuntos internos que nos gustara ver en nuestra
pelcula. Por ejemplo, dados dos conjuntos internos u y v, nos gustara tener
un conjunto interno w formado ni m
as ni menos que por u y v, es decir,
w = {x | x = u o x = v},
pero esta expresion no es de la forma que nos permite apelar al axioma de
especicacion.
Problemas como este se nos presentaran en muy pocas ocasiones, y solo necesitaremos unos pocos axiomas especcos para asegurar la existencia algunos
conjuntos internos como w. Ahora bien, una vez dispongamos de estos conceptos basicos, el u
nico principio general de formaci
on de conjuntos que vamos
a necesitar (y el u
nico que tendremos derecho a usar si no queremos caer en
contradicciones) sera el axioma de especicacion.

1.2

Los conceptos conjuntistas b


asicos

En esta seccion describiremos los personajes basicos de nuestra pelcula.


Empezamos observando que el axioma de especicacion que ya hemos discutido
requiere conocer la existencia de al menos un conjunto interno A para generar
a partir de el nuevos conjuntos internos, y de momento no conocemos ninguno.
Por eso necesitaremos algunos axiomas especcos que nos garanticen la existencia de algunos conjuntos que encabecen nuestro reparto.
Axioma del conjunto vaco
elemento.

Existe un conjunto interno que no tiene ning


un

El axioma de extensionalidad implica que tal conjunto es u


nico, pues si
existieran dos conjuntos internos sin elementos, entonces ambos tendran los
mismos elementos (a saber, ninguno), luego tendran que ser el mismo. Esta
unicidad nos permite darle un nombre. Lo llamaremos conjunto vaco y lo
representaremos por .

Captulo 1. Preliminares conjuntistas

Axioma del par Dados dos conjuntos internos u y v, existe un conjunto


interno cuyos elementos son exactamente u y v.
Nuevamente, el axioma de extensionalidad garantiza que s
olo puede haber
un conjunto interno cuyos elementos sean u y v, pues dos de ellos seran dos
conjuntos con los mismos elementos. Por ello podemos llamar a tal conjunto el
par desordenado formado por u, y v, y lo representaremos por {u, v}.
Observemos que, si tenemos dos conjuntos internos u y v, no necesitamos
ning
un axioma que nos de derecho a pensar coherentemente en la coleccion
formada por ellos dos. Lo que garantiza el axioma del par es que dicha colecci
on
no es externa a nuestra pelcula, sino que tambien forma parte de ella.
Tambien es importante destacar que el axioma no requiere que los conjuntos
u y v sean distintos. Si son iguales abreviaremos {u, u} = {u}, que es un
conjunto interno que tiene a u como u
nico elemento.
El nombre de par desordenado hace referencia a que, evidentemente, se
cumple {u, v} = {v, u}, dado que ambos conjuntos tienen los mismos elementos.
Cuando queramos dar importancia al orden en que consideramos dos conjuntos
podemos agruparlos en lo que llamaremos un par ordenado:
(u, v) = {{u}, {u, v}}.
Observemos que (u, v) es un conjunto interno cuya existencia se demuestra
aplicando tres veces el axioma del par. Es f
acil demostrar que la igualdad
(u, v) = (p, q) solo se da cuando u = v y p = q. En particular, si u = v, tenemos
que (u, v) = (v, u).
Ahora podemos denir una terna ordenada (u, v, w) = ((u, v), w), e igualmente, una cu
adrupla ordenada (u, v, w, x) = ((u, v, w), x), etc.
Dados dos conjuntos u y v, denimos su uni
on y su intersecci
on como
u v = {x | x u o x v},

u v = {x | x u y x v}.

El lector debera protestar ante estas deniciones, ya que parecen aplicaciones del axioma de especicacion y, sin embargo, no respetan su estructura, ya
que no estamos restringiendo la seleccion a los x que pertenecen a un conjunto
A prejado. En el caso de la intersecci
on esto se puede arreglar, ya que podemos
escribir
u v = {x u | x v},
sin embargo, con la uni
on la objeci
on es irrefutable, por lo que necesitamos un
axioma especco:
Axioma de la uni
on Dados dos conjuntos internos, existe un conjunto interno cuyos elementos son los conjuntos internos que pertenecen a cualquiera
de los dos conjuntos dados.2
2 En realidad, la teor
a de conjuntos requiere un axioma de la uni
on m
as fuerte que
este,
pero no necesitamos explicitar este hecho.

1.2. Los conceptos conjuntistas b


asicos

Esto nos permite hablar de conjuntos internos como


{a, b, c, d} = {a} {b} {c} {d},
que es el u
nico conjunto interno cuyos elementos son los cuatro conjuntos internos a, b, c, d.
Otro uso v
alido del axioma de especicacion es la denici
on del complementario de un conjunto interno en otro:
u \ v = {x u | x
/ v}.
El u
ltimo concepto b
asico que requiere su axioma especco es el siguiente:
Axioma del conjunto de partes Dado un conjunto interno A, existe un
conjunto interno cuyos elementos son todos los subconjuntos de A.
A dicho conjunto lo llamaremos conjunto de las partes de A:
PA = {x | x A}.
Observemos que si u A y v B, entonces u, v A B, luego
{u}, {u, v} P(A B),
luego
(u, v) = {{u}, {u, v}} P(P(A B)).
Esto implica que, aunque la denici
on
A B = {(u, v) | u A, v B}
podra parecer un uso fraudulento del axioma de especicaci
on, en realidad es
legtima, porque podramos haber escrito
A B = {(u, v) P(P(A B)) | u A, v B}.
Este conjunto, es decir, el conjunto de todos los pares ordenados con primera
componente en A y segunda componente en B, se llama producto cartesiano de
A y B.
Terminaremos esta seccion esbozando la construcci
on del conjunto N de los
n
umeros naturales. La idea que perseguimos es demostrar la existencia de un
conjunto interno que tenga este aspecto:
N = {0, 1, 2, 3, 4, . . . }
Pero, para ello, tenemos dos problemas: en primer lugar, para que N sea un
conjunto interno hemos de denir sus elementos 0, 1, 2, etc. de tal modo que
podamos considerar a cada uno de ellos como un conjunto interno, y en segundo

10

Captulo 1. Preliminares conjuntistas

lugar hemos de arregl


arnoslas para denir un conjunto N que los tenga a ellos
por elementos y solo a ellos.
El primer problema es f
acil de resolver. Si pensamos en los n
umeros naturales
como en ciertos personajes historicos, lo que necesitamos es seleccionar unos
actores que interpreten estos papeles en nuestra pelcula. Como n
umero 0,
ninguno parece m
as id
oneo que el conjunto vaco. En lo sucesivo llamaremos
n
umero natural 0 a 0 = . Esto signica que, cuando pensemos en el conjunto
vaco como en el u
nico conjunto interno sin elementos, escribiremos , mientras
que cuando pensemos en el como n
umero natural 0 escribiremos 0, si bien se
trata en ambos casos del mismo conjunto.
A continuaci
on denimos, para cualquier conjunto interno x, el que llamaremos siguiente de x, que sera x = x {x}. En particular, denimos
1 = 0 = {} = {} = {0},
2 = 1 = 1 {1} = {0} {1} = {0, 1},
3 = 2 = 2 {2} = {0, 1} {2} = {0, 1, 2},
y as sucesivamente. El problema que nos queda es convertir el as sucesivamente en una propiedad interna que podamos usar para denir el conjunto
interno N. Para ello denimos:
Un conjunto interno A es inductivo si 0 A y, siempre que un conjunto x
cumple x A, tambien se cumple que x A.
Es decir, un conjunto es inductivo si contiene a todos los conjuntos internos
que queremos tomar como n
umeros naturales. Ahora necesitamos el u
ltimo
axioma que perlar
a el comportamiento b
asico de los conjuntos internos:
Axioma de innitud

Existe un conjunto interno inductivo.

Se llama axioma de innitud porque sin el es imposible, no ya construir los


n
umeros naturales, sino siquiera demostrar la existencia de un conjunto interno
que sea innito.
El problema de los conjuntos inductivos es que, adem
as de los n
umeros
naturales, pueden contener otros conjuntos. La denici
on siguiente resuelve
este problema:
Llamaremos conjunto de los n
umeros naturales al conjunto interno
N = {x A | x pertenece a todos los conjuntos internos inductivos},
donde A es un conjunto inductivo arbitrario. Es claro que N no depende de la
eleccion de A, pues si llamamos NA y NB a los conjuntos denidos de este modo
a partir de dos conjuntos inductivos A y B, entonces todo x NA pertenece
a todos los conjuntos inductivos, en particular a B, luego tambien x NB , y
viceversa, luego NA = NB .
A partir de aqu, es una pura rutina demostrar los siguientes hechos b
asicos
sobre los n
umeros naturales:

1.2. Los conceptos conjuntistas b


asicos

11

1. 0 N y, si n N, entonces n N (el cero es un n


umero natural y el
siguiente de un n
umero natural es tambien un n
umero natural).
2. No existe ning
un n N tal que n = 0 (el cero no es el siguiente de ning
un
n
umero natural).
3. Si n N y n = 0, existe un m N tal que n = m (todo n
umero natural
no nulo es el siguiente de otro n
umero natural.
4. Si m, n N y m = n entonces m = n (n
umeros distintos tienen siguientes distintos).
5. Si A N es un conjunto interno tal que 0 A y, cuando n A, tambien
n A, entonces A = N.
La u
ltima propiedad se conoce como principio de inducci
on y, aunque parezca la propiedad m
as compleja de las cinco, es una de las mas faciles de
demostrar: un conjunto A en tales condiciones es, por denici
on, inductivo,
luego si n N, se cumple que n A por denici
on de N, es decir, porque n
ha de pertenecer a todos los conjuntos internos inductivos. Por consiguiente,
N A, lo que, unido a la hip
otesis de que A N, nos da que A = N.
Las propiedades 1. y 2. son inmediatas, 3. se prueba trivialmente usando 5.
(que ya esta probada).
Ejercicio: Probar 4. siguiendo este esquema:
a) Demostrar por inducci
on sobre n que si m n N, entonces m n.
b) Demostrar por inducci
on que, si n N, entonces n
/ n.
c) Demostrar 4. por reducci
on al absurdo: si m = n, entonces m n y n m.
Llegar de aqu a una contradicci
on.

A veces es mas comodo expresar el principio de inducci


on en terminos de
propiedades: Dados unos conjuntos internos x1 , . . . , xn y una propiedad interna
P (n, x1 , . . . , xn ), podemos considerar el conjunto interno
A = {n N | P (n, x1 , . . . , xn )}.
Lo que dice el principio de inducci
on para el caso del conjunto A es que, si
0 tiene la propiedad P y, supuesto que un n N tiene P , podemos probar que
n tambien tiene la propiedad P , entonces podemos asegurar que todo n
umero
natural tiene la propiedad P .
Las cinco propiedades que hemos enunciado sobre los n
umeros naturales se
conocen como axiomas de Peano (aunque no son axiomas, sino teoremas de
nuestra pelcula). Peano crea, y muchos matematicos siguen creyendo actualmente, que determinan completamente al conjunto N de los n
umeros naturales,
en el sentido de que no puede haber m
as que un conjunto que cumpla esas cinco
propiedades. Esto es cierto si, por conjunto, entendemos conjunto interno,
es decir, un conjunto de los que forman parte de nuestra pelcula.

12

Captulo 1. Preliminares conjuntistas

Ejercicio: Demostrar que si N1 y N2 son dos conjuntos internos que cumplen los
cinco axiomas de Peano, entonces N1 = N1 N2 = N2 .

Ahora bien, quienes creen que los axiomas de Peano determinan de forma absoluta el conjunto de los n
umeros naturales no tienen en cuenta que las pelculas
son pelculas. No es este el mejor momento para discutir sobre la cuestion. Volveremos sobre ella mas tarde. De momento dejamos u
nicamente esta idea al
lector: En el mundo real s
olo ha habido un Julio Cesar, y, por ello, en una
pelcula sobre Julio Cesar solo puede haber un personaje que sea Julio Cesar,
pero eso no garantiza que el Julio Cesar que presente la pelcula sea una imagen
el del Julio Cesar historico. Sera un error garrafal armar que el Julio Cesar
de la pelcula ha de ser identico al Julio Cesar real porque no puede haber m
as
que un Julio Cesar. En realidad tenemos dos unicidades: hay un u
nico Julio
Cesar externo y un u
nico Julio Cesar interno, pero el Julio Cesar interno puede
ser muy diferente del Julio Cesar externo.

1.3

Elementos de teora de conjuntos

Una vez presentados los principales personajes de nuestra pelcula, ahora vamos a dar algunos detalles del argumento. Puesto que todo lo que vamos a decir
hace referencia a lo que sucede en la realidad de nuestra pelcula, hablaremos
de conjuntos entendiendo que en todo momento nos referimos a conjuntos
internos.

1.3.1

Funciones

Denici
on 1.1 Dados dos conjuntos A y B, una aplicaci
on (o una funci
on)
f : A B es un subconjunto f A B tal que, para cada a A, existe un
u
nico b B tal que (a, b) f . Este u
nico b se llama imagen por f del conjunto
a, y se representa por b = f (a). Tambien se dice que a es una antiimagen de b
por f .
En la pr
actica, para denir una aplicaci
on f : A B podemos olvidar que
estamos deniendo un conjunto de pares ordenados y denir simplemente f (a)
para todo a A. En el fondo, esto es siempre una aplicaci
on del axioma de
especicacion. Por ejemplo, si denimos s : N N como la aplicacion dada
por s(n) = n , con mas precision estamos deniendo el conjunto
s = {(n, m) N N | m = n }.
Denici
on 1.2 Una aplicaci
on f : A B es inyectiva si elementos distintos
de A tienen im
agenes distintas en B o, alternativamente, si cuando f (a) = f (a ),
entonces a = a .
Diremos que f es suprayectiva si todo elemento de B tiene al menos una
antiimagen en A. Diremos que f es biyectiva si es inyectiva y suprayectiva.

1.3. Elementos de teora de conjuntos

13

Denimos3
B A = {f | f : A B}.
Si f : A B y g : B C, denimos la composici
on f g : A C
como la aplicacion dada por (f g)(a) = g(f (a)).
La aplicaci
on identidad IA : A A en un conjunto A es la aplicacion
biyectiva dada por IA (a) = a.
Si A B, la inclusi
on de A en B es la aplicacion i : A B dada por
i(a) = a (de modo que la identidad es la inclusi
on de un conjunto en s mismo).
Si f : A B es una aplicaci
on biyectiva, podemos denir la aplicaci
on
inversa f 1 : B A como la aplicacion
f 1 = {(b, a) B A | f (a) = b}.
De este modo, f (a) = b equivale a f 1 (b) = a. Es f
acil ver que f 1 es
tambien biyectiva y es la u
nica aplicaci
on g : B A que cumple f g = IA y
g f = IB .
Si f : A B y C A, llamaremos restricci
on de f a C a la aplicaci
on
f |C : C A dada por f |C (c) = f (c), para todo c C.
Ejercicio: Comprobar que la composici
on de aplicaciones inyectivas, suprayectivas o
biyectivas es tambien inyectiva, suprayectiva o biyectiva.

Teorema 1.3 (Teorema de recursi


on) Dado un conjunto A, un conjunto
a A y una aplicaci
on g : A A, existe una u
nica aplicaci
on f : N A
que cumple f (0) = a y, para todo n N, f (n ) = g(f (n)).
Es decir, para denir una aplicaci
on f : N A basta denir f (0) y denir
f (n ) a partir de f (n).
n:4 Por inducci
Demostracio
on se demuestra que, si m N, se cumple que

umeros naturales y, si n m, entonces
0 m , todos los elementos de m son n
n  m .
En efecto, esto es cierto para m = 0, ya que 0 0 = {0}, el u
nico elemento
de 0 es 0, que es un n
umero natural, y la tercera propiedad es trivial, ya que
no existe ning
un n 0 = .
Supong
amoslo cierto para m y veamoslo para m . Hemos de probar que
0 m = m {m }. Como suponemos que 0 m , es claro que tambien
3 Podemos

usar el axioma de especicaci


on porque, de hecho,
B A = {f P(A B) | f : A B}.

4 La prueba es bastante t
ecnica, y los argumentos que requiere son de naturaleza muy
distinta a los que realmente nos van a interesar en este libro, por lo que el lector puede pasarla
por alto sin que ello vaya a afectar a su comprensi
on de lo que sigue. La incluimos u
nicamente
por si acaso, m
as adelante, el lector encuentra motivos para desconar de la construcci
on de
los n
umeros naturales y quiere revisarla con detalle.

14

Captulo 1. Preliminares conjuntistas

0 m . Si todos los elementos de m son n


umeros naturales, tambien lo son
todos los de m , ya que son los de m y el propio m , que es un n
umero natural.
Ademas, si n m = m {m}, o bien n m, en cuyo caso n m m por la
hip
otesis de induccion, o bien n = m, en cuyo caso n = m m por denici
on
de m .
Ahora vamos a probar que, para cada m N, existe una u
nica aplicaci
on
fm : m A que cumple fm (0) = a y, para todo n m, fm (n ) = g(fm (n)).
En efecto, para m = 0 basta tomar f0 = {(0, a)}. Si existe fm , denimos
fm = fm {(m , g(fm (m))}. De este modo, fm (n) = fm (n) para todo n m,
por lo que la propiedad que suponemos que cumple fm puede reformularse as:
fm (0) = a,

fm (n ) = g(fm (n)),

para todo n m . Como m = m {m}, solo falta probar que la segunda parte
se cumple tambien para n = m. Ahora bien, por denici
on,
fm (m ) = g(fm (m)) = g(fm (m)).
Para probar la unicidad, sea h : m A cualquier aplicaci
on que cumpla
las condiciones
h(0) = a,

h(n ) = g(h(n)),

para todo n m ,

y vamos a probar que es justamente la fm que hemos denido. Demostramos


por inducci
on que si n m , entonces h(n) = fm (n).
En efecto, si n = 0, entonces h(0) = a = fm (0). Si h(n) = fm (n) y n m ,
entonces
h(n ) = g(h(n)) = g(fm (n)) = fm (n ).
As pues, h = fm , como queramos probar.
Ahora denimos f : N A mediante f (n) = fn (n). La aplicaci
on f tiene
la propiedad indicada, pues f (0) = f0 (0) = a y, si n N, entonces
f (n ) = fn (n ) = g(fn (n)) = g(fn (n)) = g(f (n)).
La unicidad se demuestra por inducci
on exactamente igual a como hemos
probado la unicidad de fm .
Veamos una primera aplicaci
on del teorema de recursion:
Denici
on 1.4 Para cada m N, denimos la aplicaci
on (m+) : N N
determinada recursivamente por m y la aplicaci
on siguiente s : N N, es
decir, como la u
nica aplicaci
on que cumple:
(m+)(0) = m,

(m+)(n ) = s((m+)(n)) = ((m+)(n)) .

1.3. Elementos de teora de conjuntos

15

En la pr
actica escribiremos m + n en lugar de (m+)(n), con lo que las
propiedades anteriores se vuelven m
as legibles:
m + 0 = m,

m + n = (m + n) .

M
as a
un, recordando la denici
on 1 = 0 , tenemos que
m + 1 = m + 0 = (m + 0) = m + 1.
Por ello, en lo sucesivo no volveremos a representar el siguiente de m por m ,
sino que nos referiremos a el como m + 1. En estos terminos, las propiedades
que denen a la suma se expresan as:
m + 0 = m,

m + (n + 1) = (m + n) + 1.

M
as en general, las condiciones del teorema de recursion se expresan como
sigue:
f (0) = a,
f (n + 1) = g(f (n)).
Denici
on 1.5 Para cada m N, denimos la aplicaci
on (m) : N N como
la u
nica que cumple
m 0 = 0,

m (n + 1) = m n + m,

donde hemos utilizado el teorema de recursi


on con la funci
on g : N N dada
por g(n) = n + m.
A partir de aqu, es pura rutina demostrar todas las propiedades conocidas
de la suma y el producto de n
umeros naturales. Veamos algunos ejemplos:
Propiedad asociativa de la suma: (m + n) + r = m + (n + r).
Lo probamos por inducci
on sobre r. Si r = 0 se reduce a
(m + n) + 0 = m + n = m + (n + 0).
Si vale para r, lo probamos para r + 1:
(m + n) + (r + 1) = ((m + n) + r) + 1 = (m + (n + r)) + 1
= m + ((n + r) + 1) = m + (n + (r + 1)),
donde hemos usado la denici
on de suma, la hip
otesis de induccion y dos veces
mas la denici
on de suma.
Propiedad conmutativa de la suma: m + n = n + m.
Dejamos como ejercicio probarlo para m = 0 y m = 1, es decir, probar por
inducci
on sobre n que 0 + n = n + 0 y que 1 + n = n + 1.
Ahora probamos el resultado general, tambien por inducci
on sobre n. Para
n = 0 es: uno de los casos que hemos dejado como ejercicio: m+0 = m = 0+m.
Si vale para n, tenemos
m+(n+1) = (m+n)+1 = (n+m)+1 = n+(m+1) = n+(1+m) = (n+1)+m,

16

Captulo 1. Preliminares conjuntistas

donde hemos usado la denici


on de suma, la hip
otesis de induccion, la denici
on
de suma, el caso que hemos dejado como ejercicio y la propiedad asociativa.
n de la suma: Si u + n = v + n, entonces u = v.
Simplificacio
Por inducci
on sobre n. Para n = 0 es u + 0 = v + 0, luego u = v. Si vale
para n, entonces, si u + (n + 1) = v + (n + 1), tambien (u + n) + 1 = (v + n) + 1,
luego u + n = v + n (por el cuarto axioma de Peano), luego u = v, por hip
otesis
de inducci
on.

1.3.2

Relaciones

Denici
on 1.6 Una relaci
on en un conjunto A es un conjunto R A A. En
lugar de escribir (a, b) R, escribiremos a R b y diremos que a est
a relacionado
con b (seg
un la relaci
on R)
Una relaci
on de orden (total) en un conjunto A es una relacion en A que
cumple las propiedades siguientes:
Reexiva a a.
Antisim
etrica Si a b y b a, entonces a = b.
Transitiva Si a b y b c, entonces a c.
De conexi
on a b o b a.
Si es una relacion de orden en un conjunto A, escribiremos a < b para
indicar a b y a = b. Escribiremos a b como equivalente a b a, as como
a > b como equivalente a b < a.
Un conjunto ordenado es un par (A, ), donde es una relacion de orden
en el conjunto A.
Teorema 1.7 La relaci
on en N dada por
m n si y s
olo si existe un r N tal que m + r = n
es una relaci
on de orden.
n: Las propiedades reexiva y transitiva son inmediatas.
Demostracio
Para probar la propiedad antisimetrica suponemos que m n y n m, de modo
que m+r = n y n+s = m, para ciertos r, s N. Entonces m+r+s = m = m+0.
Por la propiedad de simplicaci
on, r + s = 0. De aqu se sigue que s = 0, ya
que en caso contrario s = t + 1, con lo que r + t + 1 = 0, en contra del segundo
axioma de Peano. Por lo tanto, m = n + s = n + 0 = n.
La conexi
on la demostramos por inducci
on sobre a. Si a = 0 entonces 0 b,
ya que b = 0 + b. Si vale para a, entonces a b o b a. En el segundo caso
b a a + 1, luego b a + 1. En el primer caso tenemos que a + r = b, para
cierto r N. Si r = 0, entonces r = s + 1, luego a + 1 + s = b, lo que prueba que

1.3. Elementos de teora de conjuntos

17

a + 1 b. Si r = 0 tenemos que a = b, luego b b + 1 = a + 1. En cualquier


caso, tenemos la conexion.
En lo sucesivo consideraremos siempre a N como conjunto ordenado con la
relacion que acabamos de denir.
Denici
on 1.8 Si m n son dos n
umeros naturales, por denici
on existe un
r N tal que m + r = n. Por la propiedad de cancelaci
on, este r es u
nico, y lo
llamaremos r = n m.
Ejercicio: Demostrar que, si n N, no existe ning
un m N tal que n < m < n + 1.
Equivalentemente, si m < n + 1, entonces m n y si m < n, entonces m + 1 n.

Denici
on 1.9 Si (A, ) es un conjunto ordenado y B A, el mnimo de B
es un elemento m B tal que m b para todo b B. El m
aximo de B es un
elemento M B tal que b M para todo b B.
Un conjunto B A no tiene por que tener mnimo elemento, pero si lo
tiene es u
nico, ya que, si hubiera dos, digamos m y m , entonces tendra que
ser m m , porque m es mnimo, y m m, porque m es mnimo. Por la
antisimetra, sera m = m . Lo mismo sucede con el maximo.
Con la relaci
on de orden que hemos denido, el conjunto N de los n
umeros
naturales cumple la siguiente propiedad fundamental:
Teorema 1.10 (Principio de buena ordenaci
on) Todo subconjunto de N no
vaco tiene mnimo elemento.
n: Vamos a probar por inducci
Demostracio
on sobre n que todo subconjunto A N que contenga un n
umero n tiene un mnimo elemento. Si A
contiene un n
umero m 0, entonces ha de ser m = 0, porque 0 + m = m, luego
0 m, luego m = 0. Por el mismo motivo, 0 es menor o igual que todo n
umero
de A, luego 0 es el mnimo de A.
Supongamos que todo conjunto de n
umeros naturales que contenga un n
umero n tiene mnimo elemento y supongamos que A contiene un n
umero
a n + 1.
Distinguimos dos casos: si A no contiene ning
un n
umero menor que a, es que
a es el mnimo de A. En caso contrario, A contiene un elemento b < a n + 1,
luego b < n + 1, luego b n y, por hip
otesis de induccion, A tiene mnimo
elemento.
En particular, el mnimo de N es 0, y n + 1 es el menor natural mayor que n.
Por otra parte, N no tiene un m
aximo elemento, ya que todo n
umero natural n
es menor que n + 1.
Denici
on 1.11 Si (A, ) es un conjunto ordenado, diremos que un M A es
una cota superior de un conjunto B A si b M para todo b B (pero, al contrario que en la denici
on de m
aximo, no exigimos que M B). An
alogamente
se dene una cota inferior. Diremos que un conjunto B A esta acotado superior o inferiormente si tiene una cota superior o inferior.

18

Captulo 1. Preliminares conjuntistas

Teorema 1.12 Todo subconjunto de N no vaco acotado superiormente tiene


un m
aximo elemento.
n: Sea A N. Si A tiene una cota superior, el conjunto de
Demostracio
sus cotas superiores es un subconjunto de N no vaco, luego podemos considerar
la menor cota superior M de A. Vamos a probar que es el maximo de A. S
olo
hay que probar que M A. Si M
/ A, entonces todo a A cumple a < M .
Como A no es vaco, no puede ser M = 0, luego M = c + 1, para cierto c N.
Entonces, si a A, tenemos que a < c + 1, luego a c, luego c es una cota
superior de A, pero c < M , en contradicci
on con que M era la menor cota
posible. As pues, M A y M es el maximo de A.
Denici
on 1.13 Una relaci
on R en un conjunto A es una relaci
on de equivalencia si cumple las propiedades siguientes:
Reexiva a R a.
Sim
etrica Si a R b, entonces b R a.
Transitiva Si a R b y b R c, entonces a R c.
En estas condiciones, denimos la clase de equivalencia de un elemento a A
como el conjunto
[a] = {b A | a R b}.
El conjunto cociente de A sobre R es el conjunto A/R que contiene a todas
las clases de equivalencia de los elementos de A.
Ejercicio: Demostrar que, en las condiciones anteriores, a R b si y s
olo si [a] = [b],
mientras que no a R b si y s
olo si [a] [b] = .

1.3.3

Conjuntos nitos

Denici
on 1.14 Si n N es un n
umero natural, denimos
In = {m N | m < n}.
Un conjunto A es nito si existe un n
umero natural n y una aplicaci
on
biyectiva f : In A. En caso contrario es innito.
Observemos que, I0 = y, tecnicamente, : biyectiva, por lo que
es un conjunto nito. Si el lector juzga esto difcil de digerir, puede considerar
simplemente que es nito por denici
on.
Los conjuntos In son nitos, pues cumplen la denici
on con la aplicaci
on
identidad.
Otro hecho obvio es que, si existe una aplicaci
on biyectiva g : A B,
entonces A es nito si y solo si B es nito. En efecto, si existe una aplicaci
on
biyectiva f : In A, entonces f g : In B tambien es biyectiva.

1.3. Elementos de teora de conjuntos

19

Teorema 1.15 Un subconjunto de N es nito si y s


olo si est
a acotado superiormente.
n: Para incluir al conjunto vaco, hay que entender que este
Demostracio
esta trivialmente acotado. (De hecho, 0 es una cota superior.)
Si A N es nito, existe una aplicaci
on biyectiva f : In A. Vamos a
probar que A esta acotado por inducci
on sobre n. Si n = 0 entonces A = y,
como acabamos de decir, esta trivialmente acotado.
Supongamos que el teorema es cierto para n y pongamos que f : In+1 A
es biyectiva. Si a = f (n), entonces f se restringe a una aplicaci
on biyectiva
f  : In A \ {a}, luego A \ {a} esta acotado superiormente. Sea M N una
cota superior de A \ {a}, es decir, b M para todo b A que no sea b = a.
Si a M , entonces M es una cota superior de A. Si M a, entonces a es,
de hecho, el maximo de A.
Supongamos ahora que A esta acotado superiormente.Tambien podemos suponer que A = . Vamos a probar que es nito por inducci
on sobre una cota
superior.
Si A tiene a 0 por cota superior, entonces A = {0} = I1 , luego es nito.
Si es cierto para conjuntos acotados por n, supongamos que una cota superior
de A es n + 1. Si n es tambien una cota superior, entonces A es nito por
hip
otesis de induccion. En caso contrario es que n + 1 A. El conjunto
A \ {n + 1} tiene a n por cota superior, luego por hip
otesis de induccion es
nito. Sea f : Im A \ {n + 1} biyectiva. Entonces,
f {(m, n + 1)} : Im+1 A es biyectiva,
luego A es nito.
En particular, N es innito.
Teorema 1.16 Un conjunto A es nito si y s
olo si existe una aplicaci
on inyectiva A In , para cierto n N.
n: Si A es nito, existe una aplicaci
Demostracio
on biyectiva In A, y
su inversa es tambien biyectiva, en particular inyectiva.
Si existe una aplicaci
on A In inyectiva, podemos verla tambien como
una aplicaci
on biyectiva A B, donde B In . Como In es nito, B tambien
lo es, luego A tambien lo es.
Ejercicio: Demostrar que si A B es inyectiva y B es nito, entonces A es nito.

Teorema 1.17 Todo subconjunto de un conjunto nito es nito.


n: Sea A un conjunto nito y sea B A. Existe una apliDemostracio
cacion inyectiva A In que se restringe a otra aplicacion inyectiva B In ,
luego B es nito.
Ejercicio: Probar que un conjunto A es innito si y s
olo si existe una aplicaci
on
suprayectiva In A, para cierto n N.

20

Captulo 1. Preliminares conjuntistas

Teorema 1.18 Si m, n N y existe una aplicaci


on biyectiva Im In , entonces m = n.
n: Lo probamos por inducci
Demostracio
on sobre n. Si n = 0, entonces
In = , por lo que Im ha de ser tambien vaco, luego m = 0.
Supongamos el teorema cierto para n y supongamos que tenemos una aplicacion biyectiva f : Im In+1 . Claramente, m = 0, luego m = r + 1 si
f (r) = n, entonces f se restringe a una aplicaci
on biyectiva Ir In , luego
r = n, luego m = n + 1.
Si f (r) = n, consideramos los n
umeros f (r) = u = n y v = f 1 (n) = r. Es
f
acil ver que
(f \ {(r, u), (v, n)}) {(v, u)} : Ir In biyectiva,
luego nuevamente r = n y m = n + 1.
As pues, si A es un conjunto nito, existe un u
nico n N tal que existe una
aplicaci
on biyectiva f : In A, pues si g : Im A, entonces se cumple que
g f 1 : Im In es biyectiva, luego m = n.
Denici
on 1.19 Si A es un conjunto nito, llamaremos cardinal de A al u
nico
n N tal que existe una aplicaci
on biyectiva f : In A. Lo representaremos
por |A|.
El cardinal de un conjunto nito es lo que m
as habitualmente se llama su
n
umero de elementos. Claramente |A| = 0 si y solo si A = .
Si A = tiene n elementos, existe x : In A biyectiva. Si escribimos
xi = x(i 1), podemos representar A en la forma A = {x1 , . . . , xn }.
Teorema 1.20 Si A y B son conjuntos nitos, entonces A B es nito y
|A B| + |A B| = |A| + |B|.
n: Supongamos primeramente que AB = . Sean m = |A|,
Demostracio
n = |B|, de modo que existen f : A Im y g : B In son biyectivas.
Podemos denir una aplicaci
on biyectiva h : A B Im+n mediante

f (x)
si x A,
h(x) =
m + g(x) si x B.
Por consiguiente, |A B| = m + n = |A| + |B|.
En el caso general, sea B  = B \ (A B). Como B = B  (A B) y ambos
conjuntos son disjuntos, la parte ya probada nos da que |B| = |B  | + |A B|.
Por otra parte, A B = A B  y A B  = . De nuevo por la parte ya
probada, |A B| = |A| + |B  |. Sumando |A B| a ambos miembros tenemos la
f
ormula del enunciado.
Ejercicio: Probar que si A y B son conjuntos nitos, entonces A B tambien es
nito, y |A B| = |A||B|.

1.3. Elementos de teora de conjuntos

21

Teorema 1.21 Todo conjunto (totalmente) ordenado nito no vaco tiene un


m
aximo y un mnimo elemento.
n: Supongamos, por reducci
Demostracio
on al absurdo, que existe un conjunto ordenado no vaco sin m
aximo elemento. Sea n el mnimo cardinal posible
para un conjunto en tales condiciones. Esto signica que cualquier conjunto
ordenado con menos de n elementos tiene un maximo elemento.
Sea, pues A un conjunto de n elementos, no vaco y sin m
aximo. No puede
ser n = 0, as que n = m + 1. Tampoco puede ser n = 1, porque entonces
A = {a} y obviamente, tiene m
aximo. Por lo tanto, m = 0. Si a A, entonces
A \ {a} es un conjunto ordenado no vaco con m elementos, luego tiene un
maximo a . Si a a, entonces a es el maximo de A. Si a < a, entonces a es
el maximo de A. Igualmente se razona con los mnimos.
Si A es un conjunto ordenado nito, todo subconjunto de A tambien lo es,
luego, de hecho, todos los subconjuntos no vacos de A tienen maximo y mnimo
elemento. En particular, todo elemento que no sea el m
aximo tiene un inmediato
posterior (el mnimo de los elementos mayores que el), y todo elemento que no
sea el mnimo tiene un inmediato anterior.

1.3.4

Estructuras algebraicas y de orden

Denici
on 1.22 Una ley de composici
on interna en un conjunto A es una
aplicaci
on
: A A A.
En lugar de escribir (a, b), escribiremos a b. En denitiva, una ley de
composicion interna en A es cualquier forma de operar dos elementos de A para
obtener un nuevo elemento de A.
Por ejemplo, aunque, tecnicamente, hemos denido la suma y el producto
de n
umeros naturales como una familia de aplicaciones (m+) y (m), para cada
m N, es mas natural reunirlas en dos u
nicas leyes de composicion interna
+ : N N N,

: N N N.

Por denici
on, m + n = (m+)(n) y m n = (m)(n).
Denici
on 1.23 Un anillo conmutativo y unitario es una terna (A, +, ), donde
A es un conjunto y + : AA A, : AA A son dos leyes de composicion
interna en A que cumplen las propiedades siguientes:
Asociativa (a + b) + c = a + (b + c), (ab)c = a(bc).
Conmutativa a + b = b + a, ab = ba.
Distributiva a(b + c) = ab + ac.
Elemento neutro Existen 0, 1 A tales que a + 0 = a, a 1 = a.

22

Captulo 1. Preliminares conjuntistas

Elemento sim
etrico Para cada a A existe un elemento a A tal que
a + (a) = 0.
En lo sucesivo, siempre que hablemos de anillos se entendera que son anillos
conmutativos y unitarios.
Observemos que los elementos neutros 0 y 1 son u
nicos, pues si 0 y 0 son


neutros para la suma, entonces 0 = 0 + 0 = 0 , e igualmente con el producto.
Igualmente, el elemento simetrico ha de ser u
nico, pues si existe otro (a)

que cumple a + (a) = 0 = a + (a) , entonces
a = a + 0 = a + a + (a) = 0 + (a) = (a) .
En la pr
actica, escribiremos a b en lugar de a + (b).
Observemos que en cualquier anillo se cumple a 0 = 0, pues
a 0 = a (0 + 0) = a 0 + a 0
y, sumando (a 0) a ambos miembros, llegamos a que 0 = a 0.
Ejercicio: Demostrar que en cualquier anillo se cumple (a)b = a(b) = (ab),
(a)(b) = ab, (a + b) = a b.

Denici
on 1.24 Si A es un anillo, un ideal de A es un subconjunto I A con
las propiedades siguientes:
a) 0 I.
b) Si a, b I, entonces a + b I.
c) Si a I y b A, entonces ab I.
En tal caso, denimos en A la relacion a b (mod I) dada por a b I.
Se dice que a y b son congruentes modulo el ideal I.
Teorema 1.25 Sea A un anillo e I un ideal de A.
a) La congruencia en A m
odulo I es una relaci
on de equivalencia.
b) Si a a (mod I) y b b (mod I), entonces a + b a + b (mod I) y
ab a b (mod I).
n: a) Se cumple a a (mod I) porque a a = 0 I.
Demostracio
Si a b (mod I), entonces a b I, luego (1)(a b) = b a I, luego
b a (mod I).
Si a b (mod I) y b c (mod I), entonces a b I y b c I. La suma
tambien esta en I, y es a c I, luego a c (mod I).
b) Sea a = a + i, b = b + j, con i, j I. Entonces a + b = b + b + i + j,
ltimos productos est
an en
con i + j I, y ab = a b + a j + ib + ij, y los tres u
I, luego su suma tambien. Por lo tanto tenemos que a + b a + b (mod I) y
ab a b (mod I).

1.3. Elementos de teora de conjuntos

23

Denici
on 1.26 Si A es un anillo e I es un ideal de A, representaremos por
A/I el conjunto cociente de A respecto a la relacion de congruencia m
odulo I.
El teorema anterior prueba que podemos denir una suma y un producto en
A/I mediante
[a] + [b] = [a + b], [a][b] = [ab].
El punto crucial es que estas deniciones no dependen del elemento de la clase
de equivalencia con el que hacemos las operaciones, es decir, que si [a] = [a ]
y [b] = [b ], llegamos a la misma clase si calculamos [a + b] que si calculamos
[a + b ], e igualmente con el producto.
Es inmediato comprobar que estas operaciones convierten a A/I en un anillo,
el llamado anillo cociente de A sobre I.
Ejercicio: Demostrar, mediante los oportunos razonamientos inductivos, que N cumple todas las propiedades de la denici
on de anillo excepto la existencia de elementos
simetricos.

Al a
nadir un elemento simetrico a cada n
umero natural obtenemos el anillo
de los n
umeros enteros. Veamos como hacerlo:
Denici
on 1.27 Denimos en N N la relaci
on dada por
(m, n) R (m , n ) si y solo si m + n = n + m .
Si pudieramos restar dos n
umeros naturales cualesquiera, esta relacion podra
escribirse as:
m n = m n .
Vemos as que el signicado de la relaci
on R es que dos pares de n
umeros
estan relacionados si y s
olo si deberan tener la misma resta.
Ejercicio: Demostrar que la relaci
on R que acabamos de denir es de equivalencia.

Llamaremos conjunto de los n


umeros enteros al conjunto cociente
Z = (N N)/R.
Ejercicio: Demostrar que si (m, n) R (m , n ) y (u, v) R (u , v  ), entonces
(m + u, n + v) R (m + u , n + v  ),

(mu + nv, mv + nu) R (m u + n v  , m v  + n u )

as como que
m+v n+u

si y s
olo si

m + v  n + u .

El ejercicio anterior nos permite denir en Z las operaciones


[(m, n)] + [(u, v)] = [(m + u, n + v)],

[(m, n)][(u, v)] = [(mu + nv, mv + nu)],

as como la relacion
[(m, n)] [(u, v)]

si y solo si

m + v n + u.

24

Captulo 1. Preliminares conjuntistas

La interpretaci
on es que si imaginamos que [(m, n)] representa a la resta
m n y [(u, v)] representa a la resta u v, entonces su suma debe ser
m n + u v = (m + u) (n + v),
y su producto debe ser
(m n)(u v) = mu + nv mv nu = (mu + nv) (mv + nu)
y estas dos restas se corresponden con las clases de pares que hemos denido
como suma y producto de las clases dadas.
Igualmente, m n u v debe ser equivalente a m + v n + u.
Ejercicio: Demostrar que Z es un anillo con las operaciones que acabamos de denir.
Los elementos neutros son 0 = [(0, 0)], 1 = [(1, 0)]. Los elementos simetricos son
[(m, n)] = [(n, m)].
Ejercicio: Demostrar que la relaci
on que hemos denido en Z es una relaci
on de
orden.

Para cada n N, denimos los n


umeros enteros +n = [(n, 0)], n = [(0, n)].
Si [(m, n)] es un n
umero entero arbitrario, vemos que, si m n, entonces
[(m, n)] = [(m n, 0)] = +(m n),
mientras que si m n entonces
[(m, n)] = [(0, n m)] = (n m).
Ademas, +0 = [(0, 0)] = 0 es el elemento neutro 0 Z. Por consiguiente,
si llamamos Z+ = {+n | n N, n = 0} y Z = {n | n N, n = 0}, se cumple
Z = Z {0} Z+ .
Es inmediato comprobar que la aplicaci
on i : N Z dada por i(n) = +n
es inyectiva y cumple:
i(m + n) = i(m) + i(n),
mn

si y solo si

i(mn) = i(m)i(n),
i(m) i(n).

Esto signica que podemos identicar cada n


umero natural n con el n
umero
entero +n, de forma que la suma, el producto y la relaci
on de orden entre
n
umeros naturales se calculan igual si los consideramos como naturales o como
enteros. Por ello, a partir de este momento consideraremos que N Z.
Observemos que, si n N, entonces n es el elemento simetrico de n en Z,
de modo que Z consta u
nicamente de los n
umeros naturales y de sus simetricos
(teniendo en cuenta que, en el caso de 0 (y s
olo en este caso), se cumple 0 = 0).
Ejercicio: Demostrar que N = {n Z | n 0}.

1.3. Elementos de teora de conjuntos

25

El anillo Z cumple una propiedad que no exige la denici


on de anillo, a
saber, que si mn = 0, entonces m = 0 o n = 0.
En efecto, observemos en primer lugar que esto lo cumplen los n
umeros
naturales, ya que si m = 0 y n = 0, entonces m = r + 1, luego mn = rr + n,
luego mn n > 0.
En general, si mn = 0, tambien mn = m(n) = 0 y (m)(n) = 0, y
una de estas cuatro combinaciones corresponde a n
umeros naturales, luego ha
de ser m = 0 o n = 0, lo cual implica m = 0 o n = 0.
Denici
on 1.28 Un anillo ordenado es una cuadrupla (A, +, , ) que cumple la denici
on de anillo y la denici
on de conjunto (totalmente) ordenado, y
ademas la relacion de orden verica las dos propiedades siguientes de compatibilidad:
Compatibilidad con la suma Si a b, entonces a + c b + c.
Compatibilidad con el producto Si a b y c 0, entonces ac bc.
Para probar que (Z, +, , ) es un anillo ordenado conviene observar que si
a = [(m, n)] y b = [(u, v)], entonces
b a = [(u, v)] + [(n, m)] = [(n + u, m + v)]
luego b a 0 equivale a que m + v n + u, es decir, a que a b.
As pues, si a b, tenemos que b a = b + c (a + c) 0, luego a + c b + c.
Igualmente, si a b y c 0, tenemos que b a 0 y c 0, es decir, que
ambos son n
umeros naturales, y tambien lo sera su producto bc ac 0, lo que
equivale a ac bc.
Veamos algunas propiedades de los anillos ordenados:
a) Si a b, entonces b a (pues 0 = aa ba y b b+ba = a).
b) Si a 0, entonces a 0. (Caso particular de a.)
c) Si b, c 0, entonces bc 0 (por la compatibilidad del producto).
d) aa 0 (porque aa = (a)(a) y a una de las dos expresiones se le puede
aplicar b).
e) 1 0 y 1 0. (porque 1 = 1 1).
f) Si a b y c 0 entonces ac bc (porque ac bc).
Denici
on 1.29 Un elemento a de un anillo A es una unidad si existe un
a1 A tal que aa1 = 1. El elemento a1 se llama inverso de a, y es u
nico,
pues si existe otro a1 , entonces a1 = a1 1 = a1 aa1 = 1 a1 = a1 .
Un cuerpo es un anillo en el que todo elemento distinto de 0 es una unidad.

26

Captulo 1. Preliminares conjuntistas

Ejercicio: Demostrar que las u


nicas unidades de Z son 1.

Para dotar de inverso a cada n


umero entero construimos el cuerpo de los
n
umeros racionales por un procedimiento similar al que hemos seguido para
construir Z a partir de N.
Denici
on 1.30 Sea A = {(m, n) Z Z | n = 0}. Denimos en A la relaci
on
(m, n) R (m , n )

si y solo si

mn = nm .

Se demuestra f
acilmente que se trata de una relacion de equivalencia. La
clase de equivalencia de un par (m, n) se representa por m/n. Diremos que es
una fracci
on de numerador m y denominador n. De este modo tenemos que
m
m
= 
n
n

si y solo si

mn = nm .

El conjunto cociente Q = A/R se llama conjunto de los n


umeros racionales.
Denimos en Q las operaciones
m u
mv + nu
+ =
,
n
v
nv

mu
mu
=
n v
nv

Como el denominador de una fracci


on no puede ser 0, aqu estamos usando
que el producto de n
umeros enteros no nulos es no nulo.
Ejercicio: Comprobar que estas deniciones son correctas, en el sentido de que, si
tomamos dos representantes distintos de cada fracci
on, m/n = m /n y u/v = u /v  ,
las fracciones que obtenemos al sumar y multiplicar son la misma.
Ejercicio: Comprobar que (Q, +, ) es un cuerpo. Los elementos neutros son 0/1 y
1/1, los simetricos son (m/n) = (m)/n, y los inversos (m/n)1 = n/m.

Observemos que de la denici


on de las fracciones se sigue que
am
m
= .
an
n
En particular, para a = 1, esto implica que podemos cambiar el signo al
numerador y el denominador de una fracci
on, por lo que
Q = {m/n | m Z, n N, n = 0}.
En otras palabras: no perdemos generalidad si suponemos que el denominador de una fracci
on es positivo.
Denici
on 1.31 Denimos en Q la relacion dada por
m
u

n
v

si y solo si

mv nu

(donde n, v > 0).

1.3. Elementos de teora de conjuntos

27

Ejercicio: Demostrar que la relaci


on que acabamos de denir es correcta, en el sentido
de que no depende del representante de cada fracci
on con que la comprobamos.
Ejercicio: Demostrar que, con esta relaci
on (Q, +, , ) es un cuerpo ordenado, es
decir, un cuerpo que verica las propiedades de anillo ordenado.

Consideramos ahora la aplicaci


on i : Z Q dada por i(n) = n/1. Se
comprueba sin dicultad que es inyectiva, y adem
as cumple:
i(m + n) = i(m) + i(n),
mn

si y solo si

i(mn) = i(m)i(n),
i(m) i(n).

Una vez mas, esto signica que podemos identicar a cada n


umero entero
con su imagen en Q, de modo que las propiedades de los n
umeros enteros son
las mismas cuando los consideramos como n
umeros enteros o como n
umeros
racionales. As pues, a partir de ahora consideraremos que N Z Q.
Observemos que
m
m1
m  n 1
=
=
= i(m)i(n)1 = mn1 ,
n
1 n
1 1
donde en el u
ltimo paso hemos usado la identicaci
on que acabamos de establecer. Esto signica que, a partir de ahora, podemos olvidarnos de que las
fracciones son clases de equivalencia de pares de n
umeros enteros y considerar
que m/n = mn1 , donde el producto y el inverso del miembro derecho son las
operaciones de Q. M
as a
un, si K es un cuerpo arbitrario, usaremos la notaci
on
a/b = ab1 , para todo a, b K, b = 0. En particular, en el caso de Q podemos
considerar fracciones con numerador y denominador fraccionario:
m/n
mv
m  u 1
mv
=
=
=
.
u/v
n v
nu
nu

1.3.5

Elementos de aritm
etica

Terminamos esta seccion discutiendo algunos resultados variados sobre la


aritmetica de los anillos y los cuerpos en general y de los conjuntos numericos
en particular.
En primer lugar observamos que si A es un anillo y a A, podemos denir
una aplicaci
on N A mediante el teorema de recursion, estableciendo que
0a = 0,

(n + 1)a = na + a.

A su vez, podemos extenderla a una aplicaci


on Z A mediante
(n)a = (na),

para todo n N.

Hemos denido una aplicaci


on para cada a A, pero podemos unirlas todas
en una u
nica aplicaci
on Z A A.

28

Captulo 1. Preliminares conjuntistas

Ejercicio: Demostrar que


0a = 0,

(1)a = a,

(m + n)a = ma + na,

(mn)a = m(na).

Por ejemplo, 3a = (1+1+1)a = a+a+a. Notemos que si A = Z el producto


que acabamos de denir no es sino el producto usual en Z.
Similarmente, para cada a A podemos denir una aplicaci
on N A
mediante a0 = 1, an+1 = an a. Si a es una unidad de A, podemos extender
esta aplicacion a otra Z A mediante an = (a1 )n . Observemos que a1
en este sentido resulta ser a1 en el sentido del inverso de a.
Ejercicio: Demostrar que am+n = am an , (am )n = amn , donde m, n N si a no es
una unidad, o m, n Z si lo es. En este u
ltimo caso tenemos tambien que an = 1/an
m
n
mn
y a /a = a
.

Denimos ahora la aplicaci


on factorial N N del modo siguiente:
0! = 1,

(n + 1)! = n!(n + 1).

As, por ejemplo,


1! = 0! 1 = 1,

2! = 1! 2 = 1 2 = 2,

3! = 2! 3 = 1 2 3 = 6.

Si 0 m n denimos el n
umero combinatorio
 
n
n!
=
m
m! (n m)!
Teorema 1.32 Sean m n n
umeros naturales.
n  n 
a) m = nm .
   
 n
b) n0 = nn = 1,
1 = n.
 n   n   n+1 
c) Si m < n, m
+ m+1 = m+1 .
d) Los n
umeros combinatorios son n
umeros naturales.
n: c) Hay que probar que
Demostracio
n!
n!
(n + 1)!
+
=
.
m! (n m)! (m + 1)! (n m 1)!
(m + 1)! (n m)!
Ahora bien,


n!
n!
+
m! (n m)! (m + 1)! (n m 1)!


(m + 1)! (n m)!

n! (m + 1) m! (n m)! n! (m + 1)! (n m)(n m 1)!


+
m! (n m)!
(m + 1)! (n m 1)!

= n! (m + 1) + n! (n m) = m n! + n! + n n! m n! = (n + 1) n! = (n + 1)!

1.3. Elementos de teora de conjuntos

29

n
d) Una simple inducci
on nos da que m
es un n
umero natural, pues cada
n
umero combinatorio con n + 1 es suma de dos con n, por el apartado c).
La forma m
as f
acil de calcular los n
umeros combinatorios es disponerlos en
forma de tri
angulo, de modo que cada uno es la suma de los dos que hay sobre
el. El tri
angulo as construido se suele llamar tri
angulo de Tartaglia.
1
1
1
1
1
1

1
2

3
4

1
3

6
10

4
10

1
5

Tri
angulo de Tartaglia
Enunciamos sin demostraci
on el resultado principal sobre los n
umeros combinatorios:
Teorema 1.33 (Binomio de Newton) Sea A un anillo, n N y a, b A.
Entonces
n  

n m nm
(a + b)n =
a b
.
m
m=0

Quiz
a alg
un lector objete que no hemos denido el signo . Las sumas
nitas en un anillo A se denen recurrentemente. Consideremos una aplicacion
a : In+1 A. Convenimos en representar a(i) = ai . Por comodidad, la
extendemos a una aplicaci
on N A tomando ai = 0 para i > n. Entonces
denimos, en virtud del teorema de recursi
on:
0

ai = a0 ,

i=0

Es frecuente escribir

r+1

i=0

ai =

ai + ar+1 .

i=0

ai = a0 + + an ,

i=0

y entonces hemos de tener presente que los puntos suspensivos son solo el signo
que hemos elegido para representar la suma nita, tan legtimo como pueda
serlo la letra . Todas las propiedades de las sumas nitas se demuestran
rutinariamente por inducci
on. Igualmente pueden denirse productos nitos en
un anillo, que habitualmente se representan por
n

ai = a0 an .

i=0

Por u
ltimo mencionaremos un hecho de uso cotidiano sobre la aritmetica de
los n
umeros naturales sobre el que no hemos dicho nada hasta ahora, y es la
posibilidad de expresarlos con la notaci
on decimal.

30

Captulo 1. Preliminares conjuntistas


Si denimos
2 = 1 + 1,
6 = 5 + 1,

3 = 2 + 1,

7 = 6 + 1,

4 = 3 + 1,

8 = 7 + 1,

5 = 4 + 1,

9 = 8 + 1,

d = 9 + 1,

entonces se demuestra que todo n


umero natural no nulo N se expresa de forma
u
nica como
N = an dn + an1 dn1 + + a2 d2 + a1 d + a0 ,
donde n N, ai {0, . . . , 9}, an = 0.
Esto permite adoptar el convenio de referirnos a N como N = an a0 ,
donde esto no hay que entenderlo como un producto, sino como la mera yuxtaposicion de las cifras ai . Como el n
umero d se expresa en la forma d = 1 d + 0,
tenemos que d = 10, por lo que el desarrollo anterior puede escribirse, m
as
claramente, como
N = an (10)n + an1 (10)n1 + + a2 (10)2 + a1 10 + a0 ,
La eleccion de d es arbitraria. Sirve cualquier n
umero natural d 2.

1.4

La teora de conjuntos no est


andar

La seccion precedente es un resumen de los resultados basicos de lo que podemos llamar matem
atica cl
asica. Tal y como hemos visto, hemos partido de
dos conceptos fundamentales: la noci
on de conjunto interno, y la de pertenencia
entre conjuntos internos. A partir de estas dos nociones hemos denido muchas
otras, como las de uni
on, interseccion, aplicaci
on, anillo, etc. Todos los conceptos que pueden denirse a partir de los dos conceptos b
asicos de conjunto
interno y pertenencia son lo que hemos llamado conceptos internos. Todas
las armaciones y propiedades que hagan referencia u
nicamente a conceptos
internos, son lo que hemos llamado armaciones y propiedades internas.
Observemos que en ning
un momento hemos denido que son los conjuntos
internos ni la pertenencia entre conjuntos internos. Para poder decir algo sobre
estos conceptos sin tenerlos denidos, nos hemos tenido que apoyar en unos axiomas, que son armaciones internas. Cuando hablamos de matem
atica cl
asica
nos referimos, mas concretamente, a todo el cuerpo de armaciones internas que
pueden deducirse a partir de estos axiomas.5
En esta seccion vamos a extender la matematica clasica, no solo a
nadiendole
nuevos axiomas, sino tambien una nueva noci
on fundamental que presentaremos
sin denici
on, y que tendr
a, pues, el mismo status l
ogico que las nociones de
5 Aqu
hay que ser m
as precisos: nos referimos a los axiomas de la teora de conjuntos,

digamos ZFC. Esta


incluye unos pocos axiomas m
as que nosotros no hemos tenido necesidad
de citar, como el axioma de reemplazo o el axioma de elecci
on. Tambien consideraremos parte
de la matem
atica cl
asica cualquier resultado que se demuestre a partir de otros axiomas que
se a
nadan a ZFC, como puede ser la hip
otesis del continuo, siempre y cuando estos nuevos
axiomas sean armaciones internas, es decir, no contengan ning
un concepto que no haya sido
denido previamente a partir de las meras nociones de conjunto interno y pertenencia.

1.4. La teora de conjuntos no est


andar

31

conjunto interno y pertenencia. Las armaciones matem


aticas que se deducen de esta version extendida de la matem
atica clasica (extendida con un nuevo
concepto b
asico y con nuevos axiomas) formar
an lo que llamaremos matem
atica
no est
andar o teora de conjuntos no est
andar.
Al nuevo concepto b
asico lo llamaremos ser est
andar, de modo que a partir
de ahora distinguiremos entre dos clases de conjuntos internos: los conjuntos
internos est
andar y los conjuntos internos no est
andar. Tal y como hemos dicho,
no deniremos que es un conjunto interno est
andar, igual que no hemos denido
que es un conjunto interno. Ser
an los nuevos axiomas que vamos a incorporar a
la teora los que nos permitir
an distinguir que conjuntos internos son est
andar
y cu
ales no, as como las diferencias que puedan darse entre unos y otros.
Para que el lector se forme una idea lo m
as operativa posible del papel que
representar
a este concepto en la nueva teora, conviene volver a la met
afora
cinematograca. Podemos considerar que el equivalente cinematogr
aco de no
estandar es efectos especiales. Por ejemplo, si en una pelcula un actor
besa a una actriz, el beso es estandar, porque se lo da realmente; pero si el
actor mata a la actriz, el asesinato es no estandar, porque est
a simulado con
una pistola cticia y una sangre cticia. El beso es real internamente en la
pelcula y externamente, en la realidad externa, mientras que el asesinato es
real internamente en la pelcula y cticio en la realidad externa.
En la triloga (cinematogr
aca) El se
nor de los anillos, el personaje de Frodo
Bols
on es estandar, porque lo interpreta un actor, mientras que Gollum es no
estandar, porque es una imagen creada por ordenador. Aqu es crucial entender
que internamente no hay diferencia entre est
andar y no est
andar. En la pelcula,
Frodo Bols
on es un personaje real y Gollum es otro personaje igual de real. S
olo
externamente podemos decir que Frodo existe y Gollum no.
Ahora bien, el lector no debe deducir de este ejemplo que estemos insinuando
que los conjuntos est
andar van a ser conjuntos que existen en la realidad y que
los conjuntos no est
andar van a ser conjuntos que no existen realmente. Pensemos que los efectos especiales no tienen por que ser fantasticos. Por ejemplo,
en una pelcula sobre Julio Cesar, la muerte de Cesar sera no estandar, pero
eso no impide que, en la realidad, Julio Cesar muriera como se muestra en la
pelcula. El actor que interpreta a Cesar esta reproduciendo elmente, mediante
tecnicas no estandar, lo que le ocurri
o realmente a Julio Cesar. Fijemonos en
que la realidad interna de la pelcula es el a la realidad hist
orica, mientras que
la realidad externa no lo es, ya que Cesar muri
o acuchillado, no ngi
o morir
acuchillado con efectos especiales.
Dijimos al principio del captulo que no pretendemos persuadir al lector para
que adopte ninguna postura en concreto sobre si existen o no los objetos de los
que hablamos. S
olo hay algo cuya realidad es indiscutible: y es que cuando
leemos un libro de matematicas estamos viendo una pelcula que esta ah, con
sus personajes y sus tecnicas, y podemos preocuparnos por entender la realidad
interna que describe o no, sin que importe para nada la naturaleza los
oca de
esa realidad interna. Sobre eso, cada cual es libre de pensar lo que quiera.
El lector que sea platonista (es decir, que crea que todos los conjuntos de los

32

Captulo 1. Preliminares conjuntistas

que vamos a hablar, est


andar y no est
andar, son reales) deber
a pensar que aqu
le vamos a hablar de c
omo rodar una pelcula sobre todos esos objetos reales pero
usando solamente una parte de ellos (los estandar) y usando efectos especiales
para simular los no est
andar. Algo as como cuando se quiere presentar en el
cine un gran ejercito (real) y se usan solo unos pocos actores para los primeros
planos, mientras que los otros miles se simulan por efectos especiales.
El lector que sea formalista (es decir, que crea que todo lo que estamos
contando es un argumento de cci
on) deber
a pensar que le estamos hablando
sobre una pelcula que trata sobre el rodaje de otra pelcula, de modo que,
dentro de la cci
on que es la primera pelcula, tiene sentido hablar de lo que es
real en la segunda pelcula y lo que se consigue mediante efectos especiales.
Si un lector preere pensar que los conjuntos est
andar existen y los no
estandar no, entonces s
olo tiene que concebir a estos como efectos especiales
(como maquetas, imagenes por ordenador, sangre simulada, etc.)
La mera introducci
on de la nueva noci
on fundamental ser est
andar ya da
pie a una denici
on importante:
Denici
on 1.34 Un concepto (o propiedad, o armaci
on, construcci
on, etc.)
es interno si solo hace referencia a conceptos denidos a partir de las nociones de
conjunto interno y la pertenencia entre conjuntos internos, es decir, si en ning
un
momento requiere distinguir entre conjuntos est
andar y no est
andar. En caso
contrario diremos que es externo.
As, por ejemplo, la armaci
on 5 es un n
umero natural es interna, mientras
que la armaci
on 5 es un n
umero est
andar es externa.
Para entender esto adecuadamente podemos pensar en un matematico
clasico como un matematico ideal que sabe y entiende todo lo que puede demostrarse en la matematica clasica, pero que es incapaz de entender cualquier
armaci
on que incluya la palabra est
andar, es decir, cualquier armaci
on externa. Cuando decimos que no puede entenderla no queremos decir que la tenga
por falsa, sino que para el no signica nada. En estos terminos, una armaci
on
interna es una armaci
on que entiende un matem
atico clasico.
Podemos comparar un matematico clasico con un espectador que ve una
pelcula y entiende perfectamente su argumento, pero no sabe nada de cine, no
sabe nada sobre camaras y efectos especiales. Tal espectador puede entender
que Gollum es feo, que es esquizofrenico, que es muchas cosas, pero no puede
entender que sea un efecto especial. En la pelcula, internamente, Gollum no
es un efecto especial. Es un personaje tan real como cualquier otro. No es que
el espectador niegue que Gollum sea un efecto especial, sino que eso no tiene
signicado para el, no es ni verdadero ni falso. El espectador podr
a discutir sobre
si Gollum es bueno o malo, pero nunca sobre si es real o virtual. Igualmente, el
matematico clasico podr
a discutir si 5 es par o impar, pero nunca si es est
andar
o no estandar.
Ya hemos explicado que la teora de conjuntos no est
andar sale de a
nadir
nuevos axiomas (y un nuevo concepto b
asico) a la teora de conjuntos est
andar,
lo cual tiene como consecuencia lo que podemos llamar principio de extensi
on:

1.4. La teora de conjuntos no est


andar

33

Principio de extensi
on Todas las armaciones de la matem
atica cl
asica
siguen siendo v
alidas igualmente en la matem
atica no est
andar, sin cambio
alguno.
Si un espectador ve una pelcula de romanos y luego se entera de que el
ejercito de miles de soldados se rodo con solo cien, tiene una informaci
on adicional externa sobre la pelcula, pero eso no cambia su realidad interna. Si era
l
ogico que Cesar ganara la batalla porque duplicaba en n
umero a sus enemigos,
sera absurdo que el espectador, al enterarse del truco, se dijera: pues no es
creble que Cesar haya ganado si tenemos en cuenta que sus miles de soldados
eran solo una apariencia. Si antes de enterarse del truco vea coherente que el
abrumador ejercito de Cesar venciera a su enemigo, despues ha de tener claro
que el saber que la escena ha sido rodada con efectos especiales no disminuye
un apice el podero militar (interno) de Cesar.
Del mismo modo, todas las precisiones que nos permitira hacer la distinci
on
entre conjuntos est
andar y no est
andar no pueden alterar en nada los resultados
de la matematica clasica, porque estamos aceptando todos sus axiomas y, por
consiguiente, todas sus consecuencias.
Si, en alg
un momento, el lector cree que algo de lo que vamos a exponer
de aqu en adelante contradice a lo hemos dicho hasta la seccion anterior, o a
cualquier otro resultado de la matem
atica clasica que el conozca, puede estar
seguro de que no ha entendido bien lo que ha ledo aqu, y si llega el por
sus propios razonamientos a un resultado de tales caractersticas, puede estar
seguro de que, o bien no entiende adecuadamente lo que ha obtenido, o bien ha
razonado incorrectamente, de modo que en alg
un paso de su razonamiento ha
utilizado algo que no se puede deducir legtimamente de los axiomas de la teora
de conjuntos no est
andar.
La teora de conjuntos no est
andar necesita tres axiomas adicionales. Veamos
el primero:
Principio de Transferencia Sean y1 , . . . , yn conjuntos internos, y consideremos una propiedad interna P (x1 , . . . , xm , y1 , . . . , yn ). Entonces:
a) Si todos los conjuntos est
andar x1 , . . . , xm cumplen
P (x1 , . . . , xm , y1 , . . . , yn ),
podemos asegurar que todos los conjuntos internos (est
andar o no) cumplen P .
b) Si existen conjuntos internos x1 , . . . , xn que cumplen
P (x1 , . . . , xm , y1 , . . . , yn ),
entonces existen conjuntos est
andar x1 , . . . , xn que cumplen P .
Como primera consecuencia de este principio, podemos probar que todos los
conjuntos denibles internamente son est
andar.

34

Captulo 1. Preliminares conjuntistas

Tomemos, por ejemplo, el conjunto vaco. Sabemos que es un concepto


propio de la matem
atica clasica, que puede denirse sin la ayuda del predicado
ser estandar. As pues, la propiedad P (x) x = es interna. Como sabemos
que existe un conjunto interno x que cumple x = , el principio de transferencia
nos da que existe un conjunto est
andar x que cumple x = . Esto signica que
es un conjunto est
andar.
Si cambiamos x = por x = N concluimos que el conjunto N es estandar, si
partimos de x = 1 356 concluimos que el n
umero natural 1 356 es estandar, etc.
M
as a
un, la propiedad x = y z tambien es interna. Por lo tanto, si jamos
dos conjuntos est
andar y, z, puesto que existe un conjunto interno x que cumple
x = y z, el principio de transferencia nos da que existe un conjunto est
andar
x que cumple x = y z. En otras palabras: la uni
on de conjuntos est
andar es
un conjunto est
andar.
Si cambiamos x = y z por x = y z concluimos que la intersecci
on
de conjuntos est
andar es est
andar; si tomamos x = {y, z} concluimos que el
conjunto formado por dos conjuntos est
andar es est
andar; si tomamos x = y z
concluimos que el producto cartesiano de dos conjuntos est
andar es est
andar; si
partimos de x = f (y) (que es una propiedad interna con tres variables, x, y, f )
concluimos que la imagen de un conjunto est
andar por una funci
on est
andar es
un conjunto est
andar, etc.
En resumen:
Todo conjunto interno que pueda denir explcitamente un matem
atico
cl
asico (como N, {3, 5, 7}, 2/7, , etc.) es est
andar.
Todo conjunto interno construido a partir de conjuntos est
andar mediante
un procedimiento que entienda un matem
atico cl
asico es est
andar. (Por
ejemplo: la uni
on de conjuntos est
andar es est
andar, la suma de n
umeros
naturales est
andar es est
andar, el conjunto de todos los subconjuntos de
un conjunto est
andar es est
andar, el cubo de un n
umero racional est
andar
es est
andar, etc.)
Si el lector quiere sentirse comodo con la teora de conjuntos no est
andar,
no le conviene interpretar esto como que los conjuntos est
andar son los que ya
conoce, mientras que los conjuntos no estandar son conjuntos nuevos que no
existen en la matematica clasica. Es mucho mas conveniente que piense que la
diferencia entre la matematica no estandar y la matem
atica clasica no es que
la primera introduzca nuevos conjuntos, los conjuntos no est
andar, sino que los
conjuntos de la matem
atica clasica son los mismos que los de la matematica no
estandar (los conjuntos internos, est
andar y no est
andar) y que lo novedoso de
la matematica no estandar es la posibilidad de distinguir unos de otros.
Es verdad que, dado que no los distingue, la matem
atica clasica podra prescindir de los conjuntos no est
andar, en el mismo sentido que te
oricamente
una pelcula de romanos podra prescindir de efectos especiales y rodar todo de
forma realista (reuniendo miles de hombres cuando se necesita un ejercito de

1.4. La teora de conjuntos no est


andar

35

miles de hombres y matando de verdad a los actores cuando el gui


on exige que
mueran). Pero no es menos cierto que, aunque podra prescindir de ellos, nada
impide suponer que los conjuntos no est
andar siempre han estado ah, pasando
inadvertidos a los matem
aticos clasicos, igual que el caracter virtual de unos miles de soldados puede pasar inadvertido a un espectador. La ventaja de pensarlo
as es que el lector asimilara mas facilmente el principio de extensi
on y vacilar
a
menos a la hora de aplicar en el contexto no est
andar todos sus conocimientos
de matematica clasica.
Volviendo al principio de transferencia, ya hemos visto una aplicaci
on de
su segunda parte. La primera es u
til para reducir razonamientos al caso de
conjuntos est
andar. Por ejemplo, supongamos que tenemos que probar que un
conjunto est
andar A esta contenido en otro conjunto est
andar B. Esto supone
probar que, para todo conjunto x, se cumple que x A x B. Dado
que la propiedad entre comillas es interna, el principio de transferencia reduce
el problema a demostrar que si un conjunto est
andar x esta en A, entonces
tambien esta en B. As pues:
Teorema 1.35 Sean A y B dos conjuntos est
andar. Entonces:
a) A B si y s
olo si todo elemento est
andar de A est
a tambien en B.
b) A = B si y s
olo si A y B contienen los mismos elementos est
andar.
Respecto al apartado b), observemos que como en la matematica clasica
dos conjuntos internos se consideran iguales cuando tienen los mismos elementos
(estandar o no). Lo que estamos diciendo (en virtud del principio de transferencia) es que si dos conjuntos estandar tienen los mismos elementos estandar,
entonces tambien tienen los mismos elementos no estandar.
Nos aparece aqu una idea a la que el lector deber
a acostumbrarse cuanto
antes: los conjuntos no est
andar son como par
asitos, no son algo que pueda
meterse o sacarse de un conjunto interno a voluntad, sino que se pegan a los
conjuntos est
andar y van donde vayan ellos.
El apartado b) puede parafrasearse diciendo que un conjunto est
andar est
a
completamente determinado por sus elementos estandar, de modo que los elementos estandar que tiene un conjunto determinan autom
aticamente cuales han
de ser sus elementos no estandar.
Ejercicio: Supongamos que x es un conjunto interno no est
andar. Puede ser {x}
un conjunto est
andar? (Ayuda: Llegar a una contradicci
on probando que {x} = .)

Para terminar con el principio de transferencia se


nalamos dos aspectos tecnicos que pueden llevar a conclusiones contradictorias si se pasan por alto:
Si la propiedad P a la que se aplica tiene par
ametros, estos han de ser
conjuntos est
andar.
La propiedad P ha de ser interna, es decir, ha de poder entenderla un
matem
atico cl
asico.

36

Captulo 1. Preliminares conjuntistas

Hasta ahora no hemos visto nada que garantice la existencia de conjuntos


no estandar. Esto es lo que arma el segundo principio de la teora no estandar,
al que llamaremos Principio de Idealizaci
on. Vamos a dar una versi
on debil
consistente en dos propiedades sobre conjuntos nitos. Ambas pueden deducirse
de un principio m
as general, mas tecnico, que no vamos a necesitar.6 La primera
es la siguiente:
Principio de Idealizaci
on I Un conjunto interno es est
andar y nito si y
s
olo si todos sus elementos son est
andar.
O, recprocamente: todos los conjuntos internos tienen elementos no est
andar
excepto los que son estandar y nitos. En particular, existen, por ejemplo,
n
umeros naturales no estandar.
Por coherencia enunciamos a continuaci
on la segunda propiedad de idealizacion, aunque no la necesitaremos sino mucho m
as adelante y en ocasiones muy
contadas, siempre relacionadas con la noci
on topol
ogica de compacidad.
Principio de Idealizaci
on II Todo conjunto contiene un subconjunto nito
que contiene a todos sus elementos est
andar.
No es este el mejor momento para discutir este principio. Quiz
a el lector
quiera meditar sobre el despues de la discusion del concepto de nitud que
expondremos en el captulo siguiente (en la p
agina 44 y siguientes.) En lo
sucesivo, cuando hablemos del principio de idealizaci
on, entenderemos que
nos referimos al Principio de Idealizaci
on I, salvo que indiquemos lo contrario.

Este
es un buen momento para mostrar un ejemplo de c
omo podemos acabar enredados en contradicciones si no asimilamos adecuadamente la teora de
conjuntos no est
andar:
Paradoja 1.36 Seg
un el teorema 1.10, todo subconjunto S N no vaco tiene
un mnimo elemento. Esto es valido en la matematica clasica y, por consiguiente,
tambien en la teora de conjuntos no estandar. Sin embargo, consideremos el conjunto
S = {n N | n no es estandar}.
El principio de idealizaci
on implica que S = , luego debera tener un mnimo
elemento. Sin embargo, si S, como 0 es un n
umero estandar, ha de ser = 0,
luego existe 1 < . Ahora bien, 1 ha de ser un n
umero no estandar, ya que
si fuera estandar, como la suma de n
umeros estandar es estandar (por el principio
de transferencia) resultara que ( 1) + 1 = tambien sera estandar, y no lo es.
As pues, 1 S, luego no es el mnimo de S. Hemos probado que S no tiene
elemento mnimo.
6 Ser
a necesario, por ejemplo, para estudiar espacios topol
ogicos arbitrarios, pero nosotros
s
olo vamos a tratar con R en un principio y con espacios metricos despues, y en estos contextos
nos basta con los dos casos particulares que consideramos aqu.

1.4. La teora de conjuntos no est


andar

37

El error del razonamiento anterior es, en cierto sentido, de la misma naturaleza que el error en el que incurre un matem
atico clasico que pretende aceptar
como conjunto al conjunto R de todos los conjuntos que no se pertenecen a
s mismos. (Vease la discusion en la p
agina 4.) Ya hemos explicado que R es
una clase propia, es decir, una coleccion de conjuntos internos que no puede
ser el rango de ning
un conjunto interno, ya que, de suponerlo as, llegamos a
una contradicci
on. Tendramos una autentica contradicci
on si, por otra parte,
los axiomas de la teora de conjuntos permitieran probar la existencia de un
conjunto interno R = {x | x
/ x}, pero no es el caso, ya que esta denicion no
se ajusta a las condiciones del axioma de especicacion, ni tampoco hay ning
un
axioma especco (como el axioma del par, o el del conjunto de partes, etc.) que
demuestren la existencia de R.
Lo mismo sucede con el conjunto S. El error de la paradoja anterior est
a
en suponer que existe un conjunto interno S que contiene a todos los n
umeros
naturales no est
andar, cuando ning
un axioma permite demostrarlo. Observemos
que la denici
on de S no respeta al axioma de especicacion porque este es
un axioma de la matem
atica clasica, y, por consiguiente, s
olo es valido para
propiedades internas. (Y, obviamente, n no es est
andar no es una propiedad
interna.)
As pues, la paradoja no es una paradoja, sino una demostraci
on rigurosa
de que S no existe (como conjunto interno). No diremos que S es una clase
propia, pues reservaremos este nombre a las colecciones de conjuntos internos
que son denibles internamente, pero no constituyen la extensi
on de ning
un
conjunto interno. A las colecciones de conjuntos internos a las que les pasa esto
mismo, pero se denen externamente, las llamaremos conjuntos externos. Mas
precisamente:
Denici
on 1.37 Si A, x1 , . . . , xn son conjuntos internos y P (x, x1 , . . . , xn ) es
una propiedad interna o externa, llamaremos conjunto determinado por estos
datos a
E = {x A | P (x, x1 , . . . , xn )}.
Ahora es crucial tener presente que hay dos posibilidades para un conjunto
en este sentido amplio:
a) Que (a partir de los axiomas de la teora de conjuntos no est
andar) pueda
demostrarse que existe un conjunto interno B tal que, para todo x A,
se cumple x B si y solo si P (x, x1 , . . . , xn ).
En tal caso, lo que hemos llamado conjunto E no es ni mas ni menos que
el conjunto interno B.
b) Que (a partir de los axiomas de la teora de conjuntos no est
andar) pueda
demostrarse que no existe ning
un conjunto interno B tal que, para todo
x A, se cumple que x B si y solo si P (x, x1 , . . . , xn ).
En tal caso diremos que E es un conjunto externo, lo cual ha de entenderse como una mera abreviatura que puede ser u
til en muchos contextos

38

Captulo 1. Preliminares conjuntistas


para expresar con lenguaje conjuntista algunos resultados de la teora de
conjuntos no est
andar. Pero es fundamental tener presente en todo momento que E no es ninguno de los objetos que cumplen los axiomas de la
teora de conjuntos no est
andar, por lo que tampoco podemos esperar que
cumpla los resultados conocidos sobre conjuntos. Cualquier contradicci
on
a la que se llegue al tratar de aplicar a E un resultado de la teora de
conjuntos no est
andar no es una paradoja, sino una prueba m
as de que E
no existe, de que no es un conjunto interno.7
Tenemos, pues, la siguiente clasicacion de los conjuntos:


andar
Internos Est
No Est
andar
Conjuntos
Externos (no existen)

Si al lector le parece articial que podamos hablar de n


umeros naturales
no estandar, pero que sea ilegal hablar del conjunto de todos los n
umeros
naturales no est
andar, debera pensar en una pelcula de romanos, en la que
Julio Cesar puede dirigirse a sus soldados y decirles: Atenci
on!, los veteranos
atacar
an por la derecha, y los nuevos por la izquierda y, mientras es perfectamente admisible que haya especicado de entre sus soldados el subconjunto de
los veteranos, como podra haber especicado a los galos, o a los n
umidas, o a
los ociales, o a los jinetes, lo que sera del todo improcedente es que, en una
determinada escena de la pelcula, Cesar gritara a sus hombres: Atenci
on!,
los soldados reales atacar
an por la derecha, mientras que los que son efectos
especiales lo har
an por la izquierda!. Es verdad que un espectador bien informado podr
a distinguir entre el conjunto de soldados que son reales y los que son
efectos especiales. La distincion tiene perfecto sentido y, cada gura de soldado
en la pantalla se clasica inequvocamente en uno u otro subconjunto, pero esta
distinci
on es externa a la pelcula, es ajena a su realidad interna, y cualquier
mencion interna a esta distinci
on derrumbara la l
ogica interna de la pelcula,
exactamente igual al modo en que tratar de formar un subconjunto de N apelando a una propiedad externa volvera contradictoria a la teora de conjuntos
no estandar.
Cuando decimos que S no existe internamente (aunque podemos tratar con
el externamente) estamos diciendo exactamente lo mismo que cuando decimos
que el conjunto de los soldados virtuales no existe internamente. Tratar de
aplicar a S un teorema de la teora de conjuntos (como el principio de buena
ordenaci
on) es tan absurdo como valorar las probabilidades de victoria de Cesar
en funci
on del cardinal del conjunto de sus soldados virtuales.
El lector tiene que empezar a plantearse la necesidad de asimilar que no
todos los conjuntos en que puede pensar coherentemente son internos, lo cual
7 En realidad podr
a darse un tercer caso: que los axiomas de la teora de conjuntos no
est
andar no permitieran demostrar ni refutar la existencia de E como conjunto interno. Nunca
nos encontraremos con tal situaci
on, pero, si se diera, lo asimilaramos al caso b): Todo conjunto es externo (es decir, s
olo estamos legitimados a referirnos el como una mera abreviatura)
mientras no se demuestre que es interno.

1.4. La teora de conjuntos no est


andar

39

es importante porque a los conjuntos externos no se les puede aplicar los teoremas de la teora de conjuntos (cl
asica o no estandar) porque no son conjuntos
internos, es decir, porque no son los objetos de los que habla cualquiera de las
dos teoras de conjuntos.
La teora de conjuntos no est
andar resultar
a natural al lector a partir del
momento en que este comprenda que la distinci
on entre conjuntos internos y
externos, y el hecho de que los resultados que el conoce para conjuntos (internos)
no se aplican a los conjuntos externos, son tan naturales y obvios como que
Neron tiene poder de vida o muerte sobre todos los que le rodean, pero que este
hecho sobradamente conocido no se aplica al tecnico de sonido que le disimula
el microfono bajo la t
unica.
Una vez establecida la clasicacion de los conjuntos, vamos a dar a nalmente
la palabra conjunto su uso habitual:
Nota Por comodidad, en lo sucesivo, cuando hablemos de conjuntos, entenderemos que nos referimos a conjuntos internos, y cuando queramos hablar de
conjuntos externos lo indicaremos explcitamente.
Observemos ahora que, cuando necesitemos explicitar que un conjunto es
interno, puede dar la sensaci
on de que estamos usando hechos no demostrados,
como:
La intersecci
on de conjuntos internos es un conjunto interno.
Aqu no hay nada que probar. S
olo debemos recordar que los conjuntos
internos no son ni m
as ni menos que lo que los matematicos clasicos llaman
simplemente conjuntos. Repitiendo lo que ya dijimos en su momento: la armacion anterior es consecuencia del axioma de especicacion, seg
un el cual,
dados dos conjuntos (internos, por supuesto) u, v existe el conjunto (interno,
por supuesto)
u v = {x u | x v}.
En estos terminos, la paradoja 1.36 y la discusi
on posterior pueden reformularse como el teorema siguiente:
Teorema 1.38 El conjunto {n N | n no es est
andar} es externo.
Veamos alg
un ejemplo m
as de la utilidad de los conjuntos externos como
abreviaturas:
Denici
on 1.39 Si A es un conjunto (interno), llamaremos

A = {x A | x es estandar}

Salvo en casos muy particulares, A sera un conjunto externo, lo que en


sentido estricto signica que no existe. Sin embargo, podemos escribir sin
riesgo de llegar a ning
un absurdo que x A, entendido como mera abreviatura
de x A y x es estandar, que es una propiedad con pleno sentido en la teora.
Tambien podemos escribir A B para expresar que B contiene a todos los
elementos estandar de A, que tambien es una armaci
on con pleno sentido en
la teora.

40

Captulo 1. Preliminares conjuntistas

Teorema 1.40 El conjunto N es externo.


n: Si fuera interno, tambien lo sera N\ N, que es el conjunto
Demostracio
de los n
umeros naturales no estandar, que ya hemos visto que es externo en el
teorema 1.38.

Ejercicio: Explica por que podemos armar que N N es verdadero, mientras que

N PN es falso.

Aunque ya hemos prevenido al lector sobre los usos fraudulentos del axioma
de especicacion con propiedades externas, el tercer y u
ltimo axioma de la
teora no estandar nos permite denir conjuntos internos est
andar, de hecho
usando propiedades externas, ahora bien, en unas condiciones que mantengan a
raya las contradicciones. La clave esta en permitir u
nicamente que las propiedades determinen cuales son los conjuntos estandar que pertenecen al conjunto que
estamos deniendo, y dejar que a el se incorporen los par
asitos no estandar
que deban rodear a tales elementos estandar de acuerdo con la teora.
Principio de estandarizaci
on Sean x1 , . . . , xn , A conjuntos (internos) arbitrarios y sea P (x, x1 , . . . , xn ) una propiedad interna o externa. Entonces existe
un conjunto est
andar X cuyos elementos est
andar son los conjuntos x A que
cumplen P (x, x1 , . . . , xn ). Lo representaremos por
X = S {x A | P (x, x1 , . . . , xn )}.
La S nos recuerda que X no contiene a todos los elementos de A que cumplen
la propiedad P , sino que sus elementos estandar son los elementos estandar de
A que cumplen la propiedad P , aunque no decimos nada sobre que elementos
no estandar contiene X (que seran los que tengan que ser).
Observemos que el teorema 1.35 nos da que no puede haber m
as que un
conjunto est
andar cuyos elementos estandar sean los elementos estandar de A
que cumplen P , por lo que tiene sentido darle nombre, tal y como acabamos de
hacer.
Podemos pensar que el principio de estandarizaci
on asocia un conjunto
estandar a cada conjunto externo (o interno no est
andar). Por ejemplo,
S

{n N | n no es estandar} = ,

pues, por denici


on, el miembro izquierdo es el u
nico conjunto est
andar cuyos
elementos estandar son los n
umeros naturales estandar que no son est
andar.
Como no hay tales elementos, se trata del u
nico conjunto est
andar que no tiene
elementos estandar. Obviamente, ha de ser el conjunto vaco.
Por el contrario:
S

{n N | n es estandar} = N,

ya que N es el u
nico conjunto est
andar cuyos elementos estandar son los n
umeros
naturales estandar.

1.4. La teora de conjuntos no est


andar

41

Con esto tenemos ya todo lo necesario para desenvolvernos sin contradicciones en la teora de conjuntos no est
andar. Terminamos la seccion enunciando
sin demostracion un resultado muy profundo:
Principio de conservaci
on Todo resultado interno que pueda demostrarse
en la teora de conjuntos no est
andar, puede demostrarse tambien en la teora
de conjuntos est
andar.
En la teora de conjuntos no est
andar se pueden demostrar teoremas nuevos que no pueden probarse en la teora clasica de conjuntos, como, por
ejemplo, 5 es un n
umero natural est
andar. Es evidente que un matem
atico
clasico nunca podr
a demostrar esto, porque el nunca utilizar
a la propiedad ser
estandar. Lo que dice el principio de conservaci
on es que esta es la u
nica
excepcion, que si demostramos una armaci
on interna, como, por ejemplo, el
teorema de Bolzano, aunque en la demostraci
on usemos conjuntos no estandar
(por ejemplo, n
umeros reales innitesimales), podemos tener la seguridad de
que podramos haber llegado al mismo resultado sin hablar en ning
un momento
de conjuntos no est
andar (es decir, mediante una demostraci
on cl
asica).
M
as claramente: si en el seno de la teora de conjuntos no est
andar demostramos un resultado que un matem
atico clasico pueda entender, aunque no sea
capaz de entender la prueba, podemos estar seguros de que existe otra prueba
que s que es capaz de entender. La teora de conjuntos no est
andar es una
herramienta que permite simplicar muchas pruebas, pero no permite probar
nada nuevo que no se pueda probar sin ella (salvo el caso obvio de los teoremas
que hablen de conjuntos est
andar y no est
andar, que no tienen sentido en la
matematica clasica).
Aceptar las tecnicas de la teora de conjuntos no est
andar supone aceptar
nuevos metodos, nuevas tecnicas de demostracion, pero en ning
un caso nuevos
resultados matematicos clasicos (internos).
En particular, si en el seno de la teora de conjuntos no est
andar pudiera
probarse una contradicci
on, a partir de ella podra probarse cualquier otra contradicci
on, por ejemplo, 0 = 0, que es una armaci
on interna, luego el principio
de conservacion nos dice que tambien podramos demostrar 0 = 0 en el seno
de la teora de conjuntos cl
asica. Esto quiere decir que la teora de conjuntos
no estandar no puede ser contradictoria salvo que tambien lo sea la teora de
conjuntos cl
asica.
As pues, si un lector empieza a estudiar la teora de conjuntos no est
andar
y la abandona por in
util pensando que ha encontrado en ella una contradicci
on,
puede estar seguro que el problema esta en el y no en la teora.

Captulo II

Los n
umeros reales
Dedicamos este captulo a construir los n
umeros reales, lo cual nos servira
a su vez para familiarizarnos con las tecnicas del analisis no estandar. Previamente tendremos que estudiar desde un punto de vista no est
andar los n
umeros
naturales y los n
umeros racionales.

2.1

Los n
umeros naturales

En el captulo anterior hemos construido el conjunto N de los n


umeros naturales. Muchos matematicos clasicos creen que su denicion garantiza que N
esta formado por los n
umeros 0, 1, 2, 3, . . . , donde los puntos suspensivos representan todos los n
umeros que pueden obtenerse a partir del 0 en un n
umero
nito de pasos.
Ahora bien, el principio de idealizaci
on, sin contradecir en nada a lo que los
matematicos clasicos demuestran cosa distinta es lo que creen saber garantiza la existencia de n
umeros naturales no estandar, mientras que el principio
de transferencia garantiza que todos los n
umeros 0, 1, 2, 3, . . . , son est
andar.
Donde quedan, pues, los n
umeros no estandar?
Para responder a esta pregunta observamos en primer lugar que, si m es un
n
umero natural est
andar, entonces el conjunto
Im = {n N | n < m}
es estandar. Esto es consecuencia del principio de transferencia: cualquier conjunto denible internamente (es decir, sin distinguir entre conjuntos est
andar y
no estandar) a partir de conjuntos est
andar (en este caso, a partir de N y m) es
estandar.
As pues, Im es estandar y nito, luego el principio de idealizaci
on nos dice
que todos sus elementos (todos los n
umeros n < m) son estandar. Con esto
hemos probado que cualquier n
umero natural no est
andar ha de ser mayor que
cualquier n
umero natural est
andar.
En vista de este hecho, conviene dar la denici
on siguiente:
43

44

Captulo 2. Los n
umeros reales

Denici
on 2.1 Llamaremos n
umeros naturales innitos a los n
umeros naturales no estandar, mientras que a los n
umeros naturales estandar los llamaremos
n
umeros naturales nitos.
En estos terminos, lo que acabamos de probar puede enunciarse de varias
formas equivalentes:
Teorema 2.2 Sean m, n N dos n
umeros naturales:
a) Si n es nito y m < n, entonces m es nito.
b) Si m es innito y m < n entonces n es innito.
c) Si m es nito y n es innito, entonces m < n.
As pues, en la ordenaci
on usual de los n
umeros naturales, los n
umeros no
estandar (o innitos) se sit
uan despues de todos los n
umeros estandar (o nitos).
Si, por ejemplo, n es un n
umero innito, tenemos que
0 < 1 < 2 < 3 < < n 2 < n 1 < n < n + 1 < n + 2 < < 2n <
Quede claro que los n
umeros innitos que hemos representado en la sucesion
anterior no pretenden ser una muestra representativa de la totalidad de los
n
umeros innitos. Por ejemplo, si n es un n
umero par, el n
umero n/2 tambien
sera innito (porque, por transferencia, el producto de n
umeros naturales nitos es nito) y en la lista anterior vendra despues de los primeros puntos
suspensivos, y a unos puntos suspensivos de distancia de n 2.
Lo dicho hasta aqu debera bastar para que al lector se le ocurran unas
cuantas razones por las que todo esto es imposible. Veamos una de las mas
sencillas:
Paradoja 2.3 La matematica clasica nos ense
na que si n es un n
umero natural, el
conjunto In ha de ser nito, luego esto tendra que ser valido tanto para los n
umeros
estandar como para los no estandar. As pues, tenemos una contradicci
on, ya que
si n es un n
umero innito entonces In es innito, puesto que contiene innitos
n
umeros naturales:
{0, 1, 2, 3, . . .} In .
El error de la paradoja anterior est
a justo al nal. Como muy bien se argumenta al principio, el conjunto In debe ser (y es) nito, tanto si n es estandar
como si es no estandar. En cualquiera de los dos casos, el conjunto In es nito
porque tiene n elementos. Un conjunto cuyos elementos se pueden contar con
un n
umero natural es nito, y este es el caso de In . La prueba de que In es
innito es incorrecta.
Es verdad que In contiene al n
umero 0, y es verdad que contiene al n
umero 1,
y es verdad que contiene al n
umero 2, y es verdad que contiene al n
umero 3, y
es verdad que podemos seguir as hasta donde el lector desee, pero d
onde esta

2.1. Los n
umeros naturales

45

la prueba de que contiene a innitos n


umeros naturales? Si la prueba consiste
en que In contiene al conjunto

N = {0, 1, 2, 3, . . .} In ,

esto no tiene sentido, porque el conjunto N no existe (es externo). Ya hemos


demostrado que no existe en el captulo anterior, pero no hace falta recurrir a
ello. La paradoja 2.3, no es una paradoja, sino otra demostraci
on de que N no
existe.
Externamente, es cierto que N existe y es un conjunto innito, lo que prueba
que In es tambien (externamente) innito. Sin embargo, In es internamente
nito (mientras que, internamente, N, no es ni nito ni innito, porque internamente no existe). Los efectos especiales de nuestra pelcula permiten que
un conjunto muy grande, como In , parezca en la pantalla mucho m
as peque
no
de lo que realmente es.
Pensemos, por ejemplo, en una pelcula en la que vemos una gigantesca nave
espacial surcando el espacio. Que sucedera si, en un momento dado, se viera
en la pantalla una mano humana que la sujeta? Evidentemente, que se vera
que la nave espacial ni es gigantesca, ni es una nave espacial, ni surca el espacio.
Quedara claro que se trata de una maqueta sostenida por una mano humana
ante una foto del espacio estrellado, en contradicci
on con el argumento de la
pelcula, que exige que la nave sea gigantesca y surque el espacio.
El conjunto N es como la mano que sostiene la maqueta. Ha de estar ah,
pero no ha de verse en la pantalla. En la realidad interna de la pelcula, la maqueta existe, y no es una maqueta, es una nave espacial gigantesca, mientras que
la mano que la sostiene no existe (luego no es ni grande ni peque
na). Del mismo
modo que, ocultando toda referencia que pueda permitir al espectador calcular
el tama
no real de la maqueta, es posible hacer que esta pase por una nave gigantesca, nos encontramos con que, ocultando conjuntos como N y todos los
conjuntos (externos) que haga falta ocultar, podemos hacer que un matem
atico
clasico (que no sepa distinguir los conjuntos est
andar de los no est
andar) crea
que In es un conjunto peque
no (nito), pese a que externamente es gigantesco
(es innito).
Pretender que considerar nito a In es contradictorio por el mero hecho de

que contiene a N, es tan absurdo como considerar que una pelcula de cienciaccion es contradictoria porque est
a rodada con maquetas. A lo sumo ser
a
fant
astica (o tal vez no, ya que tal vez, en una galaxia muy lejana, hace mucho
tiempo, existieron naves espaciales gigantescas), pero eso no tiene nada que ver
con que sea contradictoria.
De acuerdo con la discusi
on precedente, el lector debera asimilar que los
n
umeros naturales innitos son s
olo externamente innitos, aunque internamente son (por denici
on) nitos. As, si un conjunto (interno) A tiene n elementos y n es un n
umero natural innito, podemos armar que el conjunto A
es nito, y si, por ejemplo, A N, podemos asegurar que A tendr
a un m
aximo
y un mnimo elemento, como corresponde a todo subconjunto nito de N.
Quiz
a ayude tambien al lector pensar que los n
umeros naturales innitos,

46

Captulo 2. Los n
umeros reales

mas que innitos, son genericos o indeterminados. Son n


umeros tan generales,
tan generales, que no coinciden con ning
un n
umero particular. Es algo similar
a lo que sucede con la igualdad
(x + 1)2 = x2 + 2x + 1.
Podemos pensar que, en ella, x representa a un n
umero arbitrario, sin especicar cu
al, pero tambien podemos concebirla como una igualdad de polinomios.
En tal caso, x ya no es un n
umero, es otra cosa, es un polinomio concreto, el
polinomio x, de grado 1, distinto de cualquier n
umero (que sera un polinomio de grado 0), pero que est
a dise
nado para comportarse como un n
umero
indeterminado.
Igualmente, cuando un matem
atico clasico dice Sea n un n
umero natural,
esta pensando en n de acuerdo con la primera interpretaci
on que le hemos dado
a la x, mientras que un n
umero natural innito viene a ser como un n
umero
natural generico, que es distinto de cualquier n
umero concreto en el mismo
sentido en que la indeterminada x es distinta de cualquier n
umero concreto por
el que pueda sustituirse.
Dejamos como ejercicio al lector que resuelva la paradoja siguiente:
Paradoja 2.4 Vamos a probar que todos los n
umeros naturales son estandar.
Razonamos por inducci
on: sabemos que 0 es estandar, y sabemos que la suma de
n
umeros estandar es estandar, luego si n N es estandar, tambien lo es n + 1
(porque 1 es estandar). As pues, todos los n
umeros naturales son estandar.
Notemos que los hechos: 0 es estandar, 1 es estandar, as como que la suma
de n
umeros estandar es estandar, los hemos demostrado anteriormente, y todos
ellos son incuestionables.
Nota Si m es un n
umero natural innito, tenemos que Im N es un conjunto
nito que contiene a todos los n
umeros naturales estandar. Se trata de un caso
particular del Principio de Idealizaci
on II (que hemos demostrado a partir del
Principio de Idealizaci
on I). El lector puede probar (naturalmente, sin usar el
Principio de Idealizaci
on II) que Q contiene tambien un subconjunto nito que
contiene a todos los n
umeros racionales estandar. As, lo que arma el Principio
de Idealizacion II es que esto es una caracterstica de todos los conjuntos, y no
solo de N o de Q.
Ya sabemos que la suma de n
umeros nitos es nita. De acuerdo con 2.2, y
teniendo en cuenta la desigualdad m m + n, satisfecha por cualquier suma de
n
umeros naturales, es facil probar algo m
as:
Teorema 2.5 La suma de dos n
umeros naturales es nita si y s
olo si los dos
sumandos son nitos.
(Ya que si m es innito, la suma es tambien innita por ser mayor.)
Ejercicio: Es cierto el teorema anterior si cambiamos suma por resta (y consideramos
pares de n
umeros que se puedan restar)?

Similarmente se puede probar:

2.2. Cuerpos ordenados

47

Teorema 2.6 El producto de dos n


umeros naturales no nulos es nito si y s
olo
si los dos factores son nitos.
Ejercicio: Sea n = p1 pm la descomposici
on de un n
umero natural en factores
primos. Si n es innito, ha de ser innito alguno de los factores? (Ayuda: considerese
el caso en el que todos los primos sean iguales.)

2.2

Cuerpos ordenados

En esta seccion estudiaremos las propiedades externas del conjunto de los


n
umeros racionales, si bien trabajaremos, m
as en general, en terminos de un
cuerpo ordenado arbitrario (K, +, , ). La raz
on para ello es que as, cuando
hayamos construido el cuerpo de los n
umeros reales, sera evidente que todo lo
dicho en esta seccion valdr
a tambien para R.
Aunque ya hemos denido el concepto en el captulo anterior, recordamos
aqu todas las propiedades que le estamos exigiendo a (K, +, , ). En primer
lugar las propiedades de los cuerpos:
Asociativa (r + s) + t = r + (s + t),

(rs)t = r(st).

Conmutativa r + s = s + r, rs = sr.
Elemento neutro r + 0 = r, s 1 = s.
Elemento sim
etrico r + (r) = 0, s (s1 ) = 1 (para s = 0).
Distributiva r(s + t) = rs + rt.
En segundo lugar las propiedades de los conjuntos (totalmente) ordenados:
Reexiva r r.
Antisim
etrica Si r s y s r, entonces r = s.
Transitiva Si r s y s t, entonces r t.
De conexi
on O bien r s, o bien s r.
Y en tercer lugar las propiedades de compatibilidad:
Compatibilidad con la suma Si r s, entonces r + t s + t.
Compatibilidad con el producto Si r s y t 0, entonces tr ts.
Sabemos que (Q, +, , ) cumple todas estas propiedades, a partir de las cuales pueden demostrarse (para un cuerpo ordenado arbitrario) todos los hechos
algebraicos elementales con los que el lector debera estar familiarizado, como
que rs = 0 si y solo si r = 0 o s = 0, o las propiedades siguientes, relativas a la
relacion de orden:

48

Captulo 2. Los n
umeros reales
Si r s, entonces s r.
r2 0.
1 0.

Si 0 < r s, entonces 0 < 1/s 1/r. (Esta


no estaba probada en
el captulo anterior, porque no tiene sentido para anillos ordenados, sino
para cuerpos: Si fuera 1/s 0, multiplicando por s > 0 resultara 1 0,
luego 0 < 1/s. Igualmente, 1/r > 0, lo que nos permite pasar de r s a
r/s 1 y a 1/s 1/r, multiplicando primero por 1/s y luego por 1/r.)

Denici
on 2.7 Si K es un cuerpo ordenado, denimos el valor absoluto como
la aplicaci
on | | : K K dada por

r si r 0,
|r| =
r si r 0.
Ejercicio: Demostrar que en un cuerpo ordenado K se cumple |r| s si y s
olo si
s r s.
Ejercicio: Demostrar que en un cuerpo ordenado K se cumple
|r + s| |r| + |s|,

|rs| = |r||s|,

||r| |s|| |r s|.

En lo sucesivo nos restringiremos a cuerpos ordenados que tengan una propiedad adicional:
Denici
on 2.8 Un cuerpo ordenado (K, +, , ) es arquimediano si Q K y,
para todo r K, existe un n N tal que r n.
Con la inclusi
on Q K hemos de entender que, al restringir a Q las operaciones y el orden de K, obtenemos las operaciones y el orden usuales de Q.
Teorema 2.9 Si K es un cuerpo ordenado arquimediano y r K, existe un
u
nico n
umero entero n Z tal que n r < n + 1.
n: si 0 r, entonces el conjunto A = {n N | n r} es
Demostracio
no vaco (contiene al 0) y es nito, ya que existe un n
umero natural m > r,
luego A Im = {n N | n < m}, y este conjunto es nito. Todo subconjunto
nito de N no vaco tiene un m
aximo elemento n, que claramente cumplir
a
n r < n + 1.
Si r < 0 entonces r 0, luego existe un n
umero natural m r < m + 1,
luego m 1 < r m. Si r < m, llamamos n = m 1 Z y se
cumple n r < n + 1. Si r = m entonces llamamos n = m y tenemos que
n r < n + 1. La unicidad de n se prueba sin dicultad.
Denici
on 2.10 Si K es un cuerpo ordenado arquimediano, denimos la parte
entera como la aplicacion E : K Z que a cada r K le asigna el u
nico
n
umero entero E[r] que cumple E[r] r < E[r] + 1.

2.2. Cuerpos ordenados

49

Observemos que todos los conceptos que hemos tratado hasta aqu en esta
seccion son internos, pues hasta ahora no hemos mencionado nunca la palabra
estandar.
En lo sucesivo, (K, +, , ) sera en todo momento un cuerpo ordenado arquimediano estandar arbitrario. El lector puede, si lo desea, pensar que es Q, pero
es importante observar que en ning
un momento vamos a usar ninguna propiedad
particular de Q, sino u
nicamente las propiedades comunes a todos los cuerpos
ordenados arquimedianos. Dado que s
olo pretendemos aplicar los resultados que
veremos aqu a los casos K = Q y, m
as adelante, K = R, llamaremos n
umeros
a los elementos de K.
Denici
on 2.11 Diremos que un n
umero r K es nito si existe un n
umero
natural nito n tal que |r| n. En caso contrario diremos que es innito.
Llamaremos O al conjunto de los n
umeros nitos.
Teorema 2.12 El conjunto O es externo.
n: Si fuera interno, tambien lo sera el conjunto O N = N,
Demostracio

y ya sabemos que N es externo.


El teorema siguiente muestra que un n
umero innito es mayor que todos los
n
umeros de K si es positivo, y menor que todos ellos si es negativo.
Teorema 2.13 Si r es un n
umero innito, entonces |r| es mayor que todos los
n
umeros nitos.
n: Si r es innito y s es nito, entonces existe un n
Demostracio
umero
natural nito n tal que |s| n. No puede ser |r| n, ya que entonces r sera
nito, luego s |s| n < |r|.
Teorema 2.14 Todo n
umero est
andar es nito.
n: Si r es estandar, entonces n = E[|r|] + 1 es un n
Demostracio
umero
natural est
andar, luego nito, y se cumple que r |r| < n, luego r es nito por
el teorema anterior.
Teorema 2.15 La suma y el producto de n
umeros nitos es nita.
n: Si r y s son nitos, existen n
Demostracio
umeros naturales nitos m y
n tales que |r| m y |s| n. Entonces
|r + s| |r| + |s| m + n

|rs| = |r||s| mn.

Como m + n y mn son nitos, r + s y rs tambien lo son.


Ejercicio: Probar que r es innito si y s
olo si existe un n
umero natural innito tal
que |r| n. (Ayuda: considerar E[|r|].)

50

Captulo 2. Los n
umeros reales

Denici
on 2.16 Un n
umero r = 0 es innitesimal (o un innitesimo) si 1/r es
innito. Aunque sera mas acorde con la tradici
on considerar que un innitesimo
es, por denici
on, distinto de 0, vamos a adoptar el convenio (m
as pr
actico)
de incluir al 0 entre los innitesimos. Llamaremos o al conjunto de todos los
n
umeros innitesimales.
Teorema 2.17 El conjunto o es externo.
n: Si fuera interno, tambien sera interno1 el conjunto
Demostracio
{n N | n = 0, 1/n o},
pero este conjunto es el conjunto de los n
umeros naturales innitos, que ya
sabemos que es externo.
Teorema 2.18 El u
nico innitesimo est
andar es el 0.
n: Si r o es no nulo, entonces 1/r es innito, luego es no
Demostracio
estandar, luego r tambien es no estandar.
Teorema 2.19 Se cumplen las propiedades siguientes:
a) Si r o y s > 0 es est
andar, entonces |r| < s.
b) o O.
c) Si s o y |r| |s|, entonces r o.
d) Si r o y s O, entonces rs o.
e) Si r, s o, entonces r + s o.
n: a) Si r o es no nulo, entonces 1/r es innito, luego existe
Demostracio
un n
umero natural innito n 1/|r|. Como s es estandar, tambien lo es 1/s,
luego es nito, luego existe un n
umero natural nito m tal que
1/s m < n 1/|r|,
luego |r| < s.
b) Si r o, entonces, por el apartado anterior |r| < 1, luego r O.
c) Podemos suponer que r = 0. Entonces 1/|s| 1/|r| y 1/|s| es innito,
luego 1/|r| tambien lo es, luego s o.
d) Podemos suponer que r = 0. Si 1/rs fuera nito, tambien lo sera su
producto por s, es decir, 1/r sera nito, pero es innito.
1 Estamos

usando que si existe un conjunto A K, tambien existe el conjunto


{n N | n
= 0, 1/n A},

consecuencia del axioma de especicaci


on (aplicado legtimamente con una propiedad interna).

2.2. Cuerpos ordenados

51

e) No perdemos generalidad si suponemos que |r| |s|. Tenemos que


|r + s| |r| + |s| 2|s|,
y 2|s| es innitesimal por el apartado anterior, luego r + s tambien lo es, por c).
En terminos algebraicos, hemos probado que O es un subanillo de K y que
o es un ideal de O.
Ejercicio: Probar que el apartado d) del teorema anterior es falso si cambiamos s O
por s K.

Destacamos el teorema siguiente porque se presta a un equvoco sobre el que


el lector debera reexionar:
Teorema 2.20 Si h o y n N, entonces hn o.
n: El lector podra creer que esto es una consecuencia inmeDemostracio
diata del apartado d) del teorema anterior, pero sera as si pudieramos argumentar por inducci
on sobre n. Ahora bien, es muy importante tener presente
que es incorrecto razonar por inducci
on para demostrar una propiedad externa.
La paradoja 2.4 es una muestra de ello. Aunque en este caso llegaramos a
una conclusi
on correcta, ello sera fruto de la casualidad, y no de la validez del
argumento.
Una forma correcta de probar el teorema es demostrar que si |x| < 1, entonces |xn | < |x|. Esto es una armaci
on interna que es legtimamente demostrable
por inducci
on sobre n a partir de las propiedades de los cuerpos ordenados (y
la prueba es trivial). Como es v
alida para todo n
umero x, podemos aplicarla al
innitesimo h, de donde deducimos que |hn | < |h|, luego hn o.
Denici
on 2.21 Diremos que dos n
umeros estan innitamente pr
oximos, y lo
representaremos por r s, si r s o.
En estos terminos, un n
umero r es innitesimal si y solo si r 0.
Ejercicio: Demostrar que la relaci
on que acabamos de denir es de equivalencia, es
decir, que es reexiva, simetrica y transitiva.

El ejercicio anterior al igual que el teorema siguiente es inmediato si


advertimos que la proximidad innita no es sino la relaci
on de congruencia
modulo el ideal o. No obstante, demostraremos el teorema para que el lector
aprecie el razonamiento directo con innitesimos.
Teorema 2.22 Se cumplen las propiedades siguientes:
a) Si r s y r s , entonces r + r s + s .
b) Si r s, r s y todos ellos son nitos, entonces rr ss .
c) Si r r no son innitesimales, entonces 1/r 1/r .
d) Si r s, r s , r < r y r  r , entonces s < s .

52

Captulo 2. Los n
umeros reales

n: a) Tenemos que r = s + , r = s +  , donde ,  o. Por


Demostracio
lo tanto, r + r = s + s +  +  y  +  o, luego r + r s + s .
b) Con la misma notaci
on del apartado anterior, ahora tenemos que
rr = ss + s + s  +  ,
y, por la hip
otesis de nitud, los tres u
ltimos sumandos son innitesimales. Por
lo tanto, rr ss .
c) Tenemos que

1
r r
1
.
 =
r
r
rr
Por hip
otesis, r r o y 1/r, 1/r O, luego el producto de los tres esta
en o.
d) Si fuera r s, entonces, de r < r s se sigue que |r r| < s r o,
on. Por lo tanto, s < r . Si fuera s s, entonces
luego r r , contradicci


s s < r implicara que |r s| < r s o, luego r s r, contradicci
on.
As pues, s < s .
Nuevamente, hemos de ser cautos con las generalizaciones del teorema anterior que un matem
atico clasico considerara obvias pero que en realidad se
apoyan en un razonamiento inductivo elemental, razonamiento que en el contexto de la matematica no estandar es inv
alido por el mero hecho de que las
inducciones sobre propiedades externas no son v
alidas.
Por ejemplo, no es cierto que si x y son dos n
umeros nitos y n N, entonces xn y n , aunque esto pueda parecer una consecuencia obvia del apartado
b) del teorema anterior.2 Lo maximo que podemos decir es lo siguiente:3
Teorema 2.23 Si x y son dos n
umeros nitos y n N es nito, entonces se
cumple xn y n .
n: Sea h = x y 0, de modo que
Demostracio
n

y = (x + h) = x + h

n1

i=0


n ni i1
x h .
i

Basta probar que el sumatorio es nito, pero esto es obvio, pues




 
n1
 n1  
 n ni i1  n
x h 
mni ,



i
i
i=0
i=0
donde m > |x| es un n
umero natural nito, y la u
ltima expresi
on es estandar,
luego nita.
2 Por ejemplo, si n es un n
umero natural innito, podemos tomar x = 1, y = 1 + 1/n. As,
x y, pero y n = (1 + 1/n)n e
1 = xn . (V
ease la p
agina 107)
3 M
as adelante quedar
a claro que este teorema es una consecuencia inmediata de la continuidad de la funci
on xn .

2.3. Convergencia de sucesiones

53

Teorema 2.24 Si r y s son n


umeros est
andar y r s, entonces r = s.
n: Si fuera r = s, entonces 1/(r s) sera innito y est
Demostracio
andar
al mismo tiempo, lo cual es imposible.
Observemos que, al contrario de lo que sucede con los n
umeros naturales,
un n
umero nito (un elemento de K) no tiene por que ser estandar. Los innitesimos no nulos son ejemplos de n
umeros nitos no estandar. M
as en general:
Denici
on 2.25 Si x K, llamaremos halo de x al conjunto
h(x) = {r K | r x}.
Teorema 2.26 Si x K el halo h(x) es un conjunto externo.
n: Si fuera interno, tambien lo sera
Demostracio
o = {r K | r x h(x)}.

La u
ltima propiedad del teorema 2.22 arma que los halos est
an ordenados,
en el sentido de que, si dos halos son distintos (y, por consiguiente, disjuntos),
entonces todos los elementos de uno son menores que todos los elementos del
otro.

Ejercicio: Probar que si r K, entonces h(r) K = {r}.

2.3

Convergencia de sucesiones

Para construir el conjunto de los n


umeros reales necesitaremos algunos hechos sobre la convergencia de sucesiones de n
umeros racionales. Aqu los estudiaremos en el contexto general de un cuerpo ordenado arquimediano para que
despues no tengamos la necesidad de demostrarlos nuevamente al estudiar las
sucesiones de n
umeros reales.
Como en la seccion anterior, llamaremos n
umeros a los elementos de un
cuerpo ordenado arquimediano est
andar K prejado.
Denici
on 2.27 Una sucesi
on en K es una aplicaci
on
x : N K.
Si n N, habitualmente escribiremos xn en lugar de x(n), y escribiremos
{xn }n0 en lugar de x para referirnos a la sucesi
on.
Aunque, en teora, a veces es importante que todas las sucesiones empiecen
en el mismo n
umero (en 0, seg
un la denici
on que hemos dado), en la pr
actica

54

Captulo 2. Los n
umeros reales

no suele haber inconveniente en que empecemos a numerar los terminos de una


sucesion donde resulte m
as oportuno. Por ejemplo, la sucesi
on
{1/n}n1 = {1,

1 1 1
, , , ... }
2 3 4

empieza con el termino x1 , aunque, si es necesario, podemos renumerarla como


{1/(n + 1)}n0 . Similarmente, la sucesion




n+1
3 4 5
=
, ,
, ...
n(n 1) n2
2 6 12
empieza en n = 2, salvo que la renumeremos adecuadamente.
Denici
on 2.28 Llamaremos K N al conjunto de todas las sucesiones en K. En
este conjunto podemos denir, termino a termino, una suma y un producto:
{xn }n0 + {yn }n0 = {xn + yn }n0 ,

{xn }n0 {yn }n0 = {xn yn }n0

Es inmediato comprobar que K N tiene estructura de anillo con estas operaciones. Los elementos neutros para la suma y el producto son, respectivamente,
las sucesiones constantes
0 = {0}n0 = {0, 0, 0, . . . , },

1 = {1}n0 = {1, 1, 1, . . . , },

el elemento simetrico para la suma es {xn }n0 = {xn }n0 , y las sucesiones
que tienen inversa son las que tienen todos sus terminos no nulos, en cuyo caso
1
{xn }1
n0 = {xn }n0 .
Ejercicio: Cumple K N la propiedad de que si {xn }n0 {yn }n0 = 0 entonces uno de
los factores es igual a 0?

Denici
on 2.29 Diremos que una sucesion estandar {xn }n0 K N converge
o tiende a un n
umero estandar r si, para todo n
umero natural innito n, se
cumple que xn r.
Llegados a este punto tenemos que hacer unas observaciones tecnicas muy
importantes que valdr
an igualmente para todas las deniciones similares que
veremos mas adelante. El lector podra pensar que faltara denir la convergencia de sucesiones no estandar, pero no es as. La denici
on anterior determina
la convergencia de cualquier sucesion, estandar o no, a pesar de que no es aplicable literalmente a sucesiones no estandar. Veamos como (e insistimos en que
el argumento siguiente es una tecnica de denici
on totalmente general):
Digamos que una sucesion x K N (estandar o no) converge a un n
umero
r K (estandar o no) si cumple la denici
on anterior (eliminando, obviamente,
el requisito de que la sucesion y el n
umero sean estandar). De este modo,
P (x, r) x converge a r es una propiedad externa. Denimos
C = S {(x, r) K N K | x converge a r}.

2.3. Convergencia de sucesiones

55

Ahora, si x K N es una sucesion arbitraria y r K es arbitrario, diremos


que x converge a r si (x, r) C.
De este modo, si x K N es una sucesion estandar y r K es un n
umero
estandar y x converge a r seg
un la denici
on general que acabamos de dar, la
denici
on de C nos garantiza que x converge a r y, como ambos son estandar,
esto no es ni mas ni menos que la denici
on 2.29. As pues, la denici
on general
coincide con 2.29 para sucesiones y n
umeros estandar.
Sin embargo, debemos tener presente que si x o r no son estandar, el hecho
de que x converja a r, es decir, que (x, r) C, no implica que x converja a r.
El interes de esta maniobra es que as, por construcci
on, C es un conjunto
estandar. Por consiguiente, aunque la propiedad x converge a r es externa,
la propiedad x converge a r, es decir, (x, r) C, es una propiedad interna con
un par
ametro estandar C. En denitiva, la noci
on de convergencia es interna,
a pesar de que, tal y como la hemos introducido, un matem
atico clasico no la
entender
a.4
En resumen, en lo sucesivo deberemos tener en cuenta el siguiente caso
particular del principio de estandarizaci
on:
Si denimos un concepto mediante una propiedad externa, pero limitamos la denici
on a conjuntos est
andar, entonces la denici
on
admite una u
nica extensi
on a conjuntos cualesquiera, que resulta ser
una propiedad interna.
Teorema 2.30 Si una sucesi
on {xn }n0 converge a un n
umero r K, este es
u
nico.
n: Hemos de probar que, para toda sucesi
Demostracio
on x y para todo
par de n
umeros r y r , si x converge a r y x converge a r , entonces r = r . Como
toda la armaci
on es interna, podemos aplicar el principio de transferencia y
suponer que x, r y r son estandar. En tal caso, tomamos un n
umero natural
innito n y observamos que r xn r , luego r = r por 2.24.
Denici
on 2.31 Diremos que una sucesion {xn }n0 K N es convergente si
existe un r K tal que {xn }n0 converge a r. A este n
umero (que es u
nico por
el teorema anterior), lo llamaremos lmite de {xn }n0 y lo representaremos por
lm xn .
n

Teorema 2.32 El lmite de una sucesi


on est
andar convergente es est
andar.
4 La raz
on de fondo por la que esto sucede es que la convergencia de sucesiones admite una
denici
on alternativa que s entienden los matem
aticos cl
asicos (la que aparece en los libros
de an
alisis est
andar), pero no vamos a ocuparnos de ella.

56

Captulo 2. Los n
umeros reales

n: Se trata de una consecuencia inmediata del principio de


Demostracio
transferencia: si existe un r tal que la sucesion x converge a r (como la propiedad
es interna) existe un r estandar tal que la sucesi
on x converge a r, luego el lmite
de la sucesion es estandar.
Veamos algunos ejemplos:
a) lm n1 = 0, pues si n es innito entonces 1/n 0.
n

b) lm 6n3n+3n5
= 2, pues si n es innito, entonces
2 +5
n

6n2 + 3n 5
6
6 + 3/n 5/n2
= 2.
=
2
3n + 5
3 + 5/n2
3
c) En general, el lmite de un cociente de polinomios del mismo grado es
igual al cociente de los coecientes de mayor grado, lo cual se demuestra
como en el caso anterior, dividiendo numerador y denominador entre la
potencia de n de mayor grado.
2

+5
d) lm 3n
n5 3 = 0, pues si n es innito tenemos que
n

3n2 + 5
3/n3 + 5/n5
0.
=
5
n 3
1 3/n5
e) En general, el lmite de un cociente de polinomios cuyo denominador tiene
mayor grado es 0, lo cual se demuestra dividiendo entre la potencia de n
de mayor grado.
n 3
f) lm 3n
2 +5 no existe, porque si n es innito, entonces
5

n5 3
1 3/n5
=
2
3n + 5
3/n3 + 5/n5
es innito, luego no puede estar innitamente cerca de ning
un n
umero
estandar.
g) En general, el lmite de un cociente de polinomios cuyo numerador tiene
mayor grado no existe, porque la sucesi
on toma valores innitos cuando
el ndice n es innito.
h) lm(1)n no existe, porque si n es innito par, entonces (1)n = 1 y si
n

n es innito impar (1)n = 1, luego si existiera el lmite r debera ser


r 1 1, lo cual es imposible.

2.3. Convergencia de sucesiones

57

Interpretaci
on del lmite La denici
on cl
asica de lmite de una sucesion es
la siguiente, con su no menos clasica triple alternancia de cuanticadores (para
todo-existe-para todo):
Se cumple que lm xn = l si y s
olo si para todo n
umero  > 0 existe un
n

n
umero natural n0 tal que, para todo n n0 se cumple |xn l| < .
Por el principio de transferencia, para probar la equivalencia podemos suponer que la sucesion y el lmite son estandar. Supongamos que existe el lmite
seg
un la denici
on que hemos dado.
Para probar la equivalencia, de nuevo por el principio de transferencia, podemos tomar un  > 0 estandar. Entonces, si n0 N es innito y n n0 ,
tambien n es innito, por lo que xn l 0 y, en particular, |xn l| < , como
haba que probar.
Recprocamente, si se cumple la caracterizacion cl
asica, jado un  > 0
estandar, existe un n0 tal que, si n n0 , se cumple |xn l| < . Por el principio
de transferencia, el n0 se puede tomar estandar.
Observemos que, en principio el n0 (estandar) que cumple esto depende de ,
pero si n es un n
umero natural innito, cumplir
a n n0 sea cual sea el natural
a |xn l| <  para todo  > 0 (estandar). Ahora bien,
nito n0 , luego se cumplir
esto solo puede suceder si xn l 0, ya que en caso contrario |xn l|1 sera
un n
umero nito, luego existira un m N nito tal que |xn l|1 < m, luego
|xn l| > 1/m, y no se cumplira lo dicho para  = 1/m. As pues, xn l y
tenemos la convergencia.
En la prueba hemos visto que (para sucesiones est
andar y  estandar, el n0 se
puede tomar estandar, luego la convergencia implica que, para ndices n nitos
sucientemente grandes, el termino xn dista del lmite l menos que cualquier
 > 0 prejado.
En lo sucesivo no volveremos a mostrar este tipo de equivalencias clasicas.
Consideraremos que propiedades como xn l cuando n es innito ya muestran claramente su signicado analtico (en este caso, que xn es muy parecido
a l cuando n es muy grande) sin necesidad de reducir la idea a aproximaciones
nitas con tolerancias  > 0 y valores mnimos n0 para n.
Conviene observar que la convergencia de una sucesi
on y el valor de su lmite
no se alteran si modicamos u
nicamente sus primeros terminos:
Teorema 2.33 Si {xn }n0 , {yn }n0 K N son dos sucesiones tales que existe
un n0 N de modo que xn = yn para todo n n0 , entonces una converge si y
s
olo si lo hace la otra, y en tal caso el lmite es el mismo para ambas.
n: Por el principio de transferencia podemos suponer que
Demostracio
las sucesiones y n0 son estandar. Entonces, si n es cualquier natural innito,
nicamente
tenemos que xn = yn y, como el concepto de convergencia depende u
de los terminos innitos de las sucesiones, es claro que se cumple el enunciado.

58

Captulo 2. Los n
umeros reales

Ejemplo Vamos a estudiar la convergencia de una sucesion no estandar. Para


ello probamos primero lo siguiente:
Si m N, se cumple que
lm
n

m
= 0.
n

En efecto, por el principio de transferencia podemos suponer que m es nito,


en cuyo caso, si n es innito, resulta que m/n 0.
Tomemos ahora un n
umero natural innito m. Por lo que acabamos de
probar, sabemos que
m
lm
= 0,
n n
pero si tomamos el n
umero innito n = m, no es cierto que m/m = 1 0, de
modo que no se cumple la propiedad que dene la convergencia en el caso de
sucesiones estandar.
Ejercicio: Demostrar que si {xn }n0 , {yn }n0 son sucesiones convergentes, entonces
lm(xn + yn ) = lm xn + lm yn ,
n

lm(xn yn ) = lm xn lm yn ,

y si adem
as lm yn = 0, entonces
n

lm
n

lm xn
xn
n
=
.
yn
lm yn
n

Denici
on 2.34 Una sucesion {xn }n0 K N esta acotada si existen n
umeros
m < M tales que m xn M para todo n N.
Ejercicio: Probar que una sucesi
on {xn }n0 K N est
a acotada si y s
olo si existe un
M K tal que |xn | M para todo n N.

Esta
es la denici
on cl
asica de funci
on acotada, si bien tiene su equivalente
no estandar, que nos ser
a mucho mas u
til en la pr
actica. Podramos haber
tomado el teorema siguiente como denicion:
Teorema 2.35 Una sucesi
on est
andar {xn }n0 est
a acotada si y s
olo si xn es
nito para todo n
umero natural innito n.
n: Si la sucesion esta acotada, entonces hay n
Demostracio
umeros m < M
tales que m < xn < M para todo n N. Por el principio de transferencia,
podemos tomar m y M nitos, con lo que xn es nito para todo n N, nito o
innito.
Supongamos ahora que la sucesi
on no esta acotada, de modo que, para todo
M K, existe un ndice n N tal que |xn | > M . En particular, esto vale
cuando M es innito, con lo que existe un n N tal que xn tambien es innito.
Dicho n ha de ser innito, porque si fuera nito sera estandar y, como la sucesion
es estandar, xn tambien sera estandar, luego sera nito.
A veces es u
til el siguiente criterio de convergencia:

2.4. La incompletitud de Q

59

Teorema 2.36 El producto de una sucesi


on que tiende a 0 por una sucesi
on
acotada, tiende a 0.
n: Por transferencia podemos suponer que las sucesiones son
Demostracio
estandar. Si {xn }n0 esta acotada, entonces xn es nito cuando n es innito.
Si {yn }n0 tiende a 0, entonces yn 0 cuando n es innito. Por el teorema
2.22 concluimos que xn yn 0, luego lm xn yn = 0.
n

Denici
on 2.37 Sea {xn }n K N una sucesion estandar en K. Diremos que
lm xn = (respectivamente + o ) si para todo n N innito se cumple
n

que xn es innito (y adem


as xn > 0, para +, o xn < 0, para ).
Ejercicio: Demostrar las relaciones que usualmente se abrevian as:
+ = ,
(+)(+) = +,
a = ,

+ + = +,

(+)() = ,
a/0 = ,

= ,

()() = +,

= ,

a/ = 0, (donde a K \ {0}).

Por ejemplo, la primera igualdad hay que entenderla como una abreviatura del teorema
siguiente: si dos sucesiones convergen a , su suma tambien converge a .

Otras expresiones como 0/0, /, , 0 , etc. se llaman indeterminaciones, para expresar que no puede demostrarse un resultado similar a los
del ejercicio anterior, en el sentido de que la existencia y el valor del lmite
depender
a de las sucesiones concretas que se operan y no solo de sus lmites.
Ejemplo La expresion es una indeterminaci
on, ya que, por ejemplo, las
sucesiones {n + 3}n0 y {n}n0 tienden ambas a , y su diferencia tiende a 3;
sin embargo, las sucesiones {n2 }n0 y {n}n0 tienden ambas a y su diferencia
tiende a . (Podemos verla como un cociente de polinomios de grados 2 y 0
respectivamente.)
Ejercicio: Poner ejemplos que demuestren que las otras indeterminaciones que hemos
citado son realmente indeterminaciones.

2.4

La incompletitud de Q

La incompletitud de Q, en el sentido de que Q no contiene todos los n


umeros
que debera contener, es un hecho que ya descubrieron los antiguos griegos y
que traumatiz
o a muchos de sus matematicos. En efecto, la geometr
a demuestra

que la diagonal de un cuadradode lado unidad debe medir 2 unidades, y un


sencillo argumento prueba que 2 es irracional. Recordemoslo:
Teorema 2.38 No existe ning
un r Q tal que r2 = 2.

60

Captulo 2. Los n
umeros reales

n: Si existiera tal n
Demostracio
umero r, podramos tomarlo positivo
(cambi
andole el signo si fuera preciso) y expresarlo como cociente r = p/q,
donde p y q son n
umeros naturales. Podemos tomar como p el mnimo numerador posible. Como p2 /q 2 = 2, tenemos que p2 = 2q 2 , luego p ha de ser par.
Pongamos que p = 2p . Entonces 4p2 = 2q 2 , luego 2p2 = q 2 . Esto implica que
q = 2q  es par, pero entonces r = p/q = p /q  , con p < p, en contradicci
on con
la eleccion de p como mnimo numerador posible para r.

Esto implica que, para hablar de 2, necesitamos un conjunto de n


umeros
mas amplio que Q. Dado que r2 = 2, podemos descomponer Q del modo
siguiente:
Q = {r Q | r < 0} {r Q | r 0, r2 < 2} {r Q | r 0, r2 > 2}.
Si llamamos A a la uni
on de los dos primeros conjuntos y B al tercero,
tenemos que Q = A B, A B = y que todos los elementos de A son menores
que todos los elementos de B. La diagonal de un cuadrado de lado unidad mide
mas que cualquier n
umero de A y mide menos que cualquier n
umero de B, pero
(en Q) entre A y B no hay nada. Hay un agujero que debemos rellenar.
Nos encargaremos de ello en la seccion siguiente, donde construiremos el
cuerpo R de los n
umeros reales, pero ahora nos ocuparemos de precisar en que
consisten estos agujeros de Q, ya que con ello obtendremos al mismo tiempo
los conceptos necesarios para rellenarlos. Una forma de denir rigurosamente
los agujeros de Q es a traves del concepto de seccion:
Denici
on 2.39 Una secci
on de Q es un par (A, B) de subconjuntos no vacos
de Q tales que Q = A B, A B = , cada elemento de A es menor que cada
elemento de B, y B no tiene un mnimo elemento. Si adem
as A no tiene un
maximo elemento diremos que la seccion es estricta.
Cada seccion estricta de Q en este sentido pone en evidencia la falta de un
n
umero entre A y B. Observemos la importancia de la u
ltima condici
on sobre
ausencia de maximo y mnimo, ya que una secci
on como
Q = {r Q | r 3} {r Q | r > 3},
que no es estricta, porque A tiene a 3 como maximo elemento,5 no nos permite
armar que falte ning
un n
umero entre A y B, sino que A y B estan perfectamente separados por r = 3.
Aunque intuitivamente est
a claro, no es inmediato comprobarque los conjuntos A y B que hemos construido entre los que debera estar 2 no tienen
maximo ni mnimo. Vamos a verlo como consecuencia de una construccion mas
general que nos dar
a otras caracterizaciones de los agujeros de Q.
5 Recordemos que las deniciones de m
aximo y mnimo de un conjunto A exigen que
estos
est
en en A. Por ello, podemos decir que 3 es el m
aximo del conjunto de la izquierda, mientras
que el conjunto de la derecha no tiene mnimo, ya que dicho mnimo debera ser 3 y no lo
es porque no pertenece al conjunto.

2.4. La incompletitud de Q

61

Ejemplo Sea B = {r Q | r 0, r2 > 2} y sea A = Q \ B. Est


a claro
que (A, B) cumple la denici
on de seccion salvo quiz
a la condici
on de que A no
tenga maximo y B no tenga mnimo. Observemos que 1 A (porque 12 < 2) y
2 B (porque 22 > 2). Esto se interpreta como que el agujero determinado
por (A, B) esta situado entre 1 y 2. Para precisar mas su situacion jamos un
n
umero natural n y consideramos los n + 1 n
umeros naturales de la forma
i
,
n
M
as explcitamente, tenemos que
xi = 1 +

0 i n.

1 = x0 < x1 < < xn = 2.


Elevando al cuadrado:
1 = x20 < x21 < < x2n = 4.
Puesto que ninguno de los cuadrados puede ser exactamente igual a 2, tiene
que existir un u
nico i tal que x2i < 2 < x2i+1 . Denimos xn = xi , yn = xi+1 . De
este modo, hemos construido dos sucesiones (estandar) {xn }n0 , {yn }n0 QN
tales que
1 xn < yn 2, yn xn = 1/n, x2n < 2 < yn2 .
Esto se interpreta como que el agujero determinado por (A, B) esta situado
entre xn e yn para todo n. Si n es innito, entonces, la segunda condici
on de
las tres anteriores nos da que xn yn , luego tambien x2n yn2 , y la tercera
condici
on nos da que |xn 2| < |x2n yn2 | 0, luego x2n yn2 = 2.
Acabamos de probar que, aunque no existe ning
un n
umero racional r tal que
r2 = 2, s que existe un r tal que r2 2.
Por otra parte, ahora es claro que A no puede tener m
aximo elemento.
Si lo tuviera, sera un n
umero estandar r (por transferencia, el m
aximo de
un conjunto est
andar es un n
umero estandar), y tendramos (siempre para n
innito) que xn r < yn , luego xn r, luego r2 x2n 2, luego r2 = 2 por el
teorema 2.24, y esto es imposible. Igualmente se razona que B no puede tener
mnimo. As hemos probado que (A, B) es una seccion estricta de Q.
Observemos tambien que la sucesion {xn }n0 no es convergente (en Q), ya
que, siendo estandar, si convergiera lo hara a un n
umero racional estandar r,
que cumplira r2 x2n 2 y de nuevo llegaramos al absurdo r2 = 2. (Lo mismo
vale para {yn }n0 .)

Esto se interpreta
como que las sucesiones deberan converger a 2, pero,

en Q, en vez de 2 tenemos un agujero.


No obstante, estas sucesiones cumplen una propiedad relacionada con la
convergencia que denimos a continuaci
on.
A partir de aqu, los resultados te
oricos generales los enunciaremos, como en
las secciones precedentes, para sucesiones en un cuerpo ordenado arquimediano
estandar K arbitrario, si bien los alternaremos con aplicaciones al caso concreto
de Q.

62

Captulo 2. Los n
umeros reales

Denici
on 2.40 Una sucesion estandar {xn }n0 K N es de Cauchy si para
todo par de n
umeros naturales innitos m y n se cumple que xm xn .
Como en el caso de la denicion de convergencia, el principio de estandarizacion nos permite considerar denido el concepto de sucesi
on de Cauchy para
sucesiones arbitrarias, no necesariamente estandar, y de modo que la propiedad
es interna.
As como la nocion de convergencia expresa que xn es muy parecido al lmite
cuando n es muy grande, la noci
on de sucesion de Cauchy expresa que los
terminos de la sucesion son todos muy parecidos entre s cuando los ndices son
muy grandes.
Las sucesiones {xn }n0 e {yn }n0 que hemos construido en el ejemplo anterior son de Cauchy, pues si m y n son dos n
umeros naturales cualesquiera,
podemos suponer que xm xn , y entonces xm xn < ym (porque todo elemento de A es menor que todo elemento de B), luego |xn xm | |ym xm | 0,
luego xm xn . Igualmente se razona con la otra sucesion.
Tenemos as ejemplos de sucesiones de Cauchy que no son convergentes
(en Q). Por otra parte:
Teorema 2.41 Toda sucesi
on convergente es de Cauchy.
n: Sea {xn }n0 una sucesion convergente en K. Por transDemostracio
ferencia podemos suponer que es estandar, y entonces tambien sera estandar
su lmite l K. Si m y n son n
umeros naturales innitos, tenemos que
xm l xn , luego la sucesion es de Cauchy.
Lo que sucede es que, para que una sucesion pueda converger, es decir,
para que sus terminos se acerquen innitamente a un lmite l, es necesario
en particular que se acerquen innitamente entre s. En cambio, aunque los
terminos de una sucesion se acerquen innitamente entre s, puede ocurrir que
la sucesion no tenga lmite porque converja hacia un agujero, como hemos
visto que sucede en Q. Las sucesiones de Cauchy no convergentes en Q son otra
forma de se
nalar los agujeros de Q. Veamos otra mas, esta genuinamente no
estandar:
Denici
on 2.42 Un n
umero r K es casi est
andar si esta innitamente cerca
de un n
umero estandar, que por el teorema 2.24 est
a unvocamente determinado
y lo llamaremos parte est
andar de r, y lo representaremos por r.
Todo n
umero casi-estandar es suma de un n
umero estandar (luego nito)
y un innitesimo (nito tambien), luego todos los n
umeros casi-estandar son
nitos. En Q el recproco es falso, y este hecho supone otra caracterizacion
de la incompletitud. Volviendo a la sucesi
on {xn }n0 del u
ltimo ejemplo que
hemos visto, cuando n es innito tenemos que xn es nito (esta entre 1 y 2)
y no esta innitamente pr
oximo a ning
un n
umero estandar r, ya que, una vez
mas, si xn r, entonces r2 = 2.

2.5. La construcci
on de R

63

As, los n
umeros racionales que deberan estar innitamente cerca de un
n
umero irracional est
andar son nitos, pero no casi-est
andar porque su parte
estandar es irracional.
Ejercicio: Demostrar que si r, s K son casi-est
andar, tambien lo son r + s y rs, y
que (r+s) = r+ s, (rs) = r s. Si s no es un innitesimo, tambien es casi-est
andar
r/s y (r/s) = r/ s.

En resumen, hemos visto tres manifestaciones de la incompletitud de Q:


La existencia de secciones estrictas (A, B), para las que debera haber
un n
umero que fuera el m
aximo de A o el mnimo de B, seg
un a cu
al de
los dos lo a
nadamos.
La existencia de sucesiones de Cauchy no convergentes, que deberan
tener un lmite.
La existencia de n
umeros nitos que no son casi-estandar, que deberan
estar innitamente pr
oximos a una parte est
andar.
En la seccion siguiente construiremos el cuerpo R de los n
umeros reales y
veremos que desaparecen estos tres fenomenos, lo que se interpretar
a como que
habremos tapado todos los agujeros de Q.
Terminamos con un u
ltimo resultado sobre sucesiones de Cauchy:
Teorema 2.43 Toda sucesi
on de Cauchy est
a acotada.
n: Sea {xn }n0 una sucesion de Cauchy, que podemos supoDemostracio
ner estandar. Si m N es innito, entonces, para todo n m, se cumple que
|xn xm | < 1, ya que, de hecho, los dos terminos estan innitamente pr
oximos.
Por transferencia, podemos tomar un m N nito que cumple lo mismo, es
decir, tal que para todo n m se cumple |xn xm | < 1, en particular para todo
n N innito. Como la sucesi
on y m son estandar, el termino xm tambien es
estandar, luego es nito, luego xn tambien es nito, para todo n N innito.
Esto signica que la sucesion esta acotada.
Ejercicio: Probar el an
alogo al teorema 2.33 para sucesiones de Cauchy.

Terminamos la seccion con otras dos caracterizaciones de la incompletitud


de Q, una genuinamente no est
andar y otra cl
asica:

2.5

La construcci
on de R

Existen diversas formas de construir un cuerpo R que complete a Q, aunque


todas ellas son equivalentes, en el sentido de que los cuerpos a los que se llega
con cada metodo tienen exactamente las mismas propiedades y sus elementos
pueden identicarse uno a uno a traves de aplicaciones naturales.
La construccion de R mas simple desde un punto de vista conceptual es la de
Dedekind, que dene R como el conjunto de todas las secciones de Q. Podemos

64

Captulo 2. Los n
umeros reales

denir entonces una aplicaci


on i : Q R que a cada n
umero x Q le asigna
la seccion
i(x) = ({r Q | r x}, {r Q | r > x}).
De este modo, los n
umeros racionales se identican con las secciones no
estrictas de Q, pero, en R hay muchos n
umeros irracionales, como la seccion
estricta que hemos estudiado
en la seccion anterior y que podramos tomar

como la denici
on de 2.
No obstante, construir R no es solo denir los n
umeros reales, sino dotarlos
de una estructura de cuerpo ordenado y, con la construcci
on de Dedekind, esto
resulta mucho mas farragoso que con la que vamos a exponer aqu, basada, no en
las secciones, sino en otro de los detectores de agujeros que hemos encontrado,
a saber, las sucesiones de Cauchy.
Aqu nos encontramos con un inconveniente, y es que, mientras que secciones de Q distintas entre s determinan n
umeros racionales distintos (si no son
estrictas) o agujeros distintos (si son estrictas), es facil construir sucesiones
de Cauchy distintas que se aproximen hacia el mismo agujero de Q, por lo
que no podemos denir los n
umeros reales como las sucesiones de Cauchy de
Q, sino que cada n
umero real deber
a ser el conjunto de todas las sucesiones de
Cauchy que se aproximan a un mismo agujero.
Denici
on 2.44 Llamaremos C al conjunto de todas las sucesiones de Cauchy
en Q.
Observemos que la suma y el producto de dos sucesiones de Cauchy {xn }n0 ,
{yn }n0 es tambien una sucesion de Cauchy. En efecto, si m y n son n
umeros
naturales innitos, entonces xm xn , ym yn , luego xm + ym xn + yn , luego
{xn + yn }n0 tambien es de Cauchy. Con el producto se razona an
alogamente,
pero teniendo en cuenta que las sucesiones de Cauchy estan acotadas, porque
para aplicar el teorema 2.22 hace falta que los n
umeros sean nitos.
Esto convierte al conjunto C en un subanillo del anillo QN . Aqu usamos
tambien que las sucesiones constantes 0 y 1 estan en C, lo cual es obvio, porque
todas las sucesiones constantes son convergentes, luego son de Cauchy.
Denici
on 2.45 Diremos que dos sucesiones estandar {xn }n0 , {yn }n0 C
son equivalentes, y lo representaremos por {xn }n0 {yn }n0 , si para todo
n N innito, se cumple que xn yn . Observemos que si esto se cumple para
un cierto n innito, entonces se cumple autom
aticamente para todos.
Es evidente que la equivalencia que acabamos de denir es ciertamente una
relacion de equivalencia, es decir, que es reexiva, simetrica y transitiva.
Ejercicio: Probar que dos sucesiones de Cauchy son equivalentes si y s
olo si su
diferencia converge a 0. Esto signica precisamente que ambas deberan tener el
mismo lmite, en caso de tenerlo.

Denimos el conjunto de los n


umeros reales R como el conjunto de todas las
clases de equivalencia de sucesiones de Cauchy respecto de la equivalencia que
acabamos de denir. Es obvio que R, as denido, es un conjunto est
andar.

2.5. La construcci
on de R

65

De este modo, cada R es de la forma = [{xn }n0 ], donde los corchetes


representan la clase de equivalencia formada por todas las sucesiones de Cauchy
equivalentes a {xn }n0 .
Ejercicio: Demostrar que si {xn }n0 {xn }n0 y {yn }n0 {yn }n0 , entonces
{xn + yn }n0 {xn + yn }n0 y {xn yn }n0 {xn yn }n0 .

El ejercicio precedente permite denir la suma y el producto de dos n


umeros
reales = [{xn }n0 ] y = [{yn }n0 ] como
+ = [{xn + yn }n0 ],

= [{xn yn }n0 ].

En otros terminos: para sumar o multiplicar dos n


umeros reales escogemos
una sucesion de Cauchy en cada uno de ellos, las sumamos o multiplicamos, y
el resultado es la clase de la sucesion suma o producto. La clave est
a en que
este resultado sera el mismo cualquiera que sea el par de sucesiones con el que
hagamos las operaciones.
Todas estas comprobaciones pueden reducirse a unas pocas a traves del
concepto de ideal:
Ejercicio: Demostrar que el conjunto I de las sucesiones de QN que convergen a 0 es
un ideal del anillo C, de modo que la equivalencia de sucesiones de Cauchy no es m
as
que la congruencia m
odulo I y R no es m
as que el anillo cociente C/I.

Teorema 2.46 (R, +, ) es un cuerpo.


n: La comprobaci
Demostracio
on de que R es un anillo es inmediata.
Todas las propiedades se reducen a las correspondientes a la suma y el producto
de sucesiones, que a su vez se reducen a las de la suma y el producto de n
umeros
racionales. Por ejemplo, la propiedad conmutativa del producto se prueba as:
Si = [{xn }n0 ] y = [{yn }n0 ], entonces
= [{xn yn }n0 ] = [{yn xn }n0 ] = .
Observemos que los elementos neutros para la suma y el producto son las
clases de las sucesiones constantes 0 = [{0}n0 ], 1 = [{1}n0 ].
La u
nica propiedad que requiere algo de atenci
on es la de existencia de
elemento inverso para el producto. Para ello tomamos un n
umero R no
nulo, que podemos suponer est
andar. Ser
a de la forma = [{xn }n0 ], donde
{xn }n0 es una sucesion de Cauchy, que podemos tomar est
andar, tal que, si n
es innito, xn  0 (pues de lo contrario la sucesi
on sera equivalente a {0}n0
y tendramos = 0).
Consideremos la sucesion (estandar) {yn }n0 denida por

yn =

xn
1

si xn = 0,
si xn = 0.

66

Captulo 2. Los n
umeros reales

Seg
un lo dicho, si n es innito ser
a yn = xn , luego {yn }n0 es tambien una
sucesion de Cauchy equivalente a {xn }n0 . Por lo tanto, = [{yn }n0 ], con la
diferencia de que ahora yn = 0 para todo n N.
Esto nos permite considerar la sucesion inversa {yn1 }n0 , que tambien es
de Cauchy, pues si m y n son n
umeros naturales innitos, entonces ym yn
1
son n
umeros racionales no innitesimales, luego ym
yn1 (por 2.22). Por
1
consiguiente, tenemos denido el n
umero real = [{yn }n0 ], que obviamente
cumple = 1, luego existe el inverso 1 = .
Denici
on 2.47 Si = [{xn }n0 ] y = [{yn }n0 ] son dos n
umeros reales
estandar distintos, el teorema 2.22 implica que la condici
on xn < yn (para n
innito) no depende ni del n considerado ni de la elecci
on de las sucesiones
dentro de cada n
umero real. Por ello diremos que < si = y xn < yn
para alg
un n innito (o, equivalentemente, para todos). A su vez, denimos
como < o = .
Teorema 2.48 (R, +, , ) es un cuerpo ordenado.
n: Es inmediato que la relaci
Demostracio
on que acabamos de denir es
reexiva, antisimetrica y transitiva. Por ejemplo, para probar la antisimetra
hemos de ver que, si = [{xn }n0 ] y = [{yn }n0 ] (que podemos suponer
estandar) cumplen y , entonces ha de ser = . Por reducci
on al
absurdo, si fuera = , entonces tendramos < y < , luego, jado un
n N innito, xn < yn , yn < xn , lo cual es absurdo porque la relaci
on de orden
en Q es antisimetrica.
Similarmente, si = , jado n N innito, o bien xn < yn , en cuyo caso
< , o bien yn < xn , en cuyo caso < . Esto implica que, o bien , o
bien .
La compatibilidad del orden con la suma y el producto se prueban tambien
sin dicultad. Por ejemplo, si y consideramos un tercer n
umero real
= [{zn }n0 ], o bien + = +, en cuyo caso tenemos tambien + +,
o bien + = + , lo que obliga a = y, m
as concretamente, a < .
Entonces, jado un n N innito, tenemos que xn < yn , luego xn +zn < xn +yn ,
luego + < + , luego + + .
Denici
on 2.49 Sea i : Q R la aplicaci
on que a cada r Q le asigna el
n
umero real i(r) = [{r}n0 ].
Teorema 2.50 La aplicaci
on i : Q R que acabamos de denir es inyectiva
y cumple las propiedades siguientes:
a) r s si y s
olo si i(r) i(s).
b) i(r + s) = i(r) + i(s).
c) i(rs) = i(r)i(s).
d) Para todo R existe un m N tal que i(m) .

2.5. La construcci
on de R

67

n: La inyectividad de i signica que si i(r) = i(s), entonces


Demostracio
r = s. Podemos suponer que r y s son estandar. Lo que tenemos es que la
sucesion constante r es equivalente a la sucesion constante s, luego r s y,
como son estandar, r = s.
Las propiedades a), b) y c) son inmediatas.
Para probar d) podemos suponer que = [{xn }n0 ] es estandar, con lo que
tambien podemos suponer que lo es la sucesion {xn }n0 . Como es de Cauchy,
esta acotada, lo cual implica que existe un M Q (que podemos tomar estandar)
tal que xn M para todo n N. Sea m = E[M ] + 2, que es un n
umero natural
nito, y es claro que |xn m| > 1 para todo n N, luego la sucesion {xn }n0
no es equivalente a la sucesion constante m y, como xn < m para cualquier n
innito, concluimos que < i(m).
En virtud de este u
ltimo teorema, podemos identicar a Q con su imagen
en R a traves de la aplicacion i, de modo que podemos considerar Q R.
La suma, el producto y la relaci
on de orden entre n
umeros racionales son los
mismos si los consideramos como n
umeros racionales o como n
umeros reales. La
u
ltima propiedad implica que (R, +, , ) es un cuerpo ordenado arquimediano
estandar. Por lo tanto, podemos aplicarle toda la teora que hasta ahora hemos
desarrollado para un cuerpo K arbitrario.
En particular, podemos distinguir entre n
umeros reales innitos, nitos e
innitesimales. A partir de ahora, O representar
a especcamente al conjunto
(externo) de todos los n
umeros reales nitos y o al conjunto (externo) de todos
los n
umeros reales innitesimales.
Observemos que un n
umero racional r es nito si y solo si existe un n
umero
natural nito n tal que |r| n, y esto no depende de si consideramos a r como
n
umero racional o como n
umero real. En otras palabras, un n
umero racional es
nito como n
umero racional si y s
olo si lo es como n
umero real. M
as brevemente:
el conjunto (externo) de los n
umeros racionales nitos es O Q. Similarmente,
los n
umeros racionales innitesimales son los de oQ. A su vez, esto implica que
dos n
umeros racionales estan innitamente pr
oximos como n
umeros racionales
si y solo si lo estan como n
umeros reales, as como que todo n
umero racional
casi-estandar sigue siendo casi-estandar como n
umero real, con la misma parte
estandar.
Teorema 2.51 Entre dos n
umeros reales distintos hay siempre un n
umero racional.
n: Sean < dos n
Demostracio
umeros reales, que podemos tomar
estandar. Sea m = E[] de modo que m < m + 1. Fijado un n
umero
natural n consideremos los n
umeros racionales de la forma
xi = m +

1
,
n

0 i n.

Como x0 = m y xn = m+1 > , ha de haber un i tal que xi1 < xi .


Si n es innito, entonces xi1 xi = 1/n 0, luego xi , luego xi < , ya

68

Captulo 2. Los n
umeros reales

que si fuera < xi sera tambien , lo cual es imposible porque


ambos n
umeros son estandar. As pues, r = xi es un n
umero racional que
cumple < r < . (Ciertamente, es un n
umero racional no est
andar, pero, por
transferencia, si existe uno no est
andar, siendo y estandar, tambien existe
otro estandar, aunque esto no es necesario para la prueba.)
Teorema 2.52 Sea {xn }n0 una sucesi
on de Cauchy de n
umeros racionales
y sea = [{xn }n0 ] R. Entonces, si consideramos la sucesi
on dada como
sucesi
on de n
umeros reales, se cumple que
lm xn = .
n

n: Podemos suponer que la sucesion (y, por lo tanto, ) es


Demostracio
estandar. Hemos de probar que si n N es innito, entonces xn . En caso
contrario, |xn | no es innitesimal, luego su inverso no es nito. Existe, pues,
un n
umero natural nito k tal que |xn |1 < k, luego |xn | > 1/k.
Si, por ejemplo, xn < , entonces xn < = 1/k < , donde es un
n
umero real estandar. Por el teorema anterior, existe un n
umero racional (que
podemos tomar estandar) tal que < r < . Entonces xn < r < , pero la
primera desigualdad implica, por denici
on, que = [{xn }n0 ] < [{r}n0 ] = r,
luego tenemos < r < , contradicci
on. Si fuera < xn razonamos igualmente
con = + 1/k.
A partir de este momento ya nunca m
as tendremos que recordar que un
n
umero real es, por denici
on, una clase de equivalencia de sucesiones de Cauchy,
sino que podremos concebir a R como un conjunto de n
umeros, sin que importe
para nada la naturaleza conjuntista de sus elementos. En lugar de escribir
= [{xn }n0 ], podremos escribir
lm xn = .
n

Observemos que el teorema anterior garantiza que hemos tapado todos los
agujeros de Q, en el sentido de que cada sucesion de Cauchy de n
umeros
racionales tiene lmite en R, pero no asegura que, en el proceso, no hayamos
generado agujeros nuevos, en el sentido de que haya sucesiones de Cauchy de
n
umeros reales (irracionales) que no tengan lmite. A continuaci
on probaremos
que no es el caso, que es lo que se conoce como teorema de completitud de R.
En primer lugar demostramos una versi
on no estandar, de la que deduciremos
trivialmente la versi
on estandar:
Teorema 2.53 (Teorema de completitud) Todo n
umero real nito est
a
innitamente pr
oximo a un u
nico n
umero real est
andar , al que llamaremos
su parte est
andar.
n: Consideremos el conjunto estandar
Demostracio
A = S {x R | x }.

2.5. La construcci
on de R

69

Recordemos que esto signica que un n


umero real estandar x esta en A si y
solo si cumple x , pero no tenemos informaci
on directa sobre que n
umeros
no estandar est
an en A.
Como es nito, el n
umero entero m = E[] es nito, luego es estandar, y
se cumple que m < m + 1, luego m A y m + 1
/ A. Para cada n N
consideramos los n
umeros racionales
i
ai = m + ,
0 i n.
n
Como a0 = m A y an = m + 1
/ A, ha de existir un i tal que xn = ai A,
pero yn = ai+1
/ A. Tenemos as denidas dos sucesiones {xn }n0 , {yn }n0 de
n
umeros racionales que son estandar, pues est
an denidas internamente a partir
de A y m, que son conjuntos est
andar.
Por construcci
on, xn A, yn
/ A, xn < yn , yn xn = 1/n. Cuando n es
nito (y s
olo en este caso) podemos asegurar que xn < yn .
Un poco mas en general, si n y n son nitos, tenemos que xn < yn luego,
por transferencia, esta desigualdad se cumple cuando n y n son arbitrarios.
Si n y n son innitos y, por ejemplo, xn xn , tenemos que
|xn xn | |xn yn | = 1/n 0,
luego xn xn . Igualmente se razona que yn yn , luego ambas sucesiones son
de Cauchy. Por el teorema anterior, existe = lm xn R, que sera un n
umero
n
real estandar. Tenemos as que xn yn , para todo n N innito.
Vamos a probar que , con lo que el teorema quedar
a probado. (La
unicidad de la parte est
andar es el teorema 2.24.)
En caso contrario, | |1 es nito, luego podemos tomar k N nito tal
que | | > 1/k. Si, por ejemplo, < , para todo n N nito tenemos que
xn < 1/k < . En la desigualdad xn < 1/k, todo es estandar,
luego, por transferencia, vale para todo n N. As pues, | xn | > 1/k, lo cual
es absurdo cuando n es innito, ya que xn . Si < razonamos igualmente
con < + 1/k < < yn .
El teorema anterior prueba que los n
umeros reales nitos coinciden con los
casi-estandar, pero, precisamente por ello, ya no volveremos a hablar de n
umeros
casi-estandar, ya que este concepto se ha vuelto sin
onimo de nito.
La version estandar del teorema de completitud es ahora trivial:
Teorema 2.54 (Teorema de completitud) Una sucesi
on de n
umeros reales
es convergente si y s
olo si es de Cauchy.
n: Sea {n }n0 una sucesion de Cauchy de n
Demostracio
umeros reales,
que podemos tomar estandar. Toda sucesi
on de Cauchy esta acotada, luego,
jado m N innito, m es nito, luego existe = m m . Como la
sucesion es de Cauchy, de hecho n , para todo n N innito, luego
= lm n
n

El recproco es el teorema 2.41.

70

Captulo 2. Los n
umeros reales

2.6

Consecuencias de la completitud de R

En esta seccion recogemos algunas propiedades elementales de R que no son


ciertas para Q porque dependen de la propiedad de completitud. Empezamos
con otra de las caracterizaciones clasicas:
Denici
on 2.55 Si (X, ) es un conjunto ordenado, el supremo de un subconjunto A X no vaco es la menor de sus cotas superiores, y el nmo es la
mayor de sus cotas inferiores.
M
as detalladamente, s X es el supremo de A si es una cota superior de A
(es decir, si a s para todo a A y cualquier otra cota superior c X cumple
s c. An
alogamente podemos desarrollar la denici
on de nmo.
Un conjunto A no tiene por que tener supremo o nmo, pero si existen son
claramente u
nicos. Si A tiene un m
aximo (resp. mnimo) elemento, es claro que
este es tambien su supremo (resp. nmo).
La completitud de R equivale al teorema siguiente:
Teorema 2.56 Todo subconjunto de R no vaco y acotado superiormente tiene
supremo.
n: Sea A R un subconjunto est
Demostracio
andar no vaco y acotado
superiormente. Sea a A estandar y sea c R una cota superior est
andar. Si a
es el maximo de A, entonces es su supremo. Supongamos que a no es el maximo
de A, con lo que a < c.
Fijemos n N innito y consideremos la sucesion xi = a + 1/n, para i N.
Tenemos que x0 = a no es una cota superior de A, mientras que xn2 > c, luego
s lo es. Ha de existir un i N tal que xi no sea una cota superior pero xi+1
s que lo sea. Que xi no sea cota superior signica que existe un b A tal que
a < xi < b < c, luego xi es nito. Sea s = xi = xi+1 . Vamos a probar que s
es el supremo de A.
En primer lugar, s es una cota superior, pues si existe b A tal que s < b,
podemos tomarlo estandar, y entonces xi+1 < b, en contradicci
on con que xi+1
es una cota superior de A.
Si existe otra cota superior d < s, podemos tomarla estandar, con lo que
d < xi , y esto contradice que xi no sea una cota superior.
Ejercicio: Demostrar que todo subconjunto de R no vaco y acotado inferiormente
tiene nmo.

Las caracterizaciones siguientes del supremo de un conjunto pueden ser


u
tiles:
Teorema 2.57 Sea A R un conjunto est
andar y sea s R un n
umero
est
andar. Las armaciones siguientes son equivalentes:
a) s es el supremo de A.

2.6. Consecuencias de la completitud de R

71

b) s es una cota superior de A y existe x s que no es cota superior de A.


c) s es una cota superior de A y existe a s tal que a A.
n: a) b) Cualquier x s que cumpla x < s no sera cota
Demostracio
superior de A.
b) c) Necesariamente x < s. Si x no es cota superior, existe un a A tal
que x < a y, como s s que es cota superior, ha de ser x < a s, luego a x
c) a) Si existe una cota superior c < s, podemos tomarla estandar, pero
entonces c < a, contradicci
on.
Hemos visto que una de las evidencias de la incompletitud de Q era que en
este cuerpo no existe la raz cuadrada de 2. En cambio, ahora podemos probar
que los n
umeros reales positivos tienen siempre una raz k-esima:
Teorema 2.58 Si 0 es un n
umero real y k N es no nulo, existe un u
nico
n
umero real 0 tal que k = .
n: Podemos suponer que y k son estandar, con lo que
Demostracio
tambien lo sera el conjunto
A = {x R | xk }.
Tambien podemos suponer que > 0, ya que en otro caso tomamos = 0.
Tenemos que A = , pues 0 A, y A esta acotado superiormente, por ejemplo
por cualquier n
umero natural n > , ya que si x n, entonces
xk nk > n > ,
luego x
/ A. Podemos tomar, pues el supremo de A, que sera un n
umero
estandar. Por el teorema anterior, existe un  A tal que  (y necesariamente  ). Por otra parte, cualquier  > tal que  cumple

/ A, luego tenemos
  ,

k k .

Por consiguiente, k k k y, por 2.23, sabemos que k k , con


lo que ha de ser k . Como ambos son estandar, k = .
La unicidad es consecuencia de que si 0 < <  , entonces k < k .
Denici
on 2.59
Si 0 es un n
umero real, denimos la raz k-esima de ,
representada por k , como el u
nico n
umero real 0 que cumple k = .

Observemos que si k esimpar y < 0, podemosdenir k = k y


se sigue cumpliendo que ( k )k = (y, en general, k tiene el mismo signo
que ). Por el contrario, si k es par, k 0 para todo R, por lo que los
n
umeros negativos no tienen raz k-esima.
Ejercicio: Demostrar las propiedades b
asicas de las races (con radicandos positivos):




k
k
r
= k k , ( k )n = k n ,
= kr .

72

Captulo 2. Los n
umeros reales

Ejemplo

Vamos a probar que


lm
n

En efecto, si llamamos xn =

n = 1.

n 1, hemos de probar que

lm xn = 0.
n

Tenemos que
n = (1 + xn )n = 1 + nxn +

n(n 1) 2
n(n 1) 2
xn + + xnn
xn .
2
2

As pues,

2
.
n1
Si n es innito, concluimos que xn 0.

El teorema 2.38 nos da que 2 es un n


umero irracional, y a partir de aqu
es facil probar que existen innitos n
umeros irracionales:
0 xn

Teorema 2.60 Entre dos n


umeros reales distintos hay al menos un n
umero
racional y un n
umero irracional.
n: Sean < dos n
Demostracio
umeros reales, que podemos suponer
estandar. El teorema 2.51 nos da que existe un n
umero racional r (que podemos
tomar estandar) tal que < r < . Por otra parte, si n N es innito, entonces

2
<r+
< ,
n

y x = r + 2/n es irracional, ya que en caso contrario 2 = (x r)n Q.


En particular, dado x R, podemos aplicar el teorema anterior a x y x + h,
donde h > 0 es innitesimal, para concluir que todo n
umero real esta innitamente cerca de n
umeros racionales y de n
umeros irracionales. Hay un caso
particular de aproximaci
on por n
umeros reales por n
umeros racionales que tiene
especial interes practico:
Expresi
on decimal de un n
umero real Para cada x R y cada n N,
podemos considerar kn = E[10n x], de modo que
kn
kn + 1
x<
.
10n
10n
Tenemos as un n
umero entero kn , unvocamente determinado, tal que el n
umero
racional kn /10n que aproxima a x con un error menor que 1/10n . Por ejemplo,
es pura rutina comprobar que
14142
14143
2
104
104

2.6. Consecuencias de la completitud de R

73

lo que se expresa mas habitualmente en notaci


on decimal:

1.4142 2 1.4143.
Observemos que, en general,
10kn
10kn + 10
x<
,
10n+1
10n+1
por lo que kn+1 sera de la forma 10kn + cn , donde 0 cn 9 es un n
umero
natural. Esto signica que cada aproximaci
on decimal de x se obtiene a
nadiendo
una nueva cifra decimal a la anterior (pero sin modicar las cifrasdecimales
anteriores). As, por ejemplo, la siguiente aproximaci
on decimal de 2 es

1.41421 2 < 1.41422.


Por u
ltimo observamos que la sucesion {kn }n0 determina completamente
el n
umero x ya que, suponiendolo estandar y tomando n innito, la relaci
on
kn
kn + 1
x<
10n
10n
kn
n
implica que x 10
0.
n , ya que la diferencia entre los dos extremos es 1/10
Por consiguiente:
kn
x = lm n .
n 10
Por esto podemos escribir

2 = 1.4142135 . . .

entendiendo que el miembro derecho, con sus puntos suspensivos,


representa el

lmite de la sucesion de aproximaciones decimales de 2.


La completitud de R puede expresarse en terminos de la convergencia de las
sucesiones de Cauchy. Otra forma equivalente utiliza sucesiones monotonas:
Denici
on 2.61 Una sucesion {xn }n0 RN es mon
otona creciente (resp.
decreciente) si cuando m n se cumple xm xn (resp. xn xm ). Diremos que
una sucesion es mon
otona si es monotona creciente o monotona decreciente.
Teorema 2.62 Toda sucesi
on mon
otona y acotada de n
umeros reales es convergente.
n: Sea {n }n0 una sucesion acotada de n
Demostracio
umeros reales,
que podemos tomar estandar, y supongamos, por ejemplo, que es mon
otona
creciente. Vamos a probar que es de Cauchy. En caso contrario, existiran m,
n N innitos tales que m  n . Esto equivale a que m = n . Pongamos
que m < n . Como son n
umeros estandar, existe un n
umero real estandar

m < r < n . Esto implica que m < r < n

74

Captulo 2. Los n
umeros reales

Como existe un n N tal que r < n , por transferencia existe un n0 N tal


que r < n0 . Ahora bien, m > n0 y, sin embargo, m < n0 , en contradicci
on
con la monotona de la sucesion. As pues, la sucesion es de Cauchy y, por lo
tanto, convergente.
Ejercicio: Probar que el lmite de una sucesi
on mon
otona creciente (resp. decreciente)
y acotada {n }n0 es el supremo (resp. el nmo) del conjunto {n | n N}.

Otra consecuencia de la completitud de R es una caracterizacion, que veremos a continuaci


on, de los subconjuntos de R que mas nos van a interesar: los
intervalos.
Denici
on 2.63 Si < son dos n
umeros reales, denimos los intervalos
acotados de extremos y como
], [ = {x R | < x < },

[, ] = {x R | x },

], ] = {x R | < x },

[, [ = {x R | x < }.

Los intervalos no acotados de extremo son:


], +[ = {x R | < x},

[, +[ = {x R | x},

], [ = {x R | x < },

], ] = {x R | x }.

Consideraremos tambien como intervalo a ], +[ = R.


Teorema 2.64 Un subconjunto I R es un intervalo si y s
olo si cuando tres
n
umeros reales cumplen < < y , I, tambien I.
n: Es evidente que los intervalos cumplen esta propiedad. Sea
Demostracio
ahora I R un conjunto que la cumpla y veamos que es un intervalo. Podemos
suponer que I es estandar. Si I = , entonces I = ]0, 0[, luego podemos suponer
que existe un x I, que podemos tomar estandar.
Si I = {x}, entonces I = [x, x], luego podemos suponer que I contiene otro
punto adem
as de x, No perdemos generalidad si suponemos que [x, x ] I,
donde x < x son ambos estandar.
Si I = R, tambien es, por denici
on, un intervalo, luego podemos suponer
que existe un y R \ I (tambien estandar). Vamos a suponer que x < x < y.
La alternativa es y < x < x , en cuyo caso razonaramos analogamente.
Fijamos k N innito y consideramos la sucesi
on ai = x + i/k. Tenemos

/ I. Por consiguiente, tiene
que a0 = x I, mientras que ak2 > y, luego ak2
que haber un i tal que ai I, pero ai+1
/ I.
Observemos que ai < y o, de lo contrario, x < y < ai implicara que y I,

luego ai es nito, luego podemos tomar = ai = ai+1 . As, R esta


innitamente cerca de puntos de I y de puntos de R \ I.
Se cumple que x < x . Veamos que
[x, [ I ], ] .

2.6. Consecuencias de la completitud de R

75

Si no se da la primera inclusi
on, existe x < u < estandar tal que u
/ I,
pero entonces x < u < ai , luego u I, contradicci
on. Si no se da la segunda
inclusi
on, existe u > estandar tal que u I, pero entonces x < ai+1 < u,
luego ai+1 I, contradicci
on.
Si I = ], ] o I = ], [, ya tenemos que I es un intervalo. En caso
contrario, existe un z < x estandar tal que z
/ I. Razonando ahora con z y con
x igual que antes hemos razonado con x y con y, podemos construir un R
tal que x < x y de modo que tiene innitamente cerca puntos de I
y puntos de R \ I. De aqu se sigue, a su vez, que
], [ I [, ].
En efecto, si existiera < u < estandar tal que u
/ I, tomando un 


on; y si
que s que este en I, tendramos < u < x , luego u I, contradicci
existiera un u I estandar tal que u < , entonces tomando  que no
este en I, sera u <  < x , con lo que  I, contradicci
on.
La doble inclusi
on que hemos obtenido implica que I es uno de los cuatro
intervalos acotados de extremos y .
La completitud de R tiene una interpretaci
on geometrica: la posibilidad de
poner en correspondencia los n
umeros reales con los puntos de una recta:
En principio, elegimos dos puntos a los que asignar arbitrariamente los
n
umeros 0 y 1, de modo que la longitud del segmento de extremos 0 y 1
se convierte en la unidad de medida, o la escala de la representacion.
Cada n
umero entero n se representa6 a |n| unidades de distancia del 0, en
la semirrecta que contiene al 1 si n > 0 y en la opuesta si n < 0.
Para representar un n
umero racional m/n, dividimos la unidad en n partes
iguales y lo situamos a una distancia del 0 igual a |m| de estas partes, en
la semirrecta que corresponda a su signo. Se cumple as que la ordenaci
on
de los n
umeros racionales se corresponde con la ordenacion geometrica de
los puntos de la recta: si, como es habitual, hemos puesto el 1 a la derecha
del 0, entonces un n
umero racional es mayor cuanto m
as a la derecha esta
su punto correspondiente.

1
2

Un punto P de la recta no tiene por que tener asignado de este modo un


n
umero racional, pero divide a los n
umeros racionales en dos partes: los
que estan a su izquierda y los que est
an a su derecha. Estos dos subconjuntos A y B de Q forman una secci
on (si entendemos que A contiene al
6 SI el lector se pregunta d
onde hay que poner los n
umeros innitos, la respuesta es que en
el mismo lugar donde pondra un n
umero n en general, sin especicar cu
al.

76

Captulo 2. Los n
umeros reales
propio punto cuando este es racional). De este modo, podemos asignar a
P el supremo de A. Recprocamente, a cada n
umero real x le asignamos
el u
nico punto de la recta que est
a a la derecha de los n
umeros racionales
menores que x y a la izquierda de los n
umeros racionales mayores que x.

Captulo III

Calculo diferencial de una


variable
3.1

La gr
aca de una funci
on

En este captulo iniciaremos el estudio analtico de las funciones de una


variable real, es decir, de funciones f : D R R. En la mayora de los
casos, el dominio D de las funciones que estudiaremos sera un intervalo o una
uni
on de intervalos disjuntos.
Una forma de visualizar las funciones mnimamente razonables es a traves
de su gr
aca:
Denici
on 3.1 La gr
aca de una funci
on f : D R R es el conjunto1
f = {(x, y) R2 | x D, y = f (x)}.
Puesto que R puede representarse como una recta, tenemos que, a traves de
un sistema de ejes cartesianos, R2 puede representarse como el conjunto de los
puntos del plano, y f resulta ser una curva en el plano.
Ejemplo La gura muestra la gr
aca de la funci
on
f : [2, 2] R dada por

f (x) =
-2

-1

x3 x + 1
.
3

Podemos observar que, para valores peque


nos de x, la
funci
on f toma valores negativos y es creciente. Toma
-2
el valor 0 en un n
umero situado en el intervalo ]2, 1[
y sigue creciendo hasta tomar un valor m
aximo en el intervalo ]1, 0[, luego
-1

1 En realidad, seg
un la denici
on de funci
on que hemos dado, se cumple que f = f , pero
en la pr
actica podemos olvidar este hecho igual que podemos olvidar que los n
umeros
reales son clases de equivalencia de sucesiones de Cauchy de n
umeros racionales.

77

78

Captulo 3. Calculo diferencial de una variable

decrece hasta alcanzar un mnimo en el intervalo ]0, 1[ y, a partir de ese punto,


vuelve a crecer.
Las tecnicas analticas que vamos a presentar aqu nos permitir
an deducir
estas caractersticas de f y otras muchas a partir de la propia expresi
on que la
dene, aunque no dispongamos de una representaci
on gr
aca.
2
1.5
1
0.5
-2

-1

1
-0.5
-1
-1.5
-2

Ejemplo Una funci


on puede tener un aspecto sustancialmente diferente al que mostraba la funci
on del
ejemplo anterior. Por ejemplo, aqu tenemos la graca
de la funci
on g : [2, 2] R dada por
x

si x = 1,
2
g(x) = x 1
0
si x = 1.

Vemos que esta funcion consta de tres piezas (cinco, en realidad, puesto
que la gr
aca tambien contiene a los puntos (1, 0) y (1, 0)). En otras palabras,
lo que tenemos ahora es que, al contrario de lo que suceda con la funci
on f del
ejemplo precedente, la gr
aca de g no puede dibujarse de un solo trazo. En
la seccion siguiente expresaremos esta diferencia diciendo que f es continua en
[2, 2], mientras que g es discontinua en los puntos 1.

3.2

Funciones continuas

Vamos a plasmar formalmente la diferencia que hemos observado entre las


funciones de los dos ejemplos de la seccion anterior. M
as concretamente, queremos denir la noci
on de continuidad de una funci
on en un punto x de modo que
garantice que la funci
on no dar
a ning
un salto en x, es decir, de modo que los
puntos cercanos a x tengan sus imagenes cerca de f (x). En principio, cerca
es un termino relativo, pero deja de serlo si lo precisamos como innitamente
cerca:
Denici
on 3.2 Sea f : D R R una funci
on estandar. Diremos que f
es continua en un punto est
andar x0 D si cuando x D cumple x x0 ,
entonces f (x) f (x0 ). Diremos que f es continua en D si lo es en todos sus
puntos.2
Notemos que si x = x0 se cumple trivialmente f (x) f (x0 ), luego al aplicar
la denici
on de continuidad podemos suponer siempre que x = x0 .
Vamos a discutir, seg
un esta denici
on, los ejemplos de la seccion precedente,
incluso ligeramente generalizados:
2 Recordemos que el principio de estandarizaci
on nos garantiza que una denici
on particularizada a datos est
andar (en este caso una funci
on est
andar y un punto est
andar) admite
una u
nica extensi
on a datos cualesquiera, que adem
as es interna. (Vease la discusi
on tras la
denici
on de convergencia 2.29. As pues, la noci
on de continuidad es interna. En lo sucesivo
no volveremos a hacer esta clase de observaciones, sino que el lector deber
a tener presente
que, para denir un concepto interno, basta hacerlo sobre conjuntos est
andar y no importa
que la denici
on sea externa.

3.2. Funciones continuas


Ejemplo

79

La funci
on f : R R dada por
f (x) =

x3 x + 1
3

es continua en R.
En efecto, se trata de una funci
on estandar y basta probar que es continua
en cualquier punto x0 R estandar. Ahora bien, si x x0 , las propiedades
algebraicas de la proximidad innita (recogidas en el teorema 2.22) nos dan que
(x3 x + 1)/3 (x30 x0 + 1)/3, es decir, tenemos que f (x) f (x0 ), luego f
es continua en x0 .
Ejemplo

La funci
on g : R R dada por
x

si x = 1,
2
g(x) = x 1

0
si x = 1,

es continua excepto en los puntos 1.


En efecto, veamos que si x0 R es un punto est
andar distinto de 1,
entonces g es continua en x0 . Para ello tomamos x x0 y observamos que
x2 1 x20 1 = 0, luego ni x2 1 ni x20 1 son innitesimales, luego sus
inversos son nitos, luego el teorema 2.22 nos permite armar que
x
x0
2
.
x2 1
x0 1
As pues, g(x) g(x0 ).
En cambio, si x0 = 1, tomamos x x0 , x = x0 y observamos que, como
antes, x2 1 x10 1 = 0, luego x2 1 es un innitesimo, luego 1/(x2 x) es
innito, y tambien ha de serlo g(x) = x/(x2 1). (Si fuera nito, despejando
tendramos que x = g(x)(x2 1) sera innitesimal, pero no lo es.) As pues,
g(x)  g(x0 ) = 0.
Por lo tanto, g es discontinua en 1. M
as precisamente, hemos visto que g
es innita en los puntos innitamente cercanos a 1, tal y se ve en su graca.

Ejemplo

La funci
on f (x) =

x es continua en R.

En
andar x0 Ry otro
acil ver
efecto, tomamos un punto est
x x0 . Es f
que 3 x es nito, con lo que podemos tomar y = 3 x 3 x. Tenemos entonces
que y 3 x
x0 , luego y 3 = x0 , ya que ambos son estandar. Por consiguiente,

3 x = y 3 x, es decir, f (x) f (x ), como hab


a que probar.
0
0
El ejemplo siguiente muestra que la continuidad de una funci
on depende del
dominio en que la consideremos denida, en el sentido de que, si una funci
on es
discontinua en un punto, puede suceder que, restringida a un dominio menor,
pase a ser continua.

80
Ejemplo

Captulo 3. Calculo diferencial de una variable


La funci
on h : R R dada por

1 si x < 1,
h(x) =
2 si x 1,

es continua en todos los puntos de R excepto en x0 = 1. Sin embargo, su


restricci
on al intervalo [1, +[ es continua en todo el intervalo, incluyendo al
punto x0 = 1.
En efecto, para probar que h es continua en todo
punto x0 = 1, podemos suponer que x0 es estandar.
Si x0 < 1, entonces, para todo x x0 , se cumplir
a
f (x)
tambien x < 1, luego h(x) = 1 = h(x0 ). Si x0 > 1
razonamos igualmente. Vemos que h es continua porque las variaciones innitesimales de x0 no producen
1
ninguna variaci
on en h(x).
En cambio, para x0 = 1, consideramos un x x0 que cumpla x < x0 .
Entonces h(x) = 1  2 = h(x0 ). Vemos que h es discontinua en x0 = 1 porque
basta un desplazamiento innitesimal hacia la izquierda desde dicho punto para
que el valor de h(x) vare apreciablemente (es decir, no innitesimalmente).
Sin embargo, cuando restringimos la funci
on al intervalo D = [1, +[ y
tomamos x0 = 1, todo x D que cumpla x x0 ha de ser x x0 , con lo cual
on de continuidad.
h(x) = h(x0 ) y se cumple la denici
Un caso extremo en el que la continuidad es trivial se da cuando no es posible
incrementar innitesimalmente la variable sin salirse del dominio de la funci
on:
Denici
on 3.3 Si D R es un conjunto est
andar y x0 D es un punto
estandar, diremos que x0 es un punto aislado de D si h(x0 ) D = {x0 }, es
decir, si D no contiene puntos innitamente pr
oximos a x0 , salvo el propio x0 .
on de D.
En caso contrario se dice que x0 es un punto de acumulaci
Es evidente que una funci
on f : D R es continua en todos los puntos
aislados de D.
Ejercicio: Probar que todos los puntos de Z son aislados. Por lo tanto, toda funci
on
f : Z R es continua.

Tambien es evidente que si x0 D E R y f : E R es continua en


x0 , entonces la restriccion f |D : D R tambien es continua en x0 , pero el
recproco no es cierto, tal y como hemos visto en el u
ltimo ejemplo.
Otra consecuencia obvia de la denici
on de continuidad es que esta depende
u
nicamente del comportamiento de la funci
on sobre el halo del punto:
Teorema 3.4 Sean f, g : D R R dos funciones est
andar y sea x0 D
un punto est
andar tal que3 f |h(x0 )D = g|h(x0 )D . Entonces f es continua en
x0 si y s
olo si lo es g.
3 Notemos que, aunque el halo h(x ) sea, habitualmente, un conjunto externo, la igualdad
0
f |h(x0 )D = g|h(x0 )D tiene sentido, pues signica que f (x) = g(x) para todo x D tal que
x x0 .

3.2. Funciones continuas

81

A continuaci
on vamos a dar teoremas que garanticen que las funciones usuales son continuas (salvo en casos obvios). Para ello conviene observar que podemos denir de forma natural (punto a punto) operaciones sobre las funciones
denidas en un mismo dominio:
Denici
on 3.5 Si D R, D = , llamaremos F (D) = RD al conjunto de
todas las funciones f : D R. Notemos que podemos denir una suma y un
producto en F (D) mediante
(f + g)(x) = f (x) + g(x),

(f g)(x) = f (x)g(x).

En inmediato comprobar que, con estas operaciones, F (D) tiene estructura


de anillo. M
as a
un, podemos identicar los n
umeros reales con las funciones
constantes en D, por lo que tambien tenemos denido el producto de un n
umero
por una funci
on.
Tambien es costumbre escribir f g para indicar que f (x) g(x) para todo
x D. No obstante, hemos de tener presente que esta relacion es reexiva,
simetrica y transitiva, pero no cumple que, dadas dos funciones f , g F (D),
se de necesariamente una de las desigualdades f g o g f .
Tambien es frecuente nombrar a una funci
on por la expresi
on que la dene.
Por ejemplo, en lugar de decir que la funci
on f : R R dada por f (x) = x3
cumple que f F (R), escribiremos simplemente x3 F (R). Aqu hay que
un n
umero x R, sino la funci
on f que
entender que x3 no es el cubo de ning
acabamos de denir.
Las funciones de la forma an xn + + a1 x + a0 F (R), donde ai R, se
llaman polinomios,4 y forman claramente un subanillo R[x] F (R).
Teorema 3.6 Si dos funciones f , g : D R R son continuas en un punto
x0 D, tambien lo son f + g y f g.
n: Podemos suponer que todos los datos son estandar. Si
Demostracio
x D cumple x x0 , entonces
(f + g)(x) = f (x) + g(x) f (x0 ) + g(x0 ) = (f + g)(x0 ),
e igualmente con el producto (en cuyo caso, para que se conserven las aproximaciones, usamos que f (x0 ) y g(x0 ) son nitos porque son est
andar.)
Denici
on 3.7 Si D R es un conjunto no vaco, denimos C(D) F (D)
como el conjunto de las funciones continuas en D.
4 En realidad habr
a que distinguir entre un polinomio como objeto algebraico y la funci
on
polin
omica que dene, pero no necesitaremos entrar en esta sutileza, principalmente porque,
sobre un dominio D R innito, dos polinomios son iguales si y s
olo si denen la misma
funci
on polin
omica.

82

Captulo 3. Calculo diferencial de una variable

Es claro que C(D) es un subanillo de F (D) que contiene a su vez como


subanillo al anillo R[x] de los polinomios (ya que contiene a las constantes y a
la identidad f (x) = x).
Para que una funci
on f F (D) tenga inversa 1/f , es necesario y suciente
que f no tome el valor 0 en D. En tal caso, si f es continua, tambien lo es 1/f :
Teorema 3.8 Si D R no es vaco y f C(D) no toma el valor 0, entonces
1/f C(D).
n: Podemos suponer todos los datos estandar. Tomamos
Demostracio
x0 D estandar. Sea x D tal que x x0 . Entonces f (x) f (x0 ). Como x0 es
estandar, f (x0 ) es estandar y no nulo, luego f (x) y f (x0 ) no son innitesimales,
luego 1/f (x) 1/f (x0 ), luego 1/f es continua en x0 , luego es continua en D.

Ejemplo

La funci
on
x3 + x 3
x2 1

es continua en R \ {1, 1}.


En efecto, el numerador y el denominador son funciones continuas en R,
porque son polinomios. En particular lo son en R \ {1, 1}, y en este conjunto
el denominador no se anula, luego 1/(x2 1) es continua en ese mismo conjunto,
luego la funci
on dada es continua por ser producto de dos funciones continuas.

Teorema 3.9 Si f : D R E R, g : E R R, x0 D, f es
continua en x0 y g es continua en f (x0 ), entonces f g es continua en x0 .
n: Podemos suponer que todos los datos son estandar. As,
Demostracio
si x D cumple x x0 , tenemos que f (x) f (x0 ) y, por consiguiente,
(f g)(x) = g(f (x)) g(f (x0 )) = (f g)(x0 ),
lo que prueba la continuidad de f g en x0 .
En particular, si f es continua en D y g es continua en E, tenemos que f g
es continua en D.
Ejercicio: Probar que la funci
on valor absoluto es continua en R, mientras que la
funci
on parte entera E : R R es continua en R \ Z y discontinua en Z.

El ejemplo siguiente muestra la necesidad de tener cierta cautela a la hora


de identicar la noci
on general de funci
on con la idea intuitiva de una curva
que tal vez de algunos saltos de vez en cuando.

3.2. Funciones continuas


Ejemplo

83

La funci
on f : R R dada por

1 si x Q,
f (x) =
0 si x R \ Q,

es discontinua en todos los n


umeros reales.
En efecto, basta probar que lo es en todo x0 R estandar. Si x0 es racional,
podemos tomar x x0 irracional, y viceversa. De este modo f (x)  f (x0 ),
puesto que uno es 1 y el otro 0, luego f es discontinua en x0 .
Notemos que no es posible representar gracamente la funci
on de este ejemplo. Su gr
aca tendra el aspecto de dos lneas horizontales paralelas, una a la
altura del 0 y otra a la altura del 1, pero esta imagen no reeja las caractersticas
de f . Por ejemplo, sera indistinguible de la representaci
on gr
aca de la funci
on
1 f.
Quiz
a el lector piense que el caracter patol
ogico del ejemplo anterior se debe
precisamente al hecho de que se trata de una funci
on discontinua. Veamos ahora
un ejemplo de funci
on que es continua en muchos puntos y no por ello es menos
patol
ogica:
La funci
on f : R R dada por

1/n si x Q y n = mn{m N \ {0} | mx Z},
f (x) =
0
si x R \ Q.

Ejemplo

es continua en R \ Q y discontinua en Q. (En otras palabras, si x Q, hemos


denido f (x) como el menor denominador posible de una fracci
on x = m/n.)
Si x0 Q es estandar, entonces la fracci
on x = m/n con n mnimo tiene
numerador y denominador est
andar, luego f (x) = 1/n  0, mientras que, si
tomamos un irracional x x0 , tenemos que f (x) = 0  f (x0 ), luego f es
discontinua en Q.
Por otro lado, si x0 R \ Q es estandar y x x0 , o bien x es irracional,
en cuyo caso f (x) = 0 = f (x0 ), o bien x = m/n con n mnimo, pero n ha
de ser innito, ya que, en caso contrario, m = xn sera tambien nito y x
sera estandar, pero entonces x = x0 sera irracional. As pues, llegamos a que
f (x) = 1/n 0 = f (x0 ). Esto prueba que f es continua en x0 .
Demostramos ahora algunas propiedades importantes de las funciones continuas:
Teorema 3.10 (Primer teorema de Weierstrass) Si f : [a, b] R es
una funci
on continua, entonces alcanza un valor m
aximo y un valor mnimo
en [a, b].
n: Lo que hemos de probar es que existen puntos x, y [a, b]
Demostracio
tales que, para todo z [a, b] se cumple que f (x) f (z) f (y). Podemos
suponer que todos los datos son est
andar.

84

Captulo 3. Calculo diferencial de una variable

Por el Principio de Idealizaci


on II, existe un conjunto nito F [a, b] que
contiene a todos los elementos estandar de [a, b]. Como F es nito, existe un
r F donde f toma su valor m
aximo (esto es el teorema 1.21). Tomemos la
parte estandar5 y = r [a, b]. Vamos a probar que y cumple lo pedido.
En caso contrario, existira un z [a, b] estandar, tal que f (z) > f (y).
Ahora bien, como y r y f es continua en y, se cumple que f (y) f (r), luego
f (z) > f (r), pero esto es absurdo, ya que z F y f (r) es el mayor valor que f
toma en el conjunto F . Igualmente se razona que f alcanza un valor mnimo.
Como ya hemos se
nalado en la prueba, el teorema anterior es falso en general
para funciones denidas sobre intervalos que no sean de la forma [a, b]. Por
ejemplo, la funci
on f (x) = x es continua en el intervalo [0, 1[ y no alcanza
un valor m
aximo: dado cualquier x [0, 1[, existe otro punto (cualquiera que
cumpla x < y < 1) donde f toma un valor mayor. En este caso, todava
podemos decir que f tiene supremo en [0, 1[, en el sentido de que s = 1 es el
supremo del conjunto de los valores que f toma en el intervalo; pero, en cambio,
la funci
on 1/x, que es continua en ]0, 1], no s
olo no alcanza un valor m
aximo,
sino que ni siquiera tiene supremo.
Teorema 3.11 (Segundo teorema de Weierstrass) Si f : [a, b] R es
una funci
on continua, entonces toma todos los valores comprendidos entre f (a)
y f (b).
n: Podemos suponer que todos los datos son estandar. Si
Demostracio
f (a) = f (b) no hay nada que probar. Supongamos que f (a) < f (b). El caso
contrario es an
alogo. Tomamos un estandar tal que f (a) < < f (b) y hemos
de probar que existe un c [a, b] tal que f (c) = .
Fijemos n N innito y consideremos la sucesion xi = a + i/n. Como
xn2 > b, existe un k N tal que xk b y xk+1 > b, luego xk b, luego
f (xk ) f (b) > , luego f (xk ) > .
Como f (x0 ) = f (a) < , existe un i < k tal que f (xi ) < f (xi+1 ).
Sea c = xi = xi+1 [a, b]. Puesto que f es continua en c, se cumple que
f (c) f (xi ) f (xi+1 ), luego f (c) y, como ambos son estandar, f (c) = .
Este teorema es geometricamente evidente, y la tecnica de demostracion
tambien: para encontrar el punto donde f toma el valor , nos vamos moviendo
desde a hasta b a pasitos innitesimales y esperamos el momento (que llegara
tarde o temprano) en que f pase de ser < a ser . El punto c que buscamos
ha de estar innitamente cerca del u
ltimo paso que hemos dado.
5 En este punto es crucial que el dominio de f es un intervalo de la forma [a, b]. (No servir
a
cualquier otro tipo de intervalo.) Concretamente, ahora usamos que si se cumple x [a, b],
entonces existe x [a, b]. Esto es evidente, pues si, por ejemplo, fuera x > b, al ser x y b
est
andar, tendra que ser x > b. Esta propiedad de los intervalos [a, b] se llama compacidad.
El teorema es v
alido para funciones continuas denidas sobre cualquier conjunto compacto en
este sentido.

3.3. Funciones derivables

85

Ejercicio: Dar un ejemplo de funci


on f : [a, b] R que cumpla la propiedad del
teorema anterior pero que sea discontinua.

Una consecuencia del u


ltimo teorema es que si una funci
on continua no toma
dos veces el mismo valor, es porque siempre crece o porque siempre decrece:
Denici
on 3.12 Una funci
on f : D R R es mon
otona creciente (resp.
mon
otona decreciente) si cuando x, y D cumplen x y entonces f (x) f (y)
(resp. f (y) f (x)). Si esto se cumple con desigualdades estrictas diremos que
f es monotona creciente (o decreciente) estricta. Diremos que f es mon
otona si
es monotona creciente o monotona decreciente.
Teorema 3.13 Una funci
on continua e inyectiva f : [a, b] R es mon
otona.
n: Como es inyectiva, no puede ser f (a) = f (b). Supongamos
Demostracio
que f (a) < f (b) y veamos que f es monotona creciente. Igualmente se probara
que es decreciente si se diera la desigualdad contraria.
Si a < c < b, ha de ser f (a) < f (c) < f (b), ya que si, por ejemplo, se diera
el caso f (c) < f (a), el segundo teorema de Weierstrass aplicado al intervalo
[c, b] implicara la existencia de un d ]c, b[ tal que f (a) = f (c), y f no sera
inyectiva.
Tomemos ahora n
umeros a x < y b. Si fuera f (a) < f (y) < f (x) < f (b),
el teorema de Weierstrass aplicado al intervalo [y, b] nos dara un z [y, b] tal
que f (z) = f (x), luego f no sera inyectiva. As pues, ha de ser f (x) < f (y),
con lo que f es monotona creciente.
Terminamos con una u
ltima propiedad de las funciones continuas:
Teorema 3.14 Sean f, g : I R R dos funciones continuas en un intervalo I (que no se reduzca a un punto) y supongamos que ambas coinciden en
Q I. Entonces son iguales.
n: Podemos suponer que las funciones son est
Demostracio
andar. Dado
x I estandar, es claro que existe un x Q I tal que x x. Entonces
f (x) f (x ) = g(x ) g(x) y, como ambos son estandar, f (x) = g(x). Esto
prueba que f y g coinciden en I.
Ejercicio: Si D E R son conjuntos est
andar, se dice que D es denso en E si todo
punto est
andar de E est
a innitamente cerca de un punto de D. Demostrar que si dos
funciones continuas en E coinciden en un subconjunto denso, entonces son iguales.

3.3

Funciones derivables

Antes de entrar en el concepto que nos va a ocupar en esta seccion (la derivabilidad de funciones) vamos a ocuparnos de una cuesti
on tecnica: hemos visto
que la continuidad de una funci
on en un punto (est
andar) x depende en gran
medida del dominio de la funci
on, pues, seg
un en que dominio la consideremos,
este podr
a contener mas o menos puntos innitamente pr
oximos a x. En el caso

86

Captulo 3. Calculo diferencial de una variable

de la derivabilidad vamos a exigir que el dominio de la funci


on contenga a todos
los puntos innitamente pr
oximos a x:
Denici
on 3.15 Un conjunto est
andar D R es un entorno de un punto
estandar x0 D si h(x0 ) D. Tambien diremos que x0 es un punto interior
de D. Diremos que D es abierto si es entorno de todos sus puntos.
Ejercicio: Demostrar que los intervalos ], [, ], +[, ], [ y ], +[, son
abiertos, mientras que cualquier otro no lo es.

El concepto de derivada que ahora vamos a introducir mide la velocidad a la


que vara una funci
on cuando vara su variable. Tal vez el caso mas tpico sea el
propio concepto de velocidad. Si e(t) representa el espacio que ha recorrido un
movil hasta el instante t, la diferencia e(t + h) e(t) es el espacio que recorrera
en los pr
oximos h segundos a partir de t, (o el que ha recorrido en los u
ltimos
h segundos, con signo negativo, si h < 0). El cociente
e(t + h) e(t)
h
es entonces una aproximacion a la velocidad del m
ovil en los pr
oximos h segundos (o en los u
ltimos h segundos si h < 0, donde al dividir hemos corregido el
signo negativo del numerador).
Decimos que es una aproximacion porque si obtenemos, por ejemplo, 10 m/s,
esto no signica que, durante el tiempo h, el movil se haya movido realmente
a 10 m/s. Podra ser que se hubiera movido mucho m
as deprisa durante los
primeros instantes y mucho m
as despacio en los u
ltimos, de modo que los 10 m/s
no son m
as que la velocidad media que ha llevado en el intervalo en cuesti
on.
Cuando menor sea el valor de h, esta velocidad media se parecera mas a la
velocidad real a la que se mova en el instante t. El mayor parecido posible lo
encontraremos cuando consideremos un incremento de tiempo h innitesimal:
Denici
on 3.16 Sea f : D R R una funci
on estandar y sea x D un
punto interior est
andar. Diremos que f es derivable en x si existe un n
umero
estandar f  (x) tal que, para todo h 0, h = 0, se cumple
f (x + h) f (x)
f  (x).
h
El n
umero f  (x) (obviamente u
nico) se llama derivada de f en el punto x0 .
Si D es abierto y f es derivable en todos los puntos de D, entonces tenemos
denida la funci
on derivada f  : D R.
En estos terminos, si e(t) representa el espacio recorrido por un m
ovil hasta
un instante t, su derivada e (t) representa la velocidad del m
ovil en cada instante t. En un ejemplo como este, es razonable suponer que la funci
on e(t) sera
derivable, pero, en general, debemos tener presente que una funci
on dada puede
tener o no tener derivada en un punto dado.

3.3. Funciones derivables

87

Como en el caso de la continuidad, es inmediato que la derivabilidad de una


funci
on estandar en un punto est
andar depende u
nicamente de los valores que
toma la funci
on sobre el halo del punto. Sin embargo, como exigimos que dicho
halo este contenido en el dominio de la funci
on, resulta que la derivabilidad en
un punto no depende de que consideremos un dominio mayor o menor.
Ejemplo La funci
on f : R R dada por f (x) = x2 es derivable en R, y su

derivada es f (x) = 2x.
En efecto, basta probar que existe la derivada en un punto est
andar x R
arbitrario. Si h 0 es no nulo, entonces
f (x + h) f (x)
(x + h)2 x2
x2 + 2xh + h2 x2
=
=
= 2x + h 2x,
h
h
h
luego6 f  (x) = 2x.
La derivabilidad es una propiedad m
as fuerte que la continuidad:
Teorema 3.17 Si una funci
on f : D R R es derivable en un punto
x0 D, entonces es continua en x0 .
n: Podemos suponer que todos los datos son estandar. ToDemostracio
memos x x0 , x = x0 , y llamemos h = x x0 . Por la denici
on de derivada
tenemos que
f (x) f (x0 )
f  (x0 ),
h
luego f (x) f (x0 ) hf  (x0 ) 0, luego f (x) f (x0 ). Esto signica que f es
continua en x0 .
Interpretaci
on geom
etrica de la derivada Sea f : D R R una
funci
on estandar derivable en un punto est
andar x0 D. Consideremos la
gr
aca de f :
f = {(x, y) R2 | x D, y = f (x)}.
Llamemos m = f  (x0 ) y consideremos la funci
on t(x) = x0 + m(x x0 ), cuya
gr
aca es la recta que pasa por el punto (x0 , f (x0 )) con pendiente m.
Fijado un n
umero real r > 0, la homotecia de radio r y centro (x0 , y0 ) es la
aplicaci
on Hr : R2 R2 dada por
Hr (u, v) = (x0 , y0 ) + r(u x0 , v y0 ).
6 Una de las mayores cr
ticas que reciba el c
alculo diferencial en sus inicios era el hecho
de que los matem
aticos tomaban cantidades innitesimales h que consideraban no nulas al
aceptarlas como denominadores v
alidos de los cocientes que denen a la derivadas, pero que,
al nal del c
alculo, las eliminaban consider
andolas nulas, como nosotros acabamos de eliminar
la h de la expresi
on 2x+h. Observemos que nuestra denici
on de derivada justica totalmente
estos hechos.

88

Captulo 3. Calculo diferencial de una variable

Geometricamente se puede calcular as: trazamos la recta que une (x0 , y0 )


con (u, v) y movemos (u, v) por dicha recta hasta que su distancia a (x0 , y0 ) se
multiplique por r. Si r > 1 estamos aplicando al plano una lupa de r aumentos
que deja jo al punto (x0 , y0 ). Es claro que Hr tambien deja invariantes a las
rectas que pasan por (x0 , y0 ).
Vamos a considerar, concretamente, una homotecia de centro (x0 , f (x0 )) y
radio innito r. Al aplic
arsela a la gr
aca de t obtenemos nuevamente la graca
de t, pues es una recta que pasa por el centro de la homotecia.
Veamos que obtenemos cuando se la aplicamos a la graca f . Obviamente,
llegamos al conjunto
rf = {(x0 + r(u x0 ), f (x0 ) + r(f (u) f (x0 ))) R2 | u D}.
Tomemos un par estandar (x, y) que este innitamente pr
oximo a un punto
(x , y  ) rf (en el sentido de que x x , y y  ). Entonces
x x = x0 + r(u x0 ),
para cierto u D, que cumplir
a
u x0 +

x x0
= x0 + h,
r

donde h es innitesimal. Como f es continua en x0 , tenemos que


y y  = f (x0 ) + r(f (u) f (x0 )) f (x0 ) + r(f (x0 + h) f (x0 ))
As pues,
y f (x0 ) +

f (x0 + h) f (x0 )
(x x0 ) f (x0 ) + m(x x0 ) = t(x),
h

luego y = t(x).
Hemos probado que los puntos nitos de rf estan innitamente cerca de los
puntos est
andar de la recta t(x). Recprocamente, si x R es cualquier punto
estandar, una comprobaci
on an
aloga muestra que el punto (x, t(x)) de la recta
t(x) esta innitamente cerca del punto de rf determinado por el par
ametro
u D que cumple
x = x0 + r(u x0 ).
(Se cumple que u D porque u x0 D y D es abierto.) En denitiva:
Cuando ampliamos innitamente la gr
aca de f alrededor del punto
(x0 , f (x0 )), esta se convierte en una curva innitamente pr
oxima a
la recta
y = x0 + f  (x0 )(x x0 ).
Esta recta recibe el nombre de recta tangente a la gr
aca de f en el
punto (x0 , f (x0 )).

3.3. Funciones derivables

89

El punto crucial es que decir que una recta se parece a la gr


aca de f
alrededor de x0 en el sentido de que, para puntos innitamente pr
oximos,la
diferencia es innitesimal, es no decir nada. Eso lo cumplen todas las rectas
(estandar) que pasan por (x0 , f (x0 )). (En efecto: si g(x0 ) = f (x0 ), por la mera
continuidad, cuando x x0 , se cumple que g(x) f (x0 ) f (x)). Lo que
distingue a la recta tangente de las dem
as rectas es que la diferencia entre f (x)
y t(x) sigue siendo inapreciable (innitesimal) cuando aplicamos una homotecia
que hace apreciable (es decir, nita, pero no innitesimal) la diferencia entre x
y x0 .
La gura muestra la gr
aca de f (x) = x2 y su
recta tangente para x = 1, que, seg
un hemos cal1 + 2(x 1) culado, tiene pendiente f  (1) = 2. Podemos ver el
parecido entre ambas para puntos cercanos a x = 1.
Esto solo signica que, para puntos a una distancia
apreciable, pero peque
na, de x0 , la diferencia es apreHr
ciable, pero peque
na. Lo que hemos probado es que si
ampliamos innitamente la gura, la diferencia entre
1
ambas seguira siendo inapreciable.
x2

En la pr
actica, una homotecia de radio sucientemente grande provoca el
mismo efecto sobre una curva derivable. Por ejemplo, cuando miramos hacia el
mar, el horizonte es un arco de circunferencia que resulta indistinguible de una
lnea recta.
Ejercicio: Denimos el halo de rf como el conjunto de todos los puntos de R2 innitamente pr
oximos a puntos de rf . Probar que la recta tangente es la estandarizaci
on
del halo de rf .

Esta interpretaci
on geometrica esta estrechamente relacionada con la interpretaci
on de la derivada como incremento instant
aneo. Por ejemplo, si e(t) = t2
es la posicion que ocupa un m
ovil que se desplaza sobre una recta, sabemos que
su velocidad es v(t) = 2t, lo que signica que est
a acelerando de forma continua,
puesto que su velocidad es cada vez mayor. Si en el instante t = 1 dejara de
acelerar, a partir de ese momento su posicion ya no sera t2 , sino que pasara a
moverse a velocidad constante v = 2 y su posici
on en cada instante vendra dada
por la recta tangente e(t) = 1 + 2(t 1). Podemos decir que la recta tangente
en un punto x representa lo que sera la gr
aca de la funci
on si, desde el punto
x, mantuviera constante su tasa de crecimiento.
Nos ocupamos ahora del calculo explcito de derivadas:
Teorema 3.18 Consideremos dos funciones f , g : D R R y un punto
interior x D. Entonces:
a) Si f es constante, entonces es derivable y f  (x) = 0.
b) Si f y g son derivables en x, tambien lo son f + g y f g, y
(f + g) (x) = f  (x) + g  (x),

(f g) (x) = f  (x)g(x) + f (x)g  (x).

90

Captulo 3. Calculo diferencial de una variable


c) Si f es derivable en x y R, entonces f tambien es derivable en x y
(f ) (x) = f  (x).
d) Si f y g son derivables en x y g no se anula en D, entonces f /g es
derivable en x y
(f /g) (x) =

f  (x)g(x) f (x)g(x)
.
g(x)2

n: Veremos solo el caso del producto y del cociente. Podemos


Demostracio
suponer todos los datos estandar. Para derivar f g tomamos h 0 no nulo y
calculamos
f (x + h)g(x + h) f (x)g(x)
h
=

f (x + h)g(x + h) f (x + h)g(x) f (x + h)g(x) f (x)g(x)


+
h
h
= f (x + h)

g(x + h) g(x)
f (x + h) f (x)
+ g(x)
h
h
f (x)g  (x) + g(x)f  (x),

donde hemos usado que f es continua en x.


Para el cociente tenemos
f (x+h)
g(x+h)

f (x)
g(x)

h
=

f (x + h)g(x) f (x)g(x + h)
hg(x + h)g(x)

f (x + h)g(x) f (x)g(x) + f (x)g(x) f (x)g(x + h)


hg(x + h)g(x)

f (x+h)f (x)
g(x)
h

f (x) g(x+h)g(x)
f  (x)g(x) f (x)g(x)
h
.

g(x + h)g(x)
g(x)2

Ejercicio: Probar inductivamente que si, para n N \ {0}, la funci


on f (x) = xn es
derivable en R y f  (x) = nxn1 . Generalizar la f
ormula para n Z y x R \ {0}.

Teorema 3.19 (Regla de la cadena) Consideremos dos funciones


f : D R E R,

g : E R R.

Si f es derivable en un punto x y g es derivable en f (x), entonces (f g) es


derivable en x, y (f g) (x) = g  (f (x))f  (x).

3.3. Funciones derivables

91

n: Podemos suponer que todos los datos son estandar. Sea


Demostracio
h 0 no nulo. Entonces
g(f (x + h)) g(f (x))
g(f (x + h)) g(f (x)) f (x + h) f (x)
=
h
f (x + h) f (x)
h
g  (f (x))f  (x).
Aqu hemos supuesto que f (x + h) f (x) = 0, pero si f (x + h) f (x) = 0,
entonces el miembro izquierdo vale 0 y, por otra parte,
f  (x)

f (x + h) f (x)
= 0,
h

luego f  (x) = 0 y sigue siendo cierto que


g(f (x + h)) g(f (x))
g  (f (x))f  (x).
h
esto prueba la derivabilidad de la funci
on compuesta.
Veamos ahora algunos ejemplos de funciones no derivables:
Ejemplo

La funci
on valor absoluto es derivable en R excepto en 0.
|x|

En efecto, la funci
on valor absoluto viene dada por

x si x 0,
|x| =
x si x 0.

Dado un n
umero real estandar x, si x < 0 entonces la
funci
on valor absoluto coincide en todo el halo h(x) con la funci
on x, que es
derivable y su derivada es 1. Igualmente, si x > 0 la funci
on valor absoluto
coincide en h(x) con la funci
on x, que tiene derivada 1, luego el valor absoluto
es derivable en todo x no nulo. Para x = 0 tomamos un innitesimo h = 0 y
calculamos
|h| |0|
|h|
=
.
h
h
Observamos que este cociente toma el valor 1 o 1 seg
un el signo de h, luego
no hay un u
nico n
umero estandar que este innitamente pr
oximo a todos los
valores que puede tomar este cociente. Por consiguiente, no existe la derivada
en x = 0. Hemos obtenido que la derivada es

1 si x < 0,
|x| =
1 si x > 0.
En general, la no derivabilidad se traduce en que la gr
aca de la funci
on
tiene un pico en el punto. Si aplicamos una homotecia de radio innito y
centro (0, 0), la gr
aca del valor absoluto seguir
a teniendo exactamente el mismo
aspecto que tiene en la gura, con su pico, de modo que no se parecer
a a una
recta. Alternativamente, la gura muestra tambien que no hay ninguna recta

92

Captulo 3. Calculo diferencial de una variable

que pase por (0, 0) y que pueda confundirse con la gr


aca de la funci
on para
valores innitesimales de x: si se parece a la graca para valores positivos, ser
a
muy distinta para valores negativos, y viceversa.
Ahora veamos un ejemplo en el que la gr
aca de una funci
on no tiene ning
un
pico en un punto y se parece a una recta en un entorno innitesimal del punto
y, pese a ello, la funci
on no es derivable en dicho punto:
Ejemplo La funci
on f (x) =
derivada es

x es derivable en R excepto en x = 0, y su

1
f  (x) =
.
3
2 x2

En efecto, de la identidad x3 1 = (x 1)(x2 + x + 1) se deduce, cambiando


x por x/y y multiplicando por y 3 , que
x3 y 3 = (x y)(x2 + xy + y 2 ).
Tomemos ahora un x R estandar no nulo y un innitesimo h no nulo.
Calculamos

3
3
( 3 x + h 3 x)( 3 (x + h)2 + 3 x + h 3 x + x2 )
x+h 3x


=

3
h
h( 3 (x + h)2 + 3 x + h 3 x + x2 )
=

h(


3

x+hx
1

= 

3
3
3
3
3
3
(x + h)2 + x + h x + x2 )
(x + h)2 + x + h 3 x + x2
1

.
3
3 x2

En el u
ltimo paso hemos usado que la funci
on 3 x es continua, tal y como
lo hemos demostrado en el ejemplo de la pagina 79. Esto prueba la existencia
de la derivada. Sin embargo, si x = 0, tenemos que

3
h 30
1
=
3
h
h2

3
es innito, yaque, si y = h2 , entonces y 3 h2 0, luego y 3 = 0, luego
3
y = 0, luego h2 0. As pues, el cociente no esta innitamente pr
oximo a
ning
un n
umero estandar.
1
0.5

-2

-1

1
-0.5
-1

La gr
aca muestra lo que sucede: la graca tiene una recta tangente en el punto (0, 0),
pero esta es vertical, y su pendiente es, por
lo tanto, innita. Si le aplicamos a la gr
aca
una homotecia de radio innito con centro
(0, 0), obtenemos la recta vertical x = 0. La
derivada de una funci
on en un punto es la
pendiente de la recta tangente a la gr
aca en

3.3. Funciones derivables

93

dicho punto, puede no existir porque no exista tal recta (como en el caso del
valor absoluto) o porque la recta tangente sea vertical, como en este caso.
Veamos ahora algunas relaciones entre las derivadas y el comportamiento de
las funciones.
Denici
on 3.20 Una funci
on estandar f : ]a, b[ R tiene un m
aximo local
(resp. mnimo local) en un punto est
andar x0 ]a, b[ si para todo x x0 se
cumple que f (x) f (x0 ) (resp. f (x) f (x0 )). Si la condici
on se cumple
con desigualdades estrictas diremos que f tiene un m
aximo o un mnimo local
estricto en x0 .
Es obvio que si f toma en x0 su valor m
aximo o su valor mnimo (y, en tal
caso, diremos que f tiene un m
aximo global o un mnimo global en x0 ), entonces
tambien tiene un m
aximo o un mnimo local en x0 .
Teorema 3.21 Si una funci
on derivable f : ]a, b[ R tiene un m
aximo o un
mnimo local en un punto x0 de su dominio, entonces f  (x0 ) = 0.
n: Podemos suponer que todos los datos son estandar. Si
Demostracio
f  (x0 ) > 0, entonces, para todo x x0 se cumple que
f (x) f (x0 )
f  (x0 ) > 0,
x x0
luego tambien el cociente es > 0 y, si x > x0 , tenemos que f (x) f (x0 ) > 0,
es decir, f (x) > f (x0 ), lo que prueba que x0 no es un m
aximo local. Si x < x0
obtenemos que f (x) < f (x0 ), luego x0 tampoco es un mnimo local. En el caso
f  (x0 ) < 0 razonamos analogamente.
Ejemplo

La gr
aca de la p
agina 77 muestra que la funci
on
f (x) =

x3 x + 1
3

tiene un m
aximo y un mnimo local. Vamos a calcularlos.
Para ello calculamos la derivada f  (x) = 3x 31 y buscamos los puntos donde

se anula, que son claramente


1/ 3. Seg
un la gr
aca, 1/ 3 ha de ser el

maximo local y 1/ 3 ha de ser el mnimo local. Podemos llegar a la misma


conclusi
on sin mirar la gr
aca. Para ello argumentamos que f  ha de tener el
mismo signo en todos los puntos de cada intervalo







, 1/ 3 ,
1/ 3, 1/ 3 ,
1/ 3, + ,
2

ya que es claramente continua y en ellos no toma el valor 0. Si tomara signos


distintos, debera anularse, por el segundo teorema de Weierstrass. Basta evaluar f  en un punto cualquiera de cada intervalo para concluir que la derivada
es positiva en el primero, negativa en el segundo y positiva en el tercero.

94

Captulo 3. Calculo diferencial de una variable

Ahora bien, que la derivada sea positiva signica que, en todo punto, la
funci
on experimenta incrementos positivos ante incrementos positivos de la variable, luego ha de ser creciente en los intervalos primero y tercero, mientras
que, an
alogamente, ha de ser decreciente en el segundo, ya que, en este intervalo, incrementos positivos de la variable dan
lugar a incrementos negativos de
la funci
on.7 Por consiguiente, el punto 1/ 3, donde la funci
on pasa
de ser creciente a ser decreciente, ha de ser un maximo local, mientras que 1/ 3, donde
pasa de ser decreciente a ser creciente, ha de ser un mnimo local.
Ahora vamos a demostrar la relaci
on que acabamos de utilizar entre el signo
de la derivada y la monotona de una funci
on. En realidad vamos a obtener
mucho mas que esto:
Teorema 3.22 (Teorema de la funci
on inversa) Sea f : ]a, b[ R una
funci
on derivable cuya derivada nunca tome el valor 0. Entonces:
a) f es estrictamente mon
otona.
b) Si f es mon
otona creciente, entonces f  (x) > 0 para todo x ]a, b[.
c) Si f es mon
otona decreciente, entonces f  (x) < 0 para todo x ]a, b[.
d) Existe un intervalo abierto I tal que f : ]a, b[ I es biyectiva.
e) La funci
on f 1 : I ]a, b[ es derivable y, si x ]a, b[ y llamamos
y = f (x) I, se cumple que
(f 1 ) (y) =

1
f  (x)

n: Podemos suponer que los datos son estandar. La funci


Demostracio
on
f ha de ser inyectiva, pues si existieran n
umeros a < x < y < b tales que
f (x) = f (y), el teorema anterior aplicado al intervalo [x, y] nos dara un punto
donde la derivada de f valdra 0.
Por el teorema 3.13, sabemos que f es monotona (estricta, porque es inyectiva). Si es mon
otona creciente, entonces, para todo x ]a, b[ estandar y todo
h 0 no nulo, tenemos que
f (x + h) f (x)
> 0,
h
luego tambien f  (x) > 0. Igualmente se razona que si f es decreciente la derivada
es negativa.
Sea I la imagen de f , de modo que f : ]a, b[ I biyectiva. Hemos de
probar que I es un intervalo abierto. Supongamos que f es monotona creciente.
7 Esto es lo que cabe esperar que suceda, teniendo en cuenta la interpretaci
on de la derivada
como el incremento instant
aneo de la funci
on. No obstante, todava no hemos demostrado
que una funci
on con derivada positiva es creciente y una funci
on con derivada negativa es
decreciente. Lo probamos justo a continuaci
on.

3.3. Funciones derivables

95

En el caso contrario se razona an


alogamente. Probaremos que I es un intervalo
mediante el teorema 2.64. Si , I y < < , entonces existen x, y ]a, b[
tales que f (x) = , f (y) = . Por la monotona, ha de ser x < y. Por el
teorema 3.11 existe un z ]x, y[ tal que f (z) = , luego I.
Falta probar que I es abierto. Esto es consecuencia de que, si I, entonces
existe un x ]a, b[ tal que f (x) = . Si h > 0 es innitesimal, entonces
x h < x < x + h, luego f (x h) < < f (x + h) y los dos extremos estan en I,
luego no puede ser uno de los extremos de I. En otras palabras, los extremos
de I no pertenecen a I, luego I es un intervalo abierto.
Sea h 0 no nulo y sea h = f 1 (y + h) f 1 (y) = 0, de modo que
f 1 (y + h) = x + h ,
luego f (x + h ) = f (x) + h. Observemos que h es innitesimal, pues si no lo
fuera habra un n
umero estandar r entre x y x + h , con lo que f (r) estara entre

f (x) y f (x + h ), con lo que f (x)  f (x + h ) y h  0.
Ahora basta observar que
f 1 (y + h) f 1 (y)
h
=
=
h
f (x + h ) f (x)

1
f (x+h )f (x)
h

1
f  (x)

Por consiguiente (f 1 ) (y) = 1/f  (x).


Por ejemplo, ahora podemos calcular f
acilmente la derivada de la raz n-sima:

Teorema 3.23 La funci


on f (x) = n x es derivable en ]0, +[ y su derivada
es
1
f  (x) =
.
n
n xn1
n: La funci
Demostracio
on g : ]0, +[ ]0, +[ dada por g(y) = y n

es derivable y su derivada g (y) = ny n1 no se anula. Su inversa es claramente
la funci
on f del enunciado, luego, por el teorema anterior, es derivable, y si
x = y n , tenemos que
f  (x) =

1
1
1
=
.
=
n
g  (y)
ny n1
n xn1

Ejercicio: Probar que si f : ]a, b[ R es derivable y su derivada toma valores


positivos y negativos, entonces tambien toma el valor 0. Generalizar este hecho para
probar que si f  (u) < < f  (v), existe un w entre u y v tal que f  (w) = .
Ejercicio: Supongamos que f : [a, b] R es continua en [a, b] y derivable en ]a, b[ y
que la derivada no se anula en ning
un punto. Demostrar que f es mon
otona estricta
en [a, b]. (El teorema de la funci
on inversa s
olo prueba que lo es en ]a, b[.)

Es evidente que las funciones constantes tienen derivada nula. En cambio, no


es tan f
acil probar que si una funci
on tiene derivada nula (en todos los puntos)

96

Captulo 3. Calculo diferencial de una variable

es necesariamente constante. Esto es una consecuencia del llamado teorema


del valor medio, que deduciremos de un resultado ligeramente m
as general.
Previamente, necesitamos el siguiente hecho elemental:
Teorema 3.24 (Teorema de Rolle) Si f : [a, b] R es una funci
on continua en [a, b] y derivable en ]a, b[ y f (a) = f (b), entonces existe un c ]a, b[ tal
que f  (c) = 0.
n: Si f es constante, entonces su derivada vale 0 en todos los
Demostracio
puntos. En caso contrario, existe un punto x ]a, b[ tal que f (x) = f (a). Esto
implica que, o bien f no toma su maximo valor en a y en b, o bien f no toma
su mnimo valor en dichos puntos.
Por el teorema 3.10 existen puntos en [a, b] donde f toma su maximo valor
y su mnimo valor. Seg
un lo dicho, uno de ellos, digamos c, es distinto de a
y b. Si f toma un valor m
aximo o mnimo global en c ]a, b[, entonces toma
tambien un m
aximo o mnimo local y, por el teorema anterior, f  (c) = 0.
Teorema 3.25 (Teorema de Cauchy) Sean f , g : [a, b] R funciones
continuas en [a, b] y derivables en ]a, b[. Existe un c ]a, b[ tal que
f  (c)(g(b) g(a)) = g  (c)(f (b) f (a)).
n: Llamemos h(x) = f (x)(g(b) g(a)) g(x)(f (b) f (a)),
Demostracio
que es una funci
on continua en [a, b] y derivable en ]a, b[. Adem
as
h(b) = h(a) = g(b)f (a) f (b)g(a).
El teorema de Rolle nos da un punto c ]a, b[ donde h (c) = 0, pero esto es
la f
ormula del enunciado.
El teorema siguiente es el caso particular del anterior cuando tomamos como
funci
on g la identidad g(x) = x:
Teorema 3.26 (Teorema del valor medio) Sea f : [a, b] R una funci
on
continua en [a, b] y derivable en ]a, b[. Entonces existe un c ]a, b[ tal que
f (b) f (a) = f  (c)(b a).
Como consecuencia podemos probar lo que habamos armado:
Teorema 3.27 Si una funci
on f : [a, b] R es continua en [a, b] y tiene
derivada nula en ]a, b[, entonces es constante.
n: Para cualquier par de puntos u, v [a, b], el teorema
Demostracio
anterior nos da que f (u) f (v) = 0.
Equivalentemente, si dos funciones f , g : ]a, b[ R son derivables y f  = g  ,
entonces f = g + k, para cierto k R.

3.3. Funciones derivables

97

Otra aplicaci
on del teorema del valor medio es el estudio de la concavidad o
convexidad de una funci
on. La interpretaci
on geometrica de la concavidad y la
convexidad es que una funci
on es convexa si al unir dos puntos de su gr
aca con
un segmento L, este queda por encima de la graca, mientras que es concava si
queda por debajo.

f
L

f
x z
y
Funci
on convexa

x z
y
Funci
on concava

Para concretar, jemos una funci


on f : [a, b] R y consideremos dos
puntos a x < y b. Llamemos L : [x, y] R a la funci
on dada por
L(z) = f (x) +

f (y) f (x)
(z x),
yx

cuya gr
aca es claramente el segmento que une el punto (x, f (x)) con (y, f (y)).
La funci
on f sera convexa si f (z) L(z) para todo punto x < z < y, y sera
concava si se da la desigualdad contraria. No obstante, vamos a reformular esto
de una forma m
as conveniente.
Para ello observamos que la funci
on g() = (1 )x + y cumple g(0) = x,
g(1) = y y g  () = y x > 0, de donde se deduce que g : [0, 1] [x, y] es
biyectiva y creciente.
As pues, cada punto x < z < y se expresa de forma u
nica como
z = (1 )x + y,

0 < < 1.

En estos terminos,
L(z) = L(x (y x)) = f (x) + (f (y) f (x)) = (1 )f (x) + f (y).
As pues, podemos dar la siguiente denici
on de concavidad y convexidad:
Denici
on 3.28 Una funci
on f : [a, b] R es convexa si para todo par de
puntos a x < y b y todo n
umero 0 < < 1 se cumple que
f ((1 )x + y) (1 )f (x) + f (y).
Si se da la desigualdad contraria, la funci
on es c
oncava.
Por ejemplo, la gr
aca de la p
agina 77 muestra que la funci
on
f (x) =

x3 x + 1
3

es concava en ], 0] y es convexa en [0, +[. El teorema siguiente nos da la


forma de comprobarlo analticamente:

98

Captulo 3. Calculo diferencial de una variable

Teorema 3.29 Sea f : [a, b] R una funci


on continua en [a, b] y derivable
en ]a, b[. Si f  es mon
otona creciente (resp. decreciente) en ]a, b[, entonces f es
convexa (resp. c
oncava) en [a, b].
n: Supongamos que f  es creciente (el caso contrario es
Demostracio
an
alogo). Tomemos a x < y b y 0 < < 1 y llamemos z = (1)x+y. Hemos de probar que f (z) (1)f (x)+f (y). Como f (z) = (1)f (z)+f (z),
esto equivale a
(1 )f (z) + f (z) (1 )f (x) + f (y),
o
(1 )(f (z) f (x)) (f (y) f (z)).
Por el teorema del valor medio, existen n
umeros x < c < z < d < y tales
que
f (z) f (x) = f  (c)(z x),
f (y) f (z) = f  (d)(y z).
Por otra parte,
(1 )(z x) = (1 )((1 )x + y x) = (1 )(y x)
= (y (1 )x y) = (y z),
con lo que
(1 )(f (z) f (x)) = (1 )f  (c)(z x) f  (d)(y z) = (f (y) f (z)),
que era lo que tenamos que probar.
Ejemplo

Consideremos nuevamente la funci


on
f (x) =

x3 x + 1
3

cuya gr
aca est
a en la p
agina 77. Vamos a estudiar su concavidad y convexidad.
Para ello calculamos su derivada
f  (x) =

3x2 1
3

Hemos de estudiar donde es creciente y donde es decreciente esta funcion.


Como tambien es derivable, podemos hacerlo a traves de su derivada, que es lo
que se conoce como segunda derivada de la funci
on f :
f  (x) = 2x.
Claramente f  (x) < 0 en ], 0[ y f  (x) > 0 en ]0, +[. Esto implica que
f  es decreciente en el primer intervalo y creciente en el segundo, luego, tal y
como muestra la graca, f es concava en el primer intervalo y convexa en el
segundo.

3.4. Derivadas sucesivas, la f


ormula de Taylor

3.4

99

Derivadas sucesivas, la f
ormula de Taylor

Denici
on 3.30 Si f : D R R es derivable en un abierto D, a su
derivada f  se la llama tambien primera derivada de f , y se representa por
f 1) : D R. Si esta es, a su vez, derivable, su derivada se llama derivada
segunda de f , y se representa por f 2) : D R. Diremos que una funci
on es
k-veces derivable en D si se pueden calcular de este modo sus derivadas hasta
f k) : D R. Estas derivadas se llaman derivadas sucesivas de f . (Es u
til
adoptar el convenio de que f 0) = f .) Diremos que f es innitamente derivable
(o de clase C ) en D si existe f k) para todo k N.
Diremos que f es de clase C k en D si existen las derivadas hasta orden k
y son continuas. (En realidad la cuesti
on es que sea continua f k) , porque las
anteriores lo seran por ser derivables.)
De los resultados que hemos visto sobre continuidad y derivabilidad se sigue
inmediatamente que la suma y el producto de funciones de clase C k es de clase
on
C k , as como el cociente, si la funcion denominador no se anula. La composici
de funciones de clase C k es de clase C k . (Todo esto para k N y tambien para
k = .) Si llamamos C k (D) al conjunto de las funciones de clase C k en D,
tenemos que C k (D) es un subanillo de C 0 (D) = C(D). Claramente contiene a
todas las funciones polin
omicas.
Si f : D R R es una funci
on derivable en a D, sabemos que f toma,
cerca de a, valores muy similares a su recta tangente:
t(x) = f (a) + f  (a)(x a).
Ello se debe esencialmente a que f (a) = t(a) y f  (a) = t (a). Cabe esperar
que, cuantas m
as derivadas sucesivas tengan en com
un dos funciones en un
punto, m
as parecidas seran alrededor de dicho punto. Esto no tiene por que
ser necesariamente as, pero cabe investigar en que condiciones la igualdad de
derivadas se traduce en similitud de las gr
acas.
As pues, vamos a estudiar la posibilidad de aproximar funciones con polinomios que compartan derivadas sucesivas en un punto. El punto de partida es
el teorema siguiente:
Teorema 3.31 Dada una funci
on f : D R R derivable k veces en D y
dado un punto a D, existe un u
nico polinomio Tak f (x) de grado k tal que
i)
i)
(Ta f ) (a) = f (a) para i = 0, . . . , k. Concretamente, es el dado por:
Tak f (x) =

k

f n) (a)
(x a)n .
n!
n=0

n: Consideremos un polinomio de la forma


Demostracio
P (x) =

n=0

cn (x a)n ,

100

Captulo 3. Calculo diferencial de una variable

y vamos a ver que podemos determinar de forma u


nica los coecientes cn para
que sus derivadas coincidan con las de f hasta el orden k. Si derivamos:
P 1) (x) =

ncn (x a)n1 ,

P 1) (a) = c1 ,

n=1

P 2) (x) =

n(n 1)cn (x a)n2 ,

P 2) (a) = 2c2 ,

n=2

P 3) (x) =

n(n 1)(n 2)cn (x a)n3 ,

P 3) (a) = 3 2c3 ,

n=3

y es facil ver que, en general, ha de ser P n) (a) = n!cn . As pues, para que las
derivadas de P coincidan con las de f en el punto a, los coecientes han de ser
necesariamente
P n) (a)
cn =
.
n!
Denici
on 3.32 Si f : D R R es k-veces derivable en el abierto D,
llamaremos polinomio de Taylor de grado k de f en el punto a al polinomio
Tak f (x) =

k

f n) (a)
(x a)n .
n!
n=0

Observemos que Ta1 f (x) = f (a)+f  (a)(xa) es la recta tangente a la graca


de f en el punto a.
Los polinomios de Taylor son u
tiles para calcular aproximadamente muchas funciones, pero esto requiere tener informaci
on sobre el error de la aproximacion, es decir, sobre lo que podemos llamar el resto de Taylor de orden k de
la funci
on f :
Rak f (x) = f (x) Tak f (x)
El caso ideal se da cuando f es de clase C en D y, para todo x D, se
on
cumple que lm Rak f (x) = 0, pues esto signica que podemos expresar la funci
k

f como serie innita:8


f (x) =


f n) (a)
k=0

n!

(x a)n .

Esta serie, tanto si converge como si no y, en caso de que converja, tanto si


converge a f como si no, se llama serie de Taylor de la funci
on f alrededor del
punto a.
8 Dada

Sm =

n=0

una sucesi
on {xn }n0 , su serie asociada es la sucesi
on

xn = {Sm }m0 , donde

n=0

xn = x0 + +xm . Los t
erminos Sm se llaman sumas parciales de la serie. Cuando

la serie es convergente, su lmite (llamado suma) se representa igualmente por

n=0

xn .

3.4. Derivadas sucesivas, la f


ormula de Taylor

101

Teorema 3.33 Sea f : I R R una funci


on derivable k + 1 veces en un
intervalo abierto I y sea a I. Para todo x I, x = a, existe un c estrictamente
comprendido entre a y x tal que
f (x) = Tak f (x) +

f k+1) (c)
(x a)k+1 .
(k + 1)!

n: Supongamos, por concretar, que a < x. Consideremos la


Demostracio
funci
on F : [a, x] R dada por
F (t) = f (t) +

k

f n) (t)
(x t)n .
n!
n=1

Claramente, F (x) = f (x) y F (a) = Tak f (x), luego queremos estudiar la


diferencia F (x) F (a). Claramente, F es continua en [a, x] y derivable en ]a, x[.
Observemos que

k  n+1)

(t)
f
f n) (t)
F  (t) = f  (t) +
(x t)n
(x t)n1 .
n!
(n 1)!
n=1
Vemos que se cancelan todos los terminos de la suma excepto el u
ltimo, de
modo que
f k+1) (t)
F  (t) =
(x t)k
k!
Sea G : [a, x] R cualquier funci
on continua en [a, x] derivable en ]a, x[.
Por el teorema de Cauchy 3.25 tenemos que existe a < c < x tal que
G (c)(F (x) F (a)) = F  (c)(G(x) G(a)).
Si G no se anula en ]a, x[, podemos escribir
f (x) Tak f (x) =

G(x) G(a) f k+1) (c)


(x c)k .
G (c)
k!

La expresion del enunciado resulta de tomar G(t) = (x t)k+1 .


De aqu se deduce una sencilla condici
on suciente para que una funci
on
coincida con su serie de Taylor. Necesitamos el resultado siguiente:
Teorema 3.34 Si x 0 entonces lm xn /n! = 0.
n

n: Podemos suponer que x es estandar. Si m es un n


Demostracio
umero
natural innito y n es el menor natural mayor que x, entonces
m1
xm
xn  x x
=

0.
m!
n!
k m
k=n+1

En efecto, el primer factor es nito porque es est


andar, el segundo tambien
porque todos los terminos son menores que 1 y el tercero es innitesimal.

102

Captulo 3. Calculo diferencial de una variable

Teorema 3.35 Sea f : I R una funci


on de clase C en un intervalo
abierto I, sea a I y sea x I tal que las derivadas sucesivas de f esten
uniformemente acotadas en el intervalo de extremos a y x, es decir, tal que
exista una constante M de modo que |f n) (t)| M n para todo n N y todo t
en dicho intervalo. Entonces
f (x) =


f n) (a)
(x a)n .
n!
n=0

n: Hemos de probar que


Demostracio
lm(f (x) Tak f (x)) = 0.
k

Por el teorema 3.33 sabemos que existe un c entre a y x tal que



 k+1)
 |f k+1) (c)|
f
(c)
k
k+1 
k+1

|f (x) Ta f (x)| = 
(x a)
 = (k + 1)! |x a|
(k + 1)!

(M |x a|)k+1
0
(k + 1)!

cuando k es innito, por el teorema anterior.


En la seccion siguiente veremos algunas aplicaciones de este teorema.

3.5

Exponenciales y logaritmos

Vamos a demostrar que, para cada a R, a > 0, existe una u


nica funci
on
continua a( ) : R R que cumple a1 = a y satisface la ecuacion funcional
ax+y = ax ay ,

para todo x, y R.

Veamos algunas propiedades que ha de tener esta funci


on exponencial:
a) a0 = 1, pues a = a1 = a1+0 = a1 a0 = aa0 , luego a0 = 0 y, como
a0 = a0+0 = a0 a0 , ha de ser a0 = 1.
b) ax = 0 y ax = 1/ax , pues ax ax = a0 = 1.
c) Si m Z, entonces am coincide con la exponencial usual para n
umeros
enteros en un cuerpo. La ecuaci
on funcional implica que esto es as para
m > 0, sabemos que a0 = 1 y el apartado b) nos da que tambien es cierto
para m < 0.
d) ax > 0, pues a1 = a > 0 y, si ax < 0 para alg
un x, la continuidad implica
que la exponencial tendra que anularse en alg
un punto.

e) am/n = n am , para todo m/n Q (n > 0). En efecto, la ecuaci


on
m/n n
m
m/n
funcional implica
que
(a
)
=
a
y
sabemos
que
a
>
0,
luego
ha

de ser am/n = n am .

3.5. Exponenciales y logaritmos

103

El apartado e) junto al teorema 3.14, implica que, si existe la funci


on exponencial ax , es u
nica.
Demostraremos que la funcion exponencial f (x) = ax es, de hecho, derivable
en R. Admitiendo que lo es, podemos calcular su derivada: Si x R es estandar
y h es innitesimal, tenemos que
ax+h ax
ah 1
= ax
f  (0) ax .
h
h
As pues, si llamamos ka = f  (0), tenemos que f  (x) = ka ax . Esto implica,
a su vez, que, si es derivable, la exponencial es de clase C en R.
Empezaremos demostrando que podemos escoger una base e > 0 tal que la
exponencial ex existe y cumple ke = 1, de modo que coincide con su propia
derivada. Esta condici
on, junto con que e0 = 1, determina completamente la
funci
on que buscamos. En efecto: Fijado x R, no nulo, como ex ha de ser
continua, el teorema 3.10 nos da que ha de estar acotada en el intervalo [0, x] (o
[x, 0]), es decir, que existe un M tal que |et | M para todo t [0, x] (o [x, 0]).
Como las derivadas de ex han de ser ellas mismas, la cota vale para sus innitas
derivadas, y el teorema 3.35 (con a = 0) nos da que se ha de cumplir
ex =


xn
.
n!
n=0

Hasta aqu, lo u
nico que hemos demostrado es que, si existe una funci
on ex
que sea igual a su propia derivada y que cumpla e0 = 1, ha de venir dada por el
desarrollo en serie que acabamos de indicar. Seguidamente demostramos, para
empezar, que dicha serie siempre converge:
Teorema 3.36 Para cada x R, la serie

n=0

xn
n!

es convergente.

n: Basta probar que converge cuando x es estandar. A su vez,


Demostracio
basta ver que la serie es de Cauchy. Para ello tomamos dos n
umeros naturales
innitos m < p y hemos de ver que Sp (x) Sm (x) 0. Ahora bien:9
 p

p
p
 xn 

|x|n
|x|m |x|nm


=



n! 
n!
m! n=m n!/m!
n=m
n=m

p
|x|m
|x|m 1 (|x|/m)pm+1
(|x|/m)nm =
0.
m! n=m
m!
1 |x|/m

Aqu usamos que el segundo factor es nito (teniendo en cuenta el teorema 2.20) y el primero es innitesimal por el teorema 3.34.
9 La u
ltima igualdad se basa en la conocida f
ormula para la suma de una serie geometrica
nita:
1 xn+1
1 + x + x2 + + xn =
.
1x

104

Captulo 3. Calculo diferencial de una variable

Denici
on 3.37 Llamaremos funci
on exponencial a la funci
on ex : R R
dada por
xn

x x2
x3
ex =
=1+x+ +
+
+
2
3
6
n=0 n!
Claramente, se trata de una funci
on estandar y cumple e0 = 1. Ahora
probamos que cumple la ecuaci
on funcional esperada:
Teorema 3.38 Para todo par de n
umeros reales x, y se cumple que
ex+y = ex ey .
n: Podemos suponer que x e y son estandar. Sea m N
Demostracio
innito. Entonces10
ex ey

m
m
2m
n


xi y j
1
=
xk y nk
i!
j!
k!(n

k)!
n=0
i=0
j=0
2m

1
n!
n=0

n 

k=0

k=0

2m
n k nk (x + y)n
ex+y .
x y
=
n!
k
n=0

Como el primer y el u
ltimo termino son estandar, tenemos ex+y = ex ey .
M
as a
un, la funci
on exponencial tambien cumple la propiedad que nos ha
llevado hasta su serie de Taylor:
Teorema 3.39 La funci
on exponencial es derivable en R, y su derivada es ella
misma.
n: Tomemos x R estandar y h 0 no nulo. Entonces
Demostracio
ex+h ex
eh 1
= ex
.
h
h
Basta probar que

eh 1
1.
h
Tomamos primero un x estandar tal que 0 < |x| < 1. Entonces, para todo
natural innito m, se cumple
ex 1 +

x
x2
xm
+
+ +
,
1!
2!
m!

y as (usando que 1/x es estandar, luego nito)


ex 1
x
xm1
1
+ +
.
x
2!
m!
10 Notemos que todos los sumatorios siguientes son sumas nitas, lo cual justica todas las
manipulaciones de ndices.

3.5. Exponenciales y logaritmos

105

Por consiguiente, usando nuevamente la f


ormula de las series geometricas:
 x

m1
e 1

|x|

 < |x| + + |x|m2 = |x| |x|

 x

1 |x|
1 |x|
y, como los extremos son estandar, tenemos la desigualdad
 x

e 1


 < |x| .

1
 x
 1 |x|
En principio, esto vale para todo x estandar tal que 0 < |x| < 1, pero por
transferencia vale incluso para el innitesimo h, es decir,
 h

e 1

|h|


 h 1 < 1 |h| 0.
A partir de aqu ya podemos armar que ex cumple todas las propiedades
que hemos deducido al principio de la secci
on para a igual al n
umero11
e = e1 =

= 2.718281828459 . . .
n=0 n!

En particular sabemos que ex > 0, y lo mismo vale para su derivada, porque


es ella misma. Esto nos permite aplicar el teorema de la funcion inversa.
Teorema 3.40 La funci
on exponencial ex : R ]0, +[ es biyectiva y mon
otona creciente.
n: El teorema de la funci
Demostracio
on inversa nos da que la exponencial
es monotona creciente y que biyecta R con un intervalo abierto. De la propia
denici
on de la exponencial (mirando los dos primeros terminos de la serie) se
sigue que, si x > 0, entonces x < 1 + x < ex .
Aplicando esto a 1/x, vemos que 1/x < e1/x = 1/e1/x , luego, en denitiva,
e1/x < x < ex .
Como la imagen de la exponencial es un intervalo, esto prueba que contiene
a todo x > 0, luego ha de ser ]0, +[.
En particular, el teorema de la funci
on inversa que acabamos de aplicarle a
la exponencial garantiza que existe la funci
on inversa y es derivable:
Denici
on 3.41 Llamaremos logaritmo a la funci
on inversa de la funci
on exponencial:
log : ]0, +[ R
11 Una regla mnemot
ecnica para las primeras cifras del n
umero e es contar las letras de cada
palabra de la frase te ayudar
e a recordar la cantidad.

106

Captulo 3. Calculo diferencial de una variable

El logaritmo existe y es derivable por el teorema de la funci


on inversa. Si
f (x) = log x y llamamos y = log x, de modo que x = ey , dicho teorema nos da
que
4
1
1
ex
f  (x) = y = .
3
e
x
log x

-2

-1

-1

La gura muestra las gr


acas de las funciones
exponencial y logaritmo. Las relaciones e0 = 1 y
e1 = e se traducen en que log 1 = 0 y log e = 1. A
su vez, la ecuacion funcional de la exponencial da
lugar a otra para el logaritmo:
log xy = log x + log y.

-2

En efecto, si x = eu , y = ev , entonces xy = eu+v , luego


log xy = u + v = log x + log y.
De aqu se sigue que, para todo n Z,
log xn = n log x.
En principio se cumple para n 0, pero la relaci
on log x1 + log x = log 1 = 0
permite extender la relaci
on a todos los enteros.
El teorema siguiente proporciona la que podramos haber tomado como denici
on alternativa de la funci
on exponencial. En particular muestra que 1 es
una indeterminaci
on.
Teorema 3.42 Para todo x R se cumple que

x n
ex = lm 1 +
.
n
n
n: Basta probarlo para x estandar. Como log x tiene derivada
Demostracio
igual a 1 en x = 1, si h 0, tenemos que
log(1 + h)
1.
h
Aplicamos esto a h = x/n, donde n N es innito. Entonces

x
n log 1 +
x.
n
Equivalentemente:


x n
log 1 +
x
n
y, como la exponencial es continua en x, tenemos que

x n
1+
ex .
n

3.5. Exponenciales y logaritmos

107

En particular,

1
e = lm 1 +
n
n

n
.

Ahora ya podemos denir la exponencial para cualquier base a > 0:


Denici
on 3.43 Para cada a R, a > 0, denimos la funci
on exponencial
ax = ex log a .
Obviamente, la exponencial es continua y cumple a1 = a, as como la
ecuacion funcional ax+y = ax ay . Por la discusi
on vista al principio de la secci
on,
es la u
nica funci
on con estas propiedades. Tambien es claro que f (x) = ax es
derivable en R, y su derivada es
f  (x) = ax log a.
Observemos que, para a = e, la exponencial que acabamos de denir es la
que ya tenamos denida. Ahora podemos generalizar las propiedades de la
exponencial y el logaritmo:
(ex )y = exy ,

log xy = y log x.

En efecto, por denici


on
x

(ex )y = ey log e = eyx .


Como xy = ey log x , tenemos que log xy = y log x.
Ejercicio: Demostrar que a( ) : R ]0, +[ es creciente si a > 1, decreciente si
a < 1 y constante si a = 1. Si a = 1, su inversa viene dada por
loga x =

log x
.
log a

Ejercicio: Demostrar que la funci


on f (x) = x tiene derivada f  (x) = x1 en
]0, +[.

Teorema 3.44 El n
umero e es irracional.
n: Seg
Demostracio
un el teorema 3.33:
e

k

1
ec
=
,
n!
(k + 1)!
n=0

para un cierto n
umero 0 < c < 1. Teniendo en cuenta que ec < e < 3, vemos
que
k

1
1
3
<e
<
,
(k + 1)!
n!
(k
+
1)!
n=0

108

Captulo 3. Calculo diferencial de una variable

luego
0<

k

1
k!
3
3
< k! e
<
,
k+1
n!
k+1
4
n=0

para k 3. El sumatorio es un n
umero entero. Si e fuera racional podramos
tomar k sucientemente grande como para que k! e fuera tambien entero, pero
entonces tendramos un entero m tal que 0 < m < 3/4, lo cual es absurdo.
Ejemplo La funci
on f : R R dada por

0
si x 0,
f (x) =
e1/x si x > 0.

0.8

f (x)
0.6
0.4
0.2

-1

es de clase C y cumple f n) (0) = 0 para todo


n N. Por lo tanto, no coincide con su serie de
Taylor (que es identicamente nula).

La gura muestra la gr
aca de la funci
on f . Aunque es > 0 para todo x > 0,
vemos que se confunde con el eje horizontal en un intervalo apreciable.
Vamos a probar que las derivadas de f tienen la forma siguiente:

0
si x 0,
n)
f (x) =
e1/x Px(x)
si x > 0,
2n
donde P (x) es un polinomio de grado n.
Razonamos por inducci
on sobre n. Se cumple claramente para n = 0. Si
es cierto para n, es obvio que, para x < 0, existe f n+1) (0) = 0. Para x > 0
tambien es claro que existe la derivada, y es
P (x)
P  (x)x2n 2nP (x)x2n1
+ e1/x
2n+2
x
x4n



2
P (x)
P  (x)x 2nP (x)
1/x
1/x P (x) + P (x)x 2nxP (x)
=
e
=e
+
.
x2n+1
x2(n+1)
x2(n+1)
f n+1) (x) = e1/x

Es claro que el numerador es un polinomio de grado n + 1.


Falta probar que existe f n+1) (0) = 0. Para ello basta ver que si h > 0 es
innitesimal, entonces
f n) (h) f n) (0)
P (h)
= e1/h 2n+1 0.
h
h
En otras palabras, vamos a probar que, para todo polinomio P (x) y todo
n N, la funci
on

0
si x 0,
g(x) =
(x)
e1/x xP2n+1
si x > 0,

3.6. Lmites de funciones

109

es continua en 0. Como es una propiedad interna, podemos suponer que n y P


son estandar. Entonces, P (h) P (0) es nito. Basta probar que
e1/h
0.
h2n+1
Ahora bien, del desarrollo en serie de la funci
on exponencial se sigue que,
para todo x > 0 y todo m N, se cumple que
xm
ex .
m!
Lo aplicamos a x = 1/h y a m = 2n + 2, con lo que obtenemos
0

e1/h
(2n + 2)! h 0,
h2n+1

lo que concluye la prueba.

3.6

Lmites de funciones

A la hora de describir una funci


on es interesante determinar como se comporta cerca de los puntos donde no est
a denida:
Denici
on 3.45 Sea f : D R R una funci
on estandar y sea x0 R
(estandar) un punto de acumulaci
on de su dominio (es decir, un punto que
cumpla h(x) (D \ {x}) = ). Diremos que f converge a un punto est
andar
l R cuando x tiende a x0 , y lo representaremos por
lm f (x) = l,

xx0

si para todo x D tal que x x0 y x = x0 , se cumple que f (x) l.


Observemos que una funci
on no puede converger a m
as de un lmite (estandar)
en un mismo punto, lo cual justica que hayamos dado nombre al lmite.
En realidad hemos calculado ya muchos lmites, solo que nunca hemos tenido
la necesidad de destacarlo. Por ejemplo, es inmediato que una funci
on f es
continua en un punto de acumulaci
on x0 de su dominio si y s
olo si
lm f (x) = f (x0 ),

xx0

y que una funci


on es derivable en un punto interior x de su dominio si y s
olo si
existe
f (x + h) f (x)
f  (x) = lm
.
h0
h
Como en el caso de las sucesiones, podemos denir lmites innitos:

110

Captulo 3. Calculo diferencial de una variable

Considerando de nuevo una funci


on estandar f : D R R y un punto
de acumulaci
on (estandar) x0 de su dominio, diremos que
lm f (x) = +

xx0

si cuando x D, x x0 , x = x0 , se cumple que f (x) > 0 es innito.


Si f (x) es innito, pero f (x) < 0, entonces diremos que
lm f (x) = ,

xx0

si f (x) es innito, pero su signo puede depender de x, entonces diremos que


lm f (x) = .

xx0

Tambien podemos denir lmites en innito:


Denici
on 3.46 Sea f : D R R una funci
on estandar cuyo dominio contenga puntos innitos positivos (resp. negativos) y sea l R un punto est
andar.
Diremos que
lm f (x) = l
(resp. lm f (x) = l)
x+

si cuando x D es innito y x > 0 (resp. x < 0) se cumple que f (x) l.


Dejamos que el lector conjeture el signicado obvio de las cuatro variantes
(seis de hecho si ademas quitamos el signo al innito de la derecha)
lm f (x) = .

Todos los resultados algebraicos sobre lmites de sucesiones valen igualmente


para lmites de funciones, con las mismas pruebas. Por poner un ejemplo:
Si una funci
on f : D R R no se anula en su dominio y x0 es un punto
de acumulaci
on de D:
lm f (x) = 0

xx0

si y s
olo si

lm 1/f (x) = .

xx0

Esto se cumple porque si x D cumple x x0 , x = x0 , entonces f (x) 0


si y solo si 1/f (x) es innito.
La relacion entre lmites de sucesiones y lmites de funciones es tambien
elemental:
Teorema 3.47 Si f : D R R cumple que existe
lm f (x) = l

xx0

y {xn }n0 es una sucesi


on contenida en D tal que lmn xn = x0 , entonces
lm f (xn ) = l.
n

3.6. Lmites de funciones

111

Esto es valido igualmente si x0 = o si l = .


Veamos algunos ejemplos de lmites de interes:

lm ex = +, lm ex = 0.

x+

En efecto, de la serie de Taylor de la exponencial se deduce que, para


x > 0 se cumple 1 + x < ex , luego si x > 0 es innito, ex tambien lo es.
Si x < 0 es innito, entonces ex es innito, luego ex es innitesimal.

lm log x = +, lm log x = .

x+

x0

En efecto, si x > 0 es innito, pero log x es nito, entonces podemos


acotarlo por n
umeros estandar m < log x < M , con lo que em < x < eM ,
lo que implica que x es nito, contradicci
on. (Sabemos que log x > 0
porque el logaritmo es positivo para n
umeros x > 1.) Igualmente se
razona el segundo lmite.
Si a > 1, entonces lm ax = +, lm ax = 0.
x+

Se deduce de lo anterior, teniendo en cuenta que log a > 0.


Si a < 1, entonces lm ax = 0, lm ax = +.
x+

Se deduce del caso anterior, pues ax = (1/a)x .


Si > 0, entonces lm x = +.
x+

Se deduce de la denici
on de la exponencial y de los casos anteriores.
Si < 0, entonces lm x = 0.
x+

Basta observar que x = 1/x .


Si n N es par y no nulo, lm xn = +.
x

En efecto, si n = 2k y x < 0 es innito, entonces x2 es innito y positivo,


y x2k > x2 tambien lo es.
Si n N es impar y no nulo, lm xn = .
x

En efecto, ahora n = 2k + 1 y, como antes, x2k > 0 es innito, luego


x2k+1 < 0 tambien lo es.
Si tenemos un polinomio (est
andar):
P (x) = xn + an1 xn1 + + a1 x + a0 ,
podemos expresarlo en la forma

an1
a0 
a1
P (x) = xn 1 +
+ + n1 + n .
x
x
x

112

Captulo 3. Calculo diferencial de una variable

Si M es una cota estandar para los coecientes ai , tenemos que


a
a0  M 1 1/xn
a1
 n1
+ + n1 + n 
.

x
x
x
x 1 1/x
Esto vale para todo x = 0. Si x es innito, la segunda fracci
on es nita, y
la primera innitesimal, luego todo el parentesis de la expresion de P (x) esta
innitamente cerca de 1, luego es nito y positivo, y P (x) es innito y tiene el
signo de xn . As pues,

+ si n es par,
lm P (x) = +,
lm P (x) =
si n es impar.
x+
x
Notemos que hemos supuesto que el coeciente director de P (x) era an = 1.
El resultado vale igualmente si an > 0, pero si an < 0 hay que invertir todos
los signos. (Esto se demuestra expresando P (x) = an Q(x), donde Q(x) tiene
coeciente director unitario.)
Teorema 3.48 Todo polinomio de grado impar se anula en al menos un punto.
n: No perdemos generalidad si suponemos que su coeciente
Demostracio
director es positivo. Entonces
lm P (x) = +,

x+

lm P (x) = ,

luego, si x > 0 es innito, tenemos que P (x) > 0, P (x) < 0. El teorema 3.11
implica que existe un c R tal que P (c) = 0.
Algunas reglas de derivaci
on se traducen en lmites que tienen interes por s
mismos. Por ejemplo, el hecho de que la derivada de ex en x = 0 vale e0 = 1
equivale a que
ex 1
lm
= 1.
x0
x
Similarmente, el hecho de que la derivada de log x en x = 1 valga 1/1 = 1
equivale a que
log x
lm
= 1.
x0 x
Estos y otros muchos lmites pueden obtenerse a partir de una regla general:
Teorema 3.49 (Regla de LH
opital) Sean f, g : ]a, b[ R dos funciones
derivables tales que g y g  no se anulen en ]a, b[. Supongamos que
lm f (x) = lm g(x) = 0

xa

y que existe

xb

f  (x)
.
xa g  (x)
lm

Entonces existe

f (x)
f  (x)
= lm 
.
xa g(x)
xa g (x)
lm

3.6. Lmites de funciones

113

n: Tomemos cualquier n
Demostracio
umero a < t < b y consideremos las
funciones f , g : [a, t] R extendidas a a con los valores f (a) = g(a) = 0. Es
claro que as son continuas en [a, t] y derivables en ]a, t[. Podemos aplicar el
teorema de Cauchy 3.25, seg
un el cual existe un n
umero a < c < t tal que
(f (t) f (a))g  (c) = (g(t) g(a))f  (c).
Como g  no se anula, g es estrictamente monotona, luego el segundo factor
no es nulo. Podemos despejar:
f (t)
f  (c)
=  .
g(t)
g (c)
Hemos tomado un t arbitrario. Si lo escogemos t a, entonces tambien
c a, con lo que
f (t)
f  (x)
lm 
,
g(t) xa g (x)
y esto prueba el teorema.
Es evidente que la regla de Lh
opital vale igualmente con lmites cuando
x b e incluso, combinando los casos ]a, c[ y ]c, b[, se demuestra trivialmente
esta otra version:
Teorema 3.50 (Regla de LH
opital) Sean f, g : ]a, b[ R dos funciones
derivables tales que g y g  no se anulen en ]a, b[ excepto en un punto a < c < b.
Supongamos que f (c) = g(c) = 0 y que existe
f  (x)
.
xc g  (x)
lm

Entonces existe

f (x)
f  (x)
= lm 
.
xc g(x)
xc g (x)
lm

Tambien es facil deducir una versi


on para lmites en :
Teorema 3.51 (Regla de LH
opital) Sean f, g : ]a, +[ R dos funciones derivables tales que g y g  no se anulan. Supongamos que existen
lm f (x) = lm g(x) = 0

x+

as como

x+

f  (x)
.
x+ g  (x)
lm

Entonces existe

f (x)
f  (x)
= lm 
.
x+ g(x)
x+ g (x)
lm

114

Captulo 3. Calculo diferencial de una variable

n: Podemos suponer a > 0. Basta considerar las funciones


Demostracio
F, G : ]0, 1/a[ R
dadas por F (x) = f (1/x), G(x) = g(1/x). Es claro que son derivables, as como
que existe
lm F (x) = lm G(x) = 0,
x0

x0

f  (1/x) 1
F  (x)
f  (x)
x2
= lm 
= lm 
.
1

x+ g (x)
x0 G (x)
x0 g (1/x) 2
x
lm

(Notemos tambien que ni G ni G se anulan.) Por la versi


on ya probada, sabemos
que existe
F (x)
f  (x)
lm
= lm 
,
x+ g (x)
x0 G(x)
pero esto equivale a

f (x)
f  (x)
= lm 
.
x+ g(x)
x+ g (x)
lm

De aqu deducimos a su vez una versi


on para el caso en que las funciones
tienden a innito:
Teorema 3.52 (Regla de LH
opital) Sean f, g : ]a, +[ R dos funciones derivables tales que g y g  no se anulen en ]a, +[. Supongamos que
lm f (x) = lm g(x) =

x+

y que existe

x+

f  (x)
.
x+ g  (x)
lm

Entonces existe

f (x)
f  (x)
= lm 
.
x+ g(x)
x+ g (x)
lm

n: Podemos suponer que todos los datos son estandar. Sea


Demostracio
f  (x)
.
x+ g  (x)

L = lm

Esto implica que si M > a es innito y c > M , entonces


f  (c)
L,
g  (c)
luego, en particular,

 

 f (c)



 g  (c) L < .

3.6. Lmites de funciones

115

Por transferencia, esto es valido tambien para todo c mayor que un cierto
M > a estandar. Sea x > a un n
umero real innito. Por el teorema de
Cauchy 3.25, existe un n
umero M < c < x tal que
f (x) f (M )
f  (c)
=  .
g(x) g(M )
g (c)
Notemos que, como g  no se anula, la funci
on g es monotona, luego el denominador de la izquierda es no nulo. Observemos ahora que
f (x)
f (x) f (M )
f (x)
g(x) g(M )
=
,
g(x)
g(x) g(M ) f (x) f (M )
g(x)
y
f (x)
1
=
1,
f (x) f (M )
1 f (M )/f (x)

g(x) g(M )
g(M )
=1
1,
g(x)
g(x)

luego

f (x)
f  (c)
 ,
g(x)
g (c)
donde hemos usado que el cociente de la derecha es nito, tanto si c es nito
como si es innito. Por consiguiente:


 f (x)



 g(x) L < .
Esto vale para todo x innito, luego tambien vale para todo x > x0 , donde
umero estandar que depende de , pero si x > 0 es innito,
x0 > a es un n
cumplir
a x > x0 para cualquier x0 estandar, luego cumplir
a la desigualdad
anterior para todo  > 0 estandar. As pues,
f (x)
L,
g(x)
luego
lm

x+

f (x)
= L.
g(x)

Dejamos como ejercicio la prueba de este u


ltimo caso (que tiene su version
an
aloga con lmites en b en lugar de en a):
Teorema 3.53 (Regla de LH
opital) Sean f, g : ]a, b[ R dos funciones
derivables tales que g y g  no se anulen en ]a, b[. Supongamos que
lm f (x) = lm g(x) =

xa

y que existe

xa

f  (x)
.
xa g  (x)
lm

Entonces existe

f (x)
f  (x)
= lm 
.
xa g(x)
xa g (x)
lm

116

Captulo 3. Calculo diferencial de una variable


Ejercicio: Estudiar las funciones seno hiperb
olico y coseno hiperb
olico, denidas como sigue:
3

senh x =
2

-1

1
-1
-2

cosh x =

ex ex
.
2

Demostrar que senh x = cosh x, cosh x = senh x, que


satisfacen la relaci
on

-2

ex ex
,
2

cosh2 x senh2 x = 1

as como que cumplen todas las propiedades que muestran sus gr


acas (crecimiento, decrecimiento, m
aximos y
mnimos, concavidad y convexidad, lmites en ).
Demostrar que las restricciones
senh : R R,

-3

cosh : [0, +[ [1, +[

son biyectivas, por lo que existen las inversas


arg sen h : R R,

arg cos h : [1, +[ [0, +[ ,

(llamadas argumento del seno hiperb


olico y argumento del coseno hiperb
olico.)
Demostrar que sus derivadas son
arg sen h (x) =

1
,
1 + x2

arg cos h (x) =

1
x2

Captulo IV

C
alculo integral de una
variable
4.1

La integral de Riemann

El concepto de integral de una funci


on nos permite calcular ciertas sumas
de innitos n
umeros innitesimales. Se trata de un esquema muy general que
admite interpretaciones muy diversas en contextos muy distintos, de entre las
cuales la mas simple y la mas natural a la hora de presentar la denici
on es
el problema del c
alculo de areas. El area de un rect
angulo es y podemos
considerar esto como una denici
on el producto de su base por su altura.
Vamos a ver que este hecho, junto con algunas propiedades obvias que es natural
suponer al concepto de area (por ejemplo, que si una regi
on esta contenida en
otra mayor, el area de la primera sea menor o igual que la de la segunda)
determina completamente un u
nico valor numerico para el area de cualquier
regi
on plana razonable.
Concretamente, vamos a ver que la integral de
una
funci
on f : [a, b] R puede interpretarse
f (x)
como el area limitada entre su gr
aca y el eje x (la
regi
on sombreada en la gura). En ella hemos dibujado tambien una familia de rect
angulos que tocan
a la gr
aca de la funci
on y quedan por debajo de
ella, y otra que queda por encima. De este modo, la
a
b suma de las areas de los rectangulos inferiores ha
de ser menor que el area sombreada, y la suma de las areas de los rectangulos
superiores ha de ser mayor.
Empezamos describiendo formalmente la construccion que muestra la gura:
Denici
on 4.1 Una partici
on de un intervalo [a, b] es un subconjunto nito
P de [a, b] tal que a, b P . Si P tiene n + 1 elementos, podemos numerarlos
117

118

Captulo 4. C
alculo integral de una variable

unvocamente en la forma
P = {a = x0 < x1 < < xn = b}.
Llamaremos xi = xi+1 xi > 0. La norma de P es
P  = max xi > 0.
i

Una funci
on f : [a, b] R esta acotada si existe un n
umero M R tal que
|f (x)| M para todo x [a, b].
Si f esta acotada y P es una partici
on de [a, b], denimos
mi = nf{f (x) | x [xi1 , xi ]},

Mi = sup{f (x) | x [xi1 , xi ]}.

(Obviamente son conjuntos no vacos acotados superiormente por cualquier cota


M de f e inferiormente por M , luego tienen supremo e nmo.)
Denimos la suma inferior y la suma superior de Riemann de f respecto a
la partici
on P como
s(f, P ) =

i=1

mi xi ,

S(f, P ) =

Mi xi .

i=1

Volviendo a la gura anterior, si P es la partici


on del intervalo [a, b] formada
por las bases de los rectangulos que hemos dibujado, entonces los rect
angulos
inferiores tienen altura mi y los superiores Mi . La suma inferior de Riemann es
la suma de las areas de los rectangulos inferiores y la suma superior es la suma
de las areas de los rectangulos superiores. Por consiguiente, son aproximaciones
por defecto y por exceso al area sombreada.1
Vamos a demostrar que, para funciones razonables, las aproximaciones se
hacen innitamente buenas cuando tomamos particiones de norma innitesimal.
La clave para ello es el teorema siguiente, que nos permite comparar las sumas
calculadas con dos particiones distintas:
Teorema 4.2 Sea f : [a, b] R una funci
on acotada y sean P P  dos
particiones de [a, b]. Entonces
s(f, P ) s(f, P  ) s(f, P ) + 2M rP ,
S(f, P ) S(f, P  ) S(f, P ) 2M rP ,
donde M es una cota de f y r es el n
umero de elementos de P  \ P .
1 Pero hemos de advertir que si la funci
on f tomara valores negativos, los valores de mi y
Mi en las regiones donde esto sucediera seran tambien negativos, con lo que la porci
on de
area situada bajo el eje X se contara negativamente, de modo que, en realidad, las sumas de

Riemann seran aproximaciones a la diferencia entre el


area situada sobre el eje X y el a
rea
situada bajo el.

4.1. La integral de Riemann

119

n: Vamos a probar el teorema por inducci


Demostracio
on sobre r. Supongamos en primer lugar que P  consta de un u
nico punto m
as que P . Llamemos
a entre dos puntos de P , digamos xi1 < x < xi .
x a este punto, que estar
Vamos a llamar m y m a los nmos de f en los intervalos [xi1 , x ] y
[x , xi ], mientras que mi es el nmo en [xi1 , xi ].
De la inclusi
on [xi1 , x ] [xi1 , xi ] y de la denici
on de nmo se sigue
f
acilmente que m mi , e igualmente m mi . Claramente,
s(f, P  ) s(f, P ) = m (x xi1 ) + m (xi x ) mi (xi xi1 )
= (m mi )(x xi1 ) + (m mi )(xi x ) 0.
Por otra parte, m mi = |m mi | |m | + |mi | 2M , e igualmente
m mi 2M . Ademas x xi1 xi xi1 P  y tambien x xi1 P .
Por lo tanto
s(f, P  ) s(f, P ) 2M P .


Esto prueba el teorema para r = 1. Si es cierto para r y P  tiene r + 1


puntos adicionales, consideramos la partici
on P  que resulta de eliminar uno de
estos puntos. Basta aplicar la hip
otesis de induccion y el caso r = 1 ya probado
(notemos que P   P ):
s(f, P ) s(f, P  ) s(f, P  ) s(f, P  ) + 2M P  
s(f, P ) + 2M rP  + 2M P  = s(f, P ) + 2M (r + 1)P .
El caso de las sumas superiores es completamente analogo.
En particular tenemos que cualquier suma inferior es menor o igual que
cualquier suma superior:
Teorema 4.3 Sea f : [a, b] R una funci
on acotada y sean P , P  particiones
de [a, b]. Entonces
s(f, P ) S(f, P  ).
n: Basta tomar P  = P P  y aplicar el teorema anterior:
Demostracio
s(f, P ) s(f, P  ) S(f, P  ) S(f, P  ).
Notemos que la desigualdad central se sigue inmediatamente de la denici
on de
las sumas inferiores y superiores.
Esto se interpreta como que entre cualquier suma inferior y cualquier suma
superior debe encontrarse el area limitada por la funci
on f .
Denici
on 4.4 Sea f : [a, b] R una funci
on acotada. Denimos la integral
inferior y la integral superior de Darboux como


f (x) dx = sup s(f, P ),


a

donde P recorre las particiones de [a, b].

b
f (x) dx = nf S(f, P ),
a

120

Captulo 4. C
alculo integral de una variable

Notemos que el supremo de las sumas inferiores existe porque el conjunto de


todas ellas es obviamente no vaco y, seg
un el teorema anterior, est
a acotado superiormente por cualquier suma superior. Igualmente, el conjunto de las sumas
superiores esta acotado inferiormente por cualquier suma inferior. Tambien es
evidente que
 b
b
f (x) dx f (x) dx
a
a
La integral inferior es el valor al que aproximan las sumas inferiores de Riemann (con m
as exactitud cuanto menor sea la norma de la partici
on), mientras
que la integral superior es el valor al que aproximan las sumas superiores. Ahora
probamos que, para aproximarnos a las integrales inferior y superior mediante
sumas de Riemann, no tenemos que preocuparnos de escoger con cuidado la
partici
on que empleamos, sino que nos sirve cualquier partici
on (de norma)
innitesimal.
Teorema 4.5 Sea f : [a, b] R una funci
on est
andar acotada. Si P es una
partici
on innitesimal de [a, b], entonces

s(P, f )

f (x) dx,

b
S(P, f ) f (x) dx.

n: Sea  > 0 estandar. Existe una partici


Demostracio
on P  , que podemos
tomar estandar, tal que
 b
 b
f (x) dx  < s(P  , f )
f (x) dx.
a
a
Sea k el n
umero de elementos de P  , que sera nito. Sea P  = P P  . Entonces,
el n
umero de puntos de P  \ P es r k. Si M es una cota (estandar) de f , el
teorema 4.2 nos da que
s(P, f ) s(P  , f ) s(P, f ) + 2M rP ,
lo que implica que s(P, f ) s(P  , f ), puesto que P  es innitesimal. Por otra
parte,
 b
f (x) dx  < s(P  , f ) s(P  , f ),
a

de donde


b

f (x) dx  s(P, f )

f (x) dx.
a
a
Como esto vale para todo  > 0 estandar, ha de ser
 b
s(P, f )
f (x) dx.
a

La prueba para sumas superiores es completamente analoga.

4.1. La integral de Riemann

121

Equivalentemente, la integral inferior (resp. superior) es la parte est


andar
de cualquier suma inferior (resp. superior) correspondiente a una partici
on innitesimal. En particular, todas las sumas inferiores (resp. superiores) correspondientes a particiones innitesimales est
an innitamente pr
oximas entre s.
Ahora bien, no tiene por que suceder que las sumas inferiores esten innitamente
pr
oximas a las superiores. En esto consiste precisamente la integrabilidad:
Denici
on 4.6 Una funci
on acotada f : [a, b] R es integrable (Riemann) si
su integral inferior coincide con su integral superior, en cuyo caso, a este valor
com
un se le llama integral (de Riemann) de f , y se representa por


f (x) dx =
a

b
f (x) dx = f (x) dx.

As pues, f es integrable cuando las sumas inferiores y las sumas superiores


aproximan ambas a un mismo n
umero real, que se convierte as en el u
nico
valor que podemos tomar como denici
on del area limitada por la gr
aca de la
funci
on. Insistimos, no obstante, en que la interpretaci
on de una integral como
suma de innitos terminos innitesimales es mucho mas amplia, y se aplica en
muchos contextos que no tienen ninguna relaci
on directa con el calculo de areas.
Por ejemplo, si v : [a, b] R es la velocidad de un m
ovil en cada instante
t, los valores mi y Mi son estimaciones por defecto y por exceso de la velocidad
que el movil ha mantenido a lo largo del periodo [ti+1 , ti ], con lo que mi ti y
Mi ti son estimaciones por defecto y por exceso del espacio recorrido en dicho
periodo, las sumas s(v, P ), S(v, P ) son estimaciones por defecto y por exceso
del espacio recorrido en el intervalo de tiempo [a, b], y lo mismo vale para la
integral inferior y la integral superior. Por consiguiente, si v es integrable, su
integral ha de ser exactamente el espacio recorrido por el movil en [a, b].
La siguiente caracterizacion no estandar de la integrabilidad, cuya prueba
es inmediata, es mucho mas pr
actica que la denici
on (cl
asica) en terminos de
integrales inferiores y superiores, es decir, en terminos de supremos e nmos:
Teorema 4.7 Sea f : [a, b] R una funci
on est
andar acotada y sea P una
partici
on de [a, b] de norma innitesimal. Entonces, la funci
on f es integrable
si y s
olo si s(P, f ) S(P, f ), en cuyo caso, la integral es la parte est
andar de
estas sumas.
Ejemplo

La funci
on f : [0, 1] R dada por

1 si x Q,
f (x) =
0 si x R \ Q,

no es integrable Riemann.
En efecto, basta tener en cuenta que, si P es cualquier partici
on de [0, 1], es
claro que s(f, P ) = 0 y S(f, P ) = 1.
Notemos que la funci
on del ejemplo anterior es discontinua en todos los
puntos. En el extremo opuesto, tenemos el teorema siguiente:

122

Captulo 4. C
alculo integral de una variable

Teorema 4.8 Si f : [a, b] R es una funci


on continua, entonces es integrable.
n: Podemos suponer que f es estandar. Observemos que f
Demostracio
esta acotada por el teorema 3.10. Sea P = {x0 , . . . , xn } una partici
on innitesimal de [a, b]. De nuevo por el teorema 3.10, existen puntos xi1 ui , vi xi
tales que mi = f (ui ), Mi = f (vi ). Notemos que ui vi , luego ambos tienen la
misma parte estandar w [a, b]. Como f es continua en w, tenemos que
mi = f (ui ) f (w) f (vi ) = Mi .
Por consiguiente, = max(Mi mi ) es innitesimal, y
i

S(f, P ) s(f, P ) =

(Mi mi )xi

i=1

xi = (b a) 0,

i=1

luego S(f, P ) s(f, P ).


Veamos ahora las propiedades b
asicas de las funciones integrables:
Teorema 4.9 Si f y g son funciones integrables en un intervalo [a, b] y R,
tambien son integrables f + g, f g y f . Adem
as:


(f (x) + g(x)) dx =
a

f (x) dx +
a

g(x) dx,
a

f (x) dx =

f (x) dx.

Si f (x) g(x) para todo x [a, b], se cumple que




f (x) dx
a

g(x) dx.
a

n: Podemos suponer que todos los datos son estandar. Sea


Demostracio
P una partici
on innitesimal de [a, b]. Es f
acil comprobar que
mi (f + g) mi (f ) + mi (g),

Mi (f + g) Mi (f ) + Mi (g),

con lo que
s(f, P ) + s(g, P ) s(f + g, P ) S(f + g, P ) S(f, P ) + S(g, P ).
Como f y g son integrables, los extremos de estas desigualdades son n
umeros
innitamente pr
oximos, luego los cuatro terminos estan innitamente pr
oximos
entre s. Esto prueba que f + g es integrable, as como que


(f (x)+g(x)) dx S(f +g, P ) S(f, P )+S(g, P )


a

f (x) dx+
a

g(x) dx.
a

4.1. La integral de Riemann

123

Para f tenemos que mi (f ) = mi (f ), Mi (f ) = Mi (f ), y razonamos


an
alogamente.
Ahora vamos a probar que si f solo toma valores 0, entonces f 2 es integrable. Para ello observamos que2 mi (f 2 ) = mi (f )2 y Mi (f 2 ) = Mi (f )2 ,
luego
n

S(f 2 , P ) s(f 2 , P ) =
(Mi (f )2 mi (f )2 )xi
i=1

(Mi (f ) + mi (f )(Mi (f ) mi (f ))xi 2M (S(f, P ) s(f, P )) 0,

i=1

donde M es una cota (estandar) de f en [a, b]. Esto prueba la integrabilidad de


la funci
on f 2 .
Ahora veamos que f 2 es integrable incluso aunque tome valores negativos.
Para ello observamos que, si M es una cota de f , la funci
on f + M solo toma
valores positivos, y es integrable porque la funci
on constante M es continua
y la suma de funciones integrables es integrable. Por la parte ya probada,
(f + M )2 = f 2 + M 2 + 2M f es integrable, pero tambien hemos probado que
M 2 + 2M f es integrable, luego f 2 es integrable.
En general, hemos probado que los cuadrados de las funciones integrables
son integrables. Por consiguiente:
fg =

(f + g)2 (f g)2
,
4

tambien es integrable.
Por u
ltimo, si f (x) g(x) para todo x [a, b], tenemos que (g f )(x) 0
para todo x [a, b], y de la propia denici
on de integral se sigue que
 b
 b
 b
g(x) dx
f (x) dx =
(g(x) f (x)) dx 0.
a

En particular hemos probado que el conjunto de las funciones integrables en


[a, b] es un subanillo de F ([a, b]) que contiene a C([a, b]).
Si f es una funci
on denida en un intervalo mayor que [a, b], diremos que es
integrable en [a, b] cuando lo sea f |[a,b] .
Teorema 4.10 Sea f : [a, b] R una funci
on acotada y sea a < c < b.
Entonces f es integrable en [a, b] si y s
olo si lo es en [a, c] y en [c, b], en cuyo
caso



b

f (x) dx =
a

f (x) dx +
a

f (x) dx.
c

2 Probamos, en general, que si f : [u, v] [0, +[ es una funci


on acotada, entonces
m(f 2 ) = m(f )2 , donde m representa al nmo en [u, v]. Para ello suponemos que los datos
son est
andar y observamos que, para todo x [u, v], se cumple 0 m(f ) f (x), luego
m(f )2 f (x)2 , luego m(f )2 es una cota inferior de f 2 . Por otra parte, existe un x [u, v]
tal que m(f ) f (x), luego m(f )2 f (x)2 , luego m(f )2 es el nmo de f 2 . Igualmente se
razona con los supremos.

124

Captulo 4. C
alculo integral de una variable

n: Podemos suponer que los datos son estandar. Tomemos


Demostracio
particiones innitesimales P1 y P2 de [a, c] y [c, b], respectivamente, de modo
on innitesimal de [a, b]. Es obvio que
que P = P1 P2 es una partici
s(f |[a,c] , P1 ) + s(f |[c,b] , P2 ) = s(f, P ),

S(f |[a,c] , P1 ) + S(f |[c,b] , P2 ) = S(f, P ).

Por consiguiente:
S(f, P ) s(f, P ) = (S(f |[a,c] , P1 ) s(f |[a,c] , P1 )) + (S(f |[c,b] , P2 ) s(f |[c,b] , P2 )).
Las tres diferencias de sumas son 0, luego el miembro izquierdo es innitesimal si y solo si los dos sumandos de la derecha lo son.
Ahora podemos probar la existencia de funciones integrables discontinuas:
Teorema 4.11 Si f : [a, b] R es una funci
on continua salvo a lo sumo en
un n
umero nito de puntos, entonces es integrable.
n: Podemos suponer que los datos son estandar. Vamos a
Demostracio
suponer en primer lugar que f es continua excepto en b. Por el Principio de
Idealizacion II, existe un conjunto nito F [a, b] que contiene a todos los
elementos estandar de [a, b]. Uniendo F a una partici
on innitesimal de [a, b],
obtenemos otra partici
on innitesimal P que contiene a F .
Si r ]a, b[ es estandar, consideramos las particiones Pr = P [a, r] y
Pr = P [r, b]. Claramente:
S(f, P ) s(f, P ) = S(f |[a,r] , Pr ) s(f |[a,r] , Pr ) + S(f |[r,b] , Pr ) s(f |[r,b] , Pr )
S(f |[a,r] , Pr ) s(f |[a,r] , Pr ) + 2M (b r),
donde M es una cota (estandar) de f en [a, b]. Como f es continua en [a, r],
sabemos que es integrable, luego la diferencia de sumas de Riemann del u
ltimo
termino es innitesimal. Tomando partes est
andar vemos que
b
 b
0 f (x) dx f (x) dx 2M (b r).
a
a
Como esto es cierto para todo n
umero estandar a < r < b, la integral superior
ha de coincidir con la integral inferior.
El mismo razonamiento es valido si f es continua salvo en a. Si f es continua
salvo en a y en b, tomamos a < c < b y concluimos que f es integrable en [a, c]
y en [c, b], luego lo es en [a, b].
En general, si f es continua salvo a lo sumo en un conjunto nito de puntos
a = x0 < x1 < < xn = b, entonces tenemos que f |[xi1 ,xi ] es continua salvo
quiz
a en los extremos del intervalo, luego es integrable en [xi1 , xi ], y por el
teorema anterior es integrable en [a, b].

4.1. La integral de Riemann

125

Ejercicio: Probar que si dos funciones coinciden en un intervalo [a, b] salvo a lo sumo
en un n
umero nito de puntos, entonces una es integrable si y s
olo si lo es la otra, y
en tal caso las integrales coinciden.
Ejercicio: Probar que si f : [a, b] R es integrable, tambien lo es |f | y

 b
  b




f
(x)
dx
|f (x)| dx.


a

(Ayuda: probar que Mi (|f |, P ) mi (|f |, P ) Mi (f, P ) mi (f, P ).)

Nos ocupamos ahora del calculo explcito de integrales. En primer lugar


conviene observar que, si sabemos que una funci
on es integrable, su integral se
puede aproximar mediante sumas construidas a partir de valores concretos que
tome la funci
on en cada intervalo de una partici
on innitesimal, sin necesidad
de calcular supremos e nmos:
Teorema 4.12 Sea f : [a, b] R una funci
on est
andar integrable en [a, b],
sea P una partici
on innitesimal (de n+1 elementos) y sea {yi }ni=1 un conjunto
de puntos tales que yi [xi1 , xi ]. Entonces


f (x) dx

f (yi )xi .

i=1

n: Es evidente que
Demostracio
s(f, P )

f (yi )xi S(f, P ).

i=1

Teorema 4.13 (Regla de Barrow) Sea f : [a, b] R una funci


on continua
en [a, b] y derivable en ]a, b[. Si f  es integrable en [a, b] entonces


f  (x) dx = f (b) f (a).

n: Podemos suponer que f es estandar. Fijamos una parDemostracio


tici
on innitesimal y aplicamos el teorema del valor medio a cada intervalo, de
modo que encontramos puntos yi [xi1 , xi ] tales que
f (xi ) f (xi1 ) = f  (yi )(xi xi1 ).
Entonces
 b
n
n

f  (x) dx
f  (yi )xi =
(f (xi ) f (xi1 )) = f (b) f (a).
a

i=1

i=1

Como el primer y el u
ltimo termino son estandar, de hecho se tiene la igualdad.

126

Captulo 4. C
alculo integral de una variable

As pues, para calcular la integral de una funci


on f : [a, b] R basta
encontrar una funci
on F : [a, b] R continua en [a, b] y derivable en ]a, b[ tal
que f = F  . Una tal funci
on F es lo que se conoce como una primitiva de f .
El teorema siguiente demuestra que toda funci
on continua tiene una primitiva,
aunque la forma de construirla no ayuda mucho a calcular integrales:
Teorema 4.14 Si f : [a, b] R es una funci
on integrable, entonces la funci
on
 x
F (x) =
f (t) dt
a

es continua en [a, b] y, si f es continua, F es derivable en ]a, b[ y F  = f .


n: Podemos suponer que f es estandar. Hemos de entenDemostracio
der que, por denici
on, F (a) = 0. Tomemos x [a, b] tambien estandar y
consideremos un innitesimo h tal que x + h [a, b]. Si h > 0 tenemos que


x+h

F (x + h) F (x) =

f (t) dt
x

y la monotona de la integral implica que


h

nf

t[x,x+h]

f (t) F (x + h) F (x) h

sup

f (t).

t[x,x+h]

El supremo y el nmo son nitos, luego los extremos de las desigualdades


son innitesimales, luego F (x + h) F (x). Si h < 0 tenemos
h

nf

t[x+h,x]

f (t) F (x) F (x + h) h

sup

f (t).

t[x+h,x]

y llegamos a la misma conclusion. Esto prueba que F es continua en x. Supongamos ahora que, adem
as, x ]a, b[, f es continua en x y h = 0. Las expresiones
anteriores nos dan
nf

f (t)

F (x + h) F (x)
sup f (t)
h
t[x,x+h]

nf

f (t)

F (x + h) F (x)
sup f (t).
h
t[x+h,x]

t[x,x+h]

o bien
t[x+h,x]

En ambos casos, como f es continua en x, el supremo y el nmo se alcanzan


en puntos del intervalo correspondiente y est
an innitamente pr
oximos a f (x).
As pues,
F (x + h) F (x)
f (x),
h
luego existe F  (x) = f (x).

4.1. La integral de Riemann


Nota

127

Si adoptamos el convenio de que




f (x) dx =

f (x) dx,

en el teorema anterior no es necesario tomar a como extremo jo de la integral.


En efecto, podemos tomar cualquier n
umero a < c < b y denir Fc : [a, b] R
como
 x
Fc (x) =

f (x) dx.
c

Entonces

f (x) dx

Fc (x) =

f (x) dx = F (x)

f (x) dx.
a

As, como Fc y F se diferencian en una constante, existe Fc = F  = f .


No vamos a entrar aqu en las tecnicas de calculo de primitivas. Muchas de
ellas se deducen mecanicamente de las reglas de derivacion que ya hemos visto.
Por ejemplo, del hecho de que la derivada de xn es nxn1 , para todo n Z, se
deduce inmediatamente que
 n+1 
 b
x
xn dx =
,
para n Z \ {1}.
n
+1
a
Ejercicio: Demostrar que


a

1
= [ln |x|]ba ,
x

donde 0 < a < b o bien a < b < 0.


Ejercicio: Demostrar la regla de integraci
on por partes:

u(x)v  (x) dx = [u(x)v(x)]ba

v(x)u (x) dx.

Teorema 4.15 (Teorema de cambio de variable) Sea f : [a, b] R una


funci
on continua y x : [u, v] [a, b] una funci
on biyectiva, continua, derivable
en ]c, d[ y con derivada positiva. (En particular, se cumplir
a que a = x(u),
b = x(v).) Entonces


x(v)

f (x) dx =
x(u)

f (x(t))x (t) dt.

n: Las hip
Demostracio
otesis sobre x implican que es estrictamente creciente (y, en particular, que x(u) = a, x(v) = b, como se indica en el enunciado). Por lo tanto, si {ti }ni=0 es una partici
on innitesimal de [u, v] y hacemos
xi = g(ti ) entonces {xi }ni=0 es una partici
on de [a, b], y es innitesimal porque,

128

Captulo 4. C
alculo integral de una variable

al ser x continua en ti ti ti1 , tenemos que x( ti ) x(ti ) x(ti1 ). Por el


teorema del valor medio existen puntos ci ]ti1 , ti [ tales que xi = x (ci )ti .
Por lo tanto
 x(v)
 v
n
n


f (x) dx
f (x(ci ))xi =
f (x(ci ))x (ci )ti
f (x(t))x (t) dt.
i=1

x(u)

i=1

Como los dos extremos son estandar, se tiene la igualdad.

Nota El teorema es valido tambien si, en lugar de suponer que x tiene derivada
positiva, suponemos que tiene derivada no nula. En tal caso, la u
nica alternativa
es que la derivada sea negativa. La prueba es v
alida igualmente, salvo que ahora
x es decreciente, luego x(u) = b, x(v) = a y xi < xi1 . Por lo tanto, {xi }ni=0
sigue formando una partici
on innitesimal de [a, b], solo que esta numerada al
reves. La forma de numerarla no afecta al c
alculo de la integral, pero hemos de
tener presente que xi = xi1 xi = x (ui )ti . La conclusi
on es que


x(u)

f (x) dx =
x(v)

f (x(t))x (t) dt =
u

f (x(t))x (t) dt.

Para enunciar conjuntamente los dos casos basta llamar t0 y t1 a los extremos
u, v, pero ordenados de forma que a = x(t0 ) y b = x(t1 ). Entonces, en ambos
casos podemos escribir que


x(t1 )

t1

f (x) dx =
x(t0 )

f (g(t))g  (t) dt.

t0

Formas diferenciales Vamos a introducir algunos conceptos que permiten


expresar mas ecientemente algunos de los resultados que hemos visto hasta
aqu:
Llamamos L(R) al conjunto de todas las aplicaciones lineales l : R R,
es decir, las aplicaciones de la forma l(u) = au, para un cierto a R.
(Observemos que, necesariamente, a = l(1).)
Denimos una suma + : L(R) L(R) L(R) dada por
(l + l )(u) = l(u) + l (u).
Se comprueba inmediatamente que, en efecto, l + l L(R).
Si D R es abierto, llamamos (D) al conjunto de todas las aplicaciones : D L(R). A los elementos de (D) los llamaremos formas
diferenciales en D.

4.1. La integral de Riemann

129

Observemos que, si (D), podemos denir f : D R mediante


f (a) = (a)(1), de modo que, para todo u R, se cumple que
(a)(u) = f (a)u.
As, esta completamente determinada por f y, recprocamente, dada
cualquier funci
on f : D R podemos denir (a)(u) = f (a)u. De
este modo, los elementos de (D) se corresponden biunvocamente con
las funciones de F (D). Diremos que una forma es continua, integrable,
etc. si lo es su funcion correspondiente.
Denimos una suma + : (D) (D) (D) mediante
( +  )(a) = (a) +  (a),
donde la suma del segundo miembro es la suma de L(R). Claramente,
f+ = f + f .
Denimos un producto F (D) (D) (D) mediante
(g)(a)(u) = g(a)((a)(u)).
Se comprueba inmediatamente que g (D). Claramente, fg = gf .
Si f : D R es derivable, denimos su diferencial como la forma diferencial df (D) dada por df (a)(u) = f  (a)u, es decir, como la forma
determinada por la funci
on f  .
En particular, si f (x) = x, entonces f  (x) = 1, luego dx(a)(u) = u. As,
si (D) es cualquier forma diferencial, tenemos que
(a)(u) = f (a)u = f (a)dx(a)(u),
luego = f dx. En particular, para toda funci
on derivable f F (D),
tenemos que df = f  dx.
Si f es una funci
on derivable ,usaremos la notaci
on
su derivada f  , de modo que podemos escribir
df =

df
dx

para referirnos a

df
dx.
dx

Si D contiene a un intervalo [a, b] y es integrable en [a, b] (lo que, por


denici
on, signica que f lo es), denimos
 b
 b
 b
=
(x) =
f (x) dx.
a

Esto signica que, a partir de ahora, la expresi


on
 b
f (x) dx,
a

130

Captulo 4. C
alculo integral de una variable
en lugar de ser considerada como la integral de la funci
on f , puede ser
considerada como la integral de la forma diferencial f (x) dx. En ambos
casos estamos hablando del mismo n
umero real.
Con esta notacion, las reglas de derivaci
on se expresan as:
d(f + g) = df + dg,

d(f ) = df,

d(f g) = f dg + g df.

La regla de la cadena arma que si x(t) es derivable en t0 e y(x) es derivable


en x0 = x(t0 ), entonces y(x(t)) es derivable en t0 , y
dy(x(t))
dy
dx
(t0 ) =
(x0 ) (t0 ).
dt
dx
dt
A menudo no se presta a ambig
uedad abreviar esta igualdad en la forma
dy
dy dx
=
,
dt
dx dt
donde hay que entender que la funci
on y del primer miembro no es y(x), sino
la funci
on compuesta y(x(t)).
El teorema de la funci
on inversa arma que, si tenemos funciones mutuamente inversas y = y(x) y x = x(y), y un punto y0 = y(x0 ) (o, equivalentemente,
x0 = x(y0 )), entonces
dy
1
.
(x0 ) = dx
dx
dy (y0 )
Nuevamente, es frecuente abreviarlo en la forma:
Las reglas de integracion son:
 b
 b

( +  ) =
+
a

 ,

dy
1
= dx .
dx
dy


.
a

La regla de Barrow arma que


 b
df = f (b) f (a).
a

Ahora podemos escribir la f


ormula de integraci
on por partes en su forma
mas conocida:
 b
 b
u dv = [uv]ba
v du.
a

M
as interesante es el caso del teorema de cambio de variable: Si tenemos
una integral
 b
f (x) dx
a

y el cambio de variable x = x(t) cumple las hip


otesis del teorema, es decir,
x biyecta un intervalo [t0 , t1 ] o [t1 , t0 ] con [a, b], donde los nombres t0 y t1 se

4.1. La integral de Riemann

131

asignan a los extremos del intervalo de modo que a = x(t0 ), b = x(t1 ), entonces,
la igualdad
 x(t1 )
 t1
dx
f (x) dx =
f (x(t))
dt
dx
t0
x(t0 )
puede interpretarse como una mera sustituci
on de la variable x por la funci
on
x(t) y la forma diferencial dx por la forma diferencial
dx =

dx
dt.
dt

Terminamos la seccion con un ejemplo sobre c


omo el calculo integral permite
calcular polinomios de Taylor y estimar el error:
Teorema 4.16 La funci
on f (x) = log(1 + x) admite un desarrollo en serie de
Taylor


(1)n+1 n
log(1 + x) =
x
n
n=1
que converge para 1 < x 1.
n: Partimos de la f
Demostracio
ormula de la suma de una serie geometrica:
m

xn =

n=0

1 xm+1
1
xm+1
=

.
1x
1x 1x

Esto es valido para todo x R. En particular, para x = t, lo que nos da


m

1
(1)m+1 tm+1
(1)n tn =

.
1 + t n=0
1+t

Ahora integramos:
log(1 + x)

 x
m

(1)n xn+1
(1)m+1 tm+1
=
dt.
n+1
1+t
0
n=0

Equivalentemente:
log(1 + x)

m+1

n=1

(1)n+1 n
x =
n


0

(1)m+1 tm+1
dt.
1+t

Vamos a probar que el polinomio del miembro izquierdo es el polinomio de


Taylor de grado m + 1 de f (x). Para ello llamamos R(x) al miembro izquierdo
y, por la unicidad del polinomio de Taylor, basta probar que Rn) (0) = 0 para
n = 0, . . . , m + 1. Para ello observamos que
R (x) =

(1)m+1 xm+1
= xm g(x),
1+x

132

Captulo 4. C
alculo integral de una variable

donde

(1)m+1 x
1+x
on
es una funci
on de clase C en R tal que g(0) = 0. Una simple inducci
demuestra que, para 1 n m + 1, se cumple que
g(x) =

Rn) (x) = xm+1n gn (x),


donde gn es una funci
on de clase C en R tal que gn (x) = 0. De aqu se sigue
n)
obviamente que R (0) = 0 y tenemos calculados los polinomios de Taylor.
Ahora falta probar que, para 1 < x 1 jo (est
andar), la sucesi
on de
restos de Taylor
 x

(1)m+1 tm+1
dt
1+t
0
m0
converge a 0. Ahora bien, si x 0
 x
  x m+1
 x

(1)m+1 tm+1 
t
xm+2

tm+1 dt =
dt

dt

.


1+t
m+2
0
0 1+t
0
Si m es innito y x < 1, entonces xm+2 0, y si x = 1, entonces xm+2 = 1.
En cualquier caso, el numerador de la u
ltima fracci
on es nito, y el denominador
es innito, luego la fracci
on es innitesimal.
Si 1 < x < 0, acotamos de otro modo:
 x
  0 m+1
 0 m+1

(1)m+1 tm+1 
|t|
|t|
|x|m+2

dt

dt

dt =


1+t
(1 + x)(m + 2)
0
x 1+t
x 1+x
Desde aqu se concluye igual que en el caso anterior.
En particular hemos probado que la convergencia de la serie


(1)n+1
1 1 1
= 1 + + = log 2.
n
2 3 4
n=1

Ejemplo

La serie


1
1 1 1
= 1 + + + +
n
2 3 4
n=1

es divergente.
En efecto, basta observar que, para n 1,
 n+1
 n+1
1
1
1
dx
dx = ,
x
n
n
n
n
luego


log(m + 1) =
1

m+1

m

1
1
dx
x
n
n=1

Esto prueba que si m es innito, la suma de la serie hasta m es innita,


luego la serie es divergente.

4.2. Las funciones trigonometricas

4.2

133

Las funciones trigonom


etricas

Consideremos una funci


on f [a, b] R continua en [a, b] y derivable en ]a, b[. Su gr
aca
sera una curva y vamos a calcular su longitud.
M
as precisamente, vamos a dar una denici
on
razonable de longitud de una curva. Para ello
consideramos una partici
on P de [a, b] y unimos
a
b
con segmentos los puntos (xi , f (xi )), de modo
que formamos una poligonal, tal y como muestra la gura. Vamos a probar
que, si la partici
on es innitesimal, la longitud de la poligonal estar
a innitamente cerca de un u
nico n
umero estandar independiente de la partici
on escogida,
y sera a este n
umero el que tomaremos como denicion de longitud de la curva.
En principio, la longitud de la poligonal es, claramente:
n 

L(f, P ) =
x2i + (f (xi ) f (xi1 ))2 .
i=1

Aplicando el teorema del valor medio encontramos puntos ui ]xi1 , xi [ tales


que f (xi ) f (xi1 ) = f  (ui )xi , con lo que
 b
n 

L(f, P ) =
1 + f  (ui )2 xi
1 + f  (x)2 dx.
i=1


Naturalmente, esto exige que la funci
on 1 + f  (x)2 sea integrable, lo que
tenemos garantizado si suponemos, por ejemplo, que f  es continua y acotada
en ]a, b[.
Denici
on 4.17 Sea f : [a, b] R una funci
on continua en [a, b], derivable
en ]a, b[ con derivada continua y acotada. Llamaremos longitud de f a
 b
L(f ) =
1 + f  (x)2 dx.
a

Acabamos de probar que L(f ) puede aproximarse por la longitud de una


poligonal que coincida con f en una partici
on de [a, b].

La funci
on f : [0, 1] R dada por f (x) = 1 x2 tiene por gr
aca un
cuarto de circunferencia de radio 1. Su derivada en ]0, 1[ es
f  (x) =

x
,
1 x2

1
.
1 x2
As pues, la longitud de una circunferencia de radio 1 debera ser cuatro
veces la integral
 1
dx

.
1 x2
0
1 + f  (x)2 =

134

Captulo 4. C
alculo integral de una variable

Ahora bien, esto no es correcto, porque el integrando no es una funci


on
acotada en [0, 1], por lo que la integral anterior no est
a denida. Tendremos
que ir m
as despacio.
Observamos que funci
on f  esta acotada en cualquier intervalo [0, t], con
0 < t < 1, ya que es continua en este intervalo. Esto nos permite denir la
integral
 t
dx

A(t) =
.
1 x2
0
As tenemos denida una funci
on A : [0, 1[ R que, por el teorema 4.14
es derivable en ]0, 1[. (Para probar que es derivable en t, aplicamos el teorema
en un intervalo [0, t ], con 0 < t < t < 1.) Concretamente, su derivada es:
A (t) =

1
.
1 t2

Reexionemos sobre el signicado de A(t). Por


construccion, sabemos que = A(t) es la longitud

del arco destacado en la gura. Vamos a adoptar el


1
convenio de medir un angulo precisamente por la longitud del arco que determina sobre la circunferencia
t
unidad. Entonces, es precisamente el angulo se
nalado en la gura y t es el
seno de , entendiendo seno en su sentido geometrico, es decir la longitud del
cateto opuesto a en un tri
angulo rect
angulo de hipotenusa igual a 1 y que
tenga un angulo igual a .
sen

En denitiva, si 0 t < 1, tenemos que A(t) es el angulo cuyo seno es t.

Ahora conviene hacer una observaci


on tecnica. La funci
on f (x) = 1 x2
puede considerarse como funci
on f : [1, 1] R, lo que a su vez nos permite
considerar A : ]1, 1[ R. El teorema 4.14 (vease la nota posterior) garantiza,
de hecho, que A(t) es derivable en todo el intervalo ]1, 1[.
Esta extension es trivial en el sentido siguiente: Si t > 0, el cambio de
variable [0, t] [t, 0] dado por x(u) = u, nos da

A(t) =
0

dx
=
1 x2


0

du
= A(t).
1 u2

As pues, la extensi
on de A(t) al intervalo ]1, 0[ solo supone el convenio
de asignar a cada seno negativo t el angulo cuyo seno es t, pero tambien con
signo negativo.
Denici
on 4.18 Llamaremos arco seno a la funci
on arcsen : ]1, 1[ R
dada por
 t
dx

arcsen t =
.
1 x2
0

4.2. Las funciones trigonometricas

135

A partir de la denici
on es inmediato que arcsen 0 = 0, hemos comprobado
que
arcsen(t) = arcsen t,
y del teorema 4.14 se sigue que se trata de una funci
on derivable con derivada
arcsen (t) =

1
.
1 t2

Tambien hemos visto que su interpretaci


on geometrica es que = arcsen t
(para t > 0) es el angulo cuyo seno es t o, equivalentemente, la longitud del arco
de la circunferencia unidad determinado por el angulo de seno t.
1.5

0.5

-1

-0.5

0.5

La gura nos muestra la gr


aca de la funci
on
arcsen, pero en estos momentos no podemos demostrar todo lo que vemos en ella. Ya hemos
justicado su simetra, y tambien podemos asegurar que es estrictamente creciente, puesto que
conocemos su derivada y es positiva. El teorema
de la funci
on inversa 3.22 nos da que su imagen es
un intervalo, que, dada la simetra, sera necesariamente de la forma ]p, p[, donde, o bien p R,
o bien p = +.

-0.5

En la gura vemos que de hecho p R y


es un poco mayor que 1.5. Tambien la interpre-1
tacion geometrica del arco seno exige que p sea
nito, pues ha de ser, concretamente, la longi-1.5
tud de un cuarto de circunferencia. Sin embargo,
hasta ahora no tenemos ning
un argumento que lo
justique. En cualquier caso, lo que tenemos es que
arcsen : ]1, 1[ ]p, p[
es biyectiva, y podemos considerar su inversa:
Denici
on 4.19 Llamaremos funci
on seno a la funci
on
sen : ]p, p[ ]1, 1[
inversa de la funci
on arco seno.
Su interpretaci
on geometrica es clara: sen es el seno (en el sentido geometrico) del angulo (que determina en la circunferencia unidad un arco de longitud) .
De las propiedades que conocemos del arco seno se deduce inmediatamente
que sen 0 = 0 y que sen() = sen , as como que el seno es estrictamente
creciente. Por el teorema de la funci
on inversa sabemos que es derivable y que,
si llamamos t = sen , entonces


1
sen =
= 1 t2 = 1 sen2 .

arcsen t

136

Captulo 4. C
alculo integral de una variable

Denici
on 4.20 Llamaremos coseno a la funci
on
cos : ]p, p[ ]0, 1]
dada por cos =

1 sen2 .

De este modo, es claro que


cos 0 = 1,

cos() = cos ,

sen2 + cos2 = 1,

sen = cos .

M
as a
un, como la raz cuadrada es derivable en ]0, +[, tenemos que el
coseno es derivable y su derivada es
cos =

2 sen cos

= sen .
2 1 sen2

La gura muestra las gr


acas de las funciones
seno
y
coseno.
Sabemos
que
la funci
on seno es
0.5
mon
otona creciente y sen 0 = 0, luego es negativa
-1.5
-1
-0.5
0.5
1
1.5
para < 0 y positiva para > 0. Por consiguiente, el coseno tiene derivada positiva para
-0.5
< 0 y derivada negativa para > 0. Esto
-1
prueba que su aspecto es el que muestra la gura:
es creciente hasta llegar a = 0 (donde toma su valor m
aximo cos 0 = 1), y
luego es decreciente. Lo u
nico que no sabemos demostrar es que el intervalo
]p, p[ es nito como muestra la gura. Para probarlo haremos uso del teorema
siguiente:
1

Teorema 4.21 Para todo par de n


umeros reales , tales que
, , + ]p, p[
se cumple que
sen( + ) = sen cos + cos sen .
n: Fijado ]p, p[, sea I = ]p, p[ ]p , p [, donde
Demostracio
hemos de entender que, si p = +, entonces p = , p = +.
Es claro que I es un intervalo abierto que contiene al 0. Se trata del mayor
intervalo tal que, si x I, estan denidos sen x, cos x y sen(x + ).
Llamemos g : I R a la funci
on dada por
g(x) = sen(x + ) sen x cos cos x sen .
Su derivada es
g  (x) = cos(x + ) cos x cos + sen x sen .
Vemos que la funci
on g  tambien es derivable, y
g  (x) = sen(x + ) + sen x sen + cos x cos = g(x).

4.2. Las funciones trigonometricas

137

As pues,
(g  (x)2 + g(x)2 ) = 2g  (x)g  (x) + 2g(x)g  (x) = 2g  (x)(g  (x) + g(x)) = 0,
para todo x I, luego la funci
on g  (x)2 + g(x)2 es constante en I. Ahora bien,
resulta que en x = 0 toma el valor 0, luego
g  (x)2 + g(x)2 = 0
para todo x I. Esto implica a su vez que g(x) = 0, luego se cumple la f
ormula
del enunciado.

Ahora podemos probar que p es nito. En


efecto, tenemos que 2/2
]0, 1[,
luego existe un ]0, p[ tal que sen = 2/2, y entonces cos = 2/2. Si
p fuera innito, se cumplira que p < + < p, y el teorema anterior nos
dara sen 2 = 1, lo cual es absurdo, pues la funci
on seno no toma el valor 1 en
]p, p[.
Denici
on 4.22 Llamaremos = 2p, de modo que
sen : ]/2, /2[ ]1, 1[ ,

cos : ]/2, /2[ ]0, 1] .

Teniendo en cuenta que el seno es biyectivo en los intervalos indicados, as


como que es estrictamente creciente, es inmediato que se extiende a una funcion
biyectiva, estrictamente creciente y continua
sen : [/2, /2] [1, 1]
estableciendo que sen(/2) = 1, sen(/2) = 1. La f
ormula cos =
nos da una extensi
on continua para el coseno

1 sen2

cos : [/2, /2] [0, 1]


estableciendo que cos(/2) = cos(/2) = 0.
Ahora denimos extensiones:
sen : [, ] [1, 1],
mediante
sen =

sen( + )
sen( )

cos : [, ] [1, 1]


si < /2,
si > /2,

cos =

cos( + )
cos( )

-2 -1
 
2

1
-1

2

2

si < /2,
si > /2.

138

Captulo 4. C
alculo integral de una variable

Es inmediato comprobar que estas extensiones siguen cumpliendo las relaci


on
sen2 + cos2 = 1, as como que, para cualquier ], [, tal que = /2,
se sigue cumpliendo que existen
sen = cos ,

cos = sen .

Esto tambien es cierto en los dos puntos que hemos exceptuado, y las cuatro
comprobaciones son an
alogas. Vamos a probar, por ejemplo, la derivabilidad
del seno en /2.
Tomemos un innitesimo h > 0. Entonces
sen(/2 h) sen(/2)
cos(h) 1
=
cos (0) = sen 0 = 0,
h
h
sen(/2 + h) sen(/2)
sen(/2 + h) 1
cos h 1
=
=
0.
h
h
h
Esto prueba que existe sen (/2) = 0 = cos(/2).
Finalmente, dado R, existe un u
nico k Z tal que
+ 2k < + 2(k + 1),
(a saber, k = E[( + )/2]), con lo que = 2k +  , con  < , y
tanto k como  estan unvocamente determinados por . Denimos
sen = sen  ,

cos = cos  .
1

2

3
 
2

 
2


2

-1

3

2

Dejamos como ejercicio demostrar el teorema siguiente, algunas de cuyas


partes ya han sido probadas:
Teorema 4.23 Las funciones
sen : R [1, 1],

cos : R [1, 1]

cumplen las propiedades siguientes:


a) sen = sen( + 2k), cos = cos( + 2k), para todo R y todo k Z.
b) sen : [/2, /2] [1, 1] es creciente.
c) cos : [0, ] [1, 1] es decreciente.
d) Son derivables y sen = cos , cos = sen .
e) sen2 + cos2 = 1.
f ) sen( + ) = sen cos + cos sen .
g) cos( + ) = cos cos sen sen .

4.2. Las funciones trigonometricas

139

Nota La prueba m
as corta del apartado f) consiste en observar que la prueba
del teorema 4.21 sigue siendo valida sin m
as cambio que eliminar toda restricci
on
sobre los dominios. (La funci
on g denida en la prueba est
a ahora denida sobre
I = R.) El apartado g) se deduce de f) sin m
as que derivar la f
ormula como
funci
on de , considerando a constante.
A partir de este teorema ya es posible demostrar sin dicultad cualquiera de
las propiedades de las funciones seno y coseno que se aprecian en las gracas.
Por ejemplo, vemos que ambas gr
acas son identicas salvo un desfase de /2,
y esto se deduce del apartado g):
cos( + /2) = sen .
Ejercicio: Probar que sen(/4) = cos(/4) =

2/2.

nico
Ejercicio: Probar que, para todo (x, y) R2 tal que x2 + y 2 = 1, existe un u
[0, 2[ tal que (x, y) = (cos , sen ).

Las funciones seno y coseno cumplen las hip


otesis del teorema 3.35, por lo
que podemos desarrollarlas en serie de Taylor. Es inmediato comprobar que los
desarrollos son:
sen x =


(1)n
x2n+1 ,
(2n
+
1)!
n=0

cos x =


(1)n 2n
x .
(2n)!
n=0

Denici
on 4.24 Llamaremos funci
on tangente a la funci
on
tan x =
6

3 
2  
2

 
2


2

3

2

sen x
.
cos x

Est
a denida en todos los n
umeros reales excepto los que anulan al coseno, que son los de la
forma /2 + 2k, con k Z. En particular, est
a
denida en el intervalo ]/2, /2[. Tambien es
obvio que

-2

tan(x) = tan(x + 2k),

-4

para todo x donde est


a denida y todo k Z.
Donde esta denida es derivable, y su derivada es

-6

tan x =

cos2 x + sen2 x
1
=
.
cos2 x
cos2 x

Como la derivada es positiva, la tangente es creciente en ]/2, /2[, y es


inmediato que tiende a en los extremos, por lo que
tan : ]/2, /2[ R
es biyectiva y creciente.

140

Captulo 4. C
alculo integral de una variable


2
-4

-2

Llamaremos arco tangente a la funci


on
inversa
4

 
2

arctan : R ]/2, /2[ .

Por el teorema de la funci


on inversa, si = arctan x, entonces
arctan x =

1
1
1
.
=
= cos2 =
tan
1 + x2
1 + tan2

Aqu hemos usado que, como sen2 + cos2 = 1, al dividir entre cos2
queda
1
tan2 + 1 =
.
cos2
La regla de Barrow nos da una expresi
on integral para el arco tangente:
 x
dt
arctan x =
.
1
+
t2
0
De ella podemos deducir el desarrollo en serie de Taylor:
Teorema 4.25 La funci
on arco tangente admite un desarrollo en serie de Taylor


(1)n x2n+1
arctan x =
,
2n + 1
n=0
que converge cuando |x| 1
n: La prueba es an
Demostracio
aloga a la del teorema 4.16. Como all,
partimos de la f
ormula
m

xn =

n=0

1 xm+1
1
xm+1
=

,
1x
1x 1x

pero ahora sustituimos x = t2 , lo que nos da


m

1
(1)m+1 t2m+1
n 2n

(1)
t
=
.
1 + t2 n=0
1 + t2

Al integrar obtenemos:
 x
m

(1)n x2n+1
(1)m+1 t2(m+1)
arctan x
dt.
=
2n + 1
1 + t2
0
n=0
La prueba de que el polinomio del miembro izquierdo es el polinomio de
Taylor de grado 2m + 1 de la funci
on arcotangente sigue el mismo argumento
empleado en 4.16. (Notemos que, del hecho de que los polinomios de Taylor de
grado 2m + 1 tengan esta forma, se sigue que el polinomio de Taylor de grado
2m es el mismo que el de grado 2m 1.)

4.3. C
alculo de longitudes, areas y vol
umenes

141

Ahora falta probar que, para |x| 1 jo, la sucesi


on de restos de Taylor
 x

(1)m+1 t2(m+1)
dt
1 + t2
0
m0
converge a 0. Ahora bien:
 x
  |x| 2(m+1)
 |x|

|x|2m+3
(1)m+1 t2(m+1) 
t

dt

dt

t2(m+1) dt =
.


2
2
1+t
1+t
2m + 3
0
0
0
Y basta observar que el u
ltimo termino es innitesimal cuando m es innito.
Ahora observamos que
tan
luego

sen 4

2/2

=
= 1,
=
4
cos 4
2/2

(1)n
1 1 1
= arctan 1 =
= 1 + +
4
2n
+
1
3 5 7
n=0

Hemos obtenido as una de las muchas expresiones que permiten calcular


aproximaciones de
= 3.1415926535897932384626433 . . .

Esta
no es de las que convergen mas rapidamente (sumando los primeros 100.000
terminos solo obtenemos la aproximaci
on 3.14160, donde la cuarta cifra decimal
ya es incorrecta), pero no vamos a entrar en cuestiones de calculo numerico.

4.3

C
alculo de longitudes,
areas y vol
umenes

Longitudes de curvas En la seccion anterior hemos dado una f


ormula para
calcular la longitud de un arco de curva. Conviene generalizarla para admitir que
la curva venga expresada de forma parametrica, es decir, como una aplicacion
(t2 )
(t1 )
l2
l1
(t0 )

: [a, b] R2 ,

(t3 )
(t4 ) que sera de la forma (t) = (x(t), y(t)), para
l3
l4
ciertas funciones x, y. Notemos que la graca
de una funci
on f : [a, b] R es el caso particular en que (t) = (t, f (t)), es decir, el caso
particular en que x(t) = t.

Deniremos la longitud de con el mismo criterio que en la seccion anterior:


consideramos una partici
on P de [a, b], la cual da lugar a un n
umero nito de
puntos sobre la curva, puntos que unimos por una lnea poligonal de n segmentos

142

Captulo 4. C
alculo integral de una variable

de longitudes l1 , . . . , ln . Vamos a probar que, si cumple algunas condiciones


de derivabilidad, la suma
n

L(, P ) =
li
i=1

converge a un n
umero (estandar) L, en el sentido de que, cuando la partici
on
es innitesimal, L(, P ) L, y este n
umero L sera el que tomaremos como
denici
on de la longitud de .
Vamos a suponer que las funciones x(t), y(t) son dos veces derivables, y que
la segunda derivada est
a acotada en ]a, b[ por un n
umero (estandar) M . Esto
se cumple, por ejemplo, si ambas funciones son de clase C 2 en un abierto que
contenga al intervalo [a, b].
y1
d
y0
x0

x1

Como vamos a trabajar en R2 , necesitamos un hecho elemental de la geometra de R2 del que nos ocuparemos con mas detalle en el captulo VI: la distancia
entre dos puntos (x0 , y0 ), (x1 , y1 ) viene dada por

d((x0 , y0 ), (x1 , y1 )) = (x1 x0 )2 + (y1 y0 )2 .

Denimos la recta tangente a en un punto t0 ]a, b[ como la recta en forma


parametrica T : R R2 dada por
T (t) = (x(t0 ) + x (t0 )(t t0 ), y(t0 ) + y  (t0 )(t t0 )).
Claramente, se trata de una recta que pasa por el punto (t0 ). Vamos a
probar que el nombre de recta tangente est
a justicado. Para ello aplicamos
el teorema de Taylor, que nos da que, si t ]a, b[, se cumple que
1
x(t) = x(t0 ) + x (t0 )(t t0 ) + x (c)(t t0 )2 ,
2
1
y(t) = y(t0 ) + y  (t0 )(t t0 ) + y  (d)(t t0 )2 ,
2
donde c y d son n
umeros entre t y t0 . Si 2M es una cota para las segundas
derivadas, tenemos que
|x(t) Tx (t)| M (t t0 )2 ,

|y(t) Ty (t)| M (t t0 )2 ,

luego
d((t), T (t)) =


(x(t) Tx (t))2 + (y(t) Ty (t))2 M (t t0 )2 .

Esto implica en particular que si t t0 , entonces d((t), T (t)) 0, es


decir, que la curva y la recta tangente est
an innitamente pr
oximas para valores
de t innitamente pr
oximos, pero debemos insistir en que esta observacion no
tiene valor alguno: cualquier recta que pase por el punto (t0 ) cumplir
a esta
propiedad, por la mera continuidad de y de la recta.

4.3. C
alculo de longitudes, areas y vol
umenes

143

Para enunciar la caracterstica que distingue a la recta tangente de cualquier


otra recta, consideramos una homotecia Hr : R2 R2 de radio r y centro
(t0 ). Explcitamente:
H(x, y) = (x(t0 ) + r(x x(t0 ), y(t0 ) + r(y y(t0 )).
Llamemos Hr () y Hr (T ) a las composiciones de y T con Hr , es decir:
Hr ()(t) = (x(t0 ) + r(x(t) x(t0 )), y(t0 ) + r(y(t) y(t0 ))),
Hr (T )(t) = (x(t0 ) + rx (t0 )(t t0 ), y(t0 ) + ry  (t0 )(t t0 )).
Observemos que las coordenadas de Hr (T )(t) son nitas si y s
olo si r(tt0 ) es
nito (lo que, en particular, exige que t t0 ). Para estos valores de t, tambien
es nito Hr ()(t), debido al siguiente hecho general: cualquier homotecia de
radio r cumple que
d(Hr (x), Hr (y)) = rd(x, y).
Esto se debe a que una homotecia se calcula efectuando una traslaci
on (que
no altera las distancias), multiplicando por r (que multiplica las distancias por r)
y luego efectuando otra traslaci
on (que no altera las distancias). Por consiguiente,
d(Hr ()(t), Hr (T )(t)) M r|t t0 |2 ,
luego Hr ()(t), no s
olo es nito cuando r(t t0 ) es nito, sino que permanece
innitamente cerca de Hr (T )(t).
La gura3 ilustra lo que hemos demostrado:
Los valores t t0 que cum
(t) plen que r(t t0 ) es nito son los que
(t0 )
(t0 )
tienen im
agenes nitas4 al aplicar la hoHr
aca de Hr (T ) es la
motecia Hr . La gr
T
misma recta T (aunque ahora se recorre
toda ella con par
ametros innitamente
pr
oximos a t0 ), mientras que la gr
aca
()
resulta
ser
indistinguible
de
T.
de
H
r
t0 t
En principio, la recta T no es la u
nica
que cumple esto, pues lo cumplir
a tambien cualquier otra recta cuya pendiente
este innitamente pr
oxima a la de T , pero si el punto t0 es estandar (cosa que
no hemos necesitado suponer en todo el razonamiento), entonces T sera tambien
estandar y es la u
nica recta estandar que aproxima a de esta forma.
Volvemos ahora al problema de calcular la longitud de . Para ello, vamos
a ver que en lugar de considerar la longitud li del segmento que va de (ti1 ) a
3 El punto marcado con (t) dentro de la lupa es en realidad H ()(t), pero no hay
r
confusi
on posible si omitimos Hr del nombre de toda imagen vista a traves de una lupa.
Lo mismo vale, en principio, para (t0 ), pero en este caso Hr ()(t0 ) = (t0 ).
4 Esto es exacto para H (T ), pero puede ocurrir que H()(t) tome valores nitos cuando
r
r(t t0 ) sea innito, por ejemplo, porque tenga forma de ocho y vuelva a pasar por (t0 )
para otro valor t > t0 , pero tales puntos podran eliminarse reduciendo el dominio [a, b] de .

144

Captulo 4. C
alculo integral de una variable

(ti ), podemos considerar la recta tangente Ti en ti1 y considerar la longitud


li del segmento que va de (ti1 ) a Ti (ti ).
Observemos que la gura no representa una ampliaci
on
homotetica de la curva (es decir, que no esta a escala,
li
porque, si lo fuera, los dos segmentos y la gr
aca de deber
an
estar
representados
por
un
mismo
segmento
de recta,
li (ti )
ya
que,
seg
u
n
hemos
visto,
H
()(t
)

(t
).
Precisamente
r
i
i
(ti1 )
esta es la razon por la que podremos cambiar li por li .
Muchos libros, especialmente de fsica, argumentan con innitesimos y, en
situaciones similares a esta, arman que podemos tomar li en lugar de li simplealido. Nuestra intenci
on
mente porque li li , pero esto no es un argumento v
es sumar los innitos valores de li , y al cambiarlos por los li estamos introduciendo un error innitesimal en cada sumando. El problema, es que al sumar
innitos errores innitesimales, el error total puede ser apreciable, y en tal caso
la sustituci
on no es v
alida. Hemos de probar que no se da el caso. Ahora bien,
es claro que li li + d(Ti (ti ) (ti )) y tambien li li + d(Ti (ti ) (ti )), lo
que nos da:
Ti (ti )

|li li | d(Ti (ti ) (ti )) M t2i M P ti .


Por lo tanto,


n
n
n



 li
l  M P 
ti = M (b a)P ,
i


i=1

i=1

i=1

que es innitesimal para cualquier partici


on innitesimal P . As pues, si proban


mos que
li permanece innitamente pr
oximo a un n
umero jo (est
andar) L
i=1

sea cual sea la particion innitesimal P , habremos probado que lo mismo vale
para la suma de los li .
En denitiva, vemos que si podemos sustituir li por li no es porque li li ,
sino porque la diferencia sigue siendo innitesimal cuando se divide entre ti
o, equivalentemente, entre la norma de la partici
on. Los matematicos antiguos
expresaban esto diciendo que li li es un innitesimo de orden superior a ti .
La interpretaci
on geometrica es, precisamente, que el innitesimo li li se mantiene innitesimal al aplicar cualquier homotecia que vuelva apreciable (es decir,
nito, pero no innitesimal) el incremento ti .
Ahora observamos que
Ti (ti ) = (x(ti1 ) + x (ti1 )ti , y(ti1 ) + y  (ti1 )ti ),
por lo que

li = d((ti ), Ti (ti )) =

x (ti1 )2 + y  (ti1 )2 ti ,

luego
n

i=1

li

i=1

li =

En denitiva:

n 

i=1


x (ti1 )2 + y  (ti1 )2 ti
a

x (t)2 + y  (t)2 dt.

4.3. C
alculo de longitudes, areas y vol
umenes

145

Denici
on 4.26 Si : [a, b] R2 es una funci
on con coordenadas5 de clase
C 1 en un intervalo abierto que contenga a [a, b], denimos la longitud de como

L() =

x (t)2 + y  (t)2 dt.

Notemos que la denici


on 4.17 es el caso particular de esta que resulta de
tomar x(t) = t.
Ejemplo
funci
on

Podemos parametrizar una circunferencia de radio r mediante la


(t) = (r cos t, r sen t),

0 t 2.

Por consiguiente, la longitud de la circunferencia es


 2 
 2
2
2
r sen t + cos t dt =
r dt = 2r.
0

El
area de un crculo La funci
on f (x) = r2 x2 deja bajo su gr
aca un
semicrculo de radio r, luego el area de un crculo de radio r es
 r 
A=2
r2 x2 dx.
r

Para calcular esta integral usamos el cambio de variable (estrictamente creciente) x : [/2, /2] [r, r] dado por x = r sen t. As:6


/2

A=2
/2

/2

= 2r2
/2

r2 r2 sen2 t r cos t dt = 2r2

/2

cos2 t dt
/2

/2

1 + cos 2t
sen 2t
2
dt = r t +
= r2 .
2
2
/2

Ejercicio: Modicar el ejemplo anterior para calcular el


area de
la regi
on sombreada en la gura. Sum
andola al
area del tri
angulo
adyacente, calcular el
area del sector circular en funci
on de .

En el ejemplo anterior hemos calculado el area del crculo


a partir de la interpretaci
on de la integral como area comprendida bajo la gr
aca de una funci
on. El c
alculo no ha sido

5 Para que L() est


e bien denida no es necesario suponer que las coordenadas de admitan
segundas derivadas. La discusi
on precedente prueba que, cuando las tienen y est
an acotadas,
L() es lo que pretendemos que sea. Puede probarse que lo mismo es cierto bajo las meras
hip
otesis de la denici
on, pero ello exige algunos tecnicismos adicionales en el argumento.
6 Usamos que cos 2t = cos2 t sen2 t = 2 cos2 t 1.

146

Captulo 4. C
alculo integral de una variable

especialmente sencillo: hemos necesitado un cambio de variable y transformar


un integrando mediante una identidad trigonometrica. Vamos a llegar al mismo
resultado de un modo conceptualmente m
as simple y, de hecho, mas clasico.
Consideremos un sector circular de radio r y amplitud
. Su area esta comprendida entre los dos tri
angulos
isosceles que muestra la gura. El menor es uni
on de
dos tri
angulos rect
angulos de base r cos(/2) y altura
r sen(/2), luego su area es

s = r2 cos

r2
sen =
sen .
2
2
2

El mayor es uni
on de dos tri
angulos rect
angulos de base r y altura r tan(/2),
luego su area es

S = r2 tan
2

Ahora consideramos el sector circular comprendido


entre dos angulos y . Tomamos una partici
on P =

{i }ni=0 de [, ], que divide el sector dado en n peque


nos
sectores. Usando las estimaciones anteriores, el area del
sector completo estara acotada de este modo:
n
n

r2

i
sen i A r2
tan
.
2 i=1
2
i=1

El teorema del valor medio aplicado al intervalo [0, i ] nos da que existe
0 < ci < i P  tal que
sen i = i cos ci i cos P .
As pues,
A

r2
r2 ( )
cos P  i =
cos P .
2
2
i=1

Igualmente,
tan

i
1 i
1
i
=

,
2
2
2
cos di 2
cos P  2

con 0 < di < i /2 P , luego


A
En total:

r2
r2 ( )
.

=
i
cos2 P  i=1
2 cos2 P 

r2 ( )
r2 ( )
cos P  A
.
2
2 cos2 P 

4.3. C
alculo de longitudes, areas y vol
umenes

147

Esto es valido para cualquier partici


on P . Si la tomamos innitesimal resulta
que cos P  1, luego ha de ser
A=

r2
( ).
2

En particular, si [, ] = [0, 2], el area del crculo completo es A = r2 .

Coordenadas polares Consideremos ahora una curva en R2 que este determinada por una funci
on : [, ] ]0, +[ del modo siguiente: la recta que
pasa por (0, 0) y forma un angulo con el vector (1, 0) corta a la curva en un
u
nico punto a distancia () de (0, 0).
()
Entonces, una parametrizaci
on de la curva es la aplicacion : [, ] R2 dada por
()

(t) = (() cos , () sen ).

()

Esto nos permite calcular su longitud:




L() =

( () cos () sen )2 + ( () sen + () cos )2 d


2 () + 2 () d

Mi
mi

Ahora vamos a calcular el area sombreada en la gura. Para ello tomamos una partici
on P = {i }ni=0 de
[, ]. Si mi y Mi son, como de costumbre, el nmo
on de supercie
y el supremo de en [i1 , i ], la porci
contenida en el angulo [i1 , i ] contiene al sector circular de radio mi y esta contenida en el sector circular de
radio Mi . Por lo tanto,
n m2
n M2

i
i
i A
i .
i=1 2
i=1 2

Los extremos son una suma inferior y una suma superior de la integral
A=

1
2

2 ()d,

que, por consiguiente, ha de ser el area que buscamos.

148

Captulo 4. C
alculo integral de una variable

Supercies de revoluci
on Vamos a calcular el area de una supercie de
revoluci
on, es decir, de la supercie generada cuando giramos alrededor del eje
X la gr
aca de una funci
on r : [a, b] R que no tome valores negativos, tal y
como se muestra en la primera gura.
Para ello tomamos una partici
on innitesimal P = {xi }ni=1 de [a, b] y otra
Q = {j }m
de
[0,
2].
La
partici
o
n P divide la supercie en rodajas circulaj=1
on
res de longitud xi (que en la segunda gura vemos desde arriba) y la partici
Q subdivide cada rodaja en cuadril
ateros.
r(x)
j
j1
xi1 xi

r(x)
g
r(xi1 )j

xi1

xi

r(xi )j

No es difcil ver que las particiones pueden renarse (a


nadiendoles puntos)
para que los cocientes xi /j sean nitos, lo que nos permite considerar
aneamente los
una homotecia Hr de radio innito que vuelva apreciables simult
incrementos xi y j .
Al estudiar las longitudes de curvas hemos visto que, si a un arco de longitud
innitesimal le aplicamos una homotecia que vuelve apreciable la diferencia
entre sus extremos, el arco permanece innitamente cerca del segmento que une
dichos extremos. As pues, al aplicar Hr , el cuadril
atero innitesimal abombado
de la segunda gura se transforma en un cuadril
atero nito indistinguible de un
cuadril
atero plano como el representado en la cuarta gura.
La longitud g sera (ampliada r veces) la longitud del segmento que une los
puntos (xi1 , r(xi1 )) y (xi , r(xi )), es decir:

g = x2i + (r(xi ) r(xi1 ))2 .
Aplicando el teorema del valor medio: r(xi ) r(xi1 ) = r (ci )xi , para
cierto punto xi1 < ci < xi , luego

g = 1 + r (ci )2 xi .
Si xi1 x xi , la altura en x del cuadril
atero es un arco de circunferencia
de radio r(x) y de amplitud j , luego su longitud es r(x)j . Al aplicar Hr ,

4.3. C
alculo de longitudes, areas y vol
umenes

149

las diferencias de longitud para distintos valores de x pueden ser apreciables


(como se reeja en la cuarta gura, donde el cuadril
atero tiene forma trapezoidal). Por lo tanto, el producto

r(di ) 1 + r (ci )2 xi j ,

xi1 di xi ,

sera una aproximaci


on por defecto o por exceso al area del cuadril
atero seg
un
que di corresponda a la m
axima longitud r(x)j o a la mnima. Sin embargo, vamos a ver que diferentes elecciones para di solo producen variaciones
innitesimales en la suma
S=

n



r(di ) 1 + r (ci )2 xi j = 2 r(di ) 1 + r (ci )2 xi ,

n
m

j=1 i=1

i=1

con lo que esta sera una estimacion razonable del area que queremos calcular.
En efecto, si tomamos otros valores ei [xi1 , xi ], podemos aplicar el teorema
del valor medio:
|r(di ) r(ei )| = |r (fi )||ei di | M xi M P 
donde M es una cota (estandar) de r en [a, b]. Por lo tanto,
|S({di }) S({ei })| 2M P 

n 

1 + r (ci )2 xi 0,

i=1

porque P  es innitesimal y el sumatorio es nito, ya que est


a innitamente
pr
oximo a la integral
 b
1 + r (x)2 dx.
a

En particular, tomando ei = ci , vemos que, sea cual sea di , se cumple que


S 2




2
r(ci ) 1 + r (ci ) xi 2

i=1


r(x) 1 + r (x)2 dx.

Denici
on 4.27 Llamaremos7
area de la supercie de revoluci
on generada por
la curva r : [a, b] R al valor

A = 2


r(x) 1 + r (x)2 dx.

a
7 Observemos que el razonamiento precedente no puede considerarse una demostraci
on de
que el
area es la que hemos calculado, ya que no partimos de ninguna denici
on previa de
area. Tan s

olo puede verse como un razonamiento heurstico que explica por que la denici
on
que hemos dado es la que va a comportarse como cabe esperar que se comporte un
area. En
el contexto de la geometra diferencial es posible dar una denici
on general de
area de una
supercie y, con respecto a dicha denici
on, s que es posible demostrar esta f
ormula. (Ahora
bien, la denici
on general de
area se justica por un razonamiento heurstico similar al que
hemos visto aqu.)

150

Captulo 4. C
alculo integral de una variable

Ejemplo Para calcular el area de una esfera de radio R consideramos la


funci
on r(x) = R2 x2 , denida en [R, R], con lo que obtenemos

 R 
 R
x2
2
2
A = 2
R x 1+ 2
dx = 2
R dx = 4R2 .
R x2
R
R

Ejercicio: Demostrar que la supercie lateral de un tronco de cono es


A = 2

r+R
g.
2

Demostrarlo mediante la f
ormula para supercies de revoluci
on y tambien desarrollando el cono y usando la f
ormula para el
area de un sector circular.

2R
h
H

2r

R
(N
otese que, por el teorema de Tales, rH = Rh.)

Vol
umenes de revoluci
on Un razonamiento m
as simple que el del apartado
anterior nos permite deducir una f
ormula para el volumen V del solido de revoluci
on determinado por una funci
on r : [a, b] R. Basta observar que, si P es
una partici
on de [a, b],
n

i=1

m2i xi V

i=1

Mi2 xi ,

donde mi y Mi son, como de costumbre, el nmo y el supremo de r en [xi1 , xi ].


En efecto, cada sumando es el volumen del cilindro de altura xi y radio mi o
on de los cilindros peque
nos esta contenida en el solido
Mi . Es obvio que la uni
de revoluci
on, que a su vez esta contenido en la uni
on de los cilindros grandes, lo
que nos da las desigualdades. Si la funci
on r es continua, m2i y Mi2 son el nmo
y el supremo de la funci
on r2 en [xi1 , xi ], luego, cuando P es innitesimal,
ambas sumas estan innitamente pr
oximas a
 b
V =
r(x)2 dx.
a

Ejercicio: Razonar (sin usar la f


ormula anterior) que, tal y como hemos armado
para deducirla, el volumen de un cilindro de radio r y altura h ha de ser V = r2 h.

4.3. C
alculo de longitudes, areas y vol
umenes
Ejemplo

151

El volumen de una esfera de radio R es



R
x3
4
2
V =
(R x ) dx = R x
= R3 .
3 R
3
R


Ejemplo El volumen del hiperboloide de revoluci


on que resulta de girar la
hiperbola f : [1, t] R dada por f (x) = 1/x es

Vt =
1


t
1
1
dx =
= (1 1/t).
x2
x 1

Observamos que lm Vt = , lo que se interpreta como que en una copa


t+

hiperb
olica innita cuya boca tenga dos unidades de di
ametro, caben solo
unidades c
ubicas de champ
an.

Esto es especialmente curioso si observamos que la copa, aunque tiene volumen nito, tiene supercie innita:
Ejercicio: Comprobar que la supercie del hiperboloide de revoluci
on en [1, t] viene
dada por

t
 t

1 + x4
1 + x4
2
At = 2
dx
=

arg
sen
h
x

x3
x2
1
1



1
+
t
= arg sen h t2
arg sen h 1 + 2
t2
(Para calcular la integral, realizar sucesivamente los cambios de variable u = x2 y
u = senh v, y tener en cuenta que (cosh v/ senh v) = 1/ senh2 v.) Concluir que
lm At = +.

t+

As pues, tal y como habamos armado, la copa hiperb


olica innita tiene volumen
nito, pero
area innita.

Captulo V

Series innitas
Ya hemos visto que algunas funciones admiten desarrollos en serie de Taylor,
de la forma


f n) (x0 )
f (x) =
(x x0 )n .
n!
n=0
Observemos que estas expresiones son en realidad familias de series, en el
sentido de que determinan una serie distinta para cada x, de modo que pueden
ser convergentes para unos valores de x y divergentes para otros. En la primera
seccion de este captulo estudiaremos las series numericas propiamente dichas,
es decir, series de la forma

an ,
n=0

donde {an }n0 es una sucesion de n


umeros reales; en la segunda seccion estudiaremos las sucesiones de funciones, para analizar aquellas propiedades que no
dependen de que las funciones en cuesti
on sean series; y nalmente estudiaremos
las series de funciones, centrandonos especialmente en las series de potencias,
que son las series de la forma

an (x x0 )n ,

n=0

es decir, las que tienen la misma estructura que las series de Taylor.

5.1

Series num
ericas

Recordemos que la serie numerica asociada a una sucesion {an }n0 de n


umeros
reales es la sucesion {SN }N 0 dada por
SN =

n=0

153

an .

154

Captulo 5. Series innitas

Es costumbre representar a esta sucesion, al igual que a su lmite, si es que


existe, como

an .
n=0

Los terminos SN de la sucesion se llaman sumas parciales. Ya hemos tenido


ocasion de probar la convergencia de algunas series no triviales, como:


(1)n
1 1 1

= 1 + + =
2n
+
1
3
5
7
4
n=0


(1)n+1
1 1 1
= 1 + + = log 2.
n
2 3 4
n=1

Y tambien hemos visto que series como


1
1 1 1
= 1 + + + +
n
2 3 4
n=1

son divergentes.
Lo mas elemental que podemos decir a la hora de distinguir las series convergentes de las divergentes es lo siguiente:
Teorema 5.1 Si una serie

an es convergente, entonces lm an = 0.
n

n=0

n: Basta observar que


Demostracio
an = Sn Sn1 ,
luego, si la serie converge a un n
umero L, se cumple que
lm an = lm Sn lm Sn1 = L L = 0.
n

Sin embargo, debemos tener bien presente que, aunque el termino general an
converja a 0, la serie puede diverger, como muestra el ejemplo previo al teorema
anterior.
Ejemplo

La serie geometrica converge a

n=0

rn =

1
1r

converge si y s
olo si |r| < 1, y diverge en caso contrario.

5.1. Series numericas

155

En efecto, si |r| 1 es claro que el termino general no converge a 0, luego


la serie es divergente. Si |r| < 1 (estandar) y N es innito:
N

rn =

n=0

1
1 rN +1

.
1r
1r

Esto prueba la convergencia.


Las propiedades de los lmites implican inmediatamente el teorema siguiente:

Teorema 5.2 Sean


an y
bn dos series convergentes y R. Entonces
n=0
tambien convergen n=0

n=0

(an + bn ) =

an +

n=0

bn

n=0

Otro hecho obvio es el siguiente:


Teorema 5.3 Si n0 N, una serie

serie
an .

an =

n=0

an .

n=0

an es convergente si y s
olo si lo es la

n=0

n=n0

n: Podemos suponer que n0 es estandar, y entonces basta


Demostracio
observar que, para N innito,
N

n=0

an =

0 1
n=0

an +

an .

n=n0

El miembro izquierdo tendr


a una parte est
andar independiente de N si y
solo si lo tiene el termino de la derecha.
Una serie plantea dos problemas distintos: determinar si es o no convergente
y, en caso de que lo sea, calcular su suma. A menudo el primero es mas sencillo
que el segundo. Desde un punto de vista te
orico, el problema es mas simple en
el caso de series de terminos positivos, es decir, series en las que an 0 para
todo ndice n:
Teorema 5.4 Una serie de terminos positivos es convergente si y s
olo si sus
sumas parciales est
an acotadas superiormente.
n: Basta observar que las series de terminos positivos son
Demostracio
sucesiones monotonas crecientes. En particular, sus sumas parciales siempre
estan acotadas inferiormente (por la primera de ellas) y, por consiguiente, decir
que estan acotadas superiormente es lo mismo que decir que estan acotadas.
Basta aplicar entonces el teorema 2.62. (Recprocamente, es obvio que toda
sucesion convergente ha de estar acotada.)
Explcitamente, la condici
on del teorema anterior es que exista un n
umero
M > 0 tal que
N

an M
n=0

para todo N N o, para series estandar, que el miembro izquierdo sea nito
siempre que N es innito.

156

Captulo 5. Series innitas

Ejemplo

La serie

n
n=1

converge si y s
olo si > 1.
En efecto, podemos suponer que es estandar. Si > 1 y n > 1, tenemos
que
 n
1
dx

n
x
n1
luego
N

 N
N

1
1
1
dx
1
1+
=1+
=1+
.

1
1
n
x
(

1)x

1
(

1)N
1
1
n=1
Si N es innito, el u
ltimo termino es innitesimal, luego la suma parcial es
nita. Esto prueba que la serie es convergente.
Si 0 la serie es divergente porque su termino general no tiende a 0. Ya
hemos observado que la serie tambien diverge cuando = 1. Falta probar que
tambien es divergente cuando 0 < < 1. En tal caso:
 n+1
dx
1
,

x
n
n
luego

N

dx
1

x
n
n=1

N +1

Al calcular la integral resulta:


N

(N + 1)1
1
1
.

1
1 n=1 n

Cuando N es innito, el primer termino tambien lo es, luego la serie es


divergente.
Igual que acabamos de comparar series con integrales, tambien podemos
comparar unas series con otras cuya convergencia o divergencia conozcamos:
Teorema 5.5 Sean

an y

n=0

bn dos series est


andar de terminos positivos

n=0
innito, an

tales que, cuando n es


primera tambien converge.

bn . Entonces, si la segunda converge, la

n: Fijemos un n
Demostracio
umero natural innito n0 . Entonces, para
todo N n0 se cumple que
N

n=n0

an

n=n0

bn

n=0

bn ,

5.1. Series numericas


luego la serie

157

an es convergente (por estar acotada) y lo mismo vale para

n=n0

la serie desde n = 0.
Teorema 5.6 Si una serie de terminos positivos no nulos

an cumple que

n=0

lm
n

an+1
< 1,
an

entonces es convergente.
n: Podemos suponer
Demostracio
lmite del enunciado, podemos tomar L
se cumple que
an+1
an
Fijado n0 innito, para todo n n0

que la sucesion es estandar. Si L es el


< r < 1 estandar. As, si n es innito,
< r.
tenemos que

an an0 rnn0 =
Como la serie geometrica

an0 n
r .
r n0

rn es convergente, tambien lo es

n=n0

an , y

n=n0

tambien la serie sumada desde n = 0.


Ejemplo

Si 0 < r < 1, se cumple que

n=1

nrn =

r
(1 r)2

En efecto, para probar la convergencia basta observar que, si n es innito,


an+1
n+1
r r,
=
an
n
luego se cumple el teorema anterior con cualquier r que cumpla r < r < 1.
Ahora observamos que
SN = r + 2r2 + 3r3 + + N rN ,
rSN 1 =

r2 + 2r3 + + (N 1)rN .

Por consiguiente:
SN rSN 1 = r + r2 + + rN =

r
r rN +1

1r
1r

Si N es innito, como sabemos que la serie es convergente, podemos asegurar


que SN SN 1 , luego
r
SN rSN
,
1r

158

Captulo 5. Series innitas

luego
SN

r
.
(1 r)2

La serie anterior aparece en un problema cl


asico de la teora de la probabilidad:
Ejemplo Vamos a calcular el n
umero de veces que cabe esperar que haya que
tirar un dado hasta que salga un seis.
M
as en general, supongamos que un fen
omeno aleatorio se produce con probabilidad 1/n, donde n es un n
umero natural (n = 6 en el caso de sacar un seis
o cualquier otro n
umero prejado con un dado). Por simplicidad, hablaremos en terminos de un dado, pero trabajaremos con un n generico.
Si repetimos muchas veces el experimento de lanzar sucesivamente un dado
hasta obtener un 6, lo conseguiremos en la primera tirada aproximadamente
1/n de las veces (si no fuera as, eso signicara, por denici
on, que el dado est
a
trucado).
En cambio, (n 1)/n de las veces, el primer resultado no sera un 6. De
entre todos estos casos, aproximadamente 1/n de ellos, es decir, (n 1)/n2 del
total de los experimentos, obtendramos el 6 al segundo intento, mientras que
en (n 1)/n de ellos, es decir, en (n 1)2 /n2 del total, no conseguiramos el 6
al segundo intento.
De entre todos estos (n 1)2 /n2 segundos intentos fallidos, en aproximadamente 1/n de los casos, es decir, (n 1)2 /n3 del total, conseguiremos el 6 al
tercer intento, y as sucesivamente.
En denitiva, la fracci
on de intentos en que conseguiremos el 6 al k-esimo
intento ser
a

k
(n 1)k1
1
n1
=
.
nk
n1
n
Si el n
umero total de experimentos es N , la media del n
umero de intentos
necesarios para obtener el 6 se calculara multiplicando por k el n
umero de
experimentos en que hemos necesitado k intentos, lo que nos da
Nk

1
n1

n1
n

k
,

sumando para todo k y dividiendo entre el total N , lo que nos da la serie

1
k
n1

k=1

n1
n

k

Seg
un el ejemplo anterior, la suma es
1 n1
n
  = n.
n1 1 2
n

5.1. Series numericas

159

As pues, si repetimos N veces el experimento de tirar un dado hasta que


salga un seis, la media del n
umero de intentos necesarios tendera a 6 cuando N
tienda a innito.
Estos criterios, que en principio valen para series de terminos positivos, pueden aplicarse para estudiar la convergencia de series arbitrarias debido al teorema siguiente. Primero necesitamos una denici
on:

Denici
on 5.7 Diremos que una serie
an es absolutamente convergente si

n=0

la serie
|an | es convergente.
n=0

Teorema 5.8 Toda serie absolutamente convergente es convergente. Adem


as:




an 
|an |.

n=0

n=0

n: Consideremos una serie (estandar)


Demostracio

an , sea SN su suma

n=0


parcial N -sima y sea SN
la suma parcial correspondiente a la serie con valores
absolutos. Si esta es convergente y M < N son n
umeros naturales innitos,
tenemos que


N
N






|SN SM | = 
an 
|an | = SN
SM
0,
n=M

n=M

luego SM SN , lo que signica que la serie dada es una sucesi


on de Cauchy,
luego es convergente. Ademas, teniendo en cuenta que una serie de terminos
positivos (como sucesion mon
otona) converge al supremo de sus sumas parciales,
tenemos que

|an |

n=0

|an |

n=0

an

n=0

|an |

n=0

|an |.

n=0

Esto vale para todo N . En particular, vale para N innito, y sigue siendo
cierto al tomar la parte estandar del termino central, es decir:

n=0

|an |

an

n=0

|an |.

n=0

Esto equivale a la desigualdad del enunciado.


As pues, para probar la convergencia de una serie podemos tratar de aplicar
los criterios que hemos visto a la serie correspondiente con valores absolutos.
Ahora bien, hemos de tener presente que una serie puede ser convergente sin ser
absolutamente convergente. Un ejemplo es la serie


(1)n+1
= log 2.
n
n=1

Hay un criterio muy sencillo que justica la convergencia de series como esta,
en la que los terminos alternan en signo:

160

Captulo 5. Series innitas

Teorema 5.9 (Criterio de Leibniz) Sea {an }n0 una sucesi


on mon
otona decreciente y convergente a 0. Entonces, la serie

(1)n+1 an

n=1

es convergente.
n: Observemos que las sumas parciales pares:
Demostracio
S2N = (a1 a2 ) + (a3 a4 ) + + (a2N 1 a2N )
forman una sucesi
on mon
otona creciente, ya que los terminos entre parentesis
son positivos. Similarmente, las sumas parciales impares:
S2N +1 = a1 + (a2 + a3 ) + (a4 + a5 ) + + (a2N + a2N +1 )
forman una sucesi
on mon
otona decreciente, ya que todos los terminos entre
parentesis son negativos. Mas a
un, ambas sucesiones estan distribuidas de esta
forma:
S2 < S4 < S6 < < S5 < S3 < S1
En efecto: S2 < S1 porque S2 resulta de sumarle a S1 un n
umero negativo, luego,
S2 < S3 < S1 porque S3 resulta de sumarle a S2 un n
umero positivo y ya hemos
visto que la sucesion de sumas impares es decreciente, luego, S2 < S4 < S3
porque ya hemos visto que la sucesion de las sumas pares es creciente y S4
resulta de sumarle a S3 un n
umero negativo, etc.
En denitiva, las series de sumas pares es una sucesion mon
otona creciente
y acotada por S1 , luego es convergente, y la serie de sumas impares es una
sucesion mon
otona decreciente y acotada por S2 , luego es convergente. Ahora
bien, si M y N son n
umeros innitos, tenemos que
S2N +1 S2M S2N +1 S2N = a2N +1 0,
luego todas las sumas parciales SN (tanto si N es par o impar) tienen la misma
parte estandar S, de modo que SN S para todo N innito, luego la serie es
convergente.
La convergencia absoluta es crucial para generalizar a series innitas propiedades obvias de las series nitas, como el hecho de que una suma (nita) es
independiente del orden de los sumandos. Esto es consecuencia de la siguiente
caracterizacion de la convergencia de una serie de terminos positivos:
Teorema 5.10 Una serie (est
andar) de terminos positivos

n=0

an converge a

un n
umero (est
andar) S si y s
olo si para todo conjunto nito I N que contenga
a todos los n
umeros nitos, se cumple que

an S.
nI

5.1. Series numericas

161

n: Si la serie converge a S e I N es un conjunto nito


Demostracio
que contenga a todos los n
umeros nitos, la nitud de I implica que existe un
maximo M y un mnimo N tales que
{0, . . . , M } I {0, . . . , N }.
Como M +1
/ I, M ha de ser innito. Como la serie es de terminos positivos,
S

an

n=0

luego

an

an S,

n=0

nI

an S.

nI

Recprocamente, si se cumple esta condicion y N es un n


umero natural
innito, tomando I = {0, . . . , N }, tenemos que
N

an =

n=0

an S,

nI

lo que signica que la serie converge a S.


Como consecuencia:

an es absolutamente convergente y f : N N

es una aplicaci
on biyectiva, entonces la serie
af (n) tambien es absolutamente
n=0
convergente, y su suma es la misma.

Teorema 5.11 Si la serie

n=0

n: Llamemos
Demostracio

an si an 0,
+
an =
0
si an < 0,

a
n


=

0
an

si an 0,
si an < 0.

De este modo, an = a+
n an . Como |an | |an | y |an | |an |, el teorema 5.5
implica que las series

a+
a
n,
n
n=0

n=0

son absolutamente convergentes, y

an =

n=0

n=0

a+
n

n=0

a
n.

Es claro que (como sucesiones, no como lmites, que no sabemos si existen)

n=0

af (n) =

n=0

a+
f (n)

n=0

a
f (n) .

Por lo tanto, si probamos que las dos series de la derecha son convergentes
y que su suma es la misma que la de las series correspondientes sin permutar
los sumandos, tendremos probado el teorema. Ahora bien, ambas series son de

162

Captulo 5. Series innitas

terminos positivos, luego concluimos que basta probar el teorema para series
de terminos positivos. Supongamos, pues que an 0 para todo n. Tambien
podemos suponer que todos los datos, incluida f son estandar.
Entonces, si N es un n
umero natural innito, el conjunto
I = {f (n) | n N }
es nito y contiene a todos los n
umeros naturales nitos, porque, como f es
estandar, todo m N estandar es de la forma m = f (m ), con m estandar,
luego m < N , luego m I. Ademas
N

af (n) =

n=0

luego

an S,

nI

af (n) = S.

n=0

El teorema es falso para series no absolutamente convergentes.


Ejemplo

Sabemos que
1

1 1 1 1 1
+ + + = ln 2.
2 3 4 5 6

Por lo tanto:
1 1 1 1
1
1
ln 2
+ +

+ =
.
2 4 6 8 10 12
2
Es claro entonces que
0+

1
1
1
1
1
1
ln 2
+0 +0+ +0 +0+
+0
+ =
.
2
4
6
8
10
12
2

Sumando esta serie y la original obtenemos que


1+0+

1 1 1
1 1 1
3 ln 2
+ + 0 + + + =
.
3 2 5
7 4 9
2

Eliminando los ceros:


1+

1 1 1 1 1 1
1
1
1
1
1
3 ln 2
+ + + +
+
+
+ =
.
3 2 5 7 4 9 11 6 13 15 8
2

La u
ltima serie es claramente una reordenacion de la primera, y tiene una
suma diferente.

5.2. Sucesiones funcionales

5.2

163

Sucesiones funcionales

Estudiamos ahora las sucesiones de funciones de la forma {fn }n0 , donde


as sencillo de convergencia
fn : I R, para un intervalo I R. El concepto m
que podemos denir para estas sucesiones es el siguiente:
Denici
on 5.12 Diremos que una sucesion funcional {fn }n0 en un intervalo
I R converge puntualmente a una funci
on f : I R si para todo x I
existe
lm fn (x) = f (x).
n

Este lmite no tiene por que existir, pero es evidente que una sucesion funcional no puede converger a dos lmites distintos.
Ejemplo La sucesi
on fn (x) =
lmite es la funci
on constante 1:

x, denida en [0, +[, es convergente, y su

lm
n

x = 1.

En efecto, si x 0 es estandar, se cumple que nx = x1/n = e(log x)/n , luego


si n es innito se cumple que (log x)/n 0, luego n x 1.
Observemos que si una sucesion numerica estandar {xn }n0 converge a un
lmite l, entonces xn es nito siempre que n es innito, y l = xn . Podemos
enunciar un hecho an
alogo para lmites funcionales, para lo cual necesitamos la
denici
on siguiente:
Denici
on 5.13 Una funci
on f : I R (no necesariamente estandar) denida en un intervalo est
andar I R es casi est
andar si cuando x I es
estandar, entonces f (x) es nito. En tal caso, denimos su estandarizaci
on
como la funci
on
f = S {(x, y) R2 | x I, y f (x)}.
Teorema 5.14 Si f : I R es una funci
on casi est
andar, entonces su estandarizaci
on f : I R es la u
nica funci
on est
andar tal que, para todo x I
est
andar, cumple f(x) = f (x).
n: Sucesivas aplicaciones del principio de transferencia prueDemostracio
ban que f : I R. En efecto, como todo elemento estandar de f es un par
de n
umeros reales con primera componente en I, podemos armar que todo
elemento de f es un par ordenado de n
umeros reales con primera componente
en I. Como para todo x I estandar existe un u
nico y R tal que (x, y) f

(concretamente y = f (x)), concluimos que para todo x I existe un u


nico
y R tal que (x, y) f . Esto signica que f : I R. M
as a
un, seg
un
acabamos de observar, para todo x I estandar se cumple que
f(x) = f (x),

164

Captulo 5. Series innitas

y esta propiedad determina completamente a f, ya que cualquier otra funci


on
estandar g : I R que cumpla esto tiene los mismos elementos estandar que
f, a saber, los pares (x, f (x)), con x I estandar. Por consiguiente, g = f.
La estandarizaci
on de una funci
on representa el mismo papel en la convergencia funcional que la parte est
andar en la convergencia numerica:
Teorema 5.15 Una sucesi
on est
andar {fn }n0 converge puntualmente en un
intervalo I a una funci
on f si y s
olo si para todo n innito la funci
on fn es casi
est
andar, y f = fn .
n: Si la sucesion converge y x I es estandar y n es innito,
Demostracio
entonces fn (x) f (x). Esto prueba que fn es casi estandar y, por el teorema
anterior, f = fn .
Recprocamente, si se cumple la condicion del enunciado, para todo x I
estandar tenemos que fn (x) fn (x) = fn (x) = f (x), luego
lm fn (x) = f (x),
n

y por transferencia, lo mismo vale para todo x I, no necesariamente estandar.


Los ejemplos siguientes muestran que la convergencia puntual es deciente
en muchos aspectos.
Ejemplo

Para cada n N, sea fn : R R la funci


on dada por
0

si x 0,
nx si 0 x 1/n,
1
si x 1/n.

fn (x) =

Entonces {fn }n0 converge puntualmente a la funci


on dada por

f (x) =

0
1

si x 0,
si x > 0.

En efecto, si x R es un punto est


andar y n es un n
umero natural innito,
o bien x 0 y fn (x) = 0 = f (x), o bien x > 0 y fn (x) = 1 = f (x), pues
1/n 0 < x. Esto prueba que
lm fn (x) = f (x)
n

para todo x R estandar y, por transferencia, para todo x R.


Tenemos as un ejemplo de sucesion de funciones continuas que converge
puntualmente a una funci
on discontinua.

5.2. Sucesiones funcionales


Ejemplo

165

Consideremos la sucesion funcional en [0, 1] dada por


fn (x) = nx(1 x2 )n

Si x [0, 1], tenemos que


lm nx(1 x2 )n = 0.
n

Esto es obvio si x = 0 o si x = 1 y, en otro caso, se cumple porque, llamando


r = (1 x2 ), la serie de termino general nrn es convergente, como hemos visto
en el ejemplo de la p
agina 157.
Por otra parte
 1
fn (x) dx =
0

As pues, existe

lm
n


1
n (1 x2 )n+1
n
=
.
2
n+1
2(n + 1)
0

fn (x) dx =
0

1
= 0 =
2

lm fn (x) dx
0

En denitiva, tenemos un ejemplo de sucesi


on convergente cuya sucesion de
integrales no converge a la integral del lmite.
Estos y otros muchos fen
omenos no suceden si, en lugar de considerar la
convergencia puntual, consideramos la convergencia uniforme que vamos a denir a continuaci
on. Para destacar la diferencia, observemos que una sucesi
on
estandar {fn }n0 converge puntualmente a una funci
on fn (en un intervalo I)
si y solo si para todo x I est
andar y todo n N innito, se cumple que
fn (x) f (x).
Denici
on 5.16 Diremos que una sucesion estandar {fn }n0 converge uniformemente en un intervalo I a una funci
on f si para todo x I y todo n N
innito, se cumple que fn (x) f (x).
La diferencia con la convergencia puntual es, pues, que en la convergencia
uniforme la aproximaci
on fn (x) f (x) es valida para todo x I no necesariamente estandar. Es obvio que la convergencia uniforme implica la convergencia
puntual, pero el recproco no es cierto, como muestra el ejemplo siguiente:
Ejemplo Las sucesiones de los dos ejemplos anteriores no convergen uniformemente a sus lmites.
En el primer caso, si tomamos x = 1/2n, donde n es un n
umero natural
innito, entonces
1
fn (x) =  1 = f (x).
2
En el segundo caso, si x = 1/n, donde n es un n
umero natural innito,

n 
n
n 
1
1
1
fn (x) = 1 2
= 1+
ee1 = 1  0 = f (x),
1
n
n
n
donde hemos usado el teorema 3.42.

166

Captulo 5. Series innitas

Ejemplo La sucesi
on dada por fn (x) = x/n converge uniformemente a la
funci
on f = 0 en el intervalo [0, 1], mientras que en R converge puntualmente,
pero no uniformemente, a dicha funci
on.
En efecto, si x [0, 1] y n es innito, entonces fn (x) = x/n 0 = f (x),
luego la convergencia es uniforme. En cambio, si x puede variar en R, el argumento anterior vale para todo x nito, en particular para todo x estandar,
luego {fn }n0 converge puntualmente a 0 en R. Sin embargo, tomando x = n,
donde n es un natural innito, tenemos que fn (x) = 1  0 = f (x), luego la
convergencia no es uniforme.
La convergencia uniforme tiene la siguiente interpretaci
on cl
asica: Si tenemos
que lm fn (x) = f (x) y la convergencia es uniforme en un intervalo I, dado
n
 > 0 estandar, como, para todo n innito, se cumple que, para todo x I,
|fn (x) f (x)| 0, en particular |fn (x) f (x)| <  y, como esto vale para todo
n n0 , donde n0 es un n
umero natural innito cualquiera, por transferencia
ha de existir un natural nito n0 que cumpla lo mismo, es decir, tal que, para
todo n n0 y todo x I, se cumple |fn (x) f (x)| < .
As pues, la convergencia uniforme se traduce en que podemos conseguir que
fn y f se diferencien en menos de  a la vez en todos los puntos x I, mientras
que en el caso de la convergencia puntual, para conseguir que la diferencia entre
fn y f se haga menor que , puede hacer falta un n0 distinto en cada punto x,
de modo que un mismo n0 no valga a la vez para todos ellos.
Probamos ahora que la convergencia uniforme resuelve los dos problemas
que habamos detectado en la convergencia puntual:
Teorema 5.17 Si {fn }n0 es una sucesi
on de funciones continuas fn : I R
que converge uniformemente a una funci
on f : I R, entonces f tambien es
continua.
n: Podemos suponer que todos los datos son estandar. Para
Demostracio
probar que f es continua en I basta ver que lo es en un punto est
andar x1 I.
Tomamos x2 I tal que x1 x2 y hemos de ver que f (x1 ) f (x2 ). En caso
contrario, existe un  > 0 estandar tal que |f (x1 ) f (x2 )| > .
Si n es un n
umero natural innito, tenemos que, para todo x I, se cumple
fn (x) f (x), luego en particular, |f (x) fn (x)| < /2. Como esta armacion
es interna, podemos aplicar el principio de transferencia, que nos da que existe
un n estandar que cumple lo mismo. En particular, |f (x1 ) fn (x1 )| < /2 y
|f (x2 ) fn (x2 )| < /2. Ahora bien, como fn es continua en x1 (y estandar),
podemos armar que fn (x1 ) fn (x2 ), luego tambien |f (x1 ) fn (x2 )| < /2
|f (x1 ) f (x2 )| |f (x1 ) fn (x2 )| + |fn (x2 ) f (x2 )| < /2 + /2 = ,
contradicci
on.
Similarmente ocurre con los lmites de integrales:

5.2. Sucesiones funcionales

167

Teorema 5.18 Sea {fn }n0 una sucesi


on de funciones integrables en un intervalo [a, b] que converja uniformemente a una funci
on f : [a, b] R. Entonces
f es integrable en [a, b] y
 b
 b
f (x) dx = lm
fn (x) dx.
n

n: Observemos en primer lugar que f esta acotada. En


Demostracio
efecto, si n es un n
umero natural innito, tenemos que fn esta acotada, porque
es integrable, lo cual signica que |fn (x)| M para todo x [a, b] (y un cierto
n
umero M , que no podemos asegurar que sea nito porque fn no es estandar).
Como f (x) fn (x), resulta que |f (x)| M + 1 para todo x [a, b], pero esto
signica que f esta acotada.
Si n es un n
umero natural innito, la funci
on |f fn | esta acotada en [a, b]
y solo toma valores innitesimales. Por lo tanto, su supremo K ha de ser
innitesimal. Si P es cualquier partici
on de [a, b] en k intervalos, tenemos que
|S(f, P ) S(fn , P )|

|Mi (f ) Mi (fn )|xi

i=1

Kxi = K(b a) 0.

i=1

Igualmente, |s(f, P ) s(fn , P )| 0. Si  > 0 es estandar, tenemos que


|S(f, P ) S(fn , P )| <  y |s(f, P ) s(fn , P )| <  para toda P
y esto es una propiedad interna que se cumple para cualquier n innito. Por
transferencia, existe un n nito que cumple lo mismo. Para dicho n, la funci
on
fn es estandar e integrable, luego, si P es una partici
on innitesimal, tenemos
ademas que s(fn , P ) S(fn , P ). Uniendo los tres hechos, concluimos que
|S(f, P ) s(f, P )| < 2,
y esto vale para todo  > 0 estandar. Por consiguiente, S(f, P ) s(f, P ), lo
que prueba que f es integrable en [a, b]. Adem
as,


 b
 b
 b
  b


f (x) dx
fn (x) dx
|f (x) fn (x)| dx
K dx = K(b a) 0,

 a

a
a
a
luego

f (x) dx
a

fn (x) dx.
a

Esto prueba la convergencia de la sucesi


on de integrales.
Nota En la prueba del teorema anterior hemos visto que, si P es una partici
on
innitesimal y n es un n
umero natural innito, entonces
 b
 b
f (x) dx
fn (x) dx,
S(fn , P ) S(f, P )
a

168

Captulo 5. Series innitas

e igualmente con sumas inferiores. En resumen, si una sucesion {fn }n0 de


funciones integrables converge uniformemente, tenemos que
 b
S(fn , P )
fn (x) dx s(fn , P )
a

para todo n
umero natural n, nito o innito. Cuando n es nito se trata simplemente de la denici
on de integrabilidad, pero para n innito es un hecho que no
es obvio, puesto que la funci
on fn , aunque es integrable, no es est
andar, luego
no tiene por que cumplir la denici
on de integrabilidad m
as que indirectamente,
a traves del principio de estandarizaci
on.
Lo mismo es valido para la continuidad: si una sucesi
on {fn }n0 de funciones
continuas en un intervalo I converge uniformemente a una funci
on f , entonces,
si x0 I es estandar y x I cumple x x0 , se cumple que fn (x) fn (x0 ). Esto
es porque f es continua en x0 (y estandar): fn (x) f (x) f (x0 ) fn (x0 ).
En resumen: si una sucesi
on {fn }n0 de funciones continuas converge uniformemente, todas las funciones fn (para n nito o innito) cumplen explcitamente
la denici
on de continuidad, aunque no sean funciones est
andar.
La relacion entre la derivabilidad y la convergencia es m
as delicada, como
muestra el ejemplo siguiente:
Ejemplo

La sucesi
on de funciones dada por
fn (x) =

sen(nx)
n

converge uniformemente a f = 0 en R, todas ellas son de clase C , y el lmite


tambien lo es, pero
fn (x) = cos(nx)
no converge a f  = 0, ni a ninguna otra funci
on, ni siquiera puntualmente.
En cambio, como veremos enseguida, la convergencia uniforme de las derivadas (y poco mas) s que implica la convergencia (casi) uniforme de las funciones,
donde casi tiene el sentido siguiente:
Denici
on 5.19 Diremos que una sucesion estandar de funciones {fn }n0 converge casi uniformemente en un intervalo I si cuando n es innito se cumple
fn (x) f (x) para todo x I que sea nito y tal que x I.
Es obvio que la convergencia uniforme en un intervalo implica la convergencia
casi uniforme y que esta implica a su vez la convergencia puntual.
M
as concretamente, la relacion entre la convergencia uniforme y la casi uniforme es muy simple: la denici
on anterior equivale a que la sucesi
on converja
uniformemente en cada intervalo [u, v] I.
En efecto, si se da la convergencia casi uniforme, podemos tomar el intervalo
estandar, y entonces, si x [u, v] I, se cumple que x es nito y x [u, v] I,
luego la sucesion converge uniformemente en [u, v].

5.2. Sucesiones funcionales

169

Recprocamente, si tenemos la convergencia uniforme en los intervalos [u, v]


y x I es nito y cumple x I, digamos x < x, como existe un x I
tal que x > x, tambien existe un v I estandar tal que v > x, y entonces
x [ x, v] I. Igualmente se razona si x < x. Si x = x, tomamos el intervalo
andar tal que x [u, v] I,
[ x, x]. En cualquier caso, tenemos un intervalo est
por lo que podemos armar que fn (x) f (x).
Ejercicio: Comprobar que la sucesi
on fn (x) = x/n converge casi uniformemente en
R a la funci
on nula.

Teorema 5.20 Sea {fn }n0 una sucesi


on de funciones de clase C 1 en un intervalo abierto I tal que exista un punto x0 I para el que exista lm fn (x0 ) = y0 .
n

Si la sucesi
on {gn }n0 converge uniformemente a una funci
on g, entonces
on f de clase C 1 tal que
{fn }n0 converge casi uniformemente a una funci
f  = g.
n: Podemos suponer que todos los datos son estandar. ObDemostracio
servemos en primer lugar que, si n es un n
umero natural innito, entonces la
funci
on fn es casi estandar. En efecto, si x I es estandar, en virtud del
teorema del valor medio,
fn (x) fn (x0 ) = fn (c)(x x0 ),
donde c es un punto (nito) entre x y x0 . Tenemos que
fn (x0 ) y0 ,

fn (c) g(c) g( c),

donde hemos usado que c I precisamente porque c esta entre x y x0 , as


como que g es continua por ser lmite uniforme de funciones continuas. Por
consiguiente, fn (x0 ) y fn (c) son nitos, y lo mismo vale para fn (x).
Esto nos permite considerar la estandarizaci
on f = fn . Observemos que,
en principio, f depende del n
umero natural innito n que hemos escogido, pero
luego veremos que, en realidad, f es el mismo para todos los n. Notemos tambien
que f (x0 ) = fn (x0 ) = y0 .
Vamos a probar que f es derivable en I. Como es una funci
on estandar,
basta probarlo en un punto est
andar p I. Si h 0, h = 0, el teorema del
valor medio nos da un punto c entre p y p + h (en particular c p) tal que
fn (p + h) fn (p)
= fn (c) g(c) g(p),
h
donde hemos usado que g es continua en p. Fijemos un  > 0 estandar. Si
> 0 es cualquier innitesimo y n0 es un n
umero innito, hemos probado que,
si |h| < , h = 0 y n n0 , se cumple


 fn (p + h) fn (p)


g(p) < .

h

170

Captulo 5. Series innitas

Como la armacion es interna, existen un y un n0 estandar que cumplen


lo mismo. Si jamos un h estandar que cumpla |h| < , h = 0, se cumple la
desigualdad anterior, pero el denominador es ahora apreciable, por lo que si lo
aplicamos al n innito que hemos tomado en un principio y cambiamos fn por
f , el numerador se altera en un innitesimo, y la fraccion entera tambien. As
pues:


 f (p + h) f (p)


g(p) < .

h
Esto vale para todo h estandar que cumpla |h| < , pero, por transferencia,
vale para todo h estandar o no. En particular vale para todo innitesimo h y
para todo  > 0 estandar. Por consiguiente, si h 0, h = 0, concluimos que
f (p + h) f (p)
g(p).
h
Esto signica que existe f  (p) = g(p). Como ademas f (x0 ) = y0 , resulta
que la funci
on f esta unvocamente determinada. (Dos funciones con la misma
derivada se diferencian a lo sumo en una constante, pero si toman el mismo
valor en un punto, han de ser iguales.) As pues, f no depende de n, como
anticip
abamos, y esto signica que {fn }n0 converge puntualmente a f .
Para probar que la convergencia es, en realidad, casi uniforme, tomamos un
x I nito tal que x I. Hemos visto antes que
fn (x) f ( x)
g( x),
x x
luego

fn (x) f ( x) f (x).

El concepto de sucesion de Cauchy puede trasladarse a sucesiones funcionales, de modo que podemos asegurar la convergencia de una sucesion sin necesidad
de conocer su lmite de antemano:
Denici
on 5.21 Una sucesion estandar {fn }n0 de funciones denidas en un
intervalo I R es puntualmente (resp. uniformemente, resp. casi uniformemente) de Cauchy en I si para todo x I estandar (resp. para todo x I, resp.
para todo x I nito tal que x I) y todos los n
umeros naturales innitos m
y n se cumple que fm (x) fn (x).
Teorema 5.22 Una sucesi
on de funciones denidas en un intervalo es puntualmente, uniformemente o casi uniformemente convergente si y s
olo si tiene
la correspondiente propiedad de Cauchy.
n: Es evidente que toda sucesion convergente es de Cauchy
Demostracio
(del tipo correspondiente a la convergencia).
Supongamos ahora que {fn }n0 es una sucesion estandar puntualmente de
Cauchy en un intervalo I. Entonces, para cada x I estandar, la sucesi
on

5.2. Sucesiones funcionales

171

{fn (x)}n0 es una sucesion de Cauchy en R, luego es convergente. En particular, fn (x) es nito cuando n es innito, luego la funci
on fn es casi estandar y
umeros innitos,
podemos considerar su estandarizaci
on fn . Si m y n son dos n
tenemos que fm (x) fn (x), luego fm (x) = fn (x), luego fm = fn . En denitiva, todas las funciones fn tienen la misma estandarizacion f , luego la sucesion
converge puntualmente a f .
Si la sucesion es uniformemente de Cauchy, entonces tambien es puntualmente de Cauchy, luego todo lo dicho anteriormente sigue siendo v
alido y tenemos que la sucesion converge puntualmente a f . Vamos a probar que la
convergencia es uniforme.
Fijemos  > 0 estandar. Si n0 es un n
umero natural innito, tenemos que,
para todo m, n n0 y todo x I, se cumple que |fm (x) fn (x)| < . Como la
propiedad es interna, existe un n0 nito que cumple lo mismo.
Esto vale en particular para cualquier x estandar y para todo m y n n0 .
Tomando m innito tenemos que fm (x) f (x), luego |f (x) fn (x)| < . Esto
vale para todo x estandar y para todo n n0 , luego, por transferencia, vale
para todo x I.
El n0 nito a partir del cual se cumple esto depende de , pero si n es innito,
cumplir
a esto cualquiera que sea n0 , es decir, para todo  > 0 estandar. Esto
prueba que si n es innito, entonces f (x) fn (x), para todo x I. As pues,
la convergencia es uniforme.
Si la sucesion es casi uniformemente de Cauchy, entonces es uniformemente
de Cauchy en cada intervalo est
andar [u, v] I, luego la convergencia a f es
uniforme en cada uno de estos intervalos, luego la convergencia es casi uniforme
en I.
Veamos una aplicacion de la caracterizacion de la convergencia en terminos
de la propiedad de Cauchy al caso de las series funcionales:
Denici
on 5.23 La serie funcional asociada a una sucesion de funciones {fn }n0
denidas en un intervalo I R, representada por

fn ,

n=0

es la sucesion funcional de sumas parciales {Sk }k0 , donde


Sk =

fn .

n=0

Diremos que la serie converge absoluta y puntualmente, absoluta y uniformemente o absoluta y casi uniformemente si lo hace la serie

|fn |.

n=0

Notemos que esto implica respectivamente la convergencia puntual, uniforme


o casi uniforme de la serie, ya que (suponiendo la serie est
andar) si x I y k r

172

Captulo 5. Series innitas

son n
umeros naturales innitos, tenemos que
 r

r


|Sr (x) Sk (x)| = 


fn (x)
|fn |(x),
n=k

n=k

y el u
ltimo termino es innitesimal para x I estandar, para todo x I o para
todo x I nito tal que x I, seg
un el tipo de convergencia, ya que la serie
con valores absolutos es puntualmente, uniformemente o casi uniformemente de
Cauchy en I, luego la serie dada tiene la misma propiedad, luego converge con
el mismo tipo de convergencia.

Teorema 5.24 (Criterio de mayoraci


on de Weierstrass) Sea
fn una

n=0

serie funcional est


andar en un intervalo I R y sea
an una serie numerica
n=0

convergente tal que, para todo n N innito y todo x I, se cumpla que


|fn (x)| an . Entonces la serie funcional converge absoluta y uniformemente
en I.
n: Tenemos que, si k r son innitos y x I, entonces
Demostracio
 r

r
r


|Sr (x) Sk (x)| = 


fn (x)
|fn (x)|
an 0
n=k

n=k

n=k

Esto prueba que Sr (x) Sk (x), luego la sucesion {Sk }k0 es uniformemente de
Cauchy, luego la serie funcional converge uniformemente.
Como aplicacion vamos a construir una funci
on continua que no es derivable
en ning
un punto. Necesitamos una caracterizaci
on de la derivabilidad:
Teorema 5.25 Una funci
on est
andar f : ]a, b[ R es derivable en un punto
est
andar p ]a, b[ si y s
olo si existe un n
umero est
andar f  (p) tal que para todo
par de n
umeros reales tales que x p y, x y, x = y, se cumple
f (y) f (x)
f  (p).
yx
n: Si se cumple esta condicion, tomando x = p tenemos la deDemostracio
nici
on de derivada. Recprocamente, si f es derivable en p, existen innitesimos
1 y 2 tales que
f (y) f (p) = f  (p)(y p) + (y p)1 ,
f (p) f (x) = f  (p)(p x) + (p x)2 .
Sumando y dividiendo entre y x queda
f (y) f (x)
yp
px
= f  (p) +
1 +
2 f  (p),
yx
yx
yx
pues las fracciones del segundo miembro son menores que 1.

5.2. Sucesiones funcionales

173

Ejemplo (Una funci


on continua no derivable) Consideremos la funci
on
: R R dada por la gura siguiente y extendida peri
odicamente a R.
1

Es claro que es continua en R y es derivable en todo R excepto en los


n
umeros enteros. Ademas, es derivable por la derecha en todo R, lo cual signica que existe un n
umero real estandar + (x) tal que, para todo innitesimo
h > 0, se cumple que
(x + h) (x)
+ (x).
h
M
as concretamente, se cumple que + (x) = 1.
Para cada natural n denimos
1
(2n x).
2n

n (x) =

La gura siguiente muestra las gr


acas de estas funciones para los primeros
valores de n:
1

0
1
2

Es f
acil ver que n es continua en R y es derivable en todo R menos en los
puntos de la forma k/2n , con k Z, y en cualquier punto existe +
n (x) = 1.
Finalmente, denimos f : R R como la funci
on dada por

f (x) =

n (x).

n=0

Como |(x)| 1, tenemos que |n (x)| 1/2n , luego el criterio de mayoraci


on de Weierstrass implica que la serie converge uniformemente en R, por lo
que la suma f es una funci
on continua. Llamemos
fm (x) =

n=0

n (x).

174

Captulo 5. Series innitas

Es claro que si n > m y k Z entonces n (k/2m ) = 0, luego vemos que


f (k/2m ) = fm (k/2m ).
Supongamos que f es derivable en un punto p (que podemos tomar estandar).
Tomemos un n
umero natural innito m y sea n Z tal que
x=

n
n+1
p < m = y.
m
2
2

Claramente x y, luego por el teorema anterior


f  (p)

fm (y) fm (x)
f (y) f (x)
+
=
= fm
(p).
yx
yx

En el u
ltimo paso hemos usado que fm es lineal en el intervalo [x, y]. Ahora
bien, esto vale para todo n
umero natural innito m, en particular para m + 1,
con lo que
+
+
+
+
fm
(p) fm+1
(p) = fm
(p) + +
m+1 (p) = fm (p) 1,

lo cual es absurdo. Por consiguiente f no es derivable en ning


un punto.

5.3

Series de potencias

Los resultados de la seccion anterior se aplican en particular a las series de


potencias, es decir, a las sucesiones funcionales de la forma

an (x x0 )n ,

n=0

donde x0 R y {an }n0 es una sucesion de n


umeros reales.
Vamos a probar que toda serie de potencias converge en un intervalo centrado
en x0 (que en el peor de los casos se reduce al propio x0 y en el mejor de los
casos es todo R). Para ello necesitamos el concepto siguiente:
Denici
on 5.26 Si {xn }n0 es una sucesion estandar de n
umeros reales acotada superiormente, denimos su lmite superior como
lm xn = sup S{xn | n N es innito}.
n

Observemos que si existe lm xn = l, entonces


n

{ xn | n N es innito} = {l},

luego
lm xn = lm xn .
n

Ejercicio: Dar una denici


on an
aloga de lmite inferior y demostrar que una sucesi
on
acotada tiene lmite si y s
olo si su lmite inferior coincide con su lmite superior.

5.3. Series de potencias


Teorema 5.27 Sea

175
an (x x0 )n una serie de potencias.

n=0


a) Si la sucesi
on { n |an |}n0 no est
a acotada, entonces la serie s
olo converge
en x = x0 .

b) En caso contrario, si L = lm n |an | =
 0 y r = 1/L, entonces la serie
n

converge absoluta y casi uniformemente en el intervalo ]x0 r, x0 + r[ y


diverge fuera del intervalo [x0 r, x0 + r].
c) Si L = 0, entonces la serie converge absoluta y casi uniformemente en R.

n: a) Si x = x0 es estandar, existe un n innito tal que n |an |
Demostracio

es innito, luego tambien lo son n |an ||x x0 | y an (x x0 )n , luego el termino
general de la serie numerica

an (x x0 )n

n=0

no tiende a 0, luego la serie diverge.


b) Todo intervalo est
andar [u, v] ]x0 r, x0 + r[ esta contenido en un
intervalo de la forma [x0 s, x0 + s], donde 0 < s < r es estandar. Tenemos
que sL < 1, luego podemos tomar un n
umero estandar sL < < 1. As, si
|x x0 | s tenemos que

L<
.
s
|x x0 |

Si n es innito, entonces n |an | L, luego


n
,
|an | <
|x x0 |
luego
|an ||x x0 |n < n .
Por el criterio de mayoraci
on de Weierstrass, concluimos que la serie converge
absoluta y uniformemente en [x0 s, x0 + s], luego converge absoluta y casi
uniformemente en ]x0 r, x0 + r[.
En cambio, si |x x0 | > r, con x estandar, tenemos que
1
< L,
|x x0 |
luego existe un n innito tal que

1
< n |an |,
|x x0 |
luego


1
< n |an |,
|x x0 |

176

Captulo 5. Series innitas

luego
|an ||x x0 |n > 1,
luego el termino general de la serie numerica correspondiente a x no tiende a 0,
luego la serie diverge en x.
c) Es una ligera variante del caso anterior, tomando s > 0 y 0 < < 1
arbitrarios.
En la pr
actica, podemos denir el radio de convergencia de una serie de
potencias como el n
umero r del apartado b) del teorema anterior, o bien como
r = + si se da el caso c) o r = 0 si se da el caso a). De este modo, la serie
converge casi uniformemente en el intervalo de convergencia ]x0 r, x0 + r[,
entendiendo que este intervalo es R cuando r = + y es cuando r = 0.
Observemos que el teorema anterior no arma nada sobre la convergencia
o divergencia de la serie en los puntos x0 r y x0 + r. La situaci
on en estos
puntos depende de cada serie en concreto.
Tambien es interesante observar que el teorema anterior permite determinar
el radio de convergencia de una serie analizando su convergencia puntual, pero,
en cualquier caso, la convergencia de una serie de potencias siempre es casi
uniforme en un intervalo de convergencia.
Ahora podemos aplicar los resultados de la seccion anterior:
Teorema 5.28 Sea f (x) =

an (x x0 )n una serie de potencias con radio

n=0

de convergencia no nulo. Entonces la funci


on f es derivable en su intervalo de
convergencia, y su derivada viene dada por
f  (x) =

nan (x x0 )n1 .

n=1

Adem
as, la serie que dene a la derivada tiene el mismo radio de convergencia.

n: Sea L = lm n |an |. En la p
Demostracio
agina 72 hemos visto que, si
n



n
n
n
n es innito,
|an |
|nan |, de donde se sigue que
 entonces n 1, luego
L = lm n |nan |, luego la serie dada tiene el mismo radio de convergencia que
n

nan (x x0 )n =

n=0

nan (x x0 )n .

n=1

A su vez, es claro que el radio de convergencia de esta serie es el mismo que


el de

nan (x x0 )n1
n=1

Ahora s
olo tenemos que atar cabos: Las sumas parciales de esta u
ltima serie
son las derivadas de las sumas parciales de la serie del enunciado. Esta serie
converge uniformemente en cualquier intervalo est
andar [u, v] contenido en el
intervalo de convergencia, luego el teorema 5.20 nos da que esta serie converge

5.3. Series de potencias

177

en [u, v] (luego en todo el intervalo de convergencia) a la derivada de la serie del


enunciado.
Aplicando sucesivamente el teorema anterior podemos decir mucho mas:
Teorema 5.29 Sea f (x) =

an (x x0 )n una serie de potencias con radio de

n=0

convergencia no nulo. Entonces, la funci


on f es de clase C en su intervalo
de convergencia y es su propia serie de Taylor, es decir,
an =

f n) (x0 )
.
n!

n: Aplicando el teorema anterior vemos que


Demostracio
f k) (x) =

n(n 1) (n k + 1)an (x x0 )nk ,

n=k

y evaluando en x0 queda que


f k) (x0 ) = n! an .

Ejemplos

El radio de convergencia de la serie geometrica

n=0

xn =

1
1x

es r = 1, como puede deducirse de la f


ormula para la suma de un n
umero nito
de terminos de una serie geometrica o bien observando que

n
lm 1 = 1.
As pues, el intervalo de convergencia es ]1, 1[ y es claro que la serie no
converge ni en 1 ni en 1. Esto puede parecer l
ogico porque la funci
on
suma no puede extenderse continuamente a x = 1. Sin embargo, el radio de
convergencia de

1
(1)n x2n =
1 + x2
n=0
es tambien r = 1, como se deduce haciendo el cambio de variable x = t2 en la
serie anterior o bien porque, la sucesi
on de coecientes de la serie es

(1)k si n = 2k,
an =
0
si n = 2k + 1,


0,
luego, si n es innito, n |an | =
luego
1,

lm n |an | = 1.

178

Captulo 5. Series innitas

En cambio, en este caso la funci


on suma se extiende a una funci
on de clase
C en R.
Seg
un el teorema 4.16, la serie
log(1 + x) =


(1)n+1 n
x
n
n=1

converge en ]1, 1], y es claro que diverge en x = 1, luego su radio de convergencia es r = 1 y la serie solo converge en uno de los dos extremos de su
intervalo de convergencia.

Captulo VI

C
alculo diferencial de varias
variables
6.1

Espacios m
etricos y espacios normados

El principal objeto de estudio de este captulo ser


a el espacio Rn , es decir,
el conjunto de todas las n-tuplas de n
umeros reales x = (x1 , . . . , xn ). En Rn
podemos denir una suma y un producto por n
umeros reales:
(x1 , . . . , xn ) + (y1 , . . . , yn ) = (x1 + y1 , . . . , xn + yn ),
(x1 , . . . , xn ) = (x1 , . . . , xn ).
Con estas operaciones, es facil ver que Rn cumple la denici
on siguiente:
Denici
on 6.1 Un espacio vectorial V sobre un cuerpo K es un conjunto V
dotado de una suma + : V V V y un producto escalar : K V V
que cumplen las propiedades siguientes: (Se entiende que las letras griegas representan elementos de K.)
Asociativa (v + w) + x = v + (w + x),

(v) = ()v,

Conmutativa v + w = w + v,
Elemento neutro Existe 0 V tal que 0 + v = v,

1 v = v,

Elemento sim
etrico Para cada v V , existe v V tal que v + (v) = 0.
Distributiva (v + w) = v + w,

( + )v = v + v.

En lo sucesivo, siempre que hablemos de espacios vectoriales, se entendera


que son espacios vectoriales sobre el cuerpo R de los n
umeros reales.
La generalizacion a Rn de los conceptos que en los temas anteriores hemos
estudiado para R se basara en la siguiente denici
on de la distancia entre dos
puntos de Rn :
179

180

Captulo 6. C
alculo diferencial de varias variables

Denici
on 6.2 La distancia eucldea entre dos puntos x, y Rn es

d(x, y) = (x1 y1 )2 + + (xn yn )2 .
El teorema de Pit
agoras justica que esta denici
on es la usual en R2 y en
n
R , y para R es su generalizacion natural.
3

A la hora de demostrar analticamente las propiedades de esta distancia, sin


tener que recurrir a consideraciones geometricas, conviene descomponerla en
varias partes. En primer lugar denimos la norma eucldea de un vector x Rn
como

x = x21 + + x2n ,
de modo que la distancia eucldea puede expresarse como
d(x, y) = x y.
A su vez, la norma puede expresarse en terminos del producto escalar:
x y = x1 y1 + + xn yn .

En estos terminos, x = x x. Deduciremos las propiedades de la distancia a partir de las de la norma, y estas a partir de las del producto escalar.
Denici
on 6.3 Un producto escalar en un espacio vectorial V es una aplicaci
on
: V V R que cumpla las propiedades siguientes:
a) v w = w v,
b) (v + w) x = v x + w x,
c) (v) w = (v w),
d) v v 0 y v v = 0 si y solo si v = 0.
Es evidente que el producto escalar que hemos denido cumple esta denici
on.
Denici
on 6.4 Una norma en un espacio vectorial V es una aplicaci
on
  : V [0, +[ que cumple las propiedades siguientes:
a) v = 0 si y solo si v = 0.
b) v = || v.
c) v + w v + w.
La tercera propiedad recibe el nombre de desigualdad triangular.
Un espacio normado es un espacio vectorial dotado de una norma.

6.1. Espacios metricos y espacios normados

181

Teorema 6.5 Si V es un espacio vectorial


dotado de un producto escalar, la
aplicaci
on   : V R dada por v = v v es una norma, y cumple adem
as
la desigualdad de Schwarz: |x y| x y.
n: Probemos en primer lugar la desigualdad de Schwarz. Sea
Demostracio
= 1, de modo que |x y| = (x y). Para todo n
umero real r, se cumple
0 (x ry) (x ry) = x x 2r(x y) + r2 y y.
As pues,
x2 2|x y|r + y2 r2 0
para todo r R. Si y = 0, ha de ser x y = 0, o de lo contrario la desigualdad
sera falsa para r grande. Si y > 0, tomamos r = |x y|/y2 y obtenemos
|x y|2 x2 y2 .
La aplicaci
on   cumple claramente todas las propiedades de la denici
on
de norma salvo quiz
a la desigualdad triangular. Pero, por la propiedad que
acabamos de probar, tenemos que
x + y2

= (x + y) (x + y) = x x + 2(x y) + y y
x2 + 2x y + y2 = (x + y)2 .

Por lo tanto x + y x + y.


En particular, ahora sabemos que la norma eucldea que hemos denido
anteriormente cumple la denici
on de norma.
Denici
on 6.6 Una distancia en un conjunto M es una aplicaci
on
d : M M [0, +[
que cumpla las propiedades siguientes:
a) d(x, y) = 0 si y solo si x = y.
b) d(x, y) = d(y, x).
c) d(x, z) d(x, y) + d(y, z).
La tercera propiedad se conoce como desigualdad triangular.
Un espacio metrico es un par (M, d), donde M es un conjunto y d una
distancia en M .
Si V es un espacio normado, es inmediato comprobar que la aplicaci
on
d(x, y) = x y
es una distancia en V . En particular, ahora sabemos que la distancia eucldea
en Rn cumple la denici
on general de distancia.
Observemos que si M es un espacio metrico y N M , entonces la distancia
en M se restringe a una distancia en N , luego podemos considerar tambien a
N como espacio metrico. As pues, tenemos denida una estructura de espacio
metrico en cada subconjunto de Rn . En lo sucesivo, siempre consideraremos a
los subconjuntos de Rn como espacios metricos con la distancia eucldea.

182

Captulo 6. C
alculo diferencial de varias variables

Denici
on 6.7 Si M1 , . . . , Mn son espacios metricos (con distancias d1 , . . . , dn ),
denimos en el producto M1 Mn la distancia

d(x, y) = d1 (x1 y1 )2 + + dn (xn yn )2 .
Del hecho de que la distancia eucldea es una distancia en Rn se sigue
f
acilmente que esta distancia producto es una distancia en M1 Mn . En
lo sucesivo consideraremos a los productos de espacios metricos como espacios
metricos con esta distancia.

Observemos que la distancia eucldea en R es d(x, y) = (x y)2 = |x y|,
y que la distancia eucldea en Rn es el producto de la distancia eucldea en R
por s misma.
A partir de aqu ya podemos extender f
acilmente a Rn muchos conceptos
que conocemos para el caso de R:
Denici
on 6.8 Sea M un espacio metrico estandar. Un punto x M es nito
si esta a una distancia nita de un punto est
andar. En caso contrario se dice
remoto. Diremos que dos puntos x, y M estan innitamente pr
oximos, y lo
representaremos por x y, si la distancia entre ellos es innitesimal.
Puesto que la distancia entre dos puntos est
andar ha de ser est
andar y,
por consiguiente, nita, observamos que un punto nito de un espacio metrico
esta a distancia nita de todos los puntos est
andar del espacio. La desigualdad
triangular implica que todo punto que este a una distancia nita de un punto
nito es tambien nito. Tambien es evidente que la relacion de proximidad
innita es una relaci
on de equivalencia.
Un punto x M es casi est
andar si esta innitamente cerca de un punto
estandar, en cuyo caso es claramente u
nico y lo llamaremos parte est
andar de x,
y lo representaremos por x.
El halo de un punto x M es el conjunto (en general externo) h(x) de todos
los puntos innitamente pr
oximos a x.
Es inmediato que, en el caso de R con la distancia eucldea, todos estos
conceptos coinciden con los que ya tenamos denidos. El teorema siguiente nos
permitir
a generalizar a Rn algunos hechos que conocemos para R:
Teorema 6.9 Sea M = M1 Mn un producto de espacios metricos
est
andar (con n tambien est
andar).
a) Un punto x M es nito si y s
olo si todas sus coordenadas lo son.
b) Dos puntos x, y M cumplen x y si y s
olo si todas sus coordenadas
cumplen xi yi .
c) Un punto x M es casi est
andar si y s
olo si todas sus coordenadas lo
son.

6.2. Elementos de topologa

183

n: Observemos que, por el principio de transferencia, un


Demostracio
punto x M es estandar si y s
olo si todas sus coordenadas son estandar.
a) Si x es nito, existe y M estandar tal que d(x, y) es nita. Claramente,
0 di (xi , yi ) d(x, y), luego d(xi , yi ) tambien es nita, luego xi es nito.
Recprocamente, si las coordenadas de x son nitas, para cada i existe un
punto yi Mi estandar tal que di (xi , yi ) es nita. Los puntos yi forman un
punto est
andar y M , y es claro que d(x, y) es nita, luego x es nito.
La prueba de b) es completamente an
aloga y c) se sigue de b).
En particular, esto se aplica a Rn (con n estandar), visto como producto de
R por s mismo: un punto de Rn es nito si y solo si todas sus coordenadas son
n
umeros reales nitos, etc.
Como primera aplicaci
on tenemos el teorema siguiente, que es inmediato, ya
que sabemos que R tiene la propiedad considerada:
Teorema 6.10 Un punto de Rn es casi est
andar si y s
olo si es nito.

6.2

Elementos de topologa
Consideremos el conjunto
C = {(x, y) R2 | x + y 5} R2

representado en la gura. En el podemos distinguir dos clases


de puntos, los puntos interiores como el (1, 2) que estan
totalmente rodeados por puntos del conjunto, y los puntos
frontera, como (3, 2), que estan rodeados por puntos de
dentro y de fuera del conjunto. En esta secci
on vamos a introducir algunas
deniciones que describen situaciones como esta y otras similares.
(1, 2) (3, 2)

Denici
on 6.11 Sea M un espacio metrico, S M y x S, todos ellos
estandar. Diremos que S es un entorno de x si h(x) S. Tambien diremos que
x es un punto interior de S. Diremos que S es abierto si es un entorno de todos
sus puntos.
Por ejemplo, el punto (1, 2) es un punto interior del conjunto C de la gura,
ya que si (x, y) (1, 2), entonces x 1 e y 2, luego x + y 3 < 5, luego
x + y < 5, luego (x, y) C.
Sin embargo, C no es un conjunto abierto, ya que no es entorno de algunos
de sus puntos, como el (3, 2). Basta considerar (x, y) (3, 2) con x > 3, y > 2.
Entonces x + y > 5, luego (x, y)
/ C.
Si que es abierto, en cambio, el conjunto
A = {(x, y) R2 | x + y < 5},

184

Captulo 6. C
alculo diferencial de varias variables

pues cualquier punto (a, b) A es interior. En efecto, podemos suponer que


(a, b) es estandar y, dado (x, y) (a, b), tenemos que x + y a + b < 5, luego
x + y < 5, luego (x, y) A.
Denici
on 6.12 Sea M un espacio metrico, S M y x M , todos ellos
estandar. Diremos que x es adherente a S si existe x S tal que x x.
Diremos que x es un punto frontera de S si es adherente a S y a M \ S.
Por ejemplo, el punto (3, 2) es un punto frontera tanto del conjunto C como
del conjunto A de los ejemplos anteriores. En efecto, si tomamos (x, y) (3, 2)
tal que x < 3, y < 2 se cumple que (x, y) A C, mientras que si lo tomamos
con x > 3, y > 2, entonces (x, y) M \ C M \ A.
Denici
on 6.13 Si M es un espacio metrico y S M , diremos que S es
cerrado si M \ S es abierto.
Por ejemplo, el conjunto C del ejemplo anterior es cerrado, porque su complementario es
R2 \ C = {(x, y) R2 | x + y > 5},
y se prueba que es abierto exactamente igual que hemos visto que lo era el
conjunto A.
El teorema siguiente clarica los conceptos de abierto y cerrado:
Teorema 6.14 Sea M un espacio metrico y S M . Entonces:
a) S es abierto si y s
olo si no contiene a ninguno de sus puntos frontera.
b) S es cerrado si y s
olo si contiene a todos sus puntos frontera.
c) S es cerrado si y s
olo si contiene a todos sus puntos adherentes.
n: Podemos suponer que S es estandar. a) Si S es abierto y
Demostracio
contiene un punto frontera x M , podemos tomarlo estandar. Existe y M \S
tal que y x, pero esto es absurdo, porque y h(x) S.
Recprocamente si S no contiene ning
un punto frontera, tomemos x S
y veamos que es interior. Podemos suponerlo estandar. Si no fuera interior,
existira un y M \ S tal que y x, pero esto signica que x es adherente a
M \ S, y tambien es adherente a S, porque x S, luego x es un punto frontera
de S, contradicci
on.
b) Observemos que los puntos frontera de S son los mismos que los de M \S.
Por lo tanto, S es cerrado si y solo si M \ S es abierto, si y solo si M \ S no
contiene ning
un punto frontera de S (por a) si y s
olo si S contiene a todos sus
puntos frontera.
c) Si S contiene a todos sus puntos adherentes, en particular contiene a
todos sus puntos frontera, luego es cerrado. Recprocamente, si S es cerrado y
x M \ S es un punto adherente, que podemos suponer est
andar, entonces x
tambien es adherente a M \ S, luego es un punto frontera de S, luego debera
estar en S por b), contradicci
on.

6.2. Elementos de topologa

185

Denici
on 6.15 Si M es un espacio metrico, x M y r > 0, denimos la bola
abierta y la bola cerrada de centro x y radio r como
Br (x) = {y M | d(x, y) < r},

Br (x) = {y M | d(x, y) r}.

Por ejemplo, en R2 con la distancia eucldea, es claro que las bolas son
crculos de radio r. La diferencia entre las bolas abiertas y las bolas cerradas
es que las primeras no contienen a su borde, es decir, a la circunferencia de
radio r, y las segundas s. Esto hace que, ciertamente, las bolas abiertas sean
abiertas y las bolas cerradas sean cerradas.
En efecto (suponiendo todos los datos est
andar): si tomamos un punto
estandar y Br (x) y un z x en su halo, tenemos que
d(x, z) d(x, y) + d(y, z) d(x, y) < r,
luego d(x, z) < r. Esto prueba que h(z) Br (x), luego la bola abierta es
abierta.
Ejercicio: Demostrar que las bolas cerradas son cerradas.

El teorema siguiente nos da caracterizaciones internas de los conceptos que


hemos introducido hasta ahora:
Teorema 6.16 Sea M un espacio metrico, S M y x M .
a) x es un punto interior de S si y s
olo si existe una bola abierta Br (x) S.
b) x es un punto adherente de S si y s
olo si todo entorno de x corta a S.
c) x es un punto frontera de S si y s
olo si todo entorno de x corta a S y a
M \ S.
n: Podemos suponer los datos estandar. a) Si existe una bola
Demostracio
Br (x) S, podemos tomar el radio estandar, en cuyo caso h(x) Br (x) S,
luego S es entorno de x.
Recprocamente, si S es entorno de x, tomando r > 0 innitesimal, se cumple
que x Br (x) h(x) S.
b) Si x es un punto adherente y A es un entorno de x, entonces h(x) A,
pero h(x) contiene un punto de S, luego A S = .
Recprocamente, si x no es adherente a S, entonces h(x) M \ S, luego,
tomando r > 0 innitesimal, tenemos que Br (x) es un entorno de x que no corta
a S.
c) es consecuencia inmediata de b).
Paradoja 6.17 Vamos a probar que si M es un espacio metrico y F es una
familia de subconjuntos abiertos de M , entonces la intersecci
on

C
CF

186

Captulo 6. C
alculo diferencial de varias variables

es abierta. En efecto, podemos suponer que el espacio y F son est


andar. Tomamos un punto x en la intersecci
on y observamos que, para todo C F , se
cumple que h(x) C, luego h(x) est
a contenido en la intersecci
on, lo que prueba
que esta es entorno de x y, por transferencia, es entorno de todos sus puntos,
luego es abierta.
Por otra parte, lo que acabamos de probar es falso, como se ve sin m
as que
tomar como F el conjunto de todos los intervalos abiertos ]1/n, +[ R,
cuya intersecci
on es el intervalo cerrado [0, +[, que no es abierto, porque no
es entorno de 0.
n: El contraejemplo es correcto, y muestra que la interseccion de
Solucio
abiertos no es necesariamente abierta. Lo que esta mal es la demostracion.
Podemos tomar F estandar, pero eso no impide que F contenga elementos no
estandar (los tendr
a, de hecho, siempre que F sea innito). Si C F no es
estandar, no podemos asegurar que h(x) C, pues la denici
on de entorno s
olo
vale explcitamente para conjuntos est
andar.
Observemos que, para probar que para todo C F , se cumple h(x) C,
no podemos aplicar el principio de transferencia (y suponer que C es estandar)
porque la armaci
on h(x) C no es interna.
Esto se ve en el contraejemplo: todos los intervalos ]1/n, +[ son abiertos, pero, aunque la familia F formada por todos ellos es estandar, contiene
intervalos no est
andar (los correspondientes a n innito) y, aunque ]1/n, +[
es abierto aun si n es innito, no es cierto que h(0) ]1/n, +[, pues, por
ejemplo, el intervalo no contiene al innitesimo 1/(n 1) h(0).
No obstante, hemos observado que el argumento de la paradoja es v
alido si
la familia de abiertos es nita.
Ejercicio: Demostrar que, en un espacio metrico, toda uni
on de conjuntos abiertos es
abierta, y toda intersecci
on nita de conjuntos abiertos es abierta. Por consiguiente,
toda intersecci
on de conjuntos cerrados es cerrada y toda uni
on nita de conjuntos
cerrados es cerrada.

Denici
on 6.18 Si M es un espacio metrico y S M , llamaremos interior de

S a la uni
on S de todos los abiertos en M contenidos en S. La clausura de S
es la interseccion S de todos los cerrados en M que contienen a S.

Es claro que S S S. M
as a
un, S es abierto, y es el mayor abierto
contenido en S, y S es cerrado, y es el menor cerrado que contiene a S.

Teorema 6.19 Si M es un espacio metrico y S M , entonces S es el conjunto de los puntos interiores de S, y S es el conjunto de los puntos adherentes
de S.

n: Podemos suponer todos los datos estandar. Todo x S


Demostracio

estandar cumple h(x) S S, luego x es interior a S y, si x es interior a

on de
S, entonces x Br (x) S, para cierto r > 0, luego x S por denici
interior, ya que la bola es abierta.

6.2. Elementos de topologa

187

Similarmente, si x (estandar) es adherente a S, tambien es adherente a S y,


como la clausura es cerrada, entonces x S. Recprocamente, si x es estandar
pero no es adherente a S, entonces h(x) M \ S, luego, tomando r > 0
innitesimal, Br (x) M \ S, luego x
/ M \ Br (x), que es un cerrado que
contiene a S, luego x
/ S.
Denici
on 6.20 Si M es un espacio metrico y S M , llamaremos frontera de
S al conjunto S de todos los puntos frontera de S.
Ejercicio: Probar que S = S M \ S,

S = S \ S,

S = S S.

Si tenemos dos espacios metricos estandar N M , conviene comparar en


ambos espacios los conceptos que acabamos de denir:
a) Si x N , la relaci
on entre los halos es que hN (x) = hM (x) M .
b) Un conjunto C N es cerrado en N si y solo si es de la forma C = C  N ,
donde C  es un cerrado en M . En efecto, es claro que los conjuntos de
esta forma son cerrados en N . Si C es cerrado, basta tomar C  = C. En
efecto, (suponiendo los datos est
andar) si x C N es estandar, existe
un y C tal que x y. Como C es cerrado en N , esto implica que x C.
on es obvia.
Esto prueba que C N C, y la otra inclusi
c) Un conjunto A N es abierto en N si y solo si es de la forma A = A N ,
donde A es un abierto en M . En efecto, si A es abierto en N , entonces
N \ A es cerrado en N , luego N \ A = C  N , donde C  es cerrado en M ,
luego A = (M \ C  ) N .
Vemos as que las nociones de abierto o cerrado son relativas al espacio en
que consideremos contenido un conjunto. Por ejemplo si N M , entonces,
como espacio metrico, N es trivialmente abierto y cerrado en s mismo, pero
puede serlo o no en M .
Ejemplo Probar que el intervalo N = [1, 2[ no es ni abierto ni cerrado en
M = R; es abierto, pero no cerrado, en M = [1, 3]; es cerrado, pero no abierto
en M = [0, 2[; es abierto y cerrado en M = [1, 2[ [3, 4]; y es abierto y cerrado
en M = N .
Espacios compactos Si N M son espacios metricos estandar, un punto
x N es nito como punto de N si y solo si es nito como punto de M . En
efecto, N ha de contener un punto est
andar p, y x sera nito en M o en N si y
solo si d(x, y) es nita. Esto convierte en absoluto el concepto siguiente:
Denici
on 6.21 Un espacio metrico estandar M es acotado si todos sus puntos
son nitos.

188

Captulo 6. C
alculo diferencial de varias variables

As, si tenemos A M y ambos son estandar, decir que A es acotado en


M es lo mismo que decir que A es acotado en s mismo, como espacio metrico.
Signica que los puntos de A son nitos, tanto en A como en M . No obstante, es interesante la siguiente caracterizacion relativa de la acotaci
on de un
subconjunto en un espacio mayor:
Teorema 6.22 Un subconjunto est
andar de un espacio metrico est
andar est
a
acotado si y s
olo si est
a contenido en una bola de centro nito y radio nito.
n: Evidentemente, si A Br (x) con x y r nitos, entonces
Demostracio
todo punto y A cumple d(x, y) < r, luego y es nito, y A esta acotado.
Recprocamente, vamos a ver que si A esta acotado, entonces esta contenido en una bola de radio est
andar y centro cualquier punto est
andar x M
prejado.
En caso contrario, para todo r > 0 estandar, tendramos que A no estara
contenido en Br (x), luego, por transferencia, A no estara contenido en ninguna
bola de cualquier radio (est
andar o no). Tomando un r > 0 innito, esto implica
que existe y A tal que d(x, y) r, luego y es remoto, en contradiccion con la
hip
otesis de que A esta acotado.
En particular, es claro que toda bola de centro nito y radio nito est
a
acotada. Tambien es obvio que todo subconjunto de un conjunto acotado est
a
acotado.
Ejercicio: Demostrar que un subconjunto A de un espacio metrico M est
a acotado
si y s
olo si existe un C R tal que d(x, y) C, para todo par de puntos x, y A.

Si en lugar de considerar puntos nitos consideramos puntos casi est


andar,
la situaci
on es algo mas delicada, pues si tenemos A M , ambos estandar,
un punto x A puede ser casi estandar en M y no serlo en A (porque x no
pertenezca a A).
Denici
on 6.23 Un espacio metrico estandar M es compacto si todos sus puntos son casi estandar.
Seg
un la observaci
on precedente, si A M son estandar, debemos tener
presente que A es compacto (como espacio metrico), no cuando todos sus puntos
son casi estandar en M , sino cuando lo son en A. Explcitamente:
A es compacto si y s
olo si todo x A es casi est
andar (en M ) y x A.
La compacidad es el concepto mas abstracto (y articial) de todos cuantos
vamos a estudiar, pero tambien uno de los m
as u
tiles. En el caso de Rn su
interpretaci
on es muy simple:
Teorema 6.24 Si M es un espacio metrico y C M es compacto, entonces
es cerrado y acotado. Si M = Rn , entonces todo subconjunto cerrado y acotado
es compacto.

6.3. Funciones continuas

189

n: Si C es compacto todos sus puntos son casi estandar,


Demostracio
luego son nitos. Esto prueba que est
a acotado. Por otra parte, C cumple
trivialmente la denici
on de cerrado.
Si C Rn es cerrado y acotado, todo punto x C es nito (por ser acotado),
luego casi-estandar (esto es cierto en Rn , por 6.10), y x C por ser cerrado,
luego C es compacto.
Otra relaci
on b
asica entre compactos y cerrados es la siguiente:
Teorema 6.25 Si M es un espacio metrico compacto y C M es cerrado,
entonces C es compacto.
n: Podemos suponer los datos estandar. Si x C, entonces
Demostracio
x es casi estandar en M , pero, como C es cerrado, x C, luego C es compacto.
El teorema siguiente es trivial en terminos no estandar, aunque con tecnicas
clasicas cuesta un poco de probar:
Teorema 6.26 (Tychono ) Si M1 , . . . , Mn son espacios metricos compactos,
entonces M1 Mn es compacto.
n: Podemos suponer que datos son estandar. Si tomamos
Demostracio
x M1 Mn , sus coordenadas xi son casi estandar, porque los factores
son compactos, luego x es casi estandar por el teorema 6.9

6.3

Funciones continuas

Ahora estamos en condiciones de generalizar a espacios metricos los resultados de continuidad que conocemos para funciones reales de variable real.
Denici
on 6.27 Una funci
on estandar f : M N entre dos espacios metricos estandar es continua en un punto est
andar x M si para todo punto y M
tal que x y, se cumple que f (x) f (y). Diremos que f es continua en un
conjunto A M si lo es en todos los puntos de A.
Es evidente que esta denici
on generaliza a la que tenamos para funciones
en R. Tambien es claro que si f : M N es continua, M  M y N N  ,
entonces f |M  : M  N  tambien es continua.
Seguidamente vamos a demostrar unos cuantos resultados que nos proporcionen numerosos ejemplos de funciones continuas. El primero es obvio:
Teorema 6.28 Si f : M N y g : N P son funciones entre espacios
metricos tales que f es continua en un punto x M y g es continua en f (x),
entonces f g es continua en x. En particular, si f y g son continuas (en sus
dominios), f g tambien lo es.

190

Captulo 6. C
alculo diferencial de varias variables
Los tres teoremas siguientes son consecuencias inmediatas de 6.9:

Teorema 6.29 Si M1 , . . . , Mn son espacios metricos, la proyecci


on
pi : M1 Mn Mi
que a cada punto x le asigna su coordenada i-esima, pi (x) = xi , es continua.
Teorema 6.30 Si fi : Mi Ni son aplicaciones continuas entre espacios
metricos, la aplicaci
on
f1 fn : M1 Mn N1 Nn
dada por (f1 fn )(x1 , . . . , xn ) = (f (x1 ), . . . , f (xn )) es continua.
Teorema 6.31 Si fi : M Ni son funciones continuas entre espacios metricos, tambien es continua la aplicaci
on (f1 , . . . , fn ) : M N1 Nn dada
por (f1 , . . . , fn )(x) = (f1 (x), . . . , fn (x)).
Teorema 6.32 Si N es un espacio normado, la suma + : N N N y el
producto : R N N son continuos.
n: Podemos suponer que N es estandar. Hemos de probar
Demostracio
que si (x, y) N N es un punto est
andar y (x , y  ) (x, y), entonces se cumple


que x + y x + y. Ahora bien,
d(x + y  , x + y) = x + y  x y = (x x) + (y  y)
x x + y  y = d(x , x) + d(y  , y) 0,
luego x + y  x + y.
Para el producto, partimos de (, x) R N estandar, tomamos otro par
( , x ) (, x), y hemos de ver que  x x.
En efecto:
d( x , x) =  x x =  x  x +  x x
| |x x + | |x 0.

Observemos ahora que, si M es un espacio metrico y N es un espacio normado, en el conjunto F (M, N ) de todas las aplicaciones M N , tenemos
denida (puntualmente) una suma y un producto por n
umeros reales:
(f + g)(m) = f (m) + g(m),

(f )(m) = f (m).

Si f , g F (M, R), tambien podemos denir puntualmente su producto:


(f g)(m) = f (m)g(m).

6.3. Funciones continuas

191

Ahora es inmediato que si f y g F (M, N ) son continuas, tambien lo son


f + g y f . En efecto, f + g puede verse como la composicion
(f,g)

M N N N,
y ambas funciones son continuas, por los teoremas anteriores. Similarmente, f
se descompone como
(,f )

M R N N,
donde, en la primera parte, representa a la funci
on constante , que obviamente es continua.
El teorema anterior prueba en particular la continuidad de la aplicaci
on
producto : R R R, luego, si f y g F (M, R) son continuas, tambien es
continua f g, ya que se expresa como
(f,g)

M R R R
En denitiva, ahora es obvio el teorema siguiente:
Teorema 6.33 Si M es un espacio normado y N es un espacio metrico, el
conjunto C(M, N ) de todas las funciones continuas en M en N es un espacio
vectorial con la suma y el producto denidos puntualmente. El espacio C(M, R)
es tambien un anillo con el producto denido puntualmente.
Ejemplo

La funci
on x2 yz 7z 3 F (R3 , R) es continua.

En efecto, las funciones x, y, z son las proyecciones cuya continuidad arma


el teorema 6.29. La funci
on dada se obtiene a partir de ellas mediante sumas,
productos y productos por n
umeros, luego es continua por el teorema anterior.
En general, es claro que el espacio C(Rn , R) contiene al anillo R[x1 , . . . , xn ]
de todos los polinomios de n variables.
Ejemplo

La funci
on f : R R2 dada por f (t) = (sen t, cos t) es continua.

En efecto, sabemos que lo son las funciones sen t y cos t y basta aplicar el
teorema 6.31.
Las aplicaciones continuas nos permiten reconocer f
acilmente muchos conjuntos abiertos y cerrados, gracias al teorema siguiente:
Teorema 6.34 Sea f : M N una aplicaci
on entre espacios metricos. Las
armaciones siguientes son equivalentes:
a) f es continua.
b) Para todo abierto A N , se cumple que f 1 [A] es abierto en M .
c) Para todo cerrado A N , se cumple que f 1 [A] es cerrado en M .

192

Captulo 6. C
alculo diferencial de varias variables

n: b) y c) son claramente equivalentes, pues si suponemos b)


Demostracio
y A es cerrado, entonces N \ A es abierto, y f 1 [N \ A] = M \ f 1 [A], luego
f 1 [A] es abierto y f 1 [A] es cerrado. Igualmente se prueba que c) implica b).
Supongamos que todos los datos son est
andar. Si f es continua y A es
abierto, tomamos un punto est
andar x f 1 [A] y un y M tal que y x.
Entonces f (y) f (x) A, luego f (y) A, luego y f 1 [A]. Esto prueba que
h(x) f 1 [A], luego f 1 [A] es abierto.
Recprocamente, si se cumple b), tomamos x M estandar y un y x. Si
f (y)  f (x), entonces hay un n
umero estandar 0 < r < d(x, y), luego tenemos
que f (y)
/ Br (f (x)) y, por consiguiente, y
/ f 1 [Br (f (x))]. Este conjunto
(estandar) debera ser abierto, pero contiene a x y no a y, luego no contiene al
halo de x. Esto es una contradicci
on.
Ejemplo

El conjunto
C = {(x, y, z) R3 | 2x2 + 5y 2 + 8z 2 = 20}

es compacto.
En efecto, es la antiimagen del cerrado {20} por el polinomio 2x2 +5y 2 +8z 2 ,
que es una aplicaci
on continua. Por lo tanto, es cerrado. Adem
as es acotado,
pues si (x, y, z) C, entonces |x| 20, |y| 20, |z| 20, luego las tres
coordenadas son nitas, luego (x, y, z) es nito. Esto signica que C es acotado.

Ejemplo

El conjunto
A = {(x, y, z) R3 | x 2y + z > 3}

es abierto.
Pues es la antiimagen del intervalo ]3, +[ por el polinomio x 2y + z.
Ejemplo Si una aplicaci
on g : M N entre dos espacios metricos es biyectiva y continua, su inversa g 1 : N M no es necesariamente continua.
En efecto, sea N = {(x, y) R2 | x2 + y 2 = 1} y consideremos la aplicacion
f : [0, 2] N dada por f (t) = (cos t, sen t). Claramente es continua, aunque
no es biyectiva, porque f (0) = f (2) = (1, 0). Sin embargo, si M = [0, 2[, la
restriccion g : M N s que es biyectiva y continua. No obstante, si h > 0 es
innitesimal, se cumple que g(2 h) = f (2 h) f (2) = f (0) = g(0).
As pues, tenemos dos puntos en N (los puntos g(2 h) y g(0)) que estan
innitamente pr
oximos, pero sus imagenes en M por g 1 (los puntos 0 y 2 h)
no estan innitamente pr
oximos. Esto prueba que g 1 no es continua en (1, 0).

6.3. Funciones continuas

193

Denici
on 6.35 Un homeomorsmo g : M N entre dos espacios metricos
es una aplicaci
on biyectiva, continua con inversa continua.
Teorema 6.36 Si f : M N es una aplicaci
on continua y suprayectiva entre
espacios metricos y M es compacto, entonces N tambien es compacto.
n: Podemos suponer que los datos son estandar. Tomemos
Demostracio
x N . Existe un y M tal que f (y) = x. Como M es compacto, existe

y M . Entonces f ( y) f (y) = x y f ( y) es estandar, luego x es casi


estandar. Esto prueba que N es compacto.
Ahora es inmediata la generalizaci
on del primer teorema de Weierstrass:
Teorema 6.37 Si M es un espacio metrico compacto y f : M R es una
aplicaci
on continua, entonces f toma en M un valor m
aximo y un valor mnimo.
n: Por el teorema anterior f [M ] R es compacto, luego
Demostracio
es cerrado y acotado. Por ser acotado, existe el supremo s y el nmo i. El
teorema 2.57 arma que s e i son adherentes a f [M ]. Como es cerrado, resulta
que s, i f [M ], es decir, s = f (u), i = f (v). Obviamente, u y v son los puntos
donde f alcanza su maximo y su mnimo.
Espacios conexos Para generalizar el segundo teorema de Weierstrass necesitamos un nuevo concepto:
Denici
on 6.38 Un espacio metrico M es conexo si no puede expresarse como
uni
on de dos abiertos disjuntos no vacos.
La relacion con el segundo teorema de Weierstrass nos la proporcionan los
dos teoremas siguientes:
Teorema 6.39 Si f : M N es una aplicaci
on continua y suprayectiva entre
espacios metricos y M es conexo, entonces N tambien lo es.
n: Si N no fuera conexo, lo podramos descomponer como
Demostracio
N = A B, donde A y B son abiertos disjuntos no vacos. Entonces, tambien
M = f 1 [A] f 1 [B], donde los dos conjuntos son abiertos disjuntos no vacos,
es decir, M no es conexo.
Teorema 6.40 Un subconjunto de R es conexo si y s
olo si es un intervalo.
n: Sea I R un intervalo y supongamos que I = A B,
Demostracio
donde A y B son abiertos disjuntos no vacos. Entonces, la aplicaci
on f : I R
dada por

0 si x A,
f (x) =
1 si x B,
es claramente continua en I, pero toma los valores 0 y 1 y no toma ning
un valor
intermedio, en contradicci
on con el segundo teorema de Weierstrass.

194

Captulo 6. C
alculo diferencial de varias variables

Supongamos ahora que I R es conexo y vamos a probar que es un intervalo.


Por el teorema 2.64, basta tomar a, b I, digamos a < b, y hemos de probar
que ]a, b[ I. En caso contrario, existe un n
umero a < c < b tal que c
/ I,
pero entonces A = I ], c[ y B = ]c, +[ son abiertos disjuntos en I tales
que I = A B. Esto prueba que I no es conexo.
La generalizacion del segundo teorema de Weierstrass es:
Teorema 6.41 Si M es un espacio metrico conexo y f : M R es una
aplicaci
on continua y x, y M , entonces f toma todos los valores comprendidos
entre f (x) y f (y).
n: Tenemos que f [M ] R es conexo, luego es un intervalo,
Demostracio
y contiene a f (x) y f (y), luego contiene a todos los valores intermedios.
La prueba del teorema 6.40 contiene una caracterizaci
on u
til de la conexi
on:
Teorema 6.42 Un espacio metrico M es conexo si y s
olo si toda aplicaci
on
continua f : M {0, 1} es constante.
n: Si M es conexo pero f no fuera constante, entonces sera
Demostracio
suprayectiva, luego {0, 1} debera ser conexo, cuando claramente no lo es (ya
que {0} y {1} son ambos abiertos en {0, 1}). Si M no es conexo, podemos
descomponerlo como M = A B, donde A y B son abiertos disjuntos no vacos.
La aplicaci
on f : M {0, 1} dada por

0 si x A,
f (x) =
1 si x B,
es continua y no es constante.
Teorema 6.43 Si M1 , . . . , Mn son espacios metricos conexos, entonces el producto M1 Mn es conexo.
n: Basta probarlo para dos factores y, por inducci
Demostracio
on, vale
para todo n. Tomemos una funci
on continua f : M1 M2 {0, 1} y veamos
que es constante.
Fijemos un punto (x, y) M1 M2 . La aplicaci
on g1 : M1 M1 M2
dada por g(m1 ) = (m1 , y) es continua, luego su imagen es conexa, luego
f (m1 , y) = f (x, y)
para todo m1 M . Fijado m1 M , la aplicaci
on g2 : M2 M1 M2 dada
por g2 (m2 ) = (m1 , m2 ) es continua, luego su imagen es conexa, luego
f (m1 , m2 ) = f (m1 , y) = f (x, y),
para todo (m1 , m2 ) M1 M2 .
Ejercicio: Probar que si M es un espacio metrico y A, B M son conexos y
A B = , entonces A B es conexo.

6.4. Derivadas y diferenciales

6.4

195

Derivadas y diferenciales

La generalizacion m
as simple del concepto de derivada de una funci
on de
una variable es la siguiente:
Denici
on 6.44 Sea f : D Rn R una funci
on estandar denida en un
abierto D y sea p D. Diremos que f es derivable en p respecto a la variable
xi si existe un n
umero estandar

f 
xi p
tal que, para todo innitesimo no nulo h R, se cumple que

f (p1 , . . . , pi + h, . . . , pn ) f (p)
f 
.

h
xi p
Es obvio que, si existe un n
umero que satisface la denici
on anterior, es
u
nico, y se llama derivada parcial de f respecto a xi en el punto p. Si f es
derivable respecto de xi en todos los puntos de D, tenemos denida la funci
on
derivada parcial
f
: D Rn R.
xi
Es claro que esta denici
on generaliza a la denici
on que ya conocamos de
derivada de una funci
on de una variable. M
as a
un, los resultados conocidos
sobre derivadas de funciones de una variable se generalizan autom
aticamente a
resultados an
alogos sobre derivadas parciales gracias a la observacion siguiente:
en las condiciones de la denici
on anterior,


f 
dfp,i 
=
,
xi p
dx pi
donde fp,i : Di R R es la funci
on dada por
fp,i (x) = f (p1 , . . . , x, . . . , pn ),
y Di = {x R | (p1 , . . . , x, . . . , pn ) D}. La igualdad ha de entenderse como
que existe una derivada si y s
olo si existe la otra.
En otras palabras: la derivada parcial de f en p respecto de xi es la derivada
en pi de la funci
on (de una variable) que resulta de jar xj = pj en f para j = i.
As, ahora es evidente que el teorema 3.18 es valido en general para derivadas
parciales. Por ejemplo, dadas dos funciones f y g, es claro que
(f + g)p,i = fp,i + gp,i ,
luego la suma sera derivable respecto de xi en p si y solo si lo son ambos
sumandos y, en tal caso, la derivada de la suma ser
a la suma de las derivadas.

196

Captulo 6. C
alculo diferencial de varias variables

Ejemplo La funci
on f (x, y) = x2 y + y 3 es derivable respecto de ambas variables en todo R2 y sus derivadas son
f
= 2xy,
x

f
= x2 + 3y 2 .
y

En efecto, para cualquier p = (x, y) R2 , se cumple que fp,1 (x) = x2 y + y 3 ,


fp,2 (y) = x2 y + y 3 , y s
olo hemos de aplicar las reglas de derivaci
on usuales para
funciones de una variable.
Sin embargo, la noci
on de derivada parcial no puede considerarse el equivalente en varias variables a la noci
on de derivada de una funci
on de una variable,
pues las propiedades b
asicas no se generalizan. Por ejemplo, no es cierto que
toda funci
on que admita derivadas parciales sea continua:
Ejercicio: Probar que la funci
on f : R2 R dada por

f (x, y) =

0
1

si xy = 0,
si xy =
 0.

no es continua en (0, 0), pero existen

f 
f 
=
= 0.


x (0,0)
x (0,0)

La razon de la patologa que muestra el ejercicio anterior es clara: las derivadas parciales nos dan informaci
on sobre el efecto que tiene la variaci
on innitesimal una variable en una funci
on manteniendo las dem
as constantes, pero
no nos dicen nada del efecto que tiene una variaci
on innitesimal de todas las
variables simult
aneamente. Para relacionar con las derivadas tales variaciones
simult
aneas necesitamos el concepto de aplicacion lineal:
Denici
on 6.45 Una aplicaci
on lineal : Rn Rm es una aplicaci
on de la
forma
(x) = (a11 x1 + + an1 xn , . . . , a1m x1 + + anm xn ),
para ciertos aij R.
La matriz

a11
..
A = (aij ) = .
an1

a1m
..
.
anm

se llama matriz asociada a la aplicaci


on lineal . Es obvio que cada aplicaci
on
lineal esta determinada por su matriz y que esta es u
nica, ya que su i-esima la
es necesariamente (ei ), donde ei = (0, . . . , 1, . . . , 0) Rn es el vector que tiene
el 1 en la coordenada i-esima. A su vez, esto prueba que esta completamente
determinada por los vectores (ei ), para i = 1, . . . , n.
Llamaremos L(Rn , Rm ) al conjunto de todas las aplicaciones lineales de Rn
en Rm .

6.4. Derivadas y diferenciales

197

Ejercicio: Probar que toda aplicaci


on lineal : Rn Rm cumple las relaciones
(x + y) = (x) + (y) y (x) = (x), para todo x, y Rn y todo R.

En general, las funciones coordenadas de una aplicaci


on f : D Rm , son
m
las composiciones fi = f pi , donde pi : R R es la proyeccion i-esima. Es
claro que una funci
on : Rn Rm es lineal si y solo si lo son sus funciones
coordenadas.
Denici
on 6.46 Una funci
on estandar f : D Rn Rm denida en un
abierto D es diferenciable en un punto p D si existe una aplicaci
on lineal
estandar : Rn Rm tal que, para cada vector h Rn , h 0, h = 0, se
cumple que
f (p + h) f (p) (h)
0.
h
Vamos a probar que, si f es diferenciable en este sentido, entonces la aplicacion esta completamente determinada por f y por p. Para ello basta ver
que estan determinados los valores (ei ), para i = 1, . . . , n. En efecto, tomamos
un innitesimo no nulo h R y aplicamos la denici
on anterior a hei , con lo
que obtenemos que
f (p + hei ) f (p) (hei )
0.
|h|
Ahora observamos que |h|/h = 1 es nito, luego podemos multiplicar el
cociente por esta expresion sin que deje de ser innitesimal:
f (p + hei ) f (p) h(ei )
0.
h
Equivalentemente:
f (p + hei ) f (p)
(ei ).
h
Ambos miembros son vectores de Rm , y sabemos que sus coordenadas han
de estar innitamente pr
oximas, es decir, para todo j = 1, . . . , m, tenemos que
fj (p + hei ) fj (p)
j (ei ).
h
Pero esto signica que la funci
on fj : D Rn R tiene derivada parcial
respecto de xi en p, y que

fj 
= j (ei ).
xi p
Esto prueba que, en efecto, (ei ) esta unvocamente determinado.
Denici
on 6.47 Si f : D Rn Rm es una funci
on diferenciable en un
punto p D, llamaremos diferencial de f en p a la u
nica aplicaci
on lineal que
cumple la denici
on precedente. La representaremos por dp f : Rn Rm .

198

Captulo 6. C
alculo diferencial de varias variables
Hemos demostrado lo siguiente:

Teorema 6.48 Si f : D Rn Rm es una funci


on diferenciable en un
punto p D, entonces sus funciones coordenadas fj : D Rn R tienen
derivadas parciales en p y, para i = 1, . . . , n, se cumple que
#

 $
f1 
fm 
dp f (ei ) =
,...,
xi p
xi p
M
as en general:
Denici
on 6.49 Si f : D Rn Rm es una funci
on cuyas funciones coordenadas tienen derivadas parciales en un punto p D, llamaremos matriz jacobiana de f en p a la matriz


fj
Jf (p) =
.
xi
En el caso m = 1, la traspuesta de matriz jacobiana se llama tambien vector
gradiente de f en p, y se representa por
#

 $
f 
f 
f (p) =
.
,...,
x1 
xn 
p

Hemos probado que si f es diferenciable en p, entonces dp f es la aplicacion


lineal asociada a la matriz jacobiana Jf (p).
De la propia denici
on de diferenciabilidad se sigue el teorema siguiente, que
nos permitir
a a menudo restringirnos al caso de funciones con valores en R:
Teorema 6.50 Una funci
on f : D Rn Rm es diferenciable en un punto
p D si y s
olo si todas sus funciones coordenadas son diferenciables en p y, en
tal caso,
dp f (v) = (dp f1 (v), . . . , dp fm (v)).
Ahora, si f : D Rn R es diferenciable en un punto p D, la propia
denici
on de matriz de una aplicaci
on lineal nos da que, para todo x Rn ,


f 
f 
dp f (x) =
x1 + +
xn .
x1 p
xn p
Observemos ahora que, de la denici
on de diferenciabilidad se sigue inmediatamente que toda aplicaci
on lineal es diferenciable, y que su diferencial coincide
con ella misma. En particular, las proyecciones pi : Rn R (es decir, las
aplicaciones pi (x) = xi o, simplemente, xi ) son lineales, luego dp xi (x) = xi .
Esto nos permite escribir la igualdad anterior como


f 
f 
dp f (x) =
dp x1 (x) + +
dp xn (x)
x1 p
xn p

6.4. Derivadas y diferenciales

199

o, tambien, como igualdad de funciones,




f 
f 
dp f =
d
x
+

+
dp xn .
p 1
x1 p
xn p
Si f es diferenciable en todos los puntos p D, esta igualdad es v
alida para
todo p, y se traduce en una igualdad de formas diferenciales. Esto requiere
generalizar la denici
on de forma diferencial que hemos visto en el caso de
funciones de una variable:
Llamamos L(Rn ) al conjunto de las aplicaciones lineales l : Rn R.
Denimos una suma + : L(Rn ) L(Rn ) L(Rn ) dada por
(l + l )(u) = l(u) + l (u).
Se comprueba inmediatamente que, en efecto, l + l L(Rn ).
Si D Rn es abierto, llamamos (D) al conjunto de todas las aplicaciones : D L(Rn ). A los elementos de (D) los llamaremos formas
diferenciales en D. Si p D, escribiremos p en lugar de (p).
Observemos que, si (D), podemos denir f,i : D R mediante
f,i (p) = (p)(ei ), de modo que, para todo x Rn , se cumple que
p (x) = f,1 (p)x1 + + f,n (p)xn .
As, esta completamente determinada por las aplicaciones f,i y, recprocamente, dadas funciones cualesquiera fi : D R podemos denir
p (x) = f1 (p)x1 + + fn (p)xn ,
de modo que f,i = fi .
Denimos una suma + : (D) (D) (D) mediante
( +  )p = p + p ,
donde la suma del segundo miembro es la suma de L(Rn ). Claramente,
f+ ,i = f,i + f ,i .
Denimos un producto F (D) (D) (D) mediante
(g)p (u) = g(p)p (u).
Se comprueba inmediatamente que g (D). Claramente, fg,i = gf,i .
En estos terminos, si f : D Rn R es una funci
on diferenciable en el
abierto D (es decir, diferenciable en todos los puntos de D), podemos considerar
la forma diferencial df (D) que a cada p D le asigna la aplicaci
on lineal
dp f L(Rn ).

200

Captulo 6. C
alculo diferencial de varias variables
En general, si (D), tenemos que

p (x) = f,1 (p)x1 + + f,n (p)xn = f,1 (p)dp x1 (x) + + f,n (p)dp xn (x),
para todo x Rn , luego
p = f,1 (p)dp x1 + + f,n (p)dp xn ,
luego
= f,1 dx1 + + f,n dxn .
En denitiva, tenemos que cada (D) se expresa de forma u
nica como
= f1 dx1 + + fn dxn ,
para ciertas funciones fi : D Rn R. Concretamente, si f es una funci
on
diferenciable en D, tenemos la igualdad de formas diferenciales:
df =

f
f
dx1 + +
dxn .
x1
xn

En contra de lo que esta expresi


on pueda sugerir, la mera existencia de
derivadas parciales no garantiza la diferenciabilidad. Ser
a f
acil dar un ejemplo
si tenemos en cuenta el teorema siguiente:
Teorema 6.51 Toda funci
on diferenciable en un punto p es continua en p.
n: Sea f : D Rn Rm una funci
Demostracio
on (estandar) denida
en un abierto D y supongamos que es diferenciable en un punto est
andar p D.
De la denici
on de diferenciabilidad se sigue que
f (p + h) f (p) + dp f (h) f (p),
ya que las funciones lineales son claramente continuas. Esto vale para todo
h Rn innitesimal no nulo, pero tambien es trivialmente cierto si h = 0. Por
consiguiente, si x D cumple x p, tenemos que f (x) f (p), y esto prueba
la continuidad en p.
Ejemplo

La funci
on f : R2 R dada por
xy
2
si (x, y) = (0, 0),
2
f (x, y) = x + y

0
si (x, y) = (0, 0),

tiene derivadas parciales en R2 , pero no es continua, luego tampoco diferenciable, en (0, 0).
En efecto, f no es continua en (0, 0) porque, si tomamos x = y 0 no nulos,
entonces
x2
1
f (x, y) = 2 =  0 = f (0, 0).
2x
2

6.4. Derivadas y diferenciales

201

La existencia de derivadas parciales en todo punto (x, y) = (0, 0) es consecuencia de las reglas usuales de derivabilidad. En el punto (0, 0) aplicamos la
denici
on de derivada parcial:
f (h, 0) f (0, 0)
= 0,
h
luego

f (0, h) f (0, 0)
= 0,
h



f 
f 
=
= 0.
x (0,0)
y (0,0)

Ejercicio: Probar que una funci


on f : D R R es derivable en un punto p D
si y s
olo si es diferenciable en p.

Para dar una condici


on suciente de diferenciabilidad conviene introducir
primero algunos conceptos:
Denici
on 6.52 Si f : D Rn R es una funci
on denida en un abierto
D, representaremos por
kf
: D Rn R
xi1 xik
a la funci
on que resulta de derivar k veces la funcion f , primero respecto de xi1 ,
luego respecto de xi2 , etc. (supuesto que sea posible).
Diremos que f es de clase C k en D (donde k 1) si existen todas las
derivadas k-esimas y todas ellas son continuas en D.
Diremos que f es de clase C en D si es de clase C k para todo k 1.
Diremos que una funci
on f : D Rn Rm es de clase C k en D (para
k = 1, 2, . . . , ) si lo son todas sus funciones coordenadas.
Diremos que una funci
on estandar f : D Rn Rm es estrictamente
diferenciable en p D si existe una aplicaci
on lineal est
andar : Rn Rm
tal que, para todo par de puntos distintos x p y, se cumple que
f (x) f (y) (x y)
0.
x y
Haciendo y = p en la denici
on anterior vemos que toda funci
on estrictamente diferenciable en p es diferenciable en p, y que la aplicaci
on lineal ha de
ser necesariamente dp f . Tambien es obvio que f es estrictamente diferenciable
en p si y solo si lo son todas sus funciones coordenadas.
Teorema 6.53 Una funci
on f : D Rn Rm es de clase C 1 en un abierto
D si y s
olo si es estrictamente diferenciable en D.

202

Captulo 6. C
alculo diferencial de varias variables

n: Como f es estrictamente diferenciable o de clase C 1 si y


Demostracio
solo si lo son sus funciones coordenadas, no perdemos generalidad si suponemos
que m = 1. Tambien podemos suponer que todos los datos son estandar.
Supongamos en primer lugar que f es de clase C 1 y tomemos un punto
estandar p D. Denimos

n

f 
(x) =
xi
xi p
i=1
y tomamos dos puntos distintos x p y. Vamos a calcular
f (x) f (y) (x y).
Para ello denimos Fi = f (x1 , . . . , xi , yi+1 , . . . , yn ), donde hemos de entender
que F0 = f (y), Fn = f (x). Es claro entonces que:
#
$


n
n


f 
f 
f (x) f (y)
Fi Fi1
(xi yi ) =
(xi yi ) .
xi p
xi p
i=1
i=1
Ahora aplicamos el teorema del valor medio a la funci
on
gi (t) = f (x1 , . . . , xi1 , yi + t(xi yi ), yi+1 , . . . , yn )
en el intervalo [0, 1]. Notemos que el punto en el que calculamos f esta innitamente pr
oximo a p, luego esta en D. Claramente gi es continua en [0, 1] y el
hecho de que f tenga derivada parcial respecto de xi implica que gi es derivable
en ]0, 1[. Por consiguiente, aplicando la regla de la cadena para funciones de
una variable:

f 
Fi Fi1 = g(1) g(0) =
(xi yi ),
xi ci
donde ci p. As pues:



 
n 

f  
 f 
|f (x) f (y) (x y)|


 |xi yi | x y,
 xi ci
xi p 
i=1

donde


 
 f 
 
f


 
= n max 

i  xi
xi p 
ci

La continuidad en p de las derivadas de f implica que los valores absolutos


son innitesimales, luego el maximo tambien es innitesimal y, como n es nito,
0. En denitiva, concluimos que
f (x) f (y) (x y)
0,
x y
luego f es estrictamente diferenciable en p.

6.4. Derivadas y diferenciales

203

Recprocamente, supongamos ahora que f es estrictamente diferenciable en


el abierto D. En particular, esto implica que f tiene derivadas parciales en D.
Tomemos un punto estandar p D y vamos a ver que
f
xi
es continua en p.
Si x D es estandar y h R es un innitesimo no nulo, tenemos que

f (x + hei ) f (x)
f 
.

h
xi x
En particular, si  > 0 es estandar, existe un > 0 (por ejemplo cualquier
innitesimo) tal que si 0 < |h| < se cumple

 
 f (x + hei ) f (x)
f  

< .


h
xi x 
Esto vale para todo x D y todo  > 0 estandar, luego por transferencia vale
para todo x D y todo  > 0. Tomemos concretamente x p y  innitesimal.
Encontramos entonces un h = 0, que podemos tomar innitesimal, tal que

f (x + hei ) f (x)
f 
= h 0.

h
xi x
Equivalentemente,

f 
f (x + hei ) f (x) = h
+ hh .
xi x
Por otra parte, aplicando la denici
on de diferenciabilidad estricta en p obtenemos que
f (x + hei ) f (x) hdp f (ei )
= h 0.
h
Equivalentemente,

f 
f (x + hei ) f (x) = h
+ hh .
xi p
Igualando las dos expresiones que hemos obtenido queda que


f 
f 

= h h 0,
xi x
xi p
lo que prueba la continuidad en p de la derivada parcial.
Para probar que todas las funciones usuales son diferenciables, s
olo nos falta
la generalizacion de la regla de la cadena:

204

Captulo 6. C
alculo diferencial de varias variables

Teorema 6.54 (Regla de la cadena) Si f : D Rn Rm es una funci


on
diferenciable en p D y g : E Rm Rk es diferenciable en f (p) E,
entonces f g es diferenciable en p y
dp (f g) = dp f df (p) g.
n: Podemos suponer que todos los datos son estandar. Sea
Demostracio
h Rn un innitesimo. Como f es diferenciable en p, es continua en p, luego
h = f (p+h)f (p) es innitesimal. La diferenciabilidad de f implica que existe
un vector innitesimal h1 Rm tal que
h = f (p + h) f (p) = dp f (h) + hh1 .
Igualmente, de la diferenciabilidad de g se sigue que existe h2 Rk innitesimal
tal que
g(f (p + h)) = g(f (p) + h ) = g(f (p)) + df (p) g(h ) + h h2
= g(f (p)) + df (p) g(dp f (h)) + hdf (p) g(h1 ) + h h2 .
Llamemos = dp f df (p) g, que es una aplicaci
on lineal (ver las observaciones
posteriores a este teorema). Tenemos que
(f g)(p + h) (f g)(p) (h)
h 
= df (p) g(h1 ) +
h2 0,
h
h
donde hemos usado que
 h 
h
= dp f
+ h1
h
h
es nito. Esto prueba que f g es diferenciable en p y que dp (f g) = .
En la prueba del teorema anterior hemos usado que la composici
on de aplicaciones lineales es lineal. Mas concretamente, si f : Rn Rm y g : Rm Rl
son dos aplicaciones lineales determinadas respectivamente por las matrices
A = (aij ) y B = (bjk ), entonces es facil ver que f g es la aplicacion lineal
determinada por la matriz C = (cil ) dada por
cil =

aij bjl .

j=1

De esta expresion deducimos en particular una f


ormula para las derivadas
parciales de una funci
on compuesta:
Teorema 6.55 Si f : D Rn Rm es una funci
on diferenciable en un
punto p D y g : E Rm R es diferenciable en f (p) E, entonces



m

(f g) 
g 
fj 
=
.
xi 
xj 
xi 
p

j=1

f (p)

6.4. Derivadas y diferenciales

205

Basta tener en cuenta la expresion de la matriz jacobiana de una funci


on
diferenciable. La f
ormula anterior se enuncia de forma m
as natural si llamamos
a las funciones y(x) (en lugar de f ) y z(y) (en lugar de g), de modo que la
funci
on compuesta es z(x) = z(y(x)). La regla de la cadena arma entonces
que
m

z
z yj
=
,
xi
y
j xi
j=1
donde las derivadas de z(x) e yj (x) se eval
uan en un punto x D y las de z(y)
se eval
uan en y = y(x).
En particular, la regla de la cadena implica que la composici
on de funciones
de clase C 1 es de clase C 1 , pues la relaci
on entre las derivadas parciales muestra
que las derivadas de la funci
on compuesta tambien son continuas. Un razonamiento inductivo muestra ahora que la composici
on de funciones de clase C k es
k
de clase C (ya que, obviamente, una funci
on es de clase C k+1 si y solo si tiene
k
derivadas parciales de clase C , y la suma y el producto de funciones de clase
C k es obviamente de clase C k ). Finalmente, esto implica que la composicion de
funciones de clase C es de clase C .
Teorema 6.56 (Teorema de Schwarz) Si f : D Rn R es una funci
on
de clase C 2 en un punto p D, entonces


2 f 
2 f 
=
para i, j = 1, . . . , n.
xi xj p
xj xi p
n: No perdemos generalidad si suponemos que n = 2. Sea
Demostracio
p = (a, b). Llamamos
2 f (h) = f (a + h, b + h) f (a, b + h) f (a + h, b) + f (a, b).
Basta probar que si h > 0 es un innitesimo entonces

2 f 
2 f (h)

.
xy (a,b)
h2
Si G(x) = f (x, b+h)f (x, b), tenemos que 2 f (h) = G(a+h)G(a). Podemos aplicar el teorema del valor medio a G, de modo que existe un innitesimo
0 < h1 < h tal que


f 
f 
2

f (h) = hG (a + h1 ) = h
h
.
x (a+h1 ,b+h)
x (a+h1 ,b)

f 
Si ahora aplicamos el teorema del valor medio a la funci
on
obx (a+h1 ,x)
tenemos un innitesimo 0 < h2 < h tal que

2 f 
2 f (h) = h2
.
xy (a+h1 ,b+h2 )

206

Captulo 6. C
alculo diferencial de varias variables
As pues, usando la continuidad de la derivada segunda,


2 f (h)
2 f 
2 f 
=

.
h2
xy (a+h1 ,b+h2 )
xy (a,b)

Terminamos la seccion demostrando la versi


on para funciones de varias variables del teorema 3.22. La prueba que vamos a dar requiere el concepto de
norma de una aplicaci
on lineal:
Si : Rn R es una aplicaci
on lineal, claramente es continua, y tambien
lo es || y la restriccion de || a la esfera unitaria
S = {x Rn | x = 1}.
Como la esfera es compacta, el teorema 6.37 nos da que existe un punto en S
donde || toma su valor m
aximo. Llamaremos norma de a este valor maximo,
y lo representaremos por .
De este modo, si x Rn es un vector arbitrario no nulo, se cumple que
x/x S, luego |(x/x)| . Como es lineal, esto equivale a que
|(x)/x|  o, equivalentemente, a:
|(x)| x.
Evidentemente, esta desigualdad es v
alida para todo x Rn , incluido x = 0.
Teorema 6.57 (De la funci
on inversa) Sea f : D Rn Rn una aplicaci
on estrictamente diferenciable en un punto p D. Si dp f es biyectiva
entonces existe un entorno U de p contenido en D tal que f [U ] es un entorno
de f (p), la restricci
on de f a U es biyectiva y su inversa es estrictamente diferenciable en f (p).
n: Podemos suponer que f y p son estandar. Veamos que f
Demostracio
biyecta el halo de p con el halo de f (p). De aqu se sigue ya la existencia de
U (en principio un entorno contenido en h(p), que por transferencia podemos
convertir en un entorno est
andar). S
olo quedar
a demostrar la diferenciabilidad
de la inversa.
En primer lugar, si x, x h(p) son distintos, la diferenciabilidad estricta
implica que
f (x) f (x )
dp f (x x )

.
(6.1)
x x 
x x 


xx
Como el vector xx
  tiene norma 1 y dp f es biyectiva (y su inversa es una
aplicaci
on lineal, luego continua), su imagen no puede ser innitesimal, luego
f (x) = f (x ).
Tomemos ahora y h(f (p)) y veamos que tiene antiimagen en h(p). Para
ello denimos la sucesion

x0 = p,

xn+1 = xn + dp f 1 (y f (xn )).

6.4. Derivadas y diferenciales

207

Para que esta sucesion este bien denida es necesario que cada xn este en el
dominio de f . De hecho xn h(p), pues, si vale para n, tenemos que
xn+1 xn  = dp f 1 (y f (xn )) dp f 1  y f (xn ),

(6.2)

luego tambien vale para n + 1.


Si f (xn ) = y para alg
un n, ya tenemos una antiimagen para y. Podemos
suponer que no se da el caso, con lo que xn+1 = xn . Vamos a demostrar la
relacion siguiente:
xn+1 xn 

1
dp f 1  y f (p).
2n

En efecto, tenemos que y = f (xn ) + dp f (xn+1 xn ), luego


f (xn+1 ) y
f (xn+1 ) f (xn ) dp f (xn+1 xn ) xn+1 xn 
=
.
f (xn ) y
xn+1 xn 
dp f (xn+1 xn )
El primer cociente es innitesimal por la diferenciabilidad estricta de f en
p, el segundo es nito porque es el inverso de la norma del valor de dp f sobre
un vector de norma 1. Por consiguiente el miembro izquierdo es innitesimal.
En particular
1
f (xn+1 ) y f (xn ) y.
2
Usando (6.2) llegamos a que
xn+1 xn  dp f 1  y f (xn )

1
dp f 1  y f (xn1 )
2

1
dp f 1  y f (p).
2n

De esta relacion se sigue claramente que la sucesion {xn } es de Cauchy,


luego converge a un punto x. Tomando lmites en la denici
on de xn queda que
y = f (x).
Ahora sabemos que f es inyectiva en un entorno est
andar de p, por lo que
tiene una inversa est
andar f 1 , que podemos considerar de nuevo restringida
sobre el halo de f (p).
Para probar que f 1 es estrictamente diferenciable en f (p) tomamos dos
puntos y, y  h(f (p)), que ser
an de la forma y = f (x), y  = f (x ). Seg
un (6.1)
tenemos que
y y
dp f (x x )

.
x x 
x x 
De aqu se sigue en particular que el cociente
x x 
y y  

208

Captulo 6. C
alculo diferencial de varias variables

es nito, pues su inverso es dp f actuando sobre un vector unitario. Adem


as
(dp f )1 (y y  )
x x

,

x x 
x x 
luego

(dp f )1 (y y  )
x x
f 1 (y) f 1 (y  )

=
,


y y 
y y 
y y  

lo que prueba la diferenciabilidad estricta de f 1 en f (p) (con diferencial igual


a (dp f )1 ).
En las condiciones del teorema anterior, si suponemos adem
as que f es de
clase C 1 en D, en particular es de clase C 1 en U , luego estrictamente diferenciable en todos los puntos de U . Si dp f es biyectiva en todos los puntos de
U , el teorema anterior puede aplicarse en todos ellos para concluir que f 1 es
estrictamente diferenciable en todo f [U ], luego es de clase C 1 en f [U ].

6.5

El teorema de la funci
on implcita

En esta seccion y en la siguiente demostraremos algunos resultados que requieren que el lector este familiarizado con los resultados b
asicos del algebra
lineal (espacios vectoriales, bases, matrices, determinantes, etc.)
Como una primera muestra elemental de las posibilidades de aplicar el
lgebra lineal al c
a
alculo diferencial, observamos que la condici
on de que dp f
sea biyectiva en el teorema de la funcion implcita equivale a que el determinante jacobiano de f en p, es decir, el determinante de la matriz jacobiana
|Jf (p)| sea no nulo.
Si suponemos que f es de clase C 1 en su dominio, entonces |Jf (x)| es una
funci
on continua, por lo que el hecho de que sea no nula en un punto implica que
es no nula en un entorno de dicho punto, luego siempre podemos encontrar un
entorno U que cumple el teorema de la funci
on inversa (para un punto dado p)
tal que el teorema es aplicable en todos los puntos de U , de modo que, tal y
como indic
abamos al nal de la seccion anterior, la funci
on inversa f 1 es de
clase C 1 en todo el abierto f [U ].
M
as a
un, aplicando la regla de la cadena a la composici
on f f 1 = I (donde
n
I representa la funci
on identidad en R ), obtenemos que, si y = f (x),
Jf (x) Jf 1 (y) = In ,
donde In es la matriz identidad o, lo que es lo mismo:
Jf 1 (y) = (Jf (x))1 ,
para todo x U (o, equivalentemente, para todo y f [U ]). M
as explcitamente,
Jf 1 (y) =

1
|Jf (f 1 (y))|

% (f 1 (y)),
Jf

6.5. El teorema de la funci


on implcita

209

donde la tilde representa la matriz adjunta, cuyos coecientes dependen polin


omicamente de los coecientes de Jf . Esto prueba que las derivadas parciales de f 1 se expresan en cada punto y f [U ] como cociente de polinomios en
las derivadas parciales de f (compuestas con f 1 ). Por consiguiente, si f es de
clase C k , sus derivadas parciales son de clase C k1 , luego las derivadas parciales
de f 1 tambien son de clase C k1 , luego f 1 es de clase C k . Obviamente, esto
es igualmente valido si f es de clase C . En denitiva, tenemos la siguiente
variante del teorema de la funci
on inversa:
Teorema 6.58 (De la funci
on inversa) Sea f : D Rn Rn una aplik
caci
on de clase C en el abierto D. Si p D cumple que dp f es biyectiva,
entonces existe un entorno U de p contenido en D tal que f [U ] es un entorno
de f (p), la restricci
on de f a U es biyectiva y su inversa es de clase C k en f [U ].
Veamos un ejemplo que ilustra el resultado central de esta seccion:
Ejemplo

Consideremos la ecuacion xey + yex = 1.


1

La gura muestra los puntos que cumplen la ecuaci


on (para 0 x 2). Vemos
que, para cada valor de x, existe un u
nico valor y(x) tal que el punto (x, y(x))
cumple la ecuacion. En estas circunstancias, se dice que la ecuacion dene a y
como funci
on implcita de x.
Si la ecuaci
on hubiera sido, por ejemplo, xy = 1, entonces la funci
on y(x)
sera y(x) = 1/x, es decir, la funci
on que resulta de despejar y en la ecuacion.
Teoricamente, la situacion es la misma, salvo que en la pr
actica no es posible
despejar y en la ecuacion dada. Por ello, sin apoyarnos en la gura, no sabemos,
en principio, c
omo justicar la existencia de la funci
on y(x) y, aun admitiendo
su existencia, no sabemos como justicar, por ejemplo, que es derivable.
El teorema de la funci
on inversa nos permite resolver estos problemas, con
la ayuda de un truco: consideramos la funci
on F : R2 R2 dada por
F (x, y) = (x, xey + yex 1).
Claramente es de clase C en R2 y su matriz jacobiana es


1 ey + yex
JF =
.
0 xey + ex
Podemos aplicarle el teorema de la funci
on inversa, por ejemplo, en el punto
(1, 0), donde JF (1, 0) = 1 = 0. Observemos que F (1, 0) = (1, 0). Esto nos da

210

Captulo 6. C
alculo diferencial de varias variables

una funci
on inversa G(u, v) = (G1 (u, v), G2 (u, v)) de clase C en un entorno U
de (1, 0). As pues, F (G(u, v)) = 0 para todo (u, v) U . Explcitamente:
G1 (u, v) = u,

G1 (u, v)eG2 (u,v) + G2 (u, v)eG1 (u,v) 1 = v.

En particular, esto vale para los puntos (u, v) = (x, 0) con x 1, lo que nos
da
xeG2 (x,0) + G2 (x, 0)ex = 1.
Si llamamos y(x) = G2 (x, 0) tenemos una funci
on (estandar) denida para
todo x 1, de clase C , tal que xey(x) + y(x)ex = 1. Por transferencia, y esta
denida en un entorno est
andar de 1, y es, obviamente, la funci
on cuya gr
aca
hemos mostrado antes. Ahora sabemos que es de clase C (en un entorno de 1).
Observemos que si (x, y) (1, 0) cumple la ecuacion, entonces (x, y) G[U ],
luego existe un (u, v) U tal que (x, y) = G(u, v), luego F (x, y) = (u, v), luego
u = x y v = xey + yex 1 = 0, luego y = G2 (x, 0) = y(x).
Esto signica que la gr
aca de y contiene a todos los puntos que cumplen la
ecuacion dada y que est
an innitamente pr
oximos a (1, 0). Por transferencia,
contiene a todos los puntos que cumplen la ecuaci
on dada y que est
an en un
entorno (est
andar) de (1, 0).
El teorema de la funci
on implcita es la generalizacion del ejemplo anterior
al caso de un n
umero arbitrario de ecuaciones:
Teorema 6.59 (Teorema de la funci
on implcita) Consideremos una funci
on f : D Rn+m Rm de clase C k en el abierto D, sea (x0 , y0 ) D tal que
f (x0 , y0 ) = 0 (donde se ha de entender que x0 Rn , y0 Rm ). Supongamos que
el determinante de las las de la matriz jacobiana Jf (x0 , y0 ) correspondientes
a las coordenadas y0 es no nulo. Entonces existen:
a) un abierto U Rn que contiene a x0 ,
b) un abierto V Rn+m que contiene a (x0 , y0 ),
c) una funci
on y : U Rn+m de clase C k en U ,
de modo que
{(x, y) V | f (x, y) = 0} = {(x, y) Rn+m | x U, y = y(x)}.
n: Consideramos la funci
Demostracio
on F : D Rn+m dada por
F (x, y) = (x, f (x, y)). Es claro que es de clase C k y que su matriz jacobiana en
(x0 , y0 ) es de la forma


In A
JF (x0 , y0 ) =
,
0 B
donde los bloques A y B son la matriz Jf (x0 , y0 ) y, concretamente, B es la
matriz cuyo determinante es no nulo por hip
otesis. Las propiedades de los
determinantes implican que |JF (x0 , y0 )| =
 0.

6.5. El teorema de la funci


on implcita

211

El teorema de la funci
on inversa nos da un abierto V que contiene a (x0 , y0 )
tal que W = F [V ] es abierto, contiene a F (x0 , y0 ) = (x0 , 0), F : V W es
biyectiva y su inversa G : W V es de clase C k en W .
Denimos U = {x Rn | (x, 0) W }, que es un abierto en Rn porque es
la antiimagen de W por la aplicaci
on continua x  (x, 0). Como (x0 , 0) W ,
tenemos que x0 U . Denimos y : U Rm mediante y(x) = G2 (x, 0).
Claramente y es de clase C k en U .
Ahora comprobamos que se cumple todo lo que indica el enunciado:
Si x U e y = y(x), por denici
on de U tenemos que (x, 0) W , luego
G(x, 0) V , pero

 

G(x, 0) = x, G2 (x, 0) = x, y(x) = (x, y).




Ademas (x, 0) = F G(x, 0) = F (x, y) = x, f (x, y) , luego f (x, y) = 0.
Recprocamente, si (x, y) V y f (x, y) = 0 entonces


F (x, y) = x, f (x, y) = (x, 0) W,



 

luego x U y (x, y) = G F (x, y) = G(x, 0) = x, G2 (x, 0) = x, y(x) , con lo
que y(x) = y.
En otros terminos, si llamamos
S = {(x, y) D | f (x, y) = 0},
tenemos un conjunto denido por un sistema de m ecuaciones de clase C k , y
lo que arma el teorema anterior es que si un punto (x0 , y0 ) S cumple la
hip
otesis, entonces existe un entorno abierto de (x0 , y0 ) en S (el conjunto S V ,
con la notaci
on del teorema) que es la graca de una funci
on de clase C k , la
funci
on implcita denida por el sistema de ecuaciones (para una determinada
eleccion de variables).
A menudo sucede que no importa cu
ales son concretamente las variables y
que se ponen en funci
on de las variables x. En tal caso, observamos que la
condici
on de que la matriz jacobiana Jf (p) contenga un determinante no nulo
(sin especicar cual) equivale a que la matriz tenga rango m o, lo que es lo
mismo, a que la diferencial dp f : Rn+m Rm sea suprayectiva. Esto nos lleva
a la denici
on siguiente:
Denici
on 6.60 Sea f : D Rd Rm una funci
on de clase C k en un abierto
D, donde d > m y sea S = {x D | f (x) = 0}. Diremos que un punto p S es
regular si dp f : Rd Rm es suprayectiva. Diremos que S es regular si lo es en
todos sus puntos.
Si p es regular en S, el teorema de la funci
on implcita nos asegura que existe
un entorno de p en S que es la graca de una funci
on de clase C k con n = m d
variables.

212

Captulo 6. C
alculo diferencial de varias variables

6.6

Optimizaci
on cl
asica

Consideremos dos funciones f : D Rn R, g : D Rn Rm y


on cl
asica determinado por estos datos
un b Rm . El problema de optimizaci
consiste en encontrar los puntos donde la funci
on objetivo f toma su valor
maximo o mnimo sobre el conjunto de oportunidades
S = {x D | g(x) = b}.
A menudo se formula como
Opt.
s.a

f (x)
g1 (x) = b1 ,

gm (x) = bm ,

(lease optimizar la funci


on f (x) sujeta a las restricciones gi (x) = bi ).
Usamos la palabra
optimo para referirnos a m
aximos y mnimos indistintamente. Cuando, especcamente, se busca el maximo o el mnimo de la funci
on
objetivo, se habla de maximizar o minimizar f (x), respectivamente.
Vamos a dar condiciones necesarias que un punto x D sea un optimo de f
sobre S. En general, las condiciones no ser
an sucientes, ya que, por ejemplo,
las cumplir
a cualquier punto que sea meramente un
optimo local, en el sentido
que denimos a continuaci
on:
Denici
on 6.61 Si f : M R es una funci
on estandar denida sobre un
espacio metrico M , diremos que f tiene un m
aximo local (resp. un mnimo
local) en un punto est
andar p M si f (p) f (x) (resp. f (p) f (x)) para todo
x M tal que x p.
Obviamente, si f alcanza en M un valor m
aximo o mnimo (global), este
sera en particular un m
aximo o mnimo local.
Es inmediato que si M es un abierto en Rn y f es derivable, una condici
on
necesaria para que f pueda tener un extremo local en p es que f (p) = 0, ya
que si, por ejemplo,

f 
> 0,
xi 
p

tomando un innitesimo h > 0, el punto x = (p1 , . . . , pi + h, . . . , pn ) M


cumplira x p y f (x) > f (p), luego f no tendra un m
aximo local en p, y
el punto x = (p1 , . . . , pi h, . . . , pn ) M cumplira x M y f (x ) < f (p),
luego f tampoco tendra un mnimo local en p. Si la derivada fuera negativa se
invertiran las desigualdades, pero la conclusi
on es la misma.
El teorema de la funci
on implcita nos permite generalizar esta condicion
necesaria al caso en que M es un conjunto denido por una o varias restricciones:

6.6. Optimizaci
on cl
asica

213

Teorema 6.62 Sea g : D Rd Rm una funci


on de clase C 1 en un abierto
D, donde d > m, sea S = {x D | g(x) = 0}, sea p D un punto regular y sea
f : S R una funci
on de clase C 1 . Entonces, si f tiene un
optimo local en
el punto p, existe un Rm tal que
f (p) = 1 g1 (p) + + m gm (p).
n: Como p es regular, existe una funci
Demostracio
on y : U Rm de
1
clase C y un abierto V D, de modo que p = (x0 , y0 ) V , x0 U , y0 = y(x0 )
y
S V = {(x, y) Rn+m | x U, y = y(x)}.
Si x x0 , entonces x U , luego (x, y(x)) S, (x, y(x)) (x0 , y0 ) = p,
aximo local en
luego f (x, y(x)) f (p) = f (x0 , y(x0 )) (si es que f tiene un m
p) o f (x, y(x)) f (p) = f (x0 , y(x0 )) (si es que f tiene un mnimo local en p).
En cualquiera de los dos casos, vemos que la funci
on f (x, y(x)) tiene un optimo
local en x0 , luego, por la discusi
on previa al teorema, sus derivadas son nulas.
Las calculamos con la regla de la cadena:



m

f 
f  dyj 
+
= 0,
xi p j=1 yj p dxi x0

i = 1, . . . , n.

Equivalentemente, f (p) es solucion del sistema n de ecuaciones lineales con


m + n inc
ognitas cuya matriz es
 

dy 
In dxji 
.
x0

Como la matriz tiene rango n, sus soluciones forman un subespacio vectorial


de Rn+m de dimensi
on m. Por otra parte, todo x U cumple g(x, y(x)) = 0.
Derivando esta igualdad con la regla de la cadena obtenemos



m

gk 
gk  dyj 
+
= 0,
xi p j=1 yj p dxi x0

i = 1, . . . , n, k = 1, . . . , m.

Equivalentemente los vectores gk (p) tambien son soluciones del mismo sistema de ecuaciones que f (p), pero la regularidad de p equivale a que estos m
vectores son linealmente independientes, luego forman una base del espacio de
soluciones del sistema de ecuaciones, por lo que f (p) ha de ser combinacion
lineal de ellos, tal y como indica el enunciado.
En la pr
actica, la condici
on del teorema anterior puede aplicarse a un problema de optimizacion cl
asica
Opt.
s.a

f (x)
g1 (x) = b1 ,

gm (x) = bm ,

214

Captulo 6. C
alculo diferencial de varias variables

tomando como funci


on g(x) la que tiene por funciones coordenadas las funciones
gj (x) bj . A menudo es u
til reformularla en terminos de la llamada funci
on
lagrangiana del problema, denida como
L(x, ) = f (x) +

j (bj gj (x)).

j=1

Un punto crtico del problema es un punto p D para el que existe un vector


Rm que cumpla las condiciones de Lagrange:
L(p, ) = 0.
Decimos condiciones, en plural, porque habitualmente se expresan en
terminos de las derivadas parciales de la funci
on lagrangiana. Observemos que
las condiciones

L 
= 0,
j = 1, . . . , m,
j (p,)
equivalen a bj gj (p) = 0, es decir, a que p pertenezca al conjunto de oportunidades, mientras que las condiciones

L 
= 0,
i = 1, . . . , n
xi (p,)
equivalen a que f (p) sea combinacion lineal de los vectores gj (p) (con coecientes j ). As pues, el teorema anterior puede enunciarse como sigue:
Teorema 6.63 (Condiciones necesarias de Lagrange) Dado un problema
de optimizaci
on cl
asica denido por funciones de clase C 1 , si p es un punto
regular de su conjunto de oportunidades y es un extremo local del problema,
entonces es un punto crtico, es decir, satisface las condiciones de Lagrange.
Alternativamente, si tenemos un problema de optimizaci
on cl
asica cuyo conjunto de oportunidades es regular, entonces sus extremos locales son necesariamente puntos crticos del problema.
Ejemplo Determinar las dimensiones que ha de tener una caja (sin tapa)
para que tenga el volumen m
aximo de entre todas las posibles con una misma
supercie dada.

z
x

Llamemos x, y, z a las dimensiones de la caja, de modo


que su volumen ser
a xyz y su supercie xy + 2xz + 2yz. El
problema que queremos resolver es maximizar el volumen
sujeto a que la supercie sea igual a un valor jo S, es
decir:
Max. xyz
s.a xy + 2xz + 2yz = S.

6.6. Optimizaci
on cl
asica

215

Consideramos las funciones denidas en D = ]0, +[ ]0, +[ ]0, +[. El


conjunto de oportunidades es regular, pues el gradiente de la restricci
on es
g = (y + 2z, x + 2z, 2x + 2y),
que no se anula en ning
un punto de D. Por lo tanto, las dimensiones que
maximizan el volumen han de ser un punto crtico del problema. La funci
on
lagrangiana es
L(x, y, z, ) = xyz + (S xy 2xz 2yz),
luego las condiciones de Lagrange son:
L
= yz (y + 2z) = 0
x
L
= xz (x + 2z) = 0,
y
L
= xy 2(x + y) = 0
z
L
= S xy 2xz 2yz = 0.

De las dos primeras ecuaciones obtenemos:


yz
xz
=
=
,
y + 2z
x + 2z
de donde xyz + 2yz 2 = xyz + 2xz 2 , luego x = y. Similarmente, de la primera y
la tercera deducimos
yz
xy
=
=
,
y + 2z
2x + 2y
luego 2xyz + 2y 2 z = xy 2 + 2xyz, luego x = 2z. Con esto, la u
ltima ecuacion se
reduce a 12z 2 = S, luego las dimensiones de la caja resultan ser:
# 
 $
S
S 1 S
(x, y, z) =
,
,
.
3
3 2 3
En esencia: La caja ha de tener base cuadrada y altura igual a la mitad del
lado de la base.
Observemos que, por el planteamiento del problema, es evidente que ha de
haber una caja de volumen m
aximo, luego este maximo ha de ser el punto crtico
que hemos obtenido. No obstante, vamos a justicar formalmente que el punto
es un maximo. Para ello consideramos el conjunto
S = {(x, y, z) R3 | xy + 2xz + 2yz = S, x 0, y 0, z 0}.
Claramente es compacto, luego la funcion continua f (x, y, z) = xyz debe
alcanzar su valor m
aximo en un punto p de este conjunto, y dicho m
aximo no
puede tener ninguna coordenada nula, pues en tal caso f (p) = 0 y hay puntos de
S donde f es positiva. As pues, p S D, que es el conjunto de oportunidades
del problema que hemos resuelto, luego ha de ser un m
aximo local de f en S D,
luego ha de ser el punto crtico que hemos encontrado.

216

Captulo 6. C
alculo diferencial de varias variables

Ejemplo La luz se mueve a una velocidad distinta a traves de cada sustancia


que atraviesa. La lnea horizontal de la gura representa la frontera entre dos
sustancias, de modo que la luz se mueve a una velocidad v1 en la primera y a
una velocidad v2 en la segunda.
d
P
Un rayo de luz se mueve desde P hasta Q. Al
pasar de una sustancia a otra se desva por refracci
on.
a
1
ngulo de incidencia (el a
ngulo que
Llamamos 1 al a
forma el rayo incidente con la vertical) y 2 al a
ngulo
2 b
de refracci
on (el a
ngulo que forma el a
ngulo refractado
on
Q con la vertical). Deducir la relaci
sen 1
sen 2
=
v1
v2
a partir del principio seg
un el cual la luz viaja de P a Q por el camino que
minimiza el tiempo necesario para ello.
La distancia desde P hasta el punto donde se produce la refracci
on es
a/ cos 1 , y la distancia de este a Q es b/ cos 2 , luego el tiempo que tarda
la luz en llegar desde P hasta Q es
a
b
+
.
v1 cos 1
v2 cos 2
Para que los angulos 1 y 2 lleven desde P hasta Q hay que exigir que
a tan 1 + b tan 2 = d. Por lo tanto, el camino que minimiza el tiempo es
soluci
on del problema:
Min.
s.a

a
b
+
v1 cos 1
v2 cos 2
a tan 1 + b tan 2 = d,

donde consideramos las funciones denidas en ]0, /2[ ]0, /2[. El conjunto de
oportunidades es regular, pues el gradiente de la restricci
on es


a
b
,
,
cos2 1 cos2 2
que no se anula en ning
un punto. La funci
on lagrangiana es
L(1 , 2 , ) =

a
b
+
+ (d a tan 1 b tan 2 ).
v1 cos 1
v2 cos 2

Las condiciones de Lagrange son:


L
a sen 1
a
=

= 0,
1
v1 cos2 1
cos2 1

L
b sen 2
b
=

= 0,
2
v2 cos2 2
cos2 2

L
= d a tan 1 b tan 2 = 0.

6.6. Optimizaci
on cl
asica

217

Las dos primeras ecuaciones nos dan


sen 1
sen 2
==
,
v1
v2
como haba que probar.

Captulo VII

C
alculo integral de varias
variables
f (x, y)

C
la integral

En este captulo deniremos la integral de una


funci
on de varias variables, cuya interpretaci
on es
an
aloga a la que ya conocemos para funciones de
una variable. Por ejemplo, si f (x, y) es una funci
on
de dos variables cuya gr
aca es la que muestra la
gura y C es el crculo (contenido en su dominio)
tambien representado en la gura, queremos denir

f (x, y) dxdy
C

de modo que sea igual al volumen comprendido entre el crculo y la gr


aca (la
suma del volumen del cilindro y de la c
upula que la gr
aca forma sobre el).

7.1

Resultados b
asicos

La denici
on de la integral de Riemann de una funci
on de varias variables es
la generalizacion obvia de la que hemos visto en el captulo IV para funciones de
una variable. La teora b
asica es completamente analoga, salvo que la notaci
on
es un poco mas farragosa. En esta primera seccion expondremos esta teora
b
asica que sigue de cerca los resultados del captulo IV, mientras que en las
secciones siguientes nos ocuparemos de los resultados especcos del calculo
integral de varias variables.
En lugar de integrar funciones en intervalos, aqu vamos a integrar funciones
en cubos:
Un cubo en Rd es un producto de intervalos
Q = [a1 , b1 ] [ad , bd ] Rd .
219

220

Captulo 7. C
alculo integral de varias variables
Su volumen es

v(Q) =

(bj aj ).

j=1

Una partici
on P de un cubo Q es una d-tupla P = (P1 , . . . , Pd ), donde cada
Pj = {aj = x0j < x1j < < xnj ,j = bj }
es una partici
on de [aj , bj ]. El conjunto de los multindices asociados a P sera
el conjunto
IP = {(i1 , . . . , id ) Nd | 1 ij nj para todo j = 1, . . . , d}.
Para cada i IP , denimos
Qi = [xi1 1,1 , xi1 ,1 ] [xid 1,d , xid ,d ].
De este modo, la particion P divide a Q en n1 nd cubos Qi . Cada punto
de Q pertenece a lo sumo a 2d de los cubos Qi .
Si i IP , denimos xij = xij ,j xij1 ,j . Convenimos tambien que
xi = xi1 xid = v(Qi ).
La norma de la partici
on P es el maximo P  de las longitudes xij , para
i IP , j = 1, . . . , d. Una partici
on es innitesimal si su norma es innitesimal.
Sea f : Q R una funci
on acotada, es decir, (en caso de que sea estandar
estandar) tal que s
olo toma valores nitos o (en general) tal que su imagen est
a
contenida en un intervalo acotado [m, M ].
Para cada i IP , podemos denir mi y Mi como el nmo y el supremo,
respectivamente, de los valores que toma f sobre el cubo Qi .
Denimos las sumas de Riemann:

s(f, P ) =
mi xi ,

S(f, P ) =

iIP

Mi xi .

iIP

Si P y P  son dos particiones de Q escribiremos P P  en el sentido de que,


para todo j = 1, . . . , d, se cumple que P P  .
Empezaremos generalizando el teorema 4.2:
Teorema 7.1 Sea f : Q Rd R una funci
on acotada sobre un cubo y sean
umero de puntos de las particiones de
P P  dos particiones de Q. Sea r el n
P  que no est
an en la partici
on correspondiente de P . Entonces
s(f, P ) s(f, P  ) s(f, P ) + KrP ,
S(f, P ) S(f, P  ) S(f, P ) KrP ,
donde K es una constante que s
olo depende de Q y de f .

7.1. Resultados b
asicos

221

n: Lo probamos por inducci


Demostracio
on sobre r. Supongamos primeramente que r = 1, es decir, que solo una de las particiones Pj diere de la
partici
on correspondiente de P , y que diere en un u
nico punto. Por simplicidad supondremos que j = d, de modo que Pd = Pd {x} y, m
as concretamente,
xi0 1,d < x < xi0 d .
Entonces, los cubos en que P divide a Q son los mismos determinados por
P  , salvo en el caso de los correspondientes a los multindices i IP tales que
id = i0 . Para estos multindices, el cubo Qi se corresponde con dos cubos de
on estandar que hemos introducido, podemos
P  , que, abandonando la notaci
2
llamar Qi = Q1

Q
,
de
modo
que
i
i
Q1
i = [xi1 1,1 , xi1 ,1 ] [xid1 1,d1 , xid1 ,1 ] [xid 1,d , x],
Q2
i = [xi1 1,1 , xi1 ,1 ] [xid1 1,d1 , xid1 ,1 ] [x, xid ,d ].
De este modo, s(f, P  ) s(f, P ) =
n1

d1

xi1 xi,d1 (m1i (xxi0 1,d )+m2i (xi0 ,d x)mi (xi0 ,d xi0 1,d )).

i1 =1 id1 =1

Como los cubos Qk


nmos mki son mayores o
i son menores, es claro que los
iguales que mi , luego
m1i (x xi0 1,d ) + m2i (xi0 ,d x) mi (xi0 ,d xi0 1,d ) 0,
de donde tambien s(f, P  ) s(f, P ) 0. Por otra parte,
m1i (x xi0 1,d ) + m2i (xi0 ,d x) mi (xi0 ,d xi0 1,d ) =
(m1i mi )(x xi0 1,d ) + (m2i mi )(xi0 ,d x) 2M P ,
donde M es una cota de f en Q. Por lo tanto,
s(f, P  ) s(f, P )

n1

d1

xi1 xi,d1 2M P 

i1 =1 id1 =1

(b1 a1 ) (bd1 ad1 )2M P  KP ,


donde
K = 2M

max{bj aj , 1}.

j=1

A partir de aqu, la conclusi


on es identica a la del teorema 4.2.
La prueba de 4.3 es v
alida sin cambio alguno, de modo que toda suma inferior
de f es menor o igual que toda suma superior de f (aunque las particiones sean
distintas).
Denici
on 7.2 Sea f : Q Rd R una funci
on acotada en un cubo. Denimos la integral inferior y la integral superior de Darboux como

f (x) dx = sup s(f, P ),
Q


f (x) dx = nf S(f, P ).
Q

222

Captulo 7. C
alculo integral de varias variables

Las integrales inferior y superior existen, porque el conjunto de las sumas


inferiores esta acotado superiormente por cualquier suma superior, y viceversa,
lo que implica tambien que



f (x) dx f (x) dx.

El teorema siguiente se demuestra exactamente igual que 4.5:


Teorema 7.3 Sea f : Q Rd R una funci
on est
andar acotada en un
cubo Q. Si P es una partici
on innitesimal de Q, entonces

S(P, f ) f (x) dx.


s(P, f )

f (x) dx,
Q

Denici
on 7.4 Una funci
on f : Q Rd R acotada en un cubo Q es
integrable (Riemann) si su integral inferior coincide con su integral superior,
en cuyo caso, a este valor com
un se le llama integral (de Riemann) de f , y se
representa por



f (x) dx = f (x) dx = f (x) dx.
Q
Q
Q
Evidentemente:
Teorema 7.5 Sea f : Q Rd R una funci
on est
andar acotada en un cubo
Q y sea P una partici
on innitesimal de Q. Entonces, la funci
on f es integrable
si y s
olo si s(P, f ) S(P, f ), en cuyo caso, la integral es la parte est
andar de
estas sumas.
Los resultados siguientes se prueban esencialmente igual que los vistos en el
captulo 4 para funciones de una variable:
Teorema 7.6 Si f y g son funciones integrables en un cubo Q y R, tambien
son integrables f + g, f g, f y |f |. Adem
as:


 b
(f (x) + g(x)) dx =
f (x) dx +
g(x) dx,
Q

f (x) dx =

f (x) dx,


 


 f (x) dx
|f (x)| dx.


Q

Si f (x) g(x) para todo x [a, b], se cumple que




f (x) dx
g(x) dx.
Q

7.2. Dominios de integraci


on

223

Teorema 7.7 Sea f : Q Rd R una funci


on est
andar integrable en un
cubo Q, sea P una partici
on innitesimal y sea {yi }iIP un conjunto de puntos
tales que yi Qi . Entonces


f (x) dx
f (yi )xi .
Q

iIP

Tambien es facil probar que toda funci


on continua es integrable, pero vamos a
necesitar resultados mas nos, de los que nos ocuparemos en la seccion siguiente.

7.2

Dominios de integraci
on

Hasta ahora hemos denido la integral de una funci


on sobre un cubo, pero
esto no incluye, por ejemplo, el caso considerado al principio del captulo, en el
que habl
abamos de la integral de una funci
on f sobre un crculo. En realidad,
esto se reduce al caso que ya conocemos sin mas que considerar la funci
on F que
coincide con f dentro del crculo y vale 0 fuera de el, pero el problema es que
F ya no es continua, aunque f lo sea, y por ello no nos basta con probar que
toda funci
on continua es integrable. Necesitamos un criterio de integrabilidad
mas general.
Denici
on 7.8 Sea f : D Rd R una funci
on acotada sobre un dominio
acotado D. Es claro entonces que existe un cubo Q tal que D Q Rd .
Diremos que f es integrable Riemann (en D) si la funci
on F : Q R dada
por

f (x) si x D,
F (x) =
0
si x Q \ D
es integrable Riemann (en Q), en cuyo caso denimos


f (x) dx =
F (x) dx.
D

Es f
acil ver que la integrabilidad de f y, en su caso, el valor de la integral,
no dependen de la elecci
on del cubo Q. En efecto, si D Q1 Q2 , entonces
Q1 Q2 tambien es un cubo, luego basta ver que si D Q1 Q2 , entonces
D es integrable respecto a Q1 si y solo si lo es respecto de Q2 . Ahora bien,
suponiendo los datos est
andar y tomando una partici
on innitesimal P de Q1 ,
podemos extenderla a una partici
on innitesimal P  de Q2 , y es claro que las
sumas de Riemann de las correspondientes funciones FQ1 y FQ2 son iguales.
on si la
Diremos que un conjunto acotado D Rd es un dominio de integraci
funci
on constante igual a 1 es integrable en D. En tal caso, denimos el volumen
de D como

v(D) =
dx.
D

Es f
acil ver que si D es un cubo, entonces el volumen as denido es el mismo
que ya tenamos denido antes.

224

Captulo 7. C
alculo integral de varias variables
Diremos que un dominio de integraci
on D es nulo1 si v(D) = 0.

Conviene denir la funci


on caracterstica de un conjunto D Rd como la
d
funci
on D : R R dada por

D(x) =

1
0

si x D,
si x
/ D.

En estos terminos, D es un dominio de integraci


on si y solo si D es integrable
en cualquier cubo que contenga a D.
El resultado fundamental sobre dominios de integraci
on es el siguiente:
Teorema 7.9 Un conjunto acotado D Rd es un dominio de integraci
on si y
s
olo si su frontera es nula.
n: Podemos suponer los datos estandar. Tomemos un cubo
Demostracio
(estandar) tal que D Q Rd . Podemos tomar el cubo sucientemente grande

como para que D Q . Esto implica que la frontera de D en Q es la misma


que la frontera de D en Rd .

Sea P una partici


on innitesimal de Q. Esta
divide a Q en una familia nita
de cubos {Qi }iIP . Sea I IP el conjunto de los multindices i IP tales que
Qi D = .

Observemos que Q = D D Q \ D luego, si i IP \ I, tenemos que

Qi = (Qi D ) (Qi \ D) y ambos conjuntos son abiertos disjuntos en Qi . Como

los cubos son conexos, o bien Qi D D, o bien Qi Q \ D Q \ D. En


ambos casos, la funcion D es constante en Qi , luego mi = Mi . Por consiguiente,

S(D, P ) s(D, P ) =
(Mi mi )xi .
iI

Si x D, entonces existe un i I tal que x Qi D. Supongamos que


Qi D. En tal caso, x Qi , ya que si Qi fuera un entorno de x, debera
cortar a Q \ D.
Notemos que la uni
on de todos los cubos Qi que contienen a x forma un
cubo mayor que tiene a x en su interior. Por lo tanto, debe cortar a Q \ D. En
denitiva, existe otro cubo Qi que tambien contiene a x pero que corta a Q \ D.
Similarmente, si hubieramos partido de que Qi Q \ D habramos llegado
igualmente a otro cubo Qi que tambien contendra a x pero cortando a D.
Sea I  I el conjunto de los multindices i tales que Qi corta a D y a
Q \ D. Acabamos de probar que
&
D
Qi .
iI 

1 Notemos que este concepto de conjunto nulo no coincide con el usual, en t


erminos de la
medida de Lebesgue. Por ejemplo, Q [0, 1] es un conjunto numerable que no es nulo en este
sentido, mientras que todo conjunto numerable es nulo para la medida de Lebesgue.

7.2. Dominios de integraci


on

225

Para i I  , tenemos que Mi mi = 1 0 = 1, luego

S(D, P ) s(D, P )
xi 0.
iI 

Si D es un dominio de integraci
on, el miembro izquierdo es innitesimal,
luego la suma intermedia tambien lo es. Ahora bien, todo i I corresponde a
un cubo Qi que toca a un cubo Qi con i I  , y cada cubo toca exactamente a
3d 1 cubos. Como la partici
on P la hemos elegido arbitrariamente, podemos
suponer que todos los cubos Qi tienen el mismo volumen. As

xi 3d
xi 0.
iI 

iI

Por lo tanto,
0 S(D, P ) s(D, P )

xi 0,

iI

lo que prueba que D es un dominio de integraci


on. M
as a
un,

0 s(D, P )
xi 0,
iI

luego D es nulo.
Recprocamente, si D es nula,

xi = S(D, P ) 0,
iI

luego
S(D, P ) s(D, P ) =

iI

(Mi mi )xi

xi 0,

iI

luego D es integrable.
Como consecuencia tenemos el u
nico criterio de integraci
on que necesitaremos en la pr
actica:
Teorema 7.10 Toda funci
on continua y acotada sobre un dominio de integraci
on es integrable.
n: Sea D Rd un dominio de integraci
Demostracio
on y f : D R una
funci
on continua y acotada. Podemos suponer todos los datos est
andar. Sea Q
un cubo est
andar tal que D Q Rd y sea F : Q R la extension de f a Q
que vale 0 en Q \ D. Sea P una partici
on innitesimal de Q y sea I el conjunto
de los multindices i IP tales que Qi D = . Como D es nulo, tenemos
que

xi = S(D, P ) 0,
iI

Fijado un n
umero estandar  > 0, el sumatorio es < , luego, por transferencia,
existe una partici
on estandar P  de Q tal que, si I  es el conjunto an
alogo a I

pero para P , se cumple que

xi < .
i I 

226

Captulo 7. C
alculo integral de varias variables

Ahora tomamos como particion innitesimal P un renamiento de P  , de


modo que todo cubo Qi determinado por P esta contenido en un cubo de P  .
Sea D D la uni
on de todos los cubos Qi (respecto de P  ) contenidos en
D. Se trata de un conjunto compacto est
andar.
Si Qi es un cubo innitesimal determinado por P y Qi D = , entonces,
o bien Qi D , o bien Qi esta contenido en uno de los cubos est
andar determinados por P  que corta a D. Llamemos I1 e I2 a los conjuntos de multindices
que estan en uno y otro caso, respectivamente.
Si i I1 y x1 , x2 Qi son los puntos donde F toma su valor m
aximo y
mnimo, por compacidad tenemos que x1 = x2 D D, luego F es continua
en este punto, luego Mi = F (x1 ) F ( x1 ) = F ( x2 ) F (x2 ) = mi . Sea
= mn(Mi mi ) 0.
iI1

Llamando M a una cota de F en D:

S(F, P ) s(F, P ) =
(Mi mi )xi +
(Mi mi )xi
iI1

xi + 2M

iI1

i I 

iI2

xi < v(Q) + 2M  < (2M + 1).

As, para todo  > 0 estandar, hemos demostrado que existe una partici
on
P tal que S(F, P ) s(F, P ) < (2M + 1), luego, por transferencia, esto vale
tambien para  0, en cuyo caso tenemos que s(F, P ) S(F, P ), luego F es
integrable.
La parte delicada del problema es reconocer los dominios de integraci
on. En
primer lugar probamos algunas propiedades generales:
Teorema 7.11 Si D1 y D2 son dominios de integraci
on en Rd , tambien lo son
D1 D2 , D1 D2 y D1 \ D2 .
n: Basta observar que
Demostracio
D

1 D2

= D1 D2 ,

D1 \D2 = D1 (1 D2 ),

D1 D2 = D2 + D1 \D2 .

Teorema 7.12 Todo subconjunto de un conjunto nulo es nulo.


n: Sea D1 un conjunto nulo y D2 D1 . Podemos supoDemostracio
nerlos estandar. Sea Q un cubo tal que D2 D1 Q y sea P una partici
on
innitesimal de Q. Entonces
0 s(D , P ) S(D , P ) S(D , P ) 0,
2
2
1
luego D2 es nulo.

7.2. Dominios de integraci


on

227

Teorema 7.13 Sean D1 , D2 Rd dos dominios de integraci


on y consideremos
una funci
on acotada f : D1 D2 R.
a) Si D1 es nulo, entonces f es integrable en D1 y

f (x) dx = 0.
D1

b) Si D1 D2 y f es integrable en D2 , tambien lo es en D1 .
c) f es integrable en D1 D2 si y s
olo si lo es en D1 y en D2 .
d) Si adem
as D1 D2 es nulo, entonces



f (x) dx =
f (x) dx +
D1 D2

D1

f (x) dx.

D2

n: Podemos suponer todos los datos estandar. Tomemos un


Demostracio
cubo estandar Q Rd que contenga a todos los dominios considerados. No
perdemos generalidad si suponemos que la funci
on f esta denida sobre todo Q
(extendiendola con el valor 0).
a) Sea P una partici
on innitesimal de Q y sea M una cota estandar de f .
Entonces
0 s(f D , P ) S(f D , P ) M S(D , P ) 0,
1

luego f D es integrable en Q, lo que equivale por denici


on a que f es integrable
1
en D1 , y la integral es nula.
b) Si f es integrable en D2 , entonces f D es integrable en Q, luego
2

f D = (f D )D
1
2
1
tambien es integrable en Q, luego f es integrable en D1 .
c) Si f es integrable en D1 D2 , entonces es integrable en D1 y D2 por el
apartado anterior. Si f es integrable en D1 y D2 , entonces tambien es integrable
en D2 \ D1 por el apartado anterior y, como
f D

1 D2

= f D + f D
1

2 \D1

concluimos que f es integrable en D1 D2 .




d) Tenemos que



f (x) dx =
(f D1 D2 )(x) dx =
(f D1 )(x) dx + (f D2 \D1 )(x) dx.

D1 D2

Similarmente,


(f D )(x) dx =
(f D
Q

2 \D1


)(x) dx +
Q

(f D

1 D2

)(x) dx,

228

Captulo 7. C
alculo integral de varias variables

y la u
ltima integral es nula por a), luego



f (x) dx =
(f D1 )(x) dx + (f D2 )(x) dx
D1 D2


=


f (x) dx +

D1

f (x) dx.
D2

De estas propiedades se deducen en particular propiedades an


alogas sobre
vol
umenes, como, por ejemplo, que si la interseccion D1 D2 es nula, entonces
v(D1 D2 ) = v(D1 ) + v(D2 ), etc.
Ejercicio: Probar que si D1 y D2 son dominios de integraci
on, entonces
v(D1 D2 ) = v(D1 ) + v(D2 ) v(D1 D2 ).

Ahora podemos generalizar ligeramente el teorema 7.10:


Teorema 7.14 Sea D Rd un dominio de integraci
on y f : D R una
funci
on acotada que sea continua en D salvo a lo sumo en un conjunto nulo de
puntos. Entonces f es integrable en D.
n: Sea E D un conjunto nulo tal que f sea continua en
Demostracio
D \ E. Entonces f es integrable en E \ D por el teorema 7.10 y es integrable en
E por el teorema anterior, luego f es integrable en D, tambien por el teorema
anterior.
A veces es u
til la caracterizaci
on siguiente de los conjuntos nulos:
Teorema 7.15 Un conjunto est
andar acotado es nulo si y s
olo si est
a contenido
en un dominio de integraci
on de volumen innitesimal.
n: Supongamos que E D, donde E es un conjunto est
Demostracio
andar
acotado y D es un dominio de integraci
on de volumen innitesimal. Sea Q un
cubo estandar tal que E D Q y sea P una partici
on innitesimal de P .
Fijado  > 0 estandar, por transferencia existe un dominio de integraci
on
estandar D+ de modo que E D+ Q y v(D+ ) < . Entonces E D+ , luego
S(E , P ) S(D , P ) v(D+ ) < ,

luego
S(E , P ) < ,
para todo  > 0 estandar, luego S(E , P ) 0, luego E es nulo.
Observemos que hasta ahora no tenemos ning
un criterio pr
actico para reconocer si un conjunto dado es un dominio de integraci
on. Por ejemplo, no
sabemos si el crculo del ejemplo del principio del captulo lo es. (Sabemos que
la condici
on necesaria y suciente es que la circunferencia sea nula.) Vamos a
ocuparnos de ello.

7.2. Dominios de integraci


on

229

Teorema 7.16 Sea f : K Rm Rd una funci


on de clase C 1 en un conjunto compacto K (en el sentido de que es de clase C 1 en un abierto que contiene
a K). Entonces existe una constante C tal que, para todo x, y K,
d(f (x), f (y)) C d(x, y).
n: Dados dos puntos x, y K, consideramos las funciones
Demostracio
gi : [0, 1] R dadas por gi (t) = fi (x + t(y x)), para i = 1, . . . , d.
Claramente es derivable en ]0, 1[ y continua en [0, 1], luego podemos aplicar
el teorema del valor medio, seg
un el cual existe un n
umero 0 < ti < 1 tal que
fi (y) fi (x) = f  (ti ) =


m

fi 
(yj xj ),
xj ci
j=1

para cierto punto ci K. Como las derivadas parciales son continuas en K,


podemos encontrar una constante C  tal que

 
 fi  


 
 xj   C
x
para todo x K. De este modo,
|fi (y) fi (x)|

C  (yj xj ) mC  d(x, y),

j=1

luego
'
d(f (x), f (y)) =

'
(fi (y) fi

(x))2

j=1

m2 C 2 d(x, y)2 = Cd(x, y),

j=1

donde la constante C no depende de x e y.


Ahora obtenemos un primer criterio pr
actico para reconocer conjuntos nulos:
Teorema 7.17 Sea g : Q Rd1 Rd una funci
on de clase C 1 en un
cubo Q. Entonces g[Q] es un conjunto nulo.
n: Es f
Demostracio
acil denir una aplicaci
on biyectiva [0, 1]d1 Q de

clase C (lineal, de hecho), luego podemos suponer que Q = [0, 1]d1 . Dividamos el intervalo [0, 1] en n partes innitesimales iguales, lo que nos da una
partici
on de Q en nd1 cubos iguales de arista 1/n.
Sea R Q el conjunto de los (n + 1)d1 vertices de los cubos Qi . Es f
acil
ver
que
dos
puntos
cualesquiera
de
un
cubo
de
arista
1/n
distan
a
lo
sumo

d 1/n. Por lo tanto, cada punto de Q dista a lo sumo d 1/n de un


punto de
R. Si C es la constante dada por el teorema anterior y llamamos
C  = C d 1, tenemos que cada punto de g[Q] dista de un punto de R = g[R]
en menos de C  /n.

230

Captulo 7. C
alculo integral de varias variables
Para cada punto x R , consideramos el cubo
d

Qx =

[xi C  /n, xi + C  /n],

i=1

que contiene a la bola abierta de centro x y radio C  /n, luego


&
g[Q]
Qx = U.
xR

El volumen de Qx es (2C  /n)d = C  /nd y hay a lo sumo (n+1)d1 cubos. El


conjunto U es un dominio de integraci
on, porque es una uni
on nita de cubos, y
cada cubo lo es. En general, si D1 y D2 son dominios de integraci
on, se cumple
que





dx =
D1 D2

dx +
D1

D2 \D1

dx

dx +

dx,

D1

D2

luego, aplicando esto varias veces, vemos que





C 
2d1 C 
0
0.
dx
dx = (n + 1)d1 d
n
n
xR Qx
U
Fijemos un cubo Q Rd que contenga a U y a g[Q] (esto es posible porque
g[Q] es compacto, luego acotado) y sea P  una partici
on innitesimal de Q .
Entonces

0 s(g[Q], P  ) S(g[Q], P  ) S(U , P  )
dx 0,
U

luego g[Q] es nulo.


De aqu obtenemos una condici
on sencilla:
Teorema 7.18 Si g : D Rd R es una aplicaci
on de clase C 1 en un
abierto D y el conjunto S = {x D | g(x) = 0} es regular, entonces todo
subconjunto compacto de S es nulo.
n: Si p S, (reordenando las variables si es necesario) el
Demostracio
teorema de la funci
on implcita nos da una funci
on xd : U Rd1 R de
clase C 1 , donde U es abierto, y un abierto V Rd tal que p V (podemos
suponer que V D), de modo que
V S = {x Rd | (x1 , . . . , xd1 ) U, xd = xd (x1 , . . . , xd1 )},
es decir, que V S es la graca de la funci
on xd . Sea h : U Rd la funci
on
dada por
h(x1 , . . . , xd1 ) = (x1 , . . . , xd1 , xd (x1 , . . . , xd1 )).
Claramente entonces, h es una funci
on de clase C 1 y podemos verla tambien
como funci
on continua h : U V S. Es biyectiva, y su inversa es la

7.3. C
alculo de integrales

231

proyeccion sobre las primeras d 1 componentes, luego la inversa tambien es


continua. Sea p = (p1 , . . . , pd1 ) U . Podemos tomar un cubo tal que

p Q Q U,
de modo que

p h[ Q ] h[Q] S.

El conjunto Vp = h[ Q ] es abierto en S (porque la inversa de h es continua),


y es nulo porque est
a contenido en h[Q], que es nulo por el teorema anterior.
Ademas p Vp .
Consideremos ahora un subconjunto compacto C S y sea F C un
subconjunto nito que contenga a todos sus puntos est
andar. Entonces
&
C=
(C Vp ),
pF

ya que si x C, por la compacidad sabemos que existe p = x C, luego p F


y, como Vp es abierto y x p Vp , ha de ser x C Vp .
Esto prueba que C es nulo, pues lo hemos expresado como uni
on de un
n
umero nito de conjuntos nulos.
Ejemplo Las esferas son conjuntos nulos, luego las bolas abiertas y cerradas
son conjuntos integrables.
En efecto, una esfera en Rd es de la forma
Sr (p) = {x Rd | (x1 p1 )2 + + (xd pd )2 = r2 },
y es un conjunto regular, pues el gradiente de la funci
on es
(2(x1 p1 ), . . . , 2(xd pd )),
que no es identicamente nulo excepto en el punto x = p
/ Sr (p). Como, ademas,
las esferas son compactas, son nulas por el teorema anterior, y las bolas son
integrables porque sus fronteras son esferas.
Observemos que hemos enunciado el teorema anterior para conjuntos denidos por una sola ecuaci
on. Si un conjunto est
a denido por varias ecuaciones,
estara contenido en los conjuntos que resultan de eliminarlas todas menos una, y
basta probar que uno cualquiera de ellos es nulo, lo que a menudo puede hacerse
con el teorema anterior.

7.3

C
alculo de integrales

El resultado fundamental para calcular explcitamente integrales de funciones de varias variables es el teorema siguiente, que lo reduce al calculo de integrales sucesivas de funciones de una variable. Para enunciarlo en general

232

Captulo 7. C
alculo integral de varias variables

necesitamos contemplar una situacion que no se presentar


a habitualmente en la
pr
actica, y es la necesidad de integrar una funci
on que puede no estar denida
en un conjunto nulo.
Observemos que si D Rd es un dominio de integraci
on, E D es un
conjunto nulo y f : D \ E R es una funci
on integrable en D \ E, entonces
cualquier extensi
on de f a D sera integrable en D (porque f |E sera siempre
integrable con integral nula), y adem
as


f (x) dx =
f (x) dx.
D

D\E

Esto signica que podemos denir la integral de f en D como la integral de


cualquier extensi
on de f a D, sin que importe c
omo la denimos en E. En otros
terminos: podemos hablar de la integral sobre D de una funci
on denida en D
salvo a lo sumo en un conjunto nulo de puntos.


Teorema 7.19 Sean Q Rd , Q Rd dos cubos y f : Q Q R una


on dada
funci
on integrable. Para cada x Q, llamemos fx : Q R a la funci
por fx (y) = f (x, y). Entonces, el conjunto
E = {x Q | fx no es integrable en Q }
es nulo, la funci
on


g(x) =
Q

es integrable en Q y


fx (y) dy

 
f (x, y) dxdy =

QQ

Q


fx (y) dy dx.

n: Observemos ante todo que, de acuerdo con el enunciado,


Demostracio
la funci
on g no esta denida sobre el conjunto E. De acuerdo con la observaci
on
previa al teorema, podemos considerarla denida en E con el valor 0, aunque
esto es irrelevante.
Es claro que sendas particiones innitesimales P y P  de Q y Q determinan
una partici
on innitesimal P P  de Q Q . Si i IP , j IP  y ci Qi ,
tenemos que
mij (f ) mj (fci ) Mj (fci ) Mij (f ).
Por lo tanto, jado i,

mij (f )yj s(fci , P  ) S(fci , P  )


Mij (f )yj ,
jIP 

jIP 

luego

mij (f )xi yj s(fci , P  )xi S(fci , P  )xi Mij (f )xi yj .


i,j

i,j

7.3. C
alculo de integrales

233

Como f es integrable, esto implica que

(S(fci , P  ) s(fci , P  ))xi 0.


iIP

Llamemos I0 = {i IP | E Qi = }. Para cada i I0 , tomemos


ci E Qi . Sea k = mn(S(fci , P  ) s(fci , P  ))  0. Entonces
iI0

0k

iI0

xi

(S(fci , P  ) s(fci , P  ))xi 0,

iI0

luego
S(E , P ) =

xi 0,

iI0

lo que prueba que E es nulo. Por otra parte,

xi yj =
xi
yj = v(Q )
xi 0,
iI0 ,jIP 

iI0

jIP 

iI0

con lo que E Q tambien es nulo.


Podemos modicar f en E Q , asign
andole el valor 0, sin que ello modique
su integrabilidad ni el valor de la integral. Equivalentemente, podemos suponer
que E = . Entonces,


mij (f )yj
fci (y) dy
Mij (f )yj .
jIP 

Q

jIP 

Como esto vale para todo ci Qi , resulta que

mij (f )yj mi (g) Mi (g)


Mij (f )yj ,
jIP 

luego

i,j

jIP 

mij (f )xi yj s(g, P ) S(g, P )

Mij (f )xi yj .

i,j

La integrabilidad de f implica entonces que g tambien es integrable, as como


la igualdad de las integrales del enunciado.
Ejemplo

Vamos a calcular el volumen de un cilindro cortado en bisel por un


plano. Supongamos, concretamente, que la base es un crculo de
radio 1 y que la m
axima altura es tambien igual a 1. M
as concretamente, podemos tomar como base el crculo unitario
C = {(x, y) R2 | x2 + y 2 1},

de modo que la altura en cada punto (x, y) es f (x, y) = (x + 1)/2. Por consiguiente, el volumen que queremos calcular es

x+1
dxdy.
2
C

234

Captulo 7. C
alculo integral de varias variables

Consideramos C [1, 1]2 . Para cada x [1, 1],


tenemos que
x+1

si 1 x2 y 1 x2 ,
2
fx (y) =
0
en otro caso.

1x2

1x2

Por consiguiente,

C

1
2

x+1
1
dxdy =
2
2
1x2

1x2

(x

1x2

[xy + y]1x2 dx =

+ 1)dydx



(x 1 x2 + 1 x2 ) dx

1

 1
1
2 3/2
= (1 x )
+
1 x2 dx = /2,
2
1
1

ya que la u
ltima integral est
a calculada en el ejemplo de la p
agina 145.
Conviene destacar un caso particular del teorema 7.19:
Teorema 7.20 Sea [a, b] R un intervalo y Q Rd1 un cubo. Consideremos
un dominio de integraci
on D [a, b] Q Rd y, para cada x [a, b], sea
Dx = {y Q | (x, y) D}. Entonces, el conjunto
E = {x [a, b] | Qx no es un dominio de integraci
on}
es nulo y v(D) =

(b
a

v(Qx ) dx.

La prueba consiste simplemente en aplicar 7.19 a la funci


on D.
Ejercicio: Deducir del teorema anterior la f
ormula para el volumen de un s
olido de
revoluci
on que dedujimos en la p
agina 150.

El teorema siguiente es un caso particular de 7.19, excepto por que proporciona un criterio de integrabilidad:
Teorema 7.21 Sean fi : Di Rdi R, para i = 1, 2 funciones integrables
sobre dos dominios de integraci
on D1 y D2 . Entonces D1 D2 es un dominio
de integraci
on, la funci
on f1 f2 : D1 D2 R dada por
(f1 f2 )(x1 , x2 ) = f1 (x1 )f2 (x2 )
es integrable en D1 D2 y


(f1 f2 )(x) dx =
D1 D2

D1

 
f1 (x) dx


f2 (x) dx .

D2

7.4. El teorema de la media

235

n: Consideremos primero el caso en que D1 y D2 son cubos,


Demostracio
de modo que D1 D2 es tambien un cubo y, por lo tanto, un dominio de
integraci
on.
Observemos que si Q1 D1 y Q2 D2 son cubos y Mi es el supremo de fi
en Qi , entonces el supremo de f1 f2 en Q1 Q2 es M1 M2 . En efecto, podemos
suponer que todos los datos son est
andar y, entonces, si (x1 , x2 ) Q1 Q2 ,
tenemos que fi (xi ) Mi , luego (f1 f2 )(x1 , x2 ) = f1 (x1 )f2 (x2 ) M1 M2 .
Por otra parte, existe xi Qi tal que fi (xi ) Mi , luego (f1 f2 )(x1 , x2 ) =
f1 (x1 )f2 (x2 ) M1 M2 . Esto prueba que M1 M2 es el supremo de f1 f2 . Lo
mismo es valido cambiando supremos por nmos.
Si Pi es una partici
on innitesimal de Di , entonces podemos formar una
partici
on innitesimal P1 P2 de D1 D2 , de modo que, por lo que acabamos
de probar,
mij (f1 f2 ) = mi (f1 )mj (f2 ),

Mij (f1 f2 ) = Mi (f1 )Mj (f2 ).

Por consiguiente,
s(f1 f2 , P1 P2 ) =

mi (f1 )mj (f2 )x1,i x2,j = s(f1 , P1 )s(f2 , P2 ),


i,j

e igualmente S(f1 f2 , P1 P2 ) = S(f1 , P1 )S(f2 , P2 ). La integrabilidad de las


funciones fi equivale a que s(fi , Pi ) S(fi , Pi ), de donde se sigue que
s(f1 f2 , P1 P2 ) S(f1 f2 , P1 P2 ),
y, por consiguiente, f1 f2 es integrable. La f
ormula para la integral es inmediata.
Consideremos ahora el caso en que D1 y D2 son dominios de integraci
on
arbitrarios. Tomemos cubos Di Qi . Basta observar que
D

1 D2

= D D ,
1

con lo que la parte ya probada nos da que D1 D2 es un dominio de integraci


on.
Similarmente, la extensi
on de f1 f2 a Q1 Q2 con el valor 0 fuera de D1 D2
es el producto de las extensiones correspondientes, luego es integrable por la
parte ya probada.
En particular, el teorema anterior implica que si D1 y D2 son dominios de
integraci
on, entonces v(D1 D2 ) = v(D1 )v(D2 ).

7.4

El teorema de la media

Demostramos aqu una propiedad de la integral de Riemann que necesitaremos mas adelante. En primer lugar, un hecho elemental:
Teorema 7.22 Sea f : D( R una funci
on continua sobre un dominio de
integraci
on D. Si f 0 y D f (x) dx = 0, entonces f = 0.

236

Captulo 7. C
alculo integral de varias variables

n: Podemos suponer todos los datos estandar. Supongamos


Demostracio
que f = 0, es decir, que existe un punto (est
andar) x0 D tal que f (x0 ) > 0.
Si P es una partici
on innitesimal de un cubo que contenga a D, entonces x0
pertenecera a uno de los cubos Qi determinados por la partici
on y, para cada
x Qi , tenemos que f (x) f (x0 ) > 0, luego mi > 0. Por lo tanto,

0 < mi xi s(f, P )
f (x) dx,
D

contradicci
on.
Teorema 7.23 (Teorema de la media) Sea f : D Rd R una funci
on
integrable sobre un dominio de integraci
on no nulo D. Sean m y M el nmo y
el supremo de f en D, respectivamente. Entonces
(
f (x) dx
m D
M.
v(D)
El cociente se llama valor medio de f en D. Si D es conexo y f es continua en
D, entonces existe un x D tal que
(
f (x) dx
D
= f (x).
v(D)
n: Como m f (x) M , para todo x D, es claro que
Demostracio



m v(D) =
m dx
f (x) dx
M dx = M v(D),
D

de donde se sigue la primera parte del enunciado. Bajo las hip


otesis adicionales
de la segunda parte, tenemos que ]m, M [ f [D] [m, M ]. El u
nico caso en el
que la conclusi
on no est
a clara es si el valor medio de f coincide con m o con
M . Supongamos que coincide con M , es decir, que


f (x) dx = M
dx.
(

Entonces D (M f (x)) dx = 0 y el integrando M f 0 es una funci


on
continua. Por el teorema anterior, f es constante igual a M , luego cualquier
x D cumple el teorema. Si el valor medio es m se razona analogamente.
Demostramos ahora que el teorema de la media, junto con otras propiedades
elementales, caracteriza las integrales de una funcion continua:
on, sea f : D0 R una
Teorema 7.24 Sea D0 Rd un dominio de integraci
funci
on continua y acotada en D0 y sea I una funci
on con valores en R denida
sobre el conjunto de todos los dominios de integraci
on D D0 que cumpla las
propiedades siguientes:
a) Si D D es nulo, entonces I(D D ) = I(D) + I(D ).

7.4. El teorema de la media

237

b) Existe una constante M tal que, para todo dominio de integraci


on D D0 ,
se cumple que
|I(D)| M v(D)
c) Si Q D0 es un cubo innitesimal, existe un x Q tal que
I(Q)
f (x).
v(Q)
Entonces, para todo dominio de integraci
on D D0 , se cumple que

I(D) =
f (x) dx.
D

n: Podemos suponer que todos los datos son estandar. ToDemostracio


memos un cubo Q que contenga a D0 y tomemos una partici
on innitesimal P
de Q. Para cada cubo innitesimal Qi D, tenemos que existe un xi Qi tal
que
I(Qi )
f (xi ).
xi
Por consiguiente, para cualquier  > 0 estandar,
I(Qi ) xi < f (xi )xi < I(Qi ) + xi .
Sumando para todos los cubos contenidos en D, obtenemos que

I(K)  xi < f (xi )xi < I(K) +  xi ,


i

donde K Qi es la uni
on de los cubos Qi D. Ahora observamos que D \ K
on
esta contenido en la uni
on de los cubos tales que Qi D = , pero esta uni
tiene volumen innitesimal, porque D es nulo, luego
I(D \ K) M v(D \ K) 0,
luego I(D) = I(K) + I(D \ K) I(K). Teniendo en cuenta tambien 7.7, las
desigualdades anteriores nos dan que

I(D) v(D)
f (x) dx I(D) + v(D),
D

luego






I(D)
f (x) dx v(D) v(D0 ).

D

Como esto es valido para todo  > 0 estandar, tambien vale si  0, y


entonces implica que

I(D) =
f (x) dx.
D

238

Captulo 7. C
alculo integral de varias variables

7.5

El teorema de cambio de variable

En esta seccion demostraremos la version para funciones de varias variables


del teorema 4.15. Primeramente necesitamos algunas propiedades sencillas de
los vol
umenes. La primera es que son invariantes por traslaciones:
Teorema 7.25 Sea v Rd y consideremos la traslaci
on f : Rd Rd dada
d
on, tambien lo es f [D],
por f (x) = v + x. Si D R es un dominio de integraci
y adem
as v(f [D]) = v(D).
n: Podemos suponer que todos los datos son estandar. ToDemostracio
memos un cubo D Q. Entonces f [Q] es un cubo que contiene a f [D]. Es claro
que una partici
on innitesimal P de Q se traslada a una partici
on innitesimal
P  = f [P ] de f [Q], con el mismo conjunto de multindices IP = IP  . Ademas,
los vol
umenes de los cubos correspondientes son iguales:
xi = (v1 + xi1 ,1 v1 xi1 1,1 ) (vd + xid ,d vd xid 1,d ) = xi .
Por u
ltimo, un cubo Qi corta a D (o esta contenido en D) si y solo si
f [Qi ] = f [Q]i corta a f [D] (o esta contenido en f [D]). Esto quiere decir que
mi (D) = mi (f [D]), Mi (D) = Mi (f [D]). Por lo tanto,
s(f [D], f [P ]) =

mi (f [D])xi = mi (D)xi = s(D, P ).


i

Lo mismo sucede con las sumas superiores, luego D es integrable si y solo


si lo es f [D], y en tal caso las integrales coinciden.
Ahora mostramos el efecto sobre el volumen de las homotecias:
Teorema 7.26 Sea r > 0 y consideremos la homotecia f : Rd Rd dada por
f (x) = rx. Si D Rd es un dominio de integraci
on, tambien lo es rD = f [D],
y adem
as v(rD) = rd v(D).
n: La prueba es identica a la del teorema anterior, salvo que
Demostracio
ahora no es cierto que los cubos de la partici
on P tengan el mismo volumen que
los de P  , sino que
xi = (rxi1 ,1 rxi1 1,1 ) (rxid ,d rxid 1,d ) = rd xi .

h
D

Ejemplo Consideremos un dominio de integraci


on arbitrario D R2 y sea C un cono arbitrario de base D y altura
h, tal y como el que muestra la gura. Vamos a probar que
su volumen es v(D) = 13 v(D)h.

Por comodidad podemos situarlo de forma que el vertice sea el punto (0, 0, 0)
y la base este en el plano z = h. De este modo, si 0 < z < h, es facil ver que

7.5. El teorema de cambio de variable

239

(x, y) Cz si y solo (x, y, z) C si y solo si (hx/z, hy/z, h) C, si y solo si


(hx/z, hy/z) D, si y solo si (x, y) (z/h)D.
As pues, Cz = (z/h)D, y el teorema anterior nos da que
v(Cz ) =
Aplicando 7.20 concluimos que
 h

v(C) =
v(Cz ) dz =
0

z2
v(D).
h2

z2
v(D)
v(D) dz =
h2
h2

z 2 dz
0

v(D) h3
1
= f (D)h.
2
h
3
3

Consideremos ahora una aplicaci


on lineal biyectiva : Rd Rd . Obserd
vemos que si Q R es un cubo, entonces [Q] es un dominio de integraci
on.
En efecto, es un homeomorsmo, luego [Q] = [Q]. La frontera de Q es
la uni
on de 2d cubos de dimensi
on d 1 o, con mas precision, es la uni
on de
las imagenes de 2d cubos en Rd1 por aplicaciones de clase C 1 (composiciones
de traslaciones y aplicaciones lineales). Por consiguiente, la frontera de [Q]
tambien es uni
on de las im
agenes de 2d cubos en Rd1 por aplicaciones de clase
1
C (las que recorren la frontera de Q compuestas con ), luego [Q] es nulo
por el teorema 7.17.
Llamemos V al volumen de la imagen por del cubo unitario Q1 = [0, 1]d y
sea Q = [a1 , a1 + r] [ad , ad + r] un cubo arbitrario de arista r > 0. Vamos
a calcular el volumen de [Q]. Para ello observamos que, si A es la matriz de
, entonces
(x) = xA = r((r1 (x a))A) + aA.
Esto signica que se puede expresar como composicion de las aplicaciones
siguientes:
la traslaci
on x  x a (que transforma Q en el cubo [0, r]d ),
la homotecia x  r1 x (que transforma [0, r]d en Q1 ),
(que transforma Q1 en [Q1 ], de volumen V ),
la homotecia x  rx (que transforma [Q1 ] en un dominio de integraci
on
de volumen rd V ),
la traslaci
on x  x + aA (que transforma el dominio anterior en [Q] sin
alterar el volumen).
As pues, v([Q]) = rd V = V v(Q).
Ahora vamos a probar que si D Rd es un dominio de integraci
on, entonces
[D] tambien lo es, y v([D]) = V v(D). Lo tenemos probado cuando D es un
cubo de arista r.

240

Captulo 7. C
alculo integral de varias variables

Fijemos un cubo que contenga a D de la forma Q = [a, b]d . As una partici


on de [a, b] en intervalos innitesimales de la misma longitud determina una
partici
on innitesimal P de Q cuyos cubos Qi tienen todos una misma arista r,
por lo que sabemos que [Qi ] tiene volumen V rd .
Llamamos I al conjunto de los multindices i IP tales que Qi D = .
Como D es nulo, sabemos que el conjunto
&
U=
Qi
iI

tiene volumen
v(U ) =

xi 0.

iI

Como es un homeomorsmo,
&

[D] = [D] [U ] =

[Qi ],

iI

y
v([U ]) =

v([Qi ]) = V

iI

xi 0.

iI

Por el teorema 7.15, concluimos que la frontera [D] es nula, luego [D] es
un dominio de integraci
on.
Sea J1 el conjunto de los multindices tales que Qi D y sea J2 el conjunto
de los multindices tales que Qi D = . De este modo,
&
&
Qi D
Qi ,
iJ1

luego

&
iJ1

iJ2

[Qi ] [D]

&

[Qi ].

iJ2

Ahora bien,
v

 &
iJ1

y
v

 &
iJ1



 &
Qi = s(D, P ) S(D, P ) = v
Qi
iJ2


 &

[Qi ] = V s(D, P ) V S(D, P ) = v
[Qi ]
v

 &
iJ1

iJ2


 &

[Qi ] v([D]) v
[Qi ] ,
iJ2

de donde se concluye que


v([D]) V s(D, P ) = V v(D),
luego v([D]) = V v(D).
El teorema siguiente contiene lo que acabamos de demostrar y un poco mas:

7.5. El teorema de cambio de variable

241

Teorema 7.27 Sea : Rd Rd una aplicaci


on lineal de determinante .
Para todo dominio de integraci
on D Rd , se cumple que [D] es un dominio
de integraci
on, y v([D]) = ||v(D).
n: Recordemos que el determinante de una aplicacion lineal
Demostracio
es el determinante de su matriz en cualquier base. Si no es biyectiva, el
teorema es trivial, ya que, por una parte, = 0 y, por otra parte, [D] esta
contenido en un subespacio vectorial de Rn de dimensi
on menor que d, luego
esta contenido en un conjunto de la forma
S = {x Rd | a1 x1 + + ad xd = 0},
luego v([D]) = 0 por el teorema 7.18.
Supongamos ahora que es biyectiva. Ya tenemos probado el teorema salvo
que falta por ver que la constante que relaciona los dos vol
umenes es precisamente ||. (Lo hemos probado con la constante V igual al volumen de la imagen
del cubo unitario.)
El algebra lineal demuestra que toda aplicaci
on lineal biyectiva se puede
expresar como composicion de un n
umero nito de aplicaciones lineales g de
uno de los tipos siguientes:
a) g permuta los vectores e1 , . . . , ed de la base canonica de Rd .
b) g(e1 ) = re1 y g(ei ) = ei para i > 1, donde r R es no nulo.
c) g(e1 ) = e1 + e2 y g(ei ) = ei , para i > 1.
Por comodidad para el lector damos la prueba en un apendice al nal del
captulo. Teniendo en cuenta que el determinante de una composici
on de aplicaciones es el producto de los determinantes, basta probar el teorema en el
caso en que f sea de uno de los tres tipos anteriores. M
as concretamente, si
Q = [0, 1]d , basta probar que, si f es de uno de los tres tipos anteriores, entonces
v[[Q]] = ||.
En el primer caso es facil ver que || = 1 y que [Q] = Q, luego, ciertamente,
v([Q]) = v(Q) = 1 = ||. En el segundo caso, = r y

[0, r] [0, 1]d1
si r > 0,
[Q] =
[r, 0] [0, 1]d1 si r < 0.
Por lo tanto, v([Q]) = |r| = ||.
En el tercer caso = 1 y
[Q] = D [0, 1]d2 ,
e2

e1 + e2

donde D es el dominio de integraci


on indicado en la gura. Es
f
acil ver que v(D) = 1, bien por integraci
on, bien observando
e1
que D se descompone en union de dos tri
angulos y que, trasladando el superior (lo cual no modica el area) obtenemos el cuadrado [0, 1]2 , que
tiene area igual a 1. El teorema 7.21 implica entonces que v([Q]) = 1 = ||.

242

Captulo 7. C
alculo integral de varias variables

El teorema anterior nos da una interpretaci


on geometrica del determinante
de una aplicaci
on lineal (o, mejor dicho, de su valor absoluto): la aplicaci
on
multiplica por || el volumen de cualquier dominio de integraci
on. Ahora vamos
a extender este resultado a aplicaciones no necesariamente lineales. La clave
para ello es la posibilidad de aproximar una aplicaci
on por su diferencial.
En el teorema siguiente consideramos un homeomorsmo f : U V de
clase C 1 entre dos abiertos de Rd . Si p U es un punto est
andar, podemos
considerar la diferencial dp f : Rd Rd , que es una aplicaci
on lineal que
aproxima a f cerca de p. Si Q U es un cubo, entonces f [Q] y dp f Q] son
cubos deformados. Lo que vamos a probar es que si Q es innitesimal y esta
innitamente cerca de p, entonces f [Q] y dfp [Q] son muy parecidos, no ya en
el sentido obvio de que ambos son innitesimales, sino, m
as a
un, porque si les
aplicamos una homotecia innita para volverlos apreciables, la diferencia entre
ambos sigue siendo inapreciable y, a su vez, esto implica que los vol
umenes de
estas ampliaciones son indistinguibles.
En realidad, para que esto tenga sentido necesitamos suponer que todas las
aristas de Q tienen la misma longitud, ya que, en otro caso, una homotecia que
volviera apreciable una de ellas, podra hacer innita, o dejar innitesimal a
otra.
Teorema 7.28 Sea f : U V un homeomorsmo est
andar de clase C 1 entre
d
dos abiertos U y V de R . Sea p U un punto est
andar, sea
Q = [a1 , a1 + r] [ad , ad + r] U
un cubo de arista innitesimal r tal que a p, sea = dp f y supongamos
adem
as que es biyectiva. Entonces,
v(f [Q])
1.
v([Q])
n: Ante todo, observemos que f [Q] es un dominio de inteDemostracio
graci
on. En efecto, Q es la uni
on de 2d imagenes de cubos de Rd1 por apli1
caciones de clase C , luego lo mismo vale para f [Q] = f [Q]. El teorema 7.17
nos da entonces que la frontera f [Q] es nula, luego f [Q] es un dominio de
integraci
on. Consideremos la aplicaci
on
f (a + rx) f (a)
f(x) =
.
r
Est
a denida en un abierto que contiene al cubo unitario Q1 = [0, 1]d .
Cuando x recorre Q1 , tenemos que a + rx recorre el cubo Q, luego f[Q1 ] resulta
de aplicar a f [Q] la traslaci
on x  x f (a) y luego la homotecia x  x/r.
Teniendo en cuenta los teoremas 7.25 y 7.26, concluimos que
v(f[Q1 ]) = rd v(f [Q]).
Lo mismo es valido para y la aplicaci
on
(a + rx) (a)

(x)
=
,
r

7.5. El teorema de cambio de variable

243

pero, como es lineal, resulta que = . As pues,


v([Q1 ]) = rd v([Q]).
Por consiguiente, el teorema se reduce a probar que
v(f[Q1 ])
1.
v([Q1 ])
Como v([Q1 ]) = || =
 0, donde es el determinante de (que es estandar,
porque lo es), la relacion anterior es equivalente a v(f[Q1 ]) v([Q1 ]).
En terminos de la discusion previa al teorema, tenemos que f[Q1 ] y [Q1 ] son
el resultado de aplicar a f [Q] y [Q] una homotecia de centro a para hacerlos
apreciables y una traslaci
on para que ambos tengan un vertice en el origen.
Ahora vamos a probar que estas ampliaciones son indistinguibles:
Como f es de clase C 1 , es estrictamente diferenciable en p. Si x Q1 ,
entonces rx 0, y la denici
on de diferenciabilidad estricta nos da que
f (a + rx) f (a) (rx)
0.
rx
Equivalentemente:

f(x)
(x)

.
x
x

Esto implica que f(x) (x). En otras palabras: cada punto de f[Q1 ] esta
innitamente cerca de un punto de [Q1 ], y viceversa.
Ahora podemos hacer una simplicaci
on: como 1 es continua en (x), la
aproximaci
on que hemos obtenido equivale a que 1 (f(x)) x. Por otra parte,
en virtud del teorema anterior, la relaci
on v(f[Q1 ]) v([Q1 ]) que queremos
1
probar equivale a v( [f [Q1 ]]) v(Q1 ) = 1.
Por lo tanto, si llamamos g = f 1 , tenemos que g es un homeomorsmo
denido sobre un abierto que contiene a Q1 en otro abierto que contiene a
K = g[Q1 ], hemos probado que g(x) x para todo x Q1 , y queremos probar
que v(K) 1.
d

Para ello vemos que si  > 0 es estandar, entonces K Q+


+ = ], 1 + [ ,
ya que todo elemento de K es de la forma g(x) x Q1 , y si no estuviera
en Q+
a a una distancia >  de cualquier punto de Q1 . Por lo tanto
+ estar
d
acilmente que v(K) 1.
v(K) v(Q+
+ ) = (1 + 2) , de donde se sigue f
La otra desigualdad ser
a inmediata tambien si demostramos la inclusion
d
Q
=
[,
1

]

K,
pues
entonces (1 2)d v(K) y esto implica que
+

v(K) 1.
A su vez, para probar la inclusi
on basta probar que todo punto x Q1 \ K
esta innitamente pr
oximo a un punto de Q1 , ya que entonces ning
un punto
de Q

Q
podr
a
estar
en
Q
\
K.
1
1
+

244

Captulo 7. C
alculo integral de varias variables

En efecto, tenemos que x g(x) K. El segmento S que une x y g(x) es


un espacio topol
ogico conexo, pues es la imagen del intervalo (conexo) [0, 1] por
la aplicaci
on continua u(t) = (1 t)x + tg(x).
La restriccion a S de K no puede ser continua, ya que, como K (x) = 0,
K (g(x)) = 1, su imagen es el espacio disconexo {0, 1}, y la imagen de un
espacio conexo por una funci
on continua ha de ser conexa.
As pues, existe un punto y S donde K es discontinua, y es f
acil ver que
esto equivale a que y K. Como x g(x), tambien x y. Por otra parte,
como g es un homeomorsmo, K = g[Q1 ], luego y = g(z), con z Q1 , y as
z y x.
En denitiva: v(K) = 1 o, lo que es lo mismo v(K) 1.
Ahora ya podemos demostrar el teorema general:
Teorema 7.29 (Teorema de cambio de variable) Sea x : U V una
aplicaci
on biyectiva de clase C 1 entre dos dominios de integraci
on abiertos en
d
R . Para cada t U , sea (t) el determinante de la matriz jacobiana (Jx)(t)
(que es una funci
on continua en U ). Supongamos que (t) no se anula y est
a
acotado en U . Sea f : V R una funci
on continua y acotada. Entonces


f (x) dx =
f (x(t))|(t)| dt.
V

n: En primer lugar, observamos que, por el teorema de la


Demostracio
funci
on inversa, la aplicaci
on x1 : V U tambien es de clase C 1 . Llamemos
a esta inversa t(x), de modo que, en cada punto x V , se cumple que dx t =
(dt(x) x)1 y su determinante es (t(x))1 .
Fijemos un  > 0 estandar, sea Q un cubo tal que U Q Rd y sea
P una partici
on innitesimal de Q . Como la frontera U es nula, la suma
de los vol
umenes de los cubos Qi que cortan a U es innitesimal, luego, en
particular, es < . Por transferencia, existe una partici
on estandar P0 con esta

on de los cubos correspondientes a la partici
on
misma propiedad. Sea K la uni
P0 contenidos en U . De este modo, K  U es un dominio de integraci
on
compacto estandar tal que v(U \ K  ) < .


Ahora tomamos un cubo Q = [a, b]d tal que V Q Rd . Consideramos una


partici
on de [a, b] en n segmentos iguales de longitud innitesimal r = (b a)/n,
la cual determina una partici
on P de Q en cubos innitesimales de arista r.
Nuevamente, la suma de los vol
umenes de los cubos Qi que cortan a V es
innitesimal (en particular < ), pero podemos decir mas: ninguno de ellos
corta a t[K  ].
En efecto, si Qi corta a la vez a V y a x[K  ], entonces existen x V ,

x x[K  ] tales que x x . Como x[K  ] es compacto, existe x x[K  ], luego,
on
cambiando x por x, podemos suponer que x es estandar. Entonces, la relaci
x x implica que x esta en la clausura de V , que es el propio V , porque la
frontera es cerrada, pero esto es absurdo, porque x x[K  ] U y U es abierto,
luego no contiene a los puntos de U .

7.5. El teorema de cambio de variable

245

Por transferencia, podemos encontrar un n


umero natural est
andar n0 tal
que, si partimos [a, b] en n0 intervalos de la misma longitud, la partici
on corresumenes de los
pondiente P0 de Q tiene la propiedad de que la suma de los vol
cubos que cortan a V es menor que  y ninguno de ellos corta a x[K  ].
Llamemos K a la uni
on de los cubos determinados por P0 y que estan contenidos en V . As, x[K  ] K V , el conjunto K es un dominio de integraci
on
compacto estandar y v(V \ K) < .
Como U \ t[K] U \ K  , tenemos tambien que v(U \ t[K]) < .
Ahora consideramos de nuevo una partici
on innitesimal de [a, b] en n segmentos de longitud r = (ba)/n, pero tomamos n m
ultiplo de n0 , de modo que,
si consideramos la partici
on P de Q y llamamos I al conjunto de los multindices
i IP tales que Qi K, tenemos que
&
K=
Qi .
iI

Si i I y Qi = [a1 , a1 + r] [ad , ad + r], entonces a K, luego


p = a K V , porque K es compacto, luego podemos aplicar el teorema
anterior, en virtud del cual
v(t[Qi ])
|(t(p))|v(t[Qi ])
=
1.
v(dp t[Qi ])
v(Qi )
on. El teorema
En particular, tenemos que t[Qi ] es un dominio de integraci
de la media nos da que
(
f (x(t))|(t)| dt
t[Qi ]
= f (x(ti ))|(t0 )|,
v(t[Qi ])
para un cierto ti t[Qi ], que ser
a de la forma ti = t(xi ), con xi Qi .
Como xi p, tambien t(xi ) t(p), luego |(ti )| |(t(p))|, y, como
(t(p)) es estandar,
|(ti )|
1.
|(t(p))|
A partir de aqu vamos a seguir de cerca el razonamiento que hemos empleado
en la prueba del teorema 7.24. Para cada dominio de integraci
on D V ,
denimos

I(D) =
f (x(t))|(t)| dt.
t[D]

Para que I(D) este bien denido es necesario que t[D] sea un dominio de
integraci
on. Hemos visto que I(Qi ) esta bien denido, y adem
as
I(Qi )
= f (x(ti ))|(ti )|,
v(t[Qi ])
luego

|(t(p))|v(t[Qi ]) |(ti )| I(Qi )


f (x(ti ))|(ti )|,
v(Qi )
|(t(p))| v(t[Qi ])

246

Captulo 7. C
alculo integral de varias variables

o, equivalentemente,
I(Qi )
f (xi ),
xi
para cierto xi Qi .
Razonando como en 7.24, tenemos que
I(Qi ) xi < f (xi )xi < I(Qi ) + xi ,
de donde, sumando para i I, obtenemos que

I(K)  xi < f (xi )xi < I(K) +  xi .


i

Notemos que I(K) esta denido porque t[K] es un dominio de integraci


on,
ya que es la uni
on de los dominios t[Qi ]. Sin embargo, ahora no es cierto que
V \ K tenga volumen innitesimal. Lo que tenemos es que v(V \ K) <  y
v(U \ t[K]) < .
Tomando partes estandar en las desigualdades anteriores, llegamos a que

I(K) v(K)
f (x) dx I(K) + v(K),
K

luego






I(K)
f (x) dx v(K) v(V ).

K

Por lo tanto:

 




 

 f (x(t))|(t)| dt
 I(K)

f
(x)
dx
f
(x)
dx

 

U







+|I(V \ K)| + 
f (x) dx
 V \K

v(V ) + M1 v(U \ t[K]) + M2 v(V \ K) M ,
donde M1 es una cota de f (x(t))|(t)| en U , M2 es una cota de f (x) en V y
M = v(V ) + M1 + M2 . Como esto vale para todo  > 0 estandar, tenemos la
igualdad del enunciado.
Coordenadas polares Un cambio de variables que a menudo resulta u
til es
el determinado por las coordenadas polares. Llamemos
A = ]0, +[ ], [ ,

B = R2 \ {(x, 0) R2 | x 0}

y consideremos la aplicacion p : A B dada por


p(, ) = ( cos , sen ).

7.5. El teorema de cambio de variable

247

Es f
acil ver que es biyectiva y de clase C . Su matriz jacobiana es


cos
sen
Jp(, ) =
sen cos
y su determinante jacobiano es (, ) = . Por el teorema de la funci
on inversa,
la inversa de p es tambien de clase C . Si U A y V = p[U ] son dominios
de integraci
on y f : V R es una funci
on continua y acotada, el teorema de
cambio de variables nos da que


f (x, y) dxdy =
f ( cos , sen ) dd.
V

Ejemplo

Vamos a calcular de nuevo la integral del ejemplo de la p


agina 233:

x+1
dxdy,
2
C

donde C = {(x, y) R2 | x2 + y 2 1}.


Es equivalente calcularla sobre
V = {(x, y) R2 | x2 + y 2 < 1} \ {(x, 0) R2 | x 0},
pues hemos quitado un conjunto nulo. Este conjunto es la imagen por el cambio
de coordenadas polares del cubo ]0, 1[ ], [. Por lo tanto:
1

  1
  3

x+1
cos + 1
2
d
dxdy =
dd =
cos +
2
2
6
4 0
C
0




 
cos 1
sen

=
+
d =
+
= .
6
4
6
4
2

Ejemplo Sean Cr = {(x, y) R2 | x2 + y 2 < r} y


2
, como
2r
r
2r Qr = ]r, r[ . Claramente, Cr Qr 2 C
2
muestra la gura. Dado que la funci
on e(x +y )/2 es siempre positiva, es claro que


2
2
(x2 +y 2 )/2
(x2 +y 2 )/2
e
dxdy
e
dxdy
e(x +y )/2 dxdy.


Cr

C2r

Qr

Por el teorema 7.21:




(x2 +y 2 )/2
e
dxdy =
Qr



x2 /2

e
r

ex

/2 y 2 /2

dxdy

Qr

 

dx

y 2 /2

e
r


dy



x2 /2

e
r

2
dx

248

Captulo 7. C
alculo integral de varias variables

Por otra parte, cambiando a coordenadas polares:



  r
 
r
2
2
2
2
2
e /2 d = 2(1er /2 ).
e(x +y )/2 dxdy =
e /2 d =

2(1 er

/2

Cr

As pues,

luego


)

ex

2
/2

dx



1 er2 /2

2(1 er ),
2


2
1
ex /2 dx 1 er2
2

Con esto podemos calcular el lmite cuando r tiende a + de la integral,


que habitualmente se representa como
 +
2
1
ex /2 dx = 1.
2

-2

-1

El integrando se conoce como campana de Gauss, y es una de las distribuciones de probabilidad m


as importantes en estadstica. Puede probarse que no
admite una primitiva expresable en terminos de las funciones usuales, a partir
de la cual calcular la integral.
Coordenadas cilndricas Un cambio de variable u
til para trabajar con s
olidos
de revoluci
on es el correspondiente a las coordenadas cilndricas:
x = cos ,

y = sen ,

z = z.

Se comprueba inmediatamente que, como en el caso de las coordenadas polares, el determinante jacobiano es . Un s
olido de revoluci
on esta determinado
por una funci
on = r(z) que determina la distancia al eje z de la supercie del
solido a cada altura z. Es claro entonces que su volumen (es decir, la integral
de su funci
on caracterstica) en coordenadas cilndricas viene dado por


r(z)

V =

dddz = 2
a

2
2

r(z)

r2 (z) dz,

dz =
a

que es la misma formula obtenida en la p


agina 150 mediante un razonamiento
ad hoc.

7.5. El teorema de cambio de variable

249

Terminamos esta seccion destacando una consecuencia teorica del teorema


de cambio de variable. Hemos denido la integraci
on sobre dominios de Rd ,
pero, m
as en general, si V es un espacio vectorial de dimension d dotado de un
producto escalar (por ejemplo, si V es un subespacio vectorial de Rn , lo que
nos permite dotarlo de la restricci
on a V del producto escalar de Rn ), podemos
considerar en V una base ortonormal, es decir una base v1 , . . . , vd formada por
vectores que cumplan vi vi = 1, vi vj = 0, para i = j (vectores de norma 1
perpendiculares entre s). (El algebra lineal garantiza que siempre existen bases
ortonormales.) A su vez, podemos denir una aplicaci
on lineal : Rd V
determinada por que (ei ) = vi , donde ei son los vectores de la base canonica
de Rd . La aplicaci
on conserva el producto escalar:




(x)(y) =
xi vi
yi vi = xi yi = xy,
i

y, en particular, conserva la distancia entre puntos. Es f


acil ver entonces que
transforma los cubos de Rd en lo que, por denici
on, podemos llamar cubos
en V , del mismo volumen. En el caso en que V sea un subespacio de Rn ,
por ejemplo, un plano en R3 , los cubos de V son rectangulos situados en una
posicion arbitraria en el espacio.
Ahora podramos desarrollar en V toda la teora de integraci
on que hemos
visto (particiones, sumas superiores e inferiores, etc.), pero podemos llegar al
mismo resultado por un camino m
as corto: podemos denir un dominio de
integraci
on D V como un subconjunto de V tal que D = 1 [D] sea un
dominio de integraci
on en Rd , y diremos que una funci
on acotada f : D R
es integrable si lo es |D f , en cuyo caso denimos la integral


f (x) dx =
f ((t)) dt.
D

D

Como decimos, una comprobacion rutinaria permitira mostrar que estas


deniciones nos llevan al mismo concepto de integral que si desarrollamos sistematicamente en V el calculo integral que hemos desarrollado en Rd . Para
tomar la igualdad anterior como denici
on de integral, necesitamos una comprobaci
on que la justique, y ah es donde interviene el teorema de cambio de
variable: hemos de probar que la denici
on de dominio de integraci
on en V y
de integral de una funci
on sobre un dominio de V no dependen de la elecci
on
de la base ortonormal.
En efecto, si tomamos dos bases ortonormales en V , estas dan lugar a dos
aplicaciones ,  : Rd V , con las que podemos formar otra aplicaci
on lineal
= 1 : Rd Rd .
Como y  conservan el producto escalar, lo mismo le sucede a , luego, si
A es la matriz de en la base canonica de Rd , tenemos que, para todo par de
vectores x, y Rd , se cumple que xAAt y t = xy. Aplicando esto a los vectores
de la base canonica concluimos que AAt = I, y tomando determinantes vemos
que |A|2 = 1, luego |A| = 1.
De este modo, si D V y 1 [D] es un dominio de integraci
on en Rd , el
1
1
teorema 7.27 nos da que [ [D]] = [D] tambien lo es, y el teorema de

250

Captulo 7. C
alculo integral de varias variables

cambio de variable nos da que





f ( (t)) dt =
1 [D]

f ( ((t))) dt =

1 [ [D]]

f ((t)) dt.
1 [D]

(En realidad, tenemos esto probado bajo la hip


otesis de que f sea continua,
no meramente integrable, en D. Podramos probar el caso general, pero no
merece la pena.)
As pues, el calculo integral en V no depende de la base ortonormal elegida.
En particular, si tomamos V = Rd , concluimos que esta generalizacion de integral respecto de una base ortonormal coincide con la integral que ya tenamos
denida (respecto de la base can
onica).

7.6

Areas
de supercies

En esta seccion veremos como calcular el area de una supercie curva S.


Del mismo modo que no hemos denido el area de cualquier supercie plana,
sino u
nicamente de los dominios de integraci
on, tambien sera necesario que
la supercie sea razonable en alg
un sentido de la palabra. Concretamente,
vamos a considerar el caso en que S es la graca de una funci
on de clase C 1 .
En particular, esto signica que si aplicamos a S una homotecia de centro uno
de sus puntos y raz
on innita, obtenemos un plano. Dicho de otro modo: vista
a traves de una lupa de innitos aumentos, S es plana.
Dejando de lado de momento las homotecias innitas, una aproximaci
on al
area de A(S) (que queremos denir) puede obtenerse pegando en S peque

nos
cuadraditos. Pensemos, por ejemplo, en una esfera de un metro de radio cubierta
por cuadraditos de un milmetro cuadrado. Evidentemente, los cuadraditos no
se ajustan perfectamente a la esfera, porque son planos y cualquier fragmento
de esfera, por diminuto que sea, tiene cierto abombamiento. No obstante, el
producto del area de cada cuadradito por el n
umero de cuadraditos que hemos
necesitado para cubrir S, es una (buena) aproximaci
on al area que buscamos.
M
as a
un, podemos aceptar que, cuanto menores sean los cuadraditos, menor
sera el error de la aproximaci
on, de modo que A(S) podra verse como el lmite
de estas aproximaciones, cuando el area (o el lado) de los cuadraditos tiende
a 0.
Esto no es una denici
on operativa, porque no es f
acil denir en general
como deben ajustarse los cuadraditos para cubrir la supercie. No obstante,
de aqu podemos deducir una propiedad que, seg
un esto, debe tener el area que
pretendemos denir: si aplicamos a S (y a los cuadraditos) una homotecia Hr
de radio r < 1, los cuadraditos reducidos se ajustan incluso mejor a la supercie
reducida Hr , puesto que tambien se habr
an reducido los resquicios entre los
cuadraditos. Ahora bien, las areas de los cuadraditos se habr
an multiplicado por
r2 . Como esto vale para todas las aproximaciones de A(S) (para cuadraditos de
cualquier area), lo mismo ha de valer para el lmite, es decir, se ha de cumplir
que
A(Hr [S]) = r2 A(S).


7.6. Areas
de supercies

251

Puesto que S se obtiene de Hr [S] mediante una homotecia de radio 1/r, esta
relacion leda al reves nos dice que es valida igualmente cuando r > 1.
Otra propiedad elemental que est
a implcita en todo lo que venimos diciendo
es que si dos supercies (razonables) S1 y S2 solo comparten puntos de su
frontera, entonces se ha de cumplir que
A(S1 S2 ) = A(S1 ) + A(S2 ).
Consideramos ahora una funci
on estandar g : K R2 R de clase C 1 en
un dominio de integraci
on compacto K. (Esto signica, por denici
on, que g es
de clase C 1 en un abierto que contiene a K.) Su gr
aca es la imagen S = f [K]
de la aplicaci
on f : K R3 dada por
f (x, y) = (x, y, g(x, y)).
Nuestro prop
osito es llegar a una denici
on razonable del area A(S) que
respete los principios que acabamos de discutir. Observemos que f : K S
es un homeomorsmo, pues su inversa es la restriccion a S de la proyecci
on
R3 R2 en las dos primeras componentes. Podemos pensar en f como un
mapa plano de la supercie S.
En lugar de cubrir S con cuadraditos, tomamos
H1/r
un cuadrado Q que contenga a K y consideramos
S
una partici
on de Q en cuadrados innitesimales Qi
de lado r. Las imagenes en S de estos cuadrados
seran cuadrados algo deformados, pero no mucho,
en el sentido de que, tal y como veremos enseguida,
vistos con una lupa de 1/r aumentos, es decir, transK
formados por una homotecia de raz
on 1/r, resultan
ser indistinguibles de paralelogramos cuya area podremos calcular. En efecto,
pongamos que
Qi = [a, a + r] [b, b + r] K
y sea p = (a, b) K. (Est
a en K porque K es compacto). Llamamos = dp f
y sea Q1 = [0, 1]2 . Como f es estrictamente diferenciable en p, tenemos que,
para todo (x, y) Q1 , se cumple que
f (a + rx, b + ry) f (a, b) (rx, ry)
0.
r(x, y)
Llamemos
f (a + rx, b + ry)
f(x, y) =
,
r

y) = f (a, b) + (rx, ry) = f (a, b) + (x, y).


(x,
r
r

De este modo, cuando (x, y) recorre Q1 , tenemos que f (a+rx, b+ry) recorre
f [Qi ], y f(x, y) recorre f [Qi ] aumentado con una lupa de 1/r aumentos.
y) recorre f (a, b) + [Qi ] aumentado 1/r veces. Lo que hemos
Igualmente, (x,
probado es que
y),
f(x, y) (x,

252

Captulo 7. C
alculo integral de varias variables

de modo que cada punto de f[Q1 ] esta a distancia innitesimal de un punto de


1 ], y viceversa. En otros terminos, las imagenes f [Qi ] y f (a, b) + [Qi ] son
[Q
indistinguibles incluso si se amplan 1/r veces para volverlas apreciables.
Ahora introducimos un tercer principio que determine la denici
on de area
(recordemos que los otros dos han sido la aditividad de las areas y su compor 1 ] son apreciables e
tamiento ante las homotecias): si los conjuntos f[Q1 ] y [Q
indistinguibles entre s, sus areas han de ser indistinguibles, es decir:
1 ]).
A(f[Q1 ]) A([Q
1 ] ha de ser la
Como es la composicion de una traslaci
on, el area de [Q
misma que la de [Q1 ], y esta la hemos denido al nal de la seccion anterior, ya
que es una aplicaci
on lineal, luego [Q1 ] es un paralelogramo (plano). Usando
v para el area de un dominio de integraci
on plano (que s que tenemos denida),
lo que tenemos es que el concepto de area que pretendemos denir debe cumplir
la relaci
on
A(f[Q1 ]) v([Q1 ]).
Enseguida calcularemos el miembro derecho, que es un n
umero estandar no
nulo, por lo que podemos escribir:
A(f[Q1 ])
1.
v([Q1 ])
Puesto que f[Q1 ] es la imagen de f [Qi ] por una homotecia de radio 1/r,
teniendo en cuenta la relaci
on entre las areas y las homotecias, esto equivale a
A(f [Qi ])
1
rn v([Q1 ])
o, equivalentemente,
A(f [Qi ])
v([Q1 ]).
v[Qi ]
Nos ocupamos ahora de calcular el area del paralelogramo P = [Q1 ]. Seg
un
lo visto al nal de la secci
on anterior, para ello deberamos aplicar a P una
aplicaci
on lineal que lo transforme en un subconjunto de R2 conservando las
distancias, y calcular entonces el area de su imagen, pero podemos ahorrarnos
todo esto mediante un truco. Tenemos que
(1, 0) = (1, 0, gx ),
donde


g 
gx =
,
x p

(0, 1) = (0, 1, gy ),

g 
gy =
.
y p

Ahora observamos que v = (gx , gy , 1) cumple que


v(1, 0) = v(0, 1) = 0,


7.6. Areas
de supercies

253

es decir, que es perpendicular a P . Sea : R3 R3 la aplicaci


on lineal que
sobre la base canonica toma los valores
(e1 ) = (1, 0),

(e2 ) = (0, 1),

(e3 ) = v.

La imagen por del cubo unitario [0, 1]3 es el


paraleleppedo de base P y altura
v =
(e3 )

(e2 )
e2

(e1 )
e1



1 
v(P ) =
v 
Si llamamos (p) =


1 + gx2 + gy2 ,

luego su volumen es vv(P ). Por otra parte,


sabemos que este volumen es el determinante de
, luego,

1
0
gx  
0
1
gy  = 1 + gx2 + gy2 .
gx gy 1 


1 + gx2 + gy2 (que, ciertamente, depende u
nicamente

del punto p), hemos probado que


A(Qi )
(p) (ai ),
v(Qi )
donde ai Qi es el vertice que antes llamabamos (a, b) p, y la u
ltima aproximacion se debe a que la funci
on (x, y) es continua en p. As, para cualquier
 > 0 estandar, tenemos que
xi  < a(Qi ) (ai )xi < xi 
y, sumando para los Qi K, tenemos que

xi  < a(K) (ai )xi < xi .


i

Ahora aplicamos el teorema 7.7, en virtud del cual, al tomar partes est
andar
obtenemos:

v(K) a(K)

(x) dx v(K).
K

Como esto vale para todo  > 0 estandar, ha de ser



a(K) =
(x) dx.
K

En denitiva, llegamos a la siguiente denici


on:

254

Captulo 7. C
alculo integral de varias variables

Denici
on 7.30 Sea g : K R una aplicaci
on de clase C 1 denida sobre
un dominio de integraci
on compacto K R2 . Denimos : K R como la
funci
on dada por
'
 2  2
g
g
(x) = 1 +
+
.
x
y
Entonces, el area de la gr
aca de g se dene como

A=
(x) dx.
K

Ejemplo Vamos a calcular de nuevo el area de una esfera de radio R. Para


ello calculamos, en realidad, el area de una semiesfera, que es la graca de la
funci
on

f (x, y) = R2 x2 y 2 ,
denida sobre el crculo C = {(x, y) R2 | x2 + y 2 R}.
Tenemos un problema y es que f no es derivable en los puntos de la circunferencia, as que calcularemos el area de la gr
aca sobre el conjunto
C+ = {(x, y) R2 | x2 + y 2 R },
lo que nos sit
ua en las condiciones de la denici
on que hemos dado, y luego
haremos tender  a 0. Para ello calculamos:
'
x2
y2
(x, y) = 1 + 2
+
R x2 y 2
R2 x2 y 2
R

=

R2 x2 y 2

As pues, el area que queremos calcular es



R dxdy

.
2
R x2 y 2
C
Aplicamos el cambio a coordenadas polares: x = cos , y = sen , con lo
que

  R+
R dxdy
d


=R
d
2
2
2
R x y
R 2 2
C
0
 
R+

= 2R R2 2
= 2R2 2R R2 (R )2
0

Haciendo tender  a cero, es claro que el area de la semiesfera es 2R2 , luego


el area de la esfera es 4R2 , como ya sabamos.


7.6. Areas
de supercies

255

Ejemplo ahora vamos a calcular el area de la semiesfera de radio R situada


bajo el crculo de centro (R/2, 0) y radio R/2.
El tri
angulo de la gura es is
osceles. El maximo valor
de para un angulo > 0 dado es el que cumple

R
R/2

cos =

/2
,
R/2

es decir, = R cos . Para evitar el problema de que el


integrando (el mismo del ejemplo anterior) no es derivable en (R, 0), calcularemos la integral en el semicrculo superior, y nos restringiremos al compacto K+
determinado por  /2. As,

K


=R

R dxdy

=R
R2 x2 y 2

/2


+

/2

R cos


 
R cos
R 2 2
d = R
0

/2

R2 [ + cos ]+

d
R 2 2

/2

(R R sen ) d

= R2 /2 R2 ( + cos ).

Haciendo tender  a cero y multiplicando por 2 (porque hemos integrado s


olo
en el semicrculo superior) queda que el area buscada es
A = R2 2R2 .
En muchos libros se llama b
oveda de Viviani a la supercie cuya area acabamos de calcular, pero el nombre es historicamente incorrecto. Vincenzo Viviani
fue un discpulo de Galileo que, en cierta ocasi
on, plante
o (y resolvi
o) el siguiente
problema:
Encontrar la forma de perforar dos ventanas en una b
oveda semiesferica de modo que el a
rea de la supercie resultante sea cuadrable.
Cuadrable signica que pueda construirse un cuadrado de la misma area.
En la pr
actica, quiere decir que el area no dependa de . La soluci
on al problema
de Viviani consiste en eliminar la supercie de la b
oveda que queda sobre dos
crculos tangentes de radio R/2. Seg
un acabamos de calcular, cada una de estas
dos ventanas tiene area R2 2R2 , el area de las dos juntas es 2R2 4R2
y, como el area de la semiesfera es 2R2 , el area de la b
oveda sin las ventanas
resulta ser A = 4R2 .

256

Captulo 7. C
alculo integral de varias variables

As pues, la b
oveda de Viviani, la b
oveda que resuelve el problema de Viviani,
no es el fragmento de esfera situado sobre el crculo, sino la semiesfera perforada
con los dos agujeros o ventanas:

Para terminar, vamos a comparar la denici


on que hemos dado del area de
una gr
aca con la denici
on 4.27 del area de una supercie de revoluci
on. Una
supercie de revoluci
on no es la gr
aca de ninguna funci
on, pero la mitad de
ella s que lo es.
r(x)

Si la supercie viene determinada por


una funci
on r(x), la mitad de la supercie
correspondiente a los puntos
con z > 0 es
la gr
aca de la funci
on z = r(x)2 y 2 ,
sobre el dominio

z
y

D = {(x, y) R2 | a x b, r(x) y r(x)}.


Para calcular el area seg
un la denici
on 7.30 calculamos:
z
rr
,
=
x
r2 y2
con lo que

z
y
,
=
y
r2 y2


r(x)
(x, y) = 
1 + r (x)2 .
2
2
r(x) y

El area sera:


r(x)

A=
a

r(x)

r(x)
r(x)2 y 2

1 + r (x)2 dydx.

Observemos que el integrando no est


a denido cuando y = r(x). En principio tendramos que restringir la integral a un dominio menor y luego tomar
lmites, como ya hemos hecho en otras ocasiones. Dejamos esta precision a

7.7. Apendice: Descomposicion de aplicaciones lineales

257

cargo del lector. Para calcular la integral interior hacemos el cambio de variable
y = r(x) sen , con lo que el area es


/2

/2

1 
1 + r (x)2 r(x) cos ddx =
cos

=

/2

1 + r (x)2 r(x) ddx

/2

1 + r (x)2 r(x) dx,

que es la mitad del valor dado por la denici


on 4.27 (porque estamos calculando
el area de la mitad de la supercie de revoluci
on).

7.7

Ap
endice: Descomposici
on de aplicaciones
lineales

Demostramos aqu el resultado sobre descomposicion de aplicaciones lineales


biyectivas en aplicaciones elementales que hemos utilizado en la prueba del
teorema 7.27, a saber:
Teorema 7.31 Toda aplicaci
on lineal biyectiva f : Rd Rd se puede expresar
como composici
on de un n
umero nito de aplicaciones lineales g de uno de los
tres tipos siguientes:
a) g permuta los vectores e1 , . . . , ed de la base can
onica de Rd .
b) g(e1 ) = re1 y g(ei ) = ei para i > 1, donde r R es no nulo.
c) g(e1 ) = e1 + e2 y g(ei ) = ei , para i > 1.
n: Sea A la matriz asociada a f en la base canonica. Es
Demostracio
conocido que f puede transformarse en una matriz diagonal de la forma

..

D=

..

.
0
mediante un n
umero nito de operaciones elementales de los tipos siguientes:
a) permutar dos las o columnas,
b) multiplicar una la o columna por un n
umero real no nulo,
c) sumar a una la o columna otra multiplicada por un n
umero.
En efecto, los pasos a seguir son los siguientes:

258

Captulo 7. C
alculo integral de varias variables
Si A = (aij ) tiene alg
un coeciente no nulo, podemos permutar sus las y
columnas hasta conseguir que a11 = 0. (En caso contrario, A ya tiene la
forma indicada.)
Dividiendo la primera la entre a11 conseguimos que a11 = 1.
Sumando a cada columna i > 1 la primera multiplicada por a1i conseguimos que a1i = 0, y operando igualmente con las conseguimos que
ai1 = 0.
As llegamos a una matriz de la forma

1 0 0
0

..


.

A
0

para una cierta submatriz A . Repetimos el proceso con A hasta llegar a una
submatriz nula.
Ahora observamos que cada operaci
on elemental sobre una matriz se puede
conseguir multiplic
andola por la izquierda o por la derecha (seg
un que se haga
sobre las o sobre columnas) por una de las siguientes matrices elementales:

j
1

..

.
0

1
..

.
0

..

k
1

..

..

r
..

.
..

.
..

.
1

j
1

..

.
r
..

.
1

La primera permuta las las o columnas i, j, la segunda suma a la la o


columna j-esima la k-esima multiplicada por r, y la tercera multiplica la la o
columna j-esima por r.
As pues llegamos a una ecuacion de la forma
E1 En AE1 En  = D,

7.7. Apendice: Descomposicion de aplicaciones lineales

259

donde las matrices Ei y Ei son elementales. Ahora bien, todas las matrices
elementales tienen determinante diferente de 0, y A tambien (porque f es biyectiva), luego D tambien ha de tener determinante diferente de 0, lo cual s
olo
puede suceder si D es la matriz identidad.
Por otra parte, la inversa de una matriz elemental es tambien una matriz
elemental (la inversa de la matriz que multiplica una la o columna por r es
la que la multiplica por 1/r, y la inversa de la matriz que suma a una la o
columna otra multiplicada por r es la que suma la otra multiplicada por r).
Por consiguiente, podemos despejar A y expresarla como producto de matrices
elementales.
Equivalentemente, la aplicaci
on lineal f es composicion de aplicaciones denidas por matrices elementales. Una aplicacion lineal g denida por una matriz
elemental esta en uno de los casos siguientes:
a) Permuta los vectores de la base canonica.
b) g(ei ) = rei , g(ej ) = ej para j = i.
c) g(ei ) = ei + rej , g(ek ) = ek para k = i.
Si g esta en el caso c) puede descomponerse como sigue: permutamos los
vectores de la base canonica para que ei  e1 y ej  e2 (tipo a), hacemos
e2  re2 (tipo b), hacemos e1  e1 + e2 , hacemos e2  (1/r)e2 (tipo b),
invertimos la permutaci
on inicial (tipo a).
Por consiguiente, podemos reducir el caso c) a g(e1 ) = e1 + e2 .
Por u
ltimo, si g esta en el caso b) puede descomponerse as: permutamos los
vectores de la base canonica de modo que ei  e1 , hacemos e1  re1 y deshacemos la permutacion inicial. As hemos descompuesto f en homomorsmos de
los tipos indicados en el enunciado.

Ap
endice A

La teora de Nelson
Describimos aqu una teora axiom
atica de conjuntos en la que pueden formalizarse todos los resultados expuestos en los captulos precedentes de este
libro exactamente en el mismo sentido en que los resultados expuestos en cualquier libro de an
alisis estandar pueden formalizarse en la teora de conjuntos
ZFC. Se trata de la teora expuesta por Nelson en [4].
El lenguaje formal de la teora de Nelson consta de los signos logicos usuales
mas el relator (di
adico) de pertenencia y un relator mon
adico st. Convendremos en leer la formula st x como el conjunto x es est
andar.
Las expresiones del lenguaje de la teora de Nelson pueden dividirse en internas, si no contienen el relator st, y externas si lo contienen. Equivalentemente,
las expresiones internas son las expresiones del lenguaje de ZFC.
Pasamos ahora a presentar los axiomas de la teora de Nelson. En primer
lugar:
Todos los axiomas de ZFC son axiomas de la teora de Nelson.
Como consecuencia, todos los teoremas de ZFC son tambien teoremas de la
teora de conjuntos de Nelson, sin cambio o precisi
on alguna. En particular, en
la teora de Nelson podemos usar todos los signos matematicos que se introducen
en ZFC a traves de deniciones: , x y, x y, f : A B, etc.
Notas Observemos que un teorema de ZFC (un esquema teorematico, en realidad), es el esquema de especicaci
on, en virtud del cual, si (x, x1 , . . . , xn ) es
cualquier f
ormula cualquier f
ormula del lenguaje de ZFC, es decir, cualquier
f
ormula interna del lenguaje de Nelson la f
ormula siguiente es un teorema:
)

1
) *
)
x1 xn A B x(x B x A (x, x1 , . . . , xn )).

Este teorema nos permite denir


{x A | (x, x1 , . . . , xn )}
261

262

Apendice A. La teora de Nelson

como el u
nico conjunto B que cumple el teorema anterior. Seg
un lo dicho, todo
esto sigue siendo valido en la teora de Nelson, pero ahora es crucial recordar
que la teora de Nelson (a falta de otros axiomas) s
olo nos permite especicar
subconjuntos mediante f
ormulas internas. Nada de lo dicho hasta aqu nos
legitima a extender el esquema de especicacion a f
ormulas externas. As, del
mismo modo que en ZFC no podemos asegurar la existencia de
R = {x | x
/ x}
porque no se esta restringiendo x a ning
un conjunto prejado A, en contra de
lo que exige el esquema de especicacion, en la teora de Nelson no podemos
asegurar la existencia de
{x N | st x},
ya que la f
ormula st x es externa.
M
as a
un, igual que en ZFC se puede demostrar que no existe ning
un conjunto
R cuyos elementos sean los conjuntos que no se pertenecen a s mismos, veremos
que en la teora de Nelson se puede demostrar que no existe ning
un conjunto
cuyos elementos sean los n
umeros naturales estandar.
Otra precauci
on relacionada con esta es tiene que ver con el principio de
inducci
on, en virtud del cual, si (n) es una f
ormula (tal vez con m
as variables
libres), se cumple que
)
)
((0) n N((n) (n + 1))) n N (n).
Nuevamente, el hecho de que esto sea un esquema teorematico de ZFC implica que tambien lo sea de la teora de Nelson, pero solo para f
ormulas internas.
As pues, en la teora de Nelson no son v
alidos los razonamientos por inducci
on
respecto a formulas externas. Decimos que esto esta relacionado con el caso
anterior porque el principio de inducci
on se demuestra en ZFC considerando el
conjunto
A = {n N | (n)},
y probando que A = N. Si la f
ormula es externa, entonces la existencia de
A no puede deducirse de los axiomas de ZFC y, por consiguiente, tampoco de
los axiomas de la teora de Nelson que hemos visto hasta ahora (que son los
mismos).
La teora de Nelson consta de los axiomas de ZFC mas tres esquemas axiomaticos adicionales. Para enunciarlos conviene introducir la notaci
on siguiente: si
es una f
ormula, escribiremos
)st
)
*st
*
x x(st x ),
x x(st x ).
Principio de Transferencia Si (x, x1 , . . . , xn ) es una f
ormula interna cuyas variables libres sean exactamente las indicadas, la f
ormula siguiente es un
axioma:
)st
)st
)
x1 xn ( x(x, x1 , . . . , xn ) x(x, x1 , . . . , xn )).

263

Equivalentemente, (considerando el axioma correspondiente a e invirtiendo la implicaci


on)
)st

*
*st
x1 xn ( x(x, x1 , . . . , xn )
x(x, x1 , . . . , xn )).

Informalmente, el principio de transferencia puede enunciarse as:


Si todo conjunto est
andar cumple una propiedad interna que depende a lo sumo de par
ametros est
andar, entonces todo conjunto
(est
andar o no) cumple dicha propiedad. Equivalentemente, si existe
un conjunto (est
andar o no) que cumple una propiedad interna con
par
ametros est
andar, entonces existe un conjunto est
andar que tambien la cumple.
Como primera consecuencia:
Teorema A.1 Si t(x1 , . . . , xn ) es un termino interno cuyas variables libres
sean exactamente las indicadas, entonces
)st

x1 xn st t(x1 , . . . , xn ).

n: Basta considerar la f
Demostracio
ormula x = t(x1 , . . . , xn ). El principio
de transferencia nos da que
)st

*
*st
x1 xn ( x(x = t(x1 , . . . , xn ))
x(x = t(x1 , . . . , xn )).

Fijados conjuntos est


andar x1 , . . . , xn , es trivialmente cierto que existe un
conjunto x = t(x1 , . . . , xn ), luego deducimos que existe un x estandar que cumple x = t, en denitiva, que t(x1 , . . . , xn ) es estandar.
As, por ejemplo, ahora podemos asegurar que
st ,

st N,

st 250,

st

y, en general, que cualquier conjunto denible explcitamente en ZFC es estandar.


Si una denici
on tiene par
ametros, entonces hemos de exigir que los parametros
sean estandar. Por ejemplo:
)st

xy st(x y),
)st

)st

xy st(x y),

)st

xy st{x, y},

mn(m N n N st(m + n)),

etc.

En palabras: la uni
on de conjuntos est
andar es un conjunto est
andar, la
interseccion de conjuntos est
andar es un conjunto est
andar, el par formado por
dos conjuntos est
andar es un conjunto est
andar, la suma de n
umeros naturales estandar es un n
umero natural est
andar, y, en general, cualquier conjunto

264

Apendice A. La teora de Nelson

construido a partir de conjuntos est


andar mediante una construcci
on denible
en ZFC, es estandar.1
Otra consecuencia del principio de transferencia es la siguiente:
Teorema A.2 Si dos conjuntos est
andar tienen los mismos elementos est
andar,
entonces son iguales.
n: Dados dos conjuntos est
Demostracio
andar x e y, la hip
otesis es que
)st
u(u x u y).
El principio de transferencia nos permite pasar a
)
u(u x u y),
lo cual implica que x = y.
As pues, si dos conjuntos est
andar tienen los mismos elementos estandar, automaticamente tienen tambien los mismos elementos no estandar. En particular,
si a un conjunto est
andar le quitamos un elemento no est
andar, necesariamente
deja de ser estandar (o, si no, tendramos dos conjuntos estandar distintos con
los mismos elementos estandar).
El segundo axioma nos da la existencia de conjuntos no est
andar:
Principio de Idealizaci
on Si (x, y) es una f
ormula interna con al menos
las variables libres x, y, entonces la f
ormula siguiente es un axioma:
)st
* )
* )st
z(z nito x y z (x, y)) x y(x, y).
El miembro izquierdo del axioma arma que la f
ormula interna (x, y) determina una relaci
on concurrente, es decir, que dado cualquier familia est
andar
nita2 z de conjuntos existe un conjunto x relacionado con todos ellos. As, el
principio de idealizaci
on puede leerse as:
1 En

principio, si + representa la suma de numeros naturales (denida en ZFC), lo que

)st

mn st(m + n). Aqu hemos de entender que si m y n


nos da el teorema A.1 es que
no son n
umeros naturales, el termino m + n es una descripci
on impropia. Adoptamos el
convenio de que todas las descripciones impropias representan un mismo objeto, que podemos
especicar o no. Por ejemplo, podemos convenir (podemos tomar como axioma) que todas las
descripciones impropias son el conjunto vaco: (x | x = x) = . El principio de transferencia
nos obliga a elegir como descripci
on impropia un conjunto est
andar, ya que, como acabamos
de ver, permite probar que la descripci
on impropia es est
andar. Este convenio s
olo es u
til
en teora para que enunciados como el teorema A.1 tengan sentido sin necesidad de imponer
restricciones al termino t. En la pr
actica podemos particularizar f
ormulas como

)st

mn st(m + n)

)st

mn(m N n N st(m + n))

y as evitamos tratar con descripciones impropias.


2 La noci
on de nitud es, por supuesto, la usual, tal y como se dene habitualmente en
ZFC.

265
Una relaci
on interna (tal vez con par
ametros no est
andar) es concurrente si y s
olo si hay un conjunto relacionado con todos los conjuntos est
andar.
En la pr
actica no es frecuente trabajar con relaciones denidas sobre todos
los conjuntos, sino s
olo sobre un conjunto prejado. Por ello suele ser m
as u
til
la siguiente versi
on relativizada del principio:
Teorema A.3 Si (x, y) es una f
ormula interna con al menos las variables
libres x, y, entonces la f
ormula siguiente es un teorema:
) )st
* )
* )st

A
z(z A z nito x y z (x, y)) x y A(x, y) .
n: Aplicamos el principio de idealizaci
Demostracio
on a la f
ormula
(x, y) y A (x, y).
Si la relaci
on es concurrente en A, es decir, si cumple el miembro izquierdo
del enunciado, entonces, para cada conjunto z estandar y nito tenemos que el
conjunto z  = z A es estandar
anterior), es nito y est
a
* (por
) el teorema

(x,
y)),
y
esto
es
equivalente
a
contenido
en
A.
Por
hip
o
tesis
x
y

z
* )
que x y z (x, y). As pues, es concurrente, luego por el principio de
* )st
* )st
idealizaci
on x y (x, y), lo cual equivale a x y A(x, y). El recproco
se prueba igualmente.
El resultado b
asico sobre existencia de conjuntos no estandar es el siguiente:
Teorema A.4 Un conjunto es est
andar y nito si y s
olo si todos sus elementos
son est
andar.
n: Sea A un conjunto. Aplicamos el principio de idealizaci
Demostracio
on
a la relaci
on interna (x, y) = x A x = y, donde A aparece como parametro
(no necesariamente estandar). La relaci
on es concurrente si y solo si
)st
* )
z(z nito x y z(x A x = y))
o equivalentemente, si A no esta contenido en ning
un conjunto est
andar y nito z.
Por tanto, si A es estandar y nito, por el principio de idealizaci
on,
)
*st
xA
y x = y,
pero esto equivale a que todos los elementos de A son estandar.
Recprocamente, si todos los elementos de A son estandar el principio de
idealizaci
on implica que la relaci
on no es concurrente, y por tanto A esta
contenido en un conjunto est
andar y nito z. Entonces A es nito y A Pz.
Por el principio de transferencia, Pz es estandar y, como tambien es nito, la
parte ya probada permite concluir que Pz solo tiene elementos estandar. Luego
A es tambien estandar.
Otra consecuencia notable del principio de idealizaci
on es la siguiente:

266

Apendice A. La teora de Nelson

Teorema A.5 Existe un conjunto nito que contiene a todos los conjuntos
est
andar.
n: Basta aplicar el principio de idealizaci
Demostracio
on a la f
ormula
(x, y) y x x es nito.

Existen otras teoras de conjuntos no est


andar en las que no se cumplen
exactamente los mismos hechos basicos. En la teora de Nelson, el principio de
idealizaci
on es especialmente fuerte, por lo que de cara a traducir los resultados
a otras aproximaciones al an
alisis no estandar, conviene observar que, en las
aplicaciones usuales de la teora al an
alisis, la topologa, etc., nunca es necesario
usar el principio de idealizaci
on de Nelson en toda su generalidad, sino que en
la pr
actica es suciente con los teoremas A.3, A.4 y la siguiente version debil
del teorema anterior:
Teorema A.6 Todo conjunto A tiene un subconjunto nito B que contiene a
todos sus elementos est
andar.
n: Basta tomar F A, donde F es un conjunto nito que
Demostracio
contenga a todos los conjuntos est
andar.
Todos los resultados que hemos demostrado en los captulos precedentes de
este libro han usado u
nicamente el principio de idealizaci
on a traves del teorema
A.4 y, en contadas ocasiones, del teorema A.6 (resultados que en el captulo I
hemos llamado Principio de idealizaci
on I y II). El teorema A.3 es necesario,
por ejemplo, en el estudio de espacios topol
ogicos arbitrarios, no necesariamente
metrizables, estudio en el que no hemos entrado en este libro.
Ejemplo Ahora estamos en condiciones de demostrar algo que habamos armado mas arriba, a saber, que no existe
{x N | st x}
o, en otras palabras, que no existe ning
un conjunto cuyos elementos sean los
n
umeros naturales estandar. En efecto, si existiera tal conjunto, llamemoslo A,
entonces N \ A sera el conjunto de los n
umeros naturales no estandar, que es no
vaco, ya que N es innito, luego tiene elementos no estandar. Todo subconjunto
no vaco de N tiene un mnimo elemento. Sea, pues, el mnimo de N \ A. Se
trata de un n
umero natural no est
andar, luego ha de ser = 0, ya que st 0.
Por lo tanto, ha de ser = n + 1, para cierto n < . Por la minimalidad de ,
concluimos que n es estandar, pero entonces = n + 1 es suma de dos n
umeros
estandar, luego debera ser estandar, y tenemos una contradicci
on.
Vemos, pues, que en la teora de Nelson hay f
ormulas (externas) que no
denen conjuntos. Pese a ello, a menudo es u
til utilizar la notaci
on conjuntista
con estas formulas, es decir, hablar de
{x A | (x, x1 , . . . , xn )}

267
aunque la f
ormula sea externa. Esto sera lcito siempre y cuando cualquier
expresion que contenga un conjunto inexistente de este tipo pueda ser reformulada en terminos de . Por ejemplo, es u
til denir en general

A = {x A | st x}.

Antes hemos demostrado que no existe ning


un conjunto cuyos elementos
sean los n
umeros naturales estandar, es decir, que no existe N. Expresaremos
esto diciendo que N es un conjunto externo, de modo que los conjuntos externos
son esencialmente lo mismo que las clases propias en ZFC (y en la propia teora
de Nelson, pues, igual que podemos hablar de clases propias en ZFC, podemos
hacerlo en la teora de Nelson).
La diferencia entre conjuntos externos y clases propias es que llamamos clases propias a las colecciones de conjuntos denidas por f
ormulas que no denen
conjuntos porque no acotan la variable tal y como exige el esquema de especicacion, y llamamos conjuntos externos a las colecciones de conjuntos denidas
por f
ormulas que no denen conjuntos porque son externas. As, por ejemplo,
*
A = {x | y(x = {y})}
(la clase de todos los conjuntos con un elemento) es una clase propia, pero
B = {x N | st x}
(el conjunto de todos los n
umeros naturales no estandar) es un conjunto externo.
Notemos que tiene sentido armar, por ejemplo, que A B = , porque
con ello estamos diciendo algo que puede expresarse sin hacer referencia ni a
clases propias ni a conjuntos externos, a saber, que es imposible que un n
umero
natural sea no est
andar y tenga un u
nico elemento, ya que el u
nico n
umero
natural con un elemento es 1 = {0}, y es estandar.
En general, una armaci
on que involucre conjuntos externos ser
a admisible
en la teora de Nelson en la medida en que pueda reformularse sin hacer referencia a conjuntos externos. Por ejemplo, el teorema A.4 puede reenunciarse
como:
Un conjunto A es est
andar y nito si y s
olo si A = A.
Esto es admisible
precisamente porque la igualdad A = A puede sustituirse
)
por la f
ormula x A st x, en la que no aparecen conjuntos externos.
Este resultado muestra, por otra parte, que A no siempre es externo: Si A
es un conjunto est
andar y nito, entonces A es interno y estandar, porque es
el propio A.
A veces, a los conjuntos los llamaremos tambien conjuntos internos, por
oposicion a los conjuntos externos. As, podemos decir que N es un conjunto
interno, mientras que N es externo, pero debemos tener presente que decir que
N es un conjunto interno signica exactamente lo mismo que decir simplemente

268

Apendice A. La teora de Nelson

que es un conjunto, es decir, uno de los objetos de los que habla la teora de
Nelson.
El tercer esquema axiomatico que completa la teora de Nelson nos permite
denir conjuntos a partir de f
ormulas externas, pero no en el mismo sentido en
que lo hace el esquema de especicacion:
Principio de Estandarizaci
on Si (z) es una f
ormula (interna o externa)
con al menos la variable libre x, entonces la f
ormula siguiente es un axioma:
)st *st )st
x
y z(z y z x (z)).
Dado un conjunto est
andar x, el conjunto y que postula el principio de
estandarizaci
on es u
nico en virtud del teorema A.2, y podemos llamarlo
S

{z x | (z)}.

Aqu es esencial recordar que este conjunto no esta formado por los elementos
z x que cumplen (z), sino que sus elementos estandar son los elementos
estandar z x que cumplen (z), pero que, aparte, puede tener otros elementos
no estandar, sobre los que en principio no podemos decir nada.
Podemos pensar en A  SA como una operaci
on que asigna un conjunto
estandar a cada conjunto externo (su estandarizaci
on), pero tambien podemos
estandarizar conjuntos internos: si A es un conjunto interno, podemos denir
A = S {x A | x A},

que es el conjunto estandar que tiene los mismos elementos estandar que A. As,
es claro que un conjunto A es estandar si y s
olo si A = SA.
Veamos un ejemplo detallado del uso de los principios de transferencia y
estandarizaci
on, que nos proporciona un ejemplo m
as en el que un conjunto A
puede ser interno:
Teorema A.7 Si A es un conjunto nito con un n
umero est
andar de elementos,
entonces A = SA. En particular, A es un conjunto interno, est
andar y nito.
n: Por hip
Demostracio
otesis, existe un n
umero natural est
andar n y una
aplicaci
on biyectiva f : In A, donde In = {m N | m n}. Llamamos
g = Sf . As, todo elemento estandar de g es un elemento de f , luego
)st
*
x g ma(m In a A x = (m, a)).
Como la f
ormula que sigue al cuanticador inicial es interna, podemos aplicar
el principio de transferencia y concluir que g In A. Similarmente, si m In ,
tenemos que
)st
ab((m, a) g (m, b) g a = b),

269
ya que si (m, a) g con m y a estandar, entonces (m, a) es estandar, luego
(m, a) f , e igualmente (m, b) f , y f es una funci
on. (Observemos que
m es estandar, porque In es estandar y nito, luego todos sus elementos son
estandar.)
Ahora podemos aplicar el principio de transferencia porque la f
ormula tras
el cuanticador inicial es interna y porque el u
nico par
ametro que aparece en
ella es g, es es un conjunto estandar. La conclusi
on es que g es una funci
on.
Similarmente, si m1 , m2 In ,
)st
a((m1 , a) g (m2 , a) g m1 = m2 ),
luego, aplicando el principio de transferencia (lo cual es lcito porque los par
ametros g, m1 y m2 son estandar), concluimos que g es inyectiva.
andar, porque el dominio
Sea D In el dominio de g, que es un conjunto est
de una funci
on estandar ha de ser un conjunto est
andar. Si m D, entonces
g(m) es estandar (porque lo son m y g), luego (m, g(m)) g implica que
(m, g(m)) f , lo que a su vez implica que g(m) A o, mas concretamente,
g(m) A. As pues, g[D] A.
Recprocamente, si a A, existe un m In tal que (m, a) f . Como m y
a son ambos estandar, tambien lo es (m, a), luego (m, a) g, luego a g[D].
En denitiva, A = g[D] es un conjunto est
andar y nito (porque la imagen de
un conjunto est
andar por una aplicaci
on estandar es un conjunto est
andar).
Como A es un conjunto est
andar que contiene los mismos elementos estandar
que A, ha de ser A = SA.
Otra aplicaci
on sencilla del principio de estandarizaci
on es la posibilidad
de denir una funci
on estandar especicando u
nicamente las imagenes de los
elementos estandar de su dominio:
Teorema A.8 (Principio de extensi
on) Si X e Y son conjuntos est
andar
y f : X Y es una aplicaci
on externa, entonces existe una aplicaci
on
est
andar f : X Y que extiende a f .
n: Hay que entender que f es cualquier criterio que asigna
Demostracio
a cada elemento estandar de X un u
nico elemento estandar de Y . M
as concretamente, el enunciado supone que existe una f
ormula (x, y) (tal vez con
par
ametros) de modo que se demuestra que
)st

xX

1
*
st

y Y (x, y).

Denimos f = S {(x, y) X Y | (x, y)}. As, los elementos estandar de

f son pares ordenados de X Y y para todo x X estandar existe un u


nico
y Y tal que (x, y) f. Aplicando el principio de transferencia a estos hechos
concluimos que f : X Y , y claramente extiende a f .
El interes del principio de extensi
on es que, la forma de asignar un elemento
estandar de Y a cada elemento estandar de X puede expresarse mediante una

270

Apendice A. La teora de Nelson

f
ormula externa y, pese a ello, la aplicaci
on nal f : X Y sera estandar.
M
as en general, podemos denir un concepto mediante una f
ormula externa y,
si restringimos el alcance de la denicion a conjuntos est
andar, podemos exigir
que el conjunto de todos los objetos que cumplen la denici
on sea estandar.
Remitimos a la denicion 2.29 y las explicaciones posteriores para ilustrar esta
posibilidad, fundamental para una exposici
on natural del an
alisis no estandar.

Ap
endice B

La teora de Hrbacek
En este apendice expondremos la teora de conjuntos no est
andar presentada
por K. Hrbacek en [2], que se diferencia de la de Nelson en que formaliza la
noci
on de conjunto externo. Nos referiremos a ella como H.
El lenguaje de ZFC est
a formado por las variables x, y, z, . .)
. , por los
dos relatores , =, el negador , el implicador , el generalizador
y por el
descriptor |.
Consideraremos como axioma de ZFC que todas las descripciones impropias
son el conjunto vaco, es decir: x|(x = x) = . Formalmente esto ha de
entenderse como un axioma a
nadido a los axiomas de ZFC, pero en realidad es
una denici
on: estamos conviniendo que todo lo que este mal denido es por
denici
on el conjunto vaco. En la pr
actica nunca vamos a trabajar con nociones
mal denidas, pero al tratar sistem
aticamente con expresiones arbitrarias hemos
de contemplar la posibilidad de que sean descripciones impropias. En cuanto
hayamos justicado la existencia del conjunto vaco en H adoptaremos tambien
este axioma en la teora de Hrbacek.
Cualquier otro signo lo consideraremos como una abreviatura de una expresi
on que contenga u
nicamente estos signos. Por ejemplo,
x y x z (x y) x z.
No consideramos a los parentesis como signos de nuestro lenguaje, pues teoricamente pueden suprimirse a condici
on de alterar la sintaxis del lenguaje.
El lenguaje de la teora de Hrbacek consta de los signos del lenguaje de ZFC
mas dos nuevos relatores st x (x es estandar) e in x (x es interno). Si es una
f
ormula, usaremos las abreviaturas
)st
*st
)in
*in
x,
x,
x,
x
con los signicados obvios. Cuando hablemos de f
ormulas de ZFC entenderemos
que son f
ormulas en las que no aparecen los relatores que acabamos de introducir,
mientras que si hablamos de f
ormulas de H entenderemos que pueden contener
estos relatores.
271

272

Apendice B. La teora de Hrbacek

Para indicar que un conjunto es arbitrario, no necesariamente interno, diremos que es externo. Cuando queramos indicar que no es interno diremos que es
estrictamente externo.
La idea b
asica que debe guiarnos es que los conjuntos estandar de H se
corresponden con los conjuntos est
andar de la teora de Nelson, los conjuntos
internos de H se corresponden con los conjuntos de la teora de Nelson (los
que existen formalmente, es decir, los internos) y los conjuntos estrictamente
externos de H se corresponden con los conjuntos externos de la teora de Nelson,
de los que solo tiene sentido hablar metamatem
aticamente.1
Desgraciadamente, no podemos suponer que los conjuntos externos satisfacen la axiomatica completa de ZFC. Nos tendremos que limitar a la axiomatica
de Zermelo incluido el axioma de eleccion, es decir, suprimimos el axioma de
reemplazo e incluimos el axioma de especicacion. Como contrapartida, extendemos dicho axioma a f
ormulas arbitrarias de H, luego, a diferencia de lo que
sucede en la teora de Nelson, podemos usar libremente los relatores st e in
para denir conjuntos (lo que suceder
a es que por regla general los conjuntos
denidos con estos relatores seran estrictamente externos). Explcitamente, los
axiomas b
asicos son los siguientes:
) )
Extensionalidad
xy( u(u x u y) x = y),
) * )
Par
xy z u(u z u = x u = y),
) * )
n
Unio
x y u(u x u y),
n
Especificacio

Partes
n
Eleccio

Para toda f
ormula (u, x1 , . . . , xn ) de H,
) * )
x y u(u y u x (u, x1 , . . . , xn )),
) * )
x y u(u x u y),
Todo conjunto admite un buen orden.

El conjunto cuya existencia postula el axioma de especicaci


on es u
nico por
extensionalidad, y es el que se representa usualmente por
{u x | (u, x1 , . . . , xn )}.
Notemos que de aqu se sigue la existencia de un conjunto sin elementos
(tomando (u) u = u), por lo que no hemos necesitado el axioma del conjunto
vaco. Tampoco hemos incluido el axioma de innitud porque se deducir
a de
los axiomas restantes. Veremos luego que el axioma del reemplazo y el axioma
de regularidad son contradictorios con los otros axiomas de H.
La supresi
on del axioma de reemplazo solo hace que la teora de conjuntos
se resienta en lo concerniente a la teora de ordinales y cardinales. Por ejemplo,
no es posible demostrar la existencia del ordinal 2, por lo que un conjunto
bien ordenado no tiene por que tener asociado un ordinal. Sin embargo, los
1 En realidad los axiomas de H determinan propiedades ligeramente distintas para los conjuntos internos que los axiomas de Nelson. Las diferencias son mnimas, pero debemos tener
presente que la correspondencia entre ambas es aproximada.

273
resultados que no dependen directamente de estas nociones (lo cual incluye a
los resultados b
asicos del algebra, la topologa o del an
alisis) siguen disponibles
en esta teora.2 En particular disponemos de todo el lenguaje conjuntista b
asico:
aplicaciones, relaciones, etc.
Introducimos ahora dos axiomas que en la teora de Nelson son triviales,
pues en ella todo conjunto es interno:
)st
n:
Inclusio
x in x
(Todo conjunto est
andar es interno.)
)in )
Transitividad:
x u(u x in u) (Los elementos de los conjuntos
internos son internos.)
El axioma de transitividad arma que al introducir los conjuntos externos
en la teora no estamos modicando los conjuntos internos, en el sentido de que
no les a
nadimos elementos.
Ahora debemos insistir en que una armaci
on que en la teora de Nelson
empiece por para todo n
umero natural. . . equivale a una armaci
on de H que
empiece por para todo n
umero natural interno. . . Para formalizar esta idea
hemos de introducir la noci
on de relativizaci
on de una f
ormula:
Si es una expresion de ZFC, denimos in como la expresion determinada
por las reglas siguientes:
a) xin x,
b) (x = y)in x = y,

(x y)in x y,

c) ()in in ,
d) ( )in in in ,
)
)in in
e) ( x)in
x ,
f) (x|)in x|(in x in ).
Son claras las identidades
( )in in in ,

( )in in in ,

( )in in in ,

as como las equivalencias logicas


*
*in in
( x)in
x ,

1
1
*
*
y ( x)in x(in x in ).

Por ejemplo y basta aplicar las reglas correspondientes a


la implicaci
on y a la negaci
on. Lo mismo sucede con la conjunci
on
( ) y la coimplicaci
on ( ) ( ).
2 Un uso elemental del esquema de reemplazo es la prueba de la existencia de x y, pero
teniendo en cuenta que (u, v) = {{u}{u, v}}, podemos obtener x y por especicaci
on desde
P(P(x y)).

274

Apendice B. La teora de Hrbacek


Para el cuanticador existencial tenemos que

)
x x, luego

*
)in
( x)in xin .
*in in
Esto no es exactamente lo mismo que
x , pero ambas f
ormulas*son
l
ogicamente equivalentes, luego en la pr
actica relativizar un cuanticador
es
*in
cambiarlo por
. Similarmente sucede con la existencia u
nica.
Ejemplo Veamos un ejemplo del funcionamiento de esta noci
on. Todava
no estamos en condiciones de justicar nada de lo que vamos a decir. Este
ejemplo es meramente orientativo.
Ahora tenemos que distinguir entre el conjunto N de los n
umeros naturales
y el conjunto Nin de los n
umeros naturalesin . El primero es el conjunto de los
n
umeros naturales (externos) construido a partir de los axiomas de Zermelo.
Por ejemplo, podemos denir N como la interseccion de todos los conjuntos
(externos) que contienen a 0 = y que si contienen a un conjunto n contienen
tambien a n + 1 = n {n}. Con esta denici
on se prueba que N solo contiene
n
umeros estandar. La prueba se basa en que podemos denir el conjunto
X = {n N | st n},
(lo cual no es lcito en la teora de Nelson) y demostrar que
0X

n X n + 1 X.

Por denici
on de N tenemos que N X, luego N = X.
Por otra parte, Nin es la interseccion de todos los conjuntos internos que
contienen a 0 y que si contienen a n contienen a n {n}. El conjunto X resulta
ser estrictamente externo, luego no forma parte de la interseccion que estamos
considerando. El resultado es que N Nin , pero el segundo contiene muchos
conjuntos que no est
an en N, conjuntos que son n
umeros naturalesin , pero no
son n
umeros naturales. Demostraremos que N = {n Nin | st n}.
El siguiente grupo de axiomas de H es:
ZFCin : Si es un axioma de ZFC, entonces3 in es un axioma de H.
En otras palabras, los conjuntos internos (al igual que en la teora de Nelson)
cumplen ZFC. El hecho de que los conjuntos externos no cumplan todo ZFC no
tiene gran importancia, pues debemos tener presente que el objeto de la teora
H es estudiar los conjuntos internos como herramienta a su vez para el estudio
de los conjuntos est
andar. Los conjuntos externos son un mero auxiliar.
3 Aqu
suponemos que los axiomas de ZFC no tienen variables libres. En el caso del axioma
del reemplazo, donde aparece una f
o)
rmula que puede tener par
ametros x1 , . . . , xn , hay que
entender que el axioma empieza con x1 xn .

275
* )
Ejemplo El axioma del conjunto vaco en ZFC arma que x y x
/ y, es
decir, existe un conjunto sin elementos. )
Por el axioma de extensionalidad es
u
nico, lo que justica la denici
on x| y y
/ x.
*in )in
Ahora tenemos que
x yx
/ y es un axioma de H, es decir, existe un
conjunto interno sin elementos internos. A este conjunto lo deberamos llamar
)in
in x|(in x y y
/ x). Ahora bien, como los conjuntos internos s
olo pueden
tener elementos internos concluimos que in no tiene elementos en absoluto,
luego es simplemente in = . En particular tenemos que es interno.
Veamos un resultado trivial:
Teorema B.1 Sea t(x1 , . . . , xn ) un termino del lenguaje de ZFC con las varia)in
bles libres indicadas. Entonces se prueba en H que
x1 . . . xn in tin .
n: Un termino ha de ser necesariamente una variable t x,
Demostracio
en cuyo caso el teorema es trivial, o bien una descripci
on t x|(x, x1 , . . . , xn ),
nico x interno que cumple in si es que existe (y entonces
y entonces tin es el u
es interno) o bien es (x|x = x) = si no existe (y tambien es interno).
En la teora de Nelson, al suponer todos los axiomas de ZFC tenemos automaticamente todos los teoremas de ZFC. El analogo para H no es igual de
inmediato, pero tambien se cumple:
Teorema B.2 Si es un teorema de ZFC sin variables libres, entonces in es
un teorema de H.
La prueba de este teorema es una comprobacion rutinaria basada en la denici
on de demostracion que proporciona la l
ogica matematica: una f
ormula
es un teorema de ZFC si se deduce en un n
umero nito de pasos a partir de los
axiomas de ZFC y de los axiomas logicos mediante la aplicacion de ciertas reglas
de inferencia. Se comprueba que si es un axioma l
ogico (con variables libres
)in
in
x1 , . . . , xn ) entonces
x1 xn es un teorema de H; por otra parte, si es
un axioma de ZFC entonces in es un axioma de H; nalmente, se comprueba
que si se deduce de otras formulas mediante una regla de inferencia, entonces
)in
x1 xn in puede demostrarse en H a partir de las relativizaciones de las
premisas. De aqu se sigue facilmente el teorema. La demostracion es constructiva, en el sentido de que permite obtener explcitamente la demostracion en H
de cualquier f
ormula in sin variables libres a partir de la demostraci
on de en
ZFC.
Hemos demostrado que in = , y hemos anunciado que Nin = N. Vamos a
ver ahora que la relativizaci
on a conjuntos internos es trivial para los conceptos
b
asicos de la teora de conjuntos, es decir, que en la medida de lo posible
los conceptos internos coinciden con los externos. Para ello introducimos el
concepto siguiente:
Denici
on B.3 Diremos que un termino t(x1 , . . . , tn ) de ZFC es absoluto si
)in
x1 xn tin (x1 , . . . , xn ) = t(x1 , . . . , xn ).

276

Apendice B. La teora de Hrbacek


Una f
ormula (x1 , . . . , xn ) de ZFC es absoluta si
)in
x1 xn (in (x1 , . . . , xn ) (x1 , . . . , xn )).

Por ejemplo, hemos demostrado que es absoluto. El teorema siguiente nos


permite reconocer muchas expresiones absolutas:
Teorema B.4 Se cumple
a) Un termino t es absoluto si y s
olo si lo es la f
ormula x = t, donde x es
una variable que no este libre en t.
b) Si una f
ormula es equivalente en la teora de Zermelo Z a una f
ormula
absoluta entonces es absoluta.
c) x = y y x y son f
ormulas absolutas.
d) Si y son f
ormulas absolutas, tambien lo son , , , ,
1
)
*
*
, x y , x y , x y , x|(x y ).
e) Si (x1 , . . . , xn ) es una expresi
on absoluta y t1 , . . . , tn son terminos absolutos, entonces (t1 , . . . , yn ) tambien es absoluta.
n: a) Si x = t es absoluta tenemos que
Demostracio
)
x1 xn x(x = tin x = t),
y sustituyendo x por tin obtenemos que tin = t. El recproco es similar.
)
b) Si en Z tenemos x1 xn ( ), entonces en H tenemos
)in
)
x1 xn (in in ), y
x1 xn ( ).
)in
En particular
x1 xn ( ), con lo que la conclusi
on es clara.
c) es inmediato.
d) La prueba para y es inmediata. Para los conectores restantes
se deduce de estos dos casos. Para el cuanticador universal tenemos que probar
que
)
)in
)in
x1 xn y( x y
x y in ).
Como es absoluta tenemos que
)in
)in
)in
x1 xn y( x y
x y in ),
pero el axioma de transitividad nos permite cambiar el primer
que los elementos de y son necesariamente internos.

)in

x por

x, ya

El caso del cuanticador existencial puede reducirse al anterior o demostrarse


an
alogamente. Para el cuanticador con unicidad tenemos que
1
*

x y

)
z y x y( x = z),

luego tambien se reduce a los casos anteriores.

277
Por u
ltimo, jados x1 , . . . , xn , y internos, tenemos que un conjunto x cumple
x y si y solo si es interno y cumple x y in , pues x y ya implica
que x es interno y como es absoluta in equivale a . Por consiguiente, o
bien existe un u
nico conjunto interno x y que cumple in , y este es tambien
el u
nico conjunto x que cumple x y , o bien no se da ninguna de las dos

in
unicidades. En cualquier caso x|(x y ) = x|(x y ) (Si no se da la
unicidad ambos miembros son el conjunto vaco.)
e) Si es una f
ormula tenemos que
)in
x1 xn (in (x1 , . . . , xn ) (x1 , . . . , xn )).
Por otra parte, si y1 , . . . , ym son las variables libres en los terminos t1 , . . . , tn ,
tenemos que
)in
y1 ym (tin
i (y1 , . . . , ym ) = ti (y1 , . . . , ym )).
Ademas, jados y1 , . . . , ym tenemos que cada tin
i es un conjunto interno,
luego podemos sustituir en la f
ormula anterior y queda
)in
in
y1 ym (in (tin
1 , . . . , tn ) (t1 , . . . , tm )).
in
in
Es f
acil ver que in (tin
on
1 , . . . , tn ) (t1 , . . . , tm ) , con lo que la composici
es absoluta.
Si es un termino, el resultado se sigue del caso que acabamos de probar
aplicado a la f
ormula x = .

Por ejemplo, ahora es claro que la uni


on de conjuntos es absoluta, es decir,
)in
xy (x y)in = x y.
Una prueba directa es la siguiente: el miembro izquierdo es por denici
on el
u
nico conjunto interno cuyos elementos internos son los elementos internos de x
o y, pero por transitividad sobran todas las especicaciones interno, es decir,
(x y)st es el u
nico conjunto interno cuyos elementos son los elementos de x o
y. As pues, (x y)in = x y. En otras palabras, la uni
on interna de conjuntos
internos es simplemente su union.
Por otra parte, el teorema anterior nos permite llegar mec
anicamente a la
misma conclusion: basta ver que
)
z = x y u z(u x u y)
y el miembro derecho es absoluto por el teorema anterior, luego el izquierdo
tambien.
Similarmente se prueba que x y, x \ y, {x}, {x, y}, x y son absolutos.
Ahora, el termino (x, y) {{x}, {x, y}} es absoluto por el apartado e) del
teorema. Por otra parte,
)
*
*
z = x y w z u x v y w = (u, v),
luego x y tambien es absoluto.

278

Apendice B. La teora de Hrbacek

Otros ejemplos de expresiones absolutas son f : x y (inyectiva, suprayectiva, biyectiva), f (u), R es una relacion (reexiva, simetrica, antisimetrica,
transitiva). Por ejemplo:
)
*
*
f : x y z f u x v y z = (u, v)
)

1
*
*
u x v y w f (w = (u, v) w f ).

Para probar que f (x) y|(x, y) f es absoluto observamos que si f y x


son internos entonces f (x)in = y|(in y (x, y) f ), donde usamos que (x, y) es
absoluto. Ahora bien, in y es redundante, pues si (x, y) f necesariamente y es
interno, ya que y {x, y} (x, y) f , luego tenemos la igualdad.
En denitiva, las propiedades y operaciones conjuntistas b
asicas son absolutas. Esto implica en particular que al realizar dichas operaciones sobre
conjuntos internos obtenemos conjuntos internos: la uni
on, la interseccion, el
producto cartesiano, etc. de conjuntos internos es un conjunto interno. Por
ejemplo x y = (x y)in , luego es interno por el teorema B.1.
Ejemplo

Anticipamos (sin prueba) un ejemplo de concepto no absoluto: Px.

En efecto, Pin Nin es por denici


on el conjunto (interno) de todos los subconjuntos internos de Nin , y no coincide con PNin , que es el conjunto de todos los
)in
subconjuntos (internos y externos) de Nin . As pues, la f
ormula
x(Pin x = Px)
in
falla cuando se aplica al conjunto interno x = N . Por consiguiente Px no es
absoluto.
)
Ejemplo Es un teorema de ZFC que 0 N n N n{n} N. Teniendo en
cuenta que 0, y {x} son conceptos absolutos, la relativizaci
on de este teorema
es
)
0 Nin n Nin n {n} Nin .
)in
Notemos que no hace falta poner
n Nin porque Nin es interno, luego sus
elementos son necesariamente internos. Esta formula es un teorema de H, y de
ella se sigue que Nin es un conjunto innito. Por ello no hemos incluido el axioma
de innitud entre los axiomas sobre los conjuntos externos. Ahora ya tenemos
justicada la existencia de conjuntos (externos) innitos y, en particular, la
existencia de N.
Los axiomas que faltan se corresponden aproximadamente con los principios
de transferencia, idealizaci
on y estandarizaci
on de la teora de Nelson. Para
enunciar el principio de idealizaci
on necesitamos unas deniciones:
Denici
on B.5 Para cada conjunto A, denimos

A = {x A | st x}.

Diremos que un conjunto B tiene tama


no est
andar si existe un conjunto est
andar
A y una aplicaci
on f : A B suprayectiva.

279
En particular, si A es un conjunto est
andar entonces A es un conjunto de
tama
no estandar. Los axiomas restantes son:
Transferencia: Si (x, x1 , . . . , xn ) es una f
ormula interna cuyas variables
libres sean exactamente las indicadas, la f
ormula siguiente es un axioma:
)st
)st
)in in
x1 xn ( xin (x, x1 , . . . , xn )
x (x, x1 , . . . , xn )).
n: Para toda f
Idealizacio
ormula (x, y, x1 , . . . , xn ) del lenguaje de ZFC
)in
)
)
no estandar z(z A z nito
x1 xn A(A tiene tama
*in )in
*in )in
x y z in (x, y, x1 , . . . , xn ))
x y A in (x, y, x1 , . . . , xn )).
n:
Estandarizacio

) *st )st
x
y u(u y u x).

Del principio de transferencia se sigue que si dos conjuntos est


andar tienen
los mismos elementos estandar entonces tienen los mismos elementos internos y,
por transitividad, son iguales. Por consiguiente, del principio de estandarizaci
on
se sigue que para todo conjunto A existe un u
nico conjunto est
andar SA cuyos
elementos estandar son los mismos que los de A.
De principio de transferencia se sigue, an
alogamente a como hemos hecho en
la teora de Nelson, que las versiones internas de todos los conceptos denibles
en ZFC son de hecho estandar. Por ejemplo, Nin es un conjunto est
andar. Para
probarlo aplicamos el principio de transferencia a la f
ormula (sin par
ametros)
*in
*st
(z = N)in , lo cual nos da que
z z = Nin
z z = Nin .
Similarmente, la uni
on de conjuntos est
andar es estandar y, en general, cualquier conjunto denido mediante una expresi
on de ZFC a partir de par
ametros
estandar es estandar.
Los n
umeros naturales Ahora ya podemos demostrar que, tal y como habamos anticipado, N = Nin , es decir, que los n
umeros naturales externos son los
n
umeros naturalesin estandar.
Una inclusi
on es simple:
) Relativizando teoremas de ZFC a conjuntos internos
tenemos 0 = Nin y n Nin n + 1 Nin . Aqu hemos usado que x {x} es
un termino absoluto, con lo que si n es un conjunto interno entonces (n + 1)in =
(n {n})in = n {n}.
)
M
as a
un, tenemos que 0 Nin y n Nin n + 1 Nin , pues si n es
estandar entonces n+1 es estandar (por transferencia). El principio de inducci
on

nos da entonces que N Nin .


Supongamos ahora que A = N in \ N = . Entonces A S A = . Todo
umero
conjunto interno que contenga n
umeros naturalesin contiene un mnimo n
in
natural (esto es la version interna de un teorema de ZFC). Sea m el mnimo
n
umero naturalin de S A. Como S A es un conjunto est
andar y m esta denido
S
a partir de A, el principio de transferencia nos da que m es estandar. En

particular m Nin \ N. Necesariamente m = 0, luego existe n = m 1, que

280

Apendice B. La teora de Hrbacek

es un n
umero naturalin que ademas es estandar por transferencia. M
as a
un,
(n < m)in . Esto nos lleva a una contradicci
on, pues la minimalidad de m fuerza
a que n N, pero entonces tambien m = n + 1 N.
No tiene sentido decir que la suma de n
umeros naturales es absoluta. Esto
sera tanto como decir que
)
mn Nin (m + n)in = m + n,
pero si m y n son n
umeros naturalesin no estandar, el miembro derecho no
esta denido (o, en sentido estricto, est
a denido como el conjunto vaco y, en
cualquier caso, no se da la igualdad). Lo que si es cierto es algo m
as debil que
el caracter absoluto:
)
mn N (m + n)in = m + n,
es decir, la suma de n
umeros naturalesin restringida a los n
umeros naturales
externos coincide con la usual. Esto es consecuencia de que ambas cumplen la
misma relacion recurrente. Lo mismo vale para el producto, la exponenciaci
on,
la relaci
on de orden, etc.
La nitud El concepto de nitud dista mucho de ser absoluto. Podemos
denir los conjuntos nitos como los biyectables con n
umeros naturales. Entonces un conjunto interno es nitoin si es biyectablein con un n
umero naturalin .
in
Observemos que biyectable no es absoluto: ser biyectable con un conjunto
supone que la biyecci
on sea interna.
on nitoin , pero no tiene por
As pues, todo n
umero naturalin es por denici
que ser nito. En primer lugar demostramos lo siguiente:
Teorema B.6 Un conjunto interno es est
andar y nitoin si y s
olo si es nito
y todos sus elementos son est
andar, si y s
olo si es est
andar y nito.
n: Sea x estandar y nitoin . Entonces su cardinalin es un
Demostracio
in
umero natural, y existe una biyecci
on
n
umero natural estandar n, luego es un n
f : n x interna que, por transferencia, podemos tomar est
andar. Como los
elementos de n son todos estandar y la imagen de un conjunto est
andar por una
aplicaci
on estandar es estandar, concluimos que todos los elementos de x son
estandar. Obviamente x es nito.
Recprocamente, si x es un conjunto nito formado por conjuntos est
andar,
probaremos que x es estandar nitoin por inducci
on sobre su cardinal. Si x =
es evidente. Supuesto cierto para conjuntos de cardinal n, pongamos que x tiene
otesis de induccion x
cardinal n + 1. Sea y x y sea x = x \ {y}. Por hip
in
es estandar y nito , pero {y} es interno porque el termino {y} es absoluto,
in
es
) estandar por transferencia y es nito porque es un teorema de ZFC que
y({y} es nito). Por otra parte, la uni
on de conjuntos est
andar es estandar y
la uni
on de conjuntos nitosin es nitain , luego x es estandar y nitoin .
Respecto a la otra equivalencia, por la parte ya probada tenemos que todo
conjunto est
andar nitoin es estandar y nito. Si x es estandar y nito probamos

281
que es nitoin por el mismo argumento inductivo sobre el cardinal con*la variante
siguiente: si el cardinal
*st de x es n + 1, en particular x = , luego y y x y
por transferencia
y y x. Tomamos, pues y x estandar, y el resto del
argumento vale igual.
Para ir m
as lejos necesitamos el principio de idealizacion. Vamos a demostrar
el an
alogo al teorema A.3:
Teorema B.7 Sea (x, y, x1 , . . . , xn ) una f
ormula de ZFC. Entonces
)in
)st
*in )
x1 xn A( z(z A z nito
x y z in (x, y))
*in )st
x y A in (x, y)).
n: Fijados x1 , . . . , xn y A, suponemos la concurrencia y conDemostracio
sideramos el conjunto SA, es decir, el conjunto de todos los elementos estandar
del estandarizado de A, que obviamente tiene tama
no estandar. En efecto, se
cumple que
)
*in )in
z(z SA z nito
x y z in (x, y)),
pues basta tener en cuenta que si z SA A es nito, como todos sus
elementos son estandar, el teorema anterior nos da que es est
andar, y podemos
aplicar la hip
otesis.
*in )in
El principio de idealizaci
on nos da que
x y SA in (x, y), de donde
*in )st
in
se sigue claramente que
x y A (x, y).
La implicaci
on contraria es trivial, teniendo en cuenta que los elementos de
un conjunto est
andar nito son todos est
andar.
Ahora ya podemos demostrar el teorema general sobre existencia de conjuntos no estandar:
Teorema B.8 Un conjunto interno A es est
andar y nito si y s
olo si todos sus
elementos son est
andar.
n: Aplicamos el teorema anterior a la relacion dada por
Demostracio
(x, y) x A x = y. Esta relaci
on es concurrente en A si y solo si A
no es estandar y nito. Por el teorema anterior esto equivale a que A tiene un
elemento no estandar.
Para completar la compatibilidad con la teora de Nelson observamos que el
teorema siguiente (analogo de A.6) se deduce del teorema anterior aplicado a la
relacion (x, y) y x x A x es nito.
Teorema B.9 Todo conjunto interno tiene un subconjunto nitoin que contiene
a todos sus elementos est
andar.
Ahora es claro que todos los resultados que hemos demostrado en los captulos precedentes a partir de la axiom
atica de Nelson pueden demostrarse tambien
en la teora de Hrbacek.

282

Apendice B. La teora de Hrbacek

El teorema de extensi
on La version general que hemos dado del principio
de idealizaci
on permite demostrar una versi
on fuerte del principio de extensi
on
(comparar con A.8).
Teorema B.10 (Teorema de extensi
on) Si A es un conjunto est
andar y f
es una funci
on externa en A con valores internos, entonces f se extiende a una
funci
on interna denida en A.
n: La funci
Demostracio
on f , es decir, el conjunto {(x, f (x)) | x A},
tiene tama
no estandar, por lo que podemos aplicarle el principio de idealizaci
on.
Si z f es nito, entonces z es una funci
on cuyo dominio es un subconjunto
nito a de A. El conjunto a es nito y todos sus elementos son estandar,
luego es estandar. Una simple inducci
on sobre su cardinal demuestra que z es
interno, y es una funci
on que contiene a todos los elementos de f . Aplicamos
el principio de idealizaci
on a la f
ormula x es una funci
on y f , con lo que
obtenemos una funci
on F que contiene a f , luego su dominio contiene a A y
por transferencia a A.
Regularidad y reemplazo Es claro que el axioma de regularidad no se cumple en la teora de Hrbacek. Por ejemplo, si tenemos en cuenta que Nin no es
on
sino el conjunto de todos los (ordinales nitos)in y que, por lo tanto, la relaci
de orden es la pertenencia, vemos que el conjunto Nin \ N no tiene un elemento minimal para la relaci
on de pertenencia, lo cual contradice al axioma de
regularidad.
Tampoco podemos suponer el axioma de reemplazo. Para verlo observemos
que si es un ordinalin estandar, entonces esta bien ordenado por la relaci
on
de pertenencia. En efecto, si x y x = , entonces S x es un subconjunto
interno no vaco de , luego contiene un mnimo ordinal , que por transferencia
sera estandar. As pues, x y es el mnimo de x.
Si suponemos el axioma de reemplazo podemos considerar el (
unico) ordinal

semejante a . Ahora probamos que si


= entonces = . En efecto,
tenemos una biyeccion f : que conserva el orden y, aplicando el
principio de transferencia, es f
acil ver que S f : es una biyeccion que
conserva el orden, luego = .
Consideremos ahora el conjunto de todos los ordinales de cardinal menor
o igual que el cardinal de Nin (este cardinal tampoco puede denirse sin el
axioma de reemplazo). De el seleccionamos el conjunto de los ordinales que son
de la forma ,
para cierto ordinalin estandar , y otra vez por el axioma del
reemplazo formamos el conjunto A de todos los ordinalesin estandar tales que

es inyectable en Nin .
Ahora bien, el conjunto A contiene a todos los ordinalesin estandar, pues

si es uno de ellos y F es un conjunto nitoin tal que F , existe

in
f : F N inyectiva, que se restringe a y prueba que A.
Cambiando A por su estandarizado, podemos suponer que A es estandar.
Tenemos as un conjunto est
andar que contiene a todos los ordinalesin estandar.

283
Por transferencia A contiene a todos los ordinalesin , pero esto es imposible, pues
se demuestra en ZFC que ning
un conjunto contiene a todos los ordinales.4
Pese a esto, en el apendice C demostraremos que podemos suponer5 que la
relacion de pertenencia esta bien fundada en la clase S de todos los conjuntos
estandar, es decir, que para todo conjunto no vaco A S,
*
)
x A y Ay
/ x.
Si dispusieramos del axioma de reemplazo, podramos denir por recursi
on
transnita sobre la relaci
on de pertenencia una aplicaci
on que a cada conjunto
estandar x le asigna un conjunto x
determinado por la relaci
on recurrente
x
= {
y | y x st y}.
M
as a
un, la teora general de recursi
on transnita permite demostrar que
esta aplicacion biyecta la clase de todos los conjuntos estandar con una u
nica
clase transitiva (su colapso transitivo) de modo que se conserva la relaci
on de
pertenencia, es decir, x y x
y. En el apendice C veremos que podemos
suponer todo esto y que el colapso transitivo de la clase de todos los conjuntos
estandar es precisamente la clase R de todos los conjuntos regulares, es decir,
la clase denida recurrentemente por
)
)
&
&
R0 = R+1 = PR R =
R R = R ,
<

donde recorre todos los ordinales y todos los ordinales lmite (esta jerarqua
tampoco puede denirse en general sin el axioma de reemplazo). Si suponemos
todo esto, tenemos una aplicacion : R S que es un isomorsmo para la
relacion de pertenencia (la inversa de la funci
on colapsante).
El lector familiarizado con la teora de modelos b
asica comprendera el signicado de esta aplicaci
on: el principio de transferencia arma que S es un
submodelo elemental de la clase I de los conjuntos internos, luego en particular
satisface todos los axiomas de ZFC, y a traves de la funci
on colapsante llegamos a
que R tambien los satisface. As pues, aunque no podemos suponer que todos los
conjuntos externos cumplen ZFC, s que podemos suponer que la existe clase de
los conjuntos regulares y que cumple todo ZFC. Todos los conceptos conjuntistas
son absolutos para R, por lo que, por ejemplo, R = (RR ) = RS = RI = Rin .
En general, transforma cada conjunto externo en su correspondiente interno.

4 Esta

es una diferencia entre la teora de Hrbacek y la de Nelson: en esta s que existe


un ordinal mayor que todos los ordinales est
andar, por la versi
on fuerte del principio de
idealizaci
on.
5 En todo este apartado podemos suponer signica que podemos tomarlo como axioma
de modo que se sigue cumpliendo el teorema de conservaci
on.

Ap
endice C

El teorema de conservaci
on
Dedicamos este apendice a demostrar el teorema de conservacion para la
teora de Nelson y para la de Hrbacek. Nos referiremos a ellas como N y H,
respectivamente. Para la primera arma que todo teorema interno de N es
tambien un teorema de ZFC. Para la segunda arma que si es una f
ormula
de ZFC tal que in es un teorema de H, entonces es un teorema de ZFC. Los
razonamientos que emplearemos seran metamatematicos nitistas es decir,
armaciones sobre la teora axiom
atica de conjuntos que no pueden ser entendidos como teoremas de teora alguna o teoremas de ZFC; en ning
un caso han
de entenderse como teoremas de la teora de conjuntos no est
andar.

C.1

Modelos internos

La herramienta b
asica para obtener el teorema de conservacion sera la teora
de modelos internos, que fue ideada por von Neumann para probar la independencia del axioma de regularidad y que despues uso Godel para probar la
consistencia de la hip
otesis del continuo generalizada y el axioma de eleccion.
Seleccionamos cinco variables de (el lenguaje de) H, a las que llamaremos
M , E, I, S y d, de modo que ninguna expresi
on que consideremos tendr
a estas
variables salvo que lo indiquemos explcitamente. Para cada expresi
on de
H que no contenga estas variables, denimos su relativizaci
on M EISd (que
M
abreviaremos por ) como la expresion construida seg
un las reglas siguientes.
a) xM x,
b) (t1 = t2 )M t1 = t2 ,
(t1 t2 )M t1 E t2 (t1 , t2 ) E,
(st t)M t S,
(in t)M t I.
c) ()M M ,
285

286

Apendice C. El teorema de conservacion

d) ( )M M M ,
)
)
e) ( x)M x M M ,
1
*
f) (x|)M x|(( x(x M M ) x M M )
1
*
(( x(x M M ) x = d).

En denitiva (dejando de lado las descripciones, que comentaremos enseguida) la relativizaci


on de )
se obtiene
) cambiando cada por E, cada st por
S, cada in por I y cada x por x M . Por ejemplo,
)
)
( u(u x u y))M u M (u E x u E y)
Para interpretar esta denici
on supongamos que (en ZFC) hemos jado un
conjunto M , una relaci
on E M M , unos subconjuntos S I M y
un elemento d M . Entonces, si es una f
ormula de H, la f
ormula M es
lo que signica si llamamos conjuntos a los elementos de M u
nicamente,
conjuntos est
andar a los elementos de S, conjuntos internos a los conjuntos
de I y consideramos que la relacion de pertenencia es la relacion E.
Por ejemplo, (x y)M es la formula que acabamos de calcular, de modo que
x es un subconjunto de y visto desde M si todo elemento de M que pertenece
en M a x (es decir, que cumple u E x), tambien pertenece en M a y.
M
nico elemento x M que cumple
) Similarmente esta denido como el u
u M u E x, si es que existe tal elemento, o bien d si no existe.

Esta
es la idea subyacente a la denici
on de relativizaci
on, pero en sentido
estricto lo u
nico que hemos hecho ha sido asociar a cada expresion de H otra
expresion M de ZFC cuyas variables libres son las mismas de mas quiz
a las
variables M , E, I, S y d. Es claro que si es una f
ormula de N (resp. de ZFC)
entonces M no contiene la variable I (resp. S e I), por lo que podemos hablar
de M ESd (resp. M Ed ).
Todo lo anterior ha de entenderse metamatematicamente, mientras que la
denici
on siguiente es una denici
on en ZFC:
Denici
on C.1 Llamaremos modelo a toda quntupla M = (M, E, I, S, d) tal
que E M M , d M , (S I M ).

Esta
es la denici
on de un modelo del lenguaje de H. Similarmente se dene
un modelo para el lenguaje de N suprimiendo la I, mientras que un modelo para
el lenguaje de ZFC se obtiene suprimiendo tambien la S. Para referirnos a este
u
ltimo caso hablaremos de un modelo est
andar. Cuando no indiquemos a que
tipo de modelo nos estamos reriendo o a que lenguaje pertenecen las formulas
que estamos considerando sera porque lo que digamos valdr
a en cualquiera de
los tres casos posibles.
En la pr
actica diremos que M es un modelo sobrentendiendo que lo es con
un universo M , una relaci
on E, una descripci
on impropia d, etc.

C.1. Modelos internos

287

La relativizaci
on de los signos l
ogicos denidos es facil de calcular:
( )M M M ,

( )M M M ,

( )M M M .

Para el cuanticador existencial tenemos que


*
*
( x)M x M M ,

1
1
*
*
( x)M x M M .

(Comparar con la relativizaci


on a conjuntos internos en la teora de Hrbacek,
apendice B)
Teorema C.2 Si t(x1 , . . . , xn ) es un termino con las
) variables libres indicadas.
se prueba en ZFC que si M es un modelo entonces x1 . . . xn M tM M .
)
n: Si t x el teorema se reduce a x M x M , lo cual
Demostracio
es obvio, mientras que si t x|(x, x1 , . . . xn ) entonces tM es el u
nico elemento
de M que cumple M si existe tal elemento (y entonces esta en M ), o bien d si
no existe (y en tal caso tambien esta en M por denici
on de modelo).
Informalmente hemos de pensar que tM es lo que llamara t alguien que creyera que los conjuntos son los elementos de M , que la relaci
on de pertenencia
es E, etc.
Denici
on C.3 Sea = {1 , . . . , m } una coleccion nita de f
ormulas y sean
x1 , . . . xn las variables que aparezcan libres en ellas. Abreviaremos
)
M
M  x1 . . . xn M 1M m
.
De este modo, M  es una f
ormula cuyas u
nicas variables libres son M ,
E, I, S y d (o menos si consideramos formulas y modelos de N o de ZFC). Se
suele leer M es un modelo de y tambien se dice que las formulas de son
verdaderas en M. Si tenemos una sola f
ormula escribiremos tambien M  .
Es importante observar que no podemos denir de este modo que signica
que innitas f
ormulas sean verdaderas en un modelo dado, pues tendramos que
formar la conjunci
on de innitas f
ormulas. La denici
on es posible, pero eso
nos llevara a la teora de modelos propiamente dicha en vez de a la teora de
modelos internos, que es la que necesitamos.
El resultado fundamental sobre modelos internos es el siguiente:
Teorema C.4 Sea una colecci
on nita de f
ormulas y una consecuencia
l
ogica de . Se demuestra en ZFC que si M  entonces M  .
Este teorema se demuestra con un argumento formalmente analogo al que
prueba el teorema B.2 (ver la observaci
on tras este resultado). Hemos de insistir
en el caracter constructivo de la prueba: a partir de una demostraci
on de a
partir de las premisas de es posible obtener explcitamente una demostracion
de que si M  entonces M  .

288

Apendice C. El teorema de conservacion

El teorema siguiente es una de las piedras angulares de nuestra demostraci


on
del teorema de conservacion. Recordemos que en ZFC se dene la jerarqua
{V }, donde recorre los n
umeros ordinales, de modo que
)
)
&
V0 = V+1 = PV V =
V ,
<

donde vara en los ordinales lmite, y se demuestra que todo conjunto est
a en
un cierto V .
Por conveniencia, nosotros llamaremos V a lo que normalmente se llama
V+ . Los conjuntos V son transitivos, es decir, si x V entonces x V , y
forman una sucesi
on creciente: si entonces V V .
Consideraremos a V como un modelo estandar con la relaci
on de pertenencia
usual y con d = .
Teorema C.5 (Teorema de Reexi
on) Sea = {1 , . . . , m } una colecci
on
nita de f
ormulas internas cuyas variables libres esten entre x1 , . . . , xn . Entonces se demuestra en ZFC que existe un ordinal lmite tal que
)
x1 . . . xn V (iV i ),
i = 1, . . . , m.
n: Es claro que podemos construir una sucesi
Demostracio
on nita de
expresiones 1 , . . . , r con las propiedades siguientes:
a) Las f
ormulas 1 , . . . , m estan entre 1 , . . . , r .
b) Todas las subexpresiones de cada i aparecen previamente en la sucesion.
c) Si i x|, entonces
en la sucesion.

1
*

x (y, por consiguiente, ) aparece previamente

Vamos a construir una sucesion de ordinales 0 < 1 < Tomamos como


0 cualquier ordinal. Supongamos denido k .
)
Si i x(x, x1 , . . . , xn ) para cada n-tupla (x1 , . . . , xn ) Vnk denimos f (x1 , . . . , xn ) como el mnimo ordinal tal que existe x V tal que
(x, x1 , . . . , xn ) si es que existe tal x, y = 0 en caso contrario.
Sea ki el mnimo ordinal tal que Vik contiene el rango de f , es decir, tal
que f : Vnk Vir .
Si i no es de esta forma, denimos ri = 0. Sea r+1 el maximo entre r + 1
y todos los ri . El supremo de la sucesion {r } es un ordinal lmite . Veamos
que cumple lo pedido.
)
Por construcci
on, (x|x = x) V y si i x(x, x1 , . . . , xn ) y para ciertos
x1 , . . . , xn V existe un x tal que (x, x1 , . . . , xn ), entonces existe un x que
cumple esto y ademas esta en V .

C.1. Modelos internos

289

Vamos a probar por inducci


on sobre i que si i es un termino con variables
libres x1 , . . . , xn entonces
)
x1 xn V (i (x1 , . . . xn ) = iV (x1 , . . . xn ))
y si i es una f
ormula entonces
)
x1 xn V (i (x1 , . . . xn ) iV (x1 , . . . xn )).
Como las j del enunciado est
an entre las i , el teorema quedar
a probado.
)
Si i x entonces lo que hay que probar es que x V x = x, lo cual es
obvio.
Si i t1 t2 , entonces los terminos t1 y t2 aparecen antes en la sucesion,
luego por hip
otesis de induccion
)
x1 xn V (t1 = tV1 t2 = tV2 ).
)
Lo que hemos de probar es que x1 xn V (t1 t2 tV1 tV2 ), lo cual
es obvio. El caso en que i t1 = t2 es identico a este.
Si i , por hip
otesis de induccion
)
x1 xn V ( V ),
y es claro que esto sigue siendo cierto si negamos ambos terminos. El caso en
que i es analogo.
)
Si i x, por hip
otesis de induccion tenemos que
)
xx1 xn V ((x, x1 , . . . , xn ) V (x, x1 , . . . , xn ))
y hemos de probar que
)
)
)
x1 xn V ( x(x, x1 , . . . , xn ) x V V (x, x1 , . . . , xn )).
)
Ahora bien, jados x1 , . . . , xn V , si suponemos que x y tomamos un
otesis de induccion V (x, x1 , . . . , xn ),
x V , tenemos (x,
)x1 , . . . , xVn ) y por hip
es decir, se cumple x )
V .
Recprocamente, si x existe un x que cumple (x, x1 , . . . , xn ) y por
otesis de
construccion de existe un x V tal que (x, x)
1 , . . . , xn ). Por hip
inducci
on V (x, x1 , . . . , xn ), luego no se cumple x V V .
Supongamos nalmente que i x|. Entonces, jados x1 , . . . , xn V , por
hip
otesis de induccion
1
*

x (x, x1 , . . . , xn )

1
*

x V V (x, x1 , . . . , xn )

x V ((x, x1 , . . . , xn ) V (x, x1 , . . . , xn )).

290

Apendice C. El teorema de conservacion

Supongamos que se dan las dos unicidades y sea x el u


nico conjunto de
V que cumple V . Entonces tambien cumple , luego es de hecho el u
nico
conjunto que cumple . Por tanto (x|) = x = (x|)V .
Si no se dan las unicidades, (x|) = = (x|)V .
El u
ltimo concepto que necesitamos sobre modelos internos es el de inmersion
elemental:
Denici
on C.6 Una inmersi
on elemental j : M M entre dos modelos (del
mismo lenguaje) es una aplicacion j : M M  tal que para toda f
ormula
(x1 , . . . , xn ) con las variables libres indicadas se cumple
)

x1 xn M (M (x1 , . . . , xn ) M (j(x1 ), . . . , j(xn ))).
(C.1)
Nota Esta denici
on carece de sentido tal y como esta enunciada, pues la
armaci
on para toda f
ormula carece de signicado matematico. Fijada
una coleccion nita de f
ormulas , podemos denir una -inmersi
on elemental
como la conjunci
on de las equivalencias (C.1) para cada una de las f
ormulas
de . En la pr
actica, cuando tomemos como hipotesis que una aplicaci
on
j es una inmersi
on elemental se entendera que lo es respecto a una coleccion
nita de f
ormulas sucientemente grande como para que se cumpla la tesis que
queremos demostrar, mientras que cuando demostremos que una aplicaci
on j es
una inmersi
on elemental signicar
a que, para toda colecci
on nita de f
ormulas
es posible demostrar que j es una -inmersion elemental.
Por ejemplo, podemos decir que toda inmersi
on elemental es inyectiva, aplicando la denici
on a la f
ormula x = y, con lo cual hay que entender que toda
inmersi
on elemental respecto a una coleccion nita de f
ormulas que contenga a
x = y es inyectiva.
Teorema C.7 Si j : M M es una inmersi
on elemental tal que j(d) = d ,
entonces para todo termino t(x1 , . . . , xn ) se cumple
)

x1 xn M (j(tM (x1 , . . . , xn )) = tM (j(x1 ), . . . , j(xn ))).
n: Si t es una variable es trivial, y si t = x|, distinguimos
Demostracio
1
*
dos casos: Si se cumple que x M M (x, x1 , . . . , xn ), entonces
1
*

x M  M (x, j(x1 ), . . . , j(xn ))

1
*
(pues estas formulas son las relativizaciones de x a M y M  ). Pero m
as
a
un, si x M es el u
nico que cumple M (x, x1 , . . . , xn ), entonces se cumple

M (j(x), j(x1 ), . . . , j(xn )). Por consiguiente x = (x|)M y j(x) = (x|)M .
Si no se da la unicidad en M , tampoco se da en M  , luego j((x|)M ) =

j(d) = d = (x|)M .

Terminamos esbozando el plan de la prueba del teorema de conservaci


on.
Suponemos que una f
ormula interna es demostrable a partir de los axiomas

C.2. Ultrapotencias

291

de N. Aunque los axiomas son innitos, en una demostraci


on solo puede aparecer
una cantidad nita de ellos. Sea la colecci
on de todos ellos. No perdemos
generalidad si suponemos que no tiene variables libres.
El resultado principal que nos falta por probar es (aproximadamente) el
siguiente:
Si es una colecci
on nita de axiomas de N y es una f
ormula
interna sin variables libres, existe una colecci
on nita de axiomas
de ZFC de modo que en ZFC se demuestra que si el modelo est
andar
M = V cumple M  entonces existe un modelo no est
andar N
tal que N  y adem
as M  si y s
olo si N  .
De hecho tendremos una inmersi
on elemental j : M N, de modo que los
conjuntos est
andar de N seran los de la imagen de j.
Admitiendo esto, la prueba del teorema de conservaci
on es como sigue: consideramos la coleccion correspondiente a los axiomas con los que se prueba
, aplicamos el teorema de reexion a las f
ormulas de y a , de modo que
encontramos un modelo M = V tal que M  y ademas M  . El
teorema que nos falta probar nos da un modelo no est
andar N tal que N  ,
luego N  , luego M  , luego . En denitiva, hemos probado en ZFC.
Insistimos en que la prueba es totalmente constructiva: si tenemos una demostracion explcita de a partir de los axiomas no est
andar , el teorema que
vamos a probar nos da explcitamente la coleccion , el teorema de reexion nos
da una prueba explcita en ZFC de que M  y de la implicaci
on M  .
El teorema que nos falta probar nos da una prueba explcita en ZFC de que
M  N  y M  N  , con lo que tenemos una prueba explcita
de que N  y N  , el teorema C.4 nos da una prueba explcita en ZFC
de que N  y terminamos con una prueba explcita de en ZFC.
El argumento para H es ligeramente m
as complicado, pero a grandes rasgos
coincide con este.

C.2

Ultrapotencias

En esta seccion veremos como construir modelos no estandar a partir de


modelos estandar. Recordemos algunas deniciones conjuntistas:
Denici
on C.8 Un ltro en un conjunto I es una familia F de subconjuntos
de I con las propiedades siguientes:
a) I F ,
/ F,
b) Si X Y I y X F entonces Y F ,
c) Si X, Y F entonces X Y F .

292

Apendice C. El teorema de conservacion

Un ultraltro U en un conjunto I es un ltro con la propiedad adicional de


que si X I entonces X U o I \ X U .
Toda familia de subconjuntos de I con la propiedad de la intersecci
on nita
(es decir, tal que la interseccion de cualquier subfamilia nita es no vaca) esta
contenida en un ltro, a saber, en el ltro de todos los subconjuntos de I que
contienen una intersecci
on nita de conjuntos de la familia.
De aqu se sigue facilmente que un ultraltro es un ltro maximal respecto de
la inclusi
on, por lo que el lema de Zorn nos da que todo ltro est
a contenido en
un ultraltro. En particular, toda familia de subconjuntos de I con la propiedad
de la interseccion nita est
a contenida en un ultraltro. El teorema siguiente es
inmediato:
Teorema C.9 Sean V e I dos conjuntos, sea U un ultraltro en I y sea V I el
conjunto de todas las aplicaciones de I en V . La relaci
on
f =U g {i I | f (i) = g(i)} U
es una relaci
on de equivalencia en V I .
Denici
on C.10 Si V es un conjunto y U es un ultraltro en un conjunto I,
llamaremos ultrapotencia de V respecto a U al conjunto cociente V = V I /U
de V I respecto de la relacion de equivalencia =U .
Denimos la inmersi
on natural j : V V como la aplicacion dada por
j(x) = [cx ], donde cx : I V es la aplicacion constante cx (i) = x. Es claro
que j es inyectiva.
Supongamos ahora que (V, E, d) es un modelo estandar. Podemos denir la
relacion E en V mediante
[f ] E [g] {i I | f (i) E g(i)} U.
Es inmediato comprobar que esta denici
on no depende de los representantes
f y g de las clases de equivalencia, as como que la aplicacion j cumple
)
xy V (x E y j(x) E j(y)).
El teorema fundamental sobre ultrapotencias es el siguiente:
Teorema C.11 Sea una f
ormula interna con x1 , . . . , xn como variables libres.
Entonces en ZFC se demuestra lo siguiente: Si (V, E, d) es un modelo est
andar
y V es una ultrapotencia, entonces (V, E, j(d)) es un modelo est
andar tal que
)



f1 fn V I kV ([f1 ], . . . , [fn ]) {i I | kV (f1 (i), . . . , fn (i))} U .

En particular j : V V es una inmersi


on elemental.

C.2. Ultrapotencias

293

n: Sea 1 , . . . r una sucesion de expresiones en las mismas


Demostracio
condiciones exigidas en la prueba del teorema de reexi
on. Veamos por inducci
on sobre k que si k es un termino y f1 , . . . , fn V I entonces

i V ([f1 ], . . . , [fn ]) = [g],


donde g : I V viene dada por g(i) = kV (f1 (i), . . . , fn (i)), mientras que si
ormula entonces cumple la propiedad del enunciado.
k es una f
Si k x1 tenemos que g = f1 , luego el resultado es trivial.
Si k t1 t2 y f1 , . . . , fn V I , tenemos que

t1V ([f1 ], . . . , [fn ]) = [g1 ],

t2V ([f1 ], . . . , [fn ]) = [g2 ],

donde g1 y g2 estan determinados por la hip


otesis de induccion. As,

kV ([f1 ], . . . , [fn ]) [g1 ] E [g2 ] {i I | g1 (i) E g2 (i)} U


{i I | tV1 (f1 (i), . . . , fn (i)) E tV2 (f1 (i), . . . , fn (i))} U
{i I | kV (f1 (i), . . . , fn (i)))} U.
El caso k t1 = t2 es similar, usando la denici
on de =U .
Si k , por hip
otesis de induccion tenemos que

([f1 ], . . . , [fn ]) {i I | V (f1 (i), . . . , fn (i))} U,

y como U es un ultraltro

([f1 ], . . . , [fn ]) V I \ {i I | V (f1 (i), . . . , fn (i))} U,

pero esto equivale a

([f1 ], . . . , [fn ]) {i I | V (f1 (i), . . . , fn (i))} U,

que es lo que haba que probar.


Si k probaremos la coimplicaci
on de las negaciones:

( )

([f1 ], . . . , [fn ])

([f1 ], . . . , [fn ])

([f1 ], . . . , [fn ]).

Usando la hip
otesis de induccion y el caso anterior esto equivale a
{i I | V (f1 (i), . . . , fn (i))} U {i I | V (f1 (i), . . . , fn (i))} U
{i I | (V V )(f1 (i), . . . , fn (i))} U
{i I | ( )V (f1 (i), . . . , fn (i))} U.

294

Apendice C. El teorema de conservacion

Usando que U es un ultraltro esto equivale a que


{i I | kV (f1 (i), . . . , fn (i))}
/ U,
que es lo que tenamos que probar.
)
Si k x probaremos tambien la coimplicacion de las negaciones:

kV ([f1 ], . . . , [fn ])

f V I

([f ], [f1 ], . . . , [fn ].)

Usando la hip
otesis de induccion y el caso ya probado, esto equivale a
*
f V I {i I | V (f (i), f1 (i), . . . , fn (i))} U.
(C.2)
Falta probar que esto equivale a
*
{i I | x V V (x, f1 (i), . . . , fn (i))} U.

(C.3)

En efecto, si existe f seg


un (C.2) es claro que el conjunto que est
a en U seg
un
(C.2) esta contenido en el conjunto que ha de estar en U seg
un (C.3), luego se
cumple (C.3). Recprocamente, si se cumple (C.3), para cada i en el conjunto
indicado tomamos f (i) V de modo que se cumpla V (f (i), f1 (i), . . . , fn (i)), y
si i no esta en el conjunto dado por (C.3) tomamos como f (i) cualquier elemento
de V . Es claro que f cumple (C.2).
Si k x|, sea g(i) = rV (f1 (i), . . . , fn (i)). Por hip
otesis de induccion
1
*

x V

(x, [f1 ], . . . , [fn ]) {i I |

1
*

x V V (x, x1 , . . . , xn )} U.

Llamemos X al conjunto de la derecha. Si se da la unicidad, entonces X U

y hemos de probar que [g] es el u


nico elemento de V que cumple V . Ahora
bien, por la unicidad basta ver que
inducci
on esto sucede si y solo si

([g], [f1 ], . . . , [fn ]) y por hip


otesis de

{i I | V (g(i), f1 (i), . . . , fn (i))} U,


pero es que X esta contenido en este conjunto.
Si no se da la unicidad, entonces I \ X U y para cada i I \ U tenemos

que g(i) = d = cd (i), luego [g] = j([d]) = r V ([f1 ], . . . , [fn ]).


En particular, si no tiene variables libres hemos obtenido que
V  V  .
A su vez esto implica que si V satisface una coleccion nita de axiomas de
ZFC entonces V tambien los satisface (los axiomas de ZFC no tienen variables
libres).
Podemos convertir a V en un modelo no est
andar (del lenguaje de N) deniendo S = j[V ], es decir, tomando como conjuntos estandar las im
agenes por
j de los conjuntos de V .

C.2. Ultrapotencias

295

Teorema C.12 Si V es un modelo est


andar y V es una ultrapotencia, enton
ces V cumple el principio de transferencia de N.
n: M
Demostracio
as precisamente, lo que vamos a probar es que si
)st
)st
)

x1 xn ( x x)
es un caso particular del principio de transferencia (donde es una f
ormula de
ZFC) entonces en ZFC se demuestra que si V es un modelo estandar y V una

ultrapotencia entonces V  .

En efecto, hemos de probar V , que es la f


ormula
)

)
)
x1 xn S( x S V (x, x1 , . . . , xn ) x V V (x, x1 , . . . , xn )).

Fijamos j(x1 ), . . . , j(xn ) S, donde x1 , . . . , xn V . Suponemos que


)

xS

(x, j(x1 ), . . . , j(xn ))

o, lo que es lo mismo,
)

xV

(j(x), j(x1 ), . . . , j(xn )).

Por el teorema anterior esto equivale a


)
)
x V V (x, x1 , . . . , xn ) ( x)V (x1 , . . . , xn ),
)
y aplicando otra vez el teorema ( x) V (j(x1 ), . . . , j(xn )). As pues,
)

x V

(x, j(x1 ), . . . , j(xn )),

como tenamos que probar.

Ahora probaremos que si el ultraltro U se escoge adecuadamente entonces


V satisface una forma debil del principio de idealizaci
on.

Denici
on C.13 Sea V un conjunto y V una ultrapotencia. Para cada X V
denimos X V como el conjunto dado por
[f ] X {i U | f (i) X} U.
Se comprueba inmediatamente que la denici
on no depende de la elecci
on
del representante f , as como que se cumplen las propiedades siguientes:

(X Y ) = X Y,

(X Y ) = X Y,

(V \ X) = V \ X.

x V (x X j(x) X).

Llamemos V al conjunto de todos los ultraltros en V y sea t : V V la

aplicaci
on dada por t() = {X PV | X}. Diremos que la ultrapotencia

V es adecuada si la aplicaci
on t es suprayectiva.

296

Apendice C. El teorema de conservacion

Teorema C.14 Todo conjunto tiene una ultrapotencia adecuada.


n: Sea V un conjunto y sea I el conjunto de todos los subDemostracio
= {i I | X i}. Es
conjuntos nitos de PV . Para cada X V denimos X
1 X
n = , pues
claro que si X1 , . . . , Xn son subconjuntos de V entonces X
esta
contiene a i = {X1 , . . . , Xn }. Por consiguiente la familia de los conjuntos X
contenida en un ultraltro U sobre I. Sea V la ultrapotencia correspondiente
y veamos que es adecuada.
Para ello tomamos un ultraltro F en V y para cada i I llamamos Ai
a la interseccion de todos los elementos de i que estan en F (entendiendo que
Ai = V si no hay ninguno). As Ai = .
Para cada i I elegimos f (i) Ai y llamamos = [f ] V . Basta probar
que t() = F . En efecto, si X F entonces para cada i I tal que X i
{i I | f (i) X}, lo que
tenemos que Ai X, luego f (i) X. As pues, X

on de
prueba que este u
ltimo conjunto est
a en U , es decir, X. Por denici
t esto signica que X t(). Con esto hemos probado que F t(), pero como
ambos conjuntos son ultraltros se ha de dar la igualdad F = t().
Teorema C.15 Sea (x, y, x1 , . . . , xm ) una f
ormula de ZFC con las variables
libres indicadas. Entonces en ZFC se demuestra que si V es un modelo est
andar
de una cierta colecci
on nita de axiomas de ZFC y V es una ultrapotencia
adecuada entonces
)st
)st
* )
* )st

V 
x1 xm ( z(z nito x y z (x, y)) x y, (x, y)).
n: La relativizaci
Demostracio
on de esta formula es
)

)
*
)
x1 xm S( z S(z nito V x V y V (y E z V (x, y))

x V

y S

(x, y)).

Fijamos m elementos de S, de la forma j(x1 ), . . . , j(xm ), con xi V . Suponemos


)

*
)


z S z nito V x V y V (y E z V (x, y, j(x1 ), . . . , j(xm )) .

Sea la coleccion de axiomas necesarios para demostrar en ZFC la existencia


de {x}, la existencia de la uni
on de dos conjuntos, que la uni
on de dos conjuntos
nitos es nita y que {x} es siempre un conjunto nito.
Tomemos y1 , . . . , yn V . Del hecho de que V  se sigue que existe un
z V tal que z es nitoV y yi E z para todo i = 1, . . . , n.

Como j es elemental, tenemos que j(z) es nito V y j(yi ) E j(z) para todo
i = 1, . . . , n. Por la hip
otesis tenemos que
*

x V

y V (y E z

(x, y))

C.3. Lmites inductivos

297

y, como j es elemental, existe un x V tal que V (x, yi , x1 , . . . , xm ) para todo


i = 1, . . . n. En otros terminos, hemos probado que la familia de los conjuntos
{x V | V (x, y, x1 , . . . , xm )}

para y V

tiene la propiedad de la intersecci


on nita, luego est
an contenidos en un ultraltro F de V . Como la ultrapotencia es adecuada, existe V tal que F = t().
De este modo, si j(y) S tenemos que {x V | V (x, y, x1 , . . . , xm )} F ,
luego {x V | V (x, y, x1 , . . . , xm )}, y por el teorema C.11 esto implica
que

(, j(y), j(x1 ), . . . , j(xm )). Por consiguiente


*

x V

y S

(x, y, j(x1 ), . . . , j(xm ))

(tomando x = ), que es lo que tenamos que demostrar.

Con esto tenemos que V cumple (una implicaci


on de) el principio de idealizacion de N, pero exigiendo adem
as que los par
ametros sean estandar. Desgra
ciadamente el caso general no tiene por que cumplirse en V , lo cual nos lleva a
renar la construcci
on.

C.3

Lmites inductivos

Denici
on C.16 Un sistema inductivo es una familia {M }< de conjuntos
no vacos, donde es un ordinal lmite, junto con una familia de aplicaciones
inyectivas j : M M tales que si <  <  < entonces se cumple
la relaci
on j j  = j .
Diremos que {x }0 < es una sucesi
on inductiva si para cada se cumple
x M y para 0 <  < se cumple que x = j (x ).
Denimos el lmite inductivo de la familia como el cociente del conjunto
de todas las sucesiones inductivas respecto a la relacion de equivalencia que
identica dos sucesiones si coinciden en su dominio com
un.
Si llamamos M al lmite inductivo, denimos las aplicaciones j : M M
mediante j (x) = [{j (x)}< < ]. Es inmediato comprobar que para todos
los ordinales <  < se cumple la relacion j j = j , as como que todo
x M es de la forma j (y) para un cierto < y un cierto y M .
Supongamos ahora) que los conjuntos M son modelos estandar y que si
<  < entonces xy M (x E y j (x) E j (y)). Supongamos
tambien que j (d ) = d . Entonces podemos convertir al lmite inductivo M
en un modelo est
andar con la relaci
on
*
*  
x E y < x y M (x = j (x ) y = j (y  ) x E y  ).
De las hip
otesis se desprende que esta denicion no depende de la representacion de x, y como x = j (x ), y = j (y  ). Tomamos como descripcion
impropia a j (d ), para cualquier .

298

Apendice C. El teorema de conservacion

Teorema C.17 Si M es el lmite inductivo de un sistema de modelos est


andar
para el que las aplicaciones j son inmersiones elementales, entonces las aplicaciones j tambien lo son.
n: Vamos a probar que todas las j satisfacen la denici
Demostracio
on de
inmersi
on elemental para una f
ormula dada. Par ello tomamos una sucesi
on de
expresiones 1 , . . . , r en las mismas condiciones que en la prueba del teorema
de reexi
on y que la contenga. Probaremos que si k es una f
ormula entonces
on de inmersi
on elemental para ella y si es un termino
cada j cumple la denici
entonces cumple el teorema C.7.
En efecto, si k x el teorema se reduce a j (x) = j (x).
Si k t1 t2 , usando la hip
otesis de induccion vemos que
M

kM (x1 , . . . , xn ) tM
1 (x1 , . . . , xn ) E t1 (x1 , . . . , xn )
M

j (tM
1 (x1 , . . . , xn )) E j (t1 (x1 , . . . , xn ))
M
tM
1 (j (x1 ), . . . , j (xn )) E t2 (j (x1 ), . . . , j (xn ))

kM (j (x1 ), . . . , j (xn )).


El caso k t1 = t2 es identico.
Si k o k la conclusi
on se sigue inmediatamente de la
hip
otesis de induccion.
)
Si k x, por hip
otesis de induccion tenemos que
)
xx1 xn M (M (x, x1 , . . . , xn ) M (j (x), j (x1 ), . . . , j (xn )))
y hemos de probar que
)
)
x1 xn M ( x M M (x, x1 , . . . , xn )
)
x M M (x, j (x1 ), . . . , j (xn ))).
)
Una implicaci
on es inmediata. Supongamos que x M M (x, x1 , . . . , xn )
y tomemos x M . Entonces existe un ordinal tal que < < y x = j (x ),
con x M . Usando que j es elemental concluimos que
)
x M M (x, j (x1 ), . . . , j (xn )).
En particular M (x , j (x1 ), . . . , j (xn )). Ahora usamos la hip
otesis de
inducci
on para , con lo que
M (j (x ), j (j (x1 )), . . . , j (j (xn ))),
que es lo mismo que M (x, j (x1 ), . . . , j (xn )).
Si k x|, por hip
otesis de induccion tenemos que
1
*

x M M (x, x1 , . . . , xn )

1
*

x M M (j (x1 ), . . . , j (xn )).

C.3. Lmites inductivos

299

Si se da la unicidad y x M es el u
nico x que cumple V , por la hip
otesis
de inducci
on para tenemos que j (x) cumple M , luego es el u
nico que lo
cumple. En denitiva j ((x|)V ) = (x|)M .
Si no se da la unicidad, entonces (x|)V = d y (x|)M = j (d ), luego
tambien tenemos la relacion que buscamos.
El teorema siguiente es inmediato:
Teorema C.18 Si V es un modelo est
andar arbitrario y es un ordinal lmite,
existe una familia de modelos est
andar {V } y una familia de inmersiones
elementales j : V V , para < , de manera que
0

a) V = V .
b) Para cada < el modelo +1V es una ultrapotencia de V respecto a
un cierto ultraltro U y j +1 es la inmersi
on natural can
onica de la
ultrapotencia.

c) Para cada ordinal lmite los modelos { V }< con las correspondientes inmersiones j forman un sistema inductivo y V es el correspondiente lmite inductivo, de modo que las inmersiones j son las correspondientes a este lmite.
En estas circunstancias diremos que el modelo V es un ultralmite del modelo V . Es claro que los ultraltros U pueden denirse recurrentemente a lo
largo del proceso de construcci
on de los modelos V . En particular podemos

+1
denir U en terminos de V y en particular podemos exigir que
V sea una

ultrapotencia adecuada de V . En tal caso diremos que V es un ultralmite


adecuado de V .
En la prueba del teorema de conservaci
on para N necesitamos u
nicamente un
ultralmite numerable (es decir, con = ). En efecto, si partimos de cualquier
modelo estandar V y formamos un ultralmite V = V , tenemos la inmersion

elemental j = j0 : V V . Convertimos a V en un modelo del lenguaje de


N deniendo S = j[V ]. El hecho de que j sea una inmersion elemental permite
probar, con el mismo argumento que en C.12, que V cumple el principio de
transferencia:
Teorema C.19 Si V es un modelo est
andar y V es un ultralmite numerable,

entonces V cumple el principio de transferencia de N.


La diferencia es que ahora podemos demostrar el principio de idealizaci
on
sin restricciones:
Teorema C.20 Si V es un modelo est
andar en el que se cumpla una cierta colecci
on nita de axiomas de ZFC y V es un ultralmite adecuado numerable,

entonces V cumple la implicaci


on del principio de idealizaci
on de N.

300

Apendice C. El teorema de conservacion

n: Fijamos una f
Demostracio
ormula interna (x, y, x1 , . . . , xm ) y hemos
de probar que
)
* )
* )st
)st


V  x1 xm
z(z nito x y z (x, y)) x y, (x, y) ,
es decir, que
)

)
*
)
x1 xm V ( z S(z nito V x V y V (y E z V (x, y))

x V

y S

(x, y)).

Si x1 , . . . , xn V existe un natural m tal que x1 , . . . , xn jm [ V ]. Digamos que xi = jm (xi ), con xi mV . Suponemos
)

z S(z nito V

xV

y V (y E z

(x, y, jm (x1 ), . . . , jm (xn ))).

m+1

V V es una inmersion elemental, con lo


Ahora usamos que jm+1 :
que
m+1
)
*
)
z m+1S(z nito V x m+1V y m+1V
(y En+1 z
donde

m+1

m+1

(x, y, jm m+1 (x1 ), . . . , jm m+1 (xn ))),

S = j0m+1 [V ]. En efecto: jado z

entonces jm+1 (z) S y es nito


*

x V

m+1

m+1

S tal que z es nito

, luego concluimos que

y V (y E z

(x, y, jm (x1 ), . . . , jm (xn )),

y ahora volvemos a aplicar que jm+1 es elemental. Aplicamos el teorema C.15


m
a V , lo cual nos da que
*

m+1

m+1

m+1

(x, y, jm m+1 (x1 ), . . . , jm m+1 (xn )).

Fijamos un x m+1V que cumpla esto y observamos que entonces

)
y S V (jm+1 (x), y, x1 , . . . , xn ).
En efecto, todo elemento de S es de la forma j(y), para un y
ha de cumplir
m+1

(x, y, jm m+1 (x1 ), . . . , jm m+1 (xn )).

Usando de nuevo que jm+1 es elemental pasamos a

(jm+1 (x), jm+1 (y), x1 , . . . , xn ).

En denitiva tenemos que

*
)
x V y S V (x, y, x1 , . . . , xn ),
como tenamos que probar.

m+1

S que

C.3. Lmites inductivos

301

Para los axiomas restantes nos restringiremos al caso en que V es un modelo


V , para un cierto ordinal lmite . Puede probarse que si V cumple sucientes
axiomas de ZFC y z V entonces z es nitoV si y solo si z es nito, pero
podemos a
nadir esto como hip
otesis en lugar de demostrarlo:
Teorema C.21 Existe un conjunto nito de axiomas de ZFC tal que en ZFC
se demuestra que si es un ordinal lmite tal que V  y
)
z V (z es nitoV z es nito)
entonces toda ultrapotencia adecuada numerable V de V cumple los principios
de transferencia, idealizaci
on y estandarizaci
on de N.
)
)
n: Veamos que V  st z(z nito y z st y). Esto
Demostracio

)
)

equivale a probar que z S(z nito V y V (y E z y S)).


Un tal z sera de la forma z = j(z  ), donde z  V y como j es elemental
otesis z  es nito, digamos z  = {y1 , . . . , yn }.
tenemos que z  es nitoV . Por hip

Basta probar que si y E z entonces y = j(yi ) para alg


un i = 1, . . . , n. Lo
probamos por inducci
on sobre n.
)


V
) Si z = {y1 } usamos la formula y(y z y = y1 ) para concluir
y V (y E z y = j(y1 )), como queramos probar.
Si vale para n 1 llamamos z  = {y1 , . . . , yn1 }. Como
)
y(y z  y z  y = yn )V ,
tenemos tambien
)

y V (y E z y E j(z  ) y = j(yn )),

y combinando esto con la hip


otesis de induccion llegamos a que si y E j(z  )
entonces y = j(yi ) para i = 1, . . . , n 1. La conclusi
on es inmediata.
Ahora observamos que la implicaci
on )del principio de
on es
) idealizaci
st
una consecuencia logica de la sentencia V 
z(z nito y z st y) que

acabamos de probar que se cumple en V , luego por C.4 tambien se cumple


la implicaci
on. El recproco nos lo da el teorema anterior. Nos falta probar el
principio de estandarizaci
on, es decir, que
)st *st )st
)

V  x1 xn x
y z(z y z x (z, x, y, x1 , . . . , xn )).
Fijamos x1 , . . . , xn V y x V . Hemos de probar que existe un y V
tal que
)

z S(z E j(y) z E j(x)

(z, j(x), j(y), x1 , . . . , xn )).

Sea y = {z x | V (j(z), j(x), j(y), x1 , . . . , xn )} V . De este modo, si


j(z) S, con z V , se cumple

302

Apendice C. El teorema de conservacion

j(z) E j(y) z y z x
j(z) E j(x)

(j(z), j(x), j(y), x1 , . . . , xn )

(j(z), j(x), j(y), x1 , . . . , xn ).

Con esto llegamos al resultado nal para la N:


Teorema C.22 Si es cualquier colecci
on nita de axiomas de N y es una
f
ormula interna sin variables libres, en ZFC se demuestra que existe un modelo
no est
andar M tal que M  y
M  .
n: Tomamos una coleccion nita de axiomas de ZFC que
Demostracio
contenga a todos los axiomas de ZFC que haya en y que satisfaga el teorema
C.21. Por el teorema C.5 podemos demostrar que existe un ordinal lmite tal
que V esta en las hip
otesis de C.21 y ademas V . Llamamos M a un
ultralmite adecuado numerable de V . Entonces M  , luego en particular M
cumple todos los axiomas de ZFC que hay en . Ademas V M  . Por el
teorema C.21 podemos probar que M cumple los axiomas externos que haya en
, con lo que tenemos todas las propiedades requeridas.
Esto prueba el teorema de conservacion: si es un teorema interno de la
teora de conjuntos no est
andar entonces se demuestra a partir de una cantidad
nita de axiomas . El teorema anterior nos dice c
omo demostrar en ZFC la
existencia de un modelo M tal que M  y M  , el teorema C.4 nos dice
como transformar la prueba que conocemos de a partir de los axiomas de la
teora no estandar en una prueba en ZFC de que M  y reuniendo todo esto
obtenemos una prueba de en ZFC.
Nota La prueba que hemos visto puede entenderse as: la coleccion de todas
las armaciones matematicas (internas) que los matematicos han demostrado
hasta la fecha o se han planteado demostrar es nita. Por el teorema de reexi
on
podemos encontrar un ordinal tal que en V se cumplen todos los teoremas
demostrados hasta la fecha y, ademas, cualquier presunto teorema que un matematico pueda estar interesado en probar (dentro de una selecci
on nita, pero
arbitrariamente grande, de objetivos interesantes) se cumple en V si y solo si
se cumple de verdad.
Si formamos un ultralmite V obtenemos otro modelo donde se cumplen
todos los teoremas demostrados y tal que un objetivo se cumple si y solo si se
cumple de verdad. Pero adem
as en V se cumplen los axiomas de la teora de
conjuntos no est
andar, por lo que si demostramos un objetivo con la ayuda de
estos axiomas y de cualquier teorema conocido previamente, estamos probando
que nuestro objetivo se cumple en V , y entonces se cumple de verdad.

C.4. El teorema de conservacion para la teora de Hrbacek

C.4

303

El teorema de conservaci
on para la teora
de Hrbacek

El teorema de conservacion para H requiere una construcci


on mas delicada
que la que acabamos de emplear para N. Concretamente, hemos de demostrar
que si es una f
ormula de ZFC tal que in es un teorema de H, entonces es
un teorema de ZFC.
Para empezar observamos que si M = (M, E, I, S, d) es un modelo del lenguaje de H entonces (I, E|II , d) es un modelo estandar, y si (x1 , . . . , xn ) es
una f
ormula de ZFC entonces
)

x1 xn M ((in )M (x1 , . . . , xn ) I (x1 , . . . , xn )),

pues las restricciones x M x I que aparecen en (in )M equivalen a las


restricciones x I que aparecen en I . Se demuestra por inducci
on sobre la
longitud de , probando al mismo tiempo que si es un termino entonces
)

x1 xn M ((in )M (x1 , . . . , xn ) = I (x1 , . . . , xn )).

Partimos de un modelo V que cumpla los sucientes axiomas de ZFC y tal


que, para la f
ormula que queremos demostrar en ZFC, se cumpla V .
Basta construir un modelo M en el que se cumplan los axiomas de H junto
con una inmersi
on elemental j : V I, pues si in es demostrable en H
entonces tendremos (in )M , luego I , luego V y, por consiguiente, . Toda
la prueba ser
a constructiva.
En realidad vamos a trabajar simult
aneamente con todos los modelos V ,
para < . Por claridad enunciamos en un teorema las caractersticas de la
construccion que vamos a realizar. Necesitamos una denicion adicional:

Denici
on C.23 Una aplicaci
on i : M M
es
) entre dos modelos estandar
una inmersi
on inicial si es inyectiva, cumple xy M (x E y i(x) E  i(y)),
i(d) = d y

)
*
x M y M  (y E  i(x) y0 M y = i(y0 )).

Teorema C.24 Fijados ordinales lmite y , existe una sucesi


on de modelos
est
andar W , con < , junto con aplicaciones inyectivas


i : W W ,

j : W W

(para <  < , <  ) tales que:








a) Si <  <  entonces j j = j .


b) Si <  <  entonces i i  = i .

304

Apendice C. El teorema de conservacion

c) Si <  , <  el diagrama siguiente es conmutativo:


W


j


 W 




i


i


 W 

d) Las aplicaciones j son inmersiones elementales, y las aplicaciones i


son inmersiones iniciales.
e) W0 = V , E0 es la relaci
on de pertenencia, i0 es la inclusi
on.
f ) Cada W+1 es una ultrapotencia de W respecto a un ultraltro U en
un conjunto I (donde ninguno de los dos depende de ).


g) Si  es un ordinal lmite entonces W es el lmite inductivo de los


modelos W , para <  .
n: Las condiciones del teorema determinan totalmente la
Demostracio

construccion. Unicamente
hemos de explicitar la construccion de las inmersiones iniciales.
Para = 0, la transitividad de cada V implica que las inclusiones i0 son
ciertamente inmersiones iniciales.
Supuestos construidos todos los modelos W para todo < y un < ,
(junto con las aplicaciones correspondientes). Fijamos arbitrariamente un conjunto I y un ultraltro U en I y denimos W+1 como la ultrapotencia
correspondiente de W . Esto nos da autom
aticamente las inmersiones elementales j +1 .



Denimos i+1
 ([f ]) = [f ], donde f (i) = i (f (i)). Una simple comproa bien denida, satisface las relaciones indicadas y
baci
on muestra que i+1
 est
es inicial. Por ejemplo, si [g] E+1
i+1

 ([f ]), entonces
{i I | g(i) E i (f (i))} U .
Como i es inicial, para cada i en este conjunto, g(i) = i (g  (i)), donde
g (i) W . Extendemos g  a una funci
on sobre todos los ndices, de modo que
tenemos [g  ] W y claramente [g] = i ([g  ]).


Supongamos ahora construidos los modelos W (con las aplicaciones corres


pondientes) para todo <  , donde  es un ordinal lmite. Denimos W

como el lmite inductivo de los modelos W . Las aplicaciones i se denen
mediante

i ([{x }]) = [{i (x )}].
Se demuestra f
acilmente que estan bien denidas, que cumplen todas las
relaciones y que son iniciales.
En realidad podemos exigir algo m
as:

C.4. El teorema de conservacion para la teora de Hrbacek

305

Teorema C.25 En las condiciones del teorema anterior, los conjuntos I y los
ultraltros U pueden elegirse de modo que cada W+1 sea una ultrapotencia
adecuada de W .
n: Suponemos construidos los modelos {W }< , con las
Demostracio
correspondientes inmersiones i . Formamos el lmite inductivo W y tomamos
I y U seg
un el teorema C.14 aplicado a W , es decir, I es el conjunto de
todos los subconjuntos nitos de PW . Vamos a comprobar que el argumento
de C.14 se rena levemente para probar que todas las ultrapotencias W+1 son
adecuadas:
Tomamos un ultraltro F W y para cada i I llamamos Ai a la interseccion de los conjuntos (i )1 [X], donde X i e (i )1 [X] F (entendiendo
que Ai = W si no hay ning
un X). En particular Ai = , por lo que podemos
tomar f (i) Ai y formamos as un = [f ] W+1 .
Ahora, si Y F y X = i [Y ] i entonces Ai Y , luego f (i) Y , lo que a
su vez implica que
{i I | f (i) Y },
X
luego el u
ltimo conjunto est
a en U . Como en C.14 se concluye ahora que
Y t(), con lo que F t() y al ser ultraltros tenemos la igualdad.
Tomamos concretamente = |V |+ (el menor cardinal mayor que el cardinal
de V ). Para cada ordinal denimos W como el lmite inductivo del
sistema formado por los modelos {W }< con las aplicaciones i . Esto nos
acil ver que son iniciales. As mismo es
da aplicaciones i : W W . Es f
claro que V se identica con W 0 de forma natural.


Si <  , denimos j : W W como la u


nica aplicaci
on que




acil ver que existe. Pronto veremos que j
cumple i j = j i . Es f
es una inmersi
on elemental, pero esto no es inmediato.
Llamamos I = W e identicamos cada modelo W con su imagen por la
aplicaci
on j i . Es claro entonces que todas las inmersiones que estamos
considerando se identican con inclusiones. En particular
W =

&

W .

<

Recordemos que el ordinal lo proporciona el teorema de reexi


on, de modo
que V satisface una coleccion nita arbitrariamente grande de axiomas de ZFC.
Vamos a exigir que satisfaga tambien las propiedades siguientes (lo cual es posible siempre por el teorema de reexion)
)
a) V ( es un ordinalV es un ordinal).
)
b) < (VV = V ) (esto se obtiene por el teorema de reexion aplicado
a x = V ).

306

Apendice C. El teorema de conservacion

En la prueba del teorema de reexi


on se ve que el ordinal se puede tomar
arbitrariamente grande, es decir, para cada f
ormula tenemos que
) * 
)
(  x1 xn V (V (x1 , . . . , xn ) (x1 , . . . , xn )).
(Aqu se entiende que representa un ordinal y  un ordinal lmite.)
Pues bien, vamos a suponer que V cumple la relativizaci
on de esta f
ormula
a V (para una colecci
on nita arbitrariamente grande de f
ormulas . Teniendo
en cuenta a) y b) lo que estamos suponiendo es que
)
*
)
<  (  < x1 xn V (V (x1 , . . . , xn ) V (x1 , . . . , xn )).
Pero esto es tanto como decir que la inclusion i0 : V V es una
inmersi
on elemental para un conjunto de ordinales lmite  no acotado en .
Teorema C.26 En las condiciones anteriores, si i0 es una inmersi
on elemen
tal, tambien lo es i para todo .
n: Fijada una f
Demostracio
ormula, construimos una sucesi
on de expresiones 1 , . . . , r igual que en la prueba del teorema de reexi
on y demostramos
que cada k cumple la denici
on de inmersi
on elemental o el teorema C.7 seg
un
si es una f
ormula o un termino. Razonamos por inducci
on sobre . Para = 0
es trivial. Ahora suponemos que i es una inmersion elemental para todas las
expresiones k y siempre que i0 lo es, y vamos a probarlo para i+1
 . A su vez
suponemos que se cumple para expresiones anteriores a k y lo probamos para
esta.
Si k x es trivial. Si k t1 = t2 o k t1 t2 se sigue inmediatamente
no es mas que la inclusi
on. Los casos k o k son
de que i+1

igualmente inmediatos a partir de
la
otesis para y .
) hip
Supongamos ahora que k x. La parte no trivial es suponer que, jados
)
+1
x1 , . . . , xn W+1
, si se cumple x W+1
W (x, x1 , . . . , xn ) entonces


)
+1
tambien x W +1 W (x, x1 , . . . , xn ).
Supongamos, por reducci
on al absurdo, que existe x W +1 de manera que
+1
W (x, x1 , . . . , xn ). Tomemos entonces un ordinal lmite  >  tal que i0
sea elemental y de modo que x W+1
.

+1

Por la hip
otesis de induccion para y  tenemos W (x, x1 , . . . , xn ).
Tomemos funciones fj : I W funciones tales que xj = [fj ]. Por el
teorema C.11 tenemos que
{i I |

x W W (x, f1 (i), . . . , fn (i))} U .

Para cada ndice i en este conjunto aplicamos la hip


otesis de induccion en
virtud de la cual las inclusiones i e i son elementales para k , de donde se
*

sigue que x W W (x, f1 (i), . . . , fn (i)). As pues,


{i I |

x W W (x, f1 (i), . . . , fn (i))} U .

C.4. El teorema de conservacion para la teora de Hrbacek


De nuevo por C.11 concluimos que
contra de lo supuesto.

307

+1

x W+1
W (x, x1 , . . . , xn ), en


El caso en que k x| se trata con el mismo argumento que hemos empleado en todos los resultados similares a este.
Ahora suponemos que es un ordinal lmite y que i es una inmersion
elemental para las expresiones k siempre que < y i0 lo es. Hemos de
probarlo para i , y a su vez lo suponemos cierto para las expresiones anteriores
a k .
)
Pasamos directamente al u
nico caso no trivial, es decir, cuando k x.

Fijamos x1 , . . . , xn W y suponemos que existe un x W de manera que

W (x, x1 , . . . , xn ).
Sea  > un ordinal lmite tal que i0 sea elemental y x, x1 , . . . , xn W .
A su vez tomamos un < tal que x W y x1 , . . . , xn W .

Por la hip
otesis de induccion para tenemos W (x, x1 , . . . , xn ), como la

inclusi
on j es elemental de aqu se sigue W (x, x1 , . . . , xn ), por la hip
otesis
*

de inducci
on para i e i respecto a k tenemos x W W (x, x1 , . . . , xn ),
y usando que la inmersi
on j es elemental concluimos que
*

x W W (x, x1 , . . . , xn ).

Como consecuencia tenemos:




Teorema C.27 Si <  , la inclusi


on j : W W es una inmersi
on elemental.
n: Dada una f
Demostracio
ormula (x1 , . . . , xn ), jamos x1 , . . . , xn W

y tomamos un ordinal lmite tal que x1 , . . . , xn W y las inclusiones i ,


i sean elementales. Entonces, usando que j
es elemental, vemos que


W (x1 , . . . , xn ) W (x1 , . . . , xn ) W (x1 , . . . , xn ) W (x1 , . . . , xn ).

Llamaremos j = j 0 , de modo que j : V I es una inmersion elemental.


Denimos S = j[V ] I. Los elementos de I seran los conjuntos internos
del modelo que vamos a construir. Ahora nos falta construir los conjuntos
estrictamente externos. Conviene introducir el siguiente concepto:
Denici
on C.28 Si x es un elemento de un modelo estandar M , llamaremos
extensi
on de x al conjunto x
= {u M | u E x}.
En la denici
on siguiente las extensiones que aparecen hacen referencia a la
relacion E del modelo estandar I:

308

Apendice C. El teorema de conservacion

Denici
on C.29 Denimos la familia de modelos estandar (Z , E , d), para
< , , determinada por las propiedades siguientes:
a) La descripci
on impropia de todos los modelos es la de I.
b) (Z0 , E0 , d) = (W , E , d).
c) Z+1 = Z A B , donde
A = {x I | x
Z },

B = {x PZ |

y I x = y}.

d) E+1 = E {(x, y) Z A | x E y} {(x, y) Z B | x y}.


&
&


e) Si  es un ordinal lmite, Z =
Z , E =
E .
<

<

Denimos M como la uni


on de todos los modelos Z , con la relaci
on E que
resulta de unir todas las relaciones E y con la descripci
on impropia de I.
Veamos algunas consecuencias de esta denicion:
Teorema C.30 Se cumple:
a) S I M .
b) Si x I entonces la extensi
on de x en M es la misma que en I.
c) Si x M \ I, entonces la extensi
on de x es x.
d) Para todo a Z existe un x Z+1 tal que x
= a.


e) Si <  < y <  , entonces Z Z Z .


f ) Si x M , y Z , x E y, entonces x Z .
n: Las propiedades a), b) y c) son inmediatas. La propiedad
Demostracio
d) se debe a que o bien existe un x A tal que x
= a, y entonces cumple lo
acilmente
pedido, o bien tomamos x = a B . La propiedad e) se demuestra f
por inducci
on. La propiedad f) se prueba por inducci
on sobre . El caso = 0
es consecuencia de que la inclusion de W en I es inicial.
Tenemos as un modelo M = (M, E, I, S, d). Hemos de probar que cumple
(cualquier subcolecci
on nita de) los axiomas de H.
Extensionalidad Decir que M cumple el axioma de extensionalidad es tanto
como decir que si dos conjuntos x, y M tienen la misma extension entonces
son iguales. Ahora bien, si x, y M \ I entonces x = x
= y = y, si x, y I
entonces las extensiones de x e y son sus extensiones en I, y ha de ser x = y
porque I satisface el axioma de extensionalidad. Por u
ltimo, no puede ocurrir
que x I e y M \ I tengan la misma extension, pues si y Z y es el
mnimo ordinal para el que esto sucede, entonces = + 1 y ha de ser y B ,
con lo que y = y = x
.

C.4. El teorema de conservacion para la teora de Hrbacek

309

Par El axioma del par es


)
*
)
xy M z M u M (u E z u = x u = y).
Sean y tales que x, y Z . Consideremos a = {x, y} Z . Basta
tomar el z Z+1 cuya extension es a.
Uni
on El axioma de la uni
on es
)
*
)
x M y M uv M (u E v v E x u E y).
*
Consideremos a = {u M | v M (u E v v E x)}. Si x Z , entonces
todo v M que cumpla v E x esta tambien en Z y lo mismo sucede con todo
u M tal que u E v. As pues, a Z . Ahora basta tomar el x Z+1 cuya
extension es a.
Partes El axioma de partes es
)
*
)
)
x M y M u M ( v M (v E u v E x) u E y).
Tomamos x M , que estara de hecho en un Z . Sea a = {u Z+1 | u
x
}
y sea y Z+2)cuya extension sea a. Entonces y cumple lo pedido, pues si
u M cumple v M (v E u v E x), entonces u
x
Z , luego existe un
+1
=u
0 , luego por extensionalidad u = u0 Z+1 . M
as a
un,
u0 Z tal que u
u a, luego u E y.
Especicaci
on El axioma de especicacion es
)
*
)
x1 xn x M y M u M (u E y u E x M (u, x1 , . . . , xn )))
Tomamos y tales que x Z y consideramos el conjunto
a = {u Z | u E x M (u, x1 , . . . , xn )}.
Es claro que el y Z+1 cuya extension es a cumple lo necesario.
Elecci
on Para demostrar el axioma de eleccion tomamos un conjunto x Z
y jamos un buen orden R en x. Teniendo en cuenta que (u, v) {{u}, {u, v}},
es facil ver que si u E x v E x, entonces {u}M , {u, v}M Z+1 y que
(u, v)M Z+2 . Llamamos a al conjunto de todos los elementos de Z+2 que
son de la forma (u, v)M , con (u, v) R y tomamos el conjunto y Z+3 cuya
extension es a. Se comprueba que (y es un buen orden de x)M .
Inclusi
on y transitividad El axioma
) de inclusi
) on es trivial, pues S I. El
axioma de transitividad equivale a que x M y I(x E y x I), lo cual
es cierto, pues la extension de un conjunto interno es su extensi
on en I.

310

Apendice C. El teorema de conservacion

ZFCin Podemos demostrar que M cumple cualquier cantidad nita de axiomas de ZFC relativizados a conjuntos internos gracias a la inmersi
on elemental
j : V I. En efecto, si es un axioma de ZFC, podemos suponer V , luego
I , pero esto equivale a (in )M .
Transferencia Para demostrar el principio de transferencia hemos de probar
que
)
)
)
x1 xn S( x S I (x, x1 , . . . , xn ) x II (x, x1 , . . . , xn )).
)
Sean j(x1 ), . . . , j(x)
x SI (x, j(x1 ), . . . , j(xn ))
n ) S y supongamos que
I
o, lo que es lo mismo,
x V (j(x), j(x1 ), . .). , j(xn )). Como j es elemental,
)
) ( x)V (x1 , . . . , xn ). Usando de
esto equivale a x V V (x, x1 , . . . , xn )
nuevo que j es elemental concluimos que x II (x, j(x1 ), . . . , j(xn )).
Idealizaci
on Observemos que si A M cumple (A tiene tama
no estandar)M ,

entonces existen B I y f M tales que (f : B A suprayectiva)M . No es


cierto que f sea exactamente una aplicacion fuera de M , pero en cualquier caso
A.
La aplicaci
determina una aplicaci
on suprayectiva g : S B
on j biyecta
con un subconjunto de V , luego |A|
|V | < .
SB
Llamemos A0 = A I. Tambien se cumple que |A0 | < . Vamos a probar
que existen ordinales < , < tales que A0 W . Para ello necesitamos
algunos hechos previos:
0
1) Si x W , entonces i +1 (x) E j+1
(V ).

En efecto, se prueba por inducci


on sobre . Para = 0 es trivial
00
(entendiendo que j+1
es la identidad). Si vale para y x W+1 , entonces
x = [f ], para cierta f : I W . Sea i+1
otesis
+1 (x) = [g]. Aplicando la hip
0
de inducci
on a f (i), tenemos que g(i) = i +1 (f (i)) E j+1
(V ). Tomando
+1 0
0+1
mite y x W ,
clases i+1
+1 (x) E j+1 (j+1 (V )) = j+1 (V ). Si es l



existe un < tal que x = j (x ), con x W . Por hip


otesis de induccion

0
0
(V ), y aplicando j+1
tenemos i +1 (x) = j+1
(V ).
i +1 (x ) E j+1
0
2) Si x I y x
Z0 , entonces x Z+2
.

En efecto, seg
un la propiedad anterior (recordemos que Z0 = W ) tenemos
I
que (x j(V )) , luego x Pj(V ))I , y como j es elemental (Pj(V ))I =
0
, y por el teorema C.30 f)
j((PV )V ) = j(V+1 ). As pues, x E j(V+1 ) Z+2
0
concluimos que x Z+2 .
0
3) Z I Z+2
.

Por inducci
on sobre < . Para = 0 es trivial. Si x Z+1 I, entonces

0
0
x
Z I Z+2
, luego por el apartado anterior x Z+2+2
. Si es lmite

y x Z I, entonces x Z I, para un < . Por hip


otesis de induccion
0
0
x Z+2
Z+2
.

C.4. El teorema de conservacion para la teora de Hrbacek

311

Volviendo al conjunto A de tama


no estandar, si A Z , ahora tenemos que
0

A0 Z I Z+2
= W+2
, pero como es un cardinal regular y |A0 | < ,

ha de existir un < tal que A0 W+2


. Cambiando la notaci
on, tenemos
un ordinal < y otro < tales que A0 W . Puesto que se puede
tomar arbitrariamente grande, podemos suponer que la inclusi
on W I es
elemental (ver el teorema C.26).
Fijados x1 , . . . , xn I (que podemos suponer en W ) Hemos de demostrar
)
*
)
z M (
z A z nitoM x I y z A0 I (x, y, x1 , . . . , xn ))
*
)
x I y A0 I (x, y, x1 , . . . , xn ).
Suponemos la hip
otesis. Tomamos y1 , . . . , ym A0 . Puesto que las inclusiones W W I son elementales, podemos suponer que W satisface
cualquier cantidad nita de axiomas de ZFC. Si suponemos que cumple los necesarios para demostrar que existe {x} y es nito, que existe la uni
on de conjuntos
y que la uni
on de conjuntos nitos es nita, podemos construir un z W cuya
extension sea {y1 , . . . , ym }. Tambien es facil ver que z es nitoM , por lo que
*
)
x I y I(y E z I (x, y, x1 , . . . , xn )).
Usando que las inclusiones son elementales pasamos a
*
)

x W y W (y E z W (x, y, x1 , . . . , xn )).

As pues, tenemos que los conjuntos {x W | W (x, y, x1 , . . . , xn )} para


on nita, luego est
an contenidos en
y A0 tienen la propiedad de la intersecci
un ultraltro F en W . Como la ultrapotencia W+1 es adecuada, existe un
W+1 tal que F = t(), y as, si y A0 tenemos que
{x W | W (x, y, x1 , . . . , xn )},

lo cual, por el teorema C.11 equivale a


+1

(, j +1 (y), j +1 (x1 ), . . . , j +1 (xn )).

Si usamos que j+1 e i son inmersiones elementales e identicandolas con


inclusiones llegamos a I (, y, x1 , . . . , xn ), para todo y A0 , como tenamos que
probar.
Estandarizaci
on Hemos de probar que
)
*
)
x M y S u S(u E y u E x).
Para ello demostramos primero que si < , u V , y W y
= i (y), entonces u V .

j0 (u)

Lo probamos por inducci


on sobre . Para = 0 es trivial (entendiendo que
j00 es la identidad). Si vale para , sea x = j0 (u), con lo que j0+1 (u) =
j+1 (x ) = [cx ].

312

Apendice C. El teorema de conservacion

Por otra parte, si y = [f ], para un conjunto de ndices i que esta en U , se


ha de dar la igualdad cx (i) = i (f (i)), es decir, existe un y  = f (i) W tal
que x = j0 (u) = i (y  ). Por hip
otesis de induccion u V .
Si es un lmite y vale para todo < , tomamos de modo que y = j (y  ),
para cierto y  W . Entonces
j (j0 (u)) = i (j (y  )) = j (i (y  )),
luego j0 (u) = i (y  ) y, por hip
otesis de induccion, u V .
En particular, para = e identicando todos los modelos con subconjuntos
de I tenemos que si u V cumple j(u) Z0 entonces u V .
Ahora demostramos que si u V cumple j(u) Z , con , < , entonces
u V+ .
Observemos antes que podemos exigir que si , < entonces + < .
En efecto, basta suponer que V cumple
)
x V (x es un ordinalV x es un ordinal)
as como el teorema que arma que para cada dos ordinales existe su suma.
Razonamos por inducci
on sobre . Para = 0 lo acabamos de probar.
Supong
amoslo cierto para y sea j(u) Z+1 . Si v u, entonces j(v) E j(u),
luego j(v) Z . Por hip
otesis de induccion v V+ , luego u V+ , luego
u V++1 . El caso lmite es trivial.
Ahora ya podemos demostrar el principio de estandarizaci
on: dado x Z ,
con , < , tomamos a = {u V+ | j(u) E x} V++1 . As, para todo
u V tenemos que j(u) E x si y solo si u a, si y solo si j(u) j(a), luego
basta tomar y = j(a) S.
En denitiva, hemos demostrado lo siguiente:
Teorema C.31 Si es cualquier colecci
on nita de axiomas de H y es una
f
ormula de ZFC sin variables libres, en ZFC se demuestra que existe un modelo
M tal que M  y
M  in .
De aqu se deduce el teorema de conservacion para H exactamente igual que
el teorema para N se deduca de C.22. La prueba del teorema anterior y por
consiguiente del teorema de conservacion es completamente constructiva.
Regularidad y reemplazo Vamos a justicar aqu las armaciones del u
ltimo apartado del apendice B. Ante todo, teniendo en cuenta que todos los
conjuntos de V0 son nitos, es f
acil ver que j biyecta V0 con Z00 . Por comodidad
podemos sustituir los conjuntos de Z00 por sus antiim
agenes en V0 , de modo que
V0 M y j es la identidad en V0 .

C.4. El teorema de conservacion para la teora de Hrbacek

313

Un conjunto x I tal que x


Z00 tiene todos sus elementos estandar, por
lo que ha de ser estandar y nito, lo cual obliga a que este en Z00 . As pues,
0
1
0
Z01 no tiene mas conjuntos internos que los
) de Z0 . Por consiguiente Z0 = PZ0 .
Ahora es f
acil demostrar en general que < Z0 = V , luego V M y la
relacion E en M se restringe a la pertenencia usual en V .
Se comprueba que los u
nicos ordinalesM son los elementos de , y entonces
es facil ver que en M puede construirse la jerarqua regular, de modo que los
conjuntos regulares son precisamente los de V . En particular en M se cumple
que la relaci
on de pertenencia esta bien fundada sobre los conjuntos regulares,
y a traves de la inmersion j se prueba que tambien esta bien fundada sobre
los conjuntos est
andar. M
as a
un, en M existe el colapso transitivo de cada

conjunto est
andar x, pues no es sino j 1 (x). Estos
son los hechos que habamos
armado que pueden a
nadirse como axiomas adicionales a H sin perder por ello
el teorema de conservacion, lo cual queda ahora demostrado porque se cumplen
en M .

Bibliografa
[1] Diener, F. Cours danalyse nos standard, Universite dOran (1983).
[2] Hrbacek, K. Axiomatic foundations of nonstandard analysis,
Fund. Math. XCVIII (1978), pp. 119.
[3] Hrbacek, K. Nonstandard set theory, Amer. Math. Monthly 83 (1979),
pp. 659677.
[4] Nelson, E. Internal set theory: a new approach to nonstandard analysis,
Bull. Amer. Math. Soc. 83 (6) (1977), pp. 11651198.
[5] Stroyan, K. D., Luxemburg, W. A. J. Introduction to the theory of
innitesimals. Pure and Applied Mathematics, No. 72. Academic Press,
New York (1976).

315

Indice de Materias
abierto, 183
absolutamente convergente (serie),
159
acotada
funci
on, 118
sucesion, 58
acotado
conjunto, 17
espacio, 187
acumulaci
on (punto de), 80
adherente (punto), 184
aislado (punto), 80
anillo, 21
aplicaci
on, 12
arco seno, 134
arco tangente, 140
arquimediano (cuerpo), 48

cociente, 18
de oportunidades, 212
conservacion (principio de), 41
continua (funci
on), 78, 189
convergencia
casi uniforme, 168
de funciones, 109
de sucesiones, 54
puntual, 163
uniforme, 165
convexa (funci
on), 97
coseno, 136
hiperb
olico, 116
cota, 17
cubo, 219
cuerpo, 25
cuadrupla, 8
concava (funci
on), 97

Barrow (regla de), 125


bola, 185
buena ordenaci
on (principio de), 17

derivada, 86
parcial, 195
derivadas sucesivas, 99
diferenciable (funci
on), 197
estricta, 201
distancia, 181
eucldea, 180
producto, 182
dominio de integraci
on, 223

cardinal, 20
casi estandar, 182
funci
on, 163
n
umero, 62
Cauchy (sucesion de), 62, 170
cerrado, 184
cilndricas (coordenadas), 248
clase de equivalencia, 18
clausura, 186
compacto (espacio), 188
complementario, 9
concurrente (relaci
on), 264, 265
conexo (espacio), 193
congruencia, 22
conjunto

entorno, 86, 183


espacio
normado, 180
vectorial, 179
especicacion (axioma de), 6
estandarizacion (principio de), 40,
268
exponencial, 104, 107
316

INDICE DE MATERIAS
extensionalidad (axioma de), 3
extension, 307
extension (principio de), 33, 269
externa (armaci
on, propiedad, etc.),
32
externa (expresi
on), 261
externo (conjunto), 37, 267
factorial, 28
ltro, 291
nito
conjunto, 18
n
umero, 49
n
umero natural, 44
punto, 182
frontera, 187
funci
on, 12
lagrangiana, 214
objetivo, 212
Gauss (campana de), 248
geometrica (suma de una serie), 103
gr
aca, 77
halo, 53, 182
homeomorsmo, 193
idealizaci
on (principio de), 36, 264
indeterminaci
on, 59
inducci
on (principio de), 11
inductivo (conjunto), 10
nmo, 70
innitamente pr
oximos (n
umeros),
51
innitesimal, 50
innito
conjunto, 18
n
umero, 49
n
umero natural, 44
innitud (axioma de), 10
inmersi
on
elemental, 290
inicial, 303
integral, 121, 222
inferior, superior, 119, 221
interior, 186
interior (punto), 86, 183

317
interna (armaci
on, propiedad, etc.),
6, 32
interna (expresi
on), 261
interseccion, 8
intervalo, 74
LH
opital (regla de), 112115
Lagrange (condiciones de), 214
lagrangiana (funci
on), 214
ley de composicion, 21
logaritmo, 105
longitud, 133, 145
lmite
de funciones, 109
de sucesiones, 55
innito, 59
inductivo, 297
superior, 174
matriz jacobiana, 198
maximo, 17
local, 93, 212
mnimo, 17
local, 93, 212
modelo, 286
mon
otona
funci
on, 85
sucesion, 73
multindice, 220
Newton (binomio), 29
norma, 180, 220
de una partici
on, 118
eucldea, 180
nulo (conjunto), 224
n
umeros
combinatorios, 28
enteros, 23
naturales, 10
racionales, 26
optimizacion cl
asica, 212
par
desordenado, 8
ordenado, 8
parte entera, 48

318
parte estandar, 62, 182
partes (conjunto de), 9
partici
on, 117, 220
Peano (axiomas de), 11
pertenencia, 3
pi, 137
polares (coordenadas), 147, 246
polinomio, 81
primitiva, 126
producto cartesiano, 9
radio de convergencia, 176
raz k-esima, 71
recta tangente, 142
regular (punto, conjunto), 211
relacion, 16
de equivalencia, 18
de orden, 16
relativizaci
on, 273, 285
remoto (punto), 182
restriccion, 13
seccion, 60
seno, 135
hiperb
olico, 116
serie, 100
funcional, 171
simplicaci
on (propiedad de), 16
sistema inductivo, 297
subconjunto, 4
sucesion, 53
sumas de Riemann, 118, 220
supremo, 70
tangente, 88, 139
Tartaglia (tri
angulo), 29
Taylor
polinomio de, 100
resto de, 100
serie de, 100
Teorema
de cambio de variable, 127, 244
de Cauchy, 96
de completitud, 68, 69
de la funci
on implcita, 210
de la funci
on inversa, 94, 206,
209

INDICE DE MATERIAS
de la media, 236
de recursi
on, 13
de Schwarz, 205
de Tychono, 189
de Weierstrass (primero), 83
de Weierstrass (segundo), 84
del valor medio, 96
terna, 8
transferencia (principio de), 33, 262
ultraltro, 292
ultralmite, 299
ultrapotencia, 292
adecuada, 295
unidad, 25
uni
on, 8
vaco (conjunto), 7
valor absoluto, 48
valor medio, 236
Viviani (b
oveda de), 255
volumen, 220, 223
Weierstrass (criterio de mayoracion),
172

También podría gustarte