Está en la página 1de 334

Carlos Ivorra

AN

ALISIS NO
EST

ANDAR
Si una cantidad no negativa fuera tan peque na
que resultara menor que cualquier otra dada, cier-
tamente no podra ser sino cero. A quienes pregun-
tan que es una cantidad innitamente peque na en
matem aticas, nosotros respondemos que es, de he-
cho, cero. As pues, no hay tantos misterios ocultos
en este concepto como se suele creer. Esos supues-
tos misterios han convertido el c alculo de lo innita-
mente peque no en algo sospechoso para mucha gente.
Las dudas que puedan quedar las resolveremos por
completo en las p aginas siguientes, donde explicare-
mos este c alculo.
Leonhard Euler

Indice General
Introducci on vii
Captulo I: Preliminares conjuntistas 1
1.1 Conjuntos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2
1.2 Los conceptos conjuntistas b asicos . . . . . . . . . . . . . . . . . 7
1.3 Elementos de teora de conjuntos . . . . . . . . . . . . . . . . . . 12
1.3.1 Funciones . . . . . . . . . . . . . . . . . . . . . . . . . . . 12
1.3.2 Relaciones . . . . . . . . . . . . . . . . . . . . . . . . . . . 16
1.3.3 Conjuntos nitos . . . . . . . . . . . . . . . . . . . . . . . 18
1.3.4 Estructuras algebraicas y de orden . . . . . . . . . . . . . 21
1.3.5 Elementos de aritmetica . . . . . . . . . . . . . . . . . . . 27
1.4 La teora de conjuntos no est andar . . . . . . . . . . . . . . . . . 30
Captulo II: Los n umeros reales 43
2.1 Los n umeros naturales . . . . . . . . . . . . . . . . . . . . . . . . 43
2.2 Cuerpos ordenados . . . . . . . . . . . . . . . . . . . . . . . . . . 47
2.3 Convergencia de sucesiones . . . . . . . . . . . . . . . . . . . . . 53
2.4 La incompletitud de Q . . . . . . . . . . . . . . . . . . . . . . . . 59
2.5 La construcci on de R . . . . . . . . . . . . . . . . . . . . . . . . . 63
2.6 Consecuencias de la completitud de R . . . . . . . . . . . . . . . 70
Captulo III: Calculo diferencial de una variable 77
3.1 La gr aca de una funci on . . . . . . . . . . . . . . . . . . . . . . 77
3.2 Funciones continuas . . . . . . . . . . . . . . . . . . . . . . . . . 78
3.3 Funciones derivables . . . . . . . . . . . . . . . . . . . . . . . . . 85
3.4 Derivadas sucesivas, la f ormula de Taylor . . . . . . . . . . . . . 99
3.5 Exponenciales y logaritmos . . . . . . . . . . . . . . . . . . . . . 102
3.6 Lmites de funciones . . . . . . . . . . . . . . . . . . . . . . . . . 109
Captulo IV: Calculo integral de una variable 117
4.1 La integral de Riemann . . . . . . . . . . . . . . . . . . . . . . . 117
4.2 Las funciones trigonometricas . . . . . . . . . . . . . . . . . . . . 133
4.3 C alculo de longitudes, areas y vol umenes . . . . . . . . . . . . . . 141
v
vi

INDICE GENERAL
Captulo V: Series innitas 153
5.1 Series numericas . . . . . . . . . . . . . . . . . . . . . . . . . . . 153
5.2 Sucesiones funcionales . . . . . . . . . . . . . . . . . . . . . . . . 163
5.3 Series de potencias . . . . . . . . . . . . . . . . . . . . . . . . . . 174
Captulo VI: Calculo diferencial de varias variables 179
6.1 Espacios metricos y espacios normados . . . . . . . . . . . . . . . 179
6.2 Elementos de topologa . . . . . . . . . . . . . . . . . . . . . . . . 183
6.3 Funciones continuas . . . . . . . . . . . . . . . . . . . . . . . . . 189
6.4 Derivadas y diferenciales . . . . . . . . . . . . . . . . . . . . . . . 195
6.5 El teorema de la funci on implcita . . . . . . . . . . . . . . . . . 208
6.6 Optimizaci on cl asica . . . . . . . . . . . . . . . . . . . . . . . . . 212
Captulo VII: Calculo integral de varias variables 219
7.1 Resultados b asicos . . . . . . . . . . . . . . . . . . . . . . . . . . 219
7.2 Dominios de integraci on . . . . . . . . . . . . . . . . . . . . . . . 223
7.3 C alculo de integrales . . . . . . . . . . . . . . . . . . . . . . . . . 231
7.4 El teorema de la media . . . . . . . . . . . . . . . . . . . . . . . . 235
7.5 El teorema de cambio de variable . . . . . . . . . . . . . . . . . . 238
7.6

Areas de supercies . . . . . . . . . . . . . . . . . . . . . . . . . . 250
7.7 Apendice: Descomposici on de aplicaciones lineales . . . . . . . . 257
Apendice A: La teora de Nelson 261
Apendice B: La teora de Hrbacek 271
Apendice C: El teorema de conservaci on 285
C.1 Modelos internos . . . . . . . . . . . . . . . . . . . . . . . . . . . 285
C.2 Ultrapotencias . . . . . . . . . . . . . . . . . . . . . . . . . . . . 291
C.3 Lmites inductivos . . . . . . . . . . . . . . . . . . . . . . . . . . 297
C.4 El teorema de conservaci on para la teora de Hrbacek . . . . . . 303
Bibliografa 315

Indice de Materias 316


Introducci on
En la historia de las matem aticas nos encontramos con muchos momen-
tos en que los matem aticos han manejado con seguridad por no decir con
virtuosismo conceptos cuya naturaleza y propiedades b asicas eran incapaces
de precisar. El ejemplo tpico lo tenemos en los algebristas de los siglos XVI
y XVII, que eran capaces de encontrar races reales de polinomios pasando, en
caso de ser necesario, por races imaginarias de otros polinomios que aparecan
a lo largo del c alculo. Los n umeros imaginarios eran concebidos como unos con-
ceptos cticios en los que, sin saber c omo ni por que, se poda conar, en el
sentido de que al incluirlos en los c alculos llevaban a conclusiones correctas.
Naturalmente, la raz on por la que los c alculos con n umeros complejos eran
correctos es que es posible construir los n umeros complejos, de tal modo que
lo que hacan los algebristas aunque no lo supieran era usar una serie de
teoremas que no saban demostrar o siquiera enunciar (los n umeros complejos
forman un cuerpo, etc.)
Hay muchos otros casos similares: los fsicos han estado derivando funciones
no derivables durante mucho tiempo, con la convicci on de que las derivadas eran
unas funciones generalizadas que no saban denir, pero en la que tambien se
poda conar. La raz on por la que estos c alculos con funciones misteriosas que
no eran funciones no llevaban a paradojas y contradicciones es, por supuesto,
que es posible construir unos objetos (las distribuciones) con las propiedades
que los fsicos postulaban implcitamente en el uso que hacan de sus funciones
generalizadas. Tambien Kummer us o unos divisores primos ideales que no
existan, y que nalmente formaliz o Dedekind a traves de la noci on de ideal de
un anillo, los propios n umeros reales no estuvieron exentos de polemicas sobre
sus propiedades hasta que Dedekind y Cantor dieron las primeras construcciones
explcitas, etc.
El an alisis no est andar es la respuesta ultima a una asignatura pendiente
que tena la matem atica. En su origen, el c alculo diferencial se bas o tambien en
unos n umeros ideales que nadie saba denir porque tenan que ser no nulos
y a la vez menores que cualquier cantidad positiva. Eran los innitesimos. Por
ejemplo, Leibniz explicaba as el c alculo de la derivada de f(x) = x
2
: tomamos
un innitesimo dx, calculamos el incremento df = f(x+dx)f(x) y lo dividimos
entre la cantidad (no nula) dx. Resulta
df
dx
= 2x +dx.
vii
viii Introducci on
Ahora bien, puesto que dx es una cantidad innitesimal, la presencia del
ultimo termino es insignicante, por lo que podemos eliminarla y as
df
dx
= 2x +dx = 2x.
Leibniz era consciente de las contradicciones de este argumento: primero
suponemos que dx 6= 0 pero luego lo eliminamos como si fuera dx = 0. Pese a
ello, tambien era consciente de que los resultados a los que se llegaba con este
tipo de razonamientos eran correctos y estaba convencido de que los argumentos
con innitesimos tenan que poder reformularse como argumentos del estilo de
Arqumedes, lo cual hoy es f acil traducir a mediante pasos al lmite.
Uno de los grandes virtuosos de los innitesimos fue Euler, quien pareca
convencido de que bastaba concebirlos como n umeros arbitrariamente peque nos
(pero no nulos) en lugar de como n umeros innitamente peque nos. Sin embargo
sus razonamientos est an bastante lejos del estilo moderno -.
Al contrario de lo que sucedi o con los n umeros reales, los n umeros complejos,
las distribuciones o los n umeros ideales de Kummer, los matem aticos del siglo
XIX y la primera mitad del siglo XX fueron incapaces de construir unos objetos
que se comportaran como deban comportarse los innitesimos, y el resultado
fue que los erradicaron de la matem atica te orica. Cauchy introdujo (con in-
nitesimos a un) la noci on de lmite y mostr o que los restantes conceptos del
an alisis podan expresarse en terminos de lmites. Posteriormente Weierstrass
introdujo las deniciones y los razonamientos -. Ahora bien, la rebelda de los
innitesimos a dejarse formalizar no los haca menos pr acticos, por lo que los
fsicos siguieron us andolos, con la convicci on de que son mucho m as intuitivos
y c omodos que los epsilons y las deltas.
El hecho de que los innitesimos funcionaran indicaba claramente que
deban poder construirse. Hubo algunos intentos previos poco satisfactorios,
pero s olo a nales de los 60, Abraham Robinson consigui o este objetivo. Del
trabajo de Robinson se sigue que es posible formalizar el c alculo diferencial
deniendo las derivadas como cocientes de incrementos innitesimales, porque,
si bien en R no hay innitesimos (como tampoco hay n umeros con raz cuadrada
negativa), lo cierto es que es posible extender R a un cuerpo que los tenga (igual
que puede extenderse a C, donde los n umeros negativos s que tienen races
cuadradas).
Por desgracia, los innitesimos de Robinson se construan y se manejaban
mediante tecnicas de l ogica matem atica, que resultan bastante complejas y arti-
ciales para los matem aticos no familiarizados con esta disciplina. No obstante,
a nales de los 60 y principios de los 70 surgieron aproximaciones axiom aticas
al an alisis no est andar, es decir, aproximaciones que, en lugar de construir los
innitesimos que es complicado, lo que hacen es postular mediante unos
axiomas sencillos su existencia y sus propiedades. Es como si en un curso de in-
troducci on al an alisis no construimos los n umeros reales, sino que postulamos la
existencia de un cuerpo ordenado completo. El resultado es que partimos exac-
tamente del mismo punto a donde habramos llegado si hubiesemos empezado
por la construcci on de R. Naturalmente, al eliminar la construcci on perdemos
ix
una informaci on, y es que el axioma que postula la existencia de R es en realidad
un axioma inesencial, en el sentido de que todo lo que se demuestra con el, se
puede demostrar tambien sin el (simplemente, demostr andolo y convirtiendolo
as en un teorema). Lo mismo sucede con el an alisis no est andar.
De entre las distintas versiones axiom aticas del an alisis no est andar, aqu
vamos a exponer una especialmente fuerte, en el sentido de que no vamos a
postular axiom aticamente la mera existencia por ejemplo de un cuerpo que
contiene al cuerpo de los n umeros reales y que adem as tiene innitesimos, sino
que vamos a presentar toda una teora de conjuntos no est andar, a nadiendo
a los axiomas usuales de la teora de conjuntos otros axiomas que postulan
la existencia de elementos ideales en todos los conjuntos innitos. Dado que
no vamos a comparar este enfoque con otros posibles, el lector no tendr a la
oportunidad de constatarlo (salvo que compare con otros textos), pero esta
versi on supone una simplicaci on enorme de la teora, tanto en sus aspectos
tecnicos como en los conceptuales.
Ahora bien, tal y como explic abamos un poco m as arriba, debemos tener
presente que los objetos cuya existencia postulan estos axiomas pueden ser cons-
truidos, de modo que los axiomas del an alisis no est andar no son como otros
axiomas que pueden a nadirse a la teora de conjuntos (tales como la hip otesis
del continuo, el axioma de Martin, etc.) sino que son eliminables, en el sentido
de que cualquier armaci on est andar que pueda demostrarse con ellos, puede
demostrarse tambien sin ellos.
De este modo, la teora de conjuntos no est andar no es una teora nueva que
proporcione nuevos resultados, sino una teora alternativa que permite probar
los mismos resultados que la teora cl asica pero de forma distinta. As, mientras
que una teora matem atica usual se valora normalmente en funci on de los
resultados nuevos que permite demostrar, este criterio no es aplicable para
valorar la teora de conjuntos no est andar (ya que la respuesta es que no permite
demostrar nada nuevo), sino que su valor depender a m as bien de la comparaci on
entre las tecnicas cl asicas y las tecnicas no est andar. El prop osito de este libro
es, precisamente, poner al lector en condiciones de realizar esa comparaci on y
para que pueda sopesar por s mismo las ventajas y los inconvenientes de la
teora de conjuntos no est andar frente a la teora de conjuntos cl asica.
En esta comparaci on, probablemente, el factor de m as peso es un hecho
externo a la teora misma: por razones hist oricas, la teora de conjuntos cl asica
est a profundamente arraigada, mientras que la teora de conjuntos no est andar
no es m as que una curiosidad, y es casi impensable que alg un da pase a ser
m as que eso. No obstante, siempre queda el cuanto menos divertimento
te orico de juzgar ambas teoras en pie de igualdad, prescindiendo de su grado de
popularidad. Entonces, los dos platos de la balanza quedan bastante igualados:
Por una parte, la teora de conjuntos no est andar da lugar a pruebas
m as intuitivas?, elegantes?, sencillas? que la teora cl asica.
Por otra parte, la teora de conjuntos no est andar requiere un marco
de razonamiento l ogico un poco?, bastante?, mucho? m as com-
plejo que la teora de conjuntos cl asica.
x Introducci on
Lo que el lector deber a juzgar es cu ales de las palabras entre interrogantes
son apropiadas (o si hay que cambiarlas por otras). Si considera que la teora no
est andar no es ni intuitiva, ni elegante, ni sencilla, ni nada parecido, concluir a
que lo mejor es olvidarse de ella, al igual que si considera que sus sutilezas
l ogicas la vuelven inmajenable en la pr actica.
Quiz a convenga destacar que no hay contradicci on en armar que las pruebas
no est andar pueden ser m as sencillas y que su l ogica subyacente puede ser m as
complicada. Esto quiere decir que, para alguien que haya asimilado esa l ogica
subyacente, las pruebas pueden resultar mucho m as sencillas, y la cuesti on es,
entonces, si la (presunta) simplicaci on (o cualquier otra ventaja) que supone
el uso de la teora no est andar compensa el (presunto) esfuerzo de familiarizarse
con ella. Probablemente, esta es la pregunta principal sobre la que deber a
meditar el lector.
Aunque una valoraci on adecuada de la teora de conjuntos no est andar re-
quiere, evidentemente, un examen a fondo de sus principios y su funcionamiento
(que es lo que pretende ofrecer este libro), podemos formarnos una primera im-
presi on considerando el teorema siguiente, de Sierpinski:
Si a
1
, . . . , a
n
, b son n umeros reales positivos, la ecuaci on
a
1
x
1
+ +
a
n
x
n
= b
tiene a lo sumo un n umero nito de soluciones naturales.
Ahora vamos a ver el aspecto de una demostraci on no est andar. Evidente-
mente, a menos que el lector ya este familiarizado con la teora de conjuntos no
est andar, no estar a en condiciones de entenderla con detalle, pero aqu se trata
simplemente de comparar su aspecto con el de una demostraci on cl asica. (Lo
que s puede tratar de hacer el lector es demostrar el teorema por s mismo por
medios cl asicos y comparar las pruebas.)
Demostraci on: Podemos suponer que n, a
1
, . . . , a
n
y b son est andar.
1
Si el
conjunto de n-tuplas (x
1
, . . . , x
n
) N
n
que cumplen la ecuaci on fuera innito,
tendra que contener un elemento no est andar. Una n-tupla (con n est andar)
que tenga todas sus componentes est andar ser a est andar, luego tenemos una
soluci on (x
1
, . . . , x
n
) en la que alg un x
i
es innitamente grande.
Ahora bien, no puede ser que todos los x
i
sean innitamente grandes, ya que
entonces el miembro izquierdo de la ecuaci on sera innitamente peque no, y el
miembro derecho no. Por consiguiente, tambien existe alg un x
i
que no es inni-
tamente grande. Reordenando los ndices, podemos suponer que x
1
, . . . , x
r
son
innitamente grandes y x
r+1
, . . . , x
n
no lo son. Pero esto nos lleva igualmente
a una contradicci on, ya que podemos despejar
a
1
x
1
+ +
a
r
x
r
= b
a
r+1
x
r+1

a
n
x
n
y, nuevamente, el miembro izquierdo es innitesimal, y el derecho no.
1
Esto implica, en particular, que no son n umeros innitamente peque nos o innitamente
grandes.
xi
La prueba puede parecer extremadamente simple, pero en esta apariencia
hay algo de enga noso, y esto nos lleva precisamente hacia el otro plato de la
balanza. Las sutilezas l ogicas inherentes a la teora de conjuntos no est andar
est an relacionadas con las causas por las que los matem aticos tuvieron que
abandonar el uso de innitesimos a la hora de fundamentar el an alisis: si no se
toman las precauciones debidas, los innitesimos dan lugar a contradicciones.
El problema es an alogo al que tuvieron que resolver los matem aticos para
fundamentar la teora de conjuntos. Si no se toman las precauciones debidas,
determinados conjuntos como el conjunto de todos los conjuntos, el con-
junto de todos los cardinales, etc. dan lugar a contradicciones por el mero
hecho de aceptar su existencia. Cantor llamaba a estos conjuntos parad ojicos
multiplicidades inconsistentes, y hay esencialmente dos formas de abordar el
problema de extirpar de la teora matem atica las contradicciones que generan:
La teora de conjuntos de Zermelo-Fraenkel (ZFC) es una teora axiom atica
en la que, simplemente, las multiplicidades inconsistentes no existen: a
partir de sus axiomas se puede demostrar que no existe ning un conjunto
que contenga a todos los conjuntos, ni existe ning un conjunto que contenga
a todos los cardinales, etc. No obstante, informalmente se puede hablar de
la clase de todos los conjuntos o la clase de todos los cardinales, pero
s olo en armaciones que claramente pueden reformularse eliminando estos
conceptos (por ejemplo, si decimos que la clase de todos los cardinales est a
contenida en la clase de todos los conjuntos, esto es equivalente a decir
que todo cardinal es un conjunto, y as hemos eliminado toda menci on a
clases inexistentes).
La teora de conjuntos de von Neumann-Bernays-G odel introduce formal-
mente la diferencia entre conjuntos y clases propias, de modo que las
multiplicidades inconsistentes de Cantor se corresponden con las clases
propias. Las contradicciones aparecen si se confunden ambos conceptos
y se tratan las clases propias como si fueran conjuntos. Estableciendo la
distinci on, los argumentos que originalmente daban lugar a contradiccio-
nes se transforman en los argumentos que demuestran que determinadas
clases son propias y no son conjuntos.
A la hora de fundamentar el uso de innitesimos, nos encontramos con pro-
blemas similares: determinados conjuntos como el conjunto de todos los
n umeros reales innitesimales dan lugar a contradicciones, y en este libro pre-
sentaremos dos teoras axiom aticas que resuelven el problema:
La teora de Nelson resuelve el problema negando la existencia de los
conjuntos problem aticos. As por ejemplo, a partir de sus axiomas se
demuestra, desde luego, que existen n umeros reales innitesimales, pero
tambien que no existe ning un conjunto cuyos elementos sean los n umeros
reales innitesimales. Esto es tecnicamente an alogo al caso de la teora de
conjuntos de ZFC, en la que se demuestra que existen los n umeros cardi-
nales (nitos e innitos), pero se demuestra que no existe ning un conjunto
xii Introducci on
cuyos elementos sean todos los cardinales. La unica diferencia (de car acter
psicol ogico) es que uno puede estudiar algebra, an alisis, topologa, etc. y
hablar de cardinales de conjuntos nitos e innitos, sin tener realmente
necesidad de hablar en ning un momento del conjunto de todos los cardi-
nales, por lo que apenas se nota la prohibici on que la teora impone como
precio para excluir las contradicciones. En cambio, cuando uno habla de
n umeros reales innitesimales, resulta tentador en muchas ocasiones razo-
nar considerando el conjunto de todos los innitesimales, y la prohibici on
de hacerlo puede resultar desconcertante.
La teora de Hrbacek distingue entre conjuntos internos y conjuntos ex-
ternos de un modo similar a como la teora NBG distingue entre conjun-
tos y clases propias. Es posible hablar del conjunto de todos los n umeros
innitesimales, pero los argumentos que, a partir de este concepto, dan
lugar a contradicciones se convierten ahora en razonamientos que prueban
que tal conjunto es externo. En realidad, la teora de Nelson permite ha-
blar de conjuntos externos en el mismo sentido informal (pero riguroso)
en que es posible hablar de clases en ZFC, es decir, como conceptos que
es posible introducir en las armaciones a condici on de que estas puedan
reformularse eliminando toda menci on a ellos.
Volviendo a la demostraci on que hemos dado m as arriba del teorema de Sier-
pinski, uno de los pasos que hemos dado, aunque es correcto, no es, en realidad,
evidente. Se trata del punto en que hemos reordenado los subndices para poner
en primer lugar los n umeros innitos y luego los nitos. La reordenaci on en
s es intrascendente. Lo que no es trivial es que, implcitamente, ah estamos
considerando el conjunto
I = {i n | x
i
es innitamente grande}.
En general, conjuntos como este son los que dan lugar a contradicciones si no
se toman las precauciones debidas. Por ejemplo, si aceptamos sin m as reexi on
la existencia del conjunto I, deberamos aceptar igualmente la existencia de
J = {i N | i es innitamente grande},
y este conjunto nos lleva a una contradicci on, ya que es f acil probar que si
i J, entonces i 1 J, luego tendramos un subconjunto de N no vaco y
sin mnimo elemento. En la teora de conjuntos de Nelson se demuestra que I
existe, mientras que J no existe, pero, por la misma raz on que no es obvio que
J no exista, tampoco es obvio que I s que exista.
2
El precio que hay que pagar para trabajar consistentemente en la teora
de conjuntos no est andar el precio que el lector deber a juzgar si es caro o
barato es asimilar las sutilezas l ogicas que determinan que I s que existe
pero J no.
2
Cuando el lector este familiarizado con la teora de conjuntos no est andar podr a entender
la raz on por la que I s que existe: I = {i n | x
i
A}, donde A =

{x
1
, . . . , x
n
}, que es un
conjunto est andar por el teorema A.7.
xiii
En la teora de Hrbacek, esta sutileza desaparece de la prueba del teorema
de Sierpinski, ya que tanto I como J existen trivialmente. La diferencia entre
ambos es ahora que I es interno, mientras que J es externo, pero que I sea
interno o externo es irrelevante para la demostraci on del teorema. Lo unico
necesario era hacer referencia a I para despejar en la ecuaci on. Sin embargo, la
teora axiom atica de Hrbacek requiere bastante m as familiaridad con la l ogica
matem atica que la teora de Nelson.
De todos modos, debemos tener presente que cualquier teora axiom atica
es ardua para un lector sin la suciente preparaci on matem atica. Incluso hay
muchos matem aticos que son expertos en su campo y que s olo tienen un vago
conocimiento de lo que es la l ogica matem atica (formal) y la teora axiom atica
de conjuntos. Por ello, no sera justo comparar una exposici on de la teora
de conjuntos no est andar seg un los patrones de rigor propios de la l ogica ma-
tem atica con una exposici on de la teora cl asica al nivel semiformal que emplean
todos los libros de matem aticas (excepto los que tratan temas directamente re-
lacionados con la l ogica matem atica o est an escritos por pedantes). Debido a
estas consideraciones, la estructura de este libro es la siguiente:
El primer captulo est a dedicado a describir informalmente la l ogica de
la teora de conjuntos cl asica (en sus tres primeras secciones) y la de la
teora de conjuntos no est andar (en la cuarta secci on). Su objetivo es
preparar al lector para que pueda manejar la teora no est andar con el
mismo nivel de seguridad con que un estudiante de matem aticas medio
maneja la teora est andar. En el caso de la teora est andar, para conseguir
este dominio informal es posible prescindir pr acticamente por completo de
toda alusi on a la l ogica matem atica, pero la teora no est andar requiere,
como mnimo, unas nociones b asicas sobre la l ogica subyacente para no
caer en contradicciones.
Es importante insistir en que todas las explicaciones, ejemplos, analogas,
etc. presentadas en este primer captulo (incluso en las secciones sobre la
teora cl asica) s olo pretenden sugerir al lector una forma pragm atica de
concebir la teora no est andar para desenvolverse en ella con soltura. En
particular, no pretenden defender ninguna posici on los oca sobre c omo
han de concebirse las matem aticas en general o los innitesimos en par-
ticular.
La secci on 1.3 contiene un resumen (con demostraciones) de los resulta-
dos b asicos sobre funciones, relaciones, estructuras algebraicas, n umeros
naturales, etc., en denitiva, de los hechos y conceptos que el lector debe
conocer para leer este libro. Su nalidad es servir de ayuda a un hipotetico
lector obstinado en que la teora no est andar contradice en algo a la teora
est andar. La secci on 1.3 le dar a la oportunidad de buscar concretamente
que resultado contradice a la teora no est andar, y tal vez el no encontrar
ninguno le ayude a entender que la contradicci on s olo est a en su imagi-
naci on. (Si encuentra alguno, entonces su problema es m as grave, pero
puede estar seguro de que ser a su problema, no un problema de la teora
xiv Introducci on
no est andar.) Los lectores que no sean especialmente suspicaces pueden
saltarse esa secci on sin riesgo a echar nada en falta m as adelante.
Segundo captulo pretende familiarizar al lector con el uso pr actico de la
teora de conjuntos no est andar siempre a un nivel informal, lo m as
parecido posible al nivel de cualquier libro de matem aticas serio, pero
no tecnico, a traves del estudio de los n umeros naturales, los n umeros
racionales y la construcci on de los n umeros reales.
Los captulos siguientes desarrollan los contenidos tpicos de un curso uni-
versitario de an alisis matem atico: c alculo diferencial e integral para funcio-
nes de una y varias variables. La exposici on pretende ser natural o, mejor
dicho, pretende ser lo que sera una exposici on natural si la teora de con-
juntos no est andar fuera considerada una teora normal en la pr actica
matem atica. Desarrollamos la teora no est andar como si la teora cl asica
no existiese, exactamente igual que los libros cl asicos desarrollan la teora
cl asica como si la teora no est andar no existiese. En particular, cada con-
cepto se dene de la forma que resulta natural en el contexto de la teora
no est andar, sin mostrar la equivalencia con la denici on cl asica corres-
pondiente, salvo que ello tenga interes en la propia teora no est andar.
El lector no necesita ning un conocimiento matem atico previo m as all a
de cierta familiaridad con los conceptos matem aticos b asicos (los mismos
que se exponen en el primer captulo), excepto para las secciones 6.5, 6.6
y 7.5, en las que necesitar a conocer algunos hechos b asicos del algebra
lineal (matrices, determinantes, espacios vectoriales, y poco m as).
Los apendices A y B presentan con rigor la axiom atica de Nelson y la
de Hrbacek, respectivamente. Aqu el lector necesitar a cierta familiaridad
con la l ogica matem atica y con la teora axiom atica de conjuntos.
3
Toda
la teora desarrollada en los captulos precedentes puede formalizarse en
la teora de Nelson sin m as esfuerzo que el necesario para formalizar en
ZFC cualquier exposici on razonable del an alisis cl asico.
El apendice C contiene la demostraci on del teorema de conservaci on, seg un
el cual, todo teorema est andar que pueda demostrarse en la teora de
conjuntos no est andar puede demostrarse tambien en la teora de con-
juntos cl asica. En particular, si la teora cl asica es consistente, la teora
no est andar tambien lo es. La prueba es metamatem atica y nitista. Eso
quiere decir, en terminos m as llanos, que cualquiera que arme convencido
que la teora de conjuntos no est andar no sirve porque es contradictoria,
no tiene ni idea de la estupidez que est a diciendo. Para este apendice, el
lector necesitar a un buen conocimiento de la l ogica matem atica y de la
teora de conjuntos.
3
Los dos captulos I, II y VIII de mi libro de L ogica son m as que sucientes, al menos
para la teora de Nelson. En el caso de la teora de Hrbacek, el primer captulo de mi libro de
Pruebas de consistencia sera conveniente tambien.
xv
Hay un aspecto de la comparaci on entre la teora cl asica y la teora no
est andar en el que no vamos a entrar aqu, y es si la teora no est andar ofrece
ventajas frente al teora cl asica de cara a la investigaci on. Hasta la fecha no
hay ning un resultado demostrado con tecnicas no est andar y que no pueda
demostrarse de forma razonablemente pareja en dicultad mediante tecnicas
est andar. Los defensores del an alisis no est andar citan ejemplos como este,
aunque la verdad sea dicha no hay muchos otros que citar:
El quinto problema de Hilbert consista en determinar si todo grupo to-
pol ogico localmente eucldeo es un grupo de Lie. El problema fue resuelto ar-
mativamente en 1952 por Montgomery, Zippin y Gleason. En 1964 Kaplanski
public o otra demostraci on. Sin embargo, en 1976 se celebr o un congreso sobre
los problemas de Hilbert en el que un especialista de cada rama deba explicar
la soluci on de los que ya haban sido resueltos, pero el correspondiente a este
problema dijo que las demostraciones conocidas eran tan tecnicas y tan comple-
jas que no poda siquiera esbozarlas. En 1990 J. Hirschfeld public o
4
una prueba
no est andar mucho m as simple y, cuanto menos, esbozable.
Para terminar, a nadiremos unicamente que la exposici on del c alculo dife-
rencial e integral que contiene este libro s olo es una muestra reducida de las
posibilidades de la teora de conjuntos no est andar. Al igual que es posible
una exposici on no est andar del an alisis matem atico, podemos desarrollar una
topologa no est andar, una geometra diferencial no est andar, una teora de la
medida no est andar, un an alisis funcional no est andar y, en general, cualquier
rama de la matem atica que estudie conjuntos innitos es susceptible de un enfo-
que no est andar. Las teoras axiom aticas que presentamos aqu son sucientes
para formalizar tales enfoques. La pregunta sigue siendo si merece la pena.
Dejamos al lector la ultima palabra.
4
J. Hirschfeld, The nostandard treatment of Hilberts fth problem, Trans. Amer. Math.
Soc. 321 (1) (1990).
Captulo I
Preliminares conjuntistas
Suponemos que el lector tiene cierta familiaridad con las matem aticas ele-
mentales, especialmente con la manipulaci on de expresiones algebraicas (como
que a
m
a
n
= a
m+n
o que a/b + c/d = (ad + bc)/bd, etc.) M as en general, su-
pondremos que el lector conoce los n umeros naturales, enteros y racionales, y
tambien sera conveniente cierta familiaridad con los n umeros reales.
El prop osito de este primer captulo es conectar estos conocimientos infor-
males que suponemos al lector con otros conceptos m as abstractos en que es
necesario enmarcarlos para abordar con el rigor necesario otros temas m as de-
licados, como el an alisis matem atico, especialmente desde el punto de vista no
est andar que vamos a adoptar. Con el rigor necesario no nos referimos al
rigor absoluto, consistente en trabajar en un sistema axiom atico formal, lo cual
exigira un esfuerzo al lector que incluso muchos licenciados en matem aticas no
son capaces de realizar, sino al rigor necesario para que el lector pueda distinguir
informalmente un razonamiento v alido de otro que no lo es, que es como de
hecho trabaja la mayora de los matem aticos profesionales cuya especialidad
no est a relacionada con la fundamentaci on de las matem aticas.
De todos modos, conviene tener presente que, del mismo modo que lo que
determina la validez de los razonamientos que hacen los matem aticos profesio-
nales es el hecho de que podran expresarse con todo rigor en el seno de una
teora axiom atica formal (por ejemplo, la teora de conjuntos ZFC), y ello sin
perjuicio de que muchos matem aticos no sepan en que consiste exactamente esta
teora, tambien sucede que los patrones de razonamiento que vamos a tratar de
inculcar al lector en este libro se corresponden con los que pueden expresarse
con todo rigor en otra teora axiom atica formal. En otras palabras, lo que trata-
remos de conseguir es que el lector pueda razonar correctamente en el seno de la
matem atica no est andar de forma intuitiva, sin necesidad de asimilar para ello
las sutilezas y los tecnicismos de la l ogica matem atica, pero de tal modo que el
resultado pr actico sea el mismo que si el lector conociera todos esos tecnicismos.
Quiz a esta comparaci on pueda ser util: un ciudadano honrado puede res-
petar la ley sin haber ledo nunca un c odigo legal. Su buen juicio le permite
determinar que conductas ser an sin duda ilegales y cu ales son admisibles. S olo
1
2 Captulo 1. Preliminares conjuntistas
en caso de verse en una situaci on delicada que escape a lo que le es familiar
necesitar a asesoramiento legal. Del mismo modo, el lector deber a tener pre-
sente que, en cualquier momento en que se de cuenta de que no domina una
situaci on y no este seguro de si un razonamiento es legal o ilegal, deber a
consultar a un experto en leyes, es decir, a alguien que s domine el sistema
axiom atico formal que determina sin margen de ambig uedad lo que puede y lo
que no puede hacerse.
1.1 Conjuntos
Invitamos al lector a que conciba todo cuanto vamos a ver aqu como una
pelcula de cine. Seg un su argumento, una pelcula puede ser fant astica, en el
sentido de que lo que se narra en ella no tiene nada que ver con la realidad; puede
ser hist orica, en el sentido de que todo cuanto se narra en ella es una replica de lo
que ha sucedido realmente en una determinada epoca y un determinado lugar; o
bien puede combinar en diferentes proporciones elementos reales con elementos
fant asticos (por ejemplo, si narra una historia cticia elmente enmarcada en
un contexto hist orico real).
Dejamos al lector la libertad de clasicar nuestra pelcula en el genero
que considere oportuno. Los lectores que consideren que nuestra pelcula es
hist orica son los que los l osofos llaman platonistas; los que consideren que es
pura fantasa son los llamados formalistas; mientras que los que adopten una
postura intermedia se distribuir an en una amplia gama de posibilidades entre
el platonismo y el formalismo, entre las cuales, una de las m as populares es el
nitismo.
En cualquier caso, el lector debe tener presente que cualquier espectador que
quiera entender una pelcula ha de ser consciente de que cada pelcula tiene su
propia realidad interna, y que es necesario remitir a ella los juicios sobre cada
escena, y no a la realidad externa a la pelcula. Por ejemplo, pensemos en un
espectador sensato que sabe que creer en fantasmas es ridculo, pero va a ver
una pelcula en la que un personaje advierte a otros que no deben entrar en una
determinada casa, porque en ella habitan fantasmas. Para entender la pelcula,
deber a estar abierto a dos posibilidades:
Puede tratarse de una pelcula de fantasmas, de modo que, internamente,
sea verdad que en la casa hay fantasmas, en cuyo caso el espectador deber a
concluir que los incredulos que se adentran en la casa son unos insensatos que
no saben lo que hacen.
Pero tambien puede tratarse de una pelcula realista, en la que el personaje
que previene contra los fantasmas lo hace, digamos, porque est a buscando un
tesoro oculto en la casa y emplea ciertos trucos para ahuyentar a otras personas
que pudieran encontrarlo antes. En tal caso, los incredulos que se adentran en
la casa son personajes m as inteligentes que los bobos a los que el malo ha
conseguido acobardar.
Lo importante es que el juicio que el espectador se forme sobre los perso-
najes no debe depender de su opini on personal sobre si existen o no fantasmas
1.1. Conjuntos 3
(su concepci on de la realidad externa) sino de la realidad interna que presenta
la pelcula. De otro modo, si, por ejemplo, la pelcula es de fantasmas y el es-
pectador se niega a aceptar internamente la existencia de fantasmas, no podr a
entender el nal, cuando los fantasmas se maniesten abiertamente y no dejen
lugar a dudas de su existencia (interna).
Los personajes de nuestra pelcula se llaman conjuntos. Los matem aticos los
llaman habitualmente conjuntos, sin m as, pero nosotros necesitamos introducir
una precisi on y, por ello, los llamaremos conjuntos internos. Del mismo modo
que un personaje de una pelcula pretende ser (y es internamente) una persona
(aunque externamente pueda no existir, por ejemplo, porque sea una imagen
creada por ordenador), los conjuntos internos de nuestra pelcula pretenden ser
(y son internamente) colecciones de objetos. De que objetos? Nuestra pelcula
es, en este sentido, bastante econ omica: los objetos que forman parte de un
conjunto interno son otros conjuntos internos. En nuestra pelcula no hay nada
m as que conjuntos internos.
As pues, un conjunto interno B es, en nuestra pelcula, una colecci on de
conjuntos internos. Si A es uno de estos conjuntos internos que forman parte
de B, representaremos este hecho con la notaci on
A B.
Habitualmente se lee A pertenece a B, aunque tambien podemos decir que
A es un elemento de B o que A est a en B, etc. Para indicar lo contrario
se escribe A / B.
Una pelcula coherente ha de respetar unas normas, que pueden jarse ar-
bitrariamente (siempre que no se incurra en contradicciones) pero que, una vez
jadas, se han de respetar. Por ejemplo, en una pelcula que narre una cticia
conspiraci on para matar al presidente de los Estados Unidos, podr an aparecer
personajes cticios, incluso un presidente de los Estados Unidos cticio, pero no
podr a aparecer un asesino con cuatro manos. En otro tipo de pelculas s que
podr a aparecer un personaje con cuatro manos, pero en esta no. Por el contra-
rio, para que la trama del complot resulte interesante, tendr a que someterse al
principio de que todos los personajes sean seres humanos normales.
Nuestra pelcula tambien tiene sus leyes internas, llamadas axiomas. Son
principios que los conjuntos internos respetan para que el argumento resulte a
la vez coherente e interesante. Del mismo modo que muchas pelculas exigen
que sus personajes tengan el aspecto y el comportamiento de seres humanos
normales, nosotros vamos a pedir a nuestros conjuntos internos que se com-
porten como lo que queremos que sean internamente, es decir, meras colecciones
de elementos. El principio que garantiza esto se conoce como axioma de exten-
sionalidad:
Axioma de extensionalidad Si dos conjuntos tienen los mismos elementos,
entonces son iguales.
4 Captulo 1. Preliminares conjuntistas
En la pr actica, esto signica que si tenemos dos conjuntos A y B y queremos
probar que A = B, bastar a con que tomemos un elemento arbitrario x A y
logremos probar que tambien x B, y viceversa.
Conviene introducir la notaci on A B para referirse a la mitad de este
hecho. Diremos que un conjunto interno A es un subconjunto de un conjunto
interno B (y se representa como acabamos de indicar) si todo elemento de A
es tambien un elemento de B. En estos terminos, el axioma de extensionalidad
arma que la igualdad A = B equivale a las dos inclusiones A B y B A.
Desde un punto de vista m as te orico, el axioma de extensionalidad puede
verse as: llamamos extensi on de un conjunto interno B a todos los conjuntos
internos A que cumplen A B. El axioma de extensionalidad arma que dos
conjuntos internos son iguales si y s olo si tienen la misma extensi on. Es este
axioma el que nos permite armar que un conjunto no es ni m as ni menos que
su extensi on
1
y, por consiguiente, que es una colecci on de conjuntos internos.
En este punto es crucial que hagamos una observaci on: el hecho de que los
conjuntos internos sean colecciones de conjuntos internos no nos garantiza que
toda colecci on de conjuntos internos sea (la extensi on de) un conjunto interno.
De hecho, sucede que es l ogicamente imposible que esto sea as. Vamos a ver
por que.
Podemos especicar una colecci on de conjuntos internos a traves de una
propiedad com un a todos ellos. Por ejemplo, vamos a considerar la propiedad
P(x) x / x. M as claramente: dado un conjunto interno x, diremos que
cumple la propiedad P(x) si no se pertenece a s mismo. Nadie dice que tenga
que haber conjuntos internos que se pertenezcan a s mismos. Si no los hay, lo
que tenemos es que todos los conjuntos cumplen la propiedad P(x).
En cualquier caso, podemos llamar R a la colecci on de todos los conjuntos
internos que cumplen P(x). Ciertamente, se trata de una colecci on de conjuntos
internos denida con toda precisi on. Pero nos formulamos la pregunta siguiente:
Es R la extensi on de un conjunto interno? o, dicho de otro modo, existe un
conjunto interno R cuyos elementos sean precisamente los conjuntos internos
que no se pertenecen a s mismos?
La respuesta es negativa. Si existiera tal conjunto R, tendra que darse
una de estas dos alternativas: o bien R R, o bien R / R. Pero sucede que
ambas nos llevan a una contradicci on. Si suponemos que R R, entonces, por
denici on de R, tenemos que R es un conjunto interno que cumple la propiedad
P(R), es decir, que cumple R / R, y est abamos suponiendo lo contrario. Es
imposible. Por otra parte, si R / R, entonces R es un conjunto interno que
1
Conviene tener presente que esto no es una necesidad l ogica. En nuestra pelcula
podramos haber decidido que los conjuntos tuvieran otras propiedades relevantes adem as
de su extensi on. Por ejemplo, podramos haber decidido que hubiera conjuntos blancos y
negros, de modo que podra haber dos conjuntos distintos A y B que tuvieran ambos un unico
elemento C, pero que fueran distintos porque A fuera blanco y B fuera negro. Lo que arma
el axioma de extensionalidad es que un conjunto interno no tiene ninguna otra propiedad
distintiva m as que su extensi on.
1.1. Conjuntos 5
cumple la propiedad P(R), luego debera ser R R, lo cual es nuevamente
absurdo.
Los matem aticos suelen expresar esto diciendo que no existe ning un conjunto
que contenga a los conjuntos que no se pertenecen a s mismos, pero, dicho as, es
difcil de digerir, porque parece que se nos este negando la posibilidad de pensar
en la colecci on de los conjuntos que verican una determinada propiedad que
no tiene nada de ambiguo.
Sin embargo, bien entendida, esta paradoja no tiene nada de extra no. Lo
que acabamos de probar es que la colecci on R no es la extensi on de ning un
conjunto interno. Los matem aticos expresan esto de forma m as afortunada
diciendo que R es una clase propia, una colecci on de objetos formada por
personajes de nuestra pelcula pero que no es ella misma un personaje de nuestra
pelcula, una colecci on externa a ella, que est a detr as de las c amaras.
Quiz a esta comparaci on sirva de ayuda: imaginemos un decorado para una
pelcula de romanos. Es una sala de un palacio y en un punto hay un jarr on con
ores, y dentro del jarr on con ores est a oculto un micr ofono. Podemos decir
que el jarr on es un objeto interno de la pelcula. El espectador lo ver a y deber a
entender que es un jarr on. En cambio, el micr ofono es un objeto externo. El
espectador no debe verlo o, si lo ve, debe aparentar ser otra cosa, por ejemplo,
una or.
Podemos decir que el micr ofono no existe internamente, en el sentido de que,
si existiera, la pelcula se volvera contradictoria, ya que en un palacio romano
del siglo I a.C. no puede haber un micr ofono. En la pr actica, que no exista
internamente no signica que no exista, porque lo cierto es que est a ah, sino
que no puede verse y que ning un personaje de la pelcula puede aludir a el como
podra aludir al jarr on con ores.
Igualmente, la clase R est a ah, pero es externa a nuestra pelcula. Si
la consideramos como parte de sus personajes llegamos a una contradicci on,
como sera una contradicci on que Julio Cesar llevara un crucijo. Podemos
demostrar que R no existe igual que podemos demostrar que Julio Cesar no
lleva crucijo, sin perjuicio de que, si, en una determinada escena, Julio Cesar
lleva una coraza, debajo de la coraza pueda llevar un crucijo colgado del cuello
si el actor es cristiano.
Observemos que, visto as, la clase R no es contradictoria. Haciendo un uso
externo del signo , podemos decir que R / R, y no hay contradicci on porque
R es la clase de todos los conjuntos internos que no se pertenecen a s mismos.
Para pertenecer a R hay que cumplir dos requisitos: 1) ser un conjunto interno
y 2) no pertenecerse a s mismo. Tenemos que R cumple 2), pero le falla 1),
y por eso no podemos concluir que R R, y no llegamos, pues, a ninguna
contradicci on.
M as en general, hemos de tener presente que un conjunto interno es una
colecci on de conjuntos internos, luego en ning un caso puede pertenecerle una
colecci on de conjuntos que no sea un conjunto interno. Una colecci on de conjun-
tos externa puede estar formada por algunos conjuntos internos, pero no puede
formar parte de un conjunto interno.
Esto nos plantea el problema de especicar con que colecciones de conjuntos
6 Captulo 1. Preliminares conjuntistas
internos podemos contar en nuestra pelcula. No podemos armar que, para
toda propiedad P(x), existe un conjunto interno formado por todos los conjuntos
internos que cumplan P(x), ya que, tomando P(x) x / x, esto nos permitira
concluir que R es un conjunto interno y nuestra pelcula se derrumbara, como
si Julio Cesar exhibiera un crucijo.
Los matem aticos tuvieron que pensar durante mucho tiempo sobre que pro-
piedades P(x) son admisibles para denir conjuntos y cu ales no. Aparte de
x / x, hay muchas otras propiedades que dan lugar a clases propias, es decir,
a colecciones de conjuntos internos que daran lugar a contradicciones si les
concedieramos la existencia interna en nuestra pelcula.
Afortunadamente, las unicas propiedades que dan lugar a clases propias son
las que deniran conjuntos demasiado grandes. Por ejemplo, puede probarse
que no existe un conjunto interno que contenga a todos los conjuntos internos o,
equivalentemente, que la clase de todos los conjuntos internos no es un conjunto
interno, como tampoco lo es la clase de todos los conjuntos internos que tienen
un unico elemento, etc.
Decimos afortunadamente porque la pr actica matem atica usual no re-
quiere considerar tales colecciones enormes. Podemos hablar de conjuntos in-
ternos con un elemento sin necesidad de tratar con la clase enorme de todos los
conjuntos internos con un elemento, podemos hablar de conjuntos internos sin
necesidad de hablar de la clase enorme de todos los conjuntos internos, etc.
El axioma m as general que vamos a aceptar sobre formaci on de conjuntos a
partir de propiedades es el siguiente:
Axioma de especicaci on Si A, x
1
, . . . , x
n
son conjuntos internos y con-
sideramos una propiedad interna P(x, x
1
, . . . , x
n
), entonces existe un conjunto
interno cuyos elementos son los conjuntos internos x A que cumplen la pro-
piedad P. Lo representaremos por
{x A | P(x, x
1
, . . . , x
n
)}.
Aqu hemos empleado por primera vez la expresi on propiedad interna para
referirnos, concretamente, a cualquier propiedad que pueda expresarse exclu-
sivamente en terminos del signo y de conceptos l ogicos, como y, o,
si. . . entonces. . . , existe, para todo, =, etc.
Esto signica que, por ejemplo, no podemos denir el conjunto de todos los
conjuntos que son verdes, ya que verdes no es un concepto denido a partir
de y de conceptos l ogicos.
La clave del axioma de especicaci on es que s olo permite que una propie-
dad seleccione algunos conjuntos internos de entre los conjuntos internos que
pertenecen a un conjunto interno dado A. Aunque podamos escribir
{x | P(x, x
1
, . . . , x
n
)}
para referirnos a la colecci on de todos los conjuntos internos x que cumplen la
propiedad P, no podemos pretender que tal colecci on de conjuntos internos sea
1.2. Los conceptos conjuntistas b asicos 7
la extensi on de un conjunto interno. Al contrario, podemos encontrarnos con
una contradicci on que demuestre que tal colecci on de conjuntos es una clase
propia, externa a nuestra pelcula.
As, dado un conjunto interno A, podemos considerar como personaje de
nuestra pelcula al conjunto
R
A
= {x A | x / x},
y este conjunto no da lugar a ninguna contradicci on. Sera una contradicci on
que cumpliera R
A
R
A
, por lo que podemos deducir que R
A
/ R
A
, de donde
a su vez se desprende que R
A
/ A (pues si fuera R
A
A podramos concluir
que R
A
R
A
, y tendramos otra contradicci on).
No obstante, el axioma de especicaci on no es suciente para garantizar
la existencia de todos los conjuntos internos que nos gustara ver en nuestra
pelcula. Por ejemplo, dados dos conjuntos internos u y v, nos gustara tener
un conjunto interno w formado ni m as ni menos que por u y v, es decir,
w = {x | x = u o x = v},
pero esta expresi on no es de la forma que nos permite apelar al axioma de
especicaci on.
Problemas como este se nos presentar an en muy pocas ocasiones, y s olo ne-
cesitaremos unos pocos axiomas especcos para asegurar la existencia algunos
conjuntos internos como w. Ahora bien, una vez dispongamos de estos con-
ceptos b asicos, el unico principio general de formaci on de conjuntos que vamos
a necesitar (y el unico que tendremos derecho a usar si no queremos caer en
contradicciones) ser a el axioma de especicaci on.
1.2 Los conceptos conjuntistas basicos
En esta secci on describiremos los personajes b asicos de nuestra pelcula.
Empezamos observando que el axioma de especicaci on que ya hemos discutido
requiere conocer la existencia de al menos un conjunto interno A para generar
a partir de el nuevos conjuntos internos, y de momento no conocemos ninguno.
Por eso necesitaremos algunos axiomas especcos que nos garanticen la exis-
tencia de algunos conjuntos que encabecen nuestro reparto.
Axioma del conjunto vaco Existe un conjunto interno que no tiene ning un
elemento.
El axioma de extensionalidad implica que tal conjunto es unico, pues si
existieran dos conjuntos internos sin elementos, entonces ambos tendran los
mismos elementos (a saber, ninguno), luego tendran que ser el mismo. Esta
unicidad nos permite darle un nombre. Lo llamaremos conjunto vaco y lo
representaremos por .
8 Captulo 1. Preliminares conjuntistas
Axioma del par Dados dos conjuntos internos u y v, existe un conjunto
interno cuyos elementos son exactamente u y v.
Nuevamente, el axioma de extensionalidad garantiza que s olo puede haber
un conjunto interno cuyos elementos sean u y v, pues dos de ellos seran dos
conjuntos con los mismos elementos. Por ello podemos llamar a tal conjunto el
par desordenado formado por u, y v, y lo representaremos por {u, v}.
Observemos que, si tenemos dos conjuntos internos u y v, no necesitamos
ning un axioma que nos de derecho a pensar coherentemente en la colecci on
formada por ellos dos. Lo que garantiza el axioma del par es que dicha colecci on
no es externa a nuestra pelcula, sino que tambien forma parte de ella.
Tambien es importante destacar que el axioma no requiere que los conjuntos
u y v sean distintos. Si son iguales abreviaremos {u, u} = {u}, que es un
conjunto interno que tiene a u como unico elemento.
El nombre de par desordenado hace referencia a que, evidentemente, se
cumple {u, v} = {v, u}, dado que ambos conjuntos tienen los mismos elementos.
Cuando queramos dar importancia al orden en que consideramos dos conjuntos
podemos agruparlos en lo que llamaremos un par ordenado:
(u, v) = {{u}, {u, v}}.
Observemos que (u, v) es un conjunto interno cuya existencia se demuestra
aplicando tres veces el axioma del par. Es f acil demostrar que la igualdad
(u, v) = (p, q) s olo se da cuando u = v y p = q. En particular, si u 6= v, tenemos
que (u, v) 6= (v, u).
Ahora podemos denir una terna ordenada (u, v, w) = ((u, v), w), e igual-
mente, una cu adrupla ordenada (u, v, w, x) = ((u, v, w), x), etc.
Dados dos conjuntos u y v, denimos su uni on y su intersecci on como
u v = {x | x u o x v}, u v = {x | x u y x v}.
El lector debera protestar ante estas deniciones, ya que parecen aplicacio-
nes del axioma de especicaci on y, sin embargo, no respetan su estructura, ya
que no estamos restringiendo la selecci on a los x que pertenecen a un conjunto
A prejado. En el caso de la intersecci on esto se puede arreglar, ya que podemos
escribir
u v = {x u | x v},
sin embargo, con la uni on la objeci on es irrefutable, por lo que necesitamos un
axioma especco:
Axioma de la uni on Dados dos conjuntos internos, existe un conjunto in-
terno cuyos elementos son los conjuntos internos que pertenecen a cualquiera
de los dos conjuntos dados.
2
2
En realidad, la teora de conjuntos requiere un axioma de la uni on m as fuerte que este,
pero no necesitamos explicitar este hecho.
1.2. Los conceptos conjuntistas b asicos 9
Esto nos permite hablar de conjuntos internos como
{a, b, c, d} = {a} {b} {c} {d},
que es el unico conjunto interno cuyos elementos son los cuatro conjuntos inter-
nos a, b, c, d.
Otro uso v alido del axioma de especicaci on es la denici on del complemen-
tario de un conjunto interno en otro:
u \ v = {x u | x / v}.
El ultimo concepto b asico que requiere su axioma especco es el siguiente:
Axioma del conjunto de partes Dado un conjunto interno A, existe un
conjunto interno cuyos elementos son todos los subconjuntos de A.
A dicho conjunto lo llamaremos conjunto de las partes de A:
PA = {x | x A}.
Observemos que si u A y v B, entonces u, v A B, luego
{u}, {u, v} P(A B),
luego
(u, v) = {{u}, {u, v}} P(P(A B)).
Esto implica que, aunque la denici on
AB = {(u, v) | u A, v B}
podra parecer un uso fraudulento del axioma de especicaci on, en realidad es
legtima, porque podramos haber escrito
AB = {(u, v) P(P(A B)) | u A, v B}.
Este conjunto, es decir, el conjunto de todos los pares ordenados con primera
componente en A y segunda componente en B, se llama producto cartesiano de
A y B.
Terminaremos esta secci on esbozando la construcci on del conjunto N de los
n umeros naturales. La idea que perseguimos es demostrar la existencia de un
conjunto interno que tenga este aspecto:
N = {0, 1, 2, 3, 4, . . . }
Pero, para ello, tenemos dos problemas: en primer lugar, para que N sea un
conjunto interno hemos de denir sus elementos 0, 1, 2, etc. de tal modo que
podamos considerar a cada uno de ellos como un conjunto interno, y en segundo
10 Captulo 1. Preliminares conjuntistas
lugar hemos de arregl arnoslas para denir un conjunto N que los tenga a ellos
por elementos y s olo a ellos.
El primer problema es f acil de resolver. Si pensamos en los n umeros naturales
como en ciertos personajes hist oricos, lo que necesitamos es seleccionar unos
actores que interpreten estos papeles en nuestra pelcula. Como n umero 0,
ninguno parece m as id oneo que el conjunto vaco. En lo sucesivo llamaremos
n umero natural 0 a 0 = . Esto signica que, cuando pensemos en el conjunto
vaco como en el unico conjunto interno sin elementos, escribiremos , mientras
que cuando pensemos en el como n umero natural 0 escribiremos 0, si bien se
trata en ambos casos del mismo conjunto.
A continuaci on denimos, para cualquier conjunto interno x, el que llama-
remos siguiente de x, que ser a x
0
= x {x}. En particular, denimos
1 = 0
0
= {} = {} = {0},
2 = 1
0
= 1 {1} = {0} {1} = {0, 1},
3 = 2
0
= 2 {2} = {0, 1} {2} = {0, 1, 2},
y as sucesivamente. El problema que nos queda es convertir el as sucesiva-
mente en una propiedad interna que podamos usar para denir el conjunto
interno N. Para ello denimos:
Un conjunto interno A es inductivo si 0 A y, siempre que un conjunto x
cumple x A, tambien se cumple que x
0
A.
Es decir, un conjunto es inductivo si contiene a todos los conjuntos internos
que queremos tomar como n umeros naturales. Ahora necesitamos el ultimo
axioma que perlar a el comportamiento b asico de los conjuntos internos:
Axioma de innitud Existe un conjunto interno inductivo.
Se llama axioma de innitud porque sin el es imposible, no ya construir los
n umeros naturales, sino siquiera demostrar la existencia de un conjunto interno
que sea innito.
El problema de los conjuntos inductivos es que, adem as de los n umeros
naturales, pueden contener otros conjuntos. La denici on siguiente resuelve
este problema:
Llamaremos conjunto de los n umeros naturales al conjunto interno
N = {x A | x pertenece a todos los conjuntos internos inductivos},
donde A es un conjunto inductivo arbitrario. Es claro que N no depende de la
elecci on de A, pues si llamamos N
A
y N
B
a los conjuntos denidos de este modo
a partir de dos conjuntos inductivos A y B, entonces todo x N
A
pertenece
a todos los conjuntos inductivos, en particular a B, luego tambien x N
B
, y
viceversa, luego N
A
= N
B
.
A partir de aqu, es una pura rutina demostrar los siguientes hechos b asicos
sobre los n umeros naturales:
1.2. Los conceptos conjuntistas b asicos 11
1. 0 N y, si n N, entonces n
0
N (el cero es un n umero natural y el
siguiente de un n umero natural es tambien un n umero natural).
2. No existe ning un n N tal que n
0
= 0 (el cero no es el siguiente de ning un
n umero natural).
3. Si n N y n 6= 0, existe un m N tal que n = m
0
(todo n umero natural
no nulo es el siguiente de otro n umero natural.
4. Si m, n N y m
0
= n
0
entonces m = n (n umeros distintos tienen siguien-
tes distintos).
5. Si A N es un conjunto interno tal que 0 A y, cuando n A, tambien
n
0
A, entonces A = N.
La ultima propiedad se conoce como principio de inducci on y, aunque pa-
rezca la propiedad m as compleja de las cinco, es una de las m as f aciles de
demostrar: un conjunto A en tales condiciones es, por denici on, inductivo,
luego si n N, se cumple que n A por denici on de N, es decir, porque n
ha de pertenecer a todos los conjuntos internos inductivos. Por consiguiente,
N A, lo que, unido a la hip otesis de que A N, nos da que A = N.
Las propiedades 1. y 2. son inmediatas, 3. se prueba trivialmente usando 5.
(que ya est a probada).
Ejercicio: Probar 4. siguiendo este esquema:
a) Demostrar por inducci on sobre n que si m n N, entonces m n.
b) Demostrar por inducci on que, si n N, entonces n / n.
c) Demostrar 4. por reducci on al absurdo: si m 6= n, entonces m n y n m.
Llegar de aqu a una contradicci on.
A veces es m as c omodo expresar el principio de inducci on en terminos de
propiedades: Dados unos conjuntos internos x
1
, . . . , x
n
y una propiedad interna
P(n, x
1
, . . . , x
n
), podemos considerar el conjunto interno
A = {n N | P(n, x
1
, . . . , x
n
)}.
Lo que dice el principio de inducci on para el caso del conjunto A es que, si
0 tiene la propiedad P y, supuesto que un n N tiene P, podemos probar que
n
0
tambien tiene la propiedad P, entonces podemos asegurar que todo n umero
natural tiene la propiedad P.
Las cinco propiedades que hemos enunciado sobre los n umeros naturales se
conocen como axiomas de Peano (aunque no son axiomas, sino teoremas de
nuestra pelcula). Peano crea, y muchos matem aticos siguen creyendo actual-
mente, que determinan completamente al conjunto N de los n umeros naturales,
en el sentido de que no puede haber m as que un conjunto que cumpla esas cinco
propiedades. Esto es cierto si, por conjunto, entendemos conjunto interno,
es decir, un conjunto de los que forman parte de nuestra pelcula.
12 Captulo 1. Preliminares conjuntistas
Ejercicio: Demostrar que si N
1
y N
2
son dos conjuntos internos que cumplen los
cinco axiomas de Peano, entonces N
1
= N
1
N
2
= N
2
.
Ahora bien, quienes creen que los axiomas de Peano determinan de forma ab-
soluta el conjunto de los n umeros naturales no tienen en cuenta que las pelculas
son pelculas. No es este el mejor momento para discutir sobre la cuesti on. Vol-
veremos sobre ella m as tarde. De momento dejamos unicamente esta idea al
lector: En el mundo real s olo ha habido un Julio Cesar, y, por ello, en una
pelcula sobre Julio Cesar s olo puede haber un personaje que sea Julio Cesar,
pero eso no garantiza que el Julio Cesar que presente la pelcula sea una imagen
el del Julio Cesar hist orico. Sera un error garrafal armar que el Julio Cesar
de la pelcula ha de ser identico al Julio Cesar real porque no puede haber m as
que un Julio Cesar. En realidad tenemos dos unicidades: hay un unico Julio
Cesar externo y un unico Julio Cesar interno, pero el Julio Cesar interno puede
ser muy diferente del Julio Cesar externo.
1.3 Elementos de teora de conjuntos
Una vez presentados los principales personajes de nuestra pelcula, ahora va-
mos a dar algunos detalles del argumento. Puesto que todo lo que vamos a decir
hace referencia a lo que sucede en la realidad de nuestra pelcula, hablaremos
de conjuntos entendiendo que en todo momento nos referimos a conjuntos
internos.
1.3.1 Funciones
Denici on 1.1 Dados dos conjuntos A y B, una aplicaci on (o una funci on)
f : A B es un subconjunto f A B tal que, para cada a A, existe un
unico b B tal que (a, b) f. Este unico b se llama imagen por f del conjunto
a, y se representa por b = f(a). Tambien se dice que a es una antiimagen de b
por f.
En la pr actica, para denir una aplicaci on f : A B podemos olvidar que
estamos deniendo un conjunto de pares ordenados y denir simplemente f(a)
para todo a A. En el fondo, esto es siempre una aplicaci on del axioma de
especicaci on. Por ejemplo, si denimos s : N N como la aplicaci on dada
por s(n) = n
0
, con m as precisi on estamos deniendo el conjunto
s = {(n, m) N N | m = n
0
}.
Denici on 1.2 Una aplicaci on f : A B es inyectiva si elementos distintos
de A tienen im agenes distintas en B o, alternativamente, si cuando f(a) = f(a
0
),
entonces a = a
0
.
Diremos que f es suprayectiva si todo elemento de B tiene al menos una
antiimagen en A. Diremos que f es biyectiva si es inyectiva y suprayectiva.
1.3. Elementos de teora de conjuntos 13
Denimos
3
B
A
= {f | f : A B}.
Si f : A B y g : B C, denimos la composici on f g : A C
como la aplicaci on dada por (f g)(a) = g(f(a)).
La aplicaci on identidad I
A
: A A en un conjunto A es la aplicaci on
biyectiva dada por I
A
(a) = a.
Si A B, la inclusi on de A en B es la aplicaci on i : A B dada por
i(a) = a (de modo que la identidad es la inclusi on de un conjunto en s mismo).
Si f : A B es una aplicaci on biyectiva, podemos denir la aplicaci on
inversa f
1
: B A como la aplicaci on
f
1
= {(b, a) B A | f(a) = b}.
De este modo, f(a) = b equivale a f
1
(b) = a. Es f acil ver que f
1
es
tambien biyectiva y es la unica aplicaci on g : B A que cumple f g = I
A
y
g f = I
B
.
Si f : A B y C A, llamaremos restricci on de f a C a la aplicaci on
f|
C
: C A dada por f|
C
(c) = f(c), para todo c C.
Ejercicio: Comprobar que la composici on de aplicaciones inyectivas, suprayectivas o
biyectivas es tambien inyectiva, suprayectiva o biyectiva.
Teorema 1.3 (Teorema de recursi on) Dado un conjunto A, un conjunto
a A y una aplicaci on g : A A, existe una unica aplicaci on f : N A
que cumple f(0) = a y, para todo n N, f(n
0
) = g(f(n)).
Es decir, para denir una aplicaci on f : N A basta denir f(0) y denir
f(n
0
) a partir de f(n).
Demostraci on:
4
Por inducci on se demuestra que, si m N, se cumple que
0 m
0
, todos los elementos de m
0
son n umeros naturales y, si n m, entonces
n
0
m
0
.
En efecto, esto es cierto para m = 0, ya que 0 0
0
= {0}, el unico elemento
de 0
0
es 0, que es un n umero natural, y la tercera propiedad es trivial, ya que
no existe ning un n 0 = .
Supong amoslo cierto para m y ve amoslo para m
0
. Hemos de probar que
0 m
00
= m
0
{m
0
}. Como suponemos que 0 m
0
, es claro que tambien
3
Podemos usar el axioma de especicaci on porque, de hecho,
B
A
= {f P(AB) | f : A B}.
4
La prueba es bastante tecnica, y los argumentos que requiere son de naturaleza muy
distinta a los que realmente nos van a interesar en este libro, por lo que el lector puede pasarla
por alto sin que ello vaya a afectar a su comprensi on de lo que sigue. La incluimos unicamente
por si acaso, m as adelante, el lector encuentra motivos para desconar de la construcci on de
los n umeros naturales y quiere revisarla con detalle.
14 Captulo 1. Preliminares conjuntistas
0 m
00
. Si todos los elementos de m
0
son n umeros naturales, tambien lo son
todos los de m
00
, ya que son los de m
0
y el propio m
0
, que es un n umero natural.
Adem as, si n m
0
= m{m}, o bien n m, en cuyo caso n
0
m
0
m
00
por la
hip otesis de inducci on, o bien n = m, en cuyo caso n
0
= m
0
m
00
por denici on
de m
00
.
Ahora vamos a probar que, para cada m N, existe una unica aplicaci on
f
m
: m
0
A que cumple f
m
(0) = a y, para todo n m, f
m
(n
0
) = g(f
m
(n)).
En efecto, para m = 0 basta tomar f
0
= {(0, a)}. Si existe f
m
, denimos
f
m
0 = f
m
{(m
0
, g(f
m
(m))}. De este modo, f
m
0 (n) = f
m
(n) para todo n m,
por lo que la propiedad que suponemos que cumple f
m
puede reformularse as:
f
m
0 (0) = a, f
m
0 (n
0
) = g(f
m
0 (n)),
para todo n m
0
. Como m
0
= m{m}, s olo falta probar que la segunda parte
se cumple tambien para n = m. Ahora bien, por denici on,
f
m
0 (m
0
) = g(f
m
(m)) = g(f
m
0 (m)).
Para probar la unicidad, sea h : m
00
A cualquier aplicaci on que cumpla
las condiciones
h(0) = a, h(n
0
) = g(h(n)), para todo n m
0
,
y vamos a probar que es justamente la f
m
0 que hemos denido. Demostramos
por inducci on que si n m
00
, entonces h(n) = f
m
0 (n).
En efecto, si n = 0, entonces h(0) = a = f
m
0 (0). Si h(n) = f
m
0 (n) y n
0
m
00
,
entonces
h(n
0
) = g(h(n)) = g(f
m
0 (n)) = f
m
0 (n
0
).
As pues, h = f
m
0 , como queramos probar.
Ahora denimos f : N A mediante f(n) = f
n
(n). La aplicaci on f tiene
la propiedad indicada, pues f(0) = f
0
(0) = a y, si n N, entonces
f(n
0
) = f
n
0 (n
0
) = g(f
n
0 (n)) = g(f
n
(n)) = g(f(n)).
La unicidad se demuestra por inducci on exactamente igual a como hemos
probado la unicidad de f
m
0 .
Veamos una primera aplicaci on del teorema de recursi on:
Denici on 1.4 Para cada m N, denimos la aplicaci on (m+) : N N
determinada recursivamente por m y la aplicaci on siguiente s : N N, es
decir, como la unica aplicaci on que cumple:
(m+)(0) = m, (m+)(n
0
) = s((m+)(n)) = ((m+)(n))
0
.
1.3. Elementos de teora de conjuntos 15
En la pr actica escribiremos m + n en lugar de (m+)(n), con lo que las
propiedades anteriores se vuelven m as legibles:
m+ 0 = m, m+n
0
= (m+n)
0
.
M as a un, recordando la denici on 1 = 0
0
, tenemos que
m+ 1 = m+ 0
0
= (m+ 0)
0
= m+ 1.
Por ello, en lo sucesivo no volveremos a representar el siguiente de m por m
0
,
sino que nos referiremos a el como m + 1. En estos terminos, las propiedades
que denen a la suma se expresan as:
m+ 0 = m, m+ (n + 1) = (m+n) + 1.
M as en general, las condiciones del teorema de recursi on se expresan como
sigue:
f(0) = a, f(n + 1) = g(f(n)).
Denici on 1.5 Para cada m N, denimos la aplicaci on (m) : N N como
la unica que cumple
m 0 = 0, m (n + 1) = m n +m,
donde hemos utilizado el teorema de recursi on con la funci on g : N N dada
por g(n) = n +m.
A partir de aqu, es pura rutina demostrar todas las propiedades conocidas
de la suma y el producto de n umeros naturales. Veamos algunos ejemplos:
Propiedad asociativa de la suma: (m+n) +r = m+ (n +r).
Lo probamos por inducci on sobre r. Si r = 0 se reduce a
(m+n) + 0 = m+n = m+ (n + 0).
Si vale para r, lo probamos para r + 1:
(m+n) + (r + 1) = ((m+n) +r) + 1 = (m+ (n +r)) + 1
= m+ ((n +r) + 1) = m+ (n + (r + 1)),
donde hemos usado la denici on de suma, la hip otesis de inducci on y dos veces
m as la denici on de suma.
Propiedad conmutativa de la suma: m+n = n +m.
Dejamos como ejercicio probarlo para m = 0 y m = 1, es decir, probar por
inducci on sobre n que 0 +n = n + 0 y que 1 +n = n + 1.
Ahora probamos el resultado general, tambien por inducci on sobre n. Para
n = 0 es: uno de los casos que hemos dejado como ejercicio: m+0 = m = 0+m.
Si vale para n, tenemos
m+(n+1) = (m+n)+1 = (n+m)+1 = n+(m+1) = n+(1+m) = (n+1)+m,
16 Captulo 1. Preliminares conjuntistas
donde hemos usado la denici on de suma, la hip otesis de inducci on, la denici on
de suma, el caso que hemos dejado como ejercicio y la propiedad asociativa.
Simplificaci on de la suma: Si u +n = v +n, entonces u = v.
Por inducci on sobre n. Para n = 0 es u + 0 = v + 0, luego u = v. Si vale
para n, entonces, si u+(n+1) = v +(n+1), tambien (u+n) +1 = (v +n) +1,
luego u+n = v +n (por el cuarto axioma de Peano), luego u = v, por hip otesis
de inducci on.
1.3.2 Relaciones
Denici on 1.6 Una relaci on en un conjunto A es un conjunto R AA. En
lugar de escribir (a, b) R, escribiremos a Rb y diremos que a est a relacionado
con b (seg un la relaci on R)
Una relaci on de orden (total) en un conjunto A es una relaci on en A que
cumple las propiedades siguientes:
Reexiva a a.
Antisimetrica Si a b y b a, entonces a = b.
Transitiva Si a b y b c, entonces a c.
De conexi on a b o b a.
Si es una relaci on de orden en un conjunto A, escribiremos a < b para
indicar a b y a 6= b. Escribiremos a b como equivalente a b a, as como
a > b como equivalente a b < a.
Un conjunto ordenado es un par (A, ), donde es una relaci on de orden
en el conjunto A.
Teorema 1.7 La relaci on en N dada por
m n si y s olo si existe un r N tal que m+r = n
es una relaci on de orden.
Demostraci on: Las propiedades reexiva y transitiva son inmediatas.
Para probar la propiedad antisimetrica suponemos que m n y n m, de modo
que m+r = n y n+s = m, para ciertos r, s N. Entonces m+r+s = m = m+0.
Por la propiedad de simplicaci on, r +s = 0. De aqu se sigue que s = 0, ya
que en caso contrario s = t + 1, con lo que r +t + 1 = 0, en contra del segundo
axioma de Peano. Por lo tanto, m = n +s = n + 0 = n.
La conexi on la demostramos por inducci on sobre a. Si a = 0 entonces 0 b,
ya que b = 0 + b. Si vale para a, entonces a b o b a. En el segundo caso
b a a + 1, luego b a + 1. En el primer caso tenemos que a +r = b, para
cierto r N. Si r 6= 0, entonces r = s+1, luego a+1+s = b, lo que prueba que
1.3. Elementos de teora de conjuntos 17
a + 1 b. Si r = 0 tenemos que a = b, luego b b + 1 = a + 1. En cualquier
caso, tenemos la conexi on.
En lo sucesivo consideraremos siempre a N como conjunto ordenado con la
relaci on que acabamos de denir.
Denici on 1.8 Si m n son dos n umeros naturales, por denici on existe un
r N tal que m+r = n. Por la propiedad de cancelaci on, este r es unico, y lo
llamaremos r = n m.
Ejercicio: Demostrar que, si n N, no existe ning un m N tal que n < m < n + 1.
Equivalentemente, si m < n + 1, entonces m n y si m < n, entonces m+ 1 n.
Denici on 1.9 Si (A, ) es un conjunto ordenado y B A, el mnimo de B
es un elemento m B tal que m b para todo b B. El m aximo de B es un
elemento M B tal que b M para todo b B.
Un conjunto B A no tiene por que tener mnimo elemento, pero si lo
tiene es unico, ya que, si hubiera dos, digamos m y m
0
, entonces tendra que
ser m m
0
, porque m es mnimo, y m
0
m, porque m
0
es mnimo. Por la
antisimetra, sera m = m
0
. Lo mismo sucede con el m aximo.
Con la relaci on de orden que hemos denido, el conjunto N de los n umeros
naturales cumple la siguiente propiedad fundamental:
Teorema 1.10 (Principio de buena ordenaci on) Todo subconjunto de N no
vaco tiene mnimo elemento.
Demostraci on: Vamos a probar por inducci on sobre n que todo subcon-
junto A N que contenga un n umero n tiene un mnimo elemento. Si A
contiene un n umero m 0, entonces ha de ser m = 0, porque 0 +m = m, luego
0 m, luego m = 0. Por el mismo motivo, 0 es menor o igual que todo n umero
de A, luego 0 es el mnimo de A.
Supongamos que todo conjunto de n umeros naturales que contenga un n u-
mero n tiene mnimo elemento y supongamos que A contiene un n umero
a n + 1.
Distinguimos dos casos: si A no contiene ning un n umero menor que a, es que
a es el mnimo de A. En caso contrario, A contiene un elemento b < a n + 1,
luego b < n + 1, luego b n y, por hip otesis de inducci on, A tiene mnimo
elemento.
En particular, el mnimo de N es 0, y n+1 es el menor natural mayor que n.
Por otra parte, N no tiene un m aximo elemento, ya que todo n umero natural n
es menor que n + 1.
Denici on 1.11 Si (A, ) es un conjunto ordenado, diremos que un M A es
una cota superior de un conjunto B A si b M para todo b B (pero, al con-
trario que en la denici on de m aximo, no exigimos que M B). An alogamente
se dene una cota inferior. Diremos que un conjunto B A est a acotado supe-
rior o inferiormente si tiene una cota superior o inferior.
18 Captulo 1. Preliminares conjuntistas
Teorema 1.12 Todo subconjunto de N no vaco acotado superiormente tiene
un m aximo elemento.
Demostraci on: Sea A N. Si A tiene una cota superior, el conjunto de
sus cotas superiores es un subconjunto de N no vaco, luego podemos considerar
la menor cota superior M de A. Vamos a probar que es el m aximo de A. S olo
hay que probar que M A. Si M / A, entonces todo a A cumple a < M.
Como A no es vaco, no puede ser M = 0, luego M = c + 1, para cierto c N.
Entonces, si a A, tenemos que a < c + 1, luego a c, luego c es una cota
superior de A, pero c < M, en contradicci on con que M era la menor cota
posible. As pues, M A y M es el m aximo de A.
Denici on 1.13 Una relaci on R en un conjunto A es una relaci on de equiva-
lencia si cumple las propiedades siguientes:
Reexiva a Ra.
Simetrica Si a Rb, entonces b Ra.
Transitiva Si a Rb y b Rc, entonces a Rc.
En estas condiciones, denimos la clase de equivalencia de un elemento a A
como el conjunto
[a] = {b A | a Rb}.
El conjunto cociente de A sobre R es el conjunto A/R que contiene a todas
las clases de equivalencia de los elementos de A.
Ejercicio: Demostrar que, en las condiciones anteriores, a Rb si y s olo si [a] = [b],
mientras que no a Rb si y s olo si [a] [b] = .
1.3.3 Conjuntos nitos
Denici on 1.14 Si n N es un n umero natural, denimos
I
n
= {m N | m < n}.
Un conjunto A es nito si existe un n umero natural n y una aplicaci on
biyectiva f : I
n
A. En caso contrario es innito.
Observemos que, I
0
= y, tecnicamente, : biyectiva, por lo que
es un conjunto nito. Si el lector juzga esto difcil de digerir, puede considerar
simplemente que es nito por denici on.
Los conjuntos I
n
son nitos, pues cumplen la denici on con la aplicaci on
identidad.
Otro hecho obvio es que, si existe una aplicaci on biyectiva g : A B,
entonces A es nito si y s olo si B es nito. En efecto, si existe una aplicaci on
biyectiva f : I
n
A, entonces f g : I
n
B tambien es biyectiva.
1.3. Elementos de teora de conjuntos 19
Teorema 1.15 Un subconjunto de N es nito si y s olo si est a acotado supe-
riormente.
Demostraci on: Para incluir al conjunto vaco, hay que entender que este
est a trivialmente acotado. (De hecho, 0 es una cota superior.)
Si A N es nito, existe una aplicaci on biyectiva f : I
n
A. Vamos a
probar que A est a acotado por inducci on sobre n. Si n = 0 entonces A = y,
como acabamos de decir, est a trivialmente acotado.
Supongamos que el teorema es cierto para n y pongamos que f : I
n+1
A
es biyectiva. Si a = f(n), entonces f se restringe a una aplicaci on biyectiva
f
0
: I
n
A\ {a}, luego A\ {a} est a acotado superiormente. Sea M N una
cota superior de A\ {a}, es decir, b M para todo b A que no sea b = a.
Si a M, entonces M es una cota superior de A. Si M a, entonces a es,
de hecho, el m aximo de A.
Supongamos ahora que A est a acotado superiormente.Tambien podemos su-
poner que A 6= . Vamos a probar que es nito por inducci on sobre una cota
superior.
Si A tiene a 0 por cota superior, entonces A = {0} = I
1
, luego es nito.
Si es cierto para conjuntos acotados por n, supongamos que una cota superior
de A es n + 1. Si n es tambien una cota superior, entonces A es nito por
hip otesis de inducci on. En caso contrario es que n + 1 A. El conjunto
A \ {n + 1} tiene a n por cota superior, luego por hip otesis de inducci on es
nito. Sea f : I
m
A\ {n + 1} biyectiva. Entonces,
f {(m, n + 1)} : I
m+1
A es biyectiva,
luego A es nito.
En particular, N es innito.
Teorema 1.16 Un conjunto A es nito si y s olo si existe una aplicaci on in-
yectiva A I
n
, para cierto n N.
Demostraci on: Si A es nito, existe una aplicaci on biyectiva I
n
A, y
su inversa es tambien biyectiva, en particular inyectiva.
Si existe una aplicaci on A I
n
inyectiva, podemos verla tambien como
una aplicaci on biyectiva A B, donde B I
n
. Como I
n
es nito, B tambien
lo es, luego A tambien lo es.
Ejercicio: Demostrar que si A B es inyectiva y B es nito, entonces A es nito.
Teorema 1.17 Todo subconjunto de un conjunto nito es nito.
Demostraci on: Sea A un conjunto nito y sea B A. Existe una apli-
caci on inyectiva A I
n
que se restringe a otra aplicaci on inyectiva B I
n
,
luego B es nito.
Ejercicio: Probar que un conjunto A es innito si y s olo si existe una aplicaci on
suprayectiva I
n
A, para cierto n N.
20 Captulo 1. Preliminares conjuntistas
Teorema 1.18 Si m, n N y existe una aplicaci on biyectiva I
m
I
n
, en-
tonces m = n.
Demostraci on: Lo probamos por inducci on sobre n. Si n = 0, entonces
I
n
= , por lo que I
m
ha de ser tambien vaco, luego m = 0.
Supongamos el teorema cierto para n y supongamos que tenemos una apli-
caci on biyectiva f : I
m
I
n+1
. Claramente, m 6= 0, luego m = r + 1 si
f(r) = n, entonces f se restringe a una aplicaci on biyectiva I
r
I
n
, luego
r = n, luego m = n + 1.
Si f(r) 6= n, consideramos los n umeros f(r) = u 6= n y v = f
1
(n) 6= r. Es
f acil ver que
(f \ {(r, u), (v, n)}) {(v, u)} : I
r
I
n
biyectiva,
luego nuevamente r = n y m = n + 1.
As pues, si A es un conjunto nito, existe un unico n N tal que existe una
aplicaci on biyectiva f : I
n
A, pues si g : I
m
A, entonces se cumple que
g f
1
: I
m
I
n
es biyectiva, luego m = n.
Denici on 1.19 Si A es un conjunto nito, llamaremos cardinal de A al unico
n N tal que existe una aplicaci on biyectiva f : I
n
A. Lo representaremos
por |A|.
El cardinal de un conjunto nito es lo que m as habitualmente se llama su
n umero de elementos. Claramente |A| = 0 si y s olo si A = .
Si A 6= tiene n elementos, existe x : I
n
A biyectiva. Si escribimos
x
i
= x(i 1), podemos representar A en la forma A = {x
1
, . . . , x
n
}.
Teorema 1.20 Si A y B son conjuntos nitos, entonces A B es nito y
|A B| + |A B| = |A| + |B|.
Demostraci on: Supongamos primeramente que AB = . Sean m = |A|,
n = |B|, de modo que existen f : A I
m
y g : B I
n
son biyectivas.
Podemos denir una aplicaci on biyectiva h : A B I
m+n
mediante
h(x) =

f(x) si x A,
m+g(x) si x B.
Por consiguiente, |A B| = m+n = |A| + |B|.
En el caso general, sea B
0
= B \ (A B). Como B = B
0
(A B) y ambos
conjuntos son disjuntos, la parte ya probada nos da que |B| = |B
0
| + |A B|.
Por otra parte, A B = A B
0
y A B
0
= . De nuevo por la parte ya
probada, |AB| = |A| +|B
0
|. Sumando |AB| a ambos miembros tenemos la
f ormula del enunciado.
Ejercicio: Probar que si A y B son conjuntos nitos, entonces A B tambien es
nito, y |AB| = |A||B|.
1.3. Elementos de teora de conjuntos 21
Teorema 1.21 Todo conjunto (totalmente) ordenado nito no vaco tiene un
m aximo y un mnimo elemento.
Demostraci on: Supongamos, por reducci on al absurdo, que existe un con-
junto ordenado no vaco sin m aximo elemento. Sea n el mnimo cardinal posible
para un conjunto en tales condiciones. Esto signica que cualquier conjunto
ordenado con menos de n elementos tiene un m aximo elemento.
Sea, pues A un conjunto de n elementos, no vaco y sin m aximo. No puede
ser n = 0, as que n = m + 1. Tampoco puede ser n = 1, porque entonces
A = {a} y obviamente, tiene m aximo. Por lo tanto, m 6= 0. Si a A, entonces
A \ {a} es un conjunto ordenado no vaco con m elementos, luego tiene un
m aximo a
0
. Si a
0
a, entonces a
0
es el m aximo de A. Si a
0
< a, entonces a es
el m aximo de A. Igualmente se razona con los mnimos.
Si A es un conjunto ordenado nito, todo subconjunto de A tambien lo es,
luego, de hecho, todos los subconjuntos no vacos de A tienen m aximo y mnimo
elemento. En particular, todo elemento que no sea el m aximo tiene un inmediato
posterior (el mnimo de los elementos mayores que el), y todo elemento que no
sea el mnimo tiene un inmediato anterior.
1.3.4 Estructuras algebraicas y de orden
Denici on 1.22 Una ley de composici on interna en un conjunto A es una
aplicaci on
: AA A.
En lugar de escribir (a, b), escribiremos a b. En denitiva, una ley de
composici on interna en A es cualquier forma de operar dos elementos de A para
obtener un nuevo elemento de A.
Por ejemplo, aunque, tecnicamente, hemos denido la suma y el producto
de n umeros naturales como una familia de aplicaciones (m+) y (m), para cada
m N, es m as natural reunirlas en dos unicas leyes de composici on interna
+ : N N N, : N N N.
Por denici on, m+n = (m+)(n) y m n = (m)(n).
Denici on 1.23 Un anillo conmutativo y unitario es una terna (A, +, ), donde
A es un conjunto y + : AA A, : AA A son dos leyes de composici on
interna en A que cumplen las propiedades siguientes:
Asociativa (a +b) +c = a + (b +c), (ab)c = a(bc).
Conmutativa a +b = b +a, ab = ba.
Distributiva a(b +c) = ab +ac.
Elemento neutro Existen 0, 1 A tales que a + 0 = a, a 1 = a.
22 Captulo 1. Preliminares conjuntistas
Elemento simetrico Para cada a A existe un elemento a A tal que
a + (a) = 0.
En lo sucesivo, siempre que hablemos de anillos se entender a que son anillos
conmutativos y unitarios.
Observemos que los elementos neutros 0 y 1 son unicos, pues si 0 y 0
0
son
neutros para la suma, entonces 0 = 0 + 0
0
= 0
0
, e igualmente con el producto.
Igualmente, el elemento simetrico ha de ser unico, pues si existe otro (a)
0
que cumple a + (a) = 0 = a + (a)
0
, entonces
a = a + 0 = a +a + (a)
0
= 0 + (a)
0
= (a)
0
.
En la pr actica, escribiremos a b en lugar de a + (b).
Observemos que en cualquier anillo se cumple a 0 = 0, pues
a 0 = a (0 + 0) = a 0 +a 0
y, sumando (a 0) a ambos miembros, llegamos a que 0 = a 0.
Ejercicio: Demostrar que en cualquier anillo se cumple (a)b = a(b) = (ab),
(a)(b) = ab, (a +b) = a b.
Denici on 1.24 Si A es un anillo, un ideal de A es un subconjunto I A con
las propiedades siguientes:
a) 0 I.
b) Si a, b I, entonces a +b I.
c) Si a I y b A, entonces ab I.
En tal caso, denimos en A la relaci on a b (mod I) dada por a b I.
Se dice que a y b son congruentes m odulo el ideal I.
Teorema 1.25 Sea A un anillo e I un ideal de A.
a) La congruencia en A m odulo I es una relaci on de equivalencia.
b) Si a a
0
(mod I) y b b
0
(mod I), entonces a + b a
0
+ b
0
(mod I) y
ab a
0
b
0
(mod I).
Demostraci on: a) Se cumple a a (mod I) porque a a = 0 I.
Si a b (mod I), entonces a b I, luego (1)(a b) = b a I, luego
b a (mod I).
Si a b (mod I) y b c (mod I), entonces a b I y b c I. La suma
tambien est a en I, y es a c I, luego a c (mod I).
b) Sea a = a
0
+ i, b = b
0
+ j, con i, j I. Entonces a + b = b + b
0
+ i + j,
con i +j I, y ab = a
0
b
0
+a
0
j +ib
0
+ij, y los tres ultimos productos est an en
I, luego su suma tambien. Por lo tanto tenemos que a +b a
0
+b
0
(mod I) y
ab a
0
b
0
(mod I).
1.3. Elementos de teora de conjuntos 23
Denici on 1.26 Si A es un anillo e I es un ideal de A, representaremos por
A/I el conjunto cociente de A respecto a la relaci on de congruencia m odulo I.
El teorema anterior prueba que podemos denir una suma y un producto en
A/I mediante
[a] + [b] = [a +b], [a][b] = [ab].
El punto crucial es que estas deniciones no dependen del elemento de la clase
de equivalencia con el que hacemos las operaciones, es decir, que si [a] = [a
0
]
y [b] = [b
0
], llegamos a la misma clase si calculamos [a + b] que si calculamos
[a
0
+b
0
], e igualmente con el producto.
Es inmediato comprobar que estas operaciones convierten a A/I en un anillo,
el llamado anillo cociente de A sobre I.
Ejercicio: Demostrar, mediante los oportunos razonamientos inductivos, que N cum-
ple todas las propiedades de la denici on de anillo excepto la existencia de elementos
simetricos.
Al a nadir un elemento simetrico a cada n umero natural obtenemos el anillo
de los n umeros enteros. Veamos c omo hacerlo:
Denici on 1.27 Denimos en N N la relaci on dada por
(m, n) R(m
0
, n
0
) si y s olo si m+n
0
= n +m
0
.
Si pudieramos restar dos n umeros naturales cualesquiera, esta relaci on podra
escribirse as:
mn = m
0
n
0
.
Vemos as que el signicado de la relaci on R es que dos pares de n umeros
est an relacionados si y s olo si deberan tener la misma resta.
Ejercicio: Demostrar que la relaci on R que acabamos de denir es de equivalencia.
Llamaremos conjunto de los n umeros enteros al conjunto cociente
Z = (N N)/R.
Ejercicio: Demostrar que si (m, n) R(m
0
, n
0
) y (u, v) R(u
0
, v
0
), entonces
(m+u, n +v) R(m
0
+u
0
, n
0
+v
0
), (mu +nv, mv +nu) R(m
0
u
0
+n
0
v
0
, m
0
v
0
+n
0
u
0
)
as como que
m+v n +u si y s olo si m
0
+v
0
n
0
+u
0
.
El ejercicio anterior nos permite denir en Z las operaciones
[(m, n)] + [(u, v)] = [(m+u, n +v)], [(m, n)][(u, v)] = [(mu +nv, mv +nu)],
as como la relaci on
[(m, n)] [(u, v)] si y s olo si m+v n +u.
24 Captulo 1. Preliminares conjuntistas
La interpretaci on es que si imaginamos que [(m, n)] representa a la resta
mn y [(u, v)] representa a la resta u v, entonces su suma debe ser
mn +u v = (m+u) (n +v),
y su producto debe ser
(mn)(u v) = mu +nv mv nu = (mu +nv) (mv +nu)
y estas dos restas se corresponden con las clases de pares que hemos denido
como suma y producto de las clases dadas.
Igualmente, mn u v debe ser equivalente a m+v n +u.
Ejercicio: Demostrar que Z es un anillo con las operaciones que acabamos de denir.
Los elementos neutros son 0 = [(0, 0)], 1 = [(1, 0)]. Los elementos simetricos son
[(m, n)] = [(n, m)].
Ejercicio: Demostrar que la relaci on que hemos denido en Z es una relaci on de
orden.
Para cada n N, denimos los n umeros enteros +n = [(n, 0)], n = [(0, n)].
Si [(m, n)] es un n umero entero arbitrario, vemos que, si m n, entonces
[(m, n)] = [(mn, 0)] = +(mn),
mientras que si m n entonces
[(m, n)] = [(0, n m)] = (n m).
Adem as, +0 = [(0, 0)] = 0 es el elemento neutro 0 Z. Por consiguiente,
si llamamos Z
+
= {+n | n N, n 6= 0} y Z

= {n | n N, n 6= 0}, se cumple
Z = Z

{0} Z
+
.
Es inmediato comprobar que la aplicaci on i : N Z dada por i(n) = +n
es inyectiva y cumple:
i(m+n) = i(m) +i(n), i(mn) = i(m)i(n),
m n si y s olo si i(m) i(n).
Esto signica que podemos identicar cada n umero natural n con el n umero
entero +n, de forma que la suma, el producto y la relaci on de orden entre
n umeros naturales se calculan igual si los consideramos como naturales o como
enteros. Por ello, a partir de este momento consideraremos que N Z.
Observemos que, si n N, entonces n es el elemento simetrico de n en Z,
de modo que Z consta unicamente de los n umeros naturales y de sus simetricos
(teniendo en cuenta que, en el caso de 0 (y s olo en este caso), se cumple 0 = 0).
Ejercicio: Demostrar que N = {n Z | n 0}.
1.3. Elementos de teora de conjuntos 25
El anillo Z cumple una propiedad que no exige la denici on de anillo, a
saber, que si mn = 0, entonces m = 0 o n = 0.
En efecto, observemos en primer lugar que esto lo cumplen los n umeros
naturales, ya que si m 6= 0 y n 6= 0, entonces m = r + 1, luego mn = rr + n,
luego mn n > 0.
En general, si mn = 0, tambien mn = m(n) = 0 y (m)(n) = 0, y
una de estas cuatro combinaciones corresponde a n umeros naturales, luego ha
de ser m = 0 o n = 0, lo cual implica m = 0 o n = 0.
Denici on 1.28 Un anillo ordenado es una cu adrupla (A, +, , ) que cum-
ple la denici on de anillo y la denici on de conjunto (totalmente) ordenado, y
adem as la relaci on de orden verica las dos propiedades siguientes de compati-
bilidad:
Compatibilidad con la suma Si a b, entonces a +c b +c.
Compatibilidad con el producto Si a b y c 0, entonces ac bc.
Para probar que (Z, +, , ) es un anillo ordenado conviene observar que si
a = [(m, n)] y b = [(u, v)], entonces
b a = [(u, v)] + [(n, m)] = [(n +u, m+v)]
luego b a 0 equivale a que m+v n +u, es decir, a que a b.
As pues, si a b, tenemos que ba = b+c(a+c) 0, luego a+c b+c.
Igualmente, si a b y c 0, tenemos que b a 0 y c 0, es decir, que
ambos son n umeros naturales, y tambien lo ser a su producto bc ac 0, lo que
equivale a ac bc.
Veamos algunas propiedades de los anillos ordenados:
a) Si a b, entonces b a (pues 0 = aa ba y b b+ba = a).
b) Si a 0, entonces a 0. (Caso particular de a.)
c) Si b, c 0, entonces bc 0 (por la compatibilidad del producto).
d) aa 0 (porque aa = (a)(a) y a una de las dos expresiones se le puede
aplicar b).
e) 1 0 y 1 0. (porque 1 = 1 1).
f) Si a b y c 0 entonces ac bc (porque ac bc).
Denici on 1.29 Un elemento a de un anillo A es una unidad si existe un
a
1
A tal que aa
1
= 1. El elemento a
1
se llama inverso de a, y es unico,
pues si existe otro a
01
, entonces a
01
= a
01
1 = a
01
aa
1
= 1 a
1
= a
1
.
Un cuerpo es un anillo en el que todo elemento distinto de 0 es una unidad.
26 Captulo 1. Preliminares conjuntistas
Ejercicio: Demostrar que las unicas unidades de Z son 1.
Para dotar de inverso a cada n umero entero construimos el cuerpo de los
n umeros racionales por un procedimiento similar al que hemos seguido para
construir Z a partir de N.
Denici on 1.30 Sea A = {(m, n) ZZ | n 6= 0}. Denimos en A la relaci on
(m, n) R(m
0
, n
0
) si y s olo si mn
0
= nm
0
.
Se demuestra f acilmente que se trata de una relaci on de equivalencia. La
clase de equivalencia de un par (m, n) se representa por m/n. Diremos que es
una fracci on de numerador m y denominador n. De este modo tenemos que
m
n
=
m
0
n
0
si y s olo si mn
0
= nm
0
.
El conjunto cociente Q = A/R se llama conjunto de los n umeros racionales.
Denimos en Q las operaciones
m
n
+
u
v
=
mv +nu
nv
,
m
n
u
v
=
mu
nv
Como el denominador de una fracci on no puede ser 0, aqu estamos usando
que el producto de n umeros enteros no nulos es no nulo.
Ejercicio: Comprobar que estas deniciones son correctas, en el sentido de que, si
tomamos dos representantes distintos de cada fracci on, m/n = m
0
/n
0
y u/v = u
0
/v
0
,
las fracciones que obtenemos al sumar y multiplicar son la misma.
Ejercicio: Comprobar que (Q, +, ) es un cuerpo. Los elementos neutros son 0/1 y
1/1, los simetricos son (m/n) = (m)/n, y los inversos (m/n)
1
= n/m.
Observemos que de la denici on de las fracciones se sigue que
am
an
=
m
n
.
En particular, para a = 1, esto implica que podemos cambiar el signo al
numerador y el denominador de una fracci on, por lo que
Q = {m/n | m Z, n N, n 6= 0}.
En otras palabras: no perdemos generalidad si suponemos que el denomina-
dor de una fracci on es positivo.
Denici on 1.31 Denimos en Q la relaci on dada por
m
n

u
v
si y s olo si mv nu (donde n, v > 0).
1.3. Elementos de teora de conjuntos 27
Ejercicio: Demostrar que la relaci on que acabamos de denir es correcta, en el sentido
de que no depende del representante de cada fracci on con que la comprobamos.
Ejercicio: Demostrar que, con esta relaci on (Q, +, , ) es un cuerpo ordenado, es
decir, un cuerpo que verica las propiedades de anillo ordenado.
Consideramos ahora la aplicaci on i : Z Q dada por i(n) = n/1. Se
comprueba sin dicultad que es inyectiva, y adem as cumple:
i(m+n) = i(m) +i(n), i(mn) = i(m)i(n),
m n si y s olo si i(m) i(n).
Una vez m as, esto signica que podemos identicar a cada n umero entero
con su imagen en Q, de modo que las propiedades de los n umeros enteros son
las mismas cuando los consideramos como n umeros enteros o como n umeros
racionales. As pues, a partir de ahora consideraremos que N Z Q.
Observemos que
m
n
=
m
1
1
n
=
m
1

n
1
_
1
= i(m)i(n)
1
= mn
1
,
donde en el ultimo paso hemos usado la identicaci on que acabamos de esta-
blecer. Esto signica que, a partir de ahora, podemos olvidarnos de que las
fracciones son clases de equivalencia de pares de n umeros enteros y considerar
que m/n = mn
1
, donde el producto y el inverso del miembro derecho son las
operaciones de Q. M as a un, si K es un cuerpo arbitrario, usaremos la notaci on
a/b = ab
1
, para todo a, b K, b 6= 0. En particular, en el caso de Q podemos
considerar fracciones con numerador y denominador fraccionario:
m/n
u/v
=
m
n

u
v
_
1
=
m
n
v
u
=
mv
nu
.
1.3.5 Elementos de aritmetica
Terminamos esta secci on discutiendo algunos resultados variados sobre la
aritmetica de los anillos y los cuerpos en general y de los conjuntos numericos
en particular.
En primer lugar observamos que si A es un anillo y a A, podemos denir
una aplicaci on N A mediante el teorema de recursi on, estableciendo que
0a = 0, (n + 1)a = na +a.
A su vez, podemos extenderla a una aplicaci on Z A mediante
(n)a = (na), para todo n N.
Hemos denido una aplicaci on para cada a A, pero podemos unirlas todas
en una unica aplicaci on Z A A.
28 Captulo 1. Preliminares conjuntistas
Ejercicio: Demostrar que
0a = 0, (1)a = a, (m+n)a = ma +na, (mn)a = m(na).
Por ejemplo, 3a = (1+1+1)a = a+a+a. Notemos que si A = Z el producto
que acabamos de denir no es sino el producto usual en Z.
Similarmente, para cada a A podemos denir una aplicaci on N A
mediante a
0
= 1, a
n+1
= a
n
a. Si a es una unidad de A, podemos extender
esta aplicaci on a otra Z A mediante a
n
= (a
1
)
n
. Observemos que a
1
en este sentido resulta ser a
1
en el sentido del inverso de a.
Ejercicio: Demostrar que a
m+n
= a
m
a
n
, (a
m
)
n
= a
mn
, donde m, n N si a no es
una unidad, o m, n Z si lo es. En este ultimo caso tenemos tambien que a
n
= 1/a
n
y a
m
/a
n
= a
mn
.
Denimos ahora la aplicaci on factorial N N del modo siguiente:
0! = 1, (n + 1)! = n!(n + 1).
As, por ejemplo,
1! = 0! 1 = 1, 2! = 1! 2 = 1 2 = 2, 3! = 2! 3 = 1 2 3 = 6.
Si 0 m n denimos el n umero combinatorio
_
n
m

=
n!
m! (n m)!
Teorema 1.32 Sean m n n umeros naturales.
a)
_
n
m
_
=
_
n
nm
_
.
b)
_
n
0
_
=
_
n
n
_
= 1,
_
n
1
_
= n.
c) Si m < n,
_
n
m
_
+
_
n
m+1
_
=
_
n+1
m+1
_
.
d) Los n umeros combinatorios son n umeros naturales.
Demostraci on: c) Hay que probar que
n!
m! (n m)!
+
n!
(m+ 1)! (n m1)!
=
(n + 1)!
(m+ 1)! (n m)!
.
Ahora bien,
_
n!
m! (n m)!
+
n!
(m+ 1)! (n m1)!

(m+ 1)! (n m)!


=
n! (m+ 1) m! (n m)!
m! (n m)!
+
n! (m+ 1)! (n m)(n m1)!
(m+ 1)! (n m1)!
= n! (m+ 1) +n! (n m) = mn! +n! +nn! mn! = (n + 1) n! = (n + 1)!
1.3. Elementos de teora de conjuntos 29
d) Una simple inducci on nos da que
_
n
m
_
es un n umero natural, pues cada
n umero combinatorio con n+1 es suma de dos con n, por el apartado c).
La forma m as f acil de calcular los n umeros combinatorios es disponerlos en
forma de tri angulo, de modo que cada uno es la suma de los dos que hay sobre
el. El tri angulo as construido se suele llamar tri angulo de Tartaglia.
1
1 1
1 2 1
1 3 3 1
1 4 6 4 1
1 5 10 10 5 1
Tri angulo de Tartaglia
Enunciamos sin demostraci on el resultado principal sobre los n umeros com-
binatorios:
Teorema 1.33 (Binomio de Newton) Sea A un anillo, n N y a, b A.
Entonces
(a +b)
n
=
n

m=0
_
n
m

a
m
b
nm
.
Quiz a alg un lector objete que no hemos denido el signo

. Las sumas
nitas en un anillo A se denen recurrentemente. Consideremos una aplicaci on
a : I
n+1
A. Convenimos en representar a(i) = a
i
. Por comodidad, la
extendemos a una aplicaci on N A tomando a
i
= 0 para i > n. Entonces
denimos, en virtud del teorema de recursi on:
0

i=0
a
i
= a
0
,
r+1

i=0
a
i
=
r

i=0
a
i
+a
r+1
.
Es frecuente escribir
n

i=0
a
i
= a
0
+ +a
n
,
y entonces hemos de tener presente que los puntos suspensivos son s olo el signo
que hemos elegido para representar la suma nita, tan legtimo como pueda
serlo la letra . Todas las propiedades de las sumas nitas se demuestran
rutinariamente por inducci on. Igualmente pueden denirse productos nitos en
un anillo, que habitualmente se representan por
n

i=0
a
i
= a
0
a
n
.
Por ultimo mencionaremos un hecho de uso cotidiano sobre la aritmetica de
los n umeros naturales sobre el que no hemos dicho nada hasta ahora, y es la
posibilidad de expresarlos con la notaci on decimal.
30 Captulo 1. Preliminares conjuntistas
Si denimos
2 = 1 + 1, 3 = 2 + 1, 4 = 3 + 1, 5 = 4 + 1,
6 = 5 + 1, 7 = 6 + 1, 8 = 7 + 1, 9 = 8 + 1, d = 9 + 1,
entonces se demuestra que todo n umero natural no nulo N se expresa de forma
unica como
N = a
n
d
n
+a
n1
d
n1
+ +a
2
d
2
+a
1
d +a
0
,
donde n N, a
i
{0, . . . , 9}, a
n
6= 0.
Esto permite adoptar el convenio de referirnos a N como N = a
n
a
0
,
donde esto no hay que entenderlo como un producto, sino como la mera yuxta-
posici on de las cifras a
i
. Como el n umero d se expresa en la forma d = 1 d +0,
tenemos que d = 10, por lo que el desarrollo anterior puede escribirse, m as
claramente, como
N = a
n
(10)
n
+a
n1
(10)
n1
+ +a
2
(10)
2
+a
1
10 +a
0
,
La elecci on de d es arbitraria. Sirve cualquier n umero natural d 2.
1.4 La teora de conjuntos no estandar
La secci on precedente es un resumen de los resultados b asicos de lo que po-
demos llamar matem atica cl asica. Tal y como hemos visto, hemos partido de
dos conceptos fundamentales: la noci on de conjunto interno, y la de pertenencia
entre conjuntos internos. A partir de estas dos nociones hemos denido muchas
otras, como las de uni on, intersecci on, aplicaci on, anillo, etc. Todos los con-
ceptos que pueden denirse a partir de los dos conceptos b asicos de conjunto
interno y pertenencia son lo que hemos llamado conceptos internos. Todas
las armaciones y propiedades que hagan referencia unicamente a conceptos
internos, son lo que hemos llamado armaciones y propiedades internas.
Observemos que en ning un momento hemos denido que son los conjuntos
internos ni la pertenencia entre conjuntos internos. Para poder decir algo sobre
estos conceptos sin tenerlos denidos, nos hemos tenido que apoyar en unos axio-
mas, que son armaciones internas. Cuando hablamos de matem atica cl asica
nos referimos, m as concretamente, a todo el cuerpo de armaciones internas que
pueden deducirse a partir de estos axiomas.
5
En esta secci on vamos a extender la matem atica cl asica, no s olo a nadiendole
nuevos axiomas, sino tambien una nueva noci on fundamental que presentaremos
sin denici on, y que tendr a, pues, el mismo status l ogico que las nociones de
5
Aqu hay que ser m as precisos: nos referimos a los axiomas de la teora de conjuntos,
digamos ZFC.

Esta incluye unos pocos axiomas m as que nosotros no hemos tenido necesidad
de citar, como el axioma de reemplazo o el axioma de elecci on. Tambien consideraremos parte
de la matem atica cl asica cualquier resultado que se demuestre a partir de otros axiomas que
se a nadan a ZFC, como puede ser la hip otesis del continuo, siempre y cuando estos nuevos
axiomas sean armaciones internas, es decir, no contengan ning un concepto que no haya sido
denido previamente a partir de las meras nociones de conjunto interno y pertenencia.
1.4. La teora de conjuntos no est andar 31
conjunto interno y pertenencia. Las armaciones matem aticas que se dedu-
cen de esta versi on extendida de la matem atica cl asica (extendida con un nuevo
concepto b asico y con nuevos axiomas) formar an lo que llamaremos matem atica
no est andar o teora de conjuntos no est andar.
Al nuevo concepto b asico lo llamaremos ser est andar, de modo que a partir
de ahora distinguiremos entre dos clases de conjuntos internos: los conjuntos
internos est andar y los conjuntos internos no est andar. Tal y como hemos dicho,
no deniremos que es un conjunto interno est andar, igual que no hemos denido
que es un conjunto interno. Ser an los nuevos axiomas que vamos a incorporar a
la teora los que nos permitir an distinguir que conjuntos internos son est andar
y cu ales no, as como las diferencias que puedan darse entre unos y otros.
Para que el lector se forme una idea lo m as operativa posible del papel que
representar a este concepto en la nueva teora, conviene volver a la met afora
cinematogr aca. Podemos considerar que el equivalente cinematogr aco de no
est andar es efectos especiales. Por ejemplo, si en una pelcula un actor
besa a una actriz, el beso es est andar, porque se lo da realmente; pero si el
actor mata a la actriz, el asesinato es no est andar, porque est a simulado con
una pistola cticia y una sangre cticia. El beso es real internamente en la
pelcula y externamente, en la realidad externa, mientras que el asesinato es
real internamente en la pelcula y cticio en la realidad externa.
En la triloga (cinematogr aca) El se nor de los anillos, el personaje de Frodo
Bols on es est andar, porque lo interpreta un actor, mientras que Gollum es no
est andar, porque es una imagen creada por ordenador. Aqu es crucial entender
que internamente no hay diferencia entre est andar y no est andar. En la pelcula,
Frodo Bols on es un personaje real y Gollum es otro personaje igual de real. S olo
externamente podemos decir que Frodo existe y Gollum no.
Ahora bien, el lector no debe deducir de este ejemplo que estemos insinuando
que los conjuntos est andar van a ser conjuntos que existen en la realidad y que
los conjuntos no est andar van a ser conjuntos que no existen realmente. Pen-
semos que los efectos especiales no tienen por que ser fant asticos. Por ejemplo,
en una pelcula sobre Julio Cesar, la muerte de Cesar ser a no est andar, pero
eso no impide que, en la realidad, Julio Cesar muriera como se muestra en la
pelcula. El actor que interpreta a Cesar est a reproduciendo elmente, mediante
tecnicas no est andar, lo que le ocurri o realmente a Julio Cesar. Fijemonos en
que la realidad interna de la pelcula es el a la realidad hist orica, mientras que
la realidad externa no lo es, ya que Cesar muri o acuchillado, no ngi o morir
acuchillado con efectos especiales.
Dijimos al principio del captulo que no pretendemos persuadir al lector para
que adopte ninguna postura en concreto sobre si existen o no los objetos de los
que hablamos. S olo hay algo cuya realidad es indiscutible: y es que cuando
leemos un libro de matem aticas estamos viendo una pelcula que est a ah, con
sus personajes y sus tecnicas, y podemos preocuparnos por entender la realidad
interna que describe o no, sin que importe para nada la naturaleza los oca de
esa realidad interna. Sobre eso, cada cual es libre de pensar lo que quiera.
El lector que sea platonista (es decir, que crea que todos los conjuntos de los
32 Captulo 1. Preliminares conjuntistas
que vamos a hablar, est andar y no est andar, son reales) deber a pensar que aqu
le vamos a hablar de c omo rodar una pelcula sobre todos esos objetos reales pero
usando solamente una parte de ellos (los est andar) y usando efectos especiales
para simular los no est andar. Algo as como cuando se quiere presentar en el
cine un gran ejercito (real) y se usan s olo unos pocos actores para los primeros
planos, mientras que los otros miles se simulan por efectos especiales.
El lector que sea formalista (es decir, que crea que todo lo que estamos
contando es un argumento de cci on) deber a pensar que le estamos hablando
sobre una pelcula que trata sobre el rodaje de otra pelcula, de modo que,
dentro de la cci on que es la primera pelcula, tiene sentido hablar de lo que es
real en la segunda pelcula y lo que se consigue mediante efectos especiales.
Si un lector preere pensar que los conjuntos est andar existen y los no
est andar no, entonces s olo tiene que concebir a estos como efectos especiales
(como maquetas, im agenes por ordenador, sangre simulada, etc.)
La mera introducci on de la nueva noci on fundamental ser est andar ya da
pie a una denici on importante:
Denici on 1.34 Un concepto (o propiedad, o armaci on, construcci on, etc.)
es interno si s olo hace referencia a conceptos denidos a partir de las nociones de
conjunto interno y la pertenencia entre conjuntos internos, es decir, si en ning un
momento requiere distinguir entre conjuntos est andar y no est andar. En caso
contrario diremos que es externo.
As, por ejemplo, la armaci on 5 es un n umero natural es interna, mientras
que la armaci on 5 es un n umero est andar es externa.
Para entender esto adecuadamente podemos pensar en un matem atico
cl asico como un matem atico ideal que sabe y entiende todo lo que puede de-
mostrarse en la matem atica cl asica, pero que es incapaz de entender cualquier
armaci on que incluya la palabra est andar, es decir, cualquier armaci on ex-
terna. Cuando decimos que no puede entenderla no queremos decir que la tenga
por falsa, sino que para el no signica nada. En estos terminos, una armaci on
interna es una armaci on que entiende un matem atico cl asico.
Podemos comparar un matem atico cl asico con un espectador que ve una
pelcula y entiende perfectamente su argumento, pero no sabe nada de cine, no
sabe nada sobre c amaras y efectos especiales. Tal espectador puede entender
que Gollum es feo, que es esquizofrenico, que es muchas cosas, pero no puede
entender que sea un efecto especial. En la pelcula, internamente, Gollum no
es un efecto especial. Es un personaje tan real como cualquier otro. No es que
el espectador niegue que Gollum sea un efecto especial, sino que eso no tiene
signicado para el, no es ni verdadero ni falso. El espectador podr a discutir sobre
si Gollum es bueno o malo, pero nunca sobre si es real o virtual. Igualmente, el
matem atico cl asico podr a discutir si 5 es par o impar, pero nunca si es est andar
o no est andar.
Ya hemos explicado que la teora de conjuntos no est andar sale de a nadir
nuevos axiomas (y un nuevo concepto b asico) a la teora de conjuntos est andar,
lo cual tiene como consecuencia lo que podemos llamar principio de extensi on:
1.4. La teora de conjuntos no est andar 33
Principio de extensi on Todas las armaciones de la matem atica cl asica
siguen siendo v alidas igualmente en la matem atica no est andar, sin cambio
alguno.
Si un espectador ve una pelcula de romanos y luego se entera de que el
ejercito de miles de soldados se rod o con s olo cien, tiene una informaci on adi-
cional externa sobre la pelcula, pero eso no cambia su realidad interna. Si era
l ogico que Cesar ganara la batalla porque duplicaba en n umero a sus enemigos,
sera absurdo que el espectador, al enterarse del truco, se dijera: pues no es
creble que Cesar haya ganado si tenemos en cuenta que sus miles de soldados
eran s olo una apariencia. Si antes de enterarse del truco vea coherente que el
abrumador ejercito de Cesar venciera a su enemigo, despues ha de tener claro
que el saber que la escena ha sido rodada con efectos especiales no disminuye
un apice el podero militar (interno) de Cesar.
Del mismo modo, todas las precisiones que nos permitir a hacer la distinci on
entre conjuntos est andar y no est andar no pueden alterar en nada los resultados
de la matem atica cl asica, porque estamos aceptando todos sus axiomas y, por
consiguiente, todas sus consecuencias.
Si, en alg un momento, el lector cree que algo de lo que vamos a exponer
de aqu en adelante contradice a lo hemos dicho hasta la secci on anterior, o a
cualquier otro resultado de la matem atica cl asica que el conozca, puede estar
seguro de que no ha entendido bien lo que ha ledo aqu, y si llega el por
sus propios razonamientos a un resultado de tales caractersticas, puede estar
seguro de que, o bien no entiende adecuadamente lo que ha obtenido, o bien ha
razonado incorrectamente, de modo que en alg un paso de su razonamiento ha
utilizado algo que no se puede deducir legtimamente de los axiomas de la teora
de conjuntos no est andar.
La teora de conjuntos no est andar necesita tres axiomas adicionales. Veamos
el primero:
Principio de Transferencia Sean y
1
, . . . , y
n
conjuntos internos, y conside-
remos una propiedad interna P(x
1
, . . . , x
m
, y
1
, . . . , y
n
). Entonces:
a) Si todos los conjuntos est andar x
1
, . . . , x
m
cumplen
P(x
1
, . . . , x
m
, y
1
, . . . , y
n
),
podemos asegurar que todos los conjuntos internos (est andar o no) cum-
plen P.
b) Si existen conjuntos internos x
1
, . . . , x
n
que cumplen
P(x
1
, . . . , x
m
, y
1
, . . . , y
n
),
entonces existen conjuntos est andar x
1
, . . . , x
n
que cumplen P.
Como primera consecuencia de este principio, podemos probar que todos los
conjuntos denibles internamente son est andar.
34 Captulo 1. Preliminares conjuntistas
Tomemos, por ejemplo, el conjunto vaco. Sabemos que es un concepto
propio de la matem atica cl asica, que puede denirse sin la ayuda del predicado
ser est andar. As pues, la propiedad P(x) x = es interna. Como sabemos
que existe un conjunto interno x que cumple x = , el principio de transferencia
nos da que existe un conjunto est andar x que cumple x = . Esto signica que
es un conjunto est andar.
Si cambiamos x = por x = N concluimos que el conjunto N es est andar, si
partimos de x = 1 356 concluimos que el n umero natural 1 356 es est andar, etc.
M as a un, la propiedad x = y z tambien es interna. Por lo tanto, si jamos
dos conjuntos est andar y, z, puesto que existe un conjunto interno x que cumple
x = y z, el principio de transferencia nos da que existe un conjunto est andar
x que cumple x = y z. En otras palabras: la uni on de conjuntos est andar es
un conjunto est andar.
Si cambiamos x = y z por x = y z concluimos que la intersecci on
de conjuntos est andar es est andar; si tomamos x = {y, z} concluimos que el
conjunto formado por dos conjuntos est andar es est andar; si tomamos x = y z
concluimos que el producto cartesiano de dos conjuntos est andar es est andar; si
partimos de x = f(y) (que es una propiedad interna con tres variables, x, y, f)
concluimos que la imagen de un conjunto est andar por una funci on est andar es
un conjunto est andar, etc.
En resumen:
Todo conjunto interno que pueda denir explcitamente un matem atico
cl asico (como N, {3, 5, 7}, 2/7, , etc.) es est andar.
Todo conjunto interno construido a partir de conjuntos est andar mediante
un procedimiento que entienda un matem atico cl asico es est andar. (Por
ejemplo: la uni on de conjuntos est andar es est andar, la suma de n umeros
naturales est andar es est andar, el conjunto de todos los subconjuntos de
un conjunto est andar es est andar, el cubo de un n umero racional est andar
es est andar, etc.)
Si el lector quiere sentirse c omodo con la teora de conjuntos no est andar,
no le conviene interpretar esto como que los conjuntos est andar son los que ya
conoce, mientras que los conjuntos no est andar son conjuntos nuevos que no
existen en la matem atica cl asica. Es mucho m as conveniente que piense que la
diferencia entre la matem atica no est andar y la matem atica cl asica no es que
la primera introduzca nuevos conjuntos, los conjuntos no est andar, sino que los
conjuntos de la matem atica cl asica son los mismos que los de la matem atica no
est andar (los conjuntos internos, est andar y no est andar) y que lo novedoso de
la matem atica no est andar es la posibilidad de distinguir unos de otros.
Es verdad que, dado que no los distingue, la matem atica cl asica podra pres-
cindir de los conjuntos no est andar, en el mismo sentido que te oricamente
una pelcula de romanos podra prescindir de efectos especiales y rodar todo de
forma realista (reuniendo miles de hombres cuando se necesita un ejercito de
1.4. La teora de conjuntos no est andar 35
miles de hombres y matando de verdad a los actores cuando el gui on exige que
mueran). Pero no es menos cierto que, aunque podra prescindir de ellos, nada
impide suponer que los conjuntos no est andar siempre han estado ah, pasando
inadvertidos a los matem aticos cl asicos, igual que el car acter virtual de unos mi-
les de soldados puede pasar inadvertido a un espectador. La ventaja de pensarlo
as es que el lector asimilar a m as f acilmente el principio de extensi on y vacilar a
menos a la hora de aplicar en el contexto no est andar todos sus conocimientos
de matem atica cl asica.
Volviendo al principio de transferencia, ya hemos visto una aplicaci on de
su segunda parte. La primera es util para reducir razonamientos al caso de
conjuntos est andar. Por ejemplo, supongamos que tenemos que probar que un
conjunto est andar A est a contenido en otro conjunto est andar B. Esto supone
probar que, para todo conjunto x, se cumple que x A x B. Dado
que la propiedad entre comillas es interna, el principio de transferencia reduce
el problema a demostrar que si un conjunto est andar x est a en A, entonces
tambien est a en B. As pues:
Teorema 1.35 Sean A y B dos conjuntos est andar. Entonces:
a) A B si y s olo si todo elemento est andar de A est a tambien en B.
b) A = B si y s olo si A y B contienen los mismos elementos est andar.
Respecto al apartado b), observemos que como en la matem atica cl asica
dos conjuntos internos se consideran iguales cuando tienen los mismos elementos
(est andar o no). Lo que estamos diciendo (en virtud del principio de transfe-
rencia) es que si dos conjuntos est andar tienen los mismos elementos est andar,
entonces tambien tienen los mismos elementos no est andar.
Nos aparece aqu una idea a la que el lector deber a acostumbrarse cuanto
antes: los conjuntos no est andar son como par asitos, no son algo que pueda
meterse o sacarse de un conjunto interno a voluntad, sino que se pegan a los
conjuntos est andar y van donde vayan ellos.
El apartado b) puede parafrasearse diciendo que un conjunto est andar est a
completamente determinado por sus elementos est andar, de modo que los ele-
mentos est andar que tiene un conjunto determinan autom aticamente cu ales han
de ser sus elementos no est andar.
Ejercicio: Supongamos que x es un conjunto interno no est andar. Puede ser {x}
un conjunto est andar? (Ayuda: Llegar a una contradicci on probando que {x} = .)
Para terminar con el principio de transferencia se nalamos dos aspectos tecni-
cos que pueden llevar a conclusiones contradictorias si se pasan por alto:
Si la propiedad P a la que se aplica tiene par ametros, estos han de ser
conjuntos est andar.
La propiedad P ha de ser interna, es decir, ha de poder entenderla un
matem atico cl asico.
36 Captulo 1. Preliminares conjuntistas
Hasta ahora no hemos visto nada que garantice la existencia de conjuntos
no est andar. Esto es lo que arma el segundo principio de la teora no est andar,
al que llamaremos Principio de Idealizaci on. Vamos a dar una versi on debil
consistente en dos propiedades sobre conjuntos nitos. Ambas pueden deducirse
de un principio m as general, m as tecnico, que no vamos a necesitar.
6
La primera
es la siguiente:
Principio de Idealizaci on I Un conjunto interno es est andar y nito si y
s olo si todos sus elementos son est andar.
O, recprocamente: todos los conjuntos internos tienen elementos no est andar
excepto los que son est andar y nitos. En particular, existen, por ejemplo,
n umeros naturales no est andar.
Por coherencia enunciamos a continuaci on la segunda propiedad de ideali-
zaci on, aunque no la necesitaremos sino mucho m as adelante y en ocasiones muy
contadas, siempre relacionadas con la noci on topol ogica de compacidad.
Principio de Idealizaci on II Todo conjunto contiene un subconjunto nito
que contiene a todos sus elementos est andar.
No es este el mejor momento para discutir este principio. Quiz a el lector
quiera meditar sobre el despues de la discusi on del concepto de nitud que
expondremos en el captulo siguiente (en la p agina 44 y siguientes.) En lo
sucesivo, cuando hablemos del principio de idealizaci on, entenderemos que
nos referimos al Principio de Idealizaci on I, salvo que indiquemos lo contrario.

Este es un buen momento para mostrar un ejemplo de c omo podemos aca-


bar enredados en contradicciones si no asimilamos adecuadamente la teora de
conjuntos no est andar:
Paradoja 1.36 Seg un el teorema 1.10, todo subconjunto S N no vaco tiene
un mnimo elemento. Esto es valido en la matematica clasica y, por consiguiente,
tambien en la teora de conjuntos no estandar. Sin embargo, consideremos el con-
junto
S = {n N | n no es estandar}.
El principio de idealizaci on implica que S 6= , luego debera tener un mnimo
elemento. Sin embargo, si S, como 0 es un n umero estandar, ha de ser 6= 0,
luego existe 1 < . Ahora bien, 1 ha de ser un n umero no estandar, ya que
si fuera estandar, como la suma de n umeros estandar es estandar (por el principio
de transferencia) resultara que ( 1) +1 = tambien sera estandar, y no lo es.
As pues, 1 S, luego no es el mnimo de S. Hemos probado que S no tiene
elemento mnimo.
6
Sera necesario, por ejemplo, para estudiar espacios topol ogicos arbitrarios, pero nosotros
s olo vamos a tratar con R en un principio y con espacios metricos despues, y en estos contextos
nos basta con los dos casos particulares que consideramos aqu.
1.4. La teora de conjuntos no est andar 37
El error del razonamiento anterior es, en cierto sentido, de la misma natura-
leza que el error en el que incurre un matem atico cl asico que pretende aceptar
como conjunto al conjunto R de todos los conjuntos que no se pertenecen a
s mismos. (Vease la discusi on en la p agina 4.) Ya hemos explicado que R es
una clase propia, es decir, una colecci on de conjuntos internos que no puede
ser el rango de ning un conjunto interno, ya que, de suponerlo as, llegamos a
una contradicci on. Tendramos una autentica contradicci on si, por otra parte,
los axiomas de la teora de conjuntos permitieran probar la existencia de un
conjunto interno R = {x | x / x}, pero no es el caso, ya que esta denici on no
se ajusta a las condiciones del axioma de especicaci on, ni tampoco hay ning un
axioma especco (como el axioma del par, o el del conjunto de partes, etc.) que
demuestren la existencia de R.
Lo mismo sucede con el conjunto S. El error de la paradoja anterior est a
en suponer que existe un conjunto interno S que contiene a todos los n umeros
naturales no est andar, cuando ning un axioma permite demostrarlo. Observemos
que la denici on de S no respeta al axioma de especicaci on porque este es
un axioma de la matem atica cl asica, y, por consiguiente, s olo es v alido para
propiedades internas. (Y, obviamente, n no es est andar no es una propiedad
interna.)
As pues, la paradoja no es una paradoja, sino una demostraci on rigurosa
de que S no existe (como conjunto interno). No diremos que S es una clase
propia, pues reservaremos este nombre a las colecciones de conjuntos internos
que son denibles internamente, pero no constituyen la extensi on de ning un
conjunto interno. A las colecciones de conjuntos internos a las que les pasa esto
mismo, pero se denen externamente, las llamaremos conjuntos externos. M as
precisamente:
Denici on 1.37 Si A, x
1
, . . . , x
n
son conjuntos internos y P(x, x
1
, . . . , x
n
) es
una propiedad interna o externa, llamaremos conjunto determinado por estos
datos a
E = {x A | P(x, x
1
, . . . , x
n
)}.
Ahora es crucial tener presente que hay dos posibilidades para un conjunto
en este sentido amplio:
a) Que (a partir de los axiomas de la teora de conjuntos no est andar) pueda
demostrarse que existe un conjunto interno B tal que, para todo x A,
se cumple x B si y s olo si P(x, x
1
, . . . , x
n
).
En tal caso, lo que hemos llamado conjunto E no es ni m as ni menos que
el conjunto interno B.
b) Que (a partir de los axiomas de la teora de conjuntos no est andar) pueda
demostrarse que no existe ning un conjunto interno B tal que, para todo
x A, se cumple que x B si y s olo si P(x, x
1
, . . . , x
n
).
En tal caso diremos que E es un conjunto externo, lo cual ha de enten-
derse como una mera abreviatura que puede ser util en muchos contextos
38 Captulo 1. Preliminares conjuntistas
para expresar con lenguaje conjuntista algunos resultados de la teora de
conjuntos no est andar. Pero es fundamental tener presente en todo mo-
mento que E no es ninguno de los objetos que cumplen los axiomas de la
teora de conjuntos no est andar, por lo que tampoco podemos esperar que
cumpla los resultados conocidos sobre conjuntos. Cualquier contradicci on
a la que se llegue al tratar de aplicar a E un resultado de la teora de
conjuntos no est andar no es una paradoja, sino una prueba m as de que E
no existe, de que no es un conjunto interno.
7
Tenemos, pues, la siguiente clasicaci on de los conjuntos:
Conjuntos
_
_
_
Internos
_
Est andar
No Est andar
Externos (no existen)
Si al lector le parece articial que podamos hablar de n umeros naturales
no est andar, pero que sea ilegal hablar del conjunto de todos los n umeros
naturales no est andar, debera pensar en una pelcula de romanos, en la que
Julio Cesar puede dirigirse a sus soldados y decirles: Atenci on!, los veteranos
atacar an por la derecha, y los nuevos por la izquierda y, mientras es perfecta-
mente admisible que haya especicado de entre sus soldados el subconjunto de
los veteranos, como podra haber especicado a los galos, o a los n umidas, o a
los ociales, o a los jinetes, lo que sera del todo improcedente es que, en una
determinada escena de la pelcula, Cesar gritara a sus hombres: Atenci on!,
los soldados reales atacar an por la derecha, mientras que los que son efectos
especiales lo har an por la izquierda!. Es verdad que un espectador bien infor-
mado podr a distinguir entre el conjunto de soldados que son reales y los que son
efectos especiales. La distinci on tiene perfecto sentido y, cada gura de soldado
en la pantalla se clasica inequvocamente en uno u otro subconjunto, pero esta
distinci on es externa a la pelcula, es ajena a su realidad interna, y cualquier
menci on interna a esta distinci on derrumbara la l ogica interna de la pelcula,
exactamente igual al modo en que tratar de formar un subconjunto de N ape-
lando a una propiedad externa volvera contradictoria a la teora de conjuntos
no est andar.
Cuando decimos que S no existe internamente (aunque podemos tratar con
el externamente) estamos diciendo exactamente lo mismo que cuando decimos
que el conjunto de los soldados virtuales no existe internamente. Tratar de
aplicar a S un teorema de la teora de conjuntos (como el principio de buena
ordenaci on) es tan absurdo como valorar las probabilidades de victoria de Cesar
en funci on del cardinal del conjunto de sus soldados virtuales.
El lector tiene que empezar a plantearse la necesidad de asimilar que no
todos los conjuntos en que puede pensar coherentemente son internos, lo cual
7
En realidad podra darse un tercer caso: que los axiomas de la teora de conjuntos no
est andar no permitieran demostrar ni refutar la existencia de E como conjunto interno. Nunca
nos encontraremos con tal situaci on, pero, si se diera, lo asimilaramos al caso b): Todo con-
junto es externo (es decir, s olo estamos legitimados a referirnos el como una mera abreviatura)
mientras no se demuestre que es interno.
1.4. La teora de conjuntos no est andar 39
es importante porque a los conjuntos externos no se les puede aplicar los teore-
mas de la teora de conjuntos (cl asica o no est andar) porque no son conjuntos
internos, es decir, porque no son los objetos de los que habla cualquiera de las
dos teoras de conjuntos.
La teora de conjuntos no est andar resultar a natural al lector a partir del
momento en que este comprenda que la distinci on entre conjuntos internos y
externos, y el hecho de que los resultados que el conoce para conjuntos (internos)
no se aplican a los conjuntos externos, son tan naturales y obvios como que
Ner on tiene poder de vida o muerte sobre todos los que le rodean, pero que este
hecho sobradamente conocido no se aplica al tecnico de sonido que le disimula
el micr ofono bajo la t unica.
Una vez establecida la clasicaci on de los conjuntos, vamos a dar a nalmente
la palabra conjunto su uso habitual:
Nota Por comodidad, en lo sucesivo, cuando hablemos de conjuntos, enten-
deremos que nos referimos a conjuntos internos, y cuando queramos hablar de
conjuntos externos lo indicaremos explcitamente.
Observemos ahora que, cuando necesitemos explicitar que un conjunto es
interno, puede dar la sensaci on de que estamos usando hechos no demostrados,
como:
La intersecci on de conjuntos internos es un conjunto interno.
Aqu no hay nada que probar. S olo debemos recordar que los conjuntos
internos no son ni m as ni menos que lo que los matem aticos cl asicos llaman
simplemente conjuntos. Repitiendo lo que ya dijimos en su momento: la ar-
maci on anterior es consecuencia del axioma de especicaci on, seg un el cual,
dados dos conjuntos (internos, por supuesto) u, v existe el conjunto (interno,
por supuesto)
u v = {x u | x v}.
En estos terminos, la paradoja 1.36 y la discusi on posterior pueden reformu-
larse como el teorema siguiente:
Teorema 1.38 El conjunto {n N | n no es est andar} es externo.
Veamos alg un ejemplo m as de la utilidad de los conjuntos externos como
abreviaturas:
Denici on 1.39 Si A es un conjunto (interno), llamaremos

A = {x A | x es est andar}
Salvo en casos muy particulares,

A ser a un conjunto externo, lo que en
sentido estricto signica que no existe. Sin embargo, podemos escribir sin
riesgo de llegar a ning un absurdo que x

A, entendido como mera abreviatura


de x A y x es est andar, que es una propiedad con pleno sentido en la teora.
Tambien podemos escribir

A B para expresar que B contiene a todos los
elementos est andar de A, que tambien es una armaci on con pleno sentido en
la teora.
40 Captulo 1. Preliminares conjuntistas
Teorema 1.40 El conjunto

N es externo.
Demostraci on: Si fuera interno, tambien lo sera N\

N, que es el conjunto
de los n umeros naturales no est andar, que ya hemos visto que es externo en el
teorema 1.38.
Ejercicio: Explica por que podemos armar que

N N es verdadero, mientras que

N PN es falso.
Aunque ya hemos prevenido al lector sobre los usos fraudulentos del axioma
de especicaci on con propiedades externas, el tercer y ultimo axioma de la
teora no est andar nos permite denir conjuntos internos est andar, de hecho
usando propiedades externas, ahora bien, en unas condiciones que mantengan a
raya las contradicciones. La clave est a en permitir unicamente que las propieda-
des determinen cu ales son los conjuntos est andar que pertenecen al conjunto que
estamos deniendo, y dejar que a el se incorporen los par asitos no est andar
que deban rodear a tales elementos est andar de acuerdo con la teora.
Principio de estandarizaci on Sean x
1
, . . . , x
n
, A conjuntos (internos) arbi-
trarios con A est andar y sea P(x, x
1
, . . . , x
n
) una propiedad interna o externa.
Entonces existe un conjunto est andar X cuyos elementos est andar son los con-
juntos x A que cumplen P(x, x
1
, . . . , x
n
). Lo representaremos por
X =
S
{x A | P(x, x
1
, . . . , x
n
)}.
La S nos recuerda que X no contiene a todos los elementos de A que cumplen
la propiedad P, sino que sus elementos est andar son los elementos est andar de
A que cumplen la propiedad P, aunque no decimos nada sobre que elementos
no est andar contiene X (que ser an los que tengan que ser).
Observemos que el teorema 1.35 nos da que no puede haber m as que un
conjunto est andar cuyos elementos est andar sean los elementos est andar de A
que cumplen P, por lo que tiene sentido darle nombre, tal y como acabamos de
hacer.
Podemos pensar que el principio de estandarizaci on asocia un conjunto
est andar a cada conjunto externo (o interno no est andar). Por ejemplo,
S
{n N | n no es est andar} = ,
pues, por denici on, el miembro izquierdo es el unico conjunto est andar cuyos
elementos est andar son los n umeros naturales est andar que no son est andar.
Como no hay tales elementos, se trata del unico conjunto est andar que no tiene
elementos est andar. Obviamente, ha de ser el conjunto vaco.
Por el contrario:
S
{n N | n es est andar} = N,
ya que N es el unico conjunto est andar cuyos elementos est andar son los n umeros
naturales est andar.
1.4. La teora de conjuntos no est andar 41
Con esto tenemos ya todo lo necesario para desenvolvernos sin contradiccio-
nes en la teora de conjuntos no est andar. Terminamos la secci on enunciando
sin demostraci on un resultado muy profundo:
Principio de conservaci on Todo resultado interno que pueda demostrarse
en la teora de conjuntos no est andar, puede demostrarse tambien en la teora
de conjuntos est andar.
En la teora de conjuntos no est andar se pueden demostrar teoremas nue-
vos que no pueden probarse en la teora cl asica de conjuntos, como, por
ejemplo, 5 es un n umero natural est andar. Es evidente que un matem atico
cl asico nunca podr a demostrar esto, porque el nunca utilizar a la propiedad ser
est andar. Lo que dice el principio de conservaci on es que esta es la unica
excepci on, que si demostramos una armaci on interna, como, por ejemplo, el
teorema de Bolzano, aunque en la demostraci on usemos conjuntos no est andar
(por ejemplo, n umeros reales innitesimales), podemos tener la seguridad de
que podramos haber llegado al mismo resultado sin hablar en ning un momento
de conjuntos no est andar (es decir, mediante una demostraci on cl asica).
M as claramente: si en el seno de la teora de conjuntos no est andar demos-
tramos un resultado que un matem atico cl asico pueda entender, aunque no sea
capaz de entender la prueba, podemos estar seguros de que existe otra prueba
que s que es capaz de entender. La teora de conjuntos no est andar es una
herramienta que permite simplicar muchas pruebas, pero no permite probar
nada nuevo que no se pueda probar sin ella (salvo el caso obvio de los teoremas
que hablen de conjuntos est andar y no est andar, que no tienen sentido en la
matem atica cl asica).
Aceptar las tecnicas de la teora de conjuntos no est andar supone aceptar
nuevos metodos, nuevas tecnicas de demostraci on, pero en ning un caso nuevos
resultados matem aticos cl asicos (internos).
En particular, si en el seno de la teora de conjuntos no est andar pudiera
probarse una contradicci on, a partir de ella podra probarse cualquier otra con-
tradicci on, por ejemplo, 0 6= 0, que es una armaci on interna, luego el principio
de conservaci on nos dice que tambien podramos demostrar 0 6= 0 en el seno
de la teora de conjuntos cl asica. Esto quiere decir que la teora de conjuntos
no est andar no puede ser contradictoria salvo que tambien lo sea la teora de
conjuntos cl asica.
As pues, si un lector empieza a estudiar la teora de conjuntos no est andar
y la abandona por in util pensando que ha encontrado en ella una contradicci on,
puede estar seguro que el problema est a en el y no en la teora.
Captulo II
Los n umeros reales
Dedicamos este captulo a construir los n umeros reales, lo cual nos servir a
a su vez para familiarizarnos con las tecnicas del an alisis no est andar. Previa-
mente tendremos que estudiar desde un punto de vista no est andar los n umeros
naturales y los n umeros racionales.
2.1 Los n umeros naturales
En el captulo anterior hemos construido el conjunto N de los n umeros na-
turales. Muchos matem aticos cl asicos creen que su denici on garantiza que N
est a formado por los n umeros 0, 1, 2, 3, . . . , donde los puntos suspensivos re-
presentan todos los n umeros que pueden obtenerse a partir del 0 en un n umero
nito de pasos.
Ahora bien, el principio de idealizaci on, sin contradecir en nada a lo que los
matem aticos cl asicos demuestran cosa distinta es lo que creen saber garan-
tiza la existencia de n umeros naturales no est andar, mientras que el principio
de transferencia garantiza que todos los n umeros 0, 1, 2, 3, . . . , son est andar.
D onde quedan, pues, los n umeros no est andar?
Para responder a esta pregunta observamos en primer lugar que, si m es un
n umero natural est andar, entonces el conjunto
I
m
= {n N | n < m}
es est andar. Esto es consecuencia del principio de transferencia: cualquier con-
junto denible internamente (es decir, sin distinguir entre conjuntos est andar y
no est andar) a partir de conjuntos est andar (en este caso, a partir de N y m) es
est andar.
As pues, I
m
es est andar y nito, luego el principio de idealizaci on nos dice
que todos sus elementos (todos los n umeros n < m) son est andar. Con esto
hemos probado que cualquier n umero natural no est andar ha de ser mayor que
cualquier n umero natural est andar.
En vista de este hecho, conviene dar la denici on siguiente:
43
44 Captulo 2. Los n umeros reales
Denici on 2.1 Llamaremos n umeros naturales innitos a los n umeros natura-
les no est andar, mientras que a los n umeros naturales est andar los llamaremos
n umeros naturales nitos.
En estos terminos, lo que acabamos de probar puede enunciarse de varias
formas equivalentes:
Teorema 2.2 Sean m, n N dos n umeros naturales:
a) Si n es nito y m < n, entonces m es nito.
b) Si m es innito y m < n entonces n es innito.
c) Si m es nito y n es innito, entonces m < n.
As pues, en la ordenaci on usual de los n umeros naturales, los n umeros no
est andar (o innitos) se sit uan despues de todos los n umeros est andar (o nitos).
Si, por ejemplo, n es un n umero innito, tenemos que
0 < 1 < 2 < 3 < < n 2 < n 1 < n < n + 1 < n + 2 < < 2n <
Quede claro que los n umeros innitos que hemos representado en la sucesi on
anterior no pretenden ser una muestra representativa de la totalidad de los
n umeros innitos. Por ejemplo, si n es un n umero par, el n umero n/2 tambien
sera innito (porque, por transferencia, el producto de n umeros naturales -
nitos es nito) y en la lista anterior vendra despues de los primeros puntos
suspensivos, y a unos puntos suspensivos de distancia de n 2.
Lo dicho hasta aqu debera bastar para que al lector se le ocurran unas
cuantas razones por las que todo esto es imposible. Veamos una de las m as
sencillas:
Paradoja 2.3 La matematica clasica nos ense na que si n es un n umero natural, el
conjunto I
n
ha de ser nito, luego esto tendra que ser valido tanto para los n umeros
estandar como para los no estandar. As pues, tenemos una contradicci on, ya que
si n es un n umero innito entonces I
n
es innito, puesto que contiene innitos
n umeros naturales:
{0, 1, 2, 3, . . .} I
n
.
El error de la paradoja anterior est a justo al nal. Como muy bien se argu-
menta al principio, el conjunto I
n
debe ser (y es) nito, tanto si n es est andar
como si es no est andar. En cualquiera de los dos casos, el conjunto I
n
es nito
porque tiene n elementos. Un conjunto cuyos elementos se pueden contar con
un n umero natural es nito, y este es el caso de I
n
. La prueba de que I
n
es
innito es incorrecta.
Es verdad que I
n
contiene al n umero 0, y es verdad que contiene al n umero 1,
y es verdad que contiene al n umero 2, y es verdad que contiene al n umero 3, y
es verdad que podemos seguir as hasta donde el lector desee, pero d onde est a
2.1. Los n umeros naturales 45
la prueba de que contiene a innitos n umeros naturales? Si la prueba consiste
en que I
n
contiene al conjunto

N = {0, 1, 2, 3, . . .} I
n
,
esto no tiene sentido, porque el conjunto

N no existe (es externo). Ya hemos
demostrado que no existe en el captulo anterior, pero no hace falta recurrir a
ello. La paradoja 2.3, no es una paradoja, sino otra demostraci on de que

N no
existe.
Externamente, es cierto que

N existe y es un conjunto innito, lo que prueba
que I
n
es tambien (externamente) innito. Sin embargo, I
n
es internamente
nito (mientras que, internamente,

N, no es ni nito ni innito, porque inter-
namente no existe). Los efectos especiales de nuestra pelcula permiten que
un conjunto muy grande, como I
n
, parezca en la pantalla mucho m as peque no
de lo que realmente es.
Pensemos, por ejemplo, en una pelcula en la que vemos una gigantesca nave
espacial surcando el espacio. Que sucedera si, en un momento dado, se viera
en la pantalla una mano humana que la sujeta? Evidentemente, que se vera
que la nave espacial ni es gigantesca, ni es una nave espacial, ni surca el espacio.
Quedara claro que se trata de una maqueta sostenida por una mano humana
ante una foto del espacio estrellado, en contradicci on con el argumento de la
pelcula, que exige que la nave sea gigantesca y surque el espacio.
El conjunto

N es como la mano que sostiene la maqueta. Ha de estar ah,
pero no ha de verse en la pantalla. En la realidad interna de la pelcula, la ma-
queta existe, y no es una maqueta, es una nave espacial gigantesca, mientras que
la mano que la sostiene no existe (luego no es ni grande ni peque na). Del mismo
modo que, ocultando toda referencia que pueda permitir al espectador calcular
el tama no real de la maqueta, es posible hacer que esta pase por una nave gi-
gantesca, nos encontramos con que, ocultando conjuntos como

N y todos los
conjuntos (externos) que haga falta ocultar, podemos hacer que un matem atico
cl asico (que no sepa distinguir los conjuntos est andar de los no est andar) crea
que I
n
es un conjunto peque no (nito), pese a que externamente es gigantesco
(es innito).
Pretender que considerar nito a I
n
es contradictorio por el mero hecho de
que contiene a

N, es tan absurdo como considerar que una pelcula de ciencia-
cci on es contradictoria porque est a rodada con maquetas. A lo sumo ser a
fant astica (o tal vez no, ya que tal vez, en una galaxia muy lejana, hace mucho
tiempo, existieron naves espaciales gigantescas), pero eso no tiene nada que ver
con que sea contradictoria.
De acuerdo con la discusi on precedente, el lector deber a asimilar que los
n umeros naturales innitos son s olo externamente innitos, aunque interna-
mente son (por denici on) nitos. As, si un conjunto (interno) A tiene n ele-
mentos y n es un n umero natural innito, podemos armar que el conjunto A
es nito, y si, por ejemplo, A N, podemos asegurar que A tendr a un m aximo
y un mnimo elemento, como corresponde a todo subconjunto nito de N.
Quiz a ayude tambien al lector pensar que los n umeros naturales innitos,
46 Captulo 2. Los n umeros reales
m as que innitos, son genericos o indeterminados. Son n umeros tan generales,
tan generales, que no coinciden con ning un n umero particular. Es algo similar
a lo que sucede con la igualdad
(x + 1)
2
= x
2
+ 2x + 1.
Podemos pensar que, en ella, x representa a un n umero arbitrario, sin espe-
cicar cu al, pero tambien podemos concebirla como una igualdad de polinomios.
En tal caso, x ya no es un n umero, es otra cosa, es un polinomio concreto, el
polinomio x, de grado 1, distinto de cualquier n umero (que sera un polino-
mio de grado 0), pero que est a dise nado para comportarse como un n umero
indeterminado.
Igualmente, cuando un matem atico cl asico dice Sea n un n umero natural,
est a pensando en n de acuerdo con la primera interpretaci on que le hemos dado
a la x, mientras que un n umero natural innito viene a ser como un n umero
natural generico, que es distinto de cualquier n umero concreto en el mismo
sentido en que la indeterminada x es distinta de cualquier n umero concreto por
el que pueda sustituirse.
Dejamos como ejercicio al lector que resuelva la paradoja siguiente:
Paradoja 2.4 Vamos a probar que todos los n umeros naturales son estandar.
Razonamos por inducci on: sabemos que 0 es estandar, y sabemos que la suma de
n umeros estandar es estandar, luego si n N es estandar, tambien lo es n + 1
(porque 1 es estandar). As pues, todos los n umeros naturales son estandar.
Notemos que los hechos: 0 es est andar, 1 es est andar, as como que la suma
de n umeros est andar es est andar, los hemos demostrado anteriormente, y todos
ellos son incuestionables.
Nota Si m es un n umero natural innito, tenemos que I
m
N es un conjunto
nito que contiene a todos los n umeros naturales est andar. Se trata de un caso
particular del Principio de Idealizaci on II (que hemos demostrado a partir del
Principio de Idealizaci on I). El lector puede probar (naturalmente, sin usar el
Principio de Idealizaci on II) que Q contiene tambien un subconjunto nito que
contiene a todos los n umeros racionales est andar. As, lo que arma el Principio
de Idealizaci on II es que esto es una caracterstica de todos los conjuntos, y no
s olo de N o de Q.
Ya sabemos que la suma de n umeros nitos es nita. De acuerdo con 2.2, y
teniendo en cuenta la desigualdad m m+n, satisfecha por cualquier suma de
n umeros naturales, es f acil probar algo m as:
Teorema 2.5 La suma de dos n umeros naturales es nita si y s olo si los dos
sumandos son nitos.
(Ya que si m es innito, la suma es tambien innita por ser mayor.)
Ejercicio: Es cierto el teorema anterior si cambiamos suma por resta (y consideramos
pares de n umeros que se puedan restar)?
Similarmente se puede probar:
2.2. Cuerpos ordenados 47
Teorema 2.6 El producto de dos n umeros naturales no nulos es nito si y s olo
si los dos factores son nitos.
Ejercicio: Sea n = p
1
p
m
la descomposici on de un n umero natural en factores
primos. Si n es innito, ha de ser innito alguno de los factores? (Ayuda: considerese
el caso en el que todos los primos sean iguales.)
2.2 Cuerpos ordenados
En esta secci on estudiaremos las propiedades externas del conjunto de los
n umeros racionales, si bien trabajaremos, m as en general, en terminos de un
cuerpo ordenado arbitrario (K, +, , ). La raz on para ello es que as, cuando
hayamos construido el cuerpo de los n umeros reales, ser a evidente que todo lo
dicho en esta secci on valdr a tambien para R.
Aunque ya hemos denido el concepto en el captulo anterior, recordamos
aqu todas las propiedades que le estamos exigiendo a (K, +, , ). En primer
lugar las propiedades de los cuerpos:
Asociativa (r +s) +t = r + (s +t), (rs)t = r(st).
Conmutativa r +s = s +r, rs = sr.
Elemento neutro r + 0 = r, s 1 = s.
Elemento simetrico r + (r) = 0, s (s
1
) = 1 (para s 6= 0).
Distributiva r(s +t) = rs +rt.
En segundo lugar las propiedades de los conjuntos (totalmente) ordenados:
Reexiva r r.
Antisimetrica Si r s y s r, entonces r = s.
Transitiva Si r s y s t, entonces r t.
De conexi on O bien r s, o bien s r.
Y en tercer lugar las propiedades de compatibilidad:
Compatibilidad con la suma Si r s, entonces r +t s +t.
Compatibilidad con el producto Si r s y t 0, entonces tr ts.
Sabemos que (Q, +, , ) cumple todas estas propiedades, a partir de las cua-
les pueden demostrarse (para un cuerpo ordenado arbitrario) todos los hechos
algebraicos elementales con los que el lector debera estar familiarizado, como
que rs = 0 si y s olo si r = 0 o s = 0, o las propiedades siguientes, relativas a la
relaci on de orden:
48 Captulo 2. Los n umeros reales
Si r s, entonces s r.
r
2
0.
1 0.
Si 0 < r s, entonces 0 < 1/s 1/r. (

Esta no estaba probada en


el captulo anterior, porque no tiene sentido para anillos ordenados, sino
para cuerpos: Si fuera 1/s 0, multiplicando por s > 0 resultara 1 0,
luego 0 < 1/s. Igualmente, 1/r > 0, lo que nos permite pasar de r s a
r/s 1 y a 1/s 1/r, multiplicando primero por 1/s y luego por 1/r.)
Denici on 2.7 Si K es un cuerpo ordenado, denimos el valor absoluto como
la aplicaci on | | : K K dada por
|r| =

r si r 0,
r si r 0.
Ejercicio: Demostrar que en un cuerpo ordenado K se cumple |r| s si y s olo si
s r s.
Ejercicio: Demostrar que en un cuerpo ordenado K se cumple
|r +s| |r| + |s|, |rs| = |r||s|, ||r| |s|| |r s|.
En lo sucesivo nos restringiremos a cuerpos ordenados que tengan una pro-
piedad adicional:
Denici on 2.8 Un cuerpo ordenado (K, +, , ) es arquimediano si Q K y,
para todo r K, existe un n N tal que r n.
Con la inclusi on Q K hemos de entender que, al restringir a Q las opera-
ciones y el orden de K, obtenemos las operaciones y el orden usuales de Q.
Teorema 2.9 Si K es un cuerpo ordenado arquimediano y r K, existe un
unico n umero entero n Z tal que n r < n + 1.
Demostraci on: si 0 r, entonces el conjunto A = {n N | n r} es
no vaco (contiene al 0) y es nito, ya que existe un n umero natural m > r,
luego A I
m
= {n N | n < m}, y este conjunto es nito. Todo subconjunto
nito de N no vaco tiene un m aximo elemento n, que claramente cumplir a
n r < n + 1.
Si r < 0 entonces r 0, luego existe un n umero natural m r < m+1,
luego m 1 < r m. Si r < m, llamamos n = m 1 Z y se
cumple n r < n + 1. Si r = m entonces llamamos n = m y tenemos que
n r < n + 1. La unicidad de n se prueba sin dicultad.
Denici on 2.10 Si K es un cuerpo ordenado arquimediano, denimos la parte
entera como la aplicaci on E : K Z que a cada r K le asigna el unico
n umero entero E[r] que cumple E[r] r < E[r] + 1.
2.2. Cuerpos ordenados 49
Observemos que todos los conceptos que hemos tratado hasta aqu en esta
secci on son internos, pues hasta ahora no hemos mencionado nunca la palabra
est andar.
En lo sucesivo, (K, +, , ) ser a en todo momento un cuerpo ordenado arqui-
mediano est andar arbitrario. El lector puede, si lo desea, pensar que es Q, pero
es importante observar que en ning un momento vamos a usar ninguna propiedad
particular de Q, sino unicamente las propiedades comunes a todos los cuerpos
ordenados arquimedianos. Dado que s olo pretendemos aplicar los resultados que
veremos aqu a los casos K = Q y, m as adelante, K = R, llamaremos n umeros
a los elementos de K.
Denici on 2.11 Diremos que un n umero r K es nito si existe un n umero
natural nito n tal que |r| n. En caso contrario diremos que es innito.
Llamaremos O al conjunto de los n umeros nitos.
Teorema 2.12 El conjunto O es externo.
Demostraci on: Si fuera interno, tambien lo sera el conjunto ON =

N,
y ya sabemos que

N es externo.
El teorema siguiente muestra que un n umero innito es mayor que todos los
n umeros de K si es positivo, y menor que todos ellos si es negativo.
Teorema 2.13 Si r es un n umero innito, entonces |r| es mayor que todos los
n umeros nitos.
Demostraci on: Si r es innito y s es nito, entonces existe un n umero
natural nito n tal que |s| n. No puede ser |r| n, ya que entonces r sera
nito, luego s |s| n < |r|.
Teorema 2.14 Todo n umero est andar es nito.
Demostraci on: Si r es est andar, entonces n = E[|r|] + 1 es un n umero
natural est andar, luego nito, y se cumple que r |r| < n, luego r es nito por
el teorema anterior.
Teorema 2.15 La suma y el producto de n umeros nitos es nita.
Demostraci on: Si r y s son nitos, existen n umeros naturales nitos m y
n tales que |r| m y |s| n. Entonces
|r +s| |r| + |s| m+n |rs| = |r||s| mn.
Como m+n y mn son nitos, r +s y rs tambien lo son.
Ejercicio: Probar que r es innito si y s olo si existe un n umero natural innito tal
que |r| n. (Ayuda: considerar E[|r|].)
50 Captulo 2. Los n umeros reales
Denici on 2.16 Un n umero r 6= 0 es innitesimal (o un innitesimo) si 1/r es
innito. Aunque sera m as acorde con la tradici on considerar que un innitesimo
es, por denici on, distinto de 0, vamos a adoptar el convenio (m as pr actico)
de incluir al 0 entre los innitesimos. Llamaremos o al conjunto de todos los
n umeros innitesimales.
Teorema 2.17 El conjunto o es externo.
Demostraci on: Si fuera interno, tambien sera interno
1
el conjunto
{n N | n 6= 0, 1/n o},
pero este conjunto es el conjunto de los n umeros naturales innitos, que ya
sabemos que es externo.
Teorema 2.18 El unico innitesimo est andar es el 0.
Demostraci on: Si r o es no nulo, entonces 1/r es innito, luego es no
est andar, luego r tambien es no est andar.
Teorema 2.19 Se cumplen las propiedades siguientes:
a) Si r o y s > 0 es est andar, entonces |r| < s.
b) o O.
c) Si s o y |r| |s|, entonces r o.
d) Si r o y s O, entonces rs o.
e) Si r, s o, entonces r +s o.
Demostraci on: a) Si r o es no nulo, entonces 1/r es innito, luego existe
un n umero natural innito n 1/|r|. Como s es est andar, tambien lo es 1/s,
luego es nito, luego existe un n umero natural nito m tal que
1/s m < n 1/|r|,
luego |r| < s.
b) Si r o, entonces, por el apartado anterior |r| < 1, luego r O.
c) Podemos suponer que r 6= 0. Entonces 1/|s| 1/|r| y 1/|s| es innito,
luego 1/|r| tambien lo es, luego s o.
d) Podemos suponer que r 6= 0. Si 1/rs fuera nito, tambien lo sera su
producto por s, es decir, 1/r sera nito, pero es innito.
1
Estamos usando que si existe un conjunto A K, tambien existe el conjunto
{n N | n 6= 0, 1/n A},
consecuencia del axioma de especicaci on (aplicado legtimamente con una propiedad interna).
2.2. Cuerpos ordenados 51
e) No perdemos generalidad si suponemos que |r| |s|. Tenemos que
|r +s| |r| + |s| 2|s|,
y 2|s| es innitesimal por el apartado anterior, luego r +s tambien lo es, por c).
En terminos algebraicos, hemos probado que O es un subanillo de K y que
o es un ideal de O.
Ejercicio: Probar que el apartado d) del teorema anterior es falso si cambiamos s O
por s K.
Destacamos el teorema siguiente porque se presta a un equvoco sobre el que
el lector deber a reexionar:
Teorema 2.20 Si h o y n N, entonces h
n
o.
Demostraci on: El lector podra creer que esto es una consecuencia inme-
diata del apartado d) del teorema anterior, pero sera as si pudieramos argu-
mentar por inducci on sobre n. Ahora bien, es muy importante tener presente
que es incorrecto razonar por inducci on para demostrar una propiedad externa.
La paradoja 2.4 es una muestra de ello. Aunque en este caso llegaramos a
una conclusi on correcta, ello sera fruto de la casualidad, y no de la validez del
argumento.
Una forma correcta de probar el teorema es demostrar que si |x| < 1, enton-
ces |x
n
| < |x|. Esto es una armaci on interna que es legtimamente demostrable
por inducci on sobre n a partir de las propiedades de los cuerpos ordenados (y
la prueba es trivial). Como es v alida para todo n umero x, podemos aplicarla al
innitesimo h, de donde deducimos que |h
n
| < |h|, luego h
n
o.
Denici on 2.21 Diremos que dos n umeros est an innitamente pr oximos, y lo
representaremos por r s, si r s o.
En estos terminos, un n umero r es innitesimal si y s olo si r 0.
Ejercicio: Demostrar que la relaci on que acabamos de denir es de equivalencia, es
decir, que es reexiva, simetrica y transitiva.
El ejercicio anterior al igual que el teorema siguiente es inmediato si
advertimos que la proximidad innita no es sino la relaci on de congruencia
m odulo el ideal o. No obstante, demostraremos el teorema para que el lector
aprecie el razonamiento directo con innitesimos.
Teorema 2.22 Se cumplen las propiedades siguientes:
a) Si r s y r
0
s
0
, entonces r +r
0
s +s
0
.
b) Si r s, r
0
s
0
y todos ellos son nitos, entonces rr
0
ss
0
.
c) Si r r
0
no son innitesimales, entonces 1/r 1/r
0
.
d) Si r s, r
0
s
0
, r < r
0
y r 6 r
0
, entonces s < s
0
.
52 Captulo 2. Los n umeros reales
Demostraci on: a) Tenemos que r = s +, r
0
= s
0
+
0
, donde ,
0
o. Por
lo tanto, r +r
0
= s +s
0
+ +
0
y +
0
o, luego r +r
0
s +s
0
.
b) Con la misma notaci on del apartado anterior, ahora tenemos que
rr
0
= ss
0
+s
0
+s
0
+
0
,
y, por la hip otesis de nitud, los tres ultimos sumandos son innitesimales. Por
lo tanto, rr
0
ss
0
.
c) Tenemos que
1
r

1
r
0
=
r
0
r
rr
0
.
Por hip otesis, r
0
r o y 1/r, 1/r
0
O, luego el producto de los tres est a
en o.
d) Si fuera r
0
s, entonces, de r < r
0
s se sigue que |r
0
r| < s r o,
luego r r
0
, contradicci on. Por lo tanto, s < r
0
. Si fuera s
0
s, entonces
s
0
s < r
0
implicara que |r
0
s| < r
0
s
0
o, luego r
0
s r, contradicci on.
As pues, s < s
0
.
Nuevamente, hemos de ser cautos con las generalizaciones del teorema an-
terior que un matem atico cl asico considerara obvias pero que en realidad se
apoyan en un razonamiento inductivo elemental, razonamiento que en el con-
texto de la matem atica no est andar es inv alido por el mero hecho de que las
inducciones sobre propiedades externas no son v alidas.
Por ejemplo, no es cierto que si x y son dos n umeros nitos y n N, enton-
ces x
n
y
n
, aunque esto pueda parecer una consecuencia obvia del apartado
b) del teorema anterior.
2
Lo m aximo que podemos decir es lo siguiente:
3
Teorema 2.23 Si x y son dos n umeros nitos y n N es nito, entonces se
cumple x
n
y
n
.
Demostraci on: Sea h = x y 0, de modo que
y
n
= (x +h)
n
= x
n
+h
n1

i=0
_
n
i

x
ni
h
i1
.
Basta probar que el sumatorio es nito, pero esto es obvio, pues

n1

i=0
_
n
i

x
ni
h
i1

n1

i=0
_
n
i

m
ni
,
donde m > |x| es un n umero natural nito, y la ultima expresi on es est andar,
luego nita.
2
Por ejemplo, si n es un n umero natural innito, podemos tomar x = 1, y = 1 +1/n. As,
x y, pero y
n
= (1 + 1/n)
n
e 6 1 = x
n
. (Vease la p agina 107)
3
M as adelante quedar a claro que este teorema es una consecuencia inmediata de la conti-
nuidad de la funci on x
n
.
2.3. Convergencia de sucesiones 53
Teorema 2.24 Si r y s son n umeros est andar y r s, entonces r = s.
Demostraci on: Si fuera r 6= s, entonces 1/(r s) sera innito y est andar
al mismo tiempo, lo cual es imposible.
Observemos que, al contrario de lo que sucede con los n umeros naturales,
un n umero nito (un elemento de K) no tiene por que ser est andar. Los in-
nitesimos no nulos son ejemplos de n umeros nitos no est andar. M as en general:
Denici on 2.25 Si x K, llamaremos halo de x al conjunto
h(x) = {r K | r x}.
Teorema 2.26 Si x K el halo h(x) es un conjunto externo.
Demostraci on: Si fuera interno, tambien lo sera
o = {r K | r x h(x)}.
La ultima propiedad del teorema 2.22 arma que los halos est an ordenados,
en el sentido de que, si dos halos son distintos (y, por consiguiente, disjuntos),
entonces todos los elementos de uno son menores que todos los elementos del
otro.
Ejercicio: Probar que si r

K, entonces h(r)

K = {r}.
2.3 Convergencia de sucesiones
Para construir el conjunto de los n umeros reales necesitaremos algunos he-
chos sobre la convergencia de sucesiones de n umeros racionales. Aqu los estu-
diaremos en el contexto general de un cuerpo ordenado arquimediano para que
despues no tengamos la necesidad de demostrarlos nuevamente al estudiar las
sucesiones de n umeros reales.
Como en la secci on anterior, llamaremos n umeros a los elementos de un
cuerpo ordenado arquimediano est andar K prejado.
Denici on 2.27 Una sucesi on en K es una aplicaci on
x : N K.
Si n N, habitualmente escribiremos x
n
en lugar de x(n), y escribiremos
{x
n
}
n0
en lugar de x para referirnos a la sucesi on.
Aunque, en teora, a veces es importante que todas las sucesiones empiecen
en el mismo n umero (en 0, seg un la denici on que hemos dado), en la pr actica
54 Captulo 2. Los n umeros reales
no suele haber inconveniente en que empecemos a numerar los terminos de una
sucesi on donde resulte m as oportuno. Por ejemplo, la sucesi on
{1/n}
n1
= {1,
1
2
,
1
3
,
1
4
, . . . }
empieza con el termino x
1
, aunque, si es necesario, podemos renumerarla como
{1/(n + 1)}
n0
. Similarmente, la sucesi on

n + 1
n(n 1)
_
n2
=

3
2
,
4
6
,
5
12
, . . .
_
empieza en n = 2, salvo que la renumeremos adecuadamente.
Denici on 2.28 Llamaremos K
N
al conjunto de todas las sucesiones en K. En
este conjunto podemos denir, termino a termino, una suma y un producto:
{x
n
}
n0
+ {y
n
}
n0
= {x
n
+y
n
}
n0
, {x
n
}
n0
{y
n
}
n0
= {x
n
y
n
}
n0
Es inmediato comprobar que K
N
tiene estructura de anillo con estas opera-
ciones. Los elementos neutros para la suma y el producto son, respectivamente,
las sucesiones constantes
0 = {0}
n0
= {0, 0, 0, . . . , }, 1 = {1}
n0
= {1, 1, 1, . . . , },
el elemento simetrico para la suma es {x
n
}
n0
= {x
n
}
n0
, y las sucesiones
que tienen inversa son las que tienen todos sus terminos no nulos, en cuyo caso
{x
n
}
1
n0
= {x
1
n
}
n0
.
Ejercicio: Cumple K
N
la propiedad de que si {x
n
}
n0
{y
n
}
n0
= 0 entonces uno de
los factores es igual a 0?
Denici on 2.29 Diremos que una sucesi on est andar {x
n
}
n0
K
N
converge
o tiende a un n umero est andar r si, para todo n umero natural innito n, se
cumple que x
n
r.
Llegados a este punto tenemos que hacer unas observaciones tecnicas muy
importantes que valdr an igualmente para todas las deniciones similares que
veremos m as adelante. El lector podra pensar que faltara denir la convergen-
cia de sucesiones no est andar, pero no es as. La denici on anterior determina
la convergencia de cualquier sucesi on, est andar o no, a pesar de que no es apli-
cable literalmente a sucesiones no est andar. Veamos c omo (e insistimos en que
el argumento siguiente es una tecnica de denici on totalmente general):
Digamos que una sucesi on x K
N
(est andar o no) converge

a un n umero
r K (est andar o no) si cumple la denici on anterior (eliminando, obviamente,
el requisito de que la sucesi on y el n umero sean est andar). De este modo,
P(x, r) x converge

a r es una propiedad externa. Denimos


C =
S
{(x, r) K
N
K | x converge

a r}.
2.3. Convergencia de sucesiones 55
Ahora, si x K
N
es una sucesi on arbitraria y r K es arbitrario, diremos
que x converge a r si (x, r) C.
De este modo, si x K
N
es una sucesi on est andar y r K es un n umero
est andar y x converge a r seg un la denici on general que acabamos de dar, la
denici on de C nos garantiza que x converge

a r y, como ambos son est andar,


esto no es ni m as ni menos que la denici on 2.29. As pues, la denici on general
coincide con 2.29 para sucesiones y n umeros est andar.
Sin embargo, debemos tener presente que si x o r no son est andar, el hecho
de que x converja a r, es decir, que (x, r) C, no implica que x converja

a r.
El interes de esta maniobra es que as, por construcci on, C es un conjunto
est andar. Por consiguiente, aunque la propiedad x converge

a r es externa,
la propiedad x converge a r, es decir, (x, r) C, es una propiedad interna con
un par ametro est andar C. En denitiva, la noci on de convergencia es interna,
a pesar de que, tal y como la hemos introducido, un matem atico cl asico no la
entender a.
4
En resumen, en lo sucesivo deberemos tener en cuenta el siguiente caso
particular del principio de estandarizaci on:
Si denimos un concepto mediante una propiedad externa, pero li-
mitamos la denici on a conjuntos est andar, entonces la denici on
admite una unica extensi on a conjuntos cualesquiera, que resulta ser
una propiedad interna.
Teorema 2.30 Si una sucesi on {x
n
}
n0
converge a un n umero r K, este es
unico.
Demostraci on: Hemos de probar que, para toda sucesi on x y para todo
par de n umeros r y r
0
, si x converge a r y x converge a r
0
, entonces r = r
0
. Como
toda la armaci on es interna, podemos aplicar el principio de transferencia y
suponer que x, r y r
0
son est andar. En tal caso, tomamos un n umero natural
innito n y observamos que r x
n
r
0
, luego r = r
0
por 2.24.
Denici on 2.31 Diremos que una sucesi on {x
n
}
n0
K
N
es convergente si
existe un r K tal que {x
n
}
n0
converge a r. A este n umero (que es unico por
el teorema anterior), lo llamaremos lmite de {x
n
}
n0
y lo representaremos por
lm
n
x
n
.
Teorema 2.32 El lmite de una sucesi on est andar convergente es est andar.
4
La raz on de fondo por la que esto sucede es que la convergencia de sucesiones admite una
denici on alternativa que s entienden los matem aticos cl asicos (la que aparece en los libros
de an alisis est andar), pero no vamos a ocuparnos de ella.
56 Captulo 2. Los n umeros reales
Demostraci on: Se trata de una consecuencia inmediata del principio de
transferencia: si existe un r tal que la sucesi on x converge a r (como la propiedad
es interna) existe un r est andar tal que la sucesi on x converge a r, luego el lmite
de la sucesi on es est andar.
Veamos algunos ejemplos:
a) lm
n
1
n
= 0, pues si n es innito entonces 1/n 0.
b) lm
n
6n
2
+3n5
3n
2
+5
= 2, pues si n es innito, entonces
6n
2
+ 3n 5
3n
2
+ 5
=
6 + 3/n 5/n
2
3 + 5/n
2

6
3
= 2.
c) En general, el lmite de un cociente de polinomios del mismo grado es
igual al cociente de los coecientes de mayor grado, lo cual se demuestra
como en el caso anterior, dividiendo numerador y denominador entre la
potencia de n de mayor grado.
d) lm
n
3n
2
+5
n
5
3
= 0, pues si n es innito tenemos que
3n
2
+ 5
n
5
3
=
3/n
3
+ 5/n
5
1 3/n
5
0.
e) En general, el lmite de un cociente de polinomios cuyo denominador tiene
mayor grado es 0, lo cual se demuestra dividiendo entre la potencia de n
de mayor grado.
f) lm
n
n
5
3
3n
2
+5
no existe, porque si n es innito, entonces
n
5
3
3n
2
+ 5
=
1 3/n
5
3/n
3
+ 5/n
5
es innito, luego no puede estar innitamente cerca de ning un n umero
est andar.
g) En general, el lmite de un cociente de polinomios cuyo numerador tiene
mayor grado no existe, porque la sucesi on toma valores innitos cuando
el ndice n es innito.
h) lm
n
(1)
n
no existe, porque si n es innito par, entonces (1)
n
= 1 y si
n es innito impar (1)
n
= 1, luego si existiera el lmite r debera ser
r 1 1, lo cual es imposible.
2.3. Convergencia de sucesiones 57
Interpretaci on del lmite La denici on cl asica de lmite de una sucesi on es
la siguiente, con su no menos cl asica triple alternancia de cuanticadores (para
todo-existe-para todo):
Se cumple que lm
n
x
n
= l si y s olo si para todo n umero > 0 existe un
n umero natural n
0
tal que, para todo n n
0
se cumple |x
n
l| < .
Por el principio de transferencia, para probar la equivalencia podemos su-
poner que la sucesi on y el lmite son est andar. Supongamos que existe el lmite
seg un la denici on que hemos dado.
Para probar la equivalencia, de nuevo por el principio de transferencia, po-
demos tomar un > 0 est andar. Entonces, si n
0
N es innito y n n
0
,
tambien n es innito, por lo que x
n
l 0 y, en particular, |x
n
l| < , como
haba que probar.
Recprocamente, si se cumple la caracterizaci on cl asica, jado un > 0
est andar, existe un n
0
tal que, si n n
0
, se cumple |x
n
l| < . Por el principio
de transferencia, el n
0
se puede tomar est andar.
Observemos que, en principio el n
0
(est andar) que cumple esto depende de ,
pero si n es un n umero natural innito, cumplir a n n
0
sea cual sea el natural
nito n
0
, luego se cumplir a |x
n
l| < para todo > 0 (est andar). Ahora bien,
esto s olo puede suceder si x
n
l 0, ya que en caso contrario |x
n
l|
1
sera
un n umero nito, luego existira un m N nito tal que |x
n
l|
1
< m, luego
|x
n
l| > 1/m, y no se cumplira lo dicho para = 1/m. As pues, x
n
l y
tenemos la convergencia.
En la prueba hemos visto que (para sucesiones est andar y est andar, el n
0
se
puede tomar est andar, luego la convergencia implica que, para ndices n nitos
sucientemente grandes, el termino x
n
dista del lmite l menos que cualquier
> 0 prejado.
En lo sucesivo no volveremos a mostrar este tipo de equivalencias cl asicas.
Consideraremos que propiedades como x
n
l cuando n es innito ya mues-
tran claramente su signicado analtico (en este caso, que x
n
es muy parecido
a l cuando n es muy grande) sin necesidad de reducir la idea a aproximaciones
nitas con tolerancias > 0 y valores mnimos n
0
para n.
Conviene observar que la convergencia de una sucesi on y el valor de su lmite
no se alteran si modicamos unicamente sus primeros terminos:
Teorema 2.33 Si {x
n
}
n0
, {y
n
}
n0
K
N
son dos sucesiones tales que existe
un n
0
N de modo que x
n
= y
n
para todo n n
0
, entonces una converge si y
s olo si lo hace la otra, y en tal caso el lmite es el mismo para ambas.
Demostraci on: Por el principio de transferencia podemos suponer que
las sucesiones y n
0
son est andar. Entonces, si n es cualquier natural innito,
tenemos que x
n
= y
n
y, como el concepto de convergencia depende unicamente
de los terminos innitos de las sucesiones, es claro que se cumple el enunciado.
58 Captulo 2. Los n umeros reales
Ejemplo Vamos a estudiar la convergencia de una sucesi on no est andar. Para
ello probamos primero lo siguiente:
Si m N, se cumple que
lm
n
m
n
= 0.
En efecto, por el principio de transferencia podemos suponer que m es nito,
en cuyo caso, si n es innito, resulta que m/n 0.
Tomemos ahora un n umero natural innito m. Por lo que acabamos de
probar, sabemos que
lm
n
m
n
= 0,
pero si tomamos el n umero innito n = m, no es cierto que m/m = 1 0, de
modo que no se cumple la propiedad que dene la convergencia en el caso de
sucesiones est andar.
Ejercicio: Demostrar que si {x
n
}
n0
, {y
n
}
n0
son sucesiones convergentes, entonces
lm
n
(x
n
+y
n
) = lm
n
x
n
+ lm
n
y
n
, lm
n
(x
n
y
n
) = lm
n
x
n
lm
n
y
n
,
y si adem as lm
n
y
n
6= 0, entonces
lm
n
x
n
y
n
=
lm
n
x
n
lm
n
y
n
.
Denici on 2.34 Una sucesi on {x
n
}
n0
K
N
est a acotada si existen n umeros
m < M tales que m x
n
M para todo n N.
Ejercicio: Probar que una sucesi on {x
n
}
n0
K
N
est a acotada si y s olo si existe un
M K tal que |x
n
| M para todo n N.

Esta es la denici on cl asica de funci on acotada, si bien tiene su equivalente


no est andar, que nos ser a mucho m as util en la pr actica. Podramos haber
tomado el teorema siguiente como denici on:
Teorema 2.35 Una sucesi on est andar {x
n
}
n0
est a acotada si y s olo si x
n
es
nito para todo n umero natural innito n.
Demostraci on: Si la sucesi on est a acotada, entonces hay n umeros m < M
tales que m < x
n
< M para todo n N. Por el principio de transferencia,
podemos tomar m y M nitos, con lo que x
n
es nito para todo n N, nito o
innito.
Supongamos ahora que la sucesi on no est a acotada, de modo que, para todo
M K, existe un ndice n N tal que |x
n
| > M. En particular, esto vale
cuando M es innito, con lo que existe un n N tal que x
n
tambien es innito.
Dicho n ha de ser innito, porque si fuera nito sera est andar y, como la sucesi on
es est andar, x
n
tambien sera est andar, luego sera nito.
A veces es util el siguiente criterio de convergencia:
2.4. La incompletitud de Q 59
Teorema 2.36 El producto de una sucesi on que tiende a 0 por una sucesi on
acotada, tiende a 0.
Demostraci on: Por transferencia podemos suponer que las sucesiones son
est andar. Si {x
n
}
n0
est a acotada, entonces x
n
es nito cuando n es innito.
Si {y
n
}
n0
tiende a 0, entonces y
n
0 cuando n es innito. Por el teorema
2.22 concluimos que x
n
y
n
0, luego lm
n
x
n
y
n
= 0.
Denici on 2.37 Sea {x
n
}
n
K
N
una sucesi on est andar en K. Diremos que
lm
n
x
n
= (respectivamente + o ) si para todo n N innito se cumple
que x
n
es innito (y adem as x
n
> 0, para +, o x
n
< 0, para ).
Ejercicio: Demostrar las relaciones que usualmente se abrevian as:
+= , ++= +, = ,
(+)(+) = +, (+)() = , ()() = +, = ,
a = , a/0 = , a/= 0, (donde a K \ {0}).
Por ejemplo, la primera igualdad hay que entenderla como una abreviatura del teorema
siguiente: si dos sucesiones convergen a , su suma tambien converge a .
Otras expresiones como 0/0, /, , 0 , etc. se llaman indeter-
minaciones, para expresar que no puede demostrarse un resultado similar a los
del ejercicio anterior, en el sentido de que la existencia y el valor del lmite
depender a de las sucesiones concretas que se operan y no s olo de sus lmites.
Ejemplo La expresi on es una indeterminaci on, ya que, por ejemplo, las
sucesiones {n +3}
n0
y {n}
n0
tienden ambas a , y su diferencia tiende a 3;
sin embargo, las sucesiones {n
2
}
n0
y {n}
n0
tienden ambas a y su diferencia
tiende a . (Podemos verla como un cociente de polinomios de grados 2 y 0
respectivamente.)
Ejercicio: Poner ejemplos que demuestren que las otras indeterminaciones que hemos
citado son realmente indeterminaciones.
2.4 La incompletitud de Q
La incompletitud de Q, en el sentido de que Q no contiene todos los n umeros
que debera contener, es un hecho que ya descubrieron los antiguos griegos y
que traumatiz o a muchos de sus matem aticos. En efecto, la geometra demuestra
que la diagonal de un cuadrado de lado unidad debe medir

2 unidades, y un
sencillo argumento prueba que

2 es irracional. Recordemoslo:
Teorema 2.38 No existe ning un r Q tal que r
2
= 2.
60 Captulo 2. Los n umeros reales
Demostraci on: Si existiera tal n umero r, podramos tomarlo positivo
(cambi andole el signo si fuera preciso) y expresarlo como cociente r = p/q,
donde p y q son n umeros naturales. Podemos tomar como p el mnimo nume-
rador posible. Como p
2
/q
2
= 2, tenemos que p
2
= 2q
2
, luego p ha de ser par.
Pongamos que p = 2p
0
. Entonces 4p
02
= 2q
2
, luego 2p
02
= q
2
. Esto implica que
q = 2q
0
es par, pero entonces r = p/q = p
0
/q
0
, con p
0
< p, en contradicci on con
la elecci on de p como mnimo numerador posible para r.
Esto implica que, para hablar de

2, necesitamos un conjunto de n umeros
m as amplio que Q. Dado que r
2
6= 2, podemos descomponer Q del modo
siguiente:
Q = {r Q | r < 0} {r Q | r 0, r
2
< 2} {r Q | r 0, r
2
> 2}.
Si llamamos A a la uni on de los dos primeros conjuntos y B al tercero,
tenemos que Q = AB, AB = y que todos los elementos de A son menores
que todos los elementos de B. La diagonal de un cuadrado de lado unidad mide
m as que cualquier n umero de A y mide menos que cualquier n umero de B, pero
(en Q) entre A y B no hay nada. Hay un agujero que debemos rellenar.
Nos encargaremos de ello en la secci on siguiente, donde construiremos el
cuerpo R de los n umeros reales, pero ahora nos ocuparemos de precisar en que
consisten estos agujeros de Q, ya que con ello obtendremos al mismo tiempo
los conceptos necesarios para rellenarlos. Una forma de denir rigurosamente
los agujeros de Q es a traves del concepto de secci on:
Denici on 2.39 Una secci on de Q es un par (A, B) de subconjuntos no vacos
de Q tales que Q = A B, A B = , cada elemento de A es menor que cada
elemento de B, y B no tiene un mnimo elemento. Si adem as A no tiene un
m aximo elemento diremos que la secci on es estricta.
Cada secci on estricta de Q en este sentido pone en evidencia la falta de un
n umero entre A y B. Observemos la importancia de la ultima condici on sobre
ausencia de m aximo y mnimo, ya que una secci on como
Q = {r Q | r 3} {r Q | r > 3},
que no es estricta, porque A tiene a 3 como m aximo elemento,
5
no nos permite
armar que falte ning un n umero entre A y B, sino que A y B est an perfecta-
mente separados por r = 3.
Aunque intuitivamente est a claro, no es inmediato comprobar que los con-
juntos A y B que hemos construido entre los que debera estar

2 no tienen
m aximo ni mnimo. Vamos a verlo como consecuencia de una construcci on m as
general que nos dar a otras caracterizaciones de los agujeros de Q.
5
Recordemos que las deniciones de m aximo y mnimo de un conjunto A exigen que estos
esten en A. Por ello, podemos decir que 3 es el m aximo del conjunto de la izquierda, mientras
que el conjunto de la derecha no tiene mnimo, ya que dicho mnimo debera ser 3 y no lo
es porque no pertenece al conjunto.
2.4. La incompletitud de Q 61
Ejemplo Sea B = {r Q | r 0, r
2
> 2} y sea A = Q \ B. Est a claro
que (A, B) cumple la denici on de secci on salvo quiz a la condici on de que A no
tenga m aximo y B no tenga mnimo. Observemos que 1 A (porque 1
2
< 2) y
2 B (porque 2
2
> 2). Esto se interpreta como que el agujero determinado
por (A, B) est a situado entre 1 y 2. Para precisar m as su situaci on jamos un
n umero natural n y consideramos los n + 1 n umeros naturales de la forma
x
i
= 1 +
i
n
, 0 i n.
M as explcitamente, tenemos que
1 = x
0
< x
1
< < x
n
= 2.
Elevando al cuadrado:
1 = x
2
0
< x
2
1
< < x
2
n
= 4.
Puesto que ninguno de los cuadrados puede ser exactamente igual a 2, tiene
que existir un unico i tal que x
2
i
< 2 < x
2
i+1
. Denimos x
n
= x
i
, y
n
= x
i+1
. De
este modo, hemos construido dos sucesiones (est andar) {x
n
}
n0
, {y
n
}
n0
Q
N
tales que
1 x
n
< y
n
2, y
n
x
n
= 1/n, x
2
n
< 2 < y
2
n
.
Esto se interpreta como que el agujero determinado por (A, B) est a situado
entre x
n
e y
n
para todo n. Si n es innito, entonces, la segunda condici on de
las tres anteriores nos da que x
n
y
n
, luego tambien x
2
n
y
2
n
, y la tercera
condici on nos da que |x
n
2| < |x
2
n
y
2
n
| 0, luego x
2
n
y
2
n
= 2.
Acabamos de probar que, aunque no existe ning un n umero racional r tal que
r
2
= 2, s que existe un r tal que r
2
2.
Por otra parte, ahora es claro que A no puede tener m aximo elemento.
Si lo tuviera, sera un n umero est andar r (por transferencia, el m aximo de
un conjunto est andar es un n umero est andar), y tendramos (siempre para n
innito) que x
n
r < y
n
, luego x
n
r, luego r
2
x
2
n
2, luego r
2
= 2 por el
teorema 2.24, y esto es imposible. Igualmente se razona que B no puede tener
mnimo. As hemos probado que (A, B) es una secci on estricta de Q.
Observemos tambien que la sucesi on {x
n
}
n0
no es convergente (en Q), ya
que, siendo est andar, si convergiera lo hara a un n umero racional est andar r,
que cumplira r
2
x
2
n
2 y de nuevo llegaramos al absurdo r
2
= 2. (Lo mismo
vale para {y
n
}
n0
.)
Esto se interpreta como que las sucesiones deberan converger a

2, pero,
en Q, en vez de

2 tenemos un agujero.
No obstante, estas sucesiones cumplen una propiedad relacionada con la
convergencia que denimos a continuaci on.
A partir de aqu, los resultados te oricos generales los enunciaremos, como en
las secciones precedentes, para sucesiones en un cuerpo ordenado arquimediano
est andar K arbitrario, si bien los alternaremos con aplicaciones al caso concreto
de Q.
62 Captulo 2. Los n umeros reales
Denici on 2.40 Una sucesi on est andar {x
n
}
n0
K
N
es de Cauchy si para
todo par de n umeros naturales innitos m y n se cumple que x
m
x
n
.
Como en el caso de la denici on de convergencia, el principio de estandari-
zaci on nos permite considerar denido el concepto de sucesi on de Cauchy para
sucesiones arbitrarias, no necesariamente est andar, y de modo que la propiedad
es interna.
As como la noci on de convergencia expresa que x
n
es muy parecido al lmite
cuando n es muy grande, la noci on de sucesi on de Cauchy expresa que los
terminos de la sucesi on son todos muy parecidos entre s cuando los ndices son
muy grandes.
Las sucesiones {x
n
}
n0
e {y
n
}
n0
que hemos construido en el ejemplo an-
terior son de Cauchy, pues si m y n son dos n umeros naturales cualesquiera,
podemos suponer que x
m
x
n
, y entonces x
m
x
n
< y
m
(porque todo ele-
mento de A es menor que todo elemento de B), luego |x
n
x
m
| |y
m
x
m
| 0,
luego x
m
x
n
. Igualmente se razona con la otra sucesi on.
Tenemos as ejemplos de sucesiones de Cauchy que no son convergentes
(en Q). Por otra parte:
Teorema 2.41 Toda sucesi on convergente es de Cauchy.
Demostraci on: Sea {x
n
}
n0
una sucesi on convergente en K. Por trans-
ferencia podemos suponer que es est andar, y entonces tambien ser a est andar
su lmite l K. Si m y n son n umeros naturales innitos, tenemos que
x
m
l x
n
, luego la sucesi on es de Cauchy.
Lo que sucede es que, para que una sucesi on pueda converger, es decir,
para que sus terminos se acerquen innitamente a un lmite l, es necesario
en particular que se acerquen innitamente entre s. En cambio, aunque los
terminos de una sucesi on se acerquen innitamente entre s, puede ocurrir que
la sucesi on no tenga lmite porque converja hacia un agujero, como hemos
visto que sucede en Q. Las sucesiones de Cauchy no convergentes en Q son otra
forma de se nalar los agujeros de Q. Veamos otra m as, esta genuinamente no
est andar:
Denici on 2.42 Un n umero r K es casi est andar si est a innitamente cerca
de un n umero est andar, que por el teorema 2.24 est a unvocamente determinado
y lo llamaremos parte est andar de r, y lo representaremos por

r.
Todo n umero casi-est andar es suma de un n umero est andar (luego nito)
y un innitesimo (nito tambien), luego todos los n umeros casi-est andar son
nitos. En Q el recproco es falso, y este hecho supone otra caracterizaci on
de la incompletitud. Volviendo a la sucesi on {x
n
}
n0
del ultimo ejemplo que
hemos visto, cuando n es innito tenemos que x
n
es nito (est a entre 1 y 2)
y no est a innitamente pr oximo a ning un n umero est andar r, ya que, una vez
m as, si x
n
r, entonces r
2
= 2.
2.5. La construcci on de R 63
As, los n umeros racionales que deberan estar innitamente cerca de un
n umero irracional est andar son nitos, pero no casi-est andar porque su parte
est andar es irracional.
Ejercicio: Demostrar que si r, s K son casi-est andar, tambien lo son r +s y rs, y
que

(r+s) =

r+

s,

(rs) =

r

s. Si s no es un innitesimo, tambien es casi-est andar


r/s y

(r/s) =

r/

s.
En resumen, hemos visto tres manifestaciones de la incompletitud de Q:
La existencia de secciones estrictas (A, B), para las que debera haber
un n umero que fuera el m aximo de A o el mnimo de B, seg un a cu al de
los dos lo a nadamos.
La existencia de sucesiones de Cauchy no convergentes, que deberan
tener un lmite.
La existencia de n umeros nitos que no son casi-est andar, que deberan
estar innitamente pr oximos a una parte est andar.
En la secci on siguiente construiremos el cuerpo R de los n umeros reales y
veremos que desaparecen estos tres fen omenos, lo que se interpretar a como que
habremos tapado todos los agujeros de Q.
Terminamos con un ultimo resultado sobre sucesiones de Cauchy:
Teorema 2.43 Toda sucesi on de Cauchy est a acotada.
Demostraci on: Sea {x
n
}
n0
una sucesi on de Cauchy, que podemos supo-
ner est andar. Si m N es innito, entonces, para todo n m, se cumple que
|x
n
x
m
| < 1, ya que, de hecho, los dos terminos est an innitamente pr oximos.
Por transferencia, podemos tomar un m N nito que cumple lo mismo, es
decir, tal que para todo n m se cumple |x
n
x
m
| < 1, en particular para todo
n N innito. Como la sucesi on y m son est andar, el termino x
m
tambien es
est andar, luego es nito, luego x
n
tambien es nito, para todo n N innito.
Esto signica que la sucesi on est a acotada.
Ejercicio: Probar el an alogo al teorema 2.33 para sucesiones de Cauchy.
Terminamos la secci on con otras dos caracterizaciones de la incompletitud
de Q, una genuinamente no est andar y otra cl asica:
2.5 La construcci on de R
Existen diversas formas de construir un cuerpo R que complete a Q, aunque
todas ellas son equivalentes, en el sentido de que los cuerpos a los que se llega
con cada metodo tienen exactamente las mismas propiedades y sus elementos
pueden identicarse uno a uno a traves de aplicaciones naturales.
La construcci on de R m as simple desde un punto de vista conceptual es la de
Dedekind, que dene R como el conjunto de todas las secciones de Q. Podemos
64 Captulo 2. Los n umeros reales
denir entonces una aplicaci on i : Q R que a cada n umero x Q le asigna
la secci on
i(x) = ({r Q | r x}, {r Q | r > x}).
De este modo, los n umeros racionales se identican con las secciones no
estrictas de Q, pero, en R hay muchos n umeros irracionales, como la secci on
estricta que hemos estudiado en la secci on anterior y que podramos tomar
como la denici on de

2.
No obstante, construir R no es s olo denir los n umeros reales, sino dotarlos
de una estructura de cuerpo ordenado y, con la construcci on de Dedekind, esto
resulta mucho m as farragoso que con la que vamos a exponer aqu, basada, no en
las secciones, sino en otro de los detectores de agujeros que hemos encontrado,
a saber, las sucesiones de Cauchy.
Aqu nos encontramos con un inconveniente, y es que, mientras que seccio-
nes de Q distintas entre s determinan n umeros racionales distintos (si no son
estrictas) o agujeros distintos (si son estrictas), es f acil construir sucesiones
de Cauchy distintas que se aproximen hacia el mismo agujero de Q, por lo
que no podemos denir los n umeros reales como las sucesiones de Cauchy de
Q, sino que cada n umero real deber a ser el conjunto de todas las sucesiones de
Cauchy que se aproximan a un mismo agujero.
Denici on 2.44 Llamaremos C al conjunto de todas las sucesiones de Cauchy
en Q.
Observemos que la suma y el producto de dos sucesiones de Cauchy {x
n
}
n0
,
{y
n
}
n0
es tambien una sucesi on de Cauchy. En efecto, si m y n son n umeros
naturales innitos, entonces x
m
x
n
, y
m
y
n
, luego x
m
+y
m
x
n
+y
n
, luego
{x
n
+y
n
}
n0
tambien es de Cauchy. Con el producto se razona an alogamente,
pero teniendo en cuenta que las sucesiones de Cauchy est an acotadas, porque
para aplicar el teorema 2.22 hace falta que los n umeros sean nitos.
Esto convierte al conjunto C en un subanillo del anillo Q
N
. Aqu usamos
tambien que las sucesiones constantes 0 y 1 est an en C, lo cual es obvio, porque
todas las sucesiones constantes son convergentes, luego son de Cauchy.
Denici on 2.45 Diremos que dos sucesiones est andar {x
n
}
n0
, {y
n
}
n0
C
son equivalentes, y lo representaremos por {x
n
}
n0
{y
n
}
n0
, si para todo
n N innito, se cumple que x
n
y
n
. Observemos que si esto se cumple para
un cierto n innito, entonces se cumple autom aticamente para todos.
Es evidente que la equivalencia que acabamos de denir es ciertamente una
relaci on de equivalencia, es decir, que es reexiva, simetrica y transitiva.
Ejercicio: Probar que dos sucesiones de Cauchy son equivalentes si y s olo si su
diferencia converge a 0. Esto signica precisamente que ambas deberan tener el
mismo lmite, en caso de tenerlo.
Denimos el conjunto de los n umeros reales R como el conjunto de todas las
clases de equivalencia de sucesiones de Cauchy respecto de la equivalencia que
acabamos de denir. Es obvio que R, as denido, es un conjunto est andar.
2.5. La construcci on de R 65
De este modo, cada R es de la forma = [{x
n
}
n0
], donde los corchetes
representan la clase de equivalencia formada por todas las sucesiones de Cauchy
equivalentes a {x
n
}
n0
.
Ejercicio: Demostrar que si {x
n
}
n0
{x
0
n
}
n0
y {y
n
}
n0
{y
0
n
}
n0
, entonces
{x
n
+y
n
}
n0
{x
0
n
+y
0
n
}
n0
y {x
n
y
n
}
n0
{x
0
n
y
0
n
}
n0
.
El ejercicio precedente permite denir la suma y el producto de dos n umeros
reales = [{x
n
}
n0
] y = [{y
n
}
n0
] como
+ = [{x
n
+y
n
}
n0
], = [{x
n
y
n
}
n0
].
En otros terminos: para sumar o multiplicar dos n umeros reales escogemos
una sucesi on de Cauchy en cada uno de ellos, las sumamos o multiplicamos, y
el resultado es la clase de la sucesi on suma o producto. La clave est a en que
este resultado ser a el mismo cualquiera que sea el par de sucesiones con el que
hagamos las operaciones.
Todas estas comprobaciones pueden reducirse a unas pocas a traves del
concepto de ideal:
Ejercicio: Demostrar que el conjunto I de las sucesiones de Q
N
que convergen a 0 es
un ideal del anillo C, de modo que la equivalencia de sucesiones de Cauchy no es m as
que la congruencia m odulo I y R no es m as que el anillo cociente C/I.
Teorema 2.46 (R, +, ) es un cuerpo.
Demostraci on: La comprobaci on de que R es un anillo es inmediata.
Todas las propiedades se reducen a las correspondientes a la suma y el producto
de sucesiones, que a su vez se reducen a las de la suma y el producto de n umeros
racionales. Por ejemplo, la propiedad conmutativa del producto se prueba as:
Si = [{x
n
}
n0
] y = [{y
n
}
n0
], entonces
= [{x
n
y
n
}
n0
] = [{y
n
x
n
}
n0
] = .
Observemos que los elementos neutros para la suma y el producto son las
clases de las sucesiones constantes 0 = [{0}
n0
], 1 = [{1}
n0
].
La unica propiedad que requiere algo de atenci on es la de existencia de
elemento inverso para el producto. Para ello tomamos un n umero R no
nulo, que podemos suponer est andar. Ser a de la forma = [{x
n
}
n0
], donde
{x
n
}
n0
es una sucesi on de Cauchy, que podemos tomar est andar, tal que, si n
es innito, x
n
6 0 (pues de lo contrario la sucesi on sera equivalente a {0}
n0
y tendramos = 0).
Consideremos la sucesi on (est andar) {y
n
}
n0
denida por
y
n
=

x
n
si x
n
6= 0,
1 si x
n
= 0.
66 Captulo 2. Los n umeros reales
Seg un lo dicho, si n es innito ser a y
n
= x
n
, luego {y
n
}
n0
es tambien una
sucesi on de Cauchy equivalente a {x
n
}
n0
. Por lo tanto, = [{y
n
}
n0
], con la
diferencia de que ahora y
n
6= 0 para todo n N.
Esto nos permite considerar la sucesi on inversa {y
1
n
}
n0
, que tambien es
de Cauchy, pues si m y n son n umeros naturales innitos, entonces y
m
y
n
son n umeros racionales no innitesimales, luego y
1
m
y
1
n
(por 2.22). Por
consiguiente, tenemos denido el n umero real = [{y
1
n
}
n0
], que obviamente
cumple = 1, luego existe el inverso
1
= .
Denici on 2.47 Si = [{x
n
}
n0
] y = [{y
n
}
n0
] son dos n umeros reales
est andar distintos, el teorema 2.22 implica que la condici on x
n
< y
n
(para n
innito) no depende ni del n considerado ni de la elecci on de las sucesiones
dentro de cada n umero real. Por ello diremos que < si 6= y x
n
< y
n
para alg un n innito (o, equivalentemente, para todos). A su vez, denimos
como < o = .
Teorema 2.48 (R, +, , ) es un cuerpo ordenado.
Demostraci on: Es inmediato que la relaci on que acabamos de denir es
reexiva, antisimetrica y transitiva. Por ejemplo, para probar la antisimetra
hemos de ver que, si = [{x
n
}
n0
] y = [{y
n
}
n0
] (que podemos suponer
est andar) cumplen y , entonces ha de ser = . Por reducci on al
absurdo, si fuera 6= , entonces tendramos < y < , luego, jado un
n N innito, x
n
< y
n
, y
n
< x
n
, lo cual es absurdo porque la relaci on de orden
en Q es antisimetrica.
Similarmente, si 6= , jado n N innito, o bien x
n
< y
n
, en cuyo caso
< , o bien y
n
< x
n
, en cuyo caso < . Esto implica que, o bien , o
bien .
La compatibilidad del orden con la suma y el producto se prueban tambien
sin dicultad. Por ejemplo, si y consideramos un tercer n umero real
= [{z
n
}
n0
], o bien + = +, en cuyo caso tenemos tambien + +,
o bien + 6= + , lo que obliga a 6= y, m as concretamente, a < .
Entonces, jado un n N innito, tenemos que x
n
< y
n
, luego x
n
+z
n
< x
n
+y
n
,
luego + < +, luego + +.
Denici on 2.49 Sea i : Q R la aplicaci on que a cada r Q le asigna el
n umero real i(r) = [{r}
n0
].
Teorema 2.50 La aplicaci on i : Q R que acabamos de denir es inyectiva
y cumple las propiedades siguientes:
a) r s si y s olo si i(r) i(s).
b) i(r +s) = i(r) +i(s).
c) i(rs) = i(r)i(s).
d) Para todo R existe un m N tal que i(m) .
2.5. La construcci on de R 67
Demostraci on: La inyectividad de i signica que si i(r) = i(s), entonces
r = s. Podemos suponer que r y s son est andar. Lo que tenemos es que la
sucesi on constante r es equivalente a la sucesi on constante s, luego r s y,
como son est andar, r = s.
Las propiedades a), b) y c) son inmediatas.
Para probar d) podemos suponer que = [{x
n
}
n0
] es est andar, con lo que
tambien podemos suponer que lo es la sucesi on {x
n
}
n0
. Como es de Cauchy,
est a acotada, lo cual implica que existe un M Q(que podemos tomar est andar)
tal que x
n
M para todo n N. Sea m = E[M] +2, que es un n umero natural
nito, y es claro que |x
n
m| > 1 para todo n N, luego la sucesi on {x
n
}
n0
no es equivalente a la sucesi on constante m y, como x
n
< m para cualquier n
innito, concluimos que < i(m).
En virtud de este ultimo teorema, podemos identicar a Q con su imagen
en R a traves de la aplicaci on i, de modo que podemos considerar Q R.
La suma, el producto y la relaci on de orden entre n umeros racionales son los
mismos si los consideramos como n umeros racionales o como n umeros reales. La
ultima propiedad implica que (R, +, , ) es un cuerpo ordenado arquimediano
est andar. Por lo tanto, podemos aplicarle toda la teora que hasta ahora hemos
desarrollado para un cuerpo K arbitrario.
En particular, podemos distinguir entre n umeros reales innitos, nitos e
innitesimales. A partir de ahora, O representar a especcamente al conjunto
(externo) de todos los n umeros reales nitos y o al conjunto (externo) de todos
los n umeros reales innitesimales.
Observemos que un n umero racional r es nito si y s olo si existe un n umero
natural nito n tal que |r| n, y esto no depende de si consideramos a r como
n umero racional o como n umero real. En otras palabras, un n umero racional es
nito como n umero racional si y s olo si lo es como n umero real. M as brevemente:
el conjunto (externo) de los n umeros racionales nitos es O Q. Similarmente,
los n umeros racionales innitesimales son los de oQ. A su vez, esto implica que
dos n umeros racionales est an innitamente pr oximos como n umeros racionales
si y s olo si lo est an como n umeros reales, as como que todo n umero racional
casi-est andar sigue siendo casi-est andar como n umero real, con la misma parte
est andar.
Teorema 2.51 Entre dos n umeros reales distintos hay siempre un n umero ra-
cional.
Demostraci on: Sean < dos n umeros reales, que podemos tomar
est andar. Sea m = E[] de modo que m < m + 1. Fijado un n umero
natural n consideremos los n umeros racionales de la forma
x
i
= m+
1
n
, 0 i n.
Como x
0
= m y x
n
= m+1 > , ha de haber un i tal que x
i1
< x
i
.
Si n es innito, entonces x
i1
x
i
= 1/n 0, luego x
i
, luego x
i
< , ya
68 Captulo 2. Los n umeros reales
que si fuera < x
i
sera tambien , lo cual es imposible porque
ambos n umeros son est andar. As pues, r = x
i
es un n umero racional que
cumple < r < . (Ciertamente, es un n umero racional no est andar, pero, por
transferencia, si existe uno no est andar, siendo y est andar, tambien existe
otro est andar, aunque esto no es necesario para la prueba.)
Teorema 2.52 Sea {x
n
}
n0
una sucesi on de Cauchy de n umeros racionales
y sea = [{x
n
}
n0
] R. Entonces, si consideramos la sucesi on dada como
sucesi on de n umeros reales, se cumple que
lm
n
x
n
= .
Demostraci on: Podemos suponer que la sucesi on (y, por lo tanto, ) es
est andar. Hemos de probar que si n N es innito, entonces x
n
. En caso
contrario, |x
n
| no es innitesimal, luego su inverso no es nito. Existe, pues,
un n umero natural nito k tal que |x
n
|
1
< k, luego |x
n
| > 1/k.
Si, por ejemplo, x
n
< , entonces x
n
< = 1/k < , donde es un
n umero real est andar. Por el teorema anterior, existe un n umero racional (que
podemos tomar est andar) tal que < r < . Entonces x
n
< r < , pero la
primera desigualdad implica, por denici on, que = [{x
n
}
n0
] < [{r}
n0
] = r,
luego tenemos < r < , contradicci on. Si fuera < x
n
razonamos igualmente
con = + 1/k.
A partir de este momento ya nunca m as tendremos que recordar que un
n umero real es, por denici on, una clase de equivalencia de sucesiones de Cauchy,
sino que podremos concebir a R como un conjunto de n umeros, sin que importe
para nada la naturaleza conjuntista de sus elementos. En lugar de escribir
= [{x
n
}
n0
], podremos escribir
lm
n
x
n
= .
Observemos que el teorema anterior garantiza que hemos tapado todos los
agujeros de Q, en el sentido de que cada sucesi on de Cauchy de n umeros
racionales tiene lmite en R, pero no asegura que, en el proceso, no hayamos
generado agujeros nuevos, en el sentido de que haya sucesiones de Cauchy de
n umeros reales (irracionales) que no tengan lmite. A continuaci on probaremos
que no es el caso, que es lo que se conoce como teorema de completitud de R.
En primer lugar demostramos una versi on no est andar, de la que deduciremos
trivialmente la versi on est andar:
Teorema 2.53 (Teorema de completitud) Todo n umero real nito est a
innitamente pr oximo a un unico n umero real est andar

, al que llamaremos
su parte est andar.
Demostraci on: Consideremos el conjunto est andar
A =
S
{x R | x }.
2.5. La construcci on de R 69
Recordemos que esto signica que un n umero real est andar x est a en A si y
s olo si cumple x , pero no tenemos informaci on directa sobre que n umeros
no est andar est an en A.
Como es nito, el n umero entero m = E[] es nito, luego es est andar, y
se cumple que m < m + 1, luego m A y m + 1 / A. Para cada n N
consideramos los n umeros racionales
a
i
= m+
i
n
, 0 i n.
Como a
0
= m A y a
n
= m+1 / A, ha de existir un i tal que x
n
= a
i
A,
pero y
n
= a
i+1
/ A. Tenemos as denidas dos sucesiones {x
n
}
n0
, {y
n
}
n0
de
n umeros racionales que son est andar, pues est an denidas internamente a partir
de A y m, que son conjuntos est andar.
Por construcci on, x
n
A, y
n
/ A, x
n
< y
n
, y
n
x
n
= 1/n. Cuando n es
nito (y s olo en este caso) podemos asegurar que x
n
< y
n
.
Un poco m as en general, si n y n
0
son nitos, tenemos que x
n
< y
n
0 luego,
por transferencia, esta desigualdad se cumple cuando n y n
0
son arbitrarios.
Si n y n
0
son innitos y, por ejemplo, x
n
x
n
0 , tenemos que
|x
n
0 x
n
| |x
n
y
n
| = 1/n 0,
luego x
n
x
n
0 . Igualmente se razona que y
n
y
n
0 , luego ambas sucesiones son
de Cauchy. Por el teorema anterior, existe = lm
n
x
n
R, que ser a un n umero
real est andar. Tenemos as que x
n
y
n
, para todo n N innito.
Vamos a probar que , con lo que el teorema quedar a probado. (La
unicidad de la parte est andar es el teorema 2.24.)
En caso contrario, | |
1
es nito, luego podemos tomar k N nito tal
que | | > 1/k. Si, por ejemplo, < , para todo n N nito tenemos que
x
n
< 1/k < . En la desigualdad x
n
< 1/k, todo es est andar,
luego, por transferencia, vale para todo n N. As pues, | x
n
| > 1/k, lo cual
es absurdo cuando n es innito, ya que x
n
. Si < razonamos igualmente
con < + 1/k < < y
n
.
El teorema anterior prueba que los n umeros reales nitos coinciden con los
casi-est andar, pero, precisamente por ello, ya no volveremos a hablar de n umeros
casi-est andar, ya que este concepto se ha vuelto sin onimo de nito.
La versi on est andar del teorema de completitud es ahora trivial:
Teorema 2.54 (Teorema de completitud) Una sucesi on de n umeros reales
es convergente si y s olo si es de Cauchy.
Demostraci on: Sea {
n
}
n0
una sucesi on de Cauchy de n umeros reales,
que podemos tomar est andar. Toda sucesi on de Cauchy est a acotada, luego,
jado m N innito,
m
es nito, luego existe =

m

m
. Como la
sucesi on es de Cauchy, de hecho
n
, para todo n N innito, luego
= lm
n

n
El recproco es el teorema 2.41.
70 Captulo 2. Los n umeros reales
2.6 Consecuencias de la completitud de R
En esta secci on recogemos algunas propiedades elementales de R que no son
ciertas para Q porque dependen de la propiedad de completitud. Empezamos
con otra de las caracterizaciones cl asicas:
Denici on 2.55 Si (X, ) es un conjunto ordenado, el supremo de un subcon-
junto A X no vaco es la menor de sus cotas superiores, y el nmo es la
mayor de sus cotas inferiores.
M as detalladamente, s X es el supremo de A si es una cota superior de A
(es decir, si a s para todo a A y cualquier otra cota superior c X cumple
s c. An alogamente podemos desarrollar la denici on de nmo.
Un conjunto A no tiene por que tener supremo o nmo, pero si existen son
claramente unicos. Si A tiene un m aximo (resp. mnimo) elemento, es claro que
este es tambien su supremo (resp. nmo).
La completitud de R equivale al teorema siguiente:
Teorema 2.56 Todo subconjunto de R no vaco y acotado superiormente tiene
supremo.
Demostraci on: Sea A R un subconjunto est andar no vaco y acotado
superiormente. Sea a A est andar y sea c R una cota superior est andar. Si a
es el m aximo de A, entonces es su supremo. Supongamos que a no es el m aximo
de A, con lo que a < c.
Fijemos n N innito y consideremos la sucesi on x
i
= a + 1/n, para i N.
Tenemos que x
0
= a no es una cota superior de A, mientras que x
n
2 > c, luego
s lo es. Ha de existir un i N tal que x
i
no sea una cota superior pero x
i+1
s que lo sea. Que x
i
no sea cota superior signica que existe un b A tal que
a < x
i
< b < c, luego x
i
es nito. Sea s =

x
i
=

x
i+1
. Vamos a probar que s
es el supremo de A.
En primer lugar, s es una cota superior, pues si existe b A tal que s < b,
podemos tomarlo est andar, y entonces x
i+1
< b, en contradicci on con que x
i+1
es una cota superior de A.
Si existe otra cota superior d < s, podemos tomarla est andar, con lo que
d < x
i
, y esto contradice que x
i
no sea una cota superior.
Ejercicio: Demostrar que todo subconjunto de R no vaco y acotado inferiormente
tiene nmo.
Las caracterizaciones siguientes del supremo de un conjunto pueden ser
utiles:
Teorema 2.57 Sea A R un conjunto est andar y sea s R un n umero
est andar. Las armaciones siguientes son equivalentes:
a) s es el supremo de A.
2.6. Consecuencias de la completitud de R 71
b) s es una cota superior de A y existe x s que no es cota superior de A.
c) s es una cota superior de A y existe a s tal que a A.
Demostraci on: a) b) Cualquier x s que cumpla x < s no ser a cota
superior de A.
b) c) Necesariamente x < s. Si x no es cota superior, existe un a A tal
que x < a y, como s s que es cota superior, ha de ser x < a s, luego a x
c) a) Si existe una cota superior c < s, podemos tomarla est andar, pero
entonces c < a, contradicci on.
Hemos visto que una de las evidencias de la incompletitud de Q era que en
este cuerpo no existe la raz cuadrada de 2. En cambio, ahora podemos probar
que los n umeros reales positivos tienen siempre una raz k-esima:
Teorema 2.58 Si 0 es un n umero real y k N es no nulo, existe un unico
n umero real 0 tal que
k
= .
Demostraci on: Podemos suponer que y k son est andar, con lo que
tambien lo ser a el conjunto
A = {x R | x
k
}.
Tambien podemos suponer que > 0, ya que en otro caso tomamos = 0.
Tenemos que A 6= , pues 0 A, y A est a acotado superiormente, por ejemplo
por cualquier n umero natural n > , ya que si x n, entonces
x
k
n
k
> n > ,
luego x / A. Podemos tomar, pues el supremo de A, que ser a un n umero
est andar. Por el teorema anterior, existe un
0
A tal que
0
(y nece-
sariamente
0
). Por otra parte, cualquier
00
> tal que
00
cumple

00
/ A, luego tenemos

0

00
,
0k

00k
.
Por consiguiente,
0k

k

00k
y, por 2.23, sabemos que
0k

00k
, con
lo que ha de ser
k
. Como ambos son est andar,
k
= .
La unicidad es consecuencia de que si 0 < <
0
, entonces
k
<
0k
.
Denici on 2.59 Si 0 es un n umero real, denimos la raz k-esima de ,
representada por
k

, como el unico n umero real 0 que cumple


k
= .
Observemos que si k es impar y < 0, podemos denir
k

=
k

y
se sigue cumpliendo que (
k

)
k
= (y, en general,
k

tiene el mismo signo


que ). Por el contrario, si k es par,
k
0 para todo R, por lo que los
n umeros negativos no tienen raz k-esima.
Ejercicio: Demostrar las propiedades b asicas de las races (con radicandos positivos):
k
_
=
k

k
_
, (
k

)
n
=
k

n
,
k
_
r

=
kr

.
72 Captulo 2. Los n umeros reales
Ejemplo Vamos a probar que
lm
n
n

n = 1.
En efecto, si llamamos x
n
=
n

n 1, hemos de probar que


lm
n
x
n
= 0.
Tenemos que
n = (1 +x
n
)
n
= 1 +nx
n
+
n(n 1)
2
x
2
n
+ +x
n
n

n(n 1)
2
x
2
n
.
As pues,
0 x
n

_
2
n 1
.
Si n es innito, concluimos que x
n
0.
El teorema 2.38 nos da que

2 es un n umero irracional, y a partir de aqu
es f acil probar que existen innitos n umeros irracionales:
Teorema 2.60 Entre dos n umeros reales distintos hay al menos un n umero
racional y un n umero irracional.
Demostraci on: Sean < dos n umeros reales, que podemos suponer
est andar. El teorema 2.51 nos da que existe un n umero racional r (que podemos
tomar est andar) tal que < r < . Por otra parte, si n N es innito, entonces
< r +

2
n
< ,
y x = r +

2/n es irracional, ya que en caso contrario

2 = (xr)n Q.
En particular, dado x R, podemos aplicar el teorema anterior a x y x+h,
donde h > 0 es innitesimal, para concluir que todo n umero real est a inni-
tamente cerca de n umeros racionales y de n umeros irracionales. Hay un caso
particular de aproximaci on por n umeros reales por n umeros racionales que tiene
especial interes pr actico:
Expresi on decimal de un n umero real Para cada x R y cada n N,
podemos considerar k
n
= E[10
n
x], de modo que
k
n
10
n
x <
k
n
+ 1
10
n
.
Tenemos as un n umero entero k
n
, unvocamente determinado, tal que el n umero
racional k
n
/10
n
que aproxima a x con un error menor que 1/10
n
. Por ejemplo,
es pura rutina comprobar que
14142
10
4

2
14143
10
4
2.6. Consecuencias de la completitud de R 73
lo que se expresa m as habitualmente en notaci on decimal:
1.4142

2 1.4143.
Observemos que, en general,
10k
n
10
n+1
x <
10k
n
+ 10
10
n+1
,
por lo que k
n+1
ser a de la forma 10k
n
+ c
n
, donde 0 c
n
9 es un n umero
natural. Esto signica que cada aproximaci on decimal de x se obtiene a nadiendo
una nueva cifra decimal a la anterior (pero sin modicar las cifras decimales
anteriores). As, por ejemplo, la siguiente aproximaci on decimal de

2 es
1.41421

2 < 1.41422.
Por ultimo observamos que la sucesi on {k
n
}
n0
determina completamente
el n umero x ya que, suponiendolo est andar y tomando n innito, la relaci on
k
n
10
n
x <
k
n
+ 1
10
n
implica que x
k
n
10
n
, ya que la diferencia entre los dos extremos es 1/10
n
0.
Por consiguiente:
x = lm
n
k
n
10
n
.
Por esto podemos escribir

2 = 1.4142135 . . .
entendiendo que el miembro derecho, con sus puntos suspensivos, representa el
lmite de la sucesi on de aproximaciones decimales de

2.
La completitud de R puede expresarse en terminos de la convergencia de las
sucesiones de Cauchy. Otra forma equivalente utiliza sucesiones mon otonas:
Denici on 2.61 Una sucesi on {x
n
}
n0
R
N
es mon otona creciente (resp.
decreciente) si cuando m n se cumple x
m
x
n
(resp. x
n
x
m
). Diremos que
una sucesi on es mon otona si es mon otona creciente o mon otona decreciente.
Teorema 2.62 Toda sucesi on mon otona y acotada de n umeros reales es con-
vergente.
Demostraci on: Sea {
n
}
n0
una sucesi on acotada de n umeros reales,
que podemos tomar est andar, y supongamos, por ejemplo, que es mon otona
creciente. Vamos a probar que es de Cauchy. En caso contrario, existiran m,
n N innitos tales que
m
6
n
. Esto equivale a que

m
6=

n
. Pongamos
que

m
<

n
. Como son n umeros est andar, existe un n umero real est andar

m
< r <

n
. Esto implica que
m
< r <
n
74 Captulo 2. Los n umeros reales
Como existe un n N tal que r <
n
, por transferencia existe un n
0

N tal
que r <
n
0
. Ahora bien, m > n
0
y, sin embargo,
m
<
n
0
, en contradicci on
con la monotona de la sucesi on. As pues, la sucesi on es de Cauchy y, por lo
tanto, convergente.
Ejercicio: Probar que el lmite de una sucesi on mon otona creciente (resp. decreciente)
y acotada {
n
}
n0
es el supremo (resp. el nmo) del conjunto {
n
| n N}.
Otra consecuencia de la completitud de R es una caracterizaci on, que vere-
mos a continuaci on, de los subconjuntos de R que m as nos van a interesar: los
intervalos.
Denici on 2.63 Si < son dos n umeros reales, denimos los intervalos
acotados de extremos y como
], [ = {x R | < x < }, [, ] = {x R | x },
], ] = {x R | < x }, [, [ = {x R | x < }.
Los intervalos no acotados de extremo son:
], +[ = {x R | < x}, [, +[ = {x R | x},
], [ = {x R | x < }, ], ] = {x R | x }.
Consideraremos tambien como intervalo a ], +[ = R.
Teorema 2.64 Un subconjunto I R es un intervalo si y s olo si cuando tres
n umeros reales cumplen < < y , I, tambien I.
Demostraci on: Es evidente que los intervalos cumplen esta propiedad. Sea
ahora I R un conjunto que la cumpla y veamos que es un intervalo. Podemos
suponer que I es est andar. Si I = , entonces I = ]0, 0[, luego podemos suponer
que existe un x I, que podemos tomar est andar.
Si I = {x}, entonces I = [x, x], luego podemos suponer que I contiene otro
punto adem as de x, No perdemos generalidad si suponemos que [x, x
0
] I,
donde x < x
0
son ambos est andar.
Si I = R, tambien es, por denici on, un intervalo, luego podemos suponer
que existe un y R \ I (tambien est andar). Vamos a suponer que x < x
0
< y.
La alternativa es y < x < x
0
, en cuyo caso razonaramos an alogamente.
Fijamos k N innito y consideramos la sucesi on a
i
= x
0
+ i/k. Tenemos
que a
0
= x
0
I, mientras que a
k
2 > y, luego a
k
2 / I. Por consiguiente, tiene
que haber un i tal que a
i
I, pero a
i+1
/ I.
Observemos que a
i
< y o, de lo contrario, x < y < a
i
implicara que y I,
luego a
i
es nito, luego podemos tomar =

a
i
=

a
i+1
. As,

R est a
innitamente cerca de puntos de I y de puntos de R \ I.
Se cumple que x < x
0
. Veamos que
[x, [ I ], ] .
2.6. Consecuencias de la completitud de R 75
Si no se da la primera inclusi on, existe x < u < est andar tal que u / I,
pero entonces x < u < a
i
, luego u I, contradicci on. Si no se da la segunda
inclusi on, existe u > est andar tal que u I, pero entonces x < a
i+1
< u,
luego a
i+1
I, contradicci on.
Si I = ], ] o I = ], [, ya tenemos que I es un intervalo. En caso
contrario, existe un z < x est andar tal que z / I. Razonando ahora con z y con
x igual que antes hemos razonado con x
0
y con y, podemos construir un

R
tal que x < x
0
y de modo que tiene innitamente cerca puntos de I
y puntos de R \ I. De aqu se sigue, a su vez, que
], [ I [, ].
En efecto, si existiera < u < est andar tal que u / I, tomando un
0

que s que este en I, tendramos
0
< u < x
0
, luego u I, contradicci on; y si
existiera un u I est andar tal que u < , entonces tomando
00
que no
este en I, sera u <
00
< x
0
, con lo que
00
I, contradicci on.
La doble inclusi on que hemos obtenido implica que I es uno de los cuatro
intervalos acotados de extremos y .
La completitud de R tiene una interpretaci on geometrica: la posibilidad de
poner en correspondencia los n umeros reales con los puntos de una recta:
En principio, elegimos dos puntos a los que asignar arbitrariamente los
n umeros 0 y 1, de modo que la longitud del segmento de extremos 0 y 1
se convierte en la unidad de medida, o la escala de la representaci on.
Cada n umero entero n se representa
6
a |n| unidades de distancia del 0, en
la semirrecta que contiene al 1 si n > 0 y en la opuesta si n < 0.
Para representar un n umero racional m/n, dividimos la unidad en n partes
iguales y lo situamos a una distancia del 0 igual a |m| de estas partes, en
la semirrecta que corresponda a su signo. Se cumple as que la ordenaci on
de los n umeros racionales se corresponde con la ordenaci on geometrica de
los puntos de la recta: si, como es habitual, hemos puesto el 1 a la derecha
del 0, entonces un n umero racional es mayor cuanto m as a la derecha est a
su punto correspondiente.
1 0
1
2
1

2 2
Un punto P de la recta no tiene por que tener asignado de este modo un
n umero racional, pero divide a los n umeros racionales en dos partes: los
que est an a su izquierda y los que est an a su derecha. Estos dos subcon-
juntos A y B de Q forman una secci on (si entendemos que A contiene al
6
SI el lector se pregunta d onde hay que poner los n umeros innitos, la respuesta es que en
el mismo lugar donde pondra un n umero n en general, sin especicar cu al.
76 Captulo 2. Los n umeros reales
propio punto cuando este es racional). De este modo, podemos asignar a
P el supremo de A. Recprocamente, a cada n umero real x le asignamos
el unico punto de la recta que est a a la derecha de los n umeros racionales
menores que x y a la izquierda de los n umeros racionales mayores que x.
Captulo III
Calculo diferencial de una
variable
3.1 La graca de una funci on
En este captulo iniciaremos el estudio analtico de las funciones de una
variable real, es decir, de funciones f : D R R. En la mayora de los
casos, el dominio D de las funciones que estudiaremos ser a un intervalo o una
uni on de intervalos disjuntos.
Una forma de visualizar las funciones mnimamente razonables es a traves
de su gr aca:
Denici on 3.1 La gr aca de una funci on f : D R R es el conjunto
1

f
= {(x, y) R
2
| x D, y = f(x)}.
Puesto que R puede representarse como una recta, tenemos que, a traves de
un sistema de ejes cartesianos, R
2
puede representarse como el conjunto de los
puntos del plano, y
f
resulta ser una curva en el plano.
-2 -1 1 2
-2
-1
1
2 Ejemplo La gura muestra la gr aca de la funci on
f : [2, 2] R dada por
f(x) =
x
3
x + 1
3
.
Podemos observar que, para valores peque nos de x, la
funci on f toma valores negativos y es creciente. Toma
el valor 0 en un n umero situado en el intervalo ]2, 1[
y sigue creciendo hasta tomar un valor m aximo en el intervalo ]1, 0[, luego
1
En realidad, seg un la denici on de funci on que hemos dado, se cumple que
f
= f, pero
en la pr actica podemos olvidar este hecho igual que podemos olvidar que los n umeros
reales son clases de equivalencia de sucesiones de Cauchy de n umeros racionales.
77
78 Captulo 3. Calculo diferencial de una variable
decrece hasta alcanzar un mnimo en el intervalo ]0, 1[ y, a partir de ese punto,
vuelve a crecer.
Las tecnicas analticas que vamos a presentar aqu nos permitir an deducir
estas caractersticas de f y otras muchas a partir de la propia expresi on que la
dene, aunque no dispongamos de una representaci on gr aca.
-2 -1 1 2
-2
-1.5
-1
-0.5
0.5
1
1.5
2
Ejemplo Una funci on puede tener un aspecto sus-
tancialmente diferente al que mostraba la funci on del
ejemplo anterior. Por ejemplo, aqu tenemos la gr aca
de la funci on g : [2, 2] R dada por
g(x) =
_
_
_
x
x
2
1
si x 6= 1,
0 si x = 1.
Vemos que esta funci on consta de tres piezas (cinco, en realidad, puesto
que la gr aca tambien contiene a los puntos (1, 0) y (1, 0)). En otras palabras,
lo que tenemos ahora es que, al contrario de lo que suceda con la funci on f del
ejemplo precedente, la gr aca de g no puede dibujarse de un solo trazo. En
la secci on siguiente expresaremos esta diferencia diciendo que f es continua en
[2, 2], mientras que g es discontinua en los puntos 1.
3.2 Funciones continuas
Vamos a plasmar formalmente la diferencia que hemos observado entre las
funciones de los dos ejemplos de la secci on anterior. M as concretamente, quere-
mos denir la noci on de continuidad de una funci on en un punto x de modo que
garantice que la funci on no dar a ning un salto en x, es decir, de modo que los
puntos cercanos a x tengan sus im agenes cerca de f(x). En principio, cerca
es un termino relativo, pero deja de serlo si lo precisamos como innitamente
cerca:
Denici on 3.2 Sea f : D R R una funci on est andar. Diremos que f
es continua en un punto est andar x
0
D si cuando x D cumple x x
0
,
entonces f(x) f(x
0
). Diremos que f es continua en D si lo es en todos sus
puntos.
2
Notemos que si x = x
0
se cumple trivialmente f(x) f(x
0
), luego al aplicar
la denici on de continuidad podemos suponer siempre que x 6= x
0
.
Vamos a discutir, seg un esta denici on, los ejemplos de la secci on precedente,
incluso ligeramente generalizados:
2
Recordemos que el principio de estandarizaci on nos garantiza que una denici on parti-
cularizada a datos est andar (en este caso una funci on est andar y un punto est andar) admite
una unica extensi on a datos cualesquiera, que adem as es interna. (Vease la discusi on tras la
denici on de convergencia 2.29. As pues, la noci on de continuidad es interna. En lo sucesivo
no volveremos a hacer esta clase de observaciones, sino que el lector deber a tener presente
que, para denir un concepto interno, basta hacerlo sobre conjuntos est andar y no importa
que la denici on sea externa.
3.2. Funciones continuas 79
Ejemplo La funci on f : R R dada por
f(x) =
x
3
x + 1
3
es continua en R.
En efecto, se trata de una funci on est andar y basta probar que es continua
en cualquier punto x
0
R est andar. Ahora bien, si x x
0
, las propiedades
algebraicas de la proximidad innita (recogidas en el teorema 2.22) nos dan que
(x
3
x + 1)/3 (x
3
0
x
0
+ 1)/3, es decir, tenemos que f(x) f(x
0
), luego f
es continua en x
0
.
Ejemplo La funci on g : R R dada por
g(x) =
_
_
_
x
x
2
1
si x 6= 1,
0 si x = 1,
es continua excepto en los puntos 1.
En efecto, veamos que si x
0
R es un punto est andar distinto de 1,
entonces g es continua en x
0
. Para ello tomamos x x
0
y observamos que
x
2
1 x
2
0
1 6= 0, luego ni x
2
1 ni x
2
0
1 son innitesimales, luego sus
inversos son nitos, luego el teorema 2.22 nos permite armar que
x
x
2
1

x
0
x
2
0
1
.
As pues, g(x) g(x
0
).
En cambio, si x
0
= 1, tomamos x x
0
, x 6= x
0
y observamos que, como
antes, x
2
1 x
1
0
1 = 0, luego x
2
1 es un innitesimo, luego 1/(x
2
x) es
innito, y tambien ha de serlo g(x) = x/(x
2
1). (Si fuera nito, despejando
tendramos que x = g(x)(x
2
1) sera innitesimal, pero no lo es.) As pues,
g(x) 6 g(x
0
) = 0.
Por lo tanto, g es discontinua en 1. M as precisamente, hemos visto que g
es innita en los puntos innitamente cercanos a 1, tal y se ve en su gr aca.
Ejemplo La funci on f(x) =
3

x es continua en R.
En efecto, tomamos un punto est andar x
0
R y otro x x
0
. Es f acil ver
que
3

x es nito, con lo que podemos tomar y =


3

x
3

x. Tenemos entonces
que y
3
x x
0
, luego y
3
= x
0
, ya que ambos son est andar. Por consiguiente,
3

x
0
= y
3

x, es decir, f(x) f(x


0
), como haba que probar.
El ejemplo siguiente muestra que la continuidad de una funci on depende del
dominio en que la consideremos denida, en el sentido de que, si una funci on es
discontinua en un punto, puede suceder que, restringida a un dominio menor,
pase a ser continua.
80 Captulo 3. Calculo diferencial de una variable
Ejemplo La funci on h : R R dada por
h(x) =

1 si x < 1,
2 si x 1,
es continua en todos los puntos de R excepto en x
0
= 1. Sin embargo, su
restricci on al intervalo [1, +[ es continua en todo el intervalo, incluyendo al
punto x
0
= 1.
1
f(x)
En efecto, para probar que h es continua en todo
punto x
0
6= 1, podemos suponer que x
0
es est andar.
Si x
0
< 1, entonces, para todo x x
0
, se cumplir a
tambien x < 1, luego h(x) = 1 = h(x
0
). Si x
0
> 1
razonamos igualmente. Vemos que h es continua por-
que las variaciones innitesimales de x
0
no producen
ninguna variaci on en h(x).
En cambio, para x
0
= 1, consideramos un x x
0
que cumpla x < x
0
.
Entonces h(x) = 1 6 2 = h(x
0
). Vemos que h es discontinua en x
0
= 1 porque
basta un desplazamiento innitesimal hacia la izquierda desde dicho punto para
que el valor de h(x) vare apreciablemente (es decir, no innitesimalmente).
Sin embargo, cuando restringimos la funci on al intervalo D = [1, +[ y
tomamos x
0
= 1, todo x D que cumpla x x
0
ha de ser x x
0
, con lo cual
h(x) = h(x
0
) y se cumple la denici on de continuidad.
Un caso extremo en el que la continuidad es trivial se da cuando no es posible
incrementar innitesimalmente la variable sin salirse del dominio de la funci on:
Denici on 3.3 Si D R es un conjunto est andar y x
0
D es un punto
est andar, diremos que x
0
es un punto aislado de D si h(x
0
) D = {x
0
}, es
decir, si D no contiene puntos innitamente pr oximos a x
0
, salvo el propio x
0
.
En caso contrario se dice que x
0
es un punto de acumulaci on de D.
Es evidente que una funci on f : D R es continua en todos los puntos
aislados de D.
Ejercicio: Probar que todos los puntos de Z son aislados. Por lo tanto, toda funci on
f : Z R es continua.
Tambien es evidente que si x
0
D E R y f : E R es continua en
x
0
, entonces la restricci on f|
D
: D R tambien es continua en x
0
, pero el
recproco no es cierto, tal y como hemos visto en el ultimo ejemplo.
Otra consecuencia obvia de la denici on de continuidad es que esta depende
unicamente del comportamiento de la funci on sobre el halo del punto:
Teorema 3.4 Sean f, g : D R R dos funciones est andar y sea x
0
D
un punto est andar tal que
3
f|
h(x
0
)D
= g|
h(x
0
)D
. Entonces f es continua en
x
0
si y s olo si lo es g.
3
Notemos que, aunque el halo h(x
0
) sea, habitualmente, un conjunto externo, la igualdad
f|
h(x
0
)D
= g|
h(x
0
)D
tiene sentido, pues signica que f(x) = g(x) para todo x D tal que
x x
0
.
3.2. Funciones continuas 81
A continuaci on vamos a dar teoremas que garanticen que las funciones usua-
les son continuas (salvo en casos obvios). Para ello conviene observar que po-
demos denir de forma natural (punto a punto) operaciones sobre las funciones
denidas en un mismo dominio:
Denici on 3.5 Si D R, D 6= , llamaremos F(D) = R
D
al conjunto de
todas las funciones f : D R. Notemos que podemos denir una suma y un
producto en F(D) mediante
(f +g)(x) = f(x) +g(x), (fg)(x) = f(x)g(x).
En inmediato comprobar que, con estas operaciones, F(D) tiene estructura
de anillo. M as a un, podemos identicar los n umeros reales con las funciones
constantes en D, por lo que tambien tenemos denido el producto de un n umero
por una funci on.
Tambien es costumbre escribir f g para indicar que f(x) g(x) para todo
x D. No obstante, hemos de tener presente que esta relaci on es reexiva,
simetrica y transitiva, pero no cumple que, dadas dos funciones f, g F(D),
se de necesariamente una de las desigualdades f g o g f.
Tambien es frecuente nombrar a una funci on por la expresi on que la dene.
Por ejemplo, en lugar de decir que la funci on f : R R dada por f(x) = x
3
cumple que f F(R), escribiremos simplemente x
3
F(R). Aqu hay que
entender que x
3
no es el cubo de ning un n umero x R, sino la funci on f que
acabamos de denir.
Las funciones de la forma a
n
x
n
+ + a
1
x + a
0
F(R), donde a
i
R, se
llaman polinomios,
4
y forman claramente un subanillo R[x] F(R).
Teorema 3.6 Si dos funciones f, g : D R R son continuas en un punto
x
0
D, tambien lo son f +g y fg.
Demostraci on: Podemos suponer que todos los datos son est andar. Si
x D cumple x x
0
, entonces
(f +g)(x) = f(x) +g(x) f(x
0
) +g(x
0
) = (f +g)(x
0
),
e igualmente con el producto (en cuyo caso, para que se conserven las aproxi-
maciones, usamos que f(x
0
) y g(x
0
) son nitos porque son est andar.)
Denici on 3.7 Si D R es un conjunto no vaco, denimos C(D) F(D)
como el conjunto de las funciones continuas en D.
4
En realidad habra que distinguir entre un polinomio como objeto algebraico y la funci on
polin omica que dene, pero no necesitaremos entrar en esta sutileza, principalmente porque,
sobre un dominio D R innito, dos polinomios son iguales si y s olo si denen la misma
funci on polin omica.
82 Captulo 3. Calculo diferencial de una variable
Es claro que C(D) es un subanillo de F(D) que contiene a su vez como
subanillo al anillo R[x] de los polinomios (ya que contiene a las constantes y a
la identidad f(x) = x).
Para que una funci on f F(D) tenga inversa 1/f, es necesario y suciente
que f no tome el valor 0 en D. En tal caso, si f es continua, tambien lo es 1/f:
Teorema 3.8 Si D R no es vaco y f C(D) no toma el valor 0, entonces
1/f C(D).
Demostraci on: Podemos suponer todos los datos est andar. Tomamos
x
0
D est andar. Sea x D tal que x x
0
. Entonces f(x) f(x
0
). Como x
0
es
est andar, f(x
0
) es est andar y no nulo, luego f(x) y f(x
0
) no son innitesimales,
luego 1/f(x) 1/f(x
0
), luego 1/f es continua en x
0
, luego es continua en D.
Ejemplo La funci on
x
3
+x 3
x
2
1
es continua en R \ {1, 1}.
En efecto, el numerador y el denominador son funciones continuas en R,
porque son polinomios. En particular lo son en R \ {1, 1}, y en este conjunto
el denominador no se anula, luego 1/(x
2
1) es continua en ese mismo conjunto,
luego la funci on dada es continua por ser producto de dos funciones continuas.
Teorema 3.9 Si f : D R E R, g : E R R, x
0
D, f es
continua en x
0
y g es continua en f(x
0
), entonces f g es continua en x
0
.
Demostraci on: Podemos suponer que todos los datos son est andar. As,
si x D cumple x x
0
, tenemos que f(x) f(x
0
) y, por consiguiente,
(f g)(x) = g(f(x)) g(f(x
0
)) = (f g)(x
0
),
lo que prueba la continuidad de f g en x
0
.
En particular, si f es continua en D y g es continua en E, tenemos que f g
es continua en D.
Ejercicio: Probar que la funci on valor absoluto es continua en R, mientras que la
funci on parte entera E : R R es continua en R \ Z y discontinua en Z.
El ejemplo siguiente muestra la necesidad de tener cierta cautela a la hora
de identicar la noci on general de funci on con la idea intuitiva de una curva
que tal vez de algunos saltos de vez en cuando.
3.2. Funciones continuas 83
Ejemplo La funci on f : R R dada por
f(x) =

1 si x Q,
0 si x R \ Q,
es discontinua en todos los n umeros reales.
En efecto, basta probar que lo es en todo x
0
R est andar. Si x
0
es racional,
podemos tomar x x
0
irracional, y viceversa. De este modo f(x) 6 f(x
0
),
puesto que uno es 1 y el otro 0, luego f es discontinua en x
0
.
Notemos que no es posible representar gr acamente la funci on de este ejem-
plo. Su gr aca tendra el aspecto de dos lneas horizontales paralelas, una a la
altura del 0 y otra a la altura del 1, pero esta imagen no reeja las caractersticas
de f. Por ejemplo, sera indistinguible de la representaci on gr aca de la funci on
1 f.
Quiz a el lector piense que el car acter patol ogico del ejemplo anterior se debe
precisamente al hecho de que se trata de una funci on discontinua. Veamos ahora
un ejemplo de funci on que es continua en muchos puntos y no por ello es menos
patol ogica:
Ejemplo La funci on f : R R dada por
f(x) =

1/n si x Q y n = mn{m N \ {0} | mx Z},


0 si x R \ Q.
es continua en R \ Q y discontinua en Q. (En otras palabras, si x Q, hemos
denido f(x) como el menor denominador posible de una fracci on x = m/n.)
Si x
0
Q es est andar, entonces la fracci on x = m/n con n mnimo tiene
numerador y denominador est andar, luego f(x) = 1/n 6 0, mientras que, si
tomamos un irracional x x
0
, tenemos que f(x) = 0 6 f(x
0
), luego f es
discontinua en Q.
Por otro lado, si x
0
R \ Q es est andar y x x
0
, o bien x es irracional,
en cuyo caso f(x) = 0 = f(x
0
), o bien x = m/n con n mnimo, pero n ha
de ser innito, ya que, en caso contrario, m = xn sera tambien nito y x
sera est andar, pero entonces x = x
0
sera irracional. As pues, llegamos a que
f(x) = 1/n 0 = f(x
0
). Esto prueba que f es continua en x
0
.
Demostramos ahora algunas propiedades importantes de las funciones con-
tinuas:
Teorema 3.10 (Primer teorema de Weierstrass) Si f : [a, b] R es
una funci on continua, entonces alcanza un valor m aximo y un valor mnimo
en [a, b].
Demostraci on: Lo que hemos de probar es que existen puntos x, y [a, b]
tales que, para todo z [a, b] se cumple que f(x) f(z) f(y). Podemos
suponer que todos los datos son est andar.
84 Captulo 3. Calculo diferencial de una variable
Por el Principio de Idealizaci on II, existe un conjunto nito F [a, b] que
contiene a todos los elementos est andar de [a, b]. Como F es nito, existe un
r F donde f toma su valor m aximo (esto es el teorema 1.21). Tomemos la
parte est andar
5
y =

r [a, b]. Vamos a probar que y cumple lo pedido.
En caso contrario, existira un z [a, b] est andar, tal que f(z) > f(y).
Ahora bien, como y r y f es continua en y, se cumple que f(y) f(r), luego
f(z) > f(r), pero esto es absurdo, ya que z F y f(r) es el mayor valor que f
toma en el conjunto F. Igualmente se razona que f alcanza un valor mnimo.
Como ya hemos se nalado en la prueba, el teorema anterior es falso en general
para funciones denidas sobre intervalos que no sean de la forma [a, b]. Por
ejemplo, la funci on f(x) = x es continua en el intervalo [0, 1[ y no alcanza
un valor m aximo: dado cualquier x [0, 1[, existe otro punto (cualquiera que
cumpla x < y < 1) donde f toma un valor mayor. En este caso, todava
podemos decir que f tiene supremo en [0, 1[, en el sentido de que s = 1 es el
supremo del conjunto de los valores que f toma en el intervalo; pero, en cambio,
la funci on 1/x, que es continua en ]0, 1], no s olo no alcanza un valor m aximo,
sino que ni siquiera tiene supremo.
Teorema 3.11 (Segundo teorema de Weierstrass) Si f : [a, b] R es
una funci on continua, entonces toma todos los valores comprendidos entre f(a)
y f(b).
Demostraci on: Podemos suponer que todos los datos son est andar. Si
f(a) = f(b) no hay nada que probar. Supongamos que f(a) < f(b). El caso
contrario es an alogo. Tomamos un est andar tal que f(a) < < f(b) y hemos
de probar que existe un c [a, b] tal que f(c) = .
Fijemos n N innito y consideremos la sucesi on x
i
= a + i/n. Como
x
n
2 > b, existe un k N tal que x
k
b y x
k+1
> b, luego x
k
b, luego
f(x
k
) f(b) > , luego f(x
k
) > .
Como f(x
0
) = f(a) < , existe un i < k tal que f(x
i
) < f(x
i+1
).
Sea c =

x
i
=

x
i+1
[a, b]. Puesto que f es continua en c, se cumple que
f(c) f(x
i
) f(x
i+1
), luego f(c) y, como ambos son est andar, f(c) = .
Este teorema es geometricamente evidente, y la tecnica de demostraci on
tambien: para encontrar el punto donde f toma el valor , nos vamos moviendo
desde a hasta b a pasitos innitesimales y esperamos el momento (que llegar a
tarde o temprano) en que f pase de ser < a ser . El punto c que buscamos
ha de estar innitamente cerca del ultimo paso que hemos dado.
5
En este punto es crucial que el dominio de f es un intervalo de la forma [a, b]. (No servira
cualquier otro tipo de intervalo.) Concretamente, ahora usamos que si se cumple x [a, b],
entonces existe

x [a, b]. Esto es evidente, pues si, por ejemplo, fuera

x > b, al ser

x y b
est andar, tendra que ser x > b. Esta propiedad de los intervalos [a, b] se llama compacidad.
El teorema es v alido para funciones continuas denidas sobre cualquier conjunto compacto en
este sentido.
3.3. Funciones derivables 85
Ejercicio: Dar un ejemplo de funci on f : [a, b] R que cumpla la propiedad del
teorema anterior pero que sea discontinua.
Una consecuencia del ultimo teorema es que si una funci on continua no toma
dos veces el mismo valor, es porque siempre crece o porque siempre decrece:
Denici on 3.12 Una funci on f : D R R es mon otona creciente (resp.
mon otona decreciente) si cuando x, y D cumplen x y entonces f(x) f(y)
(resp. f(y) f(x)). Si esto se cumple con desigualdades estrictas diremos que
f es mon otona creciente (o decreciente) estricta. Diremos que f es mon otona si
es mon otona creciente o mon otona decreciente.
Teorema 3.13 Una funci on continua e inyectiva f : [a, b] R es mon otona.
Demostraci on: Como es inyectiva, no puede ser f(a) = f(b). Supongamos
que f(a) < f(b) y veamos que f es mon otona creciente. Igualmente se probara
que es decreciente si se diera la desigualdad contraria.
Si a < c < b, ha de ser f(a) < f(c) < f(b), ya que si, por ejemplo, se diera
el caso f(c) < f(a), el segundo teorema de Weierstrass aplicado al intervalo
[c, b] implicara la existencia de un d ]c, b[ tal que f(a) = f(c), y f no sera
inyectiva.
Tomemos ahora n umeros a x < y b. Si fuera f(a) < f(y) < f(x) < f(b),
el teorema de Weierstrass aplicado al intervalo [y, b] nos dara un z [y, b] tal
que f(z) = f(x), luego f no sera inyectiva. As pues, ha de ser f(x) < f(y),
con lo que f es mon otona creciente.
Terminamos con una ultima propiedad de las funciones continuas:
Teorema 3.14 Sean f, g : I R R dos funciones continuas en un inter-
valo I (que no se reduzca a un punto) y supongamos que ambas coinciden en
Q I. Entonces son iguales.
Demostraci on: Podemos suponer que las funciones son est andar. Dado
x I est andar, es claro que existe un x
0
Q I tal que x
0
x. Entonces
f(x) f(x
0
) = g(x
0
) g(x) y, como ambos son est andar, f(x) = g(x). Esto
prueba que f y g coinciden en I.
Ejercicio: Si D E R son conjuntos est andar, se dice que D es denso en E si todo
punto est andar de E est a innitamente cerca de un punto de D. Demostrar que si dos
funciones continuas en E coinciden en un subconjunto denso, entonces son iguales.
3.3 Funciones derivables
Antes de entrar en el concepto que nos va a ocupar en esta secci on (la deri-
vabilidad de funciones) vamos a ocuparnos de una cuesti on tecnica: hemos visto
que la continuidad de una funci on en un punto (est andar) x depende en gran
medida del dominio de la funci on, pues, seg un en que dominio la consideremos,
este podr a contener m as o menos puntos innitamente pr oximos a x. En el caso
86 Captulo 3. Calculo diferencial de una variable
de la derivabilidad vamos a exigir que el dominio de la funci on contenga a todos
los puntos innitamente pr oximos a x:
Denici on 3.15 Un conjunto est andar D R es un entorno de un punto
est andar x
0
D si h(x
0
) D. Tambien diremos que x
0
es un punto interior
de D. Diremos que D es abierto si es entorno de todos sus puntos.
Ejercicio: Demostrar que los intervalos ], [, ], +[, ], [ y ], +[, son
abiertos, mientras que cualquier otro no lo es.
El concepto de derivada que ahora vamos a introducir mide la velocidad a la
que vara una funci on cuando vara su variable. Tal vez el caso m as tpico sea el
propio concepto de velocidad. Si e(t) representa el espacio que ha recorrido un
m ovil hasta el instante t, la diferencia e(t +h) e(t) es el espacio que recorrer a
en los pr oximos h segundos a partir de t, (o el que ha recorrido en los ultimos
h segundos, con signo negativo, si h < 0). El cociente
e(t +h) e(t)
h
es entonces una aproximaci on a la velocidad del m ovil en los pr oximos h segun-
dos (o en los ultimos h segundos si h < 0, donde al dividir hemos corregido el
signo negativo del numerador).
Decimos que es una aproximaci on porque si obtenemos, por ejemplo, 10 m/s,
esto no signica que, durante el tiempo h, el m ovil se haya movido realmente
a 10 m/s. Podra ser que se hubiera movido mucho m as deprisa durante los
primeros instantes y mucho m as despacio en los ultimos, de modo que los 10 m/s
no son m as que la velocidad media que ha llevado en el intervalo en cuesti on.
Cuando menor sea el valor de h, esta velocidad media se parecer a m as a la
velocidad real a la que se mova en el instante t. El mayor parecido posible lo
encontraremos cuando consideremos un incremento de tiempo h innitesimal:
Denici on 3.16 Sea f : D R R una funci on est andar y sea x D un
punto interior est andar. Diremos que f es derivable en x si existe un n umero
est andar f
0
(x) tal que, para todo h 0, h 6= 0, se cumple
f(x +h) f(x)
h
f
0
(x).
El n umero f
0
(x) (obviamente unico) se llama derivada de f en el punto x
0
.
Si D es abierto y f es derivable en todos los puntos de D, entonces tenemos
denida la funci on derivada f
0
: D R.
En estos terminos, si e(t) representa el espacio recorrido por un m ovil hasta
un instante t, su derivada e
0
(t) representa la velocidad del m ovil en cada ins-
tante t. En un ejemplo como este, es razonable suponer que la funci on e(t) ser a
derivable, pero, en general, debemos tener presente que una funci on dada puede
tener o no tener derivada en un punto dado.
3.3. Funciones derivables 87
Como en el caso de la continuidad, es inmediato que la derivabilidad de una
funci on est andar en un punto est andar depende unicamente de los valores que
toma la funci on sobre el halo del punto. Sin embargo, como exigimos que dicho
halo este contenido en el dominio de la funci on, resulta que la derivabilidad en
un punto no depende de que consideremos un dominio mayor o menor.
Ejemplo La funci on f : R R dada por f(x) = x
2
es derivable en R, y su
derivada es f
0
(x) = 2x.
En efecto, basta probar que existe la derivada en un punto est andar x R
arbitrario. Si h 0 es no nulo, entonces
f(x +h) f(x)
h
=
(x +h)
2
x
2
h
=
x
2
+ 2xh +h
2
x
2
h
= 2x +h 2x,
luego
6
f
0
(x) = 2x.
La derivabilidad es una propiedad m as fuerte que la continuidad:
Teorema 3.17 Si una funci on f : D R R es derivable en un punto
x
0
D, entonces es continua en x
0
.
Demostraci on: Podemos suponer que todos los datos son est andar. To-
memos x x
0
, x 6= x
0
, y llamemos h = x x
0
. Por la denici on de derivada
tenemos que
f(x) f(x
0
)
h
f
0
(x
0
),
luego f(x) f(x
0
) hf
0
(x
0
) 0, luego f(x) f(x
0
). Esto signica que f es
continua en x
0
.
Interpretaci on geometrica de la derivada Sea f : D R R una
funci on est andar derivable en un punto est andar x
0
D. Consideremos la
gr aca de f:

f
= {(x, y) R
2
| x D, y = f(x)}.
Llamemos m = f
0
(x
0
) y consideremos la funci on t(x) = x
0
+m(xx
0
), cuya
gr aca es la recta que pasa por el punto (x
0
, f(x
0
)) con pendiente m.
Fijado un n umero real r > 0, la homotecia de radio r y centro (x
0
, y
0
) es la
aplicaci on H
r
: R
2
R
2
dada por
H
r
(u, v) = (x
0
, y
0
) +r(u x
0
, v y
0
).
6
Una de las mayores crticas que reciba el c alculo diferencial en sus inicios era el hecho
de que los matem aticos tomaban cantidades innitesimales h que consideraban no nulas al
aceptarlas como denominadores v alidos de los cocientes que denen a la derivadas, pero que,
al nal del c alculo, las eliminaban consider andolas nulas, como nosotros acabamos de eliminar
la h de la expresi on 2x+h. Observemos que nuestra denici on de derivada justica totalmente
estos hechos.
88 Captulo 3. Calculo diferencial de una variable
Geometricamente se puede calcular as: trazamos la recta que une (x
0
, y
0
)
con (u, v) y movemos (u, v) por dicha recta hasta que su distancia a (x
0
, y
0
) se
multiplique por r. Si r > 1 estamos aplicando al plano una lupa de r aumentos
que deja jo al punto (x
0
, y
0
). Es claro que H
r
tambien deja invariantes a las
rectas que pasan por (x
0
, y
0
).
Vamos a considerar, concretamente, una homotecia de centro (x
0
, f(x
0
)) y
radio innito r. Al aplic arsela a la gr aca de t obtenemos nuevamente la gr aca
de t, pues es una recta que pasa por el centro de la homotecia.
Veamos que obtenemos cuando se la aplicamos a la gr aca
f
. Obviamente,
llegamos al conjunto
r
f
= {(x
0
+r(u x
0
), f(x
0
) +r(f(u) f(x
0
))) R
2
| u D}.
Tomemos un par est andar (x, y) que este innitamente pr oximo a un punto
(x
0
, y
0
) r
f
(en el sentido de que x x
0
, y y
0
). Entonces
x x
0
= x
0
+r(u x
0
),
para cierto u D, que cumplir a
u x
0
+
x x
0
r
= x
0
+h,
donde h es innitesimal. Como f es continua en x
0
, tenemos que
y y
0
= f(x
0
) +r(f(u) f(x
0
)) f(x
0
) +r(f(x
0
+h) f(x
0
))
As pues,
y f(x
0
) +
f(x
0
+h) f(x
0
)
h
(x x
0
) f(x
0
) +m(x x
0
) = t(x),
luego y = t(x).
Hemos probado que los puntos nitos de r
f
est an innitamente cerca de los
puntos est andar de la recta t(x). Recprocamente, si x R es cualquier punto
est andar, una comprobaci on an aloga muestra que el punto (x, t(x)) de la recta
t(x) est a innitamente cerca del punto de r
f
determinado por el par ametro
u D que cumple
x = x
0
+r(u x
0
).
(Se cumple que u D porque u x
0
D y D es abierto.) En denitiva:
Cuando ampliamos innitamente la gr aca de f alrededor del punto
(x
0
, f(x
0
)), esta se convierte en una curva innitamente pr oxima a
la recta
y = x
0
+f
0
(x
0
)(x x
0
).
Esta recta recibe el nombre de recta tangente a la gr aca de f en el
punto (x
0
, f(x
0
)).
3.3. Funciones derivables 89
El punto crucial es que decir que una recta se parece a la gr aca de f
alrededor de x
0
en el sentido de que, para puntos innitamente pr oximos,la
diferencia es innitesimal, es no decir nada. Eso lo cumplen todas las rectas
(est andar) que pasan por (x
0
, f(x
0
)). (En efecto: si g(x
0
) = f(x
0
), por la mera
continuidad, cuando x x
0
, se cumple que g(x) f(x
0
) f(x)). Lo que
distingue a la recta tangente de las dem as rectas es que la diferencia entre f(x)
y t(x) sigue siendo inapreciable (innitesimal) cuando aplicamos una homotecia
que hace apreciable (es decir, nita, pero no innitesimal) la diferencia entre x
y x
0
.
1
x
2
H
r
1 + 2(x 1)
La gura muestra la gr aca de f(x) = x
2
y su
recta tangente para x = 1, que, seg un hemos cal-
culado, tiene pendiente f
0
(1) = 2. Podemos ver el
parecido entre ambas para puntos cercanos a x = 1.
Esto s olo signica que, para puntos a una distancia
apreciable, pero peque na, de x
0
, la diferencia es apre-
ciable, pero peque na. Lo que hemos probado es que si
ampliamos innitamente la gura, la diferencia entre
ambas seguir a siendo inapreciable.
En la pr actica, una homotecia de radio sucientemente grande provoca el
mismo efecto sobre una curva derivable. Por ejemplo, cuando miramos hacia el
mar, el horizonte es un arco de circunferencia que resulta indistinguible de una
lnea recta.
Ejercicio: Denimos el halo de r
f
como el conjunto de todos los puntos de R
2
inni-
tamente pr oximos a puntos de r
f
. Probar que la recta tangente es la estandarizaci on
del halo de r
f
.
Esta interpretaci on geometrica est a estrechamente relacionada con la inter-
pretaci on de la derivada como incremento instant aneo. Por ejemplo, si e(t) = t
2
es la posici on que ocupa un m ovil que se desplaza sobre una recta, sabemos que
su velocidad es v(t) = 2t, lo que signica que est a acelerando de forma continua,
puesto que su velocidad es cada vez mayor. Si en el instante t = 1 dejara de
acelerar, a partir de ese momento su posici on ya no sera t
2
, sino que pasara a
moverse a velocidad constante v = 2 y su posici on en cada instante vendra dada
por la recta tangente e(t) = 1 + 2(t 1). Podemos decir que la recta tangente
en un punto x representa lo que sera la gr aca de la funci on si, desde el punto
x, mantuviera constante su tasa de crecimiento.
Nos ocupamos ahora del c alculo explcito de derivadas:
Teorema 3.18 Consideremos dos funciones f, g : D R R y un punto
interior x D. Entonces:
a) Si f es constante, entonces es derivable y f
0
(x) = 0.
b) Si f y g son derivables en x, tambien lo son f +g y fg, y
(f +g)
0
(x) = f
0
(x) +g
0
(x), (fg)
0
(x) = f
0
(x)g(x) +f(x)g
0
(x).
90 Captulo 3. Calculo diferencial de una variable
c) Si f es derivable en x y R, entonces f tambien es derivable en x y
(f)
0
(x) = f
0
(x).
d) Si f y g son derivables en x y g no se anula en D, entonces f/g es
derivable en x y
(f/g)
0
(x) =
f
0
(x)g(x) f(x)g(x)
g(x)
2
.
Demostraci on: Veremos s olo el caso del producto y del cociente. Podemos
suponer todos los datos est andar. Para derivar fg tomamos h 0 no nulo y
calculamos
f(x +h)g(x +h) f(x)g(x)
h
=
f(x +h)g(x +h) f(x +h)g(x)
h
+
f(x +h)g(x) f(x)g(x)
h
= f(x +h)
g(x +h) g(x)
h
+g(x)
f(x +h) f(x)
h
f(x)g
0
(x) +g(x)f
0
(x),
donde hemos usado que f es continua en x.
Para el cociente tenemos
f(x+h)
g(x+h)

f(x)
g(x)
h
=
f(x +h)g(x) f(x)g(x +h)
hg(x +h)g(x)
=
f(x +h)g(x) f(x)g(x) +f(x)g(x) f(x)g(x +h)
hg(x +h)g(x)
=
f(x+h)f(x)
h
g(x) f(x)
g(x+h)g(x)
h
g(x +h)g(x)

f
0
(x)g(x) f(x)g(x)
g(x)
2
.
Ejercicio: Probar inductivamente que si, para n N \ {0}, la funci on f(x) = x
n
es
derivable en R y f
0
(x) = nx
n1
. Generalizar la f ormula para n Z y x R \ {0}.
Teorema 3.19 (Regla de la cadena) Consideremos dos funciones
f : D R E R, g : E R R.
Si f es derivable en un punto x y g es derivable en f(x), entonces (f g) es
derivable en x, y (f g)
0
(x) = g
0
(f(x))f
0
(x).
3.3. Funciones derivables 91
Demostraci on: Podemos suponer que todos los datos son est andar. Sea
h 0 no nulo. Entonces
g(f(x +h)) g(f(x))
h
=
g(f(x +h)) g(f(x))
f(x +h) f(x)
f(x +h) f(x)
h
g
0
(f(x))f
0
(x).
Aqu hemos supuesto que f(x +h) f(x) 6= 0, pero si f(x +h) f(x) = 0,
entonces el miembro izquierdo vale 0 y, por otra parte,
f
0
(x)
f(x +h) f(x)
h
= 0,
luego f
0
(x) = 0 y sigue siendo cierto que
g(f(x +h)) g(f(x))
h
g
0
(f(x))f
0
(x).
esto prueba la derivabilidad de la funci on compuesta.
Veamos ahora algunos ejemplos de funciones no derivables:
Ejemplo La funci on valor absoluto es derivable en R excepto en 0.
|x|
En efecto, la funci on valor absoluto viene dada por
|x| =

x si x 0,
x si x 0.
Dado un n umero real est andar x, si x < 0 entonces la
funci on valor absoluto coincide en todo el halo h(x) con la funci on x, que es
derivable y su derivada es 1. Igualmente, si x > 0 la funci on valor absoluto
coincide en h(x) con la funci on x, que tiene derivada 1, luego el valor absoluto
es derivable en todo x no nulo. Para x = 0 tomamos un innitesimo h 6= 0 y
calculamos
|h| |0|
h
=
|h|
h
.
Observamos que este cociente toma el valor 1 o 1 seg un el signo de h, luego
no hay un unico n umero est andar que este innitamente pr oximo a todos los
valores que puede tomar este cociente. Por consiguiente, no existe la derivada
en x = 0. Hemos obtenido que la derivada es
|x|
0
=
_
1 si x < 0,
1 si x > 0.
En general, la no derivabilidad se traduce en que la gr aca de la funci on
tiene un pico en el punto. Si aplicamos una homotecia de radio innito y
centro (0, 0), la gr aca del valor absoluto seguir a teniendo exactamente el mismo
aspecto que tiene en la gura, con su pico, de modo que no se parecer a a una
recta. Alternativamente, la gura muestra tambien que no hay ninguna recta
92 Captulo 3. Calculo diferencial de una variable
que pase por (0, 0) y que pueda confundirse con la gr aca de la funci on para
valores innitesimales de x: si se parece a la gr aca para valores positivos, ser a
muy distinta para valores negativos, y viceversa.
Ahora veamos un ejemplo en el que la gr aca de una funci on no tiene ning un
pico en un punto y se parece a una recta en un entorno innitesimal del punto
y, pese a ello, la funci on no es derivable en dicho punto:
Ejemplo La funci on f(x) =
3

x es derivable en R excepto en x = 0, y su
derivada es
f
0
(x) =
1
2
3

x
2
.
En efecto, de la identidad x
3
1 = (x1)(x
2
+x+1) se deduce, cambiando
x por x/y y multiplicando por y
3
, que
x
3
y
3
= (x y)(x
2
+xy +y
2
).
Tomemos ahora un x R est andar no nulo y un innitesimo h no nulo.
Calculamos
3

x +h
3

x
h
=
(
3

x +h
3

x)(
3
_
(x +h)
2
+
3

x +h
3

x +
3

x
2
)
h(
3
_
(x +h)
2
+
3

x +h
3

x +
3

x
2
)
=
x +h x
h(
3
_
(x +h)
2
+
3

x +h
3

x +
3

x
2
)
=
1
3
_
(x +h)
2
+
3

x +h
3

x +
3

x
2

1
3
3

x
2
.
En el ultimo paso hemos usado que la funci on
3

x es continua, tal y como


lo hemos demostrado en el ejemplo de la p agina 79. Esto prueba la existencia
de la derivada. Sin embargo, si x = 0, tenemos que
3

h
3

0
h
=
1
3

h
2
es innito, ya que, si y =

3

h
2
, entonces y
3
h
2
0, luego y
3
= 0, luego
y = 0, luego
3

h
2
0. As pues, el cociente no est a innitamente pr oximo a
ning un n umero est andar.
-2 -1 1 2
-1
-0.5
0.5
1
La gr aca muestra lo que sucede: la gr a-
ca tiene una recta tangente en el punto (0, 0),
pero esta es vertical, y su pendiente es, por
lo tanto, innita. Si le aplicamos a la gr aca
una homotecia de radio innito con centro
(0, 0), obtenemos la recta vertical x = 0. La
derivada de una funci on en un punto es la
pendiente de la recta tangente a la gr aca en
3.3. Funciones derivables 93
dicho punto, puede no existir porque no exista tal recta (como en el caso del
valor absoluto) o porque la recta tangente sea vertical, como en este caso.
Veamos ahora algunas relaciones entre las derivadas y el comportamiento de
las funciones.
Denici on 3.20 Una funci on est andar f : ]a, b[ R tiene un m aximo local
(resp. mnimo local) en un punto est andar x
0
]a, b[ si para todo x x
0
se
cumple que f(x) f(x
0
) (resp. f(x) f(x
0
)). Si la condici on se cumple
con desigualdades estrictas diremos que f tiene un m aximo o un mnimo local
estricto en x
0
.
Es obvio que si f toma en x
0
su valor m aximo o su valor mnimo (y, en tal
caso, diremos que f tiene un m aximo global o un mnimo global en x
0
), entonces
tambien tiene un m aximo o un mnimo local en x
0
.
Teorema 3.21 Si una funci on derivable f : ]a, b[ R tiene un m aximo o un
mnimo local en un punto x
0
de su dominio, entonces f
0
(x
0
) = 0.
Demostraci on: Podemos suponer que todos los datos son est andar. Si
f
0
(x
0
) > 0, entonces, para todo x x
0
se cumple que
f(x) f(x
0
)
x x
0
f
0
(x
0
) > 0,
luego tambien el cociente es > 0 y, si x > x
0
, tenemos que f(x) f(x
0
) > 0,
es decir, f(x) > f(x
0
), lo que prueba que x
0
no es un m aximo local. Si x < x
0
obtenemos que f(x) < f(x
0
), luego x
0
tampoco es un mnimo local. En el caso
f
0
(x
0
) < 0 razonamos an alogamente.
Ejemplo La gr aca de la p agina 77 muestra que la funci on
f(x) =
x
3
x + 1
3
tiene un m aximo y un mnimo local. Vamos a calcularlos.
Para ello calculamos la derivada f
0
(x) =
3x
2
1
3
y buscamos los puntos donde
se anula, que son claramente 1/

3. Seg un la gr aca, 1/

3 ha de ser el
m aximo local y 1/

3 ha de ser el mnimo local. Podemos llegar a la misma


conclusi on sin mirar la gr aca. Para ello argumentamos que f
0
ha de tener el
mismo signo en todos los puntos de cada intervalo
_
, 1/

3
_
,
_
1/

3, 1/

3
_
,
_
1/

3, +
_
,
ya que es claramente continua y en ellos no toma el valor 0. Si tomara signos
distintos, debera anularse, por el segundo teorema de Weierstrass. Basta eva-
luar f
0
en un punto cualquiera de cada intervalo para concluir que la derivada
es positiva en el primero, negativa en el segundo y positiva en el tercero.
94 Captulo 3. Calculo diferencial de una variable
Ahora bien, que la derivada sea positiva signica que, en todo punto, la
funci on experimenta incrementos positivos ante incrementos positivos de la va-
riable, luego ha de ser creciente en los intervalos primero y tercero, mientras
que, an alogamente, ha de ser decreciente en el segundo, ya que, en este inter-
valo, incrementos positivos de la variable dan lugar a incrementos negativos de
la funci on.
7
Por consiguiente, el punto 1/

3, donde la funci on pasa de ser cre-


ciente a ser decreciente, ha de ser un m aximo local, mientras que 1/

3, donde
pasa de ser decreciente a ser creciente, ha de ser un mnimo local.
Ahora vamos a demostrar la relaci on que acabamos de utilizar entre el signo
de la derivada y la monotona de una funci on. En realidad vamos a obtener
mucho m as que esto:
Teorema 3.22 (Teorema de la funci on inversa) Sea f : ]a, b[ R una
funci on derivable cuya derivada nunca tome el valor 0. Entonces:
a) f es estrictamente mon otona.
b) Si f es mon otona creciente, entonces f
0
(x) > 0 para todo x ]a, b[.
c) Si f es mon otona decreciente, entonces f
0
(x) < 0 para todo x ]a, b[.
d) Existe un intervalo abierto I tal que f : ]a, b[ I es biyectiva.
e) La funci on f
1
: I ]a, b[ es derivable y, si x ]a, b[ y llamamos
y = f(x) I, se cumple que
(f
1
)
0
(y) =
1
f
0
(x)
.
Demostraci on: Podemos suponer que los datos son est andar. La funci on
f ha de ser inyectiva, pues si existieran n umeros a < x < y < b tales que
f(x) = f(y), el teorema anterior aplicado al intervalo [x, y] nos dara un punto
donde la derivada de f valdra 0.
Por el teorema 3.13, sabemos que f es mon otona (estricta, porque es inyec-
tiva). Si es mon otona creciente, entonces, para todo x ]a, b[ est andar y todo
h 0 no nulo, tenemos que
f(x +h) f(x)
h
> 0,
luego tambien f
0
(x) > 0. Igualmente se razona que si f es decreciente la derivada
es negativa.
Sea I la imagen de f, de modo que f : ]a, b[ I biyectiva. Hemos de
probar que I es un intervalo abierto. Supongamos que f es mon otona creciente.
7
Esto es lo que cabe esperar que suceda, teniendo en cuenta la interpretaci on de la derivada
como el incremento instant aneo de la funci on. No obstante, todava no hemos demostrado
que una funci on con derivada positiva es creciente y una funci on con derivada negativa es
decreciente. Lo probamos justo a continuaci on.
3.3. Funciones derivables 95
En el caso contrario se razona an alogamente. Probaremos que I es un intervalo
mediante el teorema 2.64. Si , I y < < , entonces existen x, y ]a, b[
tales que f(x) = , f(y) = . Por la monotona, ha de ser x < y. Por el
teorema 3.11 existe un z ]x, y[ tal que f(z) = , luego I.
Falta probar que I es abierto. Esto es consecuencia de que, si I, entonces
existe un x ]a, b[ tal que f(x) = . Si h > 0 es innitesimal, entonces
xh < x < x+h, luego f(xh) < < f(x+h) y los dos extremos est an en I,
luego no puede ser uno de los extremos de I. En otras palabras, los extremos
de I no pertenecen a I, luego I es un intervalo abierto.
Sea h 0 no nulo y sea h
0
= f
1
(y +h) f
1
(y) 6= 0, de modo que
f
1
(y +h) = x +h
0
,
luego f(x + h
0
) = f(x) + h. Observemos que h
0
es innitesimal, pues si no lo
fuera habra un n umero est andar r entre x y x+h
0
, con lo que f(r) estara entre
f(x) y f(x +h
0
), con lo que f(x) 6 f(x +h
0
) y h 6 0.
Ahora basta observar que
f
1
(y +h) f
1
(y)
h
=
h
0
f(x +h
0
) f(x)
=
1
f(x+h
0
)f(x)
h
0

1
f
0
(x)
.
Por consiguiente (f
1
)
0
(y) = 1/f
0
(x).
Por ejemplo, ahora podemos calcular f acilmente la derivada de la raz n-sima:
Teorema 3.23 La funci on f(x) =
n

x es derivable en ]0, +[ y su derivada


es
f
0
(x) =
1
n
n

x
n1
.
Demostraci on: La funci on g : ]0, +[ ]0, +[ dada por g(y) = y
n
es derivable y su derivada g
0
(y) = ny
n1
no se anula. Su inversa es claramente
la funci on f del enunciado, luego, por el teorema anterior, es derivable, y si
x = y
n
, tenemos que
f
0
(x) =
1
g
0
(y)
=
1
ny
n1
=
1
n
n

x
n1
.
Ejercicio: Probar que si f : ]a, b[ R es derivable y su derivada toma valores
positivos y negativos, entonces tambien toma el valor 0. Generalizar este hecho para
probar que si f
0
(u) < < f
0
(v), existe un w entre u y v tal que f
0
(w) = .
Ejercicio: Supongamos que f : [a, b] R es continua en [a, b] y derivable en ]a, b[ y
que la derivada no se anula en ning un punto. Demostrar que f es mon otona estricta
en [a, b]. (El teorema de la funci on inversa s olo prueba que lo es en ]a, b[.)
Es evidente que las funciones constantes tienen derivada nula. En cambio, no
es tan f acil probar que si una funci on tiene derivada nula (en todos los puntos)
96 Captulo 3. Calculo diferencial de una variable
es necesariamente constante. Esto es una consecuencia del llamado teorema
del valor medio, que deduciremos de un resultado ligeramente m as general.
Previamente, necesitamos el siguiente hecho elemental:
Teorema 3.24 (Teorema de Rolle) Si f : [a, b] R es una funci on conti-
nua en [a, b] y derivable en ]a, b[ y f(a) = f(b), entonces existe un c ]a, b[ tal
que f
0
(c) = 0.
Demostraci on: Si f es constante, entonces su derivada vale 0 en todos los
puntos. En caso contrario, existe un punto x ]a, b[ tal que f(x) 6= f(a). Esto
implica que, o bien f no toma su m aximo valor en a y en b, o bien f no toma
su mnimo valor en dichos puntos.
Por el teorema 3.10 existen puntos en [a, b] donde f toma su m aximo valor
y su mnimo valor. Seg un lo dicho, uno de ellos, digamos c, es distinto de a
y b. Si f toma un valor m aximo o mnimo global en c ]a, b[, entonces toma
tambien un m aximo o mnimo local y, por el teorema anterior, f
0
(c) = 0.
Teorema 3.25 (Teorema de Cauchy) Sean f, g : [a, b] R funciones
continuas en [a, b] y derivables en ]a, b[. Existe un c ]a, b[ tal que
f
0
(c)(g(b) g(a)) = g
0
(c)(f(b) f(a)).
Demostraci on: Llamemos h(x) = f(x)(g(b) g(a)) g(x)(f(b) f(a)),
que es una funci on continua en [a, b] y derivable en ]a, b[. Adem as
h(b) = h(a) = g(b)f(a) f(b)g(a).
El teorema de Rolle nos da un punto c ]a, b[ donde h
0
(c) = 0, pero esto es
la f ormula del enunciado.
El teorema siguiente es el caso particular del anterior cuando tomamos como
funci on g la identidad g(x) = x:
Teorema 3.26 (Teorema del valor medio) Sea f : [a, b] R una funci on
continua en [a, b] y derivable en ]a, b[. Entonces existe un c ]a, b[ tal que
f(b) f(a) = f
0
(c)(b a).
Como consecuencia podemos probar lo que habamos armado:
Teorema 3.27 Si una funci on f : [a, b] R es continua en [a, b] y tiene
derivada nula en ]a, b[, entonces es constante.
Demostraci on: Para cualquier par de puntos u, v [a, b], el teorema
anterior nos da que f(u) f(v) = 0.
Equivalentemente, si dos funciones f, g : ]a, b[ R son derivables y f
0
= g
0
,
entonces f = g +k, para cierto k R.
3.3. Funciones derivables 97
Otra aplicaci on del teorema del valor medio es el estudio de la concavidad o
convexidad de una funci on. La interpretaci on geometrica de la concavidad y la
convexidad es que una funci on es convexa si al unir dos puntos de su gr aca con
un segmento L, este queda por encima de la gr aca, mientras que es c oncava si
queda por debajo.
x z y
f
L
Funci on convexa Funci on c oncava
x z
f
L
y
Para concretar, jemos una funci on f : [a, b] R y consideremos dos
puntos a x < y b. Llamemos L : [x, y] R a la funci on dada por
L(z) = f(x) +
f(y) f(x)
y x
(z x),
cuya gr aca es claramente el segmento que une el punto (x, f(x)) con (y, f(y)).
La funci on f ser a convexa si f(z) L(z) para todo punto x < z < y, y ser a
c oncava si se da la desigualdad contraria. No obstante, vamos a reformular esto
de una forma m as conveniente.
Para ello observamos que la funci on g() = (1 )x +y cumple g(0) = x,
g(1) = y y g
0
() = y x > 0, de donde se deduce que g : [0, 1] [x, y] es
biyectiva y creciente.
As pues, cada punto x < z < y se expresa de forma unica como
z = (1 )x +y, 0 < < 1.
En estos terminos,
L(z) = L(x (y x)) = f(x) +(f(y) f(x)) = (1 )f(x) +f(y).
As pues, podemos dar la siguiente denici on de concavidad y convexidad:
Denici on 3.28 Una funci on f : [a, b] R es convexa si para todo par de
puntos a x < y b y todo n umero 0 < < 1 se cumple que
f((1 )x +y) (1 )f(x) +f(y).
Si se da la desigualdad contraria, la funci on es c oncava.
Por ejemplo, la gr aca de la p agina 77 muestra que la funci on
f(x) =
x
3
x + 1
3
es c oncava en ], 0] y es convexa en [0, +[. El teorema siguiente nos da la
forma de comprobarlo analticamente:
98 Captulo 3. Calculo diferencial de una variable
Teorema 3.29 Sea f : [a, b] R una funci on continua en [a, b] y derivable
en ]a, b[. Si f
0
es mon otona creciente (resp. decreciente) en ]a, b[, entonces f es
convexa (resp. c oncava) en [a, b].
Demostraci on: Supongamos que f
0
es creciente (el caso contrario es
an alogo). Tomemos a x < y b y 0 < < 1 y llamemos z = (1)x+y. He-
mos de probar que f(z) (1)f(x)+f(y). Como f(z) = (1)f(z)+f(z),
esto equivale a
(1 )f(z) +f(z) (1 )f(x) +f(y),
o
(1 )(f(z) f(x)) (f(y) f(z)).
Por el teorema del valor medio, existen n umeros x < c < z < d < y tales
que
f(z) f(x) = f
0
(c)(z x), f(y) f(z) = f
0
(d)(y z).
Por otra parte,
(1 )(z x) = (1 )((1 )x +y x) = (1 )(y x)
= (y (1 )x y) = (y z),
con lo que
(1 )(f(z) f(x)) = (1 )f
0
(c)(z x) f
0
(d)(y z) = (f(y) f(z)),
que era lo que tenamos que probar.
Ejemplo Consideremos nuevamente la funci on
f(x) =
x
3
x + 1
3
cuya gr aca est a en la p agina 77. Vamos a estudiar su concavidad y convexidad.
Para ello calculamos su derivada
f
0
(x) =
3x
2
1
3
Hemos de estudiar d onde es creciente y d onde es decreciente esta funci on.
Como tambien es derivable, podemos hacerlo a traves de su derivada, que es lo
que se conoce como segunda derivada de la funci on f:
f
00
(x) = 2x.
Claramente f
00
(x) < 0 en ], 0[ y f
00
(x) > 0 en ]0, +[. Esto implica que
f
0
es decreciente en el primer intervalo y creciente en el segundo, luego, tal y
como muestra la gr aca, f es c oncava en el primer intervalo y convexa en el
segundo.
3.4. Derivadas sucesivas, la f ormula de Taylor 99
3.4 Derivadas sucesivas, la f ormula de Taylor
Denici on 3.30 Si f : D R R es derivable en un abierto D, a su
derivada f
0
se la llama tambien primera derivada de f, y se representa por
f
1)
: D R. Si esta es, a su vez, derivable, su derivada se llama derivada
segunda de f, y se representa por f
2)
: D R. Diremos que una funci on es
k-veces derivable en D si se pueden calcular de este modo sus derivadas hasta
f
k)
: D R. Estas derivadas se llaman derivadas sucesivas de f. (Es util
adoptar el convenio de que f
0)
= f.) Diremos que f es innitamente derivable
(o de clase C

) en D si existe f
k)
para todo k N.
Diremos que f es de clase C
k
en D si existen las derivadas hasta orden k
y son continuas. (En realidad la cuesti on es que sea continua f
k)
, porque las
anteriores lo ser an por ser derivables.)
De los resultados que hemos visto sobre continuidad y derivabilidad se sigue
inmediatamente que la suma y el producto de funciones de clase C
k
es de clase
C
k
, as como el cociente, si la funci on denominador no se anula. La composici on
de funciones de clase C
k
es de clase C
k
. (Todo esto para k N y tambien para
k = .) Si llamamos C
k
(D) al conjunto de las funciones de clase C
k
en D,
tenemos que C
k
(D) es un subanillo de C
0
(D) = C(D). Claramente contiene a
todas las funciones polin omicas.
Si f : D R R es una funci on derivable en a D, sabemos que f toma,
cerca de a, valores muy similares a su recta tangente:
t(x) = f(a) +f
0
(a)(x a).
Ello se debe esencialmente a que f(a) = t(a) y f
0
(a) = t
0
(a). Cabe esperar
que, cuantas m as derivadas sucesivas tengan en com un dos funciones en un
punto, m as parecidas ser an alrededor de dicho punto. Esto no tiene por que
ser necesariamente as, pero cabe investigar en que condiciones la igualdad de
derivadas se traduce en similitud de las gr acas.
As pues, vamos a estudiar la posibilidad de aproximar funciones con poli-
nomios que compartan derivadas sucesivas en un punto. El punto de partida es
el teorema siguiente:
Teorema 3.31 Dada una funci on f : D R R derivable k veces en D y
dado un punto a D, existe un unico polinomio T
k
a
f(x) de grado k tal que
(T
a
f)
i)
(a) = f
i)
(a) para i = 0, . . . , k. Concretamente, es el dado por:
T
k
a
f(x) =
k

n=0
f
n)
(a)
n!
(x a)
n
.
Demostraci on: Consideremos un polinomio de la forma
P(x) =
k

n=0
c
n
(x a)
n
,
100 Captulo 3. Calculo diferencial de una variable
y vamos a ver que podemos determinar de forma unica los coecientes c
n
para
que sus derivadas coincidan con las de f hasta el orden k. Si derivamos:
P
1)
(x) =
k

n=1
nc
n
(x a)
n1
, P
1)
(a) = c
1
,
P
2)
(x) =
k

n=2
n(n 1)c
n
(x a)
n2
, P
2)
(a) = 2c
2
,
P
3)
(x) =
k

n=3
n(n 1)(n 2)c
n
(x a)
n3
, P
3)
(a) = 3 2c
3
,
y es f acil ver que, en general, ha de ser P
n)
(a) = n!c
n
. As pues, para que las
derivadas de P coincidan con las de f en el punto a, los coecientes han de ser
necesariamente
c
n
=
P
n)
(a)
n!
.
Denici on 3.32 Si f : D R R es k-veces derivable en el abierto D,
llamaremos polinomio de Taylor de grado k de f en el punto a al polinomio
T
k
a
f(x) =
k

n=0
f
n)
(a)
n!
(x a)
n
.
Observemos que T
1
a
f(x) = f(a)+f
0
(a)(xa) es la recta tangente a la gr aca
de f en el punto a.
Los polinomios de Taylor son utiles para calcular aproximadamente mu-
chas funciones, pero esto requiere tener informaci on sobre el error de la aproxi-
maci on, es decir, sobre lo que podemos llamar el resto de Taylor de orden k de
la funci on f:
R
k
a
f(x) = f(x) T
k
a
f(x)
El caso ideal se da cuando f es de clase C

en D y, para todo x D, se
cumple que lm
k
R
k
a
f(x) = 0, pues esto signica que podemos expresar la funci on
f como serie innita:
8
f(x) =

k=0
f
n)
(a)
n!
(x a)
n
.
Esta serie, tanto si converge como si no y, en caso de que converja, tanto si
converge a f como si no, se llama serie de Taylor de la funci on f alrededor del
punto a.
8
Dada una sucesi on {x
n
}
n0
, su serie asociada es la sucesi on

n=0
x
n
= {S
m
}
m0
, donde
S
m
=
m

n=0
x
n
= x
0
+ +x
m
. Los terminos S
m
se llaman sumas parciales de la serie. Cuando
la serie es convergente, su lmite (llamado suma) se representa igualmente por

n=0
x
n
.
3.4. Derivadas sucesivas, la f ormula de Taylor 101
Teorema 3.33 Sea f : I R R una funci on derivable k + 1 veces en un
intervalo abierto I y sea a I. Para todo x I, x 6= a, existe un c estrictamente
comprendido entre a y x tal que
f(x) = T
k
a
f(x) +
f
k+1)
(c)
(k + 1)!
(x a)
k+1
.
Demostraci on: Supongamos, por concretar, que a < x. Consideremos la
funci on F : [a, x] R dada por
F(t) = f(t) +
k

n=1
f
n)
(t)
n!
(x t)
n
.
Claramente, F(x) = f(x) y F(a) = T
k
a
f(x), luego queremos estudiar la
diferencia F(x)F(a). Claramente, F es continua en [a, x] y derivable en ]a, x[.
Observemos que
F
0
(t) = f
0
(t) +
k

n=1
_
f
n+1)
(t)
n!
(x t)
n

f
n)
(t)
(n 1)!
(x t)
n1

.
Vemos que se cancelan todos los terminos de la suma excepto el ultimo, de
modo que
F
0
(t) =
f
k+1)
(t)
k!
(x t)
k
Sea G : [a, x] R cualquier funci on continua en [a, x] derivable en ]a, x[.
Por el teorema de Cauchy 3.25 tenemos que existe a < c < x tal que
G
0
(c)(F(x) F(a)) = F
0
(c)(G(x) G(a)).
Si G
0
no se anula en ]a, x[, podemos escribir
f(x) T
k
a
f(x) =
G(x) G(a)
G
0
(c)
f
k+1)
(c)
k!
(x c)
k
.
La expresi on del enunciado resulta de tomar G(t) = (x t)
k+1
.
De aqu se deduce una sencilla condici on suciente para que una funci on
coincida con su serie de Taylor. Necesitamos el resultado siguiente:
Teorema 3.34 Si x 0 entonces lm
n
x
n
/n! = 0.
Demostraci on: Podemos suponer que x es est andar. Si m es un n umero
natural innito y n es el menor natural mayor que x, entonces
x
m
m!
=
x
n
n!
m1

k=n+1
x
k

x
m
0.
En efecto, el primer factor es nito porque es est andar, el segundo tambien
porque todos los terminos son menores que 1 y el tercero es innitesimal.
102 Captulo 3. Calculo diferencial de una variable
Teorema 3.35 Sea f : I R una funci on de clase C

en un intervalo
abierto I, sea a I y sea x I tal que las derivadas sucesivas de f esten
uniformemente acotadas en el intervalo de extremos a y x, es decir, tal que
exista una constante M de modo que |f
n)
(t)| M
n
para todo n N y todo t
en dicho intervalo. Entonces
f(x) =

n=0
f
n)
(a)
n!
(x a)
n
.
Demostraci on: Hemos de probar que
lm
k
(f(x) T
k
a
f(x)) = 0.
Por el teorema 3.33 sabemos que existe un c entre a y x tal que
|f(x) T
k
a
f(x)| =

f
k+1)
(c)
(k + 1)!
(x a)
k+1

=
|f
k+1)
(c)|
(k + 1)!
|x a|
k+1

(M|x a|)
k+1
(k + 1)!
0
cuando k es innito, por el teorema anterior.
En la secci on siguiente veremos algunas aplicaciones de este teorema.
3.5 Exponenciales y logaritmos
Vamos a demostrar que, para cada a R, a > 0, existe una unica funci on
continua a
( )
: R R que cumple a
1
= a y satisface la ecuaci on funcional
a
x+y
= a
x
a
y
, para todo x, y R.
Veamos algunas propiedades que ha de tener esta funci on exponencial:
a) a
0
= 1, pues a = a
1
= a
1+0
= a
1
a
0
= aa
0
, luego a
0
6= 0 y, como
a
0
= a
0+0
= a
0
a
0
, ha de ser a
0
= 1.
b) a
x
6= 0 y a
x
= 1/a
x
, pues a
x
a
x
= a
0
= 1.
c) Si m Z, entonces a
m
coincide con la exponencial usual para n umeros
enteros en un cuerpo. La ecuaci on funcional implica que esto es as para
m > 0, sabemos que a
0
= 1 y el apartado b) nos da que tambien es cierto
para m < 0.
d) a
x
> 0, pues a
1
= a > 0 y, si a
x
< 0 para alg un x, la continuidad implica
que la exponencial tendra que anularse en alg un punto.
e) a
m/n
=
n

a
m
, para todo m/n Q (n > 0). En efecto, la ecuaci on
funcional implica que (a
m/n
)
n
= a
m
y sabemos que a
m/n
> 0, luego ha
de ser a
m/n
=
n

a
m
.
3.5. Exponenciales y logaritmos 103
El apartado e) junto al teorema 3.14, implica que, si existe la funci on expo-
nencial a
x
, es unica.
Demostraremos que la funci on exponencial f(x) = a
x
es, de hecho, derivable
en R. Admitiendo que lo es, podemos calcular su derivada: Si x R es est andar
y h es innitesimal, tenemos que
a
x+h
a
x
h
= a
x
a
h
1
h
f
0
(0) a
x
.
As pues, si llamamos k
a
= f
0
(0), tenemos que f
0
(x) = k
a
a
x
. Esto implica,
a su vez, que, si es derivable, la exponencial es de clase C

en R.
Empezaremos demostrando que podemos escoger una base e > 0 tal que la
exponencial e
x
existe y cumple k
e
= 1, de modo que coincide con su propia
derivada. Esta condici on, junto con que e
0
= 1, determina completamente la
funci on que buscamos. En efecto: Fijado x R, no nulo, como e
x
ha de ser
continua, el teorema 3.10 nos da que ha de estar acotada en el intervalo [0, x] (o
[x, 0]), es decir, que existe un M tal que |e
t
| M para todo t [0, x] (o [x, 0]).
Como las derivadas de e
x
han de ser ellas mismas, la cota vale para sus innitas
derivadas, y el teorema 3.35 (con a = 0) nos da que se ha de cumplir
e
x
=

n=0
x
n
n!
.
Hasta aqu, lo unico que hemos demostrado es que, si existe una funci on e
x
que sea igual a su propia derivada y que cumpla e
0
= 1, ha de venir dada por el
desarrollo en serie que acabamos de indicar. Seguidamente demostramos, para
empezar, que dicha serie siempre converge:
Teorema 3.36 Para cada x R, la serie

n=0
x
n
n!
es convergente.
Demostraci on: Basta probar que converge cuando x es est andar. A su vez,
basta ver que la serie es de Cauchy. Para ello tomamos dos n umeros naturales
innitos m < p y hemos de ver que S
p
(x) S
m
(x) 0. Ahora bien:
9

n=m
x
n
n!

n=m
|x|
n
n!
=
|x|
m
m!
p

n=m
|x|
nm
n!/m!

|x|
m
m!
p

n=m
(|x|/m)
nm
=
|x|
m
m!
1 (|x|/m)
pm+1
1 |x|/m
0.
Aqu usamos que el segundo factor es nito (teniendo en cuenta el teo-
rema 2.20) y el primero es innitesimal por el teorema 3.34.
9
La ultima igualdad se basa en la conocida f ormula para la suma de una serie geometrica
nita:
1 +x +x
2
+ +x
n
=
1 x
n+1
1 x
.
104 Captulo 3. Calculo diferencial de una variable
Denici on 3.37 Llamaremos funci on exponencial a la funci on e
x
: R R
dada por
e
x
=

n=0
x
n
n!
= 1 +x +
x
2
+
x
2
3
+
x
3
6
+
Claramente, se trata de una funci on est andar y cumple e
0
= 1. Ahora
probamos que cumple la ecuaci on funcional esperada:
Teorema 3.38 Para todo par de n umeros reales x, y se cumple que
e
x+y
= e
x
e
y
.
Demostraci on: Podemos suponer que x e y son est andar. Sea m N
innito. Entonces
10
e
x
e
y

i=0
x
i
i!
m

j=0
y
j
j!
=
2m

n=0
n

k=0
1
k!(n k)!
x
k
y
nk
=
2m

n=0
1
n!
n

k=0
_
n
k

x
k
y
nk
=
2m

n=0
(x +y)
n
n!
e
x+y
.
Como el primer y el ultimo termino son est andar, tenemos e
x+y
= e
x
e
y
.
M as a un, la funci on exponencial tambien cumple la propiedad que nos ha
llevado hasta su serie de Taylor:
Teorema 3.39 La funci on exponencial es derivable en R, y su derivada es ella
misma.
Demostraci on: Tomemos x R est andar y h 0 no nulo. Entonces
e
x+h
e
x
h
= e
x
e
h
1
h
.
Basta probar que
e
h
1
h
1.
Tomamos primero un x est andar tal que 0 < |x| < 1. Entonces, para todo
natural innito m, se cumple
e
x
1 +
x
1!
+
x
2
2!
+ +
x
m
m!
,
y as (usando que 1/x es est andar, luego nito)
e
x
1
x
1
x
2!
+ +
x
m1
m!
.
10
Notemos que todos los sumatorios siguientes son sumas nitas, lo cual justica todas las
manipulaciones de ndices.
3.5. Exponenciales y logaritmos 105
Por consiguiente, usando nuevamente la f ormula de las series geometricas:

e
x
1
x
1

< |x| + + |x|


m2
=
|x| |x|
m1
1 |x|

|x|
1 |x|
y, como los extremos son est andar, tenemos la desigualdad

e
x
1
x
1

<
|x|
1 |x|
.
En principio, esto vale para todo x est andar tal que 0 < |x| < 1, pero por
transferencia vale incluso para el innitesimo h, es decir,

e
h
1
h
1

<
|h|
1 |h|
0.
A partir de aqu ya podemos armar que e
x
cumple todas las propiedades
que hemos deducido al principio de la secci on para a igual al n umero
11
e = e
1
=

n=0
1
n!
= 2.718281828459. . .
En particular sabemos que e
x
> 0, y lo mismo vale para su derivada, porque
es ella misma. Esto nos permite aplicar el teorema de la funci on inversa.
Teorema 3.40 La funci on exponencial e
x
: R ]0, +[ es biyectiva y mon o-
tona creciente.
Demostraci on: El teorema de la funci on inversa nos da que la exponencial
es mon otona creciente y que biyecta R con un intervalo abierto. De la propia
denici on de la exponencial (mirando los dos primeros terminos de la serie) se
sigue que, si x > 0, entonces x < 1 +x < e
x
.
Aplicando esto a 1/x, vemos que 1/x < e
1/x
= 1/e
1/x
, luego, en denitiva,
e
1/x
< x < e
x
.
Como la imagen de la exponencial es un intervalo, esto prueba que contiene
a todo x > 0, luego ha de ser ]0, +[.
En particular, el teorema de la funci on inversa que acabamos de aplicarle a
la exponencial garantiza que existe la funci on inversa y es derivable:
Denici on 3.41 Llamaremos logaritmo a la funci on inversa de la funci on ex-
ponencial:
log : ]0, +[ R
11
Una regla mnemotecnica para las primeras cifras del n umero e es contar las letras de cada
palabra de la frase te ayudare a recordar la cantidad.
106 Captulo 3. Calculo diferencial de una variable
El logaritmo existe y es derivable por el teorema de la funci on inversa. Si
f(x) = log x y llamamos y = log x, de modo que x = e
y
, dicho teorema nos da
que
f
0
(x) =
1
e
y
=
1
x
.
-2 -1 1 2 3 4
-2
-1
1
2
3
4
e
x
log x La gura muestra las gr acas de las funciones
exponencial y logaritmo. Las relaciones e
0
= 1 y
e
1
= e se traducen en que log 1 = 0 y log e = 1. A
su vez, la ecuaci on funcional de la exponencial da
lugar a otra para el logaritmo:
log xy = log x + log y.
En efecto, si x = e
u
, y = e
v
, entonces xy = e
u+v
, luego
log xy = u +v = log x + log y.
De aqu se sigue que, para todo n Z,
log x
n
= nlog x.
En principio se cumple para n 0, pero la relaci on log x
1
+ log x = log 1 = 0
permite extender la relaci on a todos los enteros.
El teorema siguiente proporciona la que podramos haber tomado como de-
nici on alternativa de la funci on exponencial. En particular muestra que 1

es
una indeterminaci on.
Teorema 3.42 Para todo x R se cumple que
e
x
= lm
n

1 +
x
n
_
n
.
Demostraci on: Basta probarlo para x est andar. Como log x tiene derivada
igual a 1 en x = 1, si h 0, tenemos que
log(1 +h)
h
1.
Aplicamos esto a h = x/n, donde n N es innito. Entonces
nlog

1 +
x
n
_
x.
Equivalentemente:
log

1 +
x
n
_
n
x
y, como la exponencial es continua en x, tenemos que

1 +
x
n
_
n
e
x
.
3.5. Exponenciales y logaritmos 107
En particular,
e = lm
n
_
1 +
1
n

n
.
Ahora ya podemos denir la exponencial para cualquier base a > 0:
Denici on 3.43 Para cada a R, a > 0, denimos la funci on exponencial
a
x
= e
xlog a
.
Obviamente, la exponencial es continua y cumple a
1
= a, as como la
ecuaci on funcional a
x+y
= a
x
a
y
. Por la discusi on vista al principio de la secci on,
es la unica funci on con estas propiedades. Tambien es claro que f(x) = a
x
es
derivable en R, y su derivada es
f
0
(x) = a
x
log a.
Observemos que, para a = e, la exponencial que acabamos de denir es la
que ya tenamos denida. Ahora podemos generalizar las propiedades de la
exponencial y el logaritmo:
(e
x
)
y
= e
xy
, log x
y
= y log x.
En efecto, por denici on
(e
x
)
y
= e
y log e
x
= e
yx
.
Como x
y
= e
y log x
, tenemos que log x
y
= y log x.
Ejercicio: Demostrar que a
( )
: R ]0, +[ es creciente si a > 1, decreciente si
a < 1 y constante si a = 1. Si a 6= 1, su inversa viene dada por
log
a
x =
log x
log a
.
Ejercicio: Demostrar que la funci on f(x) = x

tiene derivada f
0
(x) = x
1
en
]0, +[.
Teorema 3.44 El n umero e es irracional.
Demostraci on: Seg un el teorema 3.33:
e
k

n=0
1
n!
=
e
c
(k + 1)!
,
para un cierto n umero 0 < c < 1. Teniendo en cuenta que e
c
< e < 3, vemos
que
1
(k + 1)!
< e
k

n=0
1
n!
<
3
(k + 1)!
,
108 Captulo 3. Calculo diferencial de una variable
luego
0 <
1
k + 1
< k! e
k

n=0
k!
n!
<
3
k + 1

3
4
,
para k 3. El sumatorio es un n umero entero. Si e fuera racional podramos
tomar k sucientemente grande como para que k! e fuera tambien entero, pero
entonces tendramos un entero m tal que 0 < m < 3/4, lo cual es absurdo.
-1 1 2 3 4 5
0.2
0.4
0.6
0.8
f(x)
Ejemplo La funci on f : R R dada por
f(x) =
_
0 si x 0,
e
1/x
si x > 0.
es de clase C

y cumple f
n)
(0) = 0 para todo
n N. Por lo tanto, no coincide con su serie de
Taylor (que es identicamente nula).
La gura muestra la gr aca de la funci on f. Aunque es > 0 para todo x > 0,
vemos que se confunde con el eje horizontal en un intervalo apreciable.
Vamos a probar que las derivadas de f tienen la forma siguiente:
f
n)
(x) =

0 si x 0,
e
1/x
P(x)
x
2n
si x > 0,
donde P(x) es un polinomio de grado n.
Razonamos por inducci on sobre n. Se cumple claramente para n = 0. Si
es cierto para n, es obvio que, para x < 0, existe f
n+1)
(0) = 0. Para x > 0
tambien es claro que existe la derivada, y es
f
n+1)
(x) = e
1/x
P(x)
x
2n+2
+e
1/x
P
0
(x)x
2n
2nP(x)x
2n1
x
4n
= e
1/x
_
P(x)
x
2(n+1)
+
P
0
(x)x 2nP(x)
x
2n+1

= e
1/x
P(x) +P
0
(x)x
2
2nxP(x)
x
2(n+1)
.
Es claro que el numerador es un polinomio de grado n + 1.
Falta probar que existe f
n+1)
(0) = 0. Para ello basta ver que si h > 0 es
innitesimal, entonces
f
n)
(h) f
n)
(0)
h
= e
1/h
P(h)
h
2n+1
0.
En otras palabras, vamos a probar que, para todo polinomio P(x) y todo
n N, la funci on
g(x) =

0 si x 0,
e
1/x
P(x)
x
2n+1
si x > 0,
3.6. Lmites de funciones 109
es continua en 0. Como es una propiedad interna, podemos suponer que n y P
son est andar. Entonces, P(h) P(0) es nito. Basta probar que
e
1/h
h
2n+1
0.
Ahora bien, del desarrollo en serie de la funci on exponencial se sigue que,
para todo x > 0 y todo m N, se cumple que
x
m
m!
e
x
.
Lo aplicamos a x = 1/h y a m = 2n + 2, con lo que obtenemos
0
e
1/h
h
2n+1
(2n + 2)! h 0,
lo que concluye la prueba.
3.6 Lmites de funciones
A la hora de describir una funci on es interesante determinar c omo se com-
porta cerca de los puntos donde no est a denida:
Denici on 3.45 Sea f : D R R una funci on est andar y sea x
0
R
(est andar) un punto de acumulaci on de su dominio (es decir, un punto que
cumpla h(x) (D \ {x}) 6= ). Diremos que f converge a un punto est andar
l R cuando x tiende a x
0
, y lo representaremos por
lm
xx
0
f(x) = l,
si para todo x D tal que x x
0
y x 6= x
0
, se cumple que f(x) l.
Observemos que una funci on no puede converger a m as de un lmite (est andar)
en un mismo punto, lo cual justica que hayamos dado nombre al lmite.
En realidad hemos calculado ya muchos lmites, s olo que nunca hemos tenido
la necesidad de destacarlo. Por ejemplo, es inmediato que una funci on f es
continua en un punto de acumulaci on x
0
de su dominio si y s olo si
lm
xx
0
f(x) = f(x
0
),
y que una funci on es derivable en un punto interior x de su dominio si y s olo si
existe
f
0
(x) = lm
h0
f(x +h) f(x)
h
.
Como en el caso de las sucesiones, podemos denir lmites innitos:
110 Captulo 3. Calculo diferencial de una variable
Considerando de nuevo una funci on est andar f : D R R y un punto
de acumulaci on (est andar) x
0
de su dominio, diremos que
lm
xx
0
f(x) = +
si cuando x D, x x
0
, x 6= x
0
, se cumple que f(x) > 0 es innito.
Si f(x) es innito, pero f(x) < 0, entonces diremos que
lm
xx
0
f(x) = ,
si f(x) es innito, pero su signo puede depender de x, entonces diremos que
lm
xx
0
f(x) = .
Tambien podemos denir lmites en innito:
Denici on 3.46 Sea f : D R R una funci on est andar cuyo dominio con-
tenga puntos innitos positivos (resp. negativos) y sea l R un punto est andar.
Diremos que
lm
x+
f(x) = l (resp. lm
x
f(x) = l)
si cuando x D es innito y x > 0 (resp. x < 0) se cumple que f(x) l.
Dejamos que el lector conjeture el signicado obvio de las cuatro variantes
(seis de hecho si adem as quitamos el signo al innito de la derecha)
lm
x
f(x) = .
Todos los resultados algebraicos sobre lmites de sucesiones valen igualmente
para lmites de funciones, con las mismas pruebas. Por poner un ejemplo:
Si una funci on f : D R R no se anula en su dominio y x
0
es un punto
de acumulaci on de D:
lm
xx
0
f(x) = 0 si y s olo si lm
xx
0
1/f(x) = .
Esto se cumple porque si x D cumple x x
0
, x 6= x
0
, entonces f(x) 0
si y s olo si 1/f(x) es innito.
La relaci on entre lmites de sucesiones y lmites de funciones es tambien
elemental:
Teorema 3.47 Si f : D R R cumple que existe
lm
xx
0
f(x) = l
y {x
n
}
n0
es una sucesi on contenida en D tal que lm
n
x
n
= x
0
, entonces
lm
n
f(x
n
) = l.
3.6. Lmites de funciones 111
Esto es v alido igualmente si x
0
= o si l = .
Veamos algunos ejemplos de lmites de interes:
lm
x+
e
x
= +, lm
x
e
x
= 0.
En efecto, de la serie de Taylor de la exponencial se deduce que, para
x > 0 se cumple 1 + x < e
x
, luego si x > 0 es innito, e
x
tambien lo es.
Si x < 0 es innito, entonces e
x
es innito, luego e
x
es innitesimal.
lm
x+
log x = +, lm
x0
log x = .
En efecto, si x > 0 es innito, pero log x es nito, entonces podemos
acotarlo por n umeros est andar m < log x < M, con lo que e
m
< x < e
M
,
lo que implica que x es nito, contradicci on. (Sabemos que log x > 0
porque el logaritmo es positivo para n umeros x > 1.) Igualmente se
razona el segundo lmite.
Si a > 1, entonces lm
x+
a
x
= +, lm
x
a
x
= 0.
Se deduce de lo anterior, teniendo en cuenta que log a > 0.
Si a < 1, entonces lm
x+
a
x
= 0, lm
x
a
x
= +.
Se deduce del caso anterior, pues a
x
= (1/a)
x
.
Si > 0, entonces lm
x+
x

= +.
Se deduce de la denici on de la exponencial y de los casos anteriores.
Si < 0, entonces lm
x+
x

= 0.
Basta observar que x

= 1/x

.
Si n N es par y no nulo, lm
x
x
n
= +.
En efecto, si n = 2k y x < 0 es innito, entonces x
2
es innito y positivo,
y x
2k
> x
2
tambien lo es.
Si n N es impar y no nulo, lm
x
x
n
= .
En efecto, ahora n = 2k + 1 y, como antes, x
2k
> 0 es innito, luego
x
2k+1
< 0 tambien lo es.
Si tenemos un polinomio (est andar):
P(x) = x
n
+a
n1
x
n1
+ +a
1
x +a
0
,
podemos expresarlo en la forma
P(x) = x
n

1 +
a
n1
x
+ +
a
1
x
n1
+
a
0
x
n
_
.
112 Captulo 3. Calculo diferencial de una variable
Si M es una cota est andar para los coecientes a
i
, tenemos que

a
n1
x
+ +
a
1
x
n1
+
a
0
x
n


M
x
1 1/x
n
1 1/x
.
Esto vale para todo x 6= 0. Si x es innito, la segunda fracci on es nita, y
la primera innitesimal, luego todo el parentesis de la expresi on de P(x) est a
innitamente cerca de 1, luego es nito y positivo, y P(x) es innito y tiene el
signo de x
n
. As pues,
lm
x+
P(x) = +, lm
x
P(x) =

+ si n es par,
si n es impar.
Notemos que hemos supuesto que el coeciente director de P(x) era a
n
= 1.
El resultado vale igualmente si a
n
> 0, pero si a
n
< 0 hay que invertir todos
los signos. (Esto se demuestra expresando P(x) = a
n
Q(x), donde Q(x) tiene
coeciente director unitario.)
Teorema 3.48 Todo polinomio de grado impar se anula en al menos un punto.
Demostraci on: No perdemos generalidad si suponemos que su coeciente
director es positivo. Entonces
lm
x+
P(x) = +, lm
x
P(x) = ,
luego, si x > 0 es innito, tenemos que P(x) > 0, P(x) < 0. El teorema 3.11
implica que existe un c R tal que P(c) = 0.
Algunas reglas de derivaci on se traducen en lmites que tienen interes por s
mismos. Por ejemplo, el hecho de que la derivada de e
x
en x = 0 vale e
0
= 1
equivale a que
lm
x0
e
x
1
x
= 1.
Similarmente, el hecho de que la derivada de log x en x = 1 valga 1/1 = 1
equivale a que
lm
x0
log x
x
= 1.
Estos y otros muchos lmites pueden obtenerse a partir de una regla general:
Teorema 3.49 (Regla de LH opital) Sean f, g : ]a, b[ R dos funciones
derivables tales que g y g
0
no se anulen en ]a, b[. Supongamos que
lm
xa
f(x) = lm
xb
g(x) = 0
y que existe
lm
xa
f
0
(x)
g
0
(x)
.
Entonces existe
lm
xa
f(x)
g(x)
= lm
xa
f
0
(x)
g
0
(x)
.
3.6. Lmites de funciones 113
Demostraci on: Tomemos cualquier n umero a < t < b y consideremos las
funciones f, g : [a, t] R extendidas a a con los valores f(a) = g(a) = 0. Es
claro que as son continuas en [a, t] y derivables en ]a, t[. Podemos aplicar el
teorema de Cauchy 3.25, seg un el cual existe un n umero a < c < t tal que
(f(t) f(a))g
0
(c) = (g(t) g(a))f
0
(c).
Como g
0
no se anula, g es estrictamente mon otona, luego el segundo factor
no es nulo. Podemos despejar:
f(t)
g(t)
=
f
0
(c)
g
0
(c)
.
Hemos tomado un t arbitrario. Si lo escogemos t a, entonces tambien
c a, con lo que
f(t)
g(t)
lm
xa
f
0
(x)
g
0
(x)
,
y esto prueba el teorema.
Es evidente que la regla de Lh opital vale igualmente con lmites cuando
x b e incluso, combinando los casos ]a, c[ y ]c, b[, se demuestra trivialmente
esta otra versi on:
Teorema 3.50 (Regla de LH opital) Sean f, g : ]a, b[ R dos funciones
derivables tales que g y g
0
no se anulen en ]a, b[ excepto en un punto a < c < b.
Supongamos que f(c) = g(c) = 0 y que existe
lm
xc
f
0
(x)
g
0
(x)
.
Entonces existe
lm
xc
f(x)
g(x)
= lm
xc
f
0
(x)
g
0
(x)
.
Tambien es f acil deducir una versi on para lmites en :
Teorema 3.51 (Regla de LH opital) Sean f, g : ]a, +[ R dos funcio-
nes derivables tales que g y g
0
no se anulan. Supongamos que existen
lm
x+
f(x) = lm
x+
g(x) = 0
as como
lm
x+
f
0
(x)
g
0
(x)
.
Entonces existe
lm
x+
f(x)
g(x)
= lm
x+
f
0
(x)
g
0
(x)
.
114 Captulo 3. Calculo diferencial de una variable
Demostraci on: Podemos suponer a > 0. Basta considerar las funciones
F, G : ]0, 1/a[ R
dadas por F(x) = f(1/x), G(x) = g(1/x). Es claro que son derivables, as como
que existe
lm
x0
F(x) = lm
x0
G(x) = 0,
y
lm
x0
F
0
(x)
G
0
(x)
= lm
x0
f
0
(1/x)
1
x
2
g
0
(1/x)
1
x
2
= lm
x+
f
0
(x)
g
0
(x)
.
(Notemos tambien que ni Gni G
0
se anulan.) Por la versi on ya probada, sabemos
que existe
lm
x0
F(x)
G(x)
= lm
x+
f
0
(x)
g
0
(x)
,
pero esto equivale a
lm
x+
f(x)
g(x)
= lm
x+
f
0
(x)
g
0
(x)
.
De aqu deducimos a su vez una versi on para el caso en que las funciones
tienden a innito:
Teorema 3.52 (Regla de LH opital) Sean f, g : ]a, +[ R dos funcio-
nes derivables tales que g y g
0
no se anulen en ]a, +[. Supongamos que
lm
x+
f(x) = lm
x+
g(x) =
y que existe
lm
x+
f
0
(x)
g
0
(x)
.
Entonces existe
lm
x+
f(x)
g(x)
= lm
x+
f
0
(x)
g
0
(x)
.
Demostraci on: Podemos suponer que todos los datos son est andar. Sea
L = lm
x+
f
0
(x)
g
0
(x)
.
Esto implica que si M > a es innito y c > M, entonces
f
0
(c)
g
0
(c)
L,
luego, en particular,

f
0
(c)
g
0
(c)
L

< .
3.6. Lmites de funciones 115
Por transferencia, esto es v alido tambien para todo c mayor que un cierto
M > a est andar. Sea x > a un n umero real innito. Por el teorema de
Cauchy 3.25, existe un n umero M < c < x tal que
f(x) f(M)
g(x) g(M)
=
f
0
(c)
g
0
(c)
.
Notemos que, como g
0
no se anula, la funci on g es mon otona, luego el denomi-
nador de la izquierda es no nulo. Observemos ahora que
f(x)
g(x)
=
f(x) f(M)
g(x) g(M)
f(x)
f(x) f(M)
g(x) g(M)
g(x)
,
y
f(x)
f(x) f(M)
=
1
1 f(M)/f(x)
1,
g(x) g(M)
g(x)
= 1
g(M)
g(x)
1,
luego
f(x)
g(x)

f
0
(c)
g
0
(c)
,
donde hemos usado que el cociente de la derecha es nito, tanto si c es nito
como si es innito. Por consiguiente:

f(x)
g(x)
L

< .
Esto vale para todo x innito, luego tambien vale para todo x > x
0
, donde
x
0
> a es un n umero est andar que depende de , pero si x > 0 es innito,
cumplir a x > x
0
para cualquier x
0
est andar, luego cumplir a la desigualdad
anterior para todo > 0 est andar. As pues,
f(x)
g(x)
L,
luego
lm
x+
f(x)
g(x)
= L.
Dejamos como ejercicio la prueba de este ultimo caso (que tiene su versi on
an aloga con lmites en b en lugar de en a):
Teorema 3.53 (Regla de LH opital) Sean f, g : ]a, b[ R dos funciones
derivables tales que g y g
0
no se anulen en ]a, b[. Supongamos que
lm
xa
f(x) = lm
xa
g(x) =
y que existe
lm
xa
f
0
(x)
g
0
(x)
.
Entonces existe
lm
xa
f(x)
g(x)
= lm
xa
f
0
(x)
g
0
(x)
.
116 Captulo 3. Calculo diferencial de una variable
-2 -1 1 2
-3
-2
-1
1
2
3
Ejercicio: Estudiar las funciones seno hiperb olico y co-
seno hiperb olico, denidas como sigue:
senhx =
e
x
e
x
2
, coshx =
e
x
e
x
2
.
Demostrar que senh
0
x = coshx, cosh
0
x = senhx, que
satisfacen la relaci on
cosh
2
x senh
2
x = 1
as como que cumplen todas las propiedades que mues-
tran sus gr acas (crecimiento, decrecimiento, m aximos y
mnimos, concavidad y convexidad, lmites en ).
Demostrar que las restricciones
senh : R R, cosh : [0, +[ [1, +[
son biyectivas, por lo que existen las inversas
arg senh : R R, arg cos h : [1, +[ [0, +[ ,
(llamadas argumento del seno hiperb olico y argumento del coseno hiperb olico.)
Demostrar que sus derivadas son
arg senh
0
(x) =
1

1 +x
2
, arg cos h
0
(x) =
1

x
2
1
.
Captulo IV
Calculo integral de una
variable
4.1 La integral de Riemann
El concepto de integral de una funci on nos permite calcular ciertas sumas
de innitos n umeros innitesimales. Se trata de un esquema muy general que
admite interpretaciones muy diversas en contextos muy distintos, de entre las
cuales la m as simple y la m as natural a la hora de presentar la denici on es
el problema del c alculo de areas. El area de un rect angulo es y podemos
considerar esto como una denici on el producto de su base por su altura.
Vamos a ver que este hecho, junto con algunas propiedades obvias que es natural
suponer al concepto de area (por ejemplo, que si una regi on est a contenida en
otra mayor, el area de la primera sea menor o igual que la de la segunda)
determina completamente un unico valor numerico para el area de cualquier
regi on plana razonable.
b a
f(x)
Concretamente, vamos a ver que la integral de
una funci on f : [a, b] R puede interpretarse
como el area limitada entre su gr aca y el eje x (la
regi on sombreada en la gura). En ella hemos dibu-
jado tambien una familia de rect angulos que tocan
a la gr aca de la funci on y quedan por debajo de
ella, y otra que queda por encima. De este modo, la
suma de las areas de los rect angulos inferiores ha
de ser menor que el area sombreada, y la suma de las areas de los rect angulos
superiores ha de ser mayor.
Empezamos describiendo formalmente la construcci on que muestra la gura:
Denici on 4.1 Una partici on de un intervalo [a, b] es un subconjunto nito
P de [a, b] tal que a, b P. Si P tiene n + 1 elementos, podemos numerarlos
117
118 Captulo 4. C alculo integral de una variable
unvocamente en la forma
P = {a = x
0
< x
1
< < x
n
= b}.
Llamaremos x
i
= x
i+1
x
i
> 0. La norma de P es
kPk = m ax
i
x
i
> 0.
Una funci on f : [a, b] R est a acotada si existe un n umero M R tal que
|f(x)| M para todo x [a, b].
Si f est a acotada y P es una partici on de [a, b], denimos
m
i
=nf{f(x) | x [x
i1
, x
i
]}, M
i
= sup{f(x) | x [x
i1
, x
i
]}.
(Obviamente son conjuntos no vacos acotados superiormente por cualquier cota
M de f e inferiormente por M, luego tienen supremo e nmo.)
Denimos la suma inferior y la suma superior de Riemann de f respecto a
la partici on P como
s(f, P) =
n

i=1
m
i
x
i
, S(f, P) =
n

i=1
M
i
x
i
.
Volviendo a la gura anterior, si P es la partici on del intervalo [a, b] formada
por las bases de los rect angulos que hemos dibujado, entonces los rect angulos
inferiores tienen altura m
i
y los superiores M
i
. La suma inferior de Riemann es
la suma de las areas de los rect angulos inferiores y la suma superior es la suma
de las areas de los rect angulos superiores. Por consiguiente, son aproximaciones
por defecto y por exceso al area sombreada.
1
Vamos a demostrar que, para funciones razonables, las aproximaciones se
hacen innitamente buenas cuando tomamos particiones de norma innitesimal.
La clave para ello es el teorema siguiente, que nos permite comparar las sumas
calculadas con dos particiones distintas:
Teorema 4.2 Sea f : [a, b] R una funci on acotada y sean P P
0
dos
particiones de [a, b]. Entonces
s(f, P) s(f, P
0
) s(f, P) + 2MrkPk,
S(f, P) S(f, P
0
) S(f, P) 2MrkPk,
donde M es una cota de f y r es el n umero de elementos de P
0
\ P.
1
Pero hemos de advertir que si la funci on f tomara valores negativos, los valores de m
i
y
M
i
en las regiones donde esto sucediera seran tambien negativos, con lo que la porci on de
area situada bajo el eje X se contara negativamente, de modo que, en realidad, las sumas de
Riemann seran aproximaciones a la diferencia entre el area situada sobre el eje X y el area
situada bajo el.
4.1. La integral de Riemann 119
Demostraci on: Vamos a probar el teorema por inducci on sobre r. Supon-
gamos en primer lugar que P
0
consta de un unico punto m as que P. Llamemos
x
0
a este punto, que estar a entre dos puntos de P, digamos x
i1
< x
0
< x
i
.
Vamos a llamar m
0
y m
00
a los nmos de f en los intervalos [x
i1
, x
0
] y
[x
0
, x
i
], mientras que m
i
es el nmo en [x
i1
, x
i
].
De la inclusi on [x
i1
, x
0
] [x
i1
, x
i
] y de la denici on de nmo se sigue
f acilmente que m
0
m
i
, e igualmente m
00
m
i
. Claramente,
s(f, P
0
) s(f, P) = m
0
(x
0
x
i1
) +m
00
(x
i
x
0
) m
i
(x
i
x
i1
)
= (m
0
m
i
)(x
0
x
i1
) + (m
00
m
i
)(x
i
x
0
) 0.
Por otra parte, m
0
m
i
= |m
0
m
i
| |m
0
| + |m
i
| 2M, e igualmente
m
00
m
i
2M. Adem as x
0
x
i1
x
i
x
i1
kPk y tambien x
0
x
i1
kPk.
Por lo tanto
s(f, P
0
) s(f, P) 2MkPk.
Esto prueba el teorema para r = 1. Si es cierto para r y P
0
tiene r + 1
puntos adicionales, consideramos la partici on P
00
que resulta de eliminar uno de
estos puntos. Basta aplicar la hip otesis de inducci on y el caso r = 1 ya probado
(notemos que kP
00
k kPk):
s(f, P) s(f, P
00
) s(f, P
0
) s(f, P
00
) + 2MkP
00
k
s(f, P) + 2MrkPk + 2MkPk = s(f, P) + 2M(r + 1)kPk.
El caso de las sumas superiores es completamente an alogo.
En particular tenemos que cualquier suma inferior es menor o igual que
cualquier suma superior:
Teorema 4.3 Sea f : [a, b] R una funci on acotada y sean P, P
0
particiones
de [a, b]. Entonces
s(f, P) S(f, P
0
).
Demostraci on: Basta tomar P
00
= P P
0
y aplicar el teorema anterior:
s(f, P) s(f, P
00
) S(f, P
00
) S(f, P
0
).
Notemos que la desigualdad central se sigue inmediatamente de la denici on de
las sumas inferiores y superiores.
Esto se interpreta como que entre cualquier suma inferior y cualquier suma
superior debe encontrarse el area limitada por la funci on f.
Denici on 4.4 Sea f : [a, b] R una funci on acotada. Denimos la integral
inferior y la integral superior de Darboux como

_
b
a
f(x) dx = sup
P
s(f, P),
_
b
a
f(x) dx =nf
P
S(f, P),
donde P recorre las particiones de [a, b].
120 Captulo 4. C alculo integral de una variable
Notemos que el supremo de las sumas inferiores existe porque el conjunto de
todas ellas es obviamente no vaco y, seg un el teorema anterior, est a acotado su-
periormente por cualquier suma superior. Igualmente, el conjunto de las sumas
superiores est a acotado inferiormente por cualquier suma inferior. Tambien es
evidente que

_
b
a
f(x) dx
_
b
a
f(x) dx
La integral inferior es el valor al que aproximan las sumas inferiores de Rie-
mann (con m as exactitud cuanto menor sea la norma de la partici on), mientras
que la integral superior es el valor al que aproximan las sumas superiores. Ahora
probamos que, para aproximarnos a las integrales inferior y superior mediante
sumas de Riemann, no tenemos que preocuparnos de escoger con cuidado la
partici on que empleamos, sino que nos sirve cualquier partici on (de norma)
innitesimal.
Teorema 4.5 Sea f : [a, b] R una funci on est andar acotada. Si P es una
partici on innitesimal de [a, b], entonces
s(P, f)

_
b
a
f(x) dx, S(P, f)
_
b
a
f(x) dx.
Demostraci on: Sea > 0 est andar. Existe una partici on P
0
, que podemos
tomar est andar, tal que

_
b
a
f(x) dx < s(P
0
, f)

_
b
a
f(x) dx.
Sea k el n umero de elementos de P
0
, que ser a nito. Sea P
00
= P P
0
. Entonces,
el n umero de puntos de P
00
\ P es r k. Si M es una cota (est andar) de f, el
teorema 4.2 nos da que
s(P, f) s(P
00
, f) s(P, f) + 2MrkPk,
lo que implica que s(P, f) s(P
00
, f), puesto que kPk es innitesimal. Por otra
parte,

_
b
a
f(x) dx < s(P
0
, f) s(P
00
, f),
de donde

_
b
a
f(x) dx s(P, f)

_
b
a
f(x) dx.
Como esto vale para todo > 0 est andar, ha de ser
s(P, f)

_
b
a
f(x) dx.
La prueba para sumas superiores es completamente an aloga.
4.1. La integral de Riemann 121
Equivalentemente, la integral inferior (resp. superior) es la parte est andar
de cualquier suma inferior (resp. superior) correspondiente a una partici on in-
nitesimal. En particular, todas las sumas inferiores (resp. superiores) corres-
pondientes a particiones innitesimales est an innitamente pr oximas entre s.
Ahora bien, no tiene por que suceder que las sumas inferiores esten innitamente
pr oximas a las superiores. En esto consiste precisamente la integrabilidad:
Denici on 4.6 Una funci on acotada f : [a, b] R es integrable (Riemann) si
su integral inferior coincide con su integral superior, en cuyo caso, a este valor
com un se le llama integral (de Riemann) de f, y se representa por
_
b
a
f(x) dx =

_
b
a
f(x) dx =
_
b
a
f(x) dx.
As pues, f es integrable cuando las sumas inferiores y las sumas superiores
aproximan ambas a un mismo n umero real, que se convierte as en el unico
valor que podemos tomar como denici on del area limitada por la gr aca de la
funci on. Insistimos, no obstante, en que la interpretaci on de una integral como
suma de innitos terminos innitesimales es mucho m as amplia, y se aplica en
muchos contextos que no tienen ninguna relaci on directa con el c alculo de areas.
Por ejemplo, si v : [a, b] R es la velocidad de un m ovil en cada instante
t, los valores m
i
y M
i
son estimaciones por defecto y por exceso de la velocidad
que el m ovil ha mantenido a lo largo del periodo [t
i+1
, t
i
], con lo que m
i
t
i
y
M
i
t
i
son estimaciones por defecto y por exceso del espacio recorrido en dicho
periodo, las sumas s(v, P), S(v, P) son estimaciones por defecto y por exceso
del espacio recorrido en el intervalo de tiempo [a, b], y lo mismo vale para la
integral inferior y la integral superior. Por consiguiente, si v es integrable, su
integral ha de ser exactamente el espacio recorrido por el m ovil en [a, b].
La siguiente caracterizaci on no est andar de la integrabilidad, cuya prueba
es inmediata, es mucho m as pr actica que la denici on (cl asica) en terminos de
integrales inferiores y superiores, es decir, en terminos de supremos e nmos:
Teorema 4.7 Sea f : [a, b] R una funci on est andar acotada y sea P una
partici on de [a, b] de norma innitesimal. Entonces, la funci on f es integrable
si y s olo si s(P, f) S(P, f), en cuyo caso, la integral es la parte est andar de
estas sumas.
Ejemplo La funci on f : [0, 1] R dada por
f(x) =

1 si x Q,
0 si x R \ Q,
no es integrable Riemann.
En efecto, basta tener en cuenta que, si P es cualquier partici on de [0, 1], es
claro que s(f, P) = 0 y S(f, P) = 1.
Notemos que la funci on del ejemplo anterior es discontinua en todos los
puntos. En el extremo opuesto, tenemos el teorema siguiente:
122 Captulo 4. C alculo integral de una variable
Teorema 4.8 Si f : [a, b] R es una funci on continua, entonces es integra-
ble.
Demostraci on: Podemos suponer que f es est andar. Observemos que f
est a acotada por el teorema 3.10. Sea P = {x
0
, . . . , x
n
} una partici on innite-
simal de [a, b]. De nuevo por el teorema 3.10, existen puntos x
i1
u
i
, v
i
x
i
tales que m
i
= f(u
i
), M
i
= f(v
i
). Notemos que u
i
v
i
, luego ambos tienen la
misma parte est andar w [a, b]. Como f es continua en w, tenemos que
m
i
= f(u
i
) f(w) f(v
i
) = M
i
.
Por consiguiente, = m ax
i
(M
i
m
i
) es innitesimal, y
S(f, P) s(f, P) =
n

i=1
(M
i
m
i
)x
i

n

i=1
x
i
= (b a) 0,
luego S(f, P) s(f, P).
Veamos ahora las propiedades b asicas de las funciones integrables:
Teorema 4.9 Si f y g son funciones integrables en un intervalo [a, b] y R,
tambien son integrables f +g, fg y f. Adem as:
_
b
a
(f(x) +g(x)) dx =
_
b
a
f(x) dx +
_
b
a
g(x) dx,
_
b
a
f(x) dx =
_
b
a
f(x) dx.
Si f(x) g(x) para todo x [a, b], se cumple que
_
b
a
f(x) dx
_
b
a
g(x) dx.
Demostraci on: Podemos suponer que todos los datos son est andar. Sea
P una partici on innitesimal de [a, b]. Es f acil comprobar que
m
i
(f +g) m
i
(f) +m
i
(g), M
i
(f +g) M
i
(f) +M
i
(g),
con lo que
s(f, P) +s(g, P) s(f +g, P) S(f +g, P) S(f, P) +S(g, P).
Como f y g son integrables, los extremos de estas desigualdades son n umeros
innitamente pr oximos, luego los cuatro terminos est an innitamente pr oximos
entre s. Esto prueba que f +g es integrable, as como que
_
b
a
(f(x)+g(x)) dx S(f+g, P) S(f, P)+S(g, P)
_
b
a
f(x) dx+
_
b
a
g(x) dx.
4.1. La integral de Riemann 123
Para f tenemos que m
i
(f) = m
i
(f), M
i
(f) = M
i
(f), y razonamos
an alogamente.
Ahora vamos a probar que si f s olo toma valores 0, entonces f
2
es in-
tegrable. Para ello observamos que
2
m
i
(f
2
) = m
i
(f)
2
y M
i
(f
2
) = M
i
(f)
2
,
luego
S(f
2
, P) s(f
2
, P) =
n

i=1
(M
i
(f)
2
m
i
(f)
2
)x
i
=
n

i=1
(M
i
(f) +m
i
(f)(M
i
(f) m
i
(f))x
i
2M(S(f, P) s(f, P)) 0,
donde M es una cota (est andar) de f en [a, b]. Esto prueba la integrabilidad de
la funci on f
2
.
Ahora veamos que f
2
es integrable incluso aunque tome valores negativos.
Para ello observamos que, si M es una cota de f, la funci on f + M s olo toma
valores positivos, y es integrable porque la funci on constante M es continua
y la suma de funciones integrables es integrable. Por la parte ya probada,
(f + M)
2
= f
2
+ M
2
+ 2Mf es integrable, pero tambien hemos probado que
M
2
+ 2Mf es integrable, luego f
2
es integrable.
En general, hemos probado que los cuadrados de las funciones integrables
son integrables. Por consiguiente:
fg =
(f +g)
2
(f g)
2
4
,
tambien es integrable.
Por ultimo, si f(x) g(x) para todo x [a, b], tenemos que (g f)(x) 0
para todo x [a, b], y de la propia denici on de integral se sigue que
_
b
a
g(x) dx
_
b
a
f(x) dx =
_
b
a
(g(x) f(x)) dx 0.
En particular hemos probado que el conjunto de las funciones integrables en
[a, b] es un subanillo de F([a, b]) que contiene a C([a, b]).
Si f es una funci on denida en un intervalo mayor que [a, b], diremos que es
integrable en [a, b] cuando lo sea f|
[a,b]
.
Teorema 4.10 Sea f : [a, b] R una funci on acotada y sea a < c < b.
Entonces f es integrable en [a, b] si y s olo si lo es en [a, c] y en [c, b], en cuyo
caso
_
b
a
f(x) dx =
_
c
a
f(x) dx +
_
d
c
f(x) dx.
2
Probamos, en general, que si f : [u, v] [0, +[ es una funci on acotada, entonces
m(f
2
) = m(f)
2
, donde m representa al nmo en [u, v]. Para ello suponemos que los datos
son est andar y observamos que, para todo x [u, v], se cumple 0 m(f) f(x), luego
m(f)
2
f(x)
2
, luego m(f)
2
es una cota inferior de f
2
. Por otra parte, existe un x [u, v]
tal que m(f) f(x), luego m(f)
2
f(x)
2
, luego m(f)
2
es el nmo de f
2
. Igualmente se
razona con los supremos.
124 Captulo 4. C alculo integral de una variable
Demostraci on: Podemos suponer que los datos son est andar. Tomemos
particiones innitesimales P
1
y P
2
de [a, c] y [c, b], respectivamente, de modo
que P = P
1
P
2
es una partici on innitesimal de [a, b]. Es obvio que
s(f|
[a,c]
, P
1
) +s(f|
[c,b]
, P
2
) = s(f, P), S(f|
[a,c]
, P
1
) +S(f|
[c,b]
, P
2
) = S(f, P).
Por consiguiente:
S(f, P) s(f, P) = (S(f|
[a,c]
, P
1
) s(f|
[a,c]
, P
1
)) +(S(f|
[c,b]
, P
2
) s(f|
[c,b]
, P
2
)).
Las tres diferencias de sumas son 0, luego el miembro izquierdo es inni-
tesimal si y s olo si los dos sumandos de la derecha lo son.
Ahora podemos probar la existencia de funciones integrables discontinuas:
Teorema 4.11 Si f : [a, b] R es una funci on continua salvo a lo sumo en
un n umero nito de puntos, entonces es integrable.
Demostraci on: Podemos suponer que los datos son est andar. Vamos a
suponer en primer lugar que f es continua excepto en b. Por el Principio de
Idealizaci on II, existe un conjunto nito F [a, b] que contiene a todos los
elementos est andar de [a, b]. Uniendo F a una partici on innitesimal de [a, b],
obtenemos otra partici on innitesimal P que contiene a F.
Si r ]a, b[ es est andar, consideramos las particiones P
r
= P [a, r] y
P
0
r
= P [r, b]. Claramente:
S(f, P) s(f, P) = S(f|
[a,r]
, P
r
) s(f|
[a,r]
, P
r
) +S(f|
[r,b]
, P
0
r
) s(f|
[r,b]
, P
0
r
)
S(f|
[a,r]
, P
r
) s(f|
[a,r]
, P
r
) + 2M(b r),
donde M es una cota (est andar) de f en [a, b]. Como f es continua en [a, r],
sabemos que es integrable, luego la diferencia de sumas de Riemann del ultimo
termino es innitesimal. Tomando partes est andar vemos que
0
_
b
a
f(x) dx

_
b
a
f(x) dx 2M(b r).
Como esto es cierto para todo n umero est andar a < r < b, la integral superior
ha de coincidir con la integral inferior.
El mismo razonamiento es v alido si f es continua salvo en a. Si f es continua
salvo en a y en b, tomamos a < c < b y concluimos que f es integrable en [a, c]
y en [c, b], luego lo es en [a, b].
En general, si f es continua salvo a lo sumo en un conjunto nito de puntos
a = x
0
< x
1
< < x
n
= b, entonces tenemos que f|
[x
i1
,x
i
]
es continua salvo
quiz a en los extremos del intervalo, luego es integrable en [x
i1
, x
i
], y por el
teorema anterior es integrable en [a, b].
4.1. La integral de Riemann 125
Ejercicio: Probar que si dos funciones coinciden en un intervalo [a, b] salvo a lo sumo
en un n umero nito de puntos, entonces una es integrable si y s olo si lo es la otra, y
en tal caso las integrales coinciden.
Ejercicio: Probar que si f : [a, b] R es integrable, tambien lo es |f| y

_
b
a
f(x) dx

_
b
a
|f(x)| dx.
(Ayuda: probar que M
i
(|f|, P) m
i
(|f|, P) M
i
(f, P) m
i
(f, P).)
Nos ocupamos ahora del c alculo explcito de integrales. En primer lugar
conviene observar que, si sabemos que una funci on es integrable, su integral se
puede aproximar mediante sumas construidas a partir de valores concretos que
tome la funci on en cada intervalo de una partici on innitesimal, sin necesidad
de calcular supremos e nmos:
Teorema 4.12 Sea f : [a, b] R una funci on est andar integrable en [a, b],
sea P una partici on innitesimal (de n+1 elementos) y sea {y
i
}
n
i=1
un conjunto
de puntos tales que y
i
[x
i1
, x
i
]. Entonces
_
b
a
f(x) dx
n

i=1
f(y
i
)x
i
.
Demostraci on: Es evidente que
s(f, P)
n

i=1
f(y
i
)x
i
S(f, P).
Teorema 4.13 (Regla de Barrow) Sea f : [a, b] R una funci on continua
en [a, b] y derivable en ]a, b[. Si f
0
es integrable en [a, b] entonces
_
b
a
f
0
(x) dx = f(b) f(a).
Demostraci on: Podemos suponer que f es est andar. Fijamos una par-
tici on innitesimal y aplicamos el teorema del valor medio a cada intervalo, de
modo que encontramos puntos y
i
[x
i1
, x
i
] tales que
f(x
i
) f(x
i1
) = f
0
(y
i
)(x
i
x
i1
).
Entonces
_
b
a
f
0
(x) dx
n

i=1
f
0
(y
i
)x
i
=
n

i=1
(f(x
i
) f(x
i1
)) = f(b) f(a).
Como el primer y el ultimo termino son est andar, de hecho se tiene la igual-
dad.
126 Captulo 4. C alculo integral de una variable
As pues, para calcular la integral de una funci on f : [a, b] R basta
encontrar una funci on F : [a, b] R continua en [a, b] y derivable en ]a, b[ tal
que f = F
0
. Una tal funci on F es lo que se conoce como una primitiva de f.
El teorema siguiente demuestra que toda funci on continua tiene una primitiva,
aunque la forma de construirla no ayuda mucho a calcular integrales:
Teorema 4.14 Si f : [a, b] R es una funci on integrable, entonces la funci on
F(x) =
_
x
a
f(t) dt
es continua en [a, b] y, si f es continua, F es derivable en ]a, b[ y F
0
= f.
Demostraci on: Podemos suponer que f es est andar. Hemos de enten-
der que, por denici on, F(a) = 0. Tomemos x [a, b] tambien est andar y
consideremos un innitesimo h tal que x +h [a, b]. Si h > 0 tenemos que
F(x +h) F(x) =
_
x+h
x
f(t) dt
y la monotona de la integral implica que
h nf
t[x,x+h]
f(t) F(x +h) F(x) h sup
t[x,x+h]
f(t).
El supremo y el nmo son nitos, luego los extremos de las desigualdades
son innitesimales, luego F(x +h) F(x). Si h < 0 tenemos
h nf
t[x+h,x]
f(t) F(x) F(x +h) h sup
t[x+h,x]
f(t).
y llegamos a la misma conclusi on. Esto prueba que F es continua en x. Supon-
gamos ahora que, adem as, x ]a, b[, f es continua en x y h 6= 0. Las expresiones
anteriores nos dan
nf
t[x,x+h]
f(t)
F(x +h) F(x)
h
sup
t[x,x+h]
f(t)
o bien
nf
t[x+h,x]
f(t)
F(x +h) F(x)
h
sup
t[x+h,x]
f(t).
En ambos casos, como f es continua en x, el supremo y el nmo se alcanzan
en puntos del intervalo correspondiente y est an innitamente pr oximos a f(x).
As pues,
F(x +h) F(x)
h
f(x),
luego existe F
0
(x) = f(x).
4.1. La integral de Riemann 127
Nota Si adoptamos el convenio de que
_
b
a
f(x) dx =
_
a
b
f(x) dx,
en el teorema anterior no es necesario tomar a como extremo jo de la integral.
En efecto, podemos tomar cualquier n umero a < c < b y denir F
c
: [a, b] R
como
F
c
(x) =
_
x
c
f(x) dx.
Entonces
F
c
(x) =
_
x
a
f(x) dx
_
c
a
f(x) dx = F(x)
_
c
a
f(x) dx.
As, como F
c
y F se diferencian en una constante, existe F
0
c
= F
0
= f.
No vamos a entrar aqu en las tecnicas de c alculo de primitivas. Muchas de
ellas se deducen mec anicamente de las reglas de derivaci on que ya hemos visto.
Por ejemplo, del hecho de que la derivada de x
n
es nx
n1
, para todo n Z, se
deduce inmediatamente que
_
b
a
x
n
dx =

x
n+1
n + 1

, para n Z \ {1}.
Ejercicio: Demostrar que
_
b
a
1
x
= [ln|x|]
b
a
,
donde 0 < a < b o bien a < b < 0.
Ejercicio: Demostrar la regla de integraci on por partes:
_
b
a
u(x)v
0
(x) dx = [u(x)v(x)]
b
a

_
b
a
v(x)u
0
(x) dx.
Teorema 4.15 (Teorema de cambio de variable) Sea f : [a, b] R una
funci on continua y x : [u, v] [a, b] una funci on biyectiva, continua, derivable
en ]c, d[ y con derivada positiva. (En particular, se cumplir a que a = x(u),
b = x(v).) Entonces
_
x(v)
x(u)
f(x) dx =
_
v
u
f(x(t))x
0
(t) dt.
Demostraci on: Las hip otesis sobre x implican que es estrictamente cre-
ciente (y, en particular, que x(u) = a, x(v) = b, como se indica en el enun-
ciado). Por lo tanto, si {t
i
}
n
i=0
es una partici on innitesimal de [u, v] y hacemos
x
i
= g(t
i
) entonces {x
i
}
n
i=0
es una partici on de [a, b], y es innitesimal porque,
128 Captulo 4. C alculo integral de una variable
al ser x continua en

t
i
t
i
t
i1
, tenemos que x(

t
i
) x(t
i
) x(t
i1
). Por el
teorema del valor medio existen puntos c
i
]t
i1
, t
i
[ tales que x
i
= x
0
(c
i
)t
i
.
Por lo tanto
_
x(v)
x(u)
f(x) dx
n

i=1
f(x(c
i
))x
i
=
n

i=1
f(x(c
i
))x
0
(c
i
)t
i

_
v
u
f(x(t))x
0
(t) dt.
Como los dos extremos son est andar, se tiene la igualdad.
Nota El teorema es v alido tambien si, en lugar de suponer que x tiene derivada
positiva, suponemos que tiene derivada no nula. En tal caso, la unica alternativa
es que la derivada sea negativa. La prueba es v alida igualmente, salvo que ahora
x es decreciente, luego x(u) = b, x(v) = a y x
i
< x
i1
. Por lo tanto, {x
i
}
n
i=0
sigue formando una partici on innitesimal de [a, b], s olo que est a numerada al
reves. La forma de numerarla no afecta al c alculo de la integral, pero hemos de
tener presente que x
i
= x
i1
x
i
= x
0
(u
i
)t
i
. La conclusi on es que
_
x(u)
x(v)
f(x) dx =
_
v
u
f(x(t))x
0
(t) dt =
_
u
v
f(x(t))x
0
(t) dt.
Para enunciar conjuntamente los dos casos basta llamar t
0
y t
1
a los extremos
u, v, pero ordenados de forma que a = x(t
0
) y b = x(t
1
). Entonces, en ambos
casos podemos escribir que
_
x(t
1
)
x(t
0
)
f(x) dx =
_
t
1
t
0
f(g(t))g
0
(t) dt.
Formas diferenciales Vamos a introducir algunos conceptos que permiten
expresar m as ecientemente algunos de los resultados que hemos visto hasta
aqu:
Llamamos L(R) al conjunto de todas las aplicaciones lineales l : R R,
es decir, las aplicaciones de la forma l(u) = au, para un cierto a R.
(Observemos que, necesariamente, a = l(1).)
Denimos una suma + : L(R) L(R) L(R) dada por
(l +l
0
)(u) = l(u) +l
0
(u).
Se comprueba inmediatamente que, en efecto, l +l
0
L(R).
Si D R es abierto, llamamos (D) al conjunto de todas las aplicacio-
nes : D L(R). A los elementos de (D) los llamaremos formas
diferenciales en D.
4.1. La integral de Riemann 129
Observemos que, si (D), podemos denir f

: D R mediante
f

(a) = (a)(1), de modo que, para todo u R, se cumple que


(a)(u) = f

(a)u.
As, est a completamente determinada por f

y, recprocamente, dada
cualquier funci on f : D R podemos denir (a)(u) = f(a)u. De
este modo, los elementos de (D) se corresponden biunvocamente con
las funciones de F(D). Diremos que una forma es continua, integrable,
etc. si lo es su funci on correspondiente.
Denimos una suma + : (D) (D) (D) mediante
( +
0
)(a) = (a) +
0
(a),
donde la suma del segundo miembro es la suma de L(R). Claramente,
f
+
0 = f

+f

0 .
Denimos un producto F(D) (D) (D) mediante
(g)(a)(u) = g(a)((a)(u)).
Se comprueba inmediatamente que g (D). Claramente, f
g
= gf

.
Si f : D R es derivable, denimos su diferencial como la forma dife-
rencial df (D) dada por df(a)(u) = f
0
(a)u, es decir, como la forma
determinada por la funci on f
0
.
En particular, si f(x) = x, entonces f
0
(x) = 1, luego dx(a)(u) = u. As,
si (D) es cualquier forma diferencial, tenemos que
(a)(u) = f

(a)u = f

(a)dx(a)(u),
luego = f

dx. En particular, para toda funci on derivable f F(D),


tenemos que df = f
0
dx.
Si f es una funci on derivable ,usaremos la notaci on
df
dx
para referirnos a
su derivada f
0
, de modo que podemos escribir
df =
df
dx
dx.
Si D contiene a un intervalo [a, b] y es integrable en [a, b] (lo que, por
denici on, signica que f

lo es), denimos
_
b
a
=
_
b
a
(x) =
_
b
a
f

(x) dx.
Esto signica que, a partir de ahora, la expresi on
_
b
a
f(x) dx,
130 Captulo 4. C alculo integral de una variable
en lugar de ser considerada como la integral de la funci on f, puede ser
considerada como la integral de la forma diferencial f(x) dx. En ambos
casos estamos hablando del mismo n umero real.
Con esta notaci on, las reglas de derivaci on se expresan as:
d(f +g) = df +dg, d(f) = df, d(fg) = f dg +g df.
La regla de la cadena arma que si x(t) es derivable en t
0
e y(x) es derivable
en x
0
= x(t
0
), entonces y(x(t)) es derivable en t
0
, y
dy(x(t))
dt
(t
0
) =
dy
dx
(x
0
)
dx
dt
(t
0
).
A menudo no se presta a ambig uedad abreviar esta igualdad en la forma
dy
dt
=
dy
dx
dx
dt
,
donde hay que entender que la funci on y del primer miembro no es y(x), sino
la funci on compuesta y(x(t)).
El teorema de la funci on inversa arma que, si tenemos funciones mutua-
mente inversas y = y(x) y x = x(y), y un punto y
0
= y(x
0
) (o, equivalentemente,
x
0
= x(y
0
)), entonces
dy
dx
(x
0
) =
1
dx
dy
(y
0
)
.
Nuevamente, es frecuente abreviarlo en la forma:
dy
dx
=
1
dx
dy
.
Las reglas de integraci on son:
_
b
a
( +
0
) =
_
b
a
+
_
b
a

0
,
_
b
a
=
_
b
a
.
La regla de Barrow arma que
_
b
a
df = f(b) f(a).
Ahora podemos escribir la f ormula de integraci on por partes en su forma
m as conocida:
_
b
a
udv = [uv]
b
a

_
b
a
v du.
M as interesante es el caso del teorema de cambio de variable: Si tenemos
una integral
_
b
a
f(x) dx
y el cambio de variable x = x(t) cumple las hip otesis del teorema, es decir,
x biyecta un intervalo [t
0
, t
1
] o [t
1
, t
0
] con [a, b], donde los nombres t
0
y t
1
se
4.1. La integral de Riemann 131
asignan a los extremos del intervalo de modo que a = x(t
0
), b = x(t
1
), entonces,
la igualdad
_
x(t
1
)
x(t
0
)
f(x) dx =
_
t
1
t
0
f(x(t))
dx
dx
dt
puede interpretarse como una mera sustituci on de la variable x por la funci on
x(t) y la forma diferencial dx por la forma diferencial
dx =
dx
dt
dt.
Terminamos la secci on con un ejemplo sobre c omo el c alculo integral permite
calcular polinomios de Taylor y estimar el error:
Teorema 4.16 La funci on f(x) = log(1 +x) admite un desarrollo en serie de
Taylor
log(1 +x) =

n=1
(1)
n+1
n
x
n
que converge para 1 < x 1.
Demostraci on: Partimos de la f ormula de la suma de una serie geometrica:
m

n=0
x
n
=
1 x
m+1
1 x
=
1
1 x

x
m+1
1 x
.
Esto es v alido para todo x R. En particular, para x = t, lo que nos da
1
1 +t

m

n=0
(1)
n
t
n
=
(1)
m+1
t
m+1
1 +t
.
Ahora integramos:
log(1 +x)
m

n=0
(1)
n
x
n+1
n + 1
=
_
x
0
(1)
m+1
t
m+1
1 +t
dt.
Equivalentemente:
log(1 +x)
m+1

n=1
(1)
n+1
n
x
n
=
_
x
0
(1)
m+1
t
m+1
1 +t
dt.
Vamos a probar que el polinomio del miembro izquierdo es el polinomio de
Taylor de grado m+ 1 de f(x). Para ello llamamos R(x) al miembro izquierdo
y, por la unicidad del polinomio de Taylor, basta probar que R
n)
(0) = 0 para
n = 0, . . . , m+ 1. Para ello observamos que
R
0
(x) =
(1)
m+1
x
m+1
1 +x
= x
m
g(x),
132 Captulo 4. C alculo integral de una variable
donde
g(x) =
(1)
m+1
x
1 +x
es una funci on de clase C

en R tal que g(0) = 0. Una simple inducci on


demuestra que, para 1 n m+ 1, se cumple que
R
n)
(x) = x
m+1n
g
n
(x),
donde g
n
es una funci on de clase C

en R tal que g
n
(x) = 0. De aqu se sigue
obviamente que R
n)
(0) = 0 y tenemos calculados los polinomios de Taylor.
Ahora falta probar que, para 1 < x 1 jo (est andar), la sucesi on de
restos de Taylor
_
x
0
(1)
m+1
t
m+1
1 +t
dt
_
m0
converge a 0. Ahora bien, si x 0

_
x
0
(1)
m+1
t
m+1
1 +t
dt

_
x
0
t
m+1
1 +t
dt
_
x
0
t
m+1
dt =
x
m+2
m+ 2
.
Si m es innito y x < 1, entonces x
m+2
0, y si x = 1, entonces x
m+2
= 1.
En cualquier caso, el numerador de la ultima fracci on es nito, y el denominador
es innito, luego la fracci on es innitesimal.
Si 1 < x < 0, acotamos de otro modo:

_
x
0
(1)
m+1
t
m+1
1 +t
dt

_
0
x
|t|
m+1
1 +t
dt
_
0
x
|t|
m+1
1 +x
dt =
|x|
m+2
(1 +x)(m+ 2)
Desde aqu se concluye igual que en el caso anterior.
En particular hemos probado que la convergencia de la serie

n=1
(1)
n+1
n
= 1
1
2
+
1
3

1
4
+ = log 2.
Ejemplo La serie

n=1
1
n
= 1 +
1
2
+
1
3
+
1
4
+
es divergente.
En efecto, basta observar que, para n 1,
_
n+1
n
1
x
dx
_
n+1
n
1
n
dx =
1
n
,
luego
log(m+ 1) =
_
m+1
1
1
x
dx
m

n=1
1
n
Esto prueba que si m es innito, la suma de la serie hasta m es innita,
luego la serie es divergente.
4.2. Las funciones trigonometricas 133
4.2 Las funciones trigonometricas
a b
Consideremos una funci on f[a, b] R con-
tinua en [a, b] y derivable en ]a, b[. Su gr aca
ser a una curva y vamos a calcular su longitud.
M as precisamente, vamos a dar una denici on
razonable de longitud de una curva. Para ello
consideramos una partici on P de [a, b] y unimos
con segmentos los puntos (x
i
, f(x
i
)), de modo
que formamos una poligonal, tal y como muestra la gura. Vamos a probar
que, si la partici on es innitesimal, la longitud de la poligonal estar a innita-
mente cerca de un unico n umero est andar independiente de la partici on escogida,
y ser a a este n umero el que tomaremos como denici on de longitud de la curva.
En principio, la longitud de la poligonal es, claramente:
L(f, P) =
n

i=1
_
x
2
i
+ (f(x
i
) f(x
i1
))
2
.
Aplicando el teorema del valor medio encontramos puntos u
i
]x
i1
, x
i
[ tales
que f(x
i
) f(x
i1
) = f
0
(u
i
)x
i
, con lo que
L(f, P) =
n

i=1
_
1 +f
0
(u
i
)
2
x
i

_
b
a
_
1 +f
0
(x)
2
dx.
Naturalmente, esto exige que la funci on
_
1 +f
0
(x)
2
sea integrable, lo que
tenemos garantizado si suponemos, por ejemplo, que f
0
es continua y acotada
en ]a, b[.
Denici on 4.17 Sea f : [a, b] R una funci on continua en [a, b], derivable
en ]a, b[ con derivada continua y acotada. Llamaremos longitud de f a
L(f) =
_
b
a
_
1 +f
0
(x)
2
dx.
Acabamos de probar que L(f) puede aproximarse por la longitud de una
poligonal que coincida con f en una partici on de [a, b].
La funci on f : [0, 1] R dada por f(x) =

1 x
2
tiene por gr aca un
cuarto de circunferencia de radio 1. Su derivada en ]0, 1[ es
f
0
(x) =
x

1 x
2
,
y
1 +f
0
(x)
2
=
1

1 x
2
.
As pues, la longitud de una circunferencia de radio 1 debera ser cuatro
veces la integral
_
1
0
dx

1 x
2
.
134 Captulo 4. C alculo integral de una variable
Ahora bien, esto no es correcto, porque el integrando no es una funci on
acotada en [0, 1], por lo que la integral anterior no est a denida. Tendremos
que ir m as despacio.
Observamos que funci on f
0
est a acotada en cualquier intervalo [0, t], con
0 < t < 1, ya que es continua en este intervalo. Esto nos permite denir la
integral
A(t) =
_
t
0
dx

1 x
2
.
As tenemos denida una funci on A : [0, 1[ R que, por el teorema 4.14
es derivable en ]0, 1[. (Para probar que es derivable en t, aplicamos el teorema
en un intervalo [0, t
0
], con 0 < t < t
0
< 1.) Concretamente, su derivada es:
A
0
(t) =
1

1 t
2
.
t

sen
1
Reexionemos sobre el signicado de A(t). Por
construcci on, sabemos que = A(t) es la longitud
del arco destacado en la gura. Vamos a adoptar el
convenio de medir un angulo precisamente por la lon-
gitud del arco que determina sobre la circunferencia
unidad. Entonces, es precisamente el angulo se nalado en la gura y t es el
seno de , entendiendo seno en su sentido geometrico, es decir la longitud del
cateto opuesto a en un tri angulo rect angulo de hipotenusa igual a 1 y que
tenga un angulo igual a .
En denitiva, si 0 t < 1, tenemos que A(t) es el angulo cuyo seno es t.
Ahora conviene hacer una observaci on tecnica. La funci on f(x) =

1 x
2
puede considerarse como funci on f : [1, 1] R, lo que a su vez nos permite
considerar A : ]1, 1[ R. El teorema 4.14 (vease la nota posterior) garantiza,
de hecho, que A(t) es derivable en todo el intervalo ]1, 1[.
Esta extensi on es trivial en el sentido siguiente: Si t > 0, el cambio de
variable [0, t] [t, 0] dado por x(u) = u, nos da
A(t) =
_
t
0
dx

1 x
2
=
_
t
0
du

1 u
2
= A(t).
As pues, la extensi on de A(t) al intervalo ]1, 0[ s olo supone el convenio
de asignar a cada seno negativo t el angulo cuyo seno es t, pero tambien con
signo negativo.
Denici on 4.18 Llamaremos arco seno a la funci on arcsen : ]1, 1[ R
dada por
arcsent =
_
t
0
dx

1 x
2
.
4.2. Las funciones trigonometricas 135
A partir de la denici on es inmediato que arcsen0 = 0, hemos comprobado
que
arcsen(t) = arcsent,
y del teorema 4.14 se sigue que se trata de una funci on derivable con derivada
arcsen
0
(t) =
1

1 t
2
.
Tambien hemos visto que su interpretaci on geometrica es que = arcsent
(para t > 0) es el angulo cuyo seno es t o, equivalentemente, la longitud del arco
de la circunferencia unidad determinado por el angulo de seno t.
-1 -0.5 0.5 1
-1.5
-1
-0.5
0.5
1
1.5
La gura nos muestra la gr aca de la funci on
arcsen, pero en estos momentos no podemos de-
mostrar todo lo que vemos en ella. Ya hemos
justicado su simetra, y tambien podemos ase-
gurar que es estrictamente creciente, puesto que
conocemos su derivada y es positiva. El teorema
de la funci on inversa 3.22 nos da que su imagen es
un intervalo, que, dada la simetra, ser a necesa-
riamente de la forma ]p, p[, donde, o bien p R,
o bien p = +.
En la gura vemos que de hecho p R y
es un poco mayor que 1.5. Tambien la interpre-
taci on geometrica del arco seno exige que p sea
nito, pues ha de ser, concretamente, la longi-
tud de un cuarto de circunferencia. Sin embargo,
hasta ahora no tenemos ning un argumento que lo
justique. En cualquier caso, lo que tenemos es que
arcsen : ]1, 1[ ]p, p[
es biyectiva, y podemos considerar su inversa:
Denici on 4.19 Llamaremos funci on seno a la funci on
sen : ]p, p[ ]1, 1[
inversa de la funci on arco seno.
Su interpretaci on geometrica es clara: sen es el seno (en el sentido geometri-
co) del angulo (que determina en la circunferencia unidad un arco de longitud) .
De las propiedades que conocemos del arco seno se deduce inmediatamente
que sen0 = 0 y que sen() = sen, as como que el seno es estrictamente
creciente. Por el teorema de la funci on inversa sabemos que es derivable y que,
si llamamos t = sen, entonces
sen
0
=
1
arcsen
0
t
=
_
1 t
2
=
_
1 sen
2
.
136 Captulo 4. C alculo integral de una variable
Denici on 4.20 Llamaremos coseno a la funci on
cos : ]p, p[ ]0, 1]
dada por cos =

1 sen
2
.
De este modo, es claro que
cos 0 = 1, cos() = cos , sen
2
+ cos
2
= 1, sen
0
= cos .
M as a un, como la raz cuadrada es derivable en ]0, +[, tenemos que el
coseno es derivable y su derivada es
cos
0
=
2 sencos
2

1 sen
2

= sen.
-1.5 -1 -0.5 0.5 1 1.5
-1
-0.5
0.5
1
La gura muestra las gr acas de las funciones
seno y coseno. Sabemos que la funci on seno es
mon otona creciente y sen0 = 0, luego es negativa
para < 0 y positiva para > 0. Por con-
siguiente, el coseno tiene derivada positiva para
< 0 y derivada negativa para > 0. Esto
prueba que su aspecto es el que muestra la gura:
es creciente hasta llegar a = 0 (donde toma su valor m aximo cos 0 = 1), y
luego es decreciente. Lo unico que no sabemos demostrar es que el intervalo
]p, p[ es nito como muestra la gura. Para probarlo haremos uso del teorema
siguiente:
Teorema 4.21 Para todo par de n umeros reales , tales que
, , + ]p, p[
se cumple que
sen( +) = sencos + cos sen.
Demostraci on: Fijado ]p, p[, sea I = ]p, p[ ]p , p [, donde
hemos de entender que, si p = +, entonces p = , p = +.
Es claro que I es un intervalo abierto que contiene al 0. Se trata del mayor
intervalo tal que, si x I, est an denidos senx, cos x y sen(x +).
Llamemos g : I R a la funci on dada por
g(x) = sen(x +) senxcos cos xsen.
Su derivada es
g
0
(x) = cos(x +) cos xcos + senxsen.
Vemos que la funci on g
0
tambien es derivable, y
g
00
(x) = sen(x +) + senxsen + cos xcos = g(x).
4.2. Las funciones trigonometricas 137
As pues,
(g
0
(x)
2
+g(x)
2
)
0
= 2g
0
(x)g
00
(x) + 2g(x)g
0
(x) = 2g
0
(x)(g
00
(x) +g(x)) = 0,
para todo x I, luego la funci on g
0
(x)
2
+g(x)
2
es constante en I. Ahora bien,
resulta que en x = 0 toma el valor 0, luego
g
0
(x)
2
+g(x)
2
= 0
para todo x I. Esto implica a su vez que g(x) = 0, luego se cumple la f ormula
del enunciado.
Ahora podemos probar que p es nito. En efecto, tenemos que

2/2 ]0, 1[,


luego existe un ]0, p[ tal que sen =

2/2, y entonces cos =

2/2. Si
p fuera innito, se cumplira que p < + < p, y el teorema anterior nos
dara sen2 = 1, lo cual es absurdo, pues la funci on seno no toma el valor 1 en
]p, p[.
Denici on 4.22 Llamaremos = 2p, de modo que
sen : ]/2, /2[ ]1, 1[ , cos : ]/2, /2[ ]0, 1] .
Teniendo en cuenta que el seno es biyectivo en los intervalos indicados, as
como que es estrictamente creciente, es inmediato que se extiende a una funci on
biyectiva, estrictamente creciente y continua
sen : [/2, /2] [1, 1]
estableciendo que sen(/2) = 1, sen(/2) = 1. La f ormula cos =

1 sen
2

nos da una extensi on continua para el coseno


cos : [/2, /2] [0, 1]
estableciendo que cos(/2) = cos(/2) = 0.
Ahora denimos extensiones:
sen : [, ] [1, 1], cos : [, ] [1, 1]
mediante
sen =

sen( +) si < /2,


sen( ) si > /2,
cos =

cos( +) si < /2,


cos( ) si > /2.

-2

2
-1 1

2
2

-1
1
138 Captulo 4. C alculo integral de una variable
Es inmediato comprobar que estas extensiones siguen cumpliendo las relaci on
sen
2
+cos
2
= 1, as como que, para cualquier ], [, tal que 6= /2,
se sigue cumpliendo que existen
sen
0
= cos , cos
0
= sen.
Esto tambien es cierto en los dos puntos que hemos exceptuado, y las cuatro
comprobaciones son an alogas. Vamos a probar, por ejemplo, la derivabilidad
del seno en /2.
Tomemos un innitesimo h > 0. Entonces
sen(/2 h) sen(/2)
h
=
cos(h) 1
h
cos
0
(0) = sen0 = 0,
sen(/2 +h) sen(/2)
h
=
sen(/2 +h) 1
h
=
cos h 1
h
0.
Esto prueba que existe sen
0
(/2) = 0 = cos(/2).
Finalmente, dado R, existe un unico k Z tal que
+ 2k < + 2(k + 1),
(a saber, k = E[( + )/2]), con lo que = 2k +
0
, con
0
< , y
tanto k como
0
est an unvocamente determinados por . Denimos
sen = sen
0
, cos = cos
0
.
2

2

3

2
2
-1
1
Dejamos como ejercicio demostrar el teorema siguiente, algunas de cuyas
partes ya han sido probadas:
Teorema 4.23 Las funciones
sen : R [1, 1], cos : R [1, 1]
cumplen las propiedades siguientes:
a) sen = sen(+2k), cos = cos(+2k), para todo R y todo k Z.
b) sen : [/2, /2] [1, 1] es creciente.
c) cos : [0, ] [1, 1] es decreciente.
d) Son derivables y sen
0
= cos , cos
0
= sen.
e) sen
2
+ cos
2
= 1.
f ) sen( +) = sencos + cos sen.
g) cos( +) = cos cos sensen.
4.2. Las funciones trigonometricas 139
Nota La prueba m as corta del apartado f) consiste en observar que la prueba
del teorema 4.21 sigue siendo v alida sin m as cambio que eliminar toda restricci on
sobre los dominios. (La funci on g denida en la prueba est a ahora denida sobre
I = R.) El apartado g) se deduce de f) sin m as que derivar la f ormula como
funci on de , considerando a constante.
A partir de este teorema ya es posible demostrar sin dicultad cualquiera de
las propiedades de las funciones seno y coseno que se aprecian en las gr acas.
Por ejemplo, vemos que ambas gr acas son identicas salvo un desfase de /2,
y esto se deduce del apartado g):
cos( +/2) = sen.
Ejercicio: Probar que sen(/4) = cos(/4) =

2/2.
Ejercicio: Probar que, para todo (x, y) R
2
tal que x
2
+ y
2
= 1, existe un unico
[0, 2[ tal que (x, y) = (cos , sen).
Las funciones seno y coseno cumplen las hip otesis del teorema 3.35, por lo
que podemos desarrollarlas en serie de Taylor. Es inmediato comprobar que los
desarrollos son:
senx =

n=0
(1)
n
(2n + 1)!
x
2n+1
, cos x =

n=0
(1)
n
(2n)!
x
2n
.
Denici on 4.24 Llamaremos funci on tangente a la funci on
tanx =
senx
cos x
.
2

2
3

2
2
-6
-4
-2
2
4
6
Est a denida en todos los n umeros reales ex-
cepto los que anulan al coseno, que son los de la
forma /2 + 2k, con k Z. En particular, est a
denida en el intervalo ]/2, /2[. Tambien es
obvio que
tan(x) = tan(x + 2k),
para todo x donde est a denida y todo k Z.
Donde est a denida es derivable, y su derivada es
tan
0
x =
cos
2
x + sen
2
x
cos
2
x
=
1
cos
2
x
.
Como la derivada es positiva, la tangente es creciente en ]/2, /2[, y es
inmediato que tiende a en los extremos, por lo que
tan : ]/2, /2[ R
es biyectiva y creciente.
140 Captulo 4. C alculo integral de una variable
-4 -2 2 4

2
Llamaremos arco tangente a la funci on
inversa
arctan : R ]/2, /2[ .
Por el teorema de la funci on inversa, si = arctanx, entonces
arctan
0
x =
1
tan
0

= cos
2
=
1
1 + tan
2

=
1
1 +x
2
.
Aqu hemos usado que, como sen
2
+ cos
2
= 1, al dividir entre cos
2

queda
tan
2
+ 1 =
1
cos
2

.
La regla de Barrow nos da una expresi on integral para el arco tangente:
arctanx =
_
x
0
dt
1 +t
2
.
De ella podemos deducir el desarrollo en serie de Taylor:
Teorema 4.25 La funci on arco tangente admite un desarrollo en serie de Tay-
lor
arctanx =

n=0
(1)
n
x
2n+1
2n + 1
,
que converge cuando |x| 1
Demostraci on: La prueba es an aloga a la del teorema 4.16. Como all,
partimos de la f ormula
m

n=0
x
n
=
1 x
m+1
1 x
=
1
1 x

x
m+1
1 x
,
pero ahora sustituimos x = t
2
, lo que nos da
1
1 +t
2

m

n=0
(1)
n
t
2n
=
(1)
m+1
t
2m+1
1 +t
2
.
Al integrar obtenemos:
arctanx
m

n=0
(1)
n
x
2n+1
2n + 1
=
_
x
0
(1)
m+1
t
2(m+1)
1 +t
2
dt.
La prueba de que el polinomio del miembro izquierdo es el polinomio de
Taylor de grado 2m + 1 de la funci on arcotangente sigue el mismo argumento
empleado en 4.16. (Notemos que, del hecho de que los polinomios de Taylor de
grado 2m + 1 tengan esta forma, se sigue que el polinomio de Taylor de grado
2m es el mismo que el de grado 2m1.)
4.3. C alculo de longitudes, areas y vol umenes 141
Ahora falta probar que, para |x| 1 jo, la sucesi on de restos de Taylor
_
x
0
(1)
m+1
t
2(m+1)
1 +t
2
dt
_
m0
converge a 0. Ahora bien:

_
x
0
(1)
m+1
t
2(m+1)
1 +t
2
dt

_
|x|
0
t
2(m+1)
1 +t
2
dt
_
|x|
0
t
2(m+1)
dt =
|x|
2m+3
2m+ 3
.
Y basta observar que el ultimo termino es innitesimal cuando m es innito.
Ahora observamos que
tan

4
=
sen

4
cos

4
=

2/2

2/2
= 1,
luego

4
= arctan1 =

n=0
(1)
n
2n + 1
= 1
1
3
+
1
5

1
7
+
Hemos obtenido as una de las muchas expresiones que permiten calcular
aproximaciones de
= 3.1415926535897932384626433. . .

Esta no es de las que convergen m as r apidamente (sumando los primeros 100.000


terminos s olo obtenemos la aproximaci on 3.14160, donde la cuarta cifra decimal
ya es incorrecta), pero no vamos a entrar en cuestiones de c alculo numerico.
4.3 Calculo de longitudes, areas y vol umenes
Longitudes de curvas En la secci on anterior hemos dado una f ormula para
calcular la longitud de un arco de curva. Conviene generalizarla para admitir que
la curva venga expresada de forma parametrica, es decir, como una aplicaci on
: [a, b] R
2
,
(t
0
)
l
1
l
2
l
3
l
4
(t
1
)
(t
2
)
(t
3
)
(t
4
)
que ser a de la forma (t) = (x(t), y(t)), para
ciertas funciones x, y. Notemos que la gr aca
de una funci on f : [a, b] R es el caso par-
ticular en que (t) = (t, f(t)), es decir, el caso
particular en que x(t) = t.
Deniremos la longitud de con el mismo criterio que en la secci on anterior:
consideramos una partici on P de [a, b], la cual da lugar a un n umero nito de
puntos sobre la curva, puntos que unimos por una lnea poligonal de n segmentos
142 Captulo 4. C alculo integral de una variable
de longitudes l
1
, . . . , l
n
. Vamos a probar que, si cumple algunas condiciones
de derivabilidad, la suma
L(, P) =
n

i=1
l
i
converge a un n umero (est andar) L, en el sentido de que, cuando la partici on
es innitesimal, L(, P) L, y este n umero L ser a el que tomaremos como
denici on de la longitud de .
Vamos a suponer que las funciones x(t), y(t) son dos veces derivables, y que
la segunda derivada est a acotada en ]a, b[ por un n umero (est andar) M. Esto
se cumple, por ejemplo, si ambas funciones son de clase C
2
en un abierto que
contenga al intervalo [a, b].
x
0
y
0
d
y
1
x
1
Como vamos a trabajar en R
2
, necesitamos un he-
cho elemental de la geometra de R
2
del que nos ocu-
paremos con m as detalle en el captulo VI: la distancia
entre dos puntos (x
0
, y
0
), (x
1
, y
1
) viene dada por
d((x
0
, y
0
), (x
1
, y
1
)) =
_
(x
1
x
0
)
2
+ (y
1
y
0
)
2
.
Denimos la recta tangente a en un punto t
0
]a, b[ como la recta en forma
parametrica T : R R
2
dada por
T(t) = (x(t
0
) +x
0
(t
0
)(t t
0
), y(t
0
) +y
0
(t
0
)(t t
0
)).
Claramente, se trata de una recta que pasa por el punto (t
0
). Vamos a
probar que el nombre de recta tangente est a justicado. Para ello aplicamos
el teorema de Taylor, que nos da que, si t ]a, b[, se cumple que
x(t) = x(t
0
) +x
0
(t
0
)(t t
0
) +
1
2
x
00
(c)(t t
0
)
2
,
y(t) = y(t
0
) +y
0
(t
0
)(t t
0
) +
1
2
y
00
(d)(t t
0
)
2
,
donde c y d son n umeros entre t y t
0
. Si 2M es una cota para las segundas
derivadas, tenemos que
|x(t) T
x
(t)| M(t t
0
)
2
, |y(t) T
y
(t)| M(t t
0
)
2
,
luego
d((t), T(t)) =
_
(x(t) T
x
(t))
2
+ (y(t) T
y
(t))
2
M(t t
0
)
2
.
Esto implica en particular que si t t
0
, entonces d((t), T(t)) 0, es
decir, que la curva y la recta tangente est an innitamente pr oximas para valores
de t innitamente pr oximos, pero debemos insistir en que esta observaci on no
tiene valor alguno: cualquier recta que pase por el punto (t
0
) cumplir a esta
propiedad, por la mera continuidad de y de la recta.
4.3. C alculo de longitudes, areas y vol umenes 143
Para enunciar la caracterstica que distingue a la recta tangente de cualquier
otra recta, consideramos una homotecia H
r
: R
2
R
2
de radio r y centro
(t
0
). Explcitamente:
H(x, y) = (x(t
0
) +r(x x(t
0
), y(t
0
) +r(y y(t
0
)).
Llamemos H
r
() y H
r
(T) a las composiciones de y T con H
r
, es decir:
H
r
()(t) = (x(t
0
) +r(x(t) x(t
0
)), y(t
0
) +r(y(t) y(t
0
))),
H
r
(T)(t) = (x(t
0
) +rx
0
(t
0
)(t t
0
), y(t
0
) +ry
0
(t
0
)(t t
0
)).
Observemos que las coordenadas de H
r
(T)(t) son nitas si y s olo si r(tt
0
) es
nito (lo que, en particular, exige que t t
0
). Para estos valores de t, tambien
es nito H
r
()(t), debido al siguiente hecho general: cualquier homotecia de
radio r cumple que
d(H
r
(x), H
r
(y)) = rd(x, y).
Esto se debe a que una homotecia se calcula efectuando una traslaci on (que
no altera las distancias), multiplicando por r (que multiplica las distancias por r)
y luego efectuando otra traslaci on (que no altera las distancias). Por consi-
guiente,
d(H
r
()(t), H
r
(T)(t)) Mr|t t
0
|
2
,
luego H
r
()(t), no s olo es nito cuando r(t t
0
) es nito, sino que permanece
innitamente cerca de H
r
(T)(t).
t
0
(t
0
)

T
(t
0
)
(t)
H
r
t
La gura
3
ilustra lo que hemos de-
mostrado: Los valores t t
0
que cum-
plen que r(t t
0
) es nito son los que
tienen im agenes nitas
4
al aplicar la ho-
motecia H
r
. La gr aca de H
r
(T) es la
misma recta T (aunque ahora se recorre
toda ella con par ametros innitamente
pr oximos a t
0
), mientras que la gr aca
de H
r
() resulta ser indistinguible de T.
En principio, la recta T no es la unica
que cumple esto, pues lo cumplir a tambien cualquier otra recta cuya pendiente
este innitamente pr oxima a la de T, pero si el punto t
0
es est andar (cosa que
no hemos necesitado suponer en todo el razonamiento), entonces T ser a tambien
est andar y es la unica recta est andar que aproxima a de esta forma.
Volvemos ahora al problema de calcular la longitud de . Para ello, vamos
a ver que en lugar de considerar la longitud l
i
del segmento que va de (t
i1
) a
3
El punto marcado con (t) dentro de la lupa es en realidad H
r
()(t), pero no hay
confusi on posible si omitimos H
r
del nombre de toda imagen vista a traves de una lupa.
Lo mismo vale, en principio, para (t
0
), pero en este caso H
r
()(t
0
) = (t
0
).
4
Esto es exacto para H
r
(T), pero puede ocurrir que H()(t) tome valores nitos cuando
r(t t
0
) sea innito, por ejemplo, porque tenga forma de ocho y vuelva a pasar por (t
0
)
para otro valor t > t
0
, pero tales puntos podran eliminarse reduciendo el dominio [a, b] de .
144 Captulo 4. C alculo integral de una variable
(t
i
), podemos considerar la recta tangente T
i
en t
i1
y considerar la longitud
l
0
i
del segmento que va de (t
i1
) a T
i
(t
i
).
(t
i1
)
(t
i
)
T
i
(t
i
)
l
0
i
l
i
Observemos que la gura no representa una ampliaci on
homotetica de la curva (es decir, que no est a a escala,
porque, si lo fuera, los dos segmentos y la gr aca de de-
beran estar representados por un mismo segmento de recta,
ya que, seg un hemos visto, H
r
()(t
i
) (t
i
). Precisamente
esta es la raz on por la que podremos cambiar l
i
por l
0
i
.
Muchos libros, especialmente de fsica, argumentan con innitesimos y, en
situaciones similares a esta, arman que podemos tomar l
0
i
en lugar de l
i
simple-
mente porque l
i
l
0
i
, pero esto no es un argumento v alido. Nuestra intenci on
es sumar los innitos valores de l
i
, y al cambiarlos por los l
0
i
estamos introdu-
ciendo un error innitesimal en cada sumando. El problema, es que al sumar
innitos errores innitesimales, el error total puede ser apreciable, y en tal caso
la sustituci on no es v alida. Hemos de probar que no se da el caso. Ahora bien,
es claro que l
0
i
l
i
+ d(T
i
(t
i
) (t
i
)) y tambien l
i
l
0
i
+ d(T
i
(t
i
) (t
i
)), lo
que nos da:
|l
i
l
0
i
| d(T
i
(t
i
) (t
i
)) Mt
2
i
MkPkt
i
.
Por lo tanto,

i=1
l
i

i=1
l
0
i

MkPk
n

i=1
t
i
= M(b a)kPk,
que es innitesimal para cualquier partici on innitesimal P. As pues, si proba-
mos que
n

i=1
l
0
i
permanece innitamente pr oximo a un n umero jo (est andar) L
sea cual sea la partici on innitesimal P, habremos probado que lo mismo vale
para la suma de los l
i
.
En denitiva, vemos que si podemos sustituir l
i
por l
0
i
no es porque l
i
l
0
i
,
sino porque la diferencia sigue siendo innitesimal cuando se divide entre t
i
o, equivalentemente, entre la norma de la partici on. Los matem aticos antiguos
expresaban esto diciendo que l
i
l
0
i
es un innitesimo de orden superior a t
i
.
La interpretaci on geometrica es, precisamente, que el innitesimo l
i
l
0
i
se man-
tiene innitesimal al aplicar cualquier homotecia que vuelva apreciable (es decir,
nito, pero no innitesimal) el incremento t
i
.
Ahora observamos que
T
i
(t
i
) = (x(t
i1
) +x
0
(t
i1
)t
i
, y(t
i1
) +y
0
(t
i1
)t
i
),
por lo que
l
0
i
= d((t
i
), T
i
(t
i
)) =
_
x
0
(t
i1
)
2
+y
0
(t
i1
)
2
t
i
,
luego
n

i=1
l
i

n

i=1
l
0
i
=
n

i=1
_
x
0
(t
i1
)
2
+y
0
(t
i1
)
2
t
i

_
b
a
_
x
0
(t)
2
+y
0
(t)
2
dt.
En denitiva:
4.3. C alculo de longitudes, areas y vol umenes 145
Denici on 4.26 Si : [a, b] R
2
es una funci on con coordenadas
5
de clase
C
1
en un intervalo abierto que contenga a [a, b], denimos la longitud de como
L() =
_
b
a
_
x
0
(t)
2
+y
0
(t)
2
dt.
Notemos que la denici on 4.17 es el caso particular de esta que resulta de
tomar x(t) = t.
Ejemplo Podemos parametrizar una circunferencia de radio r mediante la
funci on
(t) = (r cos t, r sent), 0 t 2.
Por consiguiente, la longitud de la circunferencia es
_
2
0
r
_
sen
2
t + cos
2
t dt =
_
2
0
r dt = 2r.
El area de un crculo La funci on f(x) =

r
2
x
2
deja bajo su gr aca un
semicrculo de radio r, luego el area de un crculo de radio r es
A = 2
_
r
r
_
r
2
x
2
dx.
Para calcular esta integral usamos el cambio de variable (estrictamente cre-
ciente) x : [/2, /2] [r, r] dado por x = r sent. As:
6
A = 2
_
/2
/2
_
r
2
r
2
sen
2
t r cos t dt = 2r
2
_
/2
/2
cos
2
t dt
= 2r
2
_
/2
/2
1 + cos 2t
2
dt = r
2

t +
sen2t
2

/2
/2
= r
2
.

Ejercicio: Modicar el ejemplo anterior para calcular el area de


la regi on sombreada en la gura. Sum andola al area del tri angulo
adyacente, calcular el area del sector circular en funci on de .
En el ejemplo anterior hemos calculado el area del crculo
a partir de la interpretaci on de la integral como area com-
prendida bajo la gr aca de una funci on. El c alculo no ha sido
5
Para que L() este bien denida no es necesario suponer que las coordenadas de admitan
segundas derivadas. La discusi on precedente prueba que, cuando las tienen y est an acotadas,
L() es lo que pretendemos que sea. Puede probarse que lo mismo es cierto bajo las meras
hip otesis de la denici on, pero ello exige algunos tecnicismos adicionales en el argumento.
6
Usamos que cos 2t = cos
2
t sen
2
t = 2 cos
2
t 1.
146 Captulo 4. C alculo integral de una variable
especialmente sencillo: hemos necesitado un cambio de variable y transformar
un integrando mediante una identidad trigonometrica. Vamos a llegar al mismo
resultado de un modo conceptualmente m as simple y, de hecho, m as cl asico.

r
Consideremos un sector circular de radio r y amplitud
. Su area est a comprendida entre los dos tri angulos
is osceles que muestra la gura. El menor es uni on de
dos tri angulos rect angulos de base r cos(/2) y altura
r sen(/2), luego su area es
s = r
2
cos

2
sen

2
=
r
2
2
sen.
El mayor es uni on de dos tri angulos rect angulos de base r y altura r tan(/2),
luego su area es
S = r
2
tan

2

Ahora consideramos el sector circular comprendido


entre dos angulos y . Tomamos una partici on P =
{
i
}
n
i=0
de [, ], que divide el sector dado en n peque nos
sectores. Usando las estimaciones anteriores, el area del
sector completo estar a acotada de este modo:
r
2
2
n

i=1
sen
i
A r
2
n

i=1
tan

i
2
.
El teorema del valor medio aplicado al intervalo [0,
i
] nos da que existe
0 < c
i
<
i
kPk tal que
sen
i
=
i
cos c
i

i
cos kPk.
As pues,
A
r
2
2
cos kPk
n

i=1

i
=
r
2
( )
2
cos kPk.
Igualmente,
tan

i
2
=
1
cos
2
d
i

i
2

1
cos
2
kPk

i
2
,
con 0 < d
i
<
i
/2 kPk, luego
A
r
2
cos
2
kPk
n

i=1

i
=
r
2
( )
2 cos
2
kPk
.
En total:
r
2
( )
2
cos kPk A
r
2
( )
2 cos
2
kPk
.
4.3. C alculo de longitudes, areas y vol umenes 147
Esto es v alido para cualquier partici on P. Si la tomamos innitesimal resulta
que cos kPk 1, luego ha de ser
A =
r
2
2
( ).
En particular, si [, ] = [0, 2], el area del crculo completo es A = r
2
.
Coordenadas polares Consideremos ahora una curva en R
2
que este deter-
minada por una funci on : [, ] ]0, +[ del modo siguiente: la recta que
pasa por (0, 0) y forma un angulo con el vector (1, 0) corta a la curva en un
unico punto a distancia () de (0, 0).

()
()
()
Entonces, una parametrizaci on de la curva es la apli-
caci on : [, ] R
2
dada por
(t) = (() cos , () sen).
Esto nos permite calcular su longitud:
L() =
_

_
(
0
() cos () sen)
2
+ (
0
() sen +() cos )
2
d
=
_

02
() +
2
() d
m
i
M
i
Ahora vamos a calcular el area sombreada en la -
gura. Para ello tomamos una partici on P = {
i
}
n
i=0
de
[, ]. Si m
i
y M
i
son, como de costumbre, el nmo
y el supremo de en [
i1
,
i
], la porci on de supercie
contenida en el angulo [
i1
,
i
] contiene al sector circu-
lar de radio m
i
y est a contenida en el sector circular de
radio M
i
. Por lo tanto,
n

i=1
m
2
i
2

i
A
n

i=1
M
2
i
2

i
.
Los extremos son una suma inferior y una suma superior de la integral
A =
1
2
_

2
()d,
que, por consiguiente, ha de ser el area que buscamos.
148 Captulo 4. C alculo integral de una variable
Supercies de revoluci on Vamos a calcular el area de una supercie de
revoluci on, es decir, de la supercie generada cuando giramos alrededor del eje
X la gr aca de una funci on r : [a, b] R que no tome valores negativos, tal y
como se muestra en la primera gura.
Para ello tomamos una partici on innitesimal P = {x
i
}
n
i=1
de [a, b] y otra
Q = {
j
}
m
j=1
de [0, 2]. La partici on P divide la supercie en rodajas circula-
res de longitud x
i
(que en la segunda gura vemos desde arriba) y la partici on
Q subdivide cada rodaja en cuadril ateros.
r(x)
r(x)
g
x
i1
x
i
g
g
r(x
i1
)
j
r(x
i
)
j

j1

j
x
i
x
i1
No es difcil ver que las particiones pueden renarse (a nadiendoles puntos)
para que los cocientes x
i
/
j
sean nitos, lo que nos permite considerar
una homotecia H
r
de radio innito que vuelva apreciables simult aneamente los
incrementos x
i
y
j
.
Al estudiar las longitudes de curvas hemos visto que, si a un arco de longitud
innitesimal le aplicamos una homotecia que vuelve apreciable la diferencia
entre sus extremos, el arco permanece innitamente cerca del segmento que une
dichos extremos. As pues, al aplicar H
r
, el cuadril atero innitesimal abombado
de la segunda gura se transforma en un cuadril atero nito indistinguible de un
cuadril atero plano como el representado en la cuarta gura.
La longitud g ser a (ampliada r veces) la longitud del segmento que une los
puntos (x
i1
, r(x
i1
)) y (x
i
, r(x
i
)), es decir:
g =
_
x
2
i
+ (r(x
i
) r(x
i1
))
2
.
Aplicando el teorema del valor medio: r(x
i
) r(x
i1
) = r
0
(c
i
)x
i
, para
cierto punto x
i1
< c
i
< x
i
, luego
g =
_
1 +r
0
(c
i
)
2
x
i
.
Si x
i1
x x
i
, la altura en x del cuadril atero es un arco de circunferencia
de radio r(x) y de amplitud
j
, luego su longitud es r(x)
j
. Al aplicar H
r
,
4.3. C alculo de longitudes, areas y vol umenes 149
las diferencias de longitud para distintos valores de x pueden ser apreciables
(como se reeja en la cuarta gura, donde el cuadril atero tiene forma trapezoi-
dal). Por lo tanto, el producto
r(d
i
)
_
1 +r
0
(c
i
)
2
x
i

j
, x
i1
d
i
x
i
,
ser a una aproximaci on por defecto o por exceso al area del cuadril atero seg un
que d
i
corresponda a la m axima longitud r(x)
j
o a la mnima. Sin em-
bargo, vamos a ver que diferentes elecciones para d
i
s olo producen variaciones
innitesimales en la suma
S =
m

j=1
n

i=1
r(d
i
)
_
1 +r
0
(c
i
)
2
x
i

j
= 2
n

i=1
r(d
i
)
_
1 +r
0
(c
i
)
2
x
i
,
con lo que esta ser a una estimaci on razonable del area que queremos calcular.
En efecto, si tomamos otros valores e
i
[x
i1
, x
i
], podemos aplicar el teorema
del valor medio:
|r(d
i
) r(e
i
)| = |r
0
(f
i
)||e
i
d
i
| Mx
i
MkPk
donde M es una cota (est andar) de r
0
en [a, b]. Por lo tanto,
|S({d
i
}) S({e
i
})| 2MkPk
n

i=1
_
1 +r
0
(c
i
)
2
x
i
0,
porque kPk es innitesimal y el sumatorio es nito, ya que est a innitamente
pr oximo a la integral
_
b
a
_
1 +r
0
(x)
2
dx.
En particular, tomando e
i
= c
i
, vemos que, sea cual sea d
i
, se cumple que
S 2
n

i=1
r(c
i
)
_
1 +r
0
(c
i
)
2
x
i
2
_
b
a
r(x)
_
1 +r
0
(x)
2
dx.
Denici on 4.27 Llamaremos
7
area de la supercie de revoluci on generada por
la curva r : [a, b] R al valor
A = 2
_
b
a
r(x)
_
1 +r
0
(x)
2
dx.
7
Observemos que el razonamiento precedente no puede considerarse una demostraci on de
que el area es la que hemos calculado, ya que no partimos de ninguna denici on previa de
area. Tan s olo puede verse como un razonamiento heurstico que explica por que la denici on
que hemos dado es la que va a comportarse como cabe esperar que se comporte un area. En
el contexto de la geometra diferencial es posible dar una denici on general de area de una
supercie y, con respecto a dicha denici on, s que es posible demostrar esta f ormula. (Ahora
bien, la denici on general de area se justica por un razonamiento heurstico similar al que
hemos visto aqu.)
150 Captulo 4. C alculo integral de una variable
Ejemplo Para calcular el area de una esfera de radio R consideramos la
funci on r(x) =

R
2
x
2
, denida en [R, R], con lo que obtenemos
A = 2
_
R
R
_
R
2
x
2
_
1 +
x
2
R
2
x
2
dx = 2
_
R
R
Rdx = 4R
2
.
Ejercicio: Demostrar que la supercie lateral de un tronco de cono es
A = 2
r +R
2
g.
Demostrarlo mediante la f ormula para supercies de revoluci on y tambien desarro-
llando el cono y usando la f ormula para el area de un sector circular.
R
r
g
h
H
h
2R
2r
H
(N otese que, por el teorema de Tales, rH = Rh.)
Vol umenes de revoluci on Un razonamiento m as simple que el del apartado
anterior nos permite deducir una f ormula para el volumen V del s olido de revo-
luci on determinado por una funci on r : [a, b] R. Basta observar que, si P es
una partici on de [a, b],
n

i=1
m
2
i
x
i
V
n

i=1
M
2
i
x
i
,
donde m
i
y M
i
son, como de costumbre, el nmo y el supremo de r en [x
i1
, x
i
].
En efecto, cada sumando es el volumen del cilindro de altura x
i
y radio m
i
o
M
i
. Es obvio que la uni on de los cilindros peque nos est a contenida en el s olido
de revoluci on, que a su vez est a contenido en la uni on de los cilindros grandes, lo
que nos da las desigualdades. Si la funci on r es continua, m
2
i
y M
2
i
son el nmo
y el supremo de la funci on r
2
en [x
i1
, x
i
], luego, cuando P es innitesimal,
ambas sumas est an innitamente pr oximas a
V =
_
b
a
r(x)
2
dx.
Ejercicio: Razonar (sin usar la f ormula anterior) que, tal y como hemos armado
para deducirla, el volumen de un cilindro de radio r y altura h ha de ser V = r
2
h.
4.3. C alculo de longitudes, areas y vol umenes 151
Ejemplo El volumen de una esfera de radio R es
V =
_
R
R
(R
2
x
2
) dx =

R
2
x
x
3
3

R
R
=
4
3
R
3
.
Ejemplo El volumen del hiperboloide de revoluci on que resulta de girar la
hiperbola f : [1, t] R dada por f(x) = 1/x es
V
t
=
_
t
1
1
x
2
dx =

1
x

t
1
= (1 1/t).
Observamos que lm
t+
V
t
= , lo que se interpreta como que en una copa
hiperb olica innita cuya boca tenga dos unidades de di ametro, caben s olo
unidades c ubicas de champ an.
Esto es especialmente curioso si observamos que la copa, aunque tiene volu-
men nito, tiene supercie innita:
Ejercicio: Comprobar que la supercie del hiperboloide de revoluci on en [1, t] viene
dada por
A
t
= 2
_
t
1

1 +x
4
x
3
dx =

arg senhx
2

1 +x
4
x
2

t
1
=
_
arg senht
2

1 +t
4
t
2
arg senh1 +

(Para calcular la integral, realizar sucesivamente los cambios de variable u = x


2
y
u = senhv, y tener en cuenta que (coshv/ senhv)
0
= 1/ senh
2
v.) Concluir que
lm
t+
A
t
= +.
As pues, tal y como habamos armado, la copa hiperb olica innita tiene volumen
nito, pero area innita.
Captulo V
Series innitas
Ya hemos visto que algunas funciones admiten desarrollos en serie de Taylor,
de la forma
f(x) =

n=0
f
n)
(x
0
)
n!
(x x
0
)
n
.
Observemos que estas expresiones son en realidad familias de series, en el
sentido de que determinan una serie distinta para cada x, de modo que pueden
ser convergentes para unos valores de x y divergentes para otros. En la primera
secci on de este captulo estudiaremos las series numericas propiamente dichas,
es decir, series de la forma

n=0
a
n
,
donde {a
n
}
n0
es una sucesi on de n umeros reales; en la segunda secci on estu-
diaremos las sucesiones de funciones, para analizar aquellas propiedades que no
dependen de que las funciones en cuesti on sean series; y nalmente estudiaremos
las series de funciones, centr andonos especialmente en las series de potencias,
que son las series de la forma

n=0
a
n
(x x
0
)
n
,
es decir, las que tienen la misma estructura que las series de Taylor.
5.1 Series numericas
Recordemos que la serie numerica asociada a una sucesi on {a
n
}
n0
de n umeros
reales es la sucesi on {S
N
}
N0
dada por
S
N
=
N

n=0
a
n
.
153
154 Captulo 5. Series innitas
Es costumbre representar a esta sucesi on, al igual que a su lmite, si es que
existe, como

n=0
a
n
.
Los terminos S
N
de la sucesi on se llaman sumas parciales. Ya hemos tenido
ocasi on de probar la convergencia de algunas series no triviales, como:

n=0
(1)
n
2n + 1
= 1
1
3
+
1
5

1
7
+ =

4
o

n=1
(1)
n+1
n
= 1
1
2
+
1
3

1
4
+ = log 2.
Y tambien hemos visto que series como

n=1
1
n
= 1 +
1
2
+
1
3
+
1
4
+
son divergentes.
Lo m as elemental que podemos decir a la hora de distinguir las series con-
vergentes de las divergentes es lo siguiente:
Teorema 5.1 Si una serie

n=0
a
n
es convergente, entonces lm
n
a
n
= 0.
Demostraci on: Basta observar que
a
n
= S
n
S
n1
,
luego, si la serie converge a un n umero L, se cumple que
lm
n
a
n
= lm
n
S
n
lm
n
S
n1
= L L = 0.
Sin embargo, debemos tener bien presente que, aunque el termino general a
n
converja a 0, la serie puede diverger, como muestra el ejemplo previo al teorema
anterior.
Ejemplo La serie geometrica converge a

n=0
r
n
=
1
1 r
converge si y s olo si |r| < 1, y diverge en caso contrario.
5.1. Series numericas 155
En efecto, si |r| 1 es claro que el termino general no converge a 0, luego
la serie es divergente. Si |r| < 1 (est andar) y N es innito:
N

n=0
r
n
=
1 r
N+1
1 r

1
1 r
.
Esto prueba la convergencia.
Las propiedades de los lmites implican inmediatamente el teorema siguiente:
Teorema 5.2 Sean

n=0
a
n
y

n=0
b
n
dos series convergentes y R. Entonces
tambien convergen

n=0
(a
n
+b
n
) =

n=0
a
n
+

n=0
b
n
y

n=0
a
n
=

n=0
a
n
.
Otro hecho obvio es el siguiente:
Teorema 5.3 Si n
0
N, una serie

n=0
a
n
es convergente si y s olo si lo es la
serie

n=n
0
a
n
.
Demostraci on: Podemos suponer que n
0
es est andar, y entonces basta
observar que, para N innito,
N

n=0
a
n
=
n
0
1

n=0
a
n
+
N

n=n
0
a
n
.
El miembro izquierdo tendr a una parte est andar independiente de N si y
s olo si lo tiene el termino de la derecha.
Una serie plantea dos problemas distintos: determinar si es o no convergente
y, en caso de que lo sea, calcular su suma. A menudo el primero es m as sencillo
que el segundo. Desde un punto de vista te orico, el problema es m as simple en
el caso de series de terminos positivos, es decir, series en las que a
n
0 para
todo ndice n:
Teorema 5.4 Una serie de terminos positivos es convergente si y s olo si sus
sumas parciales est an acotadas superiormente.
Demostraci on: Basta observar que las series de terminos positivos son
sucesiones mon otonas crecientes. En particular, sus sumas parciales siempre
est an acotadas inferiormente (por la primera de ellas) y, por consiguiente, decir
que est an acotadas superiormente es lo mismo que decir que est an acotadas.
Basta aplicar entonces el teorema 2.62. (Recprocamente, es obvio que toda
sucesi on convergente ha de estar acotada.)
Explcitamente, la condici on del teorema anterior es que exista un n umero
M > 0 tal que
N

n=0
a
n
M
para todo N N o, para series est andar, que el miembro izquierdo sea nito
siempre que N es innito.
156 Captulo 5. Series innitas
Ejemplo La serie

n=1
1
n

converge si y s olo si > 1.


En efecto, podemos suponer que es est andar. Si > 1 y n > 1, tenemos
que
1
n


_
n
n1
dx
x

,
luego
N

n=1
1
n

1 +
_
N
1
dx
x

= 1 +

1
( 1)x
1

N
1
= 1 +
1
1

1
( 1)N
1
.
Si N es innito, el ultimo termino es innitesimal, luego la suma parcial es
nita. Esto prueba que la serie es convergente.
Si 0 la serie es divergente porque su termino general no tiende a 0. Ya
hemos observado que la serie tambien diverge cuando = 1. Falta probar que
tambien es divergente cuando 0 < < 1. En tal caso:
_
n+1
n
dx
x


1
n

,
luego
_
N+1
1
dx
x

n=1
1
n

.
Al calcular la integral resulta:
(N + 1)
1
1

1
1

N

n=1
1
n

.
Cuando N es innito, el primer termino tambien lo es, luego la serie es
divergente.
Igual que acabamos de comparar series con integrales, tambien podemos
comparar unas series con otras cuya convergencia o divergencia conozcamos:
Teorema 5.5 Sean

n=0
a
n
y

n=0
b
n
dos series est andar de terminos positivos
tales que, cuando n es innito, a
n
b
n
. Entonces, si la segunda converge, la
primera tambien converge.
Demostraci on: Fijemos un n umero natural innito n
0
. Entonces, para
todo N n
0
se cumple que
N

n=n
0
a
n

N

n=n
0
b
n

n=0
b
n
,
5.1. Series numericas 157
luego la serie

n=n
0
a
n
es convergente (por estar acotada) y lo mismo vale para
la serie desde n = 0.
Teorema 5.6 Si una serie de terminos positivos no nulos

n=0
a
n
cumple que
lm
n
a
n+1
a
n
< 1,
entonces es convergente.
Demostraci on: Podemos suponer que la sucesi on es est andar. Si L es el
lmite del enunciado, podemos tomar L < r < 1 est andar. As, si n es innito,
se cumple que
a
n+1
a
n
< r.
Fijado n
0
innito, para todo n n
0
tenemos que
a
n
a
n
0
r
nn
0
=
a
n
0
r
n
0
r
n
.
Como la serie geometrica

n=n
0
r
n
es convergente, tambien lo es

n=n
0
a
n
, y
tambien la serie sumada desde n = 0.
Ejemplo Si 0 < r < 1, se cumple que

n=1
nr
n
=
r
(1 r)
2
En efecto, para probar la convergencia basta observar que, si n es innito,
a
n+1
a
n
=
n + 1
n
r r,
luego se cumple el teorema anterior con cualquier r
0
que cumpla r < r
0
< 1.
Ahora observamos que
S
N
= r + 2r
2
+ 3r
3
+ +Nr
N
,
rS
N1
= r
2
+ 2r
3
+ + (N 1)r
N
.
Por consiguiente:
S
N
rS
N1
= r +r
2
+ +r
N
=
r r
N+1
1 r

r
1 r
Si N es innito, como sabemos que la serie es convergente, podemos asegurar
que S
N
S
N1
, luego
S
N
rS
N

r
1 r
,
158 Captulo 5. Series innitas
luego
S
N

r
(1 r)
2
.
La serie anterior aparece en un problema cl asico de la teora de la probabi-
lidad:
Ejemplo Vamos a calcular el n umero de veces que cabe esperar que haya que
tirar un dado hasta que salga un seis.
M as en general, supongamos que un fen omeno aleatorio se produce con pro-
babilidad 1/n, donde n es un n umero natural (n = 6 en el caso de sacar un seis
o cualquier otro n umero prejado con un dado). Por simplicidad, hablare-
mos en terminos de un dado, pero trabajaremos con un n generico.
Si repetimos muchas veces el experimento de lanzar sucesivamente un dado
hasta obtener un 6, lo conseguiremos en la primera tirada aproximadamente
1/n de las veces (si no fuera as, eso signicara, por denici on, que el dado est a
trucado).
En cambio, (n 1)/n de las veces, el primer resultado no sera un 6. De
entre todos estos casos, aproximadamente 1/n de ellos, es decir, (n 1)/n
2
del
total de los experimentos, obtendramos el 6 al segundo intento, mientras que
en (n 1)/n de ellos, es decir, en (n 1)
2
/n
2
del total, no conseguiramos el 6
al segundo intento.
De entre todos estos (n 1)
2
/n
2
segundos intentos fallidos, en aproximada-
mente 1/n de los casos, es decir, (n 1)
2
/n
3
del total, conseguiremos el 6 al
tercer intento, y as sucesivamente.
En denitiva, la fracci on de intentos en que conseguiremos el 6 al k-esimo
intento ser a
(n 1)
k1
n
k
=
1
n 1
_
n 1
n

k
.
Si el n umero total de experimentos es N, la media del n umero de intentos
necesarios para obtener el 6 se calcular a multiplicando por k el n umero de
experimentos en que hemos necesitado k intentos, lo que nos da
Nk
1
n 1
_
n 1
n

k
,
sumando para todo k y dividiendo entre el total N, lo que nos da la serie
1
n 1

k=1
k
_
n 1
n

k
.
Seg un el ejemplo anterior, la suma es
1
n 1
n1
n
_
1
n
_
2
= n.
5.1. Series numericas 159
As pues, si repetimos N veces el experimento de tirar un dado hasta que
salga un seis, la media del n umero de intentos necesarios tender a a 6 cuando N
tienda a innito.
Estos criterios, que en principio valen para series de terminos positivos, pue-
den aplicarse para estudiar la convergencia de series arbitrarias debido al teo-
rema siguiente. Primero necesitamos una denici on:
Denici on 5.7 Diremos que una serie

n=0
a
n
es absolutamente convergente si
la serie

n=0
|a
n
| es convergente.
Teorema 5.8 Toda serie absolutamente convergente es convergente. Adem as:

n=0
a
n

n=0
|a
n
|.
Demostraci on: Consideremos una serie (est andar)

n=0
a
n
, sea S
N
su suma
parcial N-sima y sea S
0
N
la suma parcial correspondiente a la serie con valores
absolutos. Si esta es convergente y M < N son n umeros naturales innitos,
tenemos que
|S
N
S
M
| =

n=M
a
n

n=M
|a
n
| = S
0
N
S
0
M
0,
luego S
M
S
N
, lo que signica que la serie dada es una sucesi on de Cauchy,
luego es convergente. Adem as, teniendo en cuenta que una serie de terminos
positivos (como sucesi on mon otona) converge al supremo de sus sumas parciales,
tenemos que

n=0
|a
n
|
N

n=0
|a
n
|
N

n=0
a
n

N

n=0
|a
n
|

n=0
|a
n
|.
Esto vale para todo N. En particular, vale para N innito, y sigue siendo
cierto al tomar la parte est andar del termino central, es decir:

n=0
|a
n
|

n=0
a
n

n=0
|a
n
|.
Esto equivale a la desigualdad del enunciado.
As pues, para probar la convergencia de una serie podemos tratar de aplicar
los criterios que hemos visto a la serie correspondiente con valores absolutos.
Ahora bien, hemos de tener presente que una serie puede ser convergente sin ser
absolutamente convergente. Un ejemplo es la serie

n=1
(1)
n+1
n
= log 2.
Hay un criterio muy sencillo que justica la convergencia de series como esta,
en la que los terminos alternan en signo:
160 Captulo 5. Series innitas
Teorema 5.9 (Criterio de Leibniz) Sea {a
n
}
n0
una sucesi on mon otona de-
creciente y convergente a 0. Entonces, la serie

n=1
(1)
n+1
a
n
es convergente.
Demostraci on: Observemos que las sumas parciales pares:
S
2N
= (a
1
a
2
) + (a
3
a
4
) + + (a
2N1
a
2N
)
forman una sucesi on mon otona creciente, ya que los terminos entre parentesis
son positivos. Similarmente, las sumas parciales impares:
S
2N+1
= a
1
+ (a
2
+a
3
) + (a
4
+a
5
) + + (a
2N
+a
2N+1
)
forman una sucesi on mon otona decreciente, ya que todos los terminos entre
parentesis son negativos. M as a un, ambas sucesiones est an distribuidas de esta
forma:
S
2
< S
4
< S
6
< < S
5
< S
3
< S
1
En efecto: S
2
< S
1
porque S
2
resulta de sumarle a S
1
un n umero negativo, luego,
S
2
< S
3
< S
1
porque S
3
resulta de sumarle a S
2
un n umero positivo y ya hemos
visto que la sucesi on de sumas impares es decreciente, luego, S
2
< S
4
< S
3
porque ya hemos visto que la sucesi on de las sumas pares es creciente y S
4
resulta de sumarle a S
3
un n umero negativo, etc.
En denitiva, las series de sumas pares es una sucesi on mon otona creciente
y acotada por S
1
, luego es convergente, y la serie de sumas impares es una
sucesi on mon otona decreciente y acotada por S
2
, luego es convergente. Ahora
bien, si M y N son n umeros innitos, tenemos que
S
2N+1
S
2M
S
2N+1
S
2N
= a
2N+1
0,
luego todas las sumas parciales S
N
(tanto si N es par o impar) tienen la misma
parte est andar S, de modo que S
N
S para todo N innito, luego la serie es
convergente.
La convergencia absoluta es crucial para generalizar a series innitas pro-
piedades obvias de las series nitas, como el hecho de que una suma (nita) es
independiente del orden de los sumandos. Esto es consecuencia de la siguiente
caracterizaci on de la convergencia de una serie de terminos positivos:
Teorema 5.10 Una serie (est andar) de terminos positivos

n=0
a
n
converge a
un n umero (est andar) S si y s olo si para todo conjunto nito I N que contenga
a todos los n umeros nitos, se cumple que

nI
a
n
S.
5.1. Series numericas 161
Demostraci on: Si la serie converge a S e I N es un conjunto nito
que contenga a todos los n umeros nitos, la nitud de I implica que existe un
m aximo M y un mnimo N tales que
{0, . . . , M} I {0, . . . , N}.
Como M+1 / I, M ha de ser innito. Como la serie es de terminos positivos,
S
M

n=0
a
n


nI
a
n

N

n=0
a
n
S,
luego

nI
a
n
S.
Recprocamente, si se cumple esta condici on y N es un n umero natural
innito, tomando I = {0, . . . , N}, tenemos que
N

n=0
a
n
=

nI
a
n
S,
lo que signica que la serie converge a S.
Como consecuencia:
Teorema 5.11 Si la serie

n=0
a
n
es absolutamente convergente y f : N N
es una aplicaci on biyectiva, entonces la serie

n=0
a
f(n)
tambien es absolutamente
convergente, y su suma es la misma.
Demostraci on: Llamemos
a
+
n
=

a
n
si a
n
0,
0 si a
n
< 0,
a

n
=

0 si a
n
0,
a
n
si a
n
< 0.
De este modo, a
n
= a
+
n
a

n
. Como |a
+
n
| |a
n
| y |a

n
| |a
n
|, el teorema 5.5
implica que las series

n=0
a
+
n
,

n=0
a

n
son absolutamente convergentes, y

n=0
a
n
=

n=0
a
+
n

n=0
a

n
.
Es claro que (como sucesiones, no como lmites, que no sabemos si existen)

n=0
a
f(n)
=

n=0
a
+
f(n)

n=0
a

f(n)
.
Por lo tanto, si probamos que las dos series de la derecha son convergentes
y que su suma es la misma que la de las series correspondientes sin permutar
los sumandos, tendremos probado el teorema. Ahora bien, ambas series son de
162 Captulo 5. Series innitas
terminos positivos, luego concluimos que basta probar el teorema para series
de terminos positivos. Supongamos, pues que a
n
0 para todo n. Tambien
podemos suponer que todos los datos, incluida f son est andar.
Entonces, si N es un n umero natural innito, el conjunto
I = {f(n) | n N}
es nito y contiene a todos los n umeros naturales nitos, porque, como f es
est andar, todo m N est andar es de la forma m = f(m
0
), con m
0
est andar,
luego m
0
< N, luego m I. Adem as
N

n=0
a
f(n)
=

nI
a
n
S,
luego

n=0
a
f(n)
= S.
El teorema es falso para series no absolutamente convergentes.
Ejemplo Sabemos que
1
1
2
+
1
3

1
4
+
1
5

1
6
+ = ln2.
Por lo tanto:
1
2

1
4
+
1
6

1
8
+
1
10

1
12
+ =
ln2
2
.
Es claro entonces que
0 +
1
2
+ 0
1
4
+ 0 +
1
6
+ 0
1
8
+ 0 +
1
10
+ 0
1
12
+ =
ln2
2
.
Sumando esta serie y la original obtenemos que
1 + 0 +
1
3

1
2
+
1
5
+ 0 +
1
7

1
4
+
1
9
+ =
3 ln2
2
.
Eliminando los ceros:
1 +
1
3

1
2
+
1
5
+
1
7

1
4
+
1
9
+
1
11

1
6
+
1
13
+
1
15

1
8
+ =
3 ln2
2
.
La ultima serie es claramente una reordenaci on de la primera, y tiene una
suma diferente.
5.2. Sucesiones funcionales 163
5.2 Sucesiones funcionales
Estudiamos ahora las sucesiones de funciones de la forma {f
n
}
n0
, donde
f
n
: I R, para un intervalo I R. El concepto m as sencillo de convergencia
que podemos denir para estas sucesiones es el siguiente:
Denici on 5.12 Diremos que una sucesi on funcional {f
n
}
n0
en un intervalo
I R converge puntualmente a una funci on f : I R si para todo x I
existe
lm
n
f
n
(x) = f(x).
Este lmite no tiene por que existir, pero es evidente que una sucesi on fun-
cional no puede converger a dos lmites distintos.
Ejemplo La sucesi on f
n
(x) =
n

x, denida en [0, +[, es convergente, y su


lmite es la funci on constante 1:
lm
n
n

x = 1.
En efecto, si x 0 es est andar, se cumple que
n

x = x
1/n
= e
(log x)/n
, luego
si n es innito se cumple que (log x)/n 0, luego
n

x 1.
Observemos que si una sucesi on numerica est andar {x
n
}
n0
converge a un
lmite l, entonces x
n
es nito siempre que n es innito, y l =

x
n
. Podemos
enunciar un hecho an alogo para lmites funcionales, para lo cual necesitamos la
denici on siguiente:
Denici on 5.13 Una funci on f : I R (no necesariamente est andar) de-
nida en un intervalo est andar I R es casi est andar si cuando x I es
est andar, entonces f(x) es nito. En tal caso, denimos su estandarizaci on
como la funci on

f =
S
{(x, y) R
2
| x I, y f(x)}.
Teorema 5.14 Si f : I R es una funci on casi est andar, entonces su es-
tandarizaci on

f : I R es la unica funci on est andar tal que, para todo x I
est andar, cumple

f(x) =

f(x).
Demostraci on: Sucesivas aplicaciones del principio de transferencia prue-
ban que

f : I R. En efecto, como todo elemento est andar de

f es un par
de n umeros reales con primera componente en I, podemos armar que todo
elemento de

f es un par ordenado de n umeros reales con primera componente
en I. Como para todo x I est andar existe un unico y R tal que (x, y)

f
(concretamente y =

f(x)), concluimos que para todo x I existe un unico
y R tal que (x, y) f. Esto signica que f : I R. M as a un, seg un
acabamos de observar, para todo x I est andar se cumple que

f(x) =

f(x),
164 Captulo 5. Series innitas
y esta propiedad determina completamente a

f, ya que cualquier otra funci on
est andar g : I R que cumpla esto tiene los mismos elementos est andar que

f, a saber, los pares (x,

f(x)), con x I est andar. Por consiguiente, g =



f.
La estandarizaci on de una funci on representa el mismo papel en la conver-
gencia funcional que la parte est andar en la convergencia numerica:
Teorema 5.15 Una sucesi on est andar {f
n
}
n0
converge puntualmente en un
intervalo I a una funci on f si y s olo si para todo n innito la funci on f
n
es casi
est andar, y f =

f
n
.
Demostraci on: Si la sucesi on converge y x I es est andar y n es innito,
entonces f
n
(x) f(x). Esto prueba que f
n
es casi est andar y, por el teorema
anterior, f =

f
n
.
Recprocamente, si se cumple la condici on del enunciado, para todo x I
est andar tenemos que f
n
(x)

f
n
(x) =

f
n
(x) = f(x), luego
lm
n
f
n
(x) = f(x),
y por transferencia, lo mismo vale para todo x I, no necesariamente est andar.
Los ejemplos siguientes muestran que la convergencia puntual es deciente
en muchos aspectos.
Ejemplo Para cada n N, sea f
n
: R R la funci on dada por
f
n
(x) =
_
0 si x 0,
nx si 0 x 1/n,
1 si x 1/n.
Entonces {f
n
}
n0
converge puntualmente a la funci on dada por
f(x) =
_
0 si x 0,
1 si x > 0.
En efecto, si x R es un punto est andar y n es un n umero natural innito,
o bien x 0 y f
n
(x) = 0 = f(x), o bien x > 0 y f
n
(x) = 1 = f(x), pues
1/n 0 < x. Esto prueba que
lm
n
f
n
(x) = f(x)
para todo x R est andar y, por transferencia, para todo x R.
Tenemos as un ejemplo de sucesi on de funciones continuas que converge
puntualmente a una funci on discontinua.
5.2. Sucesiones funcionales 165
Ejemplo Consideremos la sucesi on funcional en [0, 1] dada por
f
n
(x) = nx(1 x
2
)
n
Si x [0, 1], tenemos que
lm
n
nx(1 x
2
)
n
= 0.
Esto es obvio si x = 0 o si x = 1 y, en otro caso, se cumple porque, llamando
r = (1 x
2
), la serie de termino general nr
n
es convergente, como hemos visto
en el ejemplo de la p agina 157.
Por otra parte
_
1
0
f
n
(x) dx =
n
2

(1 x
2
)
n+1
n + 1

1
0
=
n
2(n + 1)
.
As pues, existe
lm
n
_
1
0
f
n
(x) dx =
1
2
6= 0 =
_
1
0
lm
n
f
n
(x) dx
En denitiva, tenemos un ejemplo de sucesi on convergente cuya sucesi on de
integrales no converge a la integral del lmite.
Estos y otros muchos fen omenos no suceden si, en lugar de considerar la
convergencia puntual, consideramos la convergencia uniforme que vamos a de-
nir a continuaci on. Para destacar la diferencia, observemos que una sucesi on
est andar {f
n
}
n0
converge puntualmente a una funci on f
n
(en un intervalo I)
si y s olo si para todo x I est andar y todo n N innito, se cumple que
f
n
(x) f(x).
Denici on 5.16 Diremos que una sucesi on est andar {f
n
}
n0
converge unifor-
memente en un intervalo I a una funci on f si para todo x I y todo n N
innito, se cumple que f
n
(x) f(x).
La diferencia con la convergencia puntual es, pues, que en la convergencia
uniforme la aproximaci on f
n
(x) f(x) es v alida para todo x I no necesaria-
mente est andar. Es obvio que la convergencia uniforme implica la convergencia
puntual, pero el recproco no es cierto, como muestra el ejemplo siguiente:
Ejemplo Las sucesiones de los dos ejemplos anteriores no convergen unifor-
memente a sus lmites.
En el primer caso, si tomamos x = 1/2n, donde n es un n umero natural
innito, entonces
f
n
(x) =
1
2
6 1 = f(x).
En el segundo caso, si x = 1/n, donde n es un n umero natural innito,
f
n
(x) =
_
1
1
n
2

n
=
_
1 +
1
n

n
_
1
1
n

n
ee
1
= 1 6 0 = f(x),
donde hemos usado el teorema 3.42.
166 Captulo 5. Series innitas
Ejemplo La sucesi on dada por f
n
(x) = x/n converge uniformemente a la
funci on f = 0 en el intervalo [0, 1], mientras que en R converge puntualmente,
pero no uniformemente, a dicha funci on.
En efecto, si x [0, 1] y n es innito, entonces f
n
(x) = x/n 0 = f(x),
luego la convergencia es uniforme. En cambio, si x puede variar en R, el ar-
gumento anterior vale para todo x nito, en particular para todo x est andar,
luego {f
n
}
n0
converge puntualmente a 0 en R. Sin embargo, tomando x = n,
donde n es un natural innito, tenemos que f
n
(x) = 1 6 0 = f(x), luego la
convergencia no es uniforme.
La convergencia uniforme tiene la siguiente interpretaci on cl asica: Si tenemos
que lm
n
f
n
(x) = f(x) y la convergencia es uniforme en un intervalo I, dado
> 0 est andar, como, para todo n innito, se cumple que, para todo x I,
|f
n
(x) f(x)| 0, en particular |f
n
(x) f(x)| < y, como esto vale para todo
n n
0
, donde n
0
es un n umero natural innito cualquiera, por transferencia
ha de existir un natural nito n
0
que cumpla lo mismo, es decir, tal que, para
todo n n
0
y todo x I, se cumple |f
n
(x) f(x)| < .
As pues, la convergencia uniforme se traduce en que podemos conseguir que
f
n
y f se diferencien en menos de a la vez en todos los puntos x I, mientras
que en el caso de la convergencia puntual, para conseguir que la diferencia entre
f
n
y f se haga menor que , puede hacer falta un n
0
distinto en cada punto x,
de modo que un mismo n
0
no valga a la vez para todos ellos.
Probamos ahora que la convergencia uniforme resuelve los dos problemas
que habamos detectado en la convergencia puntual:
Teorema 5.17 Si {f
n
}
n0
es una sucesi on de funciones continuas f
n
: I R
que converge uniformemente a una funci on f : I R, entonces f tambien es
continua.
Demostraci on: Podemos suponer que todos los datos son est andar. Para
probar que f es continua en I basta ver que lo es en un punto est andar x
1
I.
Tomamos x
2
I tal que x
1
x
2
y hemos de ver que f(x
1
) f(x
2
). En caso
contrario, existe un > 0 est andar tal que |f(x
1
) f(x
2
)| > .
Si n es un n umero natural innito, tenemos que, para todo x I, se cumple
f
n
(x) f(x), luego en particular, |f(x) f
n
(x)| < /2. Como esta armaci on
es interna, podemos aplicar el principio de transferencia, que nos da que existe
un n est andar que cumple lo mismo. En particular, |f(x
1
) f
n
(x
1
)| < /2 y
|f(x
2
) f
n
(x
2
)| < /2. Ahora bien, como f
n
es continua en x
1
(y est andar),
podemos armar que f
n
(x
1
) f
n
(x
2
), luego tambien |f(x
1
) f
n
(x
2
)| < /2
|f(x
1
) f(x
2
)| |f(x
1
) f
n
(x
2
)| + |f
n
(x
2
) f(x
2
)| < /2 +/2 = ,
contradicci on.
Similarmente ocurre con los lmites de integrales:
5.2. Sucesiones funcionales 167
Teorema 5.18 Sea {f
n
}
n0
una sucesi on de funciones integrables en un inter-
valo [a, b] que converja uniformemente a una funci on f : [a, b] R. Entonces
f es integrable en [a, b] y
_
b
a
f(x) dx = lm
n
_
b
a
f
n
(x) dx.
Demostraci on: Observemos en primer lugar que f est a acotada. En
efecto, si n es un n umero natural innito, tenemos que f
n
est a acotada, porque
es integrable, lo cual signica que |f
n
(x)| M para todo x [a, b] (y un cierto
n umero M, que no podemos asegurar que sea nito porque f
n
no es est andar).
Como f(x) f
n
(x), resulta que |f(x)| M + 1 para todo x [a, b], pero esto
signica que f est a acotada.
Si n es un n umero natural innito, la funci on |f f
n
| est a acotada en [a, b]
y s olo toma valores innitesimales. Por lo tanto, su supremo K ha de ser
innitesimal. Si P es cualquier partici on de [a, b] en k intervalos, tenemos que
|S(f, P) S(f
n
, P)|
k

i=1
|M
i
(f) M
i
(f
n
)|x
i

k

i=1
Kx
i
= K(b a) 0.
Igualmente, |s(f, P) s(f
n
, P)| 0. Si > 0 es est andar, tenemos que
|S(f, P) S(f
n
, P)| < y |s(f, P) s(f
n
, P)| < para toda P
y esto es una propiedad interna que se cumple para cualquier n innito. Por
transferencia, existe un n nito que cumple lo mismo. Para dicho n, la funci on
f
n
es est andar e integrable, luego, si P es una partici on innitesimal, tenemos
adem as que s(f
n
, P) S(f
n
, P). Uniendo los tres hechos, concluimos que
|S(f, P) s(f, P)| < 2,
y esto vale para todo > 0 est andar. Por consiguiente, S(f, P) s(f, P), lo
que prueba que f es integrable en [a, b]. Adem as,

_
b
a
f(x) dx
_
b
a
f
n
(x) dx

_
b
a
|f(x) f
n
(x)| dx
_
b
a
K dx = K(b a) 0,
luego
_
b
a
f(x) dx
_
b
a
f
n
(x) dx.
Esto prueba la convergencia de la sucesi on de integrales.
Nota En la prueba del teorema anterior hemos visto que, si P es una partici on
innitesimal y n es un n umero natural innito, entonces
S(f
n
, P) S(f, P)
_
b
a
f(x) dx
_
b
a
f
n
(x) dx,
168 Captulo 5. Series innitas
e igualmente con sumas inferiores. En resumen, si una sucesi on {f
n
}
n0
de
funciones integrables converge uniformemente, tenemos que
S(f
n
, P)
_
b
a
f
n
(x) dx s(f
n
, P)
para todo n umero natural n, nito o innito. Cuando n es nito se trata simple-
mente de la denici on de integrabilidad, pero para n innito es un hecho que no
es obvio, puesto que la funci on f
n
, aunque es integrable, no es est andar, luego
no tiene por que cumplir la denici on de integrabilidad m as que indirectamente,
a traves del principio de estandarizaci on.
Lo mismo es v alido para la continuidad: si una sucesi on {f
n
}
n0
de funciones
continuas en un intervalo I converge uniformemente a una funci on f, entonces,
si x
0
I es est andar y x I cumple x x
0
, se cumple que f
n
(x) f
n
(x
0
). Esto
es porque f es continua en x
0
(y est andar): f
n
(x) f(x) f(x
0
) f
n
(x
0
).
En resumen: si una sucesi on {f
n
}
n0
de funciones continuas converge unifor-
memente, todas las funciones f
n
(para n nito o innito) cumplen explcitamente
la denici on de continuidad, aunque no sean funciones est andar.
La relaci on entre la derivabilidad y la convergencia es m as delicada, como
muestra el ejemplo siguiente:
Ejemplo La sucesi on de funciones dada por
f
n
(x) =
sen(nx)
n
converge uniformemente a f = 0 en R, todas ellas son de clase C

, y el lmite
tambien lo es, pero
f
0
n
(x) = cos(nx)
no converge a f
0
= 0, ni a ninguna otra funci on, ni siquiera puntualmente.
En cambio, como veremos enseguida, la convergencia uniforme de las deriva-
das (y poco m as) s que implica la convergencia (casi) uniforme de las funciones,
donde casi tiene el sentido siguiente:
Denici on 5.19 Diremos que una sucesi on est andar de funciones {f
n
}
n0
con-
verge casi uniformemente en un intervalo I si cuando n es innito se cumple
f
n
(x) f(x) para todo x I que sea nito y tal que

x I.
Es obvio que la convergencia uniforme en un intervalo implica la convergencia
casi uniforme y que esta implica a su vez la convergencia puntual.
M as concretamente, la relaci on entre la convergencia uniforme y la casi uni-
forme es muy simple: la denici on anterior equivale a que la sucesi on converja
uniformemente en cada intervalo [u, v] I.
En efecto, si se da la convergencia casi uniforme, podemos tomar el intervalo
est andar, y entonces, si x [u, v] I, se cumple que x es nito y

x [u, v] I,
luego la sucesi on converge uniformemente en [u, v].
5.2. Sucesiones funcionales 169
Recprocamente, si tenemos la convergencia uniforme en los intervalos [u, v]
y x I es nito y cumple

x I, digamos x

< x, como existe un x I


tal que x >

x, tambien existe un v I est andar tal que v >

x, y entonces
x [

x, v] I. Igualmente se razona si x <



x. Si x =

x, tomamos el intervalo
[

x,

x]. En cualquier caso, tenemos un intervalo est andar tal que x [u, v] I,
por lo que podemos armar que f
n
(x) f(x).
Ejercicio: Comprobar que la sucesi on f
n
(x) = x/n converge casi uniformemente en
R a la funci on nula.
Teorema 5.20 Sea {f
n
}
n0
una sucesi on de funciones de clase C
1
en un inter-
valo abierto I tal que exista un punto x
0
I para el que exista lm
n
f
n
(x
0
) = y
0
.
Si la sucesi on {g
0
n
}
n0
converge uniformemente a una funci on g, entonces
{f
n
}
n0
converge casi uniformemente a una funci on f de clase C
1
tal que
f
0
= g.
Demostraci on: Podemos suponer que todos los datos son est andar. Ob-
servemos en primer lugar que, si n es un n umero natural innito, entonces la
funci on f
n
es casi est andar. En efecto, si x I es est andar, en virtud del
teorema del valor medio,
f
n
(x) f
n
(x
0
) = f
0
n
(c)(x x
0
),
donde c es un punto (nito) entre x y x
0
. Tenemos que
f
n
(x
0
) y
0
, f
0
n
(c) g(c) g(

c),
donde hemos usado que

c I precisamente porque c est a entre x y x
0
, as
como que g es continua por ser lmite uniforme de funciones continuas. Por
consiguiente, f
n
(x
0
) y f
0
n
(c) son nitos, y lo mismo vale para f
n
(x).
Esto nos permite considerar la estandarizaci on f =

f
n
. Observemos que,
en principio, f depende del n umero natural innito n que hemos escogido, pero
luego veremos que, en realidad, f es el mismo para todos los n. Notemos tambien
que f(x
0
) =

f
n
(x
0
) = y
0
.
Vamos a probar que f es derivable en I. Como es una funci on est andar,
basta probarlo en un punto est andar p I. Si h 0, h 6= 0, el teorema del
valor medio nos da un punto c entre p y p +h (en particular c p) tal que
f
n
(p +h) f
n
(p)
h
= f
0
n
(c) g(c) g(p),
donde hemos usado que g es continua en p. Fijemos un > 0 est andar. Si
> 0 es cualquier innitesimo y n
0
es un n umero innito, hemos probado que,
si |h| < , h 6= 0 y n n
0
, se cumple

f
n
(p +h) f
n
(p)
h
g(p)

< .
170 Captulo 5. Series innitas
Como la armaci on es interna, existen un y un n
0
est andar que cumplen
lo mismo. Si jamos un h est andar que cumpla |h| < , h 6= 0, se cumple la
desigualdad anterior, pero el denominador es ahora apreciable, por lo que si lo
aplicamos al n innito que hemos tomado en un principio y cambiamos f
n
por
f, el numerador se altera en un innitesimo, y la fracci on entera tambien. As
pues:

f(p +h) f(p)


h
g(p)

< .
Esto vale para todo h est andar que cumpla |h| < , pero, por transferencia,
vale para todo h est andar o no. En particular vale para todo innitesimo h y
para todo > 0 est andar. Por consiguiente, si h 0, h 6= 0, concluimos que
f(p +h) f(p)
h
g(p).
Esto signica que existe f
0
(p) = g(p). Como adem as f(x
0
) = y
0
, resulta
que la funci on f est a unvocamente determinada. (Dos funciones con la misma
derivada se diferencian a lo sumo en una constante, pero si toman el mismo
valor en un punto, han de ser iguales.) As pues, f no depende de n, como
anticip abamos, y esto signica que {f
n
}
n0
converge puntualmente a f.
Para probar que la convergencia es, en realidad, casi uniforme, tomamos un
x I nito tal que

x I. Hemos visto antes que
f
n
(x) f(

x)
x x

g(

x),
luego
f
n
(x) f(

x) f(x).
El concepto de sucesi on de Cauchy puede trasladarse a sucesiones funciona-
les, de modo que podemos asegurar la convergencia de una sucesi on sin necesidad
de conocer su lmite de antemano:
Denici on 5.21 Una sucesi on est andar {f
n
}
n0
de funciones denidas en un
intervalo I R es puntualmente (resp. uniformemente, resp. casi uniforme-
mente) de Cauchy en I si para todo x I est andar (resp. para todo x I, resp.
para todo x I nito tal que

x I) y todos los n umeros naturales innitos m
y n se cumple que f
m
(x) f
n
(x).
Teorema 5.22 Una sucesi on de funciones denidas en un intervalo es pun-
tualmente, uniformemente o casi uniformemente convergente si y s olo si tiene
la correspondiente propiedad de Cauchy.
Demostraci on: Es evidente que toda sucesi on convergente es de Cauchy
(del tipo correspondiente a la convergencia).
Supongamos ahora que {f
n
}
n0
es una sucesi on est andar puntualmente de
Cauchy en un intervalo I. Entonces, para cada x I est andar, la sucesi on
5.2. Sucesiones funcionales 171
{f
n
(x)}
n0
es una sucesi on de Cauchy en R, luego es convergente. En particu-
lar, f
n
(x) es nito cuando n es innito, luego la funci on f
n
es casi est andar y
podemos considerar su estandarizaci on

f
n
. Si m y n son dos n umeros innitos,
tenemos que f
m
(x) f
n
(x), luego

f
m
(x) =

f
n
(x), luego

f
m
=

f
n
. En deni-
tiva, todas las funciones f
n
tienen la misma estandarizaci on f, luego la sucesi on
converge puntualmente a f.
Si la sucesi on es uniformemente de Cauchy, entonces tambien es puntual-
mente de Cauchy, luego todo lo dicho anteriormente sigue siendo v alido y te-
nemos que la sucesi on converge puntualmente a f. Vamos a probar que la
convergencia es uniforme.
Fijemos > 0 est andar. Si n
0
es un n umero natural innito, tenemos que,
para todo m, n n
0
y todo x I, se cumple que |f
m
(x) f
n
(x)| < . Como la
propiedad es interna, existe un n
0
nito que cumple lo mismo.
Esto vale en particular para cualquier x est andar y para todo m y n n
0
.
Tomando m innito tenemos que f
m
(x) f(x), luego |f(x) f
n
(x)| < . Esto
vale para todo x est andar y para todo n n
0
, luego, por transferencia, vale
para todo x I.
El n
0
nito a partir del cual se cumple esto depende de , pero si n es innito,
cumplir a esto cualquiera que sea n
0
, es decir, para todo > 0 est andar. Esto
prueba que si n es innito, entonces f(x) f
n
(x), para todo x I. As pues,
la convergencia es uniforme.
Si la sucesi on es casi uniformemente de Cauchy, entonces es uniformemente
de Cauchy en cada intervalo est andar [u, v] I, luego la convergencia a f es
uniforme en cada uno de estos intervalos, luego la convergencia es casi uniforme
en I.
Veamos una aplicaci on de la caracterizaci on de la convergencia en terminos
de la propiedad de Cauchy al caso de las series funcionales:
Denici on 5.23 La serie funcional asociada a una sucesi on de funciones {f
n
}
n0
denidas en un intervalo I R, representada por

n=0
f
n
,
es la sucesi on funcional de sumas parciales {S
k
}
k0
, donde
S
k
=
k

n=0
f
n
.
Diremos que la serie converge absoluta y puntualmente, absoluta y unifor-
memente o absoluta y casi uniformemente si lo hace la serie

n=0
|f
n
|.
Notemos que esto implica respectivamente la convergencia puntual, uniforme
o casi uniforme de la serie, ya que (suponiendo la serie est andar) si x I y k r
172 Captulo 5. Series innitas
son n umeros naturales innitos, tenemos que
|S
r
(x) S
k
(x)| =

n=k
f
n
(x)

n=k
|f
n
|(x),
y el ultimo termino es innitesimal para x I est andar, para todo x I o para
todo x I nito tal que

x I, seg un el tipo de convergencia, ya que la serie
con valores absolutos es puntualmente, uniformemente o casi uniformemente de
Cauchy en I, luego la serie dada tiene la misma propiedad, luego converge con
el mismo tipo de convergencia.
Teorema 5.24 (Criterio de mayoraci on de Weierstrass) Sea

n=0
f
n
una
serie funcional est andar en un intervalo I R y sea

n=0
a
n
una serie numerica
convergente tal que, para todo n N innito y todo x I, se cumpla que
|f
n
(x)| a
n
. Entonces la serie funcional converge absoluta y uniformemente
en I.
Demostraci on: Tenemos que, si k r son innitos y x I, entonces
|S
r
(x) S
k
(x)| =

n=k
f
n
(x)

n=k
|f
n
(x)|
r

n=k
a
n
0
Esto prueba que S
r
(x) S
k
(x), luego la sucesi on {S
k
}
k0
es uniformemente de
Cauchy, luego la serie funcional converge uniformemente.
Como aplicaci on vamos a construir una funci on continua que no es derivable
en ning un punto. Necesitamos una caracterizaci on de la derivabilidad:
Teorema 5.25 Una funci on est andar f : ]a, b[ R es derivable en un punto
est andar p ]a, b[ si y s olo si existe un n umero est andar f
0
(p) tal que para todo
par de n umeros reales tales que x p y, x y, x 6= y, se cumple
f(y) f(x)
y x
f
0
(p).
Demostraci on: Si se cumple esta condici on, tomando x = p tenemos la de-
nici on de derivada. Recprocamente, si f es derivable en p, existen innitesimos

1
y
2
tales que
f(y) f(p) = f
0
(p)(y p) + (y p)
1
,
f(p) f(x) = f
0
(p)(p x) + (p x)
2
.
Sumando y dividiendo entre y x queda
f(y) f(x)
y x
= f
0
(p) +
y p
y x

1
+
p x
y x

2
f
0
(p),
pues las fracciones del segundo miembro son menores que 1.
5.2. Sucesiones funcionales 173
Ejemplo (Una funci on continua no derivable) Consideremos la funci on
: R R dada por la gura siguiente y extendida peri odicamente a R.
0 1 2
1

Es claro que es continua en R y es derivable en todo R excepto en los


n umeros enteros. Adem as, es derivable por la derecha en todo R, lo cual sig-
nica que existe un n umero real est andar
0+
(x) tal que, para todo innitesimo
h > 0, se cumple que
(x +h) (x)
h

0+
(x).
M as concretamente, se cumple que
0+
(x) = 1.
Para cada natural n denimos

n
(x) =
1
2
n
(2
n
x).
La gura siguiente muestra las gr acas de estas funciones para los primeros
valores de n:
0 1 2
1

2
Es f acil ver que
n
es continua en R y es derivable en todo R menos en los
puntos de la forma k/2
n
, con k Z, y en cualquier punto existe
0+
n
(x) = 1.
Finalmente, denimos f : R R como la funci on dada por
f(x) =

n=0

n
(x).
Como |(x)| 1, tenemos que |
n
(x)| 1/2
n
, luego el criterio de mayo-
raci on de Weierstrass implica que la serie converge uniformemente en R, por lo
que la suma f es una funci on continua. Llamemos
f
m
(x) =
m

n=0

n
(x).
174 Captulo 5. Series innitas
Es claro que si n > m y k Z entonces
n
(k/2
m
) = 0, luego vemos que
f(k/2
m
) = f
m
(k/2
m
).
Supongamos que f es derivable en un punto p (que podemos tomar est andar).
Tomemos un n umero natural innito m y sea n Z tal que
x =
n
2
m
p <
n + 1
2
m
= y.
Claramente x y, luego por el teorema anterior
f
0
(p)
f(y) f(x)
y x
=
f
m
(y) f
m
(x)
y x
= f
0+
m
(p).
En el ultimo paso hemos usado que f
m
es lineal en el intervalo [x, y]. Ahora
bien, esto vale para todo n umero natural innito m, en particular para m+ 1,
con lo que
f
0+
m
(p) f
0+
m+1
(p) = f
0+
m
(p) +
0+
m+1
(p) = f
0+
m
(p) 1,
lo cual es absurdo. Por consiguiente f no es derivable en ning un punto.
5.3 Series de potencias
Los resultados de la secci on anterior se aplican en particular a las series de
potencias, es decir, a las sucesiones funcionales de la forma

n=0
a
n
(x x
0
)
n
,
donde x
0
R y {a
n
}
n0
es una sucesi on de n umeros reales.
Vamos a probar que toda serie de potencias converge en un intervalo centrado
en x
0
(que en el peor de los casos se reduce al propio x
0
y en el mejor de los
casos es todo R). Para ello necesitamos el concepto siguiente:
Denici on 5.26 Si {x
n
}
n0
es una sucesi on est andar de n umeros reales aco-
tada superiormente, denimos su lmite superior como
lm
n
x
n
= sup
S
{

x
n
| n N es innito}.
Observemos que si existe lm
n
x
n
= l, entonces
S
{

x
n
| n N es innito} = {l},
luego
lm
n
x
n
= lm
n
x
n
.
Ejercicio: Dar una denici on an aloga de lmite inferior y demostrar que una sucesi on
acotada tiene lmite si y s olo si su lmite inferior coincide con su lmite superior.
5.3. Series de potencias 175
Teorema 5.27 Sea

n=0
a
n
(x x
0
)
n
una serie de potencias.
a) Si la sucesi on {
n
_
|a
n
|}
n0
no est a acotada, entonces la serie s olo converge
en x = x
0
.
b) En caso contrario, si L = lm
n
n
_
|a
n
| 6= 0 y r = 1/L, entonces la serie
converge absoluta y casi uniformemente en el intervalo ]x
0
r, x
0
+r[ y
diverge fuera del intervalo [x
0
r, x
0
+r].
c) Si L = 0, entonces la serie converge absoluta y casi uniformemente en R.
Demostraci on: a) Si x 6= x
0
es est andar, existe un n innito tal que
n
_
|a
n
|
es innito, luego tambien lo son
n
_
|a
n
||x x
0
| y a
n
(x x
0
)
n
, luego el termino
general de la serie numerica

n=0
a
n
(x x
0
)
n
no tiende a 0, luego la serie diverge.
b) Todo intervalo est andar [u, v] ]x
0
r, x
0
+r[ est a contenido en un
intervalo de la forma [x
0
s, x
0
+ s], donde 0 < s < r es est andar. Tenemos
que sL < 1, luego podemos tomar un n umero est andar sL < < 1. As, si
|x x
0
| s tenemos que
L <

s


|x x
0
|
.
Si n es innito, entonces
n
_
|a
n
| L, luego
n
_
|a
n
| <

|x x
0
|
,
luego
|a
n
||x x
0
|
n
<
n
.
Por el criterio de mayoraci on de Weierstrass, concluimos que la serie converge
absoluta y uniformemente en [x
0
s, x
0
+ s], luego converge absoluta y casi
uniformemente en ]x
0
r, x
0
+r[.
En cambio, si |x x
0
| > r, con x est andar, tenemos que
1
|x x
0
|
< L,
luego existe un n innito tal que
1
|x x
0
|
<
n
_
|a
n
|,
luego
1
|x x
0
|
<
n
_
|a
n
|,
176 Captulo 5. Series innitas
luego
|a
n
||x x
0
|
n
> 1,
luego el termino general de la serie numerica correspondiente a x no tiende a 0,
luego la serie diverge en x.
c) Es una ligera variante del caso anterior, tomando s > 0 y 0 < < 1
arbitrarios.
En la pr actica, podemos denir el radio de convergencia de una serie de
potencias como el n umero r del apartado b) del teorema anterior, o bien como
r = + si se da el caso c) o r = 0 si se da el caso a). De este modo, la serie
converge casi uniformemente en el intervalo de convergencia ]x
0
r, x
0
+r[,
entendiendo que este intervalo es R cuando r = + y es cuando r = 0.
Observemos que el teorema anterior no arma nada sobre la convergencia
o divergencia de la serie en los puntos x
0
r y x
0
+ r. La situaci on en estos
puntos depende de cada serie en concreto.
Tambien es interesante observar que el teorema anterior permite determinar
el radio de convergencia de una serie analizando su convergencia puntual, pero,
en cualquier caso, la convergencia de una serie de potencias siempre es casi
uniforme en un intervalo de convergencia.
Ahora podemos aplicar los resultados de la secci on anterior:
Teorema 5.28 Sea f(x) =

n=0
a
n
(x x
0
)
n
una serie de potencias con radio
de convergencia no nulo. Entonces la funci on f es derivable en su intervalo de
convergencia, y su derivada viene dada por
f
0
(x) =

n=1
na
n
(x x
0
)
n1
.
Adem as, la serie que dene a la derivada tiene el mismo radio de convergencia.
Demostraci on: Sea L = lm
n
n
_
|a
n
|. En la p agina 72 hemos visto que, si
n es innito, entonces
n

n 1, luego
n
_
|a
n
|
n
_
|na
n
|, de donde se sigue que
L = lm
n
n
_
|na
n
|, luego la serie dada tiene el mismo radio de convergencia que

n=0
na
n
(x x
0
)
n
=

n=1
na
n
(x x
0
)
n
.
A su vez, es claro que el radio de convergencia de esta serie es el mismo que
el de

n=1
na
n
(x x
0
)
n1
Ahora s olo tenemos que atar cabos: Las sumas parciales de esta ultima serie
son las derivadas de las sumas parciales de la serie del enunciado. Esta serie
converge uniformemente en cualquier intervalo est andar [u, v] contenido en el
intervalo de convergencia, luego el teorema 5.20 nos da que esta serie converge
5.3. Series de potencias 177
en [u, v] (luego en todo el intervalo de convergencia) a la derivada de la serie del
enunciado.
Aplicando sucesivamente el teorema anterior podemos decir mucho m as:
Teorema 5.29 Sea f(x) =

n=0
a
n
(xx
0
)
n
una serie de potencias con radio de
convergencia no nulo. Entonces, la funci on f es de clase C

en su intervalo
de convergencia y es su propia serie de Taylor, es decir,
a
n
=
f
n)
(x
0
)
n!
.
Demostraci on: Aplicando el teorema anterior vemos que
f
k)
(x) =

n=k
n(n 1) (n k + 1)a
n
(x x
0
)
nk
,
y evaluando en x
0
queda que
f
k)
(x
0
) = n! a
n
.
Ejemplos El radio de convergencia de la serie geometrica

n=0
x
n
=
1
1 x
es r = 1, como puede deducirse de la f ormula para la suma de un n umero nito
de terminos de una serie geometrica o bien observando que
lm
n

1 = 1.
As pues, el intervalo de convergencia es ]1, 1[ y es claro que la serie no
converge ni en 1 ni en 1. Esto puede parecer l ogico porque la funci on
suma no puede extenderse continuamente a x = 1. Sin embargo, el radio de
convergencia de

n=0
(1)
n
x
2n
=
1
1 +x
2
es tambien r = 1, como se deduce haciendo el cambio de variable x = t
2
en la
serie anterior o bien porque, la sucesi on de coecientes de la serie es
a
n
=

(1)
k
si n = 2k,
0 si n = 2k + 1,
luego, si n es innito,
n
_
|a
n
| =

0,
1,
luego
lm
n
_
|a
n
| = 1.
178 Captulo 5. Series innitas
En cambio, en este caso la funci on suma se extiende a una funci on de clase
C

en R.
Seg un el teorema 4.16, la serie
log(1 +x) =

n=1
(1)
n+1
n
x
n
converge en ]1, 1], y es claro que diverge en x = 1, luego su radio de con-
vergencia es r = 1 y la serie s olo converge en uno de los dos extremos de su
intervalo de convergencia.
Captulo VI
Calculo diferencial de varias
variables
6.1 Espacios metricos y espacios normados
El principal objeto de estudio de este captulo ser a el espacio R
n
, es decir,
el conjunto de todas las n-tuplas de n umeros reales x = (x
1
, . . . , x
n
). En R
n
podemos denir una suma y un producto por n umeros reales:
(x
1
, . . . , x
n
) + (y
1
, . . . , y
n
) = (x
1
+y
1
, . . . , x
n
+y
n
),
(x
1
, . . . , x
n
) = (x
1
, . . . , x
n
).
Con estas operaciones, es f acil ver que R
n
cumple la denici on siguiente:
Denici on 6.1 Un espacio vectorial V sobre un cuerpo K es un conjunto V
dotado de una suma + : V V V y un producto escalar : K V V
que cumplen las propiedades siguientes: (Se entiende que las letras griegas re-
presentan elementos de K.)
Asociativa (v +w) +x = v + (w +x), (v) = ()v,
Conmutativa v +w = w +v,
Elemento neutro Existe 0 V tal que 0 +v = v, 1 v = v,
Elemento simetrico Para cada v V , existe v V tal que v + (v) = 0.
Distributiva (v +w) = v +w, ( +)v = v +v.
En lo sucesivo, siempre que hablemos de espacios vectoriales, se entender a
que son espacios vectoriales sobre el cuerpo R de los n umeros reales.
La generalizaci on a R
n
de los conceptos que en los temas anteriores hemos
estudiado para R se basar a en la siguiente denici on de la distancia entre dos
puntos de R
n
:
179
180 Captulo 6. C alculo diferencial de varias variables
Denici on 6.2 La distancia eucldea entre dos puntos x, y R
n
es
d(x, y) =
_
(x
1
y
1
)
2
+ + (x
n
y
n
)
2
.
El teorema de Pit agoras justica que esta denici on es la usual en R
2
y en
R
3
, y para R
n
es su generalizaci on natural.
A la hora de demostrar analticamente las propiedades de esta distancia, sin
tener que recurrir a consideraciones geometricas, conviene descomponerla en
varias partes. En primer lugar denimos la norma eucldea de un vector x R
n
como
kxk =
_
x
2
1
+ +x
2
n
,
de modo que la distancia eucldea puede expresarse como
d(x, y) = kx yk.
A su vez, la norma puede expresarse en terminos del producto escalar:
x y = x
1
y
1
+ +x
n
y
n
.
En estos terminos, kxk =

x x. Deduciremos las propiedades de la distan-


cia a partir de las de la norma, y estas a partir de las del producto escalar.
Denici on 6.3 Un producto escalar en un espacio vectorial V es una aplicaci on
: V V R que cumpla las propiedades siguientes:
a) v w = w v,
b) (v +w) x = v x +w x,
c) (v) w = (v w),
d) v v 0 y v v = 0 si y s olo si v = 0.
Es evidente que el producto escalar que hemos denido cumple esta de-
nici on.
Denici on 6.4 Una norma en un espacio vectorial V es una aplicaci on
k k : V [0, +[ que cumple las propiedades siguientes:
a) kvk = 0 si y s olo si v = 0.
b) kvk = || kvk.
c) kv +wk kvk +kwk.
La tercera propiedad recibe el nombre de desigualdad triangular.
Un espacio normado es un espacio vectorial dotado de una norma.
6.1. Espacios metricos y espacios normados 181
Teorema 6.5 Si V es un espacio vectorial dotado de un producto escalar, la
aplicaci on k k : V R dada por kvk =

v v es una norma, y cumple adem as


la desigualdad de Schwarz: |x y| kxk kyk.
Demostraci on: Probemos en primer lugar la desigualdad de Schwarz. Sea
= 1, de modo que |x y| = (x y). Para todo n umero real r, se cumple
0 (x ry) (x ry) = x x 2r(x y) +r
2
y y.
As pues,
kxk
2
2|x y|r +kyk
2
r
2
0
para todo r R. Si kyk = 0, ha de ser x y = 0, o de lo contrario la desigualdad
sera falsa para r grande. Si kyk > 0, tomamos r = |x y|/kyk
2
y obtenemos
|x y|
2
kxk
2
kyk
2
.
La aplicaci on k k cumple claramente todas las propiedades de la denici on
de norma salvo quiz a la desigualdad triangular. Pero, por la propiedad que
acabamos de probar, tenemos que
kx +yk
2
= (x +y) (x +y) = x x + 2(x y) +y y
kxk
2
+ 2kxk kyk +kyk
2
= (kxk +kyk)
2
.
Por lo tanto kx +yk kxk +kyk.
En particular, ahora sabemos que la norma eucldea que hemos denido
anteriormente cumple la denici on de norma.
Denici on 6.6 Una distancia en un conjunto M es una aplicaci on
d : M M [0, +[
que cumpla las propiedades siguientes:
a) d(x, y) = 0 si y s olo si x = y.
b) d(x, y) = d(y, x).
c) d(x, z) d(x, y) +d(y, z).
La tercera propiedad se conoce como desigualdad triangular.
Un espacio metrico es un par (M, d), donde M es un conjunto y d una
distancia en M.
Si V es un espacio normado, es inmediato comprobar que la aplicaci on
d(x, y) = kx yk
es una distancia en V . En particular, ahora sabemos que la distancia eucldea
en R
n
cumple la denici on general de distancia.
Observemos que si M es un espacio metrico y N M, entonces la distancia
en M se restringe a una distancia en N, luego podemos considerar tambien a
N como espacio metrico. As pues, tenemos denida una estructura de espacio
metrico en cada subconjunto de R
n
. En lo sucesivo, siempre consideraremos a
los subconjuntos de R
n
como espacios metricos con la distancia eucldea.
182 Captulo 6. C alculo diferencial de varias variables
Denici on 6.7 Si M
1
, . . . , M
n
son espacios metricos (con distancias d
1
, . . . , d
n
),
denimos en el producto M
1
M
n
la distancia
d(x, y) =
_
d
1
(x
1
y
1
)
2
+ +d
n
(x
n
y
n
)
2
.
Del hecho de que la distancia eucldea es una distancia en R
n
se sigue
f acilmente que esta distancia producto es una distancia en M
1
M
n
. En
lo sucesivo consideraremos a los productos de espacios metricos como espacios
metricos con esta distancia.
Observemos que la distancia eucldea en R es d(x, y) =
_
(x y)
2
= |xy|,
y que la distancia eucldea en R
n
es el producto de la distancia eucldea en R
por s misma.
A partir de aqu ya podemos extender f acilmente a R
n
muchos conceptos
que conocemos para el caso de R:
Denici on 6.8 Sea M un espacio metrico est andar. Un punto x M es nito
si est a a una distancia nita de un punto est andar. En caso contrario se dice
remoto. Diremos que dos puntos x, y M est an innitamente pr oximos, y lo
representaremos por x y, si la distancia entre ellos es innitesimal.
Puesto que la distancia entre dos puntos est andar ha de ser est andar y,
por consiguiente, nita, observamos que un punto nito de un espacio metrico
est a a distancia nita de todos los puntos est andar del espacio. La desigualdad
triangular implica que todo punto que este a una distancia nita de un punto
nito es tambien nito. Tambien es evidente que la relaci on de proximidad
innita es una relaci on de equivalencia.
Un punto x M es casi est andar si est a innitamente cerca de un punto
est andar, en cuyo caso es claramente unico y lo llamaremos parte est andar de x,
y lo representaremos por

x.
El halo de un punto x M es el conjunto (en general externo) h(x) de todos
los puntos innitamente pr oximos a x.
Es inmediato que, en el caso de R con la distancia eucldea, todos estos
conceptos coinciden con los que ya tenamos denidos. El teorema siguiente nos
permitir a generalizar a R
n
algunos hechos que conocemos para R:
Teorema 6.9 Sea M = M
1
M
n
un producto de espacios metricos
est andar (con n tambien est andar).
a) Un punto x M es nito si y s olo si todas sus coordenadas lo son.
b) Dos puntos x, y M cumplen x y si y s olo si todas sus coordenadas
cumplen x
i
y
i
.
c) Un punto x M es casi est andar si y s olo si todas sus coordenadas lo
son.
6.2. Elementos de topologa 183
Demostraci on: Observemos que, por el principio de transferencia, un
punto x M es est andar si y s olo si todas sus coordenadas son est andar.
a) Si x es nito, existe y M est andar tal que d(x, y) es nita. Claramente,
0 d
i
(x
i
, y
i
) d(x, y), luego d(x
i
, y
i
) tambien es nita, luego x
i
es nito.
Recprocamente, si las coordenadas de x son nitas, para cada i existe un
punto y
i
M
i
est andar tal que d
i
(x
i
, y
i
) es nita. Los puntos y
i
forman un
punto est andar y M, y es claro que d(x, y) es nita, luego x es nito.
La prueba de b) es completamente an aloga y c) se sigue de b).
En particular, esto se aplica a R
n
(con n est andar), visto como producto de
R por s mismo: un punto de R
n
es nito si y s olo si todas sus coordenadas son
n umeros reales nitos, etc.
Como primera aplicaci on tenemos el teorema siguiente, que es inmediato, ya
que sabemos que R tiene la propiedad considerada:
Teorema 6.10 Un punto de R
n
es casi est andar si y s olo si es nito.
6.2 Elementos de topologa
(3, 2) (1, 2)
Consideremos el conjunto
C = {(x, y) R
2
| x +y 5} R
2
representado en la gura. En el podemos distinguir dos clases
de puntos, los puntos interiores como el (1, 2) que est an
totalmente rodeados por puntos del conjunto, y los puntos
frontera, como (3, 2), que est an rodeados por puntos de
dentro y de fuera del conjunto. En esta secci on vamos a introducir algunas
deniciones que describen situaciones como esta y otras similares.
Denici on 6.11 Sea M un espacio metrico, S M y x S, todos ellos
est andar. Diremos que S es un entorno de x si h(x) S. Tambien diremos que
x es un punto interior de S. Diremos que S es abierto si es un entorno de todos
sus puntos.
Por ejemplo, el punto (1, 2) es un punto interior del conjunto C de la gura,
ya que si (x, y) (1, 2), entonces x 1 e y 2, luego x + y 3 < 5, luego
x +y < 5, luego (x, y) C.
Sin embargo, C no es un conjunto abierto, ya que no es entorno de algunos
de sus puntos, como el (3, 2). Basta considerar (x, y) (3, 2) con x > 3, y > 2.
Entonces x +y > 5, luego (x, y) / C.
Si que es abierto, en cambio, el conjunto
A = {(x, y) R
2
| x +y < 5},
184 Captulo 6. C alculo diferencial de varias variables
pues cualquier punto (a, b) A es interior. En efecto, podemos suponer que
(a, b) es est andar y, dado (x, y) (a, b), tenemos que x + y a + b < 5, luego
x +y < 5, luego (x, y) A.
Denici on 6.12 Sea M un espacio metrico, S M y x M, todos ellos
est andar. Diremos que x es adherente a S si existe x
0
S tal que x
0
x.
Diremos que x es un punto frontera de S si es adherente a S y a M \ S.
Por ejemplo, el punto (3, 2) es un punto frontera tanto del conjunto C como
del conjunto A de los ejemplos anteriores. En efecto, si tomamos (x, y) (3, 2)
tal que x < 3, y < 2 se cumple que (x, y) A C, mientras que si lo tomamos
con x > 3, y > 2, entonces (x, y) M \ C M \ A.
Denici on 6.13 Si M es un espacio metrico y S M, diremos que S es
cerrado si M \ S es abierto.
Por ejemplo, el conjunto C del ejemplo anterior es cerrado, porque su com-
plementario es
R
2
\ C = {(x, y) R
2
| x +y > 5},
y se prueba que es abierto exactamente igual que hemos visto que lo era el
conjunto A.
El teorema siguiente clarica los conceptos de abierto y cerrado:
Teorema 6.14 Sea M un espacio metrico y S M. Entonces:
a) S es abierto si y s olo si no contiene a ninguno de sus puntos frontera.
b) S es cerrado si y s olo si contiene a todos sus puntos frontera.
c) S es cerrado si y s olo si contiene a todos sus puntos adherentes.
Demostraci on: Podemos suponer que S es est andar. a) Si S es abierto y
contiene un punto frontera x M, podemos tomarlo est andar. Existe y M\S
tal que y x, pero esto es absurdo, porque y h(x) S.
Recprocamente si S no contiene ning un punto frontera, tomemos x S
y veamos que es interior. Podemos suponerlo est andar. Si no fuera interior,
existira un y M \ S tal que y x, pero esto signica que x es adherente a
M \ S, y tambien es adherente a S, porque x S, luego x es un punto frontera
de S, contradicci on.
b) Observemos que los puntos frontera de S son los mismos que los de M\S.
Por lo tanto, S es cerrado si y s olo si M \ S es abierto, si y s olo si M \ S no
contiene ning un punto frontera de S (por a) si y s olo si S contiene a todos sus
puntos frontera.
c) Si S contiene a todos sus puntos adherentes, en particular contiene a
todos sus puntos frontera, luego es cerrado. Recprocamente, si S es cerrado y
x M \ S es un punto adherente, que podemos suponer est andar, entonces x
tambien es adherente a M \ S, luego es un punto frontera de S, luego debera
estar en S por b), contradicci on.
6.2. Elementos de topologa 185
Denici on 6.15 Si M es un espacio metrico, x M y r > 0, denimos la bola
abierta y la bola cerrada de centro x y radio r como
B
r
(x) = {y M | d(x, y) < r}, B

r
(x) = {y M | d(x, y) r}.
Por ejemplo, en R
2
con la distancia eucldea, es claro que las bolas son
crculos de radio r. La diferencia entre las bolas abiertas y las bolas cerradas
es que las primeras no contienen a su borde, es decir, a la circunferencia de
radio r, y las segundas s. Esto hace que, ciertamente, las bolas abiertas sean
abiertas y las bolas cerradas sean cerradas.
En efecto (suponiendo todos los datos est andar): si tomamos un punto
est andar y B
r
(x) y un z x en su halo, tenemos que
d(x, z) d(x, y) +d(y, z) d(x, y) < r,
luego d(x, z) < r. Esto prueba que h(z) B
r
(x), luego la bola abierta es
abierta.
Ejercicio: Demostrar que las bolas cerradas son cerradas.
El teorema siguiente nos da caracterizaciones internas de los conceptos que
hemos introducido hasta ahora:
Teorema 6.16 Sea M un espacio metrico, S M y x M.
a) x es un punto interior de S si y s olo si existe una bola abierta B
r
(x) S.
b) x es un punto adherente de S si y s olo si todo entorno de x corta a S.
c) x es un punto frontera de S si y s olo si todo entorno de x corta a S y a
M \ S.
Demostraci on: Podemos suponer los datos est andar. a) Si existe una bola
B
r
(x) S, podemos tomar el radio est andar, en cuyo caso h(x) B
r
(x) S,
luego S es entorno de x.
Recprocamente, si S es entorno de x, tomando r > 0 innitesimal, se cumple
que x B
r
(x) h(x) S.
b) Si x es un punto adherente y A es un entorno de x, entonces h(x) A,
pero h(x) contiene un punto de S, luego A S 6= .
Recprocamente, si x no es adherente a S, entonces h(x) M \ S, luego,
tomando r > 0 innitesimal, tenemos que B
r
(x) es un entorno de x que no corta
a S.
c) es consecuencia inmediata de b).
Paradoja 6.17 Vamos a probar que si M es un espacio metrico y F es una
familia de subconjuntos abiertos de M, entonces la intersecci on

CF
C
186 Captulo 6. C alculo diferencial de varias variables
es abierta. En efecto, podemos suponer que el espacio y F son est andar. To-
mamos un punto x en la intersecci on y observamos que, para todo C F, se
cumple que h(x) C, luego h(x) est a contenido en la intersecci on, lo que prueba
que esta es entorno de x y, por transferencia, es entorno de todos sus puntos,
luego es abierta.
Por otra parte, lo que acabamos de probar es falso, como se ve sin m as que
tomar como F el conjunto de todos los intervalos abiertos ]1/n, +[ R,
cuya intersecci on es el intervalo cerrado [0, +[, que no es abierto, porque no
es entorno de 0.
Soluci on: El contraejemplo es correcto, y muestra que la intersecci on de
abiertos no es necesariamente abierta. Lo que est a mal es la demostraci on.
Podemos tomar F est andar, pero eso no impide que F contenga elementos no
est andar (los tendr a, de hecho, siempre que F sea innito). Si C F no es
est andar, no podemos asegurar que h(x) C, pues la denici on de entorno s olo
vale explcitamente para conjuntos est andar.
Observemos que, para probar que para todo C F, se cumple h(x) C,
no podemos aplicar el principio de transferencia (y suponer que C es est andar)
porque la armaci on h(x) C no es interna.
Esto se ve en el contraejemplo: todos los intervalos ]1/n, +[ son abier-
tos, pero, aunque la familia F formada por todos ellos es est andar, contiene
intervalos no est andar (los correspondientes a n innito) y, aunque ]1/n, +[
es abierto aun si n es innito, no es cierto que h(0) ]1/n, +[, pues, por
ejemplo, el intervalo no contiene al innitesimo 1/(n 1) h(0).
No obstante, hemos observado que el argumento de la paradoja es v alido si
la familia de abiertos es nita.
Ejercicio: Demostrar que, en un espacio metrico, toda uni on de conjuntos abiertos es
abierta, y toda intersecci on nita de conjuntos abiertos es abierta. Por consiguiente,
toda intersecci on de conjuntos cerrados es cerrada y toda uni on nita de conjuntos
cerrados es cerrada.
Denici on 6.18 Si M es un espacio metrico y S M, llamaremos interior de
S a la uni on

S de todos los abiertos en M contenidos en S. La clausura de S
es la intersecci on S de todos los cerrados en M que contienen a S.
Es claro que

S S S. M as a un,

S es abierto, y es el mayor abierto
contenido en S, y S es cerrado, y es el menor cerrado que contiene a S.
Teorema 6.19 Si M es un espacio metrico y S M, entonces

S es el con-
junto de los puntos interiores de S, y S es el conjunto de los puntos adherentes
de S.
Demostraci on: Podemos suponer todos los datos est andar. Todo x

S
est andar cumple h(x)

S S, luego x es interior a S y, si x es interior a


S, entonces x B
r
(x) S, para cierto r > 0, luego x

S por denici on de
interior, ya que la bola es abierta.
6.2. Elementos de topologa 187
Similarmente, si x (est andar) es adherente a S, tambien es adherente a S y,
como la clausura es cerrada, entonces x S. Recprocamente, si x es est andar
pero no es adherente a S, entonces h(x) M \ S, luego, tomando r > 0
innitesimal, B
r
(x) M \ S, luego x / M \ B
r
(x), que es un cerrado que
contiene a S, luego x / S.
Denici on 6.20 Si M es un espacio metrico y S M, llamaremos frontera de
S al conjunto S de todos los puntos frontera de S.
Ejercicio: Probar que S = S M \ S,

S = S \ S, S = S S.
Si tenemos dos espacios metricos est andar N M, conviene comparar en
ambos espacios los conceptos que acabamos de denir:
a) Si x N, la relaci on entre los halos es que h
N
(x) = h
M
(x) M.
b) Un conjunto C N es cerrado en N si y s olo si es de la forma C = C
0
N,
donde C
0
es un cerrado en M. En efecto, es claro que los conjuntos de
esta forma son cerrados en N. Si C es cerrado, basta tomar C
0
= C. En
efecto, (suponiendo los datos est andar) si x C N es est andar, existe
un y C tal que x y. Como C es cerrado en N, esto implica que x C.
Esto prueba que C N C, y la otra inclusi on es obvia.
c) Un conjunto A N es abierto en N si y s olo si es de la forma A = A
0
N,
donde A
0
es un abierto en M. En efecto, si A es abierto en N, entonces
N \ A es cerrado en N, luego N \ A = C
0
N, donde C
0
es cerrado en M,
luego A = (M \ C
0
) N.
Vemos as que las nociones de abierto o cerrado son relativas al espacio en
que consideremos contenido un conjunto. Por ejemplo si N M, entonces,
como espacio metrico, N es trivialmente abierto y cerrado en s mismo, pero
puede serlo o no en M.
Ejemplo Probar que el intervalo N = [1, 2[ no es ni abierto ni cerrado en
M = R; es abierto, pero no cerrado, en M = [1, 3]; es cerrado, pero no abierto
en M = [0, 2[; es abierto y cerrado en M = [1, 2[ [3, 4]; y es abierto y cerrado
en M = N.
Espacios compactos Si N M son espacios metricos est andar, un punto
x N es nito como punto de N si y s olo si es nito como punto de M. En
efecto, N ha de contener un punto est andar p, y x ser a nito en M o en N si y
s olo si d(x, y) es nita. Esto convierte en absoluto el concepto siguiente:
Denici on 6.21 Un espacio metrico est andar M es acotado si todos sus puntos
son nitos.
188 Captulo 6. C alculo diferencial de varias variables
As, si tenemos A M y ambos son est andar, decir que A es acotado en
M es lo mismo que decir que A es acotado en s mismo, como espacio metrico.
Signica que los puntos de A son nitos, tanto en A como en M. No obs-
tante, es interesante la siguiente caracterizaci on relativa de la acotaci on de un
subconjunto en un espacio mayor:
Teorema 6.22 Un subconjunto est andar de un espacio metrico est andar est a
acotado si y s olo si est a contenido en una bola de centro nito y radio nito.
Demostraci on: Evidentemente, si A B
r
(x) con x y r nitos, entonces
todo punto y A cumple d(x, y) < r, luego y es nito, y A est a acotado.
Recprocamente, vamos a ver que si A est a acotado, entonces est a conte-
nido en una bola de radio est andar y centro cualquier punto est andar x M
prejado.
En caso contrario, para todo r > 0 est andar, tendramos que A no estara
contenido en B
r
(x), luego, por transferencia, A no estara contenido en ninguna
bola de cualquier radio (est andar o no). Tomando un r > 0 innito, esto implica
que existe y A tal que d(x, y) r, luego y es remoto, en contradicci on con la
hip otesis de que A est a acotado.
En particular, es claro que toda bola de centro nito y radio nito est a
acotada. Tambien es obvio que todo subconjunto de un conjunto acotado est a
acotado.
Ejercicio: Demostrar que un subconjunto A de un espacio metrico M est a acotado
si y s olo si existe un C R tal que d(x, y) C, para todo par de puntos x, y A.
Si en lugar de considerar puntos nitos consideramos puntos casi est andar,
la situaci on es algo m as delicada, pues si tenemos A M, ambos est andar,
un punto x A puede ser casi est andar en M y no serlo en A (porque

x no
pertenezca a A).
Denici on 6.23 Un espacio metrico est andar M es compacto si todos sus pun-
tos son casi est andar.
Seg un la observaci on precedente, si A M son est andar, debemos tener
presente que A es compacto (como espacio metrico), no cuando todos sus puntos
son casi est andar en M, sino cuando lo son en A. Explcitamente:
A es compacto si y s olo si todo x A es casi est andar (en M) y

x A.
La compacidad es el concepto m as abstracto (y articial) de todos cuantos
vamos a estudiar, pero tambien uno de los m as utiles. En el caso de R
n
su
interpretaci on es muy simple:
Teorema 6.24 Si M es un espacio metrico y C M es compacto, entonces
es cerrado y acotado. Si M = R
n
, entonces todo subconjunto cerrado y acotado
es compacto.
6.3. Funciones continuas 189
Demostraci on: Si C es compacto todos sus puntos son casi est andar,
luego son nitos. Esto prueba que est a acotado. Por otra parte, C cumple
trivialmente la denici on de cerrado.
Si C R
n
es cerrado y acotado, todo punto x C es nito (por ser acotado),
luego casi-est andar (esto es cierto en R
n
, por 6.10), y

x C por ser cerrado,
luego C es compacto.
Otra relaci on b asica entre compactos y cerrados es la siguiente:
Teorema 6.25 Si M es un espacio metrico compacto y C M es cerrado,
entonces C es compacto.
Demostraci on: Podemos suponer los datos est andar. Si x C, entonces
x es casi est andar en M, pero, como C es cerrado,

x C, luego C es compacto.
El teorema siguiente es trivial en terminos no est andar, aunque con tecnicas
cl asicas cuesta un poco de probar:
Teorema 6.26 (Tychono) Si M
1
, . . . , M
n
son espacios metricos compactos,
entonces M
1
M
n
es compacto.
Demostraci on: Podemos suponer que datos son est andar. Si tomamos
x M
1
M
n
, sus coordenadas x
i
son casi est andar, porque los factores
son compactos, luego x es casi est andar por el teorema 6.9
6.3 Funciones continuas
Ahora estamos en condiciones de generalizar a espacios metricos los resulta-
dos de continuidad que conocemos para funciones reales de variable real.
Denici on 6.27 Una funci on est andar f : M N entre dos espacios metri-
cos est andar es continua en un punto est andar x M si para todo punto y M
tal que x y, se cumple que f(x) f(y). Diremos que f es continua en un
conjunto A M si lo es en todos los puntos de A.
Es evidente que esta denici on generaliza a la que tenamos para funciones
en R. Tambien es claro que si f : M N es continua, M
0
M y N N
0
,
entonces f|
M
0 : M
0
N
0
tambien es continua.
Seguidamente vamos a demostrar unos cuantos resultados que nos propor-
cionen numerosos ejemplos de funciones continuas. El primero es obvio:
Teorema 6.28 Si f : M N y g : N P son funciones entre espacios
metricos tales que f es continua en un punto x M y g es continua en f(x),
entonces f g es continua en x. En particular, si f y g son continuas (en sus
dominios), f g tambien lo es.
190 Captulo 6. C alculo diferencial de varias variables
Los tres teoremas siguientes son consecuencias inmediatas de 6.9:
Teorema 6.29 Si M
1
, . . . , M
n
son espacios metricos, la proyecci on
p
i
: M
1
M
n
M
i
que a cada punto x le asigna su coordenada i-esima, p
i
(x) = x
i
, es continua.
Teorema 6.30 Si f
i
: M
i
N
i
son aplicaciones continuas entre espacios
metricos, la aplicaci on
f
1
f
n
: M
1
M
n
N
1
N
n
dada por (f
1
f
n
)(x
1
, . . . , x
n
) = (f(x
1
), . . . , f(x
n
)) es continua.
Teorema 6.31 Si f
i
: M N
i
son funciones continuas entre espacios metri-
cos, tambien es continua la aplicaci on (f
1
, . . . , f
n
) : M N
1
N
n
dada
por (f
1
, . . . , f
n
)(x) = (f
1
(x), . . . , f
n
(x)).
Teorema 6.32 Si N es un espacio normado, la suma + : N N N y el
producto : R N N son continuos.
Demostraci on: Podemos suponer que N es est andar. Hemos de probar
que si (x, y) NN es un punto est andar y (x
0
, y
0
) (x, y), entonces se cumple
que x
0
+y
0
x +y. Ahora bien,
d(x
0
+y
0
, x +y) = kx
0
+y
0
x yk = k(x
0
x) + (y
0
y)k
kx
0
xk +ky
0
yk = d(x
0
, x) +d(y
0
, y) 0,
luego x
0
+y
0
x +y.
Para el producto, partimos de (, x) R N est andar, tomamos otro par
(
0
, x
0
) (, x), y hemos de ver que
0
x
0
x.
En efecto:
d(
0
x
0
, x) = k
0
x
0
xk = k
0
x
0

0
x +
0
x xk
|
0
|kx
0
xk + |
0
|kxk 0.
Observemos ahora que, si M es un espacio metrico y N es un espacio nor-
mado, en el conjunto F(M, N) de todas las aplicaciones M N, tenemos
denida (puntualmente) una suma y un producto por n umeros reales:
(f +g)(m) = f(m) +g(m), (f)(m) = f(m).
Si f, g F(M, R), tambien podemos denir puntualmente su producto:
(fg)(m) = f(m)g(m).
6.3. Funciones continuas 191
Ahora es inmediato que si f y g F(M, N) son continuas, tambien lo son
f +g y f. En efecto, f +g puede verse como la composici on
M
(f,g)
N N
+
N,
y ambas funciones son continuas, por los teoremas anteriores. Similarmente, f
se descompone como
M
(,f)
R N

N,
donde, en la primera parte, representa a la funci on constante , que obvia-
mente es continua.
El teorema anterior prueba en particular la continuidad de la aplicaci on
producto : R R R, luego, si f y g F(M, R) son continuas, tambien es
continua fg, ya que se expresa como
M
(f,g)
R R

R
En denitiva, ahora es obvio el teorema siguiente:
Teorema 6.33 Si M es un espacio normado y N es un espacio metrico, el
conjunto C(M, N) de todas las funciones continuas en M en N es un espacio
vectorial con la suma y el producto denidos puntualmente. El espacio C(M, R)
es tambien un anillo con el producto denido puntualmente.
Ejemplo La funci on x
2
yz 7z
3
F(R
3
, R) es continua.
En efecto, las funciones x, y, z son las proyecciones cuya continuidad arma
el teorema 6.29. La funci on dada se obtiene a partir de ellas mediante sumas,
productos y productos por n umeros, luego es continua por el teorema anterior.
En general, es claro que el espacio C(R
n
, R) contiene al anillo R[x
1
, . . . , x
n
]
de todos los polinomios de n variables.
Ejemplo La funci on f : R R
2
dada por f(t) = (sent, cos t) es continua.
En efecto, sabemos que lo son las funciones sent y cos t y basta aplicar el
teorema 6.31.
Las aplicaciones continuas nos permiten reconocer f acilmente muchos con-
juntos abiertos y cerrados, gracias al teorema siguiente:
Teorema 6.34 Sea f : M N una aplicaci on entre espacios metricos. Las
armaciones siguientes son equivalentes:
a) f es continua.
b) Para todo abierto A N, se cumple que f
1
[A] es abierto en M.
c) Para todo cerrado A N, se cumple que f
1
[A] es cerrado en M.
192 Captulo 6. C alculo diferencial de varias variables
Demostraci on: b) y c) son claramente equivalentes, pues si suponemos b)
y A es cerrado, entonces N \ A es abierto, y f
1
[N \ A] = M \ f
1
[A], luego
f
1
[A] es abierto y f
1
[A] es cerrado. Igualmente se prueba que c) implica b).
Supongamos que todos los datos son est andar. Si f es continua y A es
abierto, tomamos un punto est andar x f
1
[A] y un y M tal que y x.
Entonces f(y) f(x) A, luego f(y) A, luego y f
1
[A]. Esto prueba que
h(x) f
1
[A], luego f
1
[A] es abierto.
Recprocamente, si se cumple b), tomamos x M est andar y un y x. Si
f(y) 6 f(x), entonces hay un n umero est andar 0 < r < d(x, y), luego tenemos
que f(y) / B
r
(f(x)) y, por consiguiente, y / f
1
[B
r
(f(x))]. Este conjunto
(est andar) debera ser abierto, pero contiene a x y no a y, luego no contiene al
halo de x. Esto es una contradicci on.
Ejemplo El conjunto
C = {(x, y, z) R
3
| 2x
2
+ 5y
2
+ 8z
2
= 20}
es compacto.
En efecto, es la antiimagen del cerrado {20} por el polinomio 2x
2
+5y
2
+8z
2
,
que es una aplicaci on continua. Por lo tanto, es cerrado. Adem as es acotado,
pues si (x, y, z) C, entonces |x| 20, |y| 20, |z| 20, luego las tres
coordenadas son nitas, luego (x, y, z) es nito. Esto signica que C es acotado.
Ejemplo El conjunto
A = {(x, y, z) R
3
| x 2y +z > 3}
es abierto.
Pues es la antiimagen del intervalo ]3, +[ por el polinomio x2y +z.
Ejemplo Si una aplicaci on g : M N entre dos espacios metricos es biyec-
tiva y continua, su inversa g
1
: N M no es necesariamente continua.
En efecto, sea N = {(x, y) R
2
| x
2
+y
2
= 1} y consideremos la aplicaci on
f : [0, 2] N dada por f(t) = (cos t, sent). Claramente es continua, aunque
no es biyectiva, porque f(0) = f(2) = (1, 0). Sin embargo, si M = [0, 2[, la
restricci on g : M N s que es biyectiva y continua. No obstante, si h > 0 es
innitesimal, se cumple que g(2 h) = f(2 h) f(2) = f(0) = g(0).
As pues, tenemos dos puntos en N (los puntos g(2 h) y g(0)) que est an
innitamente pr oximos, pero sus im agenes en M por g
1
(los puntos 0 y 2h)
no est an innitamente pr oximos. Esto prueba que g
1
no es continua en (1, 0).
6.3. Funciones continuas 193
Denici on 6.35 Un homeomorsmo g : M N entre dos espacios metricos
es una aplicaci on biyectiva, continua con inversa continua.
Teorema 6.36 Si f : M N es una aplicaci on continua y suprayectiva entre
espacios metricos y M es compacto, entonces N tambien es compacto.
Demostraci on: Podemos suponer que los datos son est andar. Tomemos
x N. Existe un y M tal que f(y) = x. Como M es compacto, existe

y M. Entonces f(

y) f(y) = x y f(

y) es est andar, luego x es casi


est andar. Esto prueba que N es compacto.
Ahora es inmediata la generalizaci on del primer teorema de Weierstrass:
Teorema 6.37 Si M es un espacio metrico compacto y f : M R es una
aplicaci on continua, entonces f toma en M un valor m aximo y un valor mnimo.
Demostraci on: Por el teorema anterior f[M] R es compacto, luego
es cerrado y acotado. Por ser acotado, existe el supremo s y el nmo i. El
teorema 2.57 arma que s e i son adherentes a f[M]. Como es cerrado, resulta
que s, i f[M], es decir, s = f(u), i = f(v). Obviamente, u y v son los puntos
donde f alcanza su m aximo y su mnimo.
Espacios conexos Para generalizar el segundo teorema de Weierstrass nece-
sitamos un nuevo concepto:
Denici on 6.38 Un espacio metrico M es conexo si no puede expresarse como
uni on de dos abiertos disjuntos no vacos.
La relaci on con el segundo teorema de Weierstrass nos la proporcionan los
dos teoremas siguientes:
Teorema 6.39 Si f : M N es una aplicaci on continua y suprayectiva entre
espacios metricos y M es conexo, entonces N tambien lo es.
Demostraci on: Si N no fuera conexo, lo podramos descomponer como
N = A B, donde A y B son abiertos disjuntos no vacos. Entonces, tambien
M = f
1
[A] f
1
[B], donde los dos conjuntos son abiertos disjuntos no vacos,
es decir, M no es conexo.
Teorema 6.40 Un subconjunto de R es conexo si y s olo si es un intervalo.
Demostraci on: Sea I R un intervalo y supongamos que I = A B,
donde Ay B son abiertos disjuntos no vacos. Entonces, la aplicaci on f : I R
dada por
f(x) =

0 si x A,
1 si x B,
es claramente continua en I, pero toma los valores 0 y 1 y no toma ning un valor
intermedio, en contradicci on con el segundo teorema de Weierstrass.
194 Captulo 6. C alculo diferencial de varias variables
Supongamos ahora que I R es conexo y vamos a probar que es un intervalo.
Por el teorema 2.64, basta tomar a, b I, digamos a < b, y hemos de probar
que ]a, b[ I. En caso contrario, existe un n umero a < c < b tal que c / I,
pero entonces A = I ], c[ y B = ]c, +[ son abiertos disjuntos en I tales
que I = A B. Esto prueba que I no es conexo.
La generalizaci on del segundo teorema de Weierstrass es:
Teorema 6.41 Si M es un espacio metrico conexo y f : M R es una
aplicaci on continua y x, y M, entonces f toma todos los valores comprendidos
entre f(x) y f(y).
Demostraci on: Tenemos que f[M] R es conexo, luego es un intervalo,
y contiene a f(x) y f(y), luego contiene a todos los valores intermedios.
La prueba del teorema 6.40 contiene una caracterizaci on util de la conexi on:
Teorema 6.42 Un espacio metrico M es conexo si y s olo si toda aplicaci on
continua f : M {0, 1} es constante.
Demostraci on: Si M es conexo pero f no fuera constante, entonces sera
suprayectiva, luego {0, 1} debera ser conexo, cuando claramente no lo es (ya
que {0} y {1} son ambos abiertos en {0, 1}). Si M no es conexo, podemos
descomponerlo como M = AB, donde A y B son abiertos disjuntos no vacos.
La aplicaci on f : M {0, 1} dada por
f(x) =

0 si x A,
1 si x B,
es continua y no es constante.
Teorema 6.43 Si M
1
, . . . , M
n
son espacios metricos conexos, entonces el pro-
ducto M
1
M
n
es conexo.
Demostraci on: Basta probarlo para dos factores y, por inducci on, vale
para todo n. Tomemos una funci on continua f : M
1
M
2
{0, 1} y veamos
que es constante.
Fijemos un punto (x, y) M
1
M
2
. La aplicaci on g
1
: M
1
M
1
M
2
dada por g(m
1
) = (m
1
, y) es continua, luego su imagen es conexa, luego
f(m
1
, y) = f(x, y)
para todo m
1
M. Fijado m
1
M, la aplicaci on g
2
: M
2
M
1
M
2
dada
por g
2
(m
2
) = (m
1
, m
2
) es continua, luego su imagen es conexa, luego
f(m
1
, m
2
) = f(m
1
, y) = f(x, y),
para todo (m
1
, m
2
) M
1
M
2
.
Ejercicio: Probar que si M es un espacio metrico y A, B M son conexos y
A B 6= , entonces A B es conexo.
6.4. Derivadas y diferenciales 195
6.4 Derivadas y diferenciales
La generalizaci on m as simple del concepto de derivada de una funci on de
una variable es la siguiente:
Denici on 6.44 Sea f : D R
n
R una funci on est andar denida en un
abierto D y sea p D. Diremos que f es derivable en p respecto a la variable
x
i
si existe un n umero est andar
f
x
i

p
tal que, para todo innitesimo no nulo h R, se cumple que
f(p
1
, . . . , p
i
+h, . . . , p
n
) f(p)
h

f
x
i

p
.
Es obvio que, si existe un n umero que satisface la denici on anterior, es
unico, y se llama derivada parcial de f respecto a x
i
en el punto p. Si f es
derivable respecto de x
i
en todos los puntos de D, tenemos denida la funci on
derivada parcial
f
x
i
: D R
n
R.
Es claro que esta denici on generaliza a la denici on que ya conocamos de
derivada de una funci on de una variable. M as a un, los resultados conocidos
sobre derivadas de funciones de una variable se generalizan autom aticamente a
resultados an alogos sobre derivadas parciales gracias a la observaci on siguiente:
en las condiciones de la denici on anterior,
f
x
i

p
=
df
p,i
dx

p
i
,
donde f
p,i
: D
i
R R es la funci on dada por
f
p,i
(x) = f(p
1
, . . . , x, . . . , p
n
),
y D
i
= {x R | (p
1
, . . . , x, . . . , p
n
) D}. La igualdad ha de entenderse como
que existe una derivada si y s olo si existe la otra.
En otras palabras: la derivada parcial de f en p respecto de x
i
es la derivada
en p
i
de la funci on (de una variable) que resulta de jar x
j
= p
j
en f para j 6= i.
As, ahora es evidente que el teorema 3.18 es v alido en general para derivadas
parciales. Por ejemplo, dadas dos funciones f y g, es claro que
(f +g)
p,i
= f
p,i
+g
p,i
,
luego la suma ser a derivable respecto de x
i
en p si y s olo si lo son ambos
sumandos y, en tal caso, la derivada de la suma ser a la suma de las derivadas.
196 Captulo 6. C alculo diferencial de varias variables
Ejemplo La funci on f(x, y) = x
2
y +y
3
es derivable respecto de ambas varia-
bles en todo R
2
y sus derivadas son
f
x
= 2xy,
f
y
= x
2
+ 3y
2
.
En efecto, para cualquier p = (x, y) R
2
, se cumple que f
p,1
(x) = x
2
y +y
3
,
f
p,2
(y) = x
2
y +y
3
, y s olo hemos de aplicar las reglas de derivaci on usuales para
funciones de una variable.
Sin embargo, la noci on de derivada parcial no puede considerarse el equiva-
lente en varias variables a la noci on de derivada de una funci on de una variable,
pues las propiedades b asicas no se generalizan. Por ejemplo, no es cierto que
toda funci on que admita derivadas parciales sea continua:
Ejercicio: Probar que la funci on f : R
2
R dada por
f(x, y) =
_
0 si xy = 0,
1 si xy 6= 0.
no es continua en (0, 0), pero existen
f
x

(0,0)
=
f
x

(0,0)
= 0.
La raz on de la patologa que muestra el ejercicio anterior es clara: las deri-
vadas parciales nos dan informaci on sobre el efecto que tiene la variaci on in-
nitesimal una variable en una funci on manteniendo las dem as constantes, pero
no nos dicen nada del efecto que tiene una variaci on innitesimal de todas las
variables simult aneamente. Para relacionar con las derivadas tales variaciones
simult aneas necesitamos el concepto de aplicaci on lineal:
Denici on 6.45 Una aplicaci on lineal : R
n
R
m
es una aplicaci on de la
forma
(x) = (a
11
x
1
+ +a
n1
x
n
, . . . , a
1m
x
1
+ +a
nm
x
n
),
para ciertos a
ij
R.
La matriz
A = (a
ij
) =
_
_
_
a
11
a
1m
.
.
.
.
.
.
a
n1
a
nm
_
_
_
se llama matriz asociada a la aplicaci on lineal . Es obvio que cada aplicaci on
lineal est a determinada por su matriz y que esta es unica, ya que su i-esima la
es necesariamente (e
i
), donde e
i
= (0, . . . , 1, . . . , 0) R
n
es el vector que tiene
el 1 en la coordenada i-esima. A su vez, esto prueba que est a completamente
determinada por los vectores (e
i
), para i = 1, . . . , n.
Llamaremos L(R
n
, R
m
) al conjunto de todas las aplicaciones lineales de R
n
en R
m
.
6.4. Derivadas y diferenciales 197
Ejercicio: Probar que toda aplicaci on lineal : R
n
R
m
cumple las relaciones
(x +y) = (x) +(y) y (x) = (x), para todo x, y R
n
y todo R.
En general, las funciones coordenadas de una aplicaci on f : D R
m
, son
las composiciones f
i
= f p
i
, donde p
i
: R
m
R es la proyecci on i-esima. Es
claro que una funci on : R
n
R
m
es lineal si y s olo si lo son sus funciones
coordenadas.
Denici on 6.46 Una funci on est andar f : D R
n
R
m
denida en un
abierto D es diferenciable en un punto p D si existe una aplicaci on lineal
est andar : R
n
R
m
tal que, para cada vector h R
n
, h 0, h 6= 0, se
cumple que
f(p +h) f(p) (h)
khk
0.
Vamos a probar que, si f es diferenciable en este sentido, entonces la apli-
caci on est a completamente determinada por f y por p. Para ello basta ver
que est an determinados los valores (e
i
), para i = 1, . . . , n. En efecto, tomamos
un innitesimo no nulo h R y aplicamos la denici on anterior a he
i
, con lo
que obtenemos que
f(p +he
i
) f(p) (he
i
)
|h|
0.
Ahora observamos que |h|/h = 1 es nito, luego podemos multiplicar el
cociente por esta expresi on sin que deje de ser innitesimal:
f(p +he
i
) f(p) h(e
i
)
h
0.
Equivalentemente:
f(p +he
i
) f(p)
h
(e
i
).
Ambos miembros son vectores de R
m
, y sabemos que sus coordenadas han
de estar innitamente pr oximas, es decir, para todo j = 1, . . . , m, tenemos que
f
j
(p +he
i
) f
j
(p)
h

j
(e
i
).
Pero esto signica que la funci on f
j
: D R
n
R tiene derivada parcial
respecto de x
i
en p, y que
f
j
x
i

p
=
j
(e
i
).
Esto prueba que, en efecto, (e
i
) est a unvocamente determinado.
Denici on 6.47 Si f : D R
n
R
m
es una funci on diferenciable en un
punto p D, llamaremos diferencial de f en p a la unica aplicaci on lineal que
cumple la denici on precedente. La representaremos por d
p
f : R
n
R
m
.
198 Captulo 6. C alculo diferencial de varias variables
Hemos demostrado lo siguiente:
Teorema 6.48 Si f : D R
n
R
m
es una funci on diferenciable en un
punto p D, entonces sus funciones coordenadas f
j
: D R
n
R tienen
derivadas parciales en p y, para i = 1, . . . , n, se cumple que
d
p
f(e
i
) =

f
1
x
i

p
, . . . ,
f
m
x
i

p
_
M as en general:
Denici on 6.49 Si f : D R
n
R
m
es una funci on cuyas funciones coor-
denadas tienen derivadas parciales en un punto p D, llamaremos matriz jaco-
biana de f en p a la matriz
Jf(p) =
_
f
j
x
i

.
En el caso m = 1, la traspuesta de matriz jacobiana se llama tambien vector
gradiente de f en p, y se representa por
f(p) =

f
x
1

p
, . . . ,
f
x
n

p
_
.
Hemos probado que si f es diferenciable en p, entonces d
p
f es la aplicaci on
lineal asociada a la matriz jacobiana Jf(p).
De la propia denici on de diferenciabilidad se sigue el teorema siguiente, que
nos permitir a a menudo restringirnos al caso de funciones con valores en R:
Teorema 6.50 Una funci on f : D R
n
R
m
es diferenciable en un punto
p D si y s olo si todas sus funciones coordenadas son diferenciables en p y, en
tal caso,
d
p
f(v) = (d
p
f
1
(v), . . . , d
p
f
m
(v)).
Ahora, si f : D R
n
R es diferenciable en un punto p D, la propia
denici on de matriz de una aplicaci on lineal nos da que, para todo x R
n
,
d
p
f(x) =
f
x
1

p
x
1
+ +
f
x
n

p
x
n
.
Observemos ahora que, de la denici on de diferenciabilidad se sigue inmedia-
tamente que toda aplicaci on lineal es diferenciable, y que su diferencial coincide
con ella misma. En particular, las proyecciones p
i
: R
n
R (es decir, las
aplicaciones p
i
(x) = x
i
o, simplemente, x
i
) son lineales, luego d
p
x
i
(x) = x
i
.
Esto nos permite escribir la igualdad anterior como
d
p
f(x) =
f
x
1

p
d
p
x
1
(x) + +
f
x
n

p
d
p
x
n
(x)
6.4. Derivadas y diferenciales 199
o, tambien, como igualdad de funciones,
d
p
f =
f
x
1

p
d
p
x
1
+ +
f
x
n

p
d
p
x
n
.
Si f es diferenciable en todos los puntos p D, esta igualdad es v alida para
todo p, y se traduce en una igualdad de formas diferenciales. Esto requiere
generalizar la denici on de forma diferencial que hemos visto en el caso de
funciones de una variable:
Llamamos L(R
n
) al conjunto de las aplicaciones lineales l : R
n
R.
Denimos una suma + : L(R
n
) L(R
n
) L(R
n
) dada por
(l +l
0
)(u) = l(u) +l
0
(u).
Se comprueba inmediatamente que, en efecto, l +l
0
L(R
n
).
Si D R
n
es abierto, llamamos (D) al conjunto de todas las aplicacio-
nes : D L(R
n
). A los elementos de (D) los llamaremos formas
diferenciales en D. Si p D, escribiremos
p
en lugar de (p).
Observemos que, si (D), podemos denir f
,i
: D R mediante
f
,i
(p) = (p)(e
i
), de modo que, para todo x R
n
, se cumple que

p
(x) = f
,1
(p)x
1
+ +f
,n
(p)x
n
.
As, est a completamente determinada por las aplicaciones f
,i
y, recpro-
camente, dadas funciones cualesquiera f
i
: D R podemos denir

p
(x) = f
1
(p)x
1
+ +f
n
(p)x
n
,
de modo que f
,i
= f
i
.
Denimos una suma + : (D) (D) (D) mediante
( +
0
)
p
=
p
+
0
p
,
donde la suma del segundo miembro es la suma de L(R
n
). Claramente,
f
+
0
,i
= f
,i
+f

0
,i
.
Denimos un producto F(D) (D) (D) mediante
(g)
p
(u) = g(p)
p
(u).
Se comprueba inmediatamente que g (D). Claramente, f
g,i
= gf
,i
.
En estos terminos, si f : D R
n
R es una funci on diferenciable en el
abierto D (es decir, diferenciable en todos los puntos de D), podemos considerar
la forma diferencial df (D) que a cada p D le asigna la aplicaci on lineal
d
p
f L(R
n
).
200 Captulo 6. C alculo diferencial de varias variables
En general, si (D), tenemos que

p
(x) = f
,1
(p)x
1
+ +f
,n
(p)x
n
= f
,1
(p)d
p
x
1
(x) + +f
,n
(p)d
p
x
n
(x),
para todo x R
n
, luego

p
= f
,1
(p)d
p
x
1
+ +f
,n
(p)d
p
x
n
,
luego
= f
,1
dx
1
+ +f
,n
dx
n
.
En denitiva, tenemos que cada (D) se expresa de forma unica como
= f
1
dx
1
+ +f
n
dx
n
,
para ciertas funciones f
i
: D R
n
R. Concretamente, si f es una funci on
diferenciable en D, tenemos la igualdad de formas diferenciales:
df =
f
x
1
dx
1
+ +
f
x
n
dx
n
.
En contra de lo que esta expresi on pueda sugerir, la mera existencia de
derivadas parciales no garantiza la diferenciabilidad. Ser a f acil dar un ejemplo
si tenemos en cuenta el teorema siguiente:
Teorema 6.51 Toda funci on diferenciable en un punto p es continua en p.
Demostraci on: Sea f : D R
n
R
m
una funci on (est andar) denida
en un abierto D y supongamos que es diferenciable en un punto est andar p D.
De la denici on de diferenciabilidad se sigue que
f(p +h) f(p) +d
p
f(h) f(p),
ya que las funciones lineales son claramente continuas. Esto vale para todo
h R
n
innitesimal no nulo, pero tambien es trivialmente cierto si h = 0. Por
consiguiente, si x D cumple x p, tenemos que f(x) f(p), y esto prueba
la continuidad en p.
Ejemplo La funci on f : R
2
R dada por
f(x, y) =
_
_
_
xy
x
2
+y
2
si (x, y) 6= (0, 0),
0 si (x, y) = (0, 0),
tiene derivadas parciales en R
2
, pero no es continua, luego tampoco diferencia-
ble, en (0, 0).
En efecto, f no es continua en (0, 0) porque, si tomamos x = y 0 no nulos,
entonces
f(x, y) =
x
2
2x
2
=
1
2
6 0 = f(0, 0).
6.4. Derivadas y diferenciales 201
La existencia de derivadas parciales en todo punto (x, y) 6= (0, 0) es conse-
cuencia de las reglas usuales de derivabilidad. En el punto (0, 0) aplicamos la
denici on de derivada parcial:
f(h, 0) f(0, 0)
h
= 0,
f(0, h) f(0, 0)
h
= 0,
luego
f
x

(0,0)
=
f
y

(0,0)
= 0.
Ejercicio: Probar que una funci on f : D R R es derivable en un punto p D
si y s olo si es diferenciable en p.
Para dar una condici on suciente de diferenciabilidad conviene introducir
primero algunos conceptos:
Denici on 6.52 Si f : D R
n
R es una funci on denida en un abierto
D, representaremos por

k
f
x
i
1
x
i
k
: D R
n
R
a la funci on que resulta de derivar k veces la funci on f, primero respecto de x
i
1
,
luego respecto de x
i
2
, etc. (supuesto que sea posible).
Diremos que f es de clase C
k
en D (donde k 1) si existen todas las
derivadas k-esimas y todas ellas son continuas en D.
Diremos que f es de clase C

en D si es de clase C
k
para todo k 1.
Diremos que una funci on f : D R
n
R
m
es de clase C
k
en D (para
k = 1, 2, . . . , ) si lo son todas sus funciones coordenadas.
Diremos que una funci on est andar f : D R
n
R
m
es estrictamente
diferenciable en p D si existe una aplicaci on lineal est andar : R
n
R
m
tal que, para todo par de puntos distintos x p y, se cumple que
f(x) f(y) (x y)
kx yk
0.
Haciendo y = p en la denici on anterior vemos que toda funci on estricta-
mente diferenciable en p es diferenciable en p, y que la aplicaci on lineal ha de
ser necesariamente d
p
f. Tambien es obvio que f es estrictamente diferenciable
en p si y s olo si lo son todas sus funciones coordenadas.
Teorema 6.53 Una funci on f : D R
n
R
m
es de clase C
1
en un abierto
D si y s olo si es estrictamente diferenciable en D.
202 Captulo 6. C alculo diferencial de varias variables
Demostraci on: Como f es estrictamente diferenciable o de clase C
1
si y
s olo si lo son sus funciones coordenadas, no perdemos generalidad si suponemos
que m = 1. Tambien podemos suponer que todos los datos son est andar.
Supongamos en primer lugar que f es de clase C
1
y tomemos un punto
est andar p D. Denimos
(x) =
n

i=1
f
x
i

p
x
i
y tomamos dos puntos distintos x p y. Vamos a calcular
f(x) f(y) (x y).
Para ello denimos F
i
= f(x
1
, . . . , x
i
, y
i+1
, . . . , y
n
), donde hemos de entender
que F
0
= f(y), F
n
= f(x). Es claro entonces que:
f(x) f(y)
n

i=1
f
x
i

p
(x
i
y
i
) =
n

i=1

F
i
F
i1

f
x
i

p
(x
i
y
i
)
_
.
Ahora aplicamos el teorema del valor medio a la funci on
g
i
(t) = f(x
1
, . . . , x
i1
, y
i
+t(x
i
y
i
), y
i+1
, . . . , y
n
)
en el intervalo [0, 1]. Notemos que el punto en el que calculamos f est a inni-
tamente pr oximo a p, luego est a en D. Claramente g
i
es continua en [0, 1] y el
hecho de que f tenga derivada parcial respecto de x
i
implica que g
i
es derivable
en ]0, 1[. Por consiguiente, aplicando la regla de la cadena para funciones de
una variable:
F
i
F
i1
= g(1) g(0) =
f
x
i

c
i
(x
i
y
i
),
donde c
i
p. As pues:
|f(x) f(y) (x y)|
n

i=1

f
x
i

c
i

f
x
i

|x
i
y
i
| kx yk,
donde
= nm ax
i

f
x
i

c
i

f
x
i

La continuidad en p de las derivadas de f implica que los valores absolutos


son innitesimales, luego el m aximo tambien es innitesimal y, como n es nito,
0. En denitiva, concluimos que
f(x) f(y) (x y)
kx yk
0,
luego f es estrictamente diferenciable en p.
6.4. Derivadas y diferenciales 203
Recprocamente, supongamos ahora que f es estrictamente diferenciable en
el abierto D. En particular, esto implica que f tiene derivadas parciales en D.
Tomemos un punto est andar p D y vamos a ver que
f
x
i
es continua en p.
Si x D es est andar y h R es un innitesimo no nulo, tenemos que
f(x +he
i
) f(x)
h

f
x
i

x
.
En particular, si > 0 es est andar, existe un > 0 (por ejemplo cualquier
innitesimo) tal que si 0 < |h| < se cumple

f(x +he
i
) f(x)
h

f
x
i

< .
Esto vale para todo x D y todo > 0 est andar, luego por transferencia vale
para todo x D y todo > 0. Tomemos concretamente x p y innitesimal.
Encontramos entonces un h 6= 0, que podemos tomar innitesimal, tal que
f(x +he
i
) f(x)
h

f
x
i

x
= h
0
0.
Equivalentemente,
f(x +he
i
) f(x) = h
f
x
i

x
+hh
0
.
Por otra parte, aplicando la denici on de diferenciabilidad estricta en p ob-
tenemos que
f(x +he
i
) f(x) hd
p
f(e
i
)
h
= h
00
0.
Equivalentemente,
f(x +he
i
) f(x) = h
f
x
i

p
+hh
00
.
Igualando las dos expresiones que hemos obtenido queda que
f
x
i

f
x
i

p
= h
00
h
0
0,
lo que prueba la continuidad en p de la derivada parcial.
Para probar que todas las funciones usuales son diferenciables, s olo nos falta
la generalizaci on de la regla de la cadena:
204 Captulo 6. C alculo diferencial de varias variables
Teorema 6.54 (Regla de la cadena) Si f : D R
n
R
m
es una funci on
diferenciable en p D y g : E R
m
R
k
es diferenciable en f(p) E,
entonces f g es diferenciable en p y
d
p
(f g) = d
p
f d
f(p)
g.
Demostraci on: Podemos suponer que todos los datos son est andar. Sea
h R
n
un innitesimo. Como f es diferenciable en p, es continua en p, luego
h
0
= f(p+h)f(p) es innitesimal. La diferenciabilidad de f implica que existe
un vector innitesimal h
1
R
m
tal que
h
0
= f(p +h) f(p) = d
p
f(h) +khkh
1
.
Igualmente, de la diferenciabilidad de g se sigue que existe h
2
R
k
innitesimal
tal que
g(f(p +h)) = g(f(p) +h
0
) = g(f(p)) +d
f(p)
g(h
0
) +kh
0
kh
2
= g(f(p)) +d
f(p)
g(d
p
f(h)) +khkd
f(p)
g(h
1
) +kh
0
kh
2
.
Llamemos = d
p
f d
f(p)
g, que es una aplicaci on lineal (ver las observaciones
posteriores a este teorema). Tenemos que
(f g)(p +h) (f g)(p) (h)
khk
= d
f(p)
g(h
1
) +
kh
0
k
khk
h
2
0,
donde hemos usado que
h
0
khk
= d
p
f

h
khk
_
+h
1
es nito. Esto prueba que f g es diferenciable en p y que d
p
(f g) = .
En la prueba del teorema anterior hemos usado que la composici on de aplica-
ciones lineales es lineal. M as concretamente, si f : R
n
R
m
y g : R
m
R
l
son dos aplicaciones lineales determinadas respectivamente por las matrices
A = (a
ij
) y B = (b
jk
), entonces es f acil ver que f g es la aplicaci on lineal
determinada por la matriz C = (c
il
) dada por
c
il
=
m

j=1
a
ij
b
jl
.
De esta expresi on deducimos en particular una f ormula para las derivadas
parciales de una funci on compuesta:
Teorema 6.55 Si f : D R
n
R
m
es una funci on diferenciable en un
punto p D y g : E R
m
R es diferenciable en f(p) E, entonces
(f g)
x
i

p
=
m

j=1
g
x
j

f(p)
f
j
x
i

p
.
6.4. Derivadas y diferenciales 205
Basta tener en cuenta la expresi on de la matriz jacobiana de una funci on
diferenciable. La f ormula anterior se enuncia de forma m as natural si llamamos
a las funciones y(x) (en lugar de f) y z(y) (en lugar de g), de modo que la
funci on compuesta es z(x) = z(y(x)). La regla de la cadena arma entonces
que
z
x
i
=
m

j=1
z
y
j
y
j
x
i
,
donde las derivadas de z(x) e y
j
(x) se eval uan en un punto x D y las de z(y)
se eval uan en y = y(x).
En particular, la regla de la cadena implica que la composici on de funciones
de clase C
1
es de clase C
1
, pues la relaci on entre las derivadas parciales muestra
que las derivadas de la funci on compuesta tambien son continuas. Un razona-
miento inductivo muestra ahora que la composici on de funciones de clase C
k
es
de clase C
k
(ya que, obviamente, una funci on es de clase C
k+1
si y s olo si tiene
derivadas parciales de clase C
k
, y la suma y el producto de funciones de clase
C
k
es obviamente de clase C
k
). Finalmente, esto implica que la composici on de
funciones de clase C

es de clase C

.
Teorema 6.56 (Teorema de Schwarz) Si f : D R
n
R es una funci on
de clase C
2
en un punto p D, entonces

2
f
x
i
x
j

p
=

2
f
x
j
x
i

p
para i, j = 1, . . . , n.
Demostraci on: No perdemos generalidad si suponemos que n = 2. Sea
p = (a, b). Llamamos

2
f(h) = f(a +h, b +h) f(a, b +h) f(a +h, b) +f(a, b).
Basta probar que si h > 0 es un innitesimo entonces

2
f
xy

(a,b)


2
f(h)
h
2
.
Si G(x) = f(x, b+h)f(x, b), tenemos que
2
f(h) = G(a+h)G(a). Pode-
mos aplicar el teorema del valor medio a G, de modo que existe un innitesimo
0 < h
1
< h tal que

2
f(h) = hG
0
(a +h
1
) = h
f
x

(a+h
1
,b+h)
h
f
x

(a+h
1
,b)
.
Si ahora aplicamos el teorema del valor medio a la funci on
f
x

(a+h
1
,x)
ob-
tenemos un innitesimo 0 < h
2
< h tal que

2
f(h) = h
2

2
f
xy

(a+h
1
,b+h
2
)
.
206 Captulo 6. C alculo diferencial de varias variables
As pues, usando la continuidad de la derivada segunda,

2
f(h)
h
2
=

2
f
xy

(a+h
1
,b+h
2
)


2
f
xy

(a,b)
.
Terminamos la secci on demostrando la versi on para funciones de varias va-
riables del teorema 3.22. La prueba que vamos a dar requiere el concepto de
norma de una aplicaci on lineal:
Si : R
n
R es una aplicaci on lineal, claramente es continua, y tambien
lo es || y la restricci on de || a la esfera unitaria
S = {x R
n
| kxk = 1}.
Como la esfera es compacta, el teorema 6.37 nos da que existe un punto en S
donde || toma su valor m aximo. Llamaremos norma de a este valor m aximo,
y lo representaremos por kk.
De este modo, si x R
n
es un vector arbitrario no nulo, se cumple que
x/kxk S, luego |(x/kxk)| kk. Como es lineal, esto equivale a que
|(x)/kxk| kk o, equivalentemente, a:
|(x)| kkkxk.
Evidentemente, esta desigualdad es v alida para todo x R
n
, incluido x = 0.
Teorema 6.57 (De la funci on inversa) Sea f : D R
n
R
n
una apli-
caci on estrictamente diferenciable en un punto p D. Si d
p
f es biyectiva
entonces existe un entorno U de p contenido en D tal que f[U] es un entorno
de f(p), la restricci on de f a U es biyectiva y su inversa es estrictamente dife-
renciable en f(p).
Demostraci on: Podemos suponer que f y p son est andar. Veamos que f
biyecta el halo de p con el halo de f(p). De aqu se sigue ya la existencia de
U (en principio un entorno contenido en h(p), que por transferencia podemos
convertir en un entorno est andar). S olo quedar a demostrar la diferenciabilidad
de la inversa.
En primer lugar, si x, x
0
h(p) son distintos, la diferenciabilidad estricta
implica que
f(x) f(x
0
)
kx x
0
k

d
p
f(x x
0
)
kx x
0
k
. (6.1)
Como el vector
xx
0
kxx
0
k
tiene norma 1 y d
p
f es biyectiva (y su inversa es una
aplicaci on lineal, luego continua), su imagen no puede ser innitesimal, luego
f(x) 6= f(x
0
).
Tomemos ahora y h(f(p)) y veamos que tiene antiimagen en h(p). Para
ello denimos la sucesi on
x
0
= p, x
n+1
= x
n
+d
p
f
1
(y f(x
n
)).
6.4. Derivadas y diferenciales 207
Para que esta sucesi on este bien denida es necesario que cada x
n
este en el
dominio de f. De hecho x
n
h(p), pues, si vale para n, tenemos que
kx
n+1
x
n
k = kd
p
f
1
(y f(x
n
))k kd
p
f
1
k ky f(x
n
)k, (6.2)
luego tambien vale para n + 1.
Si f(x
n
) = y para alg un n, ya tenemos una antiimagen para y. Podemos
suponer que no se da el caso, con lo que x
n+1
6= x
n
. Vamos a demostrar la
relaci on siguiente:
kx
n+1
x
n
k
1
2
n
kd
p
f
1
k ky f(p)k.
En efecto, tenemos que y = f(x
n
) +d
p
f(x
n+1
x
n
), luego
kf(x
n+1
) yk
kf(x
n
) yk
=
kf(x
n+1
) f(x
n
) d
p
f(x
n+1
x
n
)k
kx
n+1
x
n
k
kx
n+1
x
n
k
kd
p
f(x
n+1
x
n
)k
.
El primer cociente es innitesimal por la diferenciabilidad estricta de f en
p, el segundo es nito porque es el inverso de la norma del valor de d
p
f sobre
un vector de norma 1. Por consiguiente el miembro izquierdo es innitesimal.
En particular
kf(x
n+1
) yk
1
2
kf(x
n
) yk.
Usando (6.2) llegamos a que
kx
n+1
x
n
k kd
p
f
1
k ky f(x
n
)k
1
2
kd
p
f
1
k ky f(x
n1
)k

1
2
n
kd
p
f
1
k ky f(p)k.
De esta relaci on se sigue claramente que la sucesi on {x
n
} es de Cauchy,
luego converge a un punto x. Tomando lmites en la denici on de x
n
queda que
y = f(x).
Ahora sabemos que f es inyectiva en un entorno est andar de p, por lo que
tiene una inversa est andar f
1
, que podemos considerar de nuevo restringida
sobre el halo de f(p).
Para probar que f
1
es estrictamente diferenciable en f(p) tomamos dos
puntos y, y
0
h(f(p)), que ser an de la forma y = f(x), y
0
= f(x
0
). Seg un (6.1)
tenemos que
y y
0
kx x
0
k

d
p
f(x x
0
)
kx x
0
k
.
De aqu se sigue en particular que el cociente
kx x
0
k
ky y
0
k
208 Captulo 6. C alculo diferencial de varias variables
es nito, pues su inverso es d
p
f actuando sobre un vector unitario. Adem as
(d
p
f)
1
(y y
0
)
kx x
0
k

x x
0
kx x
0
k
,
luego
(d
p
f)
1
(y y
0
)
ky y
0
k

x x
0
ky y
0
k
=
f
1
(y) f
1
(y
0
)
ky y
0
k
,
lo que prueba la diferenciabilidad estricta de f
1
en f(p) (con diferencial igual
a (d
p
f)
1
).
En las condiciones del teorema anterior, si suponemos adem as que f es de
clase C
1
en D, en particular es de clase C
1
en U, luego estrictamente diferen-
ciable en todos los puntos de U. Si d
p
f es biyectiva en todos los puntos de
U, el teorema anterior puede aplicarse en todos ellos para concluir que f
1
es
estrictamente diferenciable en todo f[U], luego es de clase C
1
en f[U].
6.5 El teorema de la funci on implcita
En esta secci on y en la siguiente demostraremos algunos resultados que re-
quieren que el lector este familiarizado con los resultados b asicos del algebra
lineal (espacios vectoriales, bases, matrices, determinantes, etc.)
Como una primera muestra elemental de las posibilidades de aplicar el
algebra lineal al c alculo diferencial, observamos que la condici on de que d
p
f
sea biyectiva en el teorema de la funci on implcita equivale a que el determi-
nante jacobiano de f en p, es decir, el determinante de la matriz jacobiana
|Jf(p)| sea no nulo.
Si suponemos que f es de clase C
1
en su dominio, entonces |Jf(x)| es una
funci on continua, por lo que el hecho de que sea no nula en un punto implica que
es no nula en un entorno de dicho punto, luego siempre podemos encontrar un
entorno U que cumple el teorema de la funci on inversa (para un punto dado p)
tal que el teorema es aplicable en todos los puntos de U, de modo que, tal y
como indic abamos al nal de la secci on anterior, la funci on inversa f
1
es de
clase C
1
en todo el abierto f[U].
M as a un, aplicando la regla de la cadena a la composici on f f
1
= I (donde
I representa la funci on identidad en R
n
), obtenemos que, si y = f(x),
Jf(x) Jf
1
(y) = I
n
,
donde I
n
es la matriz identidad o, lo que es lo mismo:
Jf
1
(y) = (Jf(x))
1
,
para todo x U (o, equivalentemente, para todo y f[U]). M as explcitamente,
Jf
1
(y) =
1
|Jf(f
1
(y))|

Jf
t
(f
1
(y)),
6.5. El teorema de la funci on implcita 209
donde la tilde representa la matriz adjunta, cuyos coecientes dependen po-
lin omicamente de los coecientes de Jf. Esto prueba que las derivadas parcia-
les de f
1
se expresan en cada punto y f[U] como cociente de polinomios en
las derivadas parciales de f (compuestas con f
1
). Por consiguiente, si f es de
clase C
k
, sus derivadas parciales son de clase C
k1
, luego las derivadas parciales
de f
1
tambien son de clase C
k1
, luego f
1
es de clase C
k
. Obviamente, esto
es igualmente v alido si f es de clase C

. En denitiva, tenemos la siguiente


variante del teorema de la funci on inversa:
Teorema 6.58 (De la funci on inversa) Sea f : D R
n
R
n
una apli-
caci on de clase C
k
en el abierto D. Si p D cumple que d
p
f es biyectiva,
entonces existe un entorno U de p contenido en D tal que f[U] es un entorno
de f(p), la restricci on de f a U es biyectiva y su inversa es de clase C
k
en f[U].
Veamos un ejemplo que ilustra el resultado central de esta secci on:
Ejemplo Consideremos la ecuaci on xe
y
+ye
x
= 1.
1 2
1
La gura muestra los puntos que cumplen la ecuaci on (para 0 x 2). Vemos
que, para cada valor de x, existe un unico valor y(x) tal que el punto (x, y(x))
cumple la ecuaci on. En estas circunstancias, se dice que la ecuaci on dene a y
como funci on implcita de x.
Si la ecuaci on hubiera sido, por ejemplo, xy = 1, entonces la funci on y(x)
sera y(x) = 1/x, es decir, la funci on que resulta de despejar y en la ecuaci on.
Te oricamente, la situaci on es la misma, salvo que en la pr actica no es posible
despejar y en la ecuaci on dada. Por ello, sin apoyarnos en la gura, no sabemos,
en principio, c omo justicar la existencia de la funci on y(x) y, aun admitiendo
su existencia, no sabemos c omo justicar, por ejemplo, que es derivable.
El teorema de la funci on inversa nos permite resolver estos problemas, con
la ayuda de un truco: consideramos la funci on F : R
2
R
2
dada por
F(x, y) = (x, xe
y
+ye
x
1).
Claramente es de clase C

en R
2
y su matriz jacobiana es
JF =
_
1 e
y
+ye
x
0 xe
y
+e
x

.
Podemos aplicarle el teorema de la funci on inversa, por ejemplo, en el punto
(1, 0), donde JF(1, 0) = 1 6= 0. Observemos que F(1, 0) = (1, 0). Esto nos da
210 Captulo 6. C alculo diferencial de varias variables
una funci on inversa G(u, v) = (G
1
(u, v), G
2
(u, v)) de clase C

en un entorno U
de (1, 0). As pues, F(G(u, v)) = 0 para todo (u, v) U. Explcitamente:
G
1
(u, v) = u, G
1
(u, v)e
G
2
(u,v)
+G
2
(u, v)e
G
1
(u,v)
1 = v.
En particular, esto vale para los puntos (u, v) = (x, 0) con x 1, lo que nos
da
xe
G
2
(x,0)
+G
2
(x, 0)e
x
= 1.
Si llamamos y(x) = G
2
(x, 0) tenemos una funci on (est andar) denida para
todo x 1, de clase C

, tal que xe
y(x)
+y(x)e
x
= 1. Por transferencia, y est a
denida en un entorno est andar de 1, y es, obviamente, la funci on cuya gr aca
hemos mostrado antes. Ahora sabemos que es de clase C

(en un entorno de 1).


Observemos que si (x, y) (1, 0) cumple la ecuaci on, entonces (x, y) G[U],
luego existe un (u, v) U tal que (x, y) = G(u, v), luego F(x, y) = (u, v), luego
u = x y v = xe
y
+ye
x
1 = 0, luego y = G
2
(x, 0) = y(x).
Esto signica que la gr aca de y contiene a todos los puntos que cumplen la
ecuaci on dada y que est an innitamente pr oximos a (1, 0). Por transferencia,
contiene a todos los puntos que cumplen la ecuaci on dada y que est an en un
entorno (est andar) de (1, 0).
El teorema de la funci on implcita es la generalizaci on del ejemplo anterior
al caso de un n umero arbitrario de ecuaciones:
Teorema 6.59 (Teorema de la funci on implcita) Consideremos una fun-
ci on f : D R
n+m
R
m
de clase C
k
en el abierto D, sea (x
0
, y
0
) D tal que
f(x
0
, y
0
) = 0 (donde se ha de entender que x
0
R
n
, y
0
R
m
). Supongamos que
el determinante de las las de la matriz jacobiana Jf(x
0
, y
0
) correspondientes
a las coordenadas y
0
es no nulo. Entonces existen:
a) un abierto U R
n
que contiene a x
0
,
b) un abierto V R
n+m
que contiene a (x
0
, y
0
),
c) una funci on y : U R
n+m
de clase C
k
en U,
de modo que
{(x, y) V | f(x, y) = 0} = {(x, y) R
n+m
| x U, y = y(x)}.
Demostraci on: Consideramos la funci on F : D R
n+m
dada por
F(x, y) = (x, f(x, y)). Es claro que es de clase C
k
y que su matriz jacobiana en
(x
0
, y
0
) es de la forma
JF(x
0
, y
0
) =
_
I
n
A
0 B

,
donde los bloques A y B son la matriz Jf(x
0
, y
0
) y, concretamente, B es la
matriz cuyo determinante es no nulo por hip otesis. Las propiedades de los
determinantes implican que |JF(x
0
, y
0
)| 6= 0.
6.5. El teorema de la funci on implcita 211
El teorema de la funci on inversa nos da un abierto V que contiene a (x
0
, y
0
)
tal que W = F[V ] es abierto, contiene a F(x
0
, y
0
) = (x
0
, 0), F : V W es
biyectiva y su inversa G : W V es de clase C
k
en W.
Denimos U = {x R
n
| (x, 0) W}, que es un abierto en R
n
porque es
la antiimagen de W por la aplicaci on continua x 7 (x, 0). Como (x
0
, 0) W,
tenemos que x
0
U. Denimos y : U R
m
mediante y(x) = G
2
(x, 0).
Claramente y es de clase C
k
en U.
Ahora comprobamos que se cumple todo lo que indica el enunciado:
Si x U e y = y(x), por denici on de U tenemos que (x, 0) W, luego
G(x, 0) V , pero
G(x, 0) =
_
x, G
2
(x, 0)
_
=
_
x, y(x)
_
= (x, y).
Adem as (x, 0) = F
_
G(x, 0)
_
= F(x, y) =
_
x, f(x, y)
_
, luego f(x, y) = 0.
Recprocamente, si (x, y) V y f(x, y) = 0 entonces
F(x, y) =
_
x, f(x, y)
_
= (x, 0) W,
luego x U y (x, y) = G
_
F(x, y)
_
= G(x, 0) =
_
x, G
2
(x, 0)
_
=
_
x, y(x)
_
, con lo
que y(x) = y.
En otros terminos, si llamamos
S = {(x, y) D | f(x, y) = 0},
tenemos un conjunto denido por un sistema de m ecuaciones de clase C
k
, y
lo que arma el teorema anterior es que si un punto (x
0
, y
0
) S cumple la
hip otesis, entonces existe un entorno abierto de (x
0
, y
0
) en S (el conjunto SV ,
con la notaci on del teorema) que es la gr aca de una funci on de clase C
k
, la
funci on implcita denida por el sistema de ecuaciones (para una determinada
elecci on de variables).
A menudo sucede que no importa cu ales son concretamente las variables y
que se ponen en funci on de las variables x. En tal caso, observamos que la
condici on de que la matriz jacobiana Jf(p) contenga un determinante no nulo
(sin especicar cu al) equivale a que la matriz tenga rango m o, lo que es lo
mismo, a que la diferencial d
p
f : R
n+m
R
m
sea suprayectiva. Esto nos lleva
a la denici on siguiente:
Denici on 6.60 Sea f : D R
d
R
m
una funci on de clase C
k
en un abierto
D, donde d > m y sea S = {x D | f(x) = 0}. Diremos que un punto p S es
regular si d
p
f : R
d
R
m
es suprayectiva. Diremos que S es regular si lo es en
todos sus puntos.
Si p es regular en S, el teorema de la funci on implcita nos asegura que existe
un entorno de p en S que es la gr aca de una funci on de clase C
k
con n = md
variables.
212 Captulo 6. C alculo diferencial de varias variables
6.6 Optimizaci on clasica
Consideremos dos funciones f : D R
n
R, g : D R
n
R
m
y
un b R
m
. El problema de optimizaci on cl asica determinado por estos datos
consiste en encontrar los puntos donde la funci on objetivo f toma su valor
m aximo o mnimo sobre el conjunto de oportunidades
S = {x D | g(x) = b}.
A menudo se formula como
Opt. f(x)
s.a g
1
(x) = b
1
,

g
m
(x) = b
m
,
(lease optimizar la funci on f(x) sujeta a las restricciones g
i
(x) = b
i
).
Usamos la palabra optimo para referirnos a m aximos y mnimos indistinta-
mente. Cuando, especcamente, se busca el m aximo o el mnimo de la funci on
objetivo, se habla de maximizar o minimizar f(x), respectivamente.
Vamos a dar condiciones necesarias que un punto x D sea un optimo de f
sobre S. En general, las condiciones no ser an sucientes, ya que, por ejemplo,
las cumplir a cualquier punto que sea meramente un optimo local, en el sentido
que denimos a continuaci on:
Denici on 6.61 Si f : M R es una funci on est andar denida sobre un
espacio metrico M, diremos que f tiene un m aximo local (resp. un mnimo
local) en un punto est andar p M si f(p) f(x) (resp. f(p) f(x)) para todo
x M tal que x p.
Obviamente, si f alcanza en M un valor m aximo o mnimo (global), este
ser a en particular un m aximo o mnimo local.
Es inmediato que si M es un abierto en R
n
y f es derivable, una condici on
necesaria para que f pueda tener un extremo local en p es que f(p) = 0, ya
que si, por ejemplo,
f
x
i

p
> 0,
tomando un innitesimo h > 0, el punto x = (p
1
, . . . , p
i
+ h, . . . , p
n
) M
cumplira x p y f(x) > f(p), luego f no tendra un m aximo local en p, y
el punto x
0
= (p
1
, . . . , p
i
h, . . . , p
n
) M cumplira x
0
M y f(x
0
) < f(p),
luego f tampoco tendra un mnimo local en p. Si la derivada fuera negativa se
invertiran las desigualdades, pero la conclusi on es la misma.
El teorema de la funci on implcita nos permite generalizar esta condici on
necesaria al caso en que M es un conjunto denido por una o varias restricciones:
6.6. Optimizaci on cl asica 213
Teorema 6.62 Sea g : D R
d
R
m
una funci on de clase C
1
en un abierto
D, donde d > m, sea S = {x D | g(x) = 0}, sea p D un punto regular y sea
f : S R una funci on de clase C
1
. Entonces, si f tiene un optimo local en
el punto p, existe un R
m
tal que
f(p) =
1
g
1
(p) + +
m
g
m
(p).
Demostraci on: Como p es regular, existe una funci on y : U R
m
de
clase C
1
y un abierto V D, de modo que p = (x
0
, y
0
) V , x
0
U, y
0
= y(x
0
)
y
S V = {(x, y) R
n+m
| x U, y = y(x)}.
Si x x
0
, entonces x U, luego (x, y(x)) S, (x, y(x)) (x
0
, y
0
) = p,
luego f(x, y(x)) f(p) = f(x
0
, y(x
0
)) (si es que f tiene un m aximo local en
p) o f(x, y(x)) f(p) = f(x
0
, y(x
0
)) (si es que f tiene un mnimo local en p).
En cualquiera de los dos casos, vemos que la funci on f(x, y(x)) tiene un optimo
local en x
0
, luego, por la discusi on previa al teorema, sus derivadas son nulas.
Las calculamos con la regla de la cadena:
f
x
i

p
+
m

j=1
f
y
j

p
dy
j
dx
i

x
0
= 0, i = 1, . . . , n.
Equivalentemente, f(p) es soluci on del sistema n de ecuaciones lineales con
m+n inc ognitas cuya matriz es

I
n
dy
j
dx
i

x
0
_
.
Como la matriz tiene rango n, sus soluciones forman un subespacio vectorial
de R
n+m
de dimensi on m. Por otra parte, todo x U cumple g(x, y(x)) = 0.
Derivando esta igualdad con la regla de la cadena obtenemos
g
k
x
i

p
+
m

j=1
g
k
y
j

p
dy
j
dx
i

x
0
= 0, i = 1, . . . , n, k = 1, . . . , m.
Equivalentemente los vectores g
k
(p) tambien son soluciones del mismo sis-
tema de ecuaciones que f(p), pero la regularidad de p equivale a que estos m
vectores son linealmente independientes, luego forman una base del espacio de
soluciones del sistema de ecuaciones, por lo que f(p) ha de ser combinaci on
lineal de ellos, tal y como indica el enunciado.
En la pr actica, la condici on del teorema anterior puede aplicarse a un pro-
blema de optimizaci on cl asica
Opt. f(x)
s.a g
1
(x) = b
1
,

g
m
(x) = b
m
,
214 Captulo 6. C alculo diferencial de varias variables
tomando como funci on g(x) la que tiene por funciones coordenadas las funciones
g
j
(x) b
j
. A menudo es util reformularla en terminos de la llamada funci on
lagrangiana del problema, denida como
L(x, ) = f(x) +
m

j=1

j
(b
j
g
j
(x)).
Un punto crtico del problema es un punto p D para el que existe un vector
R
m
que cumpla las condiciones de Lagrange:
L(p, ) = 0.
Decimos condiciones, en plural, porque habitualmente se expresan en
terminos de las derivadas parciales de la funci on lagrangiana. Observemos que
las condiciones
L

(p,)
= 0, j = 1, . . . , m,
equivalen a b
j
g
j
(p) = 0, es decir, a que p pertenezca al conjunto de oportu-
nidades, mientras que las condiciones
L
x
i

(p,)
= 0, i = 1, . . . , n
equivalen a que f(p) sea combinaci on lineal de los vectores g
j
(p) (con coe-
cientes
j
). As pues, el teorema anterior puede enunciarse como sigue:
Teorema 6.63 (Condiciones necesarias de Lagrange) Dado un problema
de optimizaci on cl asica denido por funciones de clase C
1
, si p es un punto
regular de su conjunto de oportunidades y es un extremo local del problema,
entonces es un punto crtico, es decir, satisface las condiciones de Lagrange.
Alternativamente, si tenemos un problema de optimizaci on cl asica cuyo con-
junto de oportunidades es regular, entonces sus extremos locales son necesaria-
mente puntos crticos del problema.
Ejemplo Determinar las dimensiones que ha de tener una caja (sin tapa)
para que tenga el volumen m aximo de entre todas las posibles con una misma
supercie dada.
x
z
y
Llamemos x, y, z a las dimensiones de la caja, de modo
que su volumen ser a xyz y su supercie xy+2xz +2yz. El
problema que queremos resolver es maximizar el volumen
sujeto a que la supercie sea igual a un valor jo S, es
decir:
Max. xyz
s.a xy + 2xz + 2yz = S.
6.6. Optimizaci on cl asica 215
Consideramos las funciones denidas en D = ]0, +[ ]0, +[ ]0, +[. El
conjunto de oportunidades es regular, pues el gradiente de la restricci on es
g = (y + 2z, x + 2z, 2x + 2y),
que no se anula en ning un punto de D. Por lo tanto, las dimensiones que
maximizan el volumen han de ser un punto crtico del problema. La funci on
lagrangiana es
L(x, y, z, ) = xyz +(S xy 2xz 2yz),
luego las condiciones de Lagrange son:
L
x
= yz (y + 2z) = 0
L
y
= xz (x + 2z) = 0,
L
z
= xy 2(x +y) = 0
L

= S xy 2xz 2yz = 0.
De las dos primeras ecuaciones obtenemos:
=
yz
y + 2z
=
xz
x + 2z
,
de donde xyz +2yz
2
= xyz +2xz
2
, luego x = y. Similarmente, de la primera y
la tercera deducimos
=
yz
y + 2z
=
xy
2x + 2y
,
luego 2xyz + 2y
2
z = xy
2
+ 2xyz, luego x = 2z. Con esto, la ultima ecuaci on se
reduce a 12z
2
= S, luego las dimensiones de la caja resultan ser:
(x, y, z) =

_
S
3
,
_
S
3
,
1
2
_
S
3
_
.
En esencia: La caja ha de tener base cuadrada y altura igual a la mitad del
lado de la base.
Observemos que, por el planteamiento del problema, es evidente que ha de
haber una caja de volumen m aximo, luego este m aximo ha de ser el punto crtico
que hemos obtenido. No obstante, vamos a justicar formalmente que el punto
es un m aximo. Para ello consideramos el conjunto
S = {(x, y, z) R
3
| xy + 2xz + 2yz = S, x 0, y 0, z 0}.
Claramente es compacto, luego la funci on continua f(x, y, z) = xyz debe
alcanzar su valor m aximo en un punto p de este conjunto, y dicho m aximo no
puede tener ninguna coordenada nula, pues en tal caso f(p) = 0 y hay puntos de
S donde f es positiva. As pues, p S D, que es el conjunto de oportunidades
del problema que hemos resuelto, luego ha de ser un m aximo local de f en SD,
luego ha de ser el punto crtico que hemos encontrado.
216 Captulo 6. C alculo diferencial de varias variables
Ejemplo La luz se mueve a una velocidad distinta a traves de cada sustancia
que atraviesa. La lnea horizontal de la gura representa la frontera entre dos
sustancias, de modo que la luz se mueve a una velocidad v
1
en la primera y a
una velocidad v
2
en la segunda.
P
d
a

2
b
Q
Un rayo de luz se mueve desde P hasta Q. Al
pasar de una sustancia a otra se desva por refracci on.
Llamamos
1
al angulo de incidencia (el angulo que
forma el rayo incidente con la vertical) y
2
al angulo
de refracci on (el angulo que forma el angulo refractado
con la vertical). Deducir la relaci on
sen
1
v
1
=
sen
2
v
2
a partir del principio seg un el cual la luz viaja de P a Q por el camino que
minimiza el tiempo necesario para ello.
La distancia desde P hasta el punto donde se produce la refracci on es
a/ cos
1
, y la distancia de este a Q es b/ cos
2
, luego el tiempo que tarda
la luz en llegar desde P hasta Q es
a
v
1
cos
1
+
b
v
2
cos
2
.
Para que los angulos
1
y
2
lleven desde P hasta Q hay que exigir que
a tan
1
+ b tan
2
= d. Por lo tanto, el camino que minimiza el tiempo es
soluci on del problema:
Min.
a
v
1
cos
1
+
b
v
2
cos
2
s.a a tan
1
+b tan
2
= d,
donde consideramos las funciones denidas en ]0, /2[ ]0, /2[. El conjunto de
oportunidades es regular, pues el gradiente de la restricci on es
_
a
cos
2

1
,
b
cos
2

,
que no se anula en ning un punto. La funci on lagrangiana es
L(
1
,
2
, ) =
a
v
1
cos
1
+
b
v
2
cos
2
+(d a tan
1
b tan
2
).
Las condiciones de Lagrange son:
L

1
=
a sen
1
v
1
cos
2

a
cos
2

1
= 0,
L

2
=
b sen
2
v
2
cos
2

b
cos
2

2
= 0,
L

= d a tan
1
b tan
2
= 0.
6.6. Optimizaci on cl asica 217
Las dos primeras ecuaciones nos dan
sen
1
v
1
= =
sen
2
v
2
,
como haba que probar.
Captulo VII
Calculo integral de varias
variables
C
f(x, y)
En este captulo deniremos la integral de una
funci on de varias variables, cuya interpretaci on es
an aloga a la que ya conocemos para funciones de
una variable. Por ejemplo, si f(x, y) es una funci on
de dos variables cuya gr aca es la que muestra la
gura y C es el crculo (contenido en su dominio)
tambien representado en la gura, queremos denir
la integral
_
C
f(x, y) dxdy
de modo que sea igual al volumen comprendido entre el crculo y la gr aca (la
suma del volumen del cilindro y de la c upula que la gr aca forma sobre el).
7.1 Resultados basicos
La denici on de la integral de Riemann de una funci on de varias variables es
la generalizaci on obvia de la que hemos visto en el captulo IV para funciones de
una variable. La teora b asica es completamente an aloga, salvo que la notaci on
es un poco m as farragosa. En esta primera secci on expondremos esta teora
b asica que sigue de cerca los resultados del captulo IV, mientras que en las
secciones siguientes nos ocuparemos de los resultados especcos del c alculo
integral de varias variables.
En lugar de integrar funciones en intervalos, aqu vamos a integrar funciones
en cubos:
Un cubo en R
d
es un producto de intervalos
Q = [a
1
, b
1
] [a
d
, b
d
] R
d
.
219
220 Captulo 7. C alculo integral de varias variables
Su volumen es
v(Q) =
d

j=1
(b
j
a
j
).
Una partici on P de un cubo Q es una d-tupla P = (P
1
, . . . , P
d
), donde cada
P
j
= {a
j
= x
0j
< x
1j
< < x
n
j
,j
= b
j
}
es una partici on de [a
j
, b
j
]. El conjunto de los multindices asociados a P ser a
el conjunto
I
P
= {(i
1
, . . . , i
d
) N
d
| 1 i
j
n
j
para todo j = 1, . . . , d}.
Para cada i I
P
, denimos
Q
i
= [x
i
1
1,1
, x
i
1
,1
] [x
i
d
1,d
, x
i
d
,d
].
De este modo, la partici on P divide a Q en n
1
n
d
cubos Q
i
. Cada punto
de Q pertenece a lo sumo a 2
d
de los cubos Q
i
.
Si i I
P
, denimos x
ij
= x
i
j
,j
x
i
j1
,j
. Convenimos tambien que
x
i
= x
i1
x
id
= v(Q
i
).
La norma de la partici on P es el m aximo kPk de las longitudes x
ij
, para
i I
P
, j = 1, . . . , d. Una partici on es innitesimal si su norma es innitesimal.
Sea f : Q R una funci on acotada, es decir, (en caso de que sea est andar
est andar) tal que s olo toma valores nitos o (en general) tal que su imagen est a
contenida en un intervalo acotado [m, M].
Para cada i I
P
, podemos denir m
i
y M
i
como el nmo y el supremo,
respectivamente, de los valores que toma f sobre el cubo Q
i
.
Denimos las sumas de Riemann:
s(f, P) =

iI
P
m
i
x
i
, S(f, P) =

iI
P
M
i
x
i
.
Si P y P
0
son dos particiones de Q escribiremos P P
0
en el sentido de que,
para todo j = 1, . . . , d, se cumple que P P
0
.
Empezaremos generalizando el teorema 4.2:
Teorema 7.1 Sea f : Q R
d
R una funci on acotada sobre un cubo y sean
P P
0
dos particiones de Q. Sea r el n umero de puntos de las particiones de
P
0
que no est an en la partici on correspondiente de P. Entonces
s(f, P) s(f, P
0
) s(f, P) +KrkPk,
S(f, P) S(f, P
0
) S(f, P) KrkPk,
donde K es una constante que s olo depende de Q y de f.
7.1. Resultados b asicos 221
Demostraci on: Lo probamos por inducci on sobre r. Supongamos prime-
ramente que r = 1, es decir, que s olo una de las particiones P
0
j
diere de la
partici on correspondiente de P, y que diere en un unico punto. Por simplici-
dad supondremos que j = d, de modo que P
0
d
= P
d
{x} y, m as concretamente,
x
i
0
1,d
< x < x
i
0
d
.
Entonces, los cubos en que P divide a Q son los mismos determinados por
P
0
, salvo en el caso de los correspondientes a los multindices i I
P
tales que
i
d
= i
0
. Para estos multindices, el cubo Q
i
se corresponde con dos cubos de
P
0
, que, abandonando la notaci on est andar que hemos introducido, podemos
llamar Q
i
= Q
01
i
Q
02
i
, de modo que
Q
01
i
= [x
i
1
1,1
, x
i
1
,1
] [x
i
d1
1,d1
, x
i
d1
,1
] [x
i
d
1,d
, x],
Q
02
i
= [x
i
1
1,1
, x
i
1
,1
] [x
i
d1
1,d1
, x
i
d1
,1
] [x, x
i
d
,d
].
De este modo, s(f, P
0
) s(f, P) =
n
1

i
1
=1

n
d1

i
d1
=1
x
i1
x
i,d1
(m
1
i
(xx
i
0
1,d
)+m
2
i
(x
i
0
,d
x)m
i
(x
i
0
,d
x
i
0
1,d
)).
Como los cubos Q
0k
i
son menores, es claro que los nmos m
k
i
son mayores o
iguales que m
i
, luego
m
1
i
(x x
i
0
1,d
) +m
2
i
(x
i
0
,d
x) m
i
(x
i
0
,d
x
i
0
1,d
) 0,
de donde tambien s(f, P
0
) s(f, P) 0. Por otra parte,
m
1
i
(x x
i
0
1,d
) +m
2
i
(x
i
0
,d
x) m
i
(x
i
0
,d
x
i
0
1,d
) =
(m
1
i
m
i
)(x x
i
0
1,d
) + (m
2
i
m
i
)(x
i
0
,d
x) 2MkPk,
donde M es una cota de f en Q. Por lo tanto,
s(f, P
0
) s(f, P)
n
1

i
1
=1

n
d1

i
d1
=1
x
i1
x
i,d1
2MkPk
(b
1
a
1
) (b
d1
a
d1
)2MkPk KkPk,
donde
K = 2M
d

j=1
m ax{b
j
a
j
, 1}.
A partir de aqu, la conclusi on es identica a la del teorema 4.2.
La prueba de 4.3 es v alida sin cambio alguno, de modo que toda suma inferior
de f es menor o igual que toda suma superior de f (aunque las particiones sean
distintas).
Denici on 7.2 Sea f : Q R
d
R una funci on acotada en un cubo. De-
nimos la integral inferior y la integral superior de Darboux como

_
Q
f(x) dx = sup
P
s(f, P),
_
Q
f(x) dx =nf
P
S(f, P).
222 Captulo 7. C alculo integral de varias variables
Las integrales inferior y superior existen, porque el conjunto de las sumas
inferiores est a acotado superiormente por cualquier suma superior, y viceversa,
lo que implica tambien que

_
Q
f(x) dx
_
Q
f(x) dx.
El teorema siguiente se demuestra exactamente igual que 4.5:
Teorema 7.3 Sea f : Q R
d
R una funci on est andar acotada en un
cubo Q. Si P es una partici on innitesimal de Q, entonces
s(P, f)

_
Q
f(x) dx, S(P, f)
_
Q
f(x) dx.
Denici on 7.4 Una funci on f : Q R
d
R acotada en un cubo Q es
integrable (Riemann) si su integral inferior coincide con su integral superior,
en cuyo caso, a este valor com un se le llama integral (de Riemann) de f, y se
representa por
_
Q
f(x) dx =

_
Q
f(x) dx =
_
Q
f(x) dx.
Evidentemente:
Teorema 7.5 Sea f : Q R
d
R una funci on est andar acotada en un cubo
Q y sea P una partici on innitesimal de Q. Entonces, la funci on f es integrable
si y s olo si s(P, f) S(P, f), en cuyo caso, la integral es la parte est andar de
estas sumas.
Los resultados siguientes se prueban esencialmente igual que los vistos en el
captulo 4 para funciones de una variable:
Teorema 7.6 Si f y g son funciones integrables en un cubo Q y R, tambien
son integrables f +g, fg, f y |f|. Adem as:
_
Q
(f(x) +g(x)) dx =
_
Q
f(x) dx +
_
b
a
g(x) dx,
_
Q
f(x) dx =
_
Q
f(x) dx,

_
Q
f(x) dx

_
Q
|f(x)| dx.
Si f(x) g(x) para todo x [a, b], se cumple que
_
Q
f(x) dx
_
Q
g(x) dx.
7.2. Dominios de integraci on 223
Teorema 7.7 Sea f : Q R
d
R una funci on est andar integrable en un
cubo Q, sea P una partici on innitesimal y sea {y
i
}
iI
P
un conjunto de puntos
tales que y
i
Q
i
. Entonces
_
Q
f(x) dx

iI
P
f(y
i
)x
i
.
Tambien es f acil probar que toda funci on continua es integrable, pero vamos a
necesitar resultados m as nos, de los que nos ocuparemos en la secci on siguiente.
7.2 Dominios de integraci on
Hasta ahora hemos denido la integral de una funci on sobre un cubo, pero
esto no incluye, por ejemplo, el caso considerado al principio del captulo, en el
que habl abamos de la integral de una funci on f sobre un crculo. En realidad,
esto se reduce al caso que ya conocemos sin m as que considerar la funci on F que
coincide con f dentro del crculo y vale 0 fuera de el, pero el problema es que
F ya no es continua, aunque f lo sea, y por ello no nos basta con probar que
toda funci on continua es integrable. Necesitamos un criterio de integrabilidad
m as general.
Denici on 7.8 Sea f : D R
d
R una funci on acotada sobre un dominio
acotado D. Es claro entonces que existe un cubo Q tal que D Q R
d
.
Diremos que f es integrable Riemann (en D) si la funci on F : Q R dada
por
F(x) =

f(x) si x D,
0 si x Q\ D
es integrable Riemann (en Q), en cuyo caso denimos
_
D
f(x) dx =
_
Q
F(x) dx.
Es f acil ver que la integrabilidad de f y, en su caso, el valor de la integral,
no dependen de la elecci on del cubo Q. En efecto, si D Q
1
Q
2
, entonces
Q
1
Q
2
tambien es un cubo, luego basta ver que si D Q
1
Q
2
, entonces
D es integrable respecto a Q
1
si y s olo si lo es respecto de Q
2
. Ahora bien,
suponiendo los datos est andar y tomando una partici on innitesimal P de Q
1
,
podemos extenderla a una partici on innitesimal P
0
de Q
2
, y es claro que las
sumas de Riemann de las correspondientes funciones F
Q
1
y F
Q
2
son iguales.
Diremos que un conjunto acotado D R
d
es un dominio de integraci on si la
funci on constante igual a 1 es integrable en D. En tal caso, denimos el volumen
de D como
v(D) =
_
D
dx.
Es f acil ver que si D es un cubo, entonces el volumen as denido es el mismo
que ya tenamos denido antes.
224 Captulo 7. C alculo integral de varias variables
Diremos que un dominio de integraci on D es nulo
1
si v(D) = 0.
Conviene denir la funci on caracterstica de un conjunto D R
d
como la
funci on
D
: R
d
R dada por

D
(x) =
_
1 si x D,
0 si x / D.
En estos terminos, D es un dominio de integraci on si y s olo si
D
es integrable
en cualquier cubo que contenga a D.
El resultado fundamental sobre dominios de integraci on es el siguiente:
Teorema 7.9 Un conjunto acotado D R
d
es un dominio de integraci on si y
s olo si su frontera es nula.
Demostraci on: Podemos suponer los datos est andar. Tomemos un cubo
(est andar) tal que D Q R
d
. Podemos tomar el cubo sucientemente grande
como para que D

Q. Esto implica que la frontera de D en Q es la misma


que la frontera de D en R
d
.
Sea P una partici on innitesimal de Q.

Esta divide a Q en una familia nita
de cubos {Q
i
}
iI
P
. Sea I I
P
el conjunto de los multindices i I
P
tales que
Q
i
D 6= .
Observemos que Q =

D D Q \ D luego, si i I
P
\ I, tenemos que
Q
i
= (Q
i

D)(Q
i
\D) y ambos conjuntos son abiertos disjuntos en Q
i
. Como
los cubos son conexos, o bien Q
i

D D, o bien Q
i
Q \ D Q \ D. En
ambos casos, la funci on
D
es constante en Q
i
, luego m
i
= M
i
. Por consiguiente,
S(
D
, P) s(
D
, P) =

iI
(M
i
m
i
)x
i
.
Si x D, entonces existe un i I tal que x Q
i
D. Supongamos que
Q
i
D. En tal caso, x Q
i
, ya que si Q
i
fuera un entorno de x, debera
cortar a Q\ D.
Notemos que la uni on de todos los cubos Q
i
que contienen a x forma un
cubo mayor que tiene a x en su interior. Por lo tanto, debe cortar a Q\ D. En
denitiva, existe otro cubo Q
i
0 que tambien contiene a x pero que corta a Q\D.
Similarmente, si hubieramos partido de que Q
i
Q \ D habramos llegado
igualmente a otro cubo Q
i
0 que tambien contendra a x pero cortando a D.
Sea I
0
I el conjunto de los multindices i
0
tales que Q
i
0 corta a D y a
Q\ D. Acabamos de probar que
D

iI
0
Q
i
.
1
Notemos que este concepto de conjunto nulo no coincide con el usual, en terminos de la
medida de Lebesgue. Por ejemplo, Q[0, 1] es un conjunto numerable que no es nulo en este
sentido, mientras que todo conjunto numerable es nulo para la medida de Lebesgue.
7.2. Dominios de integraci on 225
Para i I
0
, tenemos que M
i
m
i
= 1 0 = 1, luego
S(
D
, P) s(
D
, P)

iI
0
x
i
0.
Si D es un dominio de integraci on, el miembro izquierdo es innitesimal,
luego la suma intermedia tambien lo es. Ahora bien, todo i I corresponde a
un cubo Q
i
que toca a un cubo Q
i
0 con i
0
I
0
, y cada cubo toca exactamente a
3
d
1 cubos. Como la partici on P la hemos elegido arbitrariamente, podemos
suponer que todos los cubos Q
i
tienen el mismo volumen. As

iI
x
i
3
d

iI
0
x
i
0.
Por lo tanto,
0 S(
D
, P) s(
D
, P)

iI
x
i
0,
lo que prueba que D es un dominio de integraci on. M as a un,
0 s(
D
, P)

iI
x
i
0,
luego D es nulo.
Recprocamente, si D es nula,

iI
x
i
= S(
D
, P) 0,
luego
S(
D
, P) s(
D
, P) =

iI
(M
i
m
i
)x
i


iI
x
i
0,
luego
D
es integrable.
Como consecuencia tenemos el unico criterio de integraci on que necesitare-
mos en la pr actica:
Teorema 7.10 Toda funci on continua y acotada sobre un dominio de inte-
graci on es integrable.
Demostraci on: Sea D R
d
un dominio de integraci on y f : D R una
funci on continua y acotada. Podemos suponer todos los datos est andar. Sea Q
un cubo est andar tal que D Q R
d
y sea F : Q R la extensi on de f a Q
que vale 0 en Q\ D. Sea P una partici on innitesimal de Q y sea I el conjunto
de los multindices i I
P
tales que Q
i
D 6= . Como D es nulo, tenemos
que

iI
x
i
= S(
D
, P) 0,
Fijado un n umero est andar > 0, el sumatorio es < , luego, por transferencia,
existe una partici on est andar P
0
de Q tal que, si I
0
es el conjunto an alogo a I
pero para P
0
, se cumple que

i
0
I
0
x
0
i
0 < .
226 Captulo 7. C alculo integral de varias variables
Ahora tomamos como partici on innitesimal P un renamiento de P
0
, de
modo que todo cubo Q
i
determinado por P est a contenido en un cubo de P
0
.
Sea D
0
D la uni on de todos los cubos Q
0
i
0 (respecto de P
0
) contenidos en
D. Se trata de un conjunto compacto est andar.
Si Q
i
es un cubo innitesimal determinado por P y Q
i
D 6= , entonces,
o bien Q
i
D
0
, o bien Q
i
est a contenido en uno de los cubos est andar determi-
nados por P
0
que corta a D. Llamemos I
1
e I
2
a los conjuntos de multindices
que est an en uno y otro caso, respectivamente.
Si i I
1
y x
1
, x
2
Q
i
son los puntos donde F toma su valor m aximo y
mnimo, por compacidad tenemos que

x
1
=

x
2
D
0
D, luego F es continua
en este punto, luego M
i
= F(x
1
) F(

x
1
) = F(

x
2
) F(x
2
) = m
i
. Sea
= mn
iI
1
(M
i
m
i
) 0.
Llamando M a una cota de F en D:
S(F, P) s(F, P) =

iI
1
(M
i
m
i
)x
i
+

iI
2
(M
i
m
i
)x
i

iI
1
x
i
+ 2M

i
0
I
0
x
0
i
0 < v(Q) + 2M < (2M + 1).
As, para todo > 0 est andar, hemos demostrado que existe una partici on
P tal que S(F, P) s(F, P) < (2M + 1), luego, por transferencia, esto vale
tambien para 0, en cuyo caso tenemos que s(F, P) S(F, P), luego F es
integrable.
La parte delicada del problema es reconocer los dominios de integraci on. En
primer lugar probamos algunas propiedades generales:
Teorema 7.11 Si D
1
y D
2
son dominios de integraci on en R
d
, tambien lo son
D
1
D
2
, D
1
D
2
y D
1
\ D
2
.
Demostraci on: Basta observar que

D
1
D
2
=
D
1

D
2
,
D
1
\D
2
=
D
1
(1
D
2
),
D
1
D
2
=
D
2
+
D
1
\D
2
.
Teorema 7.12 Todo subconjunto de un conjunto nulo es nulo.
Demostraci on: Sea D
1
un conjunto nulo y D
2
D
1
. Podemos supo-
nerlos est andar. Sea Q un cubo tal que D
2
D
1
Q y sea P una partici on
innitesimal de Q. Entonces
0 s(
D
2
, P) S(
D
2
, P) S(
D
1
, P) 0,
luego D
2
es nulo.
7.2. Dominios de integraci on 227
Teorema 7.13 Sean D
1
, D
2
R
d
dos dominios de integraci on y consideremos
una funci on acotada f : D
1
D
2
R.
a) Si D
1
es nulo, entonces f es integrable en D
1
y
_
D
1
f(x) dx = 0.
b) Si D
1
D
2
y f es integrable en D
2
, tambien lo es en D
1
.
c) f es integrable en D
1
D
2
si y s olo si lo es en D
1
y en D
2
.
d) Si adem as D
1
D
2
es nulo, entonces
_
D
1
D
2
f(x) dx =
_
D
1
f(x) dx +
_
D
2
f(x) dx.
Demostraci on: Podemos suponer todos los datos est andar. Tomemos un
cubo est andar Q R
d
que contenga a todos los dominios considerados. No
perdemos generalidad si suponemos que la funci on f est a denida sobre todo Q
(extendiendola con el valor 0).
a) Sea P una partici on innitesimal de Q y sea M una cota est andar de f.
Entonces
0 s(f
D
1
, P) S(f
D
1
, P) MS(
D
1
, P) 0,
luego f
D
1
es integrable en Q, lo que equivale por denici on a que f es integrable
en D
1
, y la integral es nula.
b) Si f es integrable en D
2
, entonces f
D
2
es integrable en Q, luego
f
D
1
= (f
D
2
)
D
1
tambien es integrable en Q, luego f es integrable en D
1
.
c) Si f es integrable en D
1
D
2
, entonces es integrable en D
1
y D
2
por el
apartado anterior. Si f es integrable en D
1
y D
2
, entonces tambien es integrable
en D
2
\ D
1
por el apartado anterior y, como
f
D
1
D
2
= f
D
1
+f
D
2
\D
1
,
concluimos que f es integrable en D
1
D
2
.
d) Tenemos que
_
D
1
D
2
f(x) dx =
_
Q
(f
D
1
D
2
)(x) dx =
_
Q
(f
D
1
)(x) dx +
_
Q
(f
D
2
\D
1
)(x) dx.
Similarmente,
_
Q
(f
D
2
)(x) dx =
_
Q
(f
D
2
\D
1
)(x) dx +
_
Q
(f
D
1
D
2
)(x) dx,
228 Captulo 7. C alculo integral de varias variables
y la ultima integral es nula por a), luego
_
D
1
D
2
f(x) dx =
_
Q
(f
D
1
)(x) dx +
_
Q
(f
D
2
)(x) dx
=
_
D
1
f(x) dx +
_
D
2
f(x) dx.
De estas propiedades se deducen en particular propiedades an alogas sobre
vol umenes, como, por ejemplo, que si la intersecci on D
1
D
2
es nula, entonces
v(D
1
D
2
) = v(D
1
) +v(D
2
), etc.
Ejercicio: Probar que si D
1
y D
2
son dominios de integraci on, entonces
v(D
1
D
2
) = v(D
1
) +v(D
2
) v(D
1
D
2
).
Ahora podemos generalizar ligeramente el teorema 7.10:
Teorema 7.14 Sea D R
d
un dominio de integraci on y f : D R una
funci on acotada que sea continua en D salvo a lo sumo en un conjunto nulo de
puntos. Entonces f es integrable en D.
Demostraci on: Sea E D un conjunto nulo tal que f sea continua en
D\ E. Entonces f es integrable en E \ D por el teorema 7.10 y es integrable en
E por el teorema anterior, luego f es integrable en D, tambien por el teorema
anterior.
A veces es util la caracterizaci on siguiente de los conjuntos nulos:
Teorema 7.15 Un conjunto est andar acotado es nulo si y s olo si est a contenido
en un dominio de integraci on de volumen innitesimal.
Demostraci on: Supongamos que E D, donde E es un conjunto est andar
acotado y D es un dominio de integraci on de volumen innitesimal. Sea Q un
cubo est andar tal que E D Q y sea P una partici on innitesimal de P.
Fijado > 0 est andar, por transferencia existe un dominio de integraci on
est andar D

de modo que E D

Q y v(D

) < . Entonces
E

D
, luego
S(
E
, P) S(
D

, P) v(D

) < ,
luego
S(
E
, P) < ,
para todo > 0 est andar, luego S(
E
, P) 0, luego E es nulo.
Observemos que hasta ahora no tenemos ning un criterio pr actico para re-
conocer si un conjunto dado es un dominio de integraci on. Por ejemplo, no
sabemos si el crculo del ejemplo del principio del captulo lo es. (Sabemos que
la condici on necesaria y suciente es que la circunferencia sea nula.) Vamos a
ocuparnos de ello.
7.2. Dominios de integraci on 229
Teorema 7.16 Sea f : K R
m
R
d
una funci on de clase C
1
en un con-
junto compacto K (en el sentido de que es de clase C
1
en un abierto que contiene
a K). Entonces existe una constante C tal que, para todo x, y K,
d(f(x), f(y)) C d(x, y).
Demostraci on: Dados dos puntos x, y K, consideramos las funciones
g
i
: [0, 1] R dadas por g
i
(t) = f
i
(x +t(y x)), para i = 1, . . . , d.
Claramente es derivable en ]0, 1[ y continua en [0, 1], luego podemos aplicar
el teorema del valor medio, seg un el cual existe un n umero 0 < t
i
< 1 tal que
f
i
(y) f
i
(x) = f
0
(t
i
) =
m

j=1
f
i
x
j

c
i
(y
j
x
j
),
para cierto punto c
i
K. Como las derivadas parciales son continuas en K,
podemos encontrar una constante C
0
tal que

f
i
x
j

C
0
para todo x K. De este modo,
|f
i
(y) f
i
(x)|
m

j=1
C
0
(y
j
x
j
) mC
0
d(x, y),
luego
d(f(x), f(y)) =

j=1
(f
i
(y) f
i
(x))
2

j=1
m
2
C
02
d(x, y)
2
= Cd(x, y),
donde la constante C no depende de x e y.
Ahora obtenemos un primer criterio pr actico para reconocer conjuntos nulos:
Teorema 7.17 Sea g : Q R
d1
R
d
una funci on de clase C
1
en un
cubo Q. Entonces g[Q] es un conjunto nulo.
Demostraci on: Es f acil denir una aplicaci on biyectiva [0, 1]
d1
Q de
clase C

(lineal, de hecho), luego podemos suponer que Q = [0, 1]


d1
. Divi-
damos el intervalo [0, 1] en n partes innitesimales iguales, lo que nos da una
partici on de Q en n
d1
cubos iguales de arista 1/n.
Sea R Q el conjunto de los (n + 1)
d1
vertices de los cubos Q
i
. Es f acil
ver que dos puntos cualesquiera de un cubo de arista 1/n distan a lo sumo

d 1/n. Por lo tanto, cada punto de Q dista a lo sumo



d 1/n de un
punto de R. Si C es la constante dada por el teorema anterior y llamamos
C
0
= C

d 1, tenemos que cada punto de g[Q] dista de un punto de R


0
= g[R]
en menos de C
0
/n.
230 Captulo 7. C alculo integral de varias variables
Para cada punto x R
0
, consideramos el cubo
Q
x
=
d

i=1
[x
i
C
0
/n, x
i
+C
0
/n],
que contiene a la bola abierta de centro x y radio C
0
/n, luego
g[Q]

xR
0
Q
x
= U.
El volumen de Q
x
es (2C
0
/n)
d
= C
00
/n
d
y hay a lo sumo (n+1)
d1
cubos. El
conjunto U es un dominio de integraci on, porque es una uni on nita de cubos, y
cada cubo lo es. En general, si D
1
y D
2
son dominios de integraci on, se cumple
que
_
D
1
D
2
dx =
_
D
1
dx +
_
D
2
\D
1
dx
_
D
1
dx +
_
D
2
dx,
luego, aplicando esto varias veces, vemos que
0
_
U
dx

xR
0
_
Q
x
dx = (n + 1)
d1
C
00
n
d

2
d1
C
00
n
0.
Fijemos un cubo Q
0
R
d
que contenga a U y a g[Q] (esto es posible porque
g[Q] es compacto, luego acotado) y sea P
0
una partici on innitesimal de Q
0
.
Entonces
0 s(
g[Q]
, P
0
) S(
g[Q]
, P
0
) S(
U
, P
0
)
_
U
dx 0,
luego g[Q] es nulo.
De aqu obtenemos una condici on sencilla:
Teorema 7.18 Si g : D R
d
R es una aplicaci on de clase C
1
en un
abierto D y el conjunto S = {x D | g(x) = 0} es regular, entonces todo
subconjunto compacto de S es nulo.
Demostraci on: Si p S, (reordenando las variables si es necesario) el
teorema de la funci on implcita nos da una funci on x
d
: U R
d1
R de
clase C
1
, donde U es abierto, y un abierto V R
d
tal que p V (podemos
suponer que V D), de modo que
V S = {x R
d
| (x
1
, . . . , x
d1
) U, x
d
= x
d
(x
1
, . . . , x
d1
)},
es decir, que V S es la gr aca de la funci on x
d
. Sea h : U R
d
la funci on
dada por
h(x
1
, . . . , x
d1
) = (x
1
, . . . , x
d1
, x
d
(x
1
, . . . , x
d1
)).
Claramente entonces, h es una funci on de clase C
1
y podemos verla tambien
como funci on continua h : U V S. Es biyectiva, y su inversa es la
7.3. C alculo de integrales 231
proyecci on sobre las primeras d 1 componentes, luego la inversa tambien es
continua. Sea p
0
= (p
1
, . . . , p
d1
) U. Podemos tomar un cubo tal que
p
0

Q Q U,
de modo que
p h[

Q] h[Q] S.
El conjunto V
p
= h[

Q] es abierto en S (porque la inversa de h es continua),
y es nulo porque est a contenido en h[Q], que es nulo por el teorema anterior.
Adem as p V
p
.
Consideremos ahora un subconjunto compacto C S y sea F C un
subconjunto nito que contenga a todos sus puntos est andar. Entonces
C =

pF
(C V
p
),
ya que si x C, por la compacidad sabemos que existe p =

x C, luego p F
y, como V
p
es abierto y x p V
p
, ha de ser x C V
p
.
Esto prueba que C es nulo, pues lo hemos expresado como uni on de un
n umero nito de conjuntos nulos.
Ejemplo Las esferas son conjuntos nulos, luego las bolas abiertas y cerradas
son conjuntos integrables.
En efecto, una esfera en R
d
es de la forma
S
r
(p) = {x R
d
| (x
1
p
1
)
2
+ + (x
d
p
d
)
2
= r
2
},
y es un conjunto regular, pues el gradiente de la funci on es
(2(x
1
p
1
), . . . , 2(x
d
p
d
)),
que no es identicamente nulo excepto en el punto x = p / S
r
(p). Como, adem as,
las esferas son compactas, son nulas por el teorema anterior, y las bolas son
integrables porque sus fronteras son esferas.
Observemos que hemos enunciado el teorema anterior para conjuntos deni-
dos por una sola ecuaci on. Si un conjunto est a denido por varias ecuaciones,
estar a contenido en los conjuntos que resultan de eliminarlas todas menos una, y
basta probar que uno cualquiera de ellos es nulo, lo que a menudo puede hacerse
con el teorema anterior.
7.3 Calculo de integrales
El resultado fundamental para calcular explcitamente integrales de funcio-
nes de varias variables es el teorema siguiente, que lo reduce al c alculo de in-
tegrales sucesivas de funciones de una variable. Para enunciarlo en general
232 Captulo 7. C alculo integral de varias variables
necesitamos contemplar una situaci on que no se presentar a habitualmente en la
pr actica, y es la necesidad de integrar una funci on que puede no estar denida
en un conjunto nulo.
Observemos que si D R
d
es un dominio de integraci on, E D es un
conjunto nulo y f : D \ E R es una funci on integrable en D \ E, entonces
cualquier extensi on de f a D ser a integrable en D (porque f|
E
ser a siempre
integrable con integral nula), y adem as
_
D
f(x) dx =
_
D\E
f(x) dx.
Esto signica que podemos denir la integral de f en D como la integral de
cualquier extensi on de f a D, sin que importe c omo la denimos en E. En otros
terminos: podemos hablar de la integral sobre D de una funci on denida en D
salvo a lo sumo en un conjunto nulo de puntos.
Teorema 7.19 Sean Q R
d
, Q
0
R
d
0
dos cubos y f : Q Q
0
R una
funci on integrable. Para cada x Q, llamemos f
x
: Q
0
R a la funci on dada
por f
x
(y) = f(x, y). Entonces, el conjunto
E = {x Q | f
x
no es integrable en Q
0
}
es nulo, la funci on
g(x) =
_
Q
0
f
x
(y) dy
es integrable en Q y
_
QQ
0
f(x, y) dxdy =
_
Q
__
Q
0
f
x
(y) dy

dx.
Demostraci on: Observemos ante todo que, de acuerdo con el enunciado,
la funci on g no est a denida sobre el conjunto E. De acuerdo con la observaci on
previa al teorema, podemos considerarla denida en E con el valor 0, aunque
esto es irrelevante.
Es claro que sendas particiones innitesimales P y P
0
de Q y Q
0
determinan
una partici on innitesimal P P
0
de Q Q
0
. Si i I
P
, j I
P
0 y c
i
Q
i
,
tenemos que
m
ij
(f) m
j
(f
c
i
) M
j
(f
c
i
) M
ij
(f).
Por lo tanto, jado i,

jI
P
0
m
ij
(f)y
j
s(f
c
i
, P
0
) S(f
c
i
, P
0
)

jI
P
0
M
ij
(f)y
j
,
luego

i,j
m
ij
(f)x
i
y
j

i
s(f
c
i
, P
0
)x
i

i
S(f
c
i
, P
0
)x
i

i,j
M
ij
(f)x
i
y
j
.
7.3. C alculo de integrales 233
Como f es integrable, esto implica que

iI
P
(S(f
c
i
, P
0
) s(f
c
i
, P
0
))x
i
0.
Llamemos I
0
= {i I
P
| E Q
i
6= }. Para cada i I
0
, tomemos
c
i
E Q
i
. Sea k = mn
iI
0
(S(f
c
i
, P
0
) s(f
c
i
, P
0
)) 6 0. Entonces
0 k

iI
0
x
i


iI
0
(S(f
c
i
, P
0
) s(f
c
i
, P
0
))x
i
0,
luego
S(
E
, P) =

iI
0
x
i
0,
lo que prueba que E es nulo. Por otra parte,

iI
0
,jI
P
0
x
i
y
j
=

iI
0
x
i

jI
P
0
y
j
= v(Q
0
)

iI
0
x
i
0,
con lo que E Q
0
tambien es nulo.
Podemos modicar f en EQ
0
, asign andole el valor 0, sin que ello modique
su integrabilidad ni el valor de la integral. Equivalentemente, podemos suponer
que E = . Entonces,

jI
P
0
m
ij
(f)y
j

_
Q
0
f
c
i
(y) dy

jI
P
0
M
ij
(f)y
j
.
Como esto vale para todo c
i
Q
i
, resulta que

jI
P
0
m
ij
(f)y
j
m
i
(g) M
i
(g)

jI
P
0
M
ij
(f)y
j
,
luego

i,j
m
ij
(f)x
i
y
j
s(g, P) S(g, P)

i,j
M
ij
(f)x
i
y
j
.
La integrabilidad de f implica entonces que g tambien es integrable, as como
la igualdad de las integrales del enunciado.
Ejemplo Vamos a calcular el volumen de un cilindro cortado en bisel por un
plano. Supongamos, concretamente, que la base es un crculo de
radio 1 y que la m axima altura es tambien igual a 1. M as concre-
tamente, podemos tomar como base el crculo unitario
C = {(x, y) R
2
| x
2
+y
2
1},
de modo que la altura en cada punto (x, y) es f(x, y) = (x + 1)/2. Por consi-
guiente, el volumen que queremos calcular es
_
C
x + 1
2
dxdy.
234 Captulo 7. C alculo integral de varias variables
x

1x
2

1x
2
Consideramos C [1, 1]
2
. Para cada x [1, 1],
tenemos que
f
x
(y) =
_
_
_
x + 1
2
si

1 x
2
y

1 x
2
,
0 en otro caso.
Por consiguiente,
_
C
x + 1
2
dxdy =
1
2
_
1
1
_

1x
2

1x
2
(x + 1)dydx
1
2
_
1
1
[xy +y]

1x
2

1x
2
dx =
_
1
1
(x
_
1 x
2
+
_
1 x
2
) dx
=

1
2
(1 x
2
)
3/2

1
1
+
_
1
1
_
1 x
2
dx = /2,
ya que la ultima integral est a calculada en el ejemplo de la p agina 145.
Conviene destacar un caso particular del teorema 7.19:
Teorema 7.20 Sea [a, b] R un intervalo y Q R
d1
un cubo. Consideremos
un dominio de integraci on D [a, b] Q R
d
y, para cada x [a, b], sea
D
x
= {y Q | (x, y) D}. Entonces, el conjunto
E = {x [a, b] | Q
x
no es un dominio de integraci on}
es nulo y v(D) =
_
b
a
v(Q
x
) dx.
La prueba consiste simplemente en aplicar 7.19 a la funci on
D
.
Ejercicio: Deducir del teorema anterior la f ormula para el volumen de un s olido de
revoluci on que dedujimos en la p agina 150.
El teorema siguiente es un caso particular de 7.19, excepto por que propor-
ciona un criterio de integrabilidad:
Teorema 7.21 Sean f
i
: D
i
R
d
i
R, para i = 1, 2 funciones integrables
sobre dos dominios de integraci on D
1
y D
2
. Entonces D
1
D
2
es un dominio
de integraci on, la funci on f
1
f
2
: D
1
D
2
R dada por
(f
1
f
2
)(x
1
, x
2
) = f
1
(x
1
)f
2
(x
2
)
es integrable en D
1
D
2
y
_
D
1
D
2
(f
1
f
2
)(x) dx =
__
D
1
f
1
(x) dx
__
D
2
f
2
(x) dx

.
7.4. El teorema de la media 235
Demostraci on: Consideremos primero el caso en que D
1
y D
2
son cubos,
de modo que D
1
D
2
es tambien un cubo y, por lo tanto, un dominio de
integraci on.
Observemos que si Q
1
D
1
y Q
2
D
2
son cubos y M
i
es el supremo de f
i
en Q
i
, entonces el supremo de f
1
f
2
en Q
1
Q
2
es M
1
M
2
. En efecto, podemos
suponer que todos los datos son est andar y, entonces, si (x
1
, x
2
) Q
1
Q
2
,
tenemos que f
i
(x
i
) M
i
, luego (f
1
f
2
)(x
1
, x
2
) = f
1
(x
1
)f
2
(x
2
) M
1
M
2
.
Por otra parte, existe x
i
Q
i
tal que f
i
(x
i
) M
i
, luego (f
1
f
2
)(x
1
, x
2
) =
f
1
(x
1
)f
2
(x
2
) M
1
M
2
. Esto prueba que M
1
M
2
es el supremo de f
1
f
2
. Lo
mismo es v alido cambiando supremos por nmos.
Si P
i
es una partici on innitesimal de D
i
, entonces podemos formar una
partici on innitesimal P
1
P
2
de D
1
D
2
, de modo que, por lo que acabamos
de probar,
m
ij
(f
1
f
2
) = m
i
(f
1
)m
j
(f
2
), M
ij
(f
1
f
2
) = M
i
(f
1
)M
j
(f
2
).
Por consiguiente,
s(f
1
f
2
, P
1
P
2
) =

i,j
m
i
(f
1
)m
j
(f
2
)x
1,i
x
2,j
= s(f
1
, P
1
)s(f
2
, P
2
),
e igualmente S(f
1
f
2
, P
1
P
2
) = S(f
1
, P
1
)S(f
2
, P
2
). La integrabilidad de las
funciones f
i
equivale a que s(f
i
, P
i
) S(f
i
, P
i
), de donde se sigue que
s(f
1
f
2
, P
1
P
2
) S(f
1
f
2
, P
1
P
2
),
y, por consiguiente, f
1
f
2
es integrable. La f ormula para la integral es inme-
diata.
Consideremos ahora el caso en que D
1
y D
2
son dominios de integraci on
arbitrarios. Tomemos cubos D
i
Q
i
. Basta observar que

D
1
D
2
=
D
1

D
2
,
con lo que la parte ya probada nos da que D
1
D
2
es un dominio de integraci on.
Similarmente, la extensi on de f
1
f
2
a Q
1
Q
2
con el valor 0 fuera de D
1
D
2
es el producto de las extensiones correspondientes, luego es integrable por la
parte ya probada.
En particular, el teorema anterior implica que si D
1
y D
2
son dominios de
integraci on, entonces v(D
1
D
2
) = v(D
1
)v(D
2
).
7.4 El teorema de la media
Demostramos aqu una propiedad de la integral de Riemann que necesitare-
mos m as adelante. En primer lugar, un hecho elemental:
Teorema 7.22 Sea f : D R una funci on continua sobre un dominio de
integraci on D. Si f 0 y
_
D
f(x) dx = 0, entonces f = 0.
236 Captulo 7. C alculo integral de varias variables
Demostraci on: Podemos suponer todos los datos est andar. Supongamos
que f 6= 0, es decir, que existe un punto (est andar) x
0
D tal que f(x
0
) > 0.
Si P es una partici on innitesimal de un cubo que contenga a D, entonces x
0
pertenecer a a uno de los cubos Q
i
determinados por la partici on y, para cada
x Q
i
, tenemos que f(x) f(x
0
) > 0, luego m
i
> 0. Por lo tanto,
0 < m
i
x
i
s(f, P)
_
D
f(x) dx,
contradicci on.
Teorema 7.23 (Teorema de la media) Sea f : D R
d
R una funci on
integrable sobre un dominio de integraci on no nulo D. Sean m y M el nmo y
el supremo de f en D, respectivamente. Entonces
m
_
D
f(x) dx
v(D)
M.
El cociente se llama valor medio de f en D. Si D es conexo y f es continua en
D, entonces existe un x D tal que
_
D
f(x) dx
v(D)
= f(x).
Demostraci on: Como m f(x) M, para todo x D, es claro que
mv(D) =
_
D
mdx
_
D
f(x) dx
_
D
M dx = M v(D),
de donde se sigue la primera parte del enunciado. Bajo las hip otesis adicionales
de la segunda parte, tenemos que ]m, M[ f[D] [m, M]. El unico caso en el
que la conclusi on no est a clara es si el valor medio de f coincide con m o con
M. Supongamos que coincide con M, es decir, que
_
D
f(x) dx = M
_
D
dx.
Entonces
_
D
(M f(x)) dx = 0 y el integrando M f 0 es una funci on
continua. Por el teorema anterior, f es constante igual a M, luego cualquier
x D cumple el teorema. Si el valor medio es m se razona an alogamente.
Demostramos ahora que el teorema de la media, junto con otras propiedades
elementales, caracteriza las integrales de una funci on continua:
Teorema 7.24 Sea D
0
R
d
un dominio de integraci on, sea f : D
0
R una
funci on continua y acotada en D
0
y sea I una funci on con valores en R denida
sobre el conjunto de todos los dominios de integraci on D D
0
que cumpla las
propiedades siguientes:
a) Si D D
0
es nulo, entonces I(D D
0
) = I(D) +I(D
0
).
7.4. El teorema de la media 237
b) Existe una constante M tal que, para todo dominio de integraci on D D
0
,
se cumple que
|I(D)| Mv(D)
c) Si Q D
0
es un cubo innitesimal, existe un x Q tal que
I(Q)
v(Q)
f(x).
Entonces, para todo dominio de integraci on D D
0
, se cumple que
I(D) =
_
D
f(x) dx.
Demostraci on: Podemos suponer que todos los datos son est andar. To-
memos un cubo Q que contenga a D
0
y tomemos una partici on innitesimal P
de Q. Para cada cubo innitesimal Q
i
D, tenemos que existe un x
i
Q
i
tal
que
I(Q
i
)
x
i
f(x
i
).
Por consiguiente, para cualquier > 0 est andar,
I(Q
i
) x
i
< f(x
i
)x
i
< I(Q
i
) +x
i
.
Sumando para todos los cubos contenidos en D, obtenemos que
I(K)

i
x
i
<

i
f(x
i
)x
i
< I(K) +

i
x
i
,
donde K Q
i
es la uni on de los cubos Q
i
D. Ahora observamos que D \ K
est a contenido en la uni on de los cubos tales que Q
i
D 6= , pero esta uni on
tiene volumen innitesimal, porque D es nulo, luego
I(D \ K) Mv(D \ K) 0,
luego I(D) = I(K) + I(D \ K) I(K). Teniendo en cuenta tambien 7.7, las
desigualdades anteriores nos dan que
I(D) v(D)
_
D
f(x) dx I(D) +v(D),
luego

I(D)
_
D
f(x) dx

v(D) v(D
0
).
Como esto es v alido para todo > 0 est andar, tambien vale si 0, y
entonces implica que
I(D) =
_
D
f(x) dx.
238 Captulo 7. C alculo integral de varias variables
7.5 El teorema de cambio de variable
En esta secci on demostraremos la versi on para funciones de varias variables
del teorema 4.15. Primeramente necesitamos algunas propiedades sencillas de
los vol umenes. La primera es que son invariantes por traslaciones:
Teorema 7.25 Sea v R
d
y consideremos la traslaci on f : R
d
R
d
dada
por f(x) = v +x. Si D R
d
es un dominio de integraci on, tambien lo es f[D],
y adem as v(f[D]) = v(D).
Demostraci on: Podemos suponer que todos los datos son est andar. To-
memos un cubo D Q. Entonces f[Q] es un cubo que contiene a f[D]. Es claro
que una partici on innitesimal P de Q se traslada a una partici on innitesimal
P
0
= f[P] de f[Q], con el mismo conjunto de multindices I
P
= I
P
0 . Adem as,
los vol umenes de los cubos correspondientes son iguales:
x
0
i
= (v
1
+x
i
1
,1
v
1
x
i
1
1,1
) (v
d
+x
i
d
,d
v
d
x
i
d
1,d
) = x
i
.
Por ultimo, un cubo Q
i
corta a D (o est a contenido en D) si y s olo si
f[Q
i
] = f[Q]
i
corta a f[D] (o est a contenido en f[D]). Esto quiere decir que
m
i
(
D
) = m
i
(
f[D]
), M
i
(
D
) = M
i
(
f[D]
). Por lo tanto,
s(f[
D
], f[P]) =

i
m
i
(
f[D]
)x
0
i
=

i
m
i
(
D
)x
i
= s(
D
, P).
Lo mismo sucede con las sumas superiores, luego
D
es integrable si y s olo
si lo es
f[D]
, y en tal caso las integrales coinciden.
Ahora mostramos el efecto sobre el volumen de las homotecias:
Teorema 7.26 Sea r > 0 y consideremos la homotecia f : R
d
R
d
dada por
f(x) = rx. Si D R
d
es un dominio de integraci on, tambien lo es rD = f[D],
y adem as v(rD) = r
d
v(D).
Demostraci on: La prueba es identica a la del teorema anterior, salvo que
ahora no es cierto que los cubos de la partici on P tengan el mismo volumen que
los de P
0
, sino que
x
0
i
= (rx
i
1
,1
rx
i
1
1,1
) (rx
i
d
,d
rx
i
d
1,d
) = r
d
x
i
.
D
h
Ejemplo Consideremos un dominio de integraci on arbitra-
rio D R
2
y sea C un cono arbitrario de base D y altura
h, tal y como el que muestra la gura. Vamos a probar que
su volumen es v(D) =
1
3
v(D)h.
Por comodidad podemos situarlo de forma que el vertice sea el punto (0, 0, 0)
y la base este en el plano z = h. De este modo, si 0 < z < h, es f acil ver que
7.5. El teorema de cambio de variable 239
(x, y) C
z
si y s olo (x, y, z) C si y s olo si (hx/z, hy/z, h) C, si y s olo si
(hx/z, hy/z) D, si y s olo si (x, y) (z/h)D.
As pues, C
z
= (z/h)D, y el teorema anterior nos da que
v(C
z
) =
z
2
h
2
v(D).
Aplicando 7.20 concluimos que
v(C) =
_
h
0
v(C
z
) dz =
_
h
0
z
2
h
2
v(D) dz =
v(D)
h
2
_
h
0
z
2
dz
=
v(D)
h
2
h
3
3
=
1
3
f(D)h.
Consideremos ahora una aplicaci on lineal biyectiva : R
d
R
d
. Obser-
vemos que si Q R
d
es un cubo, entonces [Q] es un dominio de integraci on.
En efecto, es un homeomorsmo, luego [Q] = [Q]. La frontera de Q es
la uni on de 2d cubos de dimensi on d 1 o, con m as precisi on, es la uni on de
las im agenes de 2d cubos en R
d1
por aplicaciones de clase C
1
(composiciones
de traslaciones y aplicaciones lineales). Por consiguiente, la frontera de [Q]
tambien es uni on de las im agenes de 2d cubos en R
d1
por aplicaciones de clase
C
1
(las que recorren la frontera de Q compuestas con ), luego [Q] es nulo
por el teorema 7.17.
Llamemos V al volumen de la imagen por del cubo unitario Q
1
= [0, 1]
d
y
sea Q = [a
1
, a
1
+r] [a
d
, a
d
+r] un cubo arbitrario de arista r > 0. Vamos
a calcular el volumen de [Q]. Para ello observamos que, si A es la matriz de
, entonces
(x) = xA = r((r
1
(x a))A) +aA.
Esto signica que se puede expresar como composici on de las aplicaciones
siguientes:
la traslaci on x 7x a (que transforma Q en el cubo [0, r]
d
),
la homotecia x 7r
1
x (que transforma [0, r]
d
en Q
1
),
(que transforma Q
1
en [Q
1
], de volumen V ),
la homotecia x 7rx (que transforma [Q
1
] en un dominio de integraci on
de volumen r
d
V ),
la traslaci on x 7x +aA (que transforma el dominio anterior en [Q] sin
alterar el volumen).
As pues, v([Q]) = r
d
V = V v(Q).
Ahora vamos a probar que si D R
d
es un dominio de integraci on, entonces
[D] tambien lo es, y v([D]) = V v(D). Lo tenemos probado cuando D es un
cubo de arista r.
240 Captulo 7. C alculo integral de varias variables
Fijemos un cubo que contenga a D de la forma Q = [a, b]
d
. As una par-
tici on de [a, b] en intervalos innitesimales de la misma longitud determina una
partici on innitesimal P de Q cuyos cubos Q
i
tienen todos una misma arista r,
por lo que sabemos que [Q
i
] tiene volumen V r
d
.
Llamamos I al conjunto de los multindices i I
P
tales que Q
i
D 6= .
Como D es nulo, sabemos que el conjunto
U =

iI
Q
i
tiene volumen
v(U) =

iI
x
i
0.
Como es un homeomorsmo,
[D] = [D] [U] =

iI
[Q
i
],
y
v([U]) =

iI
v([Q
i
]) = V

iI
x
i
0.
Por el teorema 7.15, concluimos que la frontera [D] es nula, luego [D] es
un dominio de integraci on.
Sea J
1
el conjunto de los multindices tales que Q
i
D y sea J
2
el conjunto
de los multindices tales que Q
i
D 6= . De este modo,

iJ
1
Q
i
D

iJ
2
Q
i
,
luego

iJ
1
[Q
i
] [D]

iJ
2
[Q
i
].
Ahora bien,
v


iJ
1
Q
i
_
= s(
D
, P) S(
D
, P) = v


iJ
2
Q
i
_
y
v


iJ
1
[Q
i
]
_
= V s(
D
, P) V S(
D
, P) = v


iJ
2
[Q
i
]
_
v


iJ
1
[Q
i
]
_
v([D]) v


iJ
2
[Q
i
]
_
,
de donde se concluye que
v([D]) V s(
D
, P) = V v(D),
luego v([D]) = V v(D).
El teorema siguiente contiene lo que acabamos de demostrar y un poco m as:
7.5. El teorema de cambio de variable 241
Teorema 7.27 Sea : R
d
R
d
una aplicaci on lineal de determinante .
Para todo dominio de integraci on D R
d
, se cumple que [D] es un dominio
de integraci on, y v([D]) = ||v(D).
Demostraci on: Recordemos que el determinante de una aplicaci on lineal
es el determinante de su matriz en cualquier base. Si no es biyectiva, el
teorema es trivial, ya que, por una parte, = 0 y, por otra parte, [D] est a
contenido en un subespacio vectorial de R
n
de dimensi on menor que d, luego
est a contenido en un conjunto de la forma
S = {x R
d
| a
1
x
1
+ +a
d
x
d
= 0},
luego v([D]) = 0 por el teorema 7.18.
Supongamos ahora que es biyectiva. Ya tenemos probado el teorema salvo
que falta por ver que la constante que relaciona los dos vol umenes es precisa-
mente ||. (Lo hemos probado con la constante V igual al volumen de la imagen
del cubo unitario.)
El algebra lineal demuestra que toda aplicaci on lineal biyectiva se puede
expresar como composici on de un n umero nito de aplicaciones lineales g de
uno de los tipos siguientes:
a) g permuta los vectores e
1
, . . . , e
d
de la base can onica de R
d
.
b) g(e
1
) = re
1
y g(e
i
) = e
i
para i > 1, donde r R es no nulo.
c) g(e
1
) = e
1
+e
2
y g(e
i
) = e
i
, para i > 1.
Por comodidad para el lector damos la prueba en un apendice al nal del
captulo. Teniendo en cuenta que el determinante de una composici on de apli-
caciones es el producto de los determinantes, basta probar el teorema en el
caso en que f sea de uno de los tres tipos anteriores. M as concretamente, si
Q = [0, 1]
d
, basta probar que, si f es de uno de los tres tipos anteriores, entonces
v[[Q]] = ||.
En el primer caso es f acil ver que || = 1 y que [Q] = Q, luego, ciertamente,
v([Q]) = v(Q) = 1 = ||. En el segundo caso, = r y
[Q] =

[0, r] [0, 1]
d
1
si r > 0,
[r, 0] [0, 1]
d1
si r < 0.
Por lo tanto, v([Q]) = |r| = ||.
e
1
e
2
e
1
+e
2
En el tercer caso = 1 y
[Q] = D[0, 1]
d2
,
donde D es el dominio de integraci on indicado en la gura. Es
f acil ver que v(D) = 1, bien por integraci on, bien observando
que D se descompone en uni on de dos tri angulos y que, trasla-
dando el superior (lo cual no modica el area) obtenemos el cuadrado [0, 1]
2
, que
tiene area igual a 1. El teorema 7.21 implica entonces que v([Q]) = 1 = ||.
242 Captulo 7. C alculo integral de varias variables
El teorema anterior nos da una interpretaci on geometrica del determinante
de una aplicaci on lineal (o, mejor dicho, de su valor absoluto): la aplicaci on
multiplica por || el volumen de cualquier dominio de integraci on. Ahora vamos
a extender este resultado a aplicaciones no necesariamente lineales. La clave
para ello es la posibilidad de aproximar una aplicaci on por su diferencial.
En el teorema siguiente consideramos un homeomorsmo f : U V de
clase C
1
entre dos abiertos de R
d
. Si p U es un punto est andar, podemos
considerar la diferencial d
p
f : R
d
R
d
, que es una aplicaci on lineal que
aproxima a f cerca de p. Si Q U es un cubo, entonces f[Q] y d
p
fQ] son
cubos deformados. Lo que vamos a probar es que si Q es innitesimal y est a
innitamente cerca de p, entonces f[Q] y df
p
[Q] son muy parecidos, no ya en
el sentido obvio de que ambos son innitesimales, sino, m as a un, porque si les
aplicamos una homotecia innita para volverlos apreciables, la diferencia entre
ambos sigue siendo inapreciable y, a su vez, esto implica que los vol umenes de
estas ampliaciones son indistinguibles.
En realidad, para que esto tenga sentido necesitamos suponer que todas las
aristas de Q tienen la misma longitud, ya que, en otro caso, una homotecia que
volviera apreciable una de ellas, podra hacer innita, o dejar innitesimal a
otra.
Teorema 7.28 Sea f : U V un homeomorsmo est andar de clase C
1
entre
dos abiertos U y V de R
d
. Sea p U un punto est andar, sea
Q = [a
1
, a
1
+r] [a
d
, a
d
+r] U
un cubo de arista innitesimal r tal que a p, sea = d
p
f y supongamos
adem as que es biyectiva. Entonces,
v(f[Q])
v([Q])
1.
Demostraci on: Ante todo, observemos que f[Q] es un dominio de inte-
graci on. En efecto, Q es la uni on de 2d im agenes de cubos de R
d1
por apli-
caciones de clase C
1
, luego lo mismo vale para f[Q] = f[Q]. El teorema 7.17
nos da entonces que la frontera f[Q] es nula, luego f[Q] es un dominio de
integraci on. Consideremos la aplicaci on

f(x) =
f(a +rx) f(a)
r
.
Est a denida en un abierto que contiene al cubo unitario Q
1
= [0, 1]
d
.
Cuando x recorre Q
1
, tenemos que a+rx recorre el cubo Q, luego

f[Q
1
] resulta
de aplicar a f[Q] la traslaci on x 7 x f(a) y luego la homotecia x 7 x/r.
Teniendo en cuenta los teoremas 7.25 y 7.26, concluimos que
v(

f[Q
1
]) = r
d
v(f[Q]).
Lo mismo es v alido para y la aplicaci on

(x) =
(a +rx) (a)
r
,
7.5. El teorema de cambio de variable 243
pero, como es lineal, resulta que

= . As pues,
v([Q
1
]) = r
d
v([Q]).
Por consiguiente, el teorema se reduce a probar que
v(

f[Q
1
])
v([Q
1
])
1.
Como v([Q
1
]) = || 6= 0, donde es el determinante de (que es est andar,
porque lo es), la relaci on anterior es equivalente a v(

f[Q
1
]) v([Q
1
]).
En terminos de la discusi on previa al teorema, tenemos que

f[Q
1
] y [Q
1
] son
el resultado de aplicar a f[Q] y [Q] una homotecia de centro a para hacerlos
apreciables y una traslaci on para que ambos tengan un vertice en el origen.
Ahora vamos a probar que estas ampliaciones son indistinguibles:
Como f es de clase C
1
, es estrictamente diferenciable en p. Si x Q
1
,
entonces rx 0, y la denici on de diferenciabilidad estricta nos da que
f(a +rx) f(a) (rx)
rkxk
0.
Equivalentemente:

f(x)
kxk

(x)
kxk
.
Esto implica que

f(x) (x). En otras palabras: cada punto de

f[Q
1
] est a
innitamente cerca de un punto de [Q
1
], y viceversa.
Ahora podemos hacer una simplicaci on: como
1
es continua en

(x), la
aproximaci on que hemos obtenido equivale a que
1
(

f(x)) x. Por otra parte,
en virtud del teorema anterior, la relaci on v(

f[Q
1
]) v([Q
1
]) que queremos
probar equivale a v(
1
[

f[Q
1
]]) v(Q
1
) = 1.
Por lo tanto, si llamamos g =

f
1
, tenemos que g es un homeomorsmo
denido sobre un abierto que contiene a Q
1
en otro abierto que contiene a
K = g[Q
1
], hemos probado que g(x) x para todo x Q
1
, y queremos probar
que v(K) 1.
Para ello vemos que si > 0 es est andar, entonces K Q
+

= ], 1 +[
d
,
ya que todo elemento de K es de la forma g(x) x Q
1
, y si no estuviera
en Q
+

estara a una distancia > de cualquier punto de Q


1
. Por lo tanto
v(K) v(Q
+

) = (1 + 2)
d
, de donde se sigue f acilmente que

v(K) 1.
La otra desigualdad ser a inmediata tambien si demostramos la inclusi on
Q

= [, 1 ]
d
K, pues entonces (1 2)
d
v(K) y esto implica que

v(K) 1.
A su vez, para probar la inclusi on basta probar que todo punto x Q
1
\ K
est a innitamente pr oximo a un punto de Q
1
, ya que entonces ning un punto
de Q

Q
1
podr a estar en Q
1
\ K.
244 Captulo 7. C alculo integral de varias variables
En efecto, tenemos que x g(x) K. El segmento S que une x y g(x) es
un espacio topol ogico conexo, pues es la imagen del intervalo (conexo) [0, 1] por
la aplicaci on continua u(t) = (1 t)x +tg(x).
La restricci on a S de
K
no puede ser continua, ya que, como
K
(x) = 0,

K
(g(x)) = 1, su imagen es el espacio disconexo {0, 1}, y la imagen de un
espacio conexo por una funci on continua ha de ser conexa.
As pues, existe un punto y S donde
K
es discontinua, y es f acil ver que
esto equivale a que y K. Como x g(x), tambien x y. Por otra parte,
como g es un homeomorsmo, K = g[Q
1
], luego y = g(z), con z Q
1
, y as
z y x.
En denitiva:

v(K) = 1 o, lo que es lo mismo v(K) 1.
Ahora ya podemos demostrar el teorema general:
Teorema 7.29 (Teorema de cambio de variable) Sea x : U V una
aplicaci on biyectiva de clase C
1
entre dos dominios de integraci on abiertos en
R
d
. Para cada t U, sea (t) el determinante de la matriz jacobiana (Jx)(t)
(que es una funci on continua en U). Supongamos que (t) no se anula y est a
acotado en U. Sea f : V R una funci on continua y acotada. Entonces
_
V
f(x) dx =
_
U
f(x(t))|(t)| dt.
Demostraci on: En primer lugar, observamos que, por el teorema de la
funci on inversa, la aplicaci on x
1
: V U tambien es de clase C
1
. Llamemos
a esta inversa t(x), de modo que, en cada punto x V , se cumple que d
x
t =
(d
t(x)
x)
1
y su determinante es (t(x))
1
.
Fijemos un > 0 est andar, sea Q
0
un cubo tal que U Q
0
R
d
y sea
P
0
una partici on innitesimal de Q
0
. Como la frontera U es nula, la suma
de los vol umenes de los cubos Q
i
que cortan a U es innitesimal, luego, en
particular, es < . Por transferencia, existe una partici on est andar P
0
0
con esta
misma propiedad. Sea K
0
la uni on de los cubos correspondientes a la partici on
P
0
0
contenidos en U. De este modo, K
0
U es un dominio de integraci on
compacto est andar tal que v(U \ K
0
) < .
Ahora tomamos un cubo Q = [a, b]
d
tal que V Q R
d
. Consideramos una
partici on de [a, b] en n segmentos iguales de longitud innitesimal r = (ba)/n,
la cual determina una partici on P de Q en cubos innitesimales de arista r.
Nuevamente, la suma de los vol umenes de los cubos Q
i
que cortan a V es
innitesimal (en particular < ), pero podemos decir m as: ninguno de ellos
corta a t[K
0
].
En efecto, si Q
i
corta a la vez a V y a x[K
0
], entonces existen x V ,
x
0
x[K
0
] tales que x x
0
. Como x[K
0
] es compacto, existe

x x[K
0
], luego,
cambiando x por

x, podemos suponer que x es est andar. Entonces, la relaci on
x x
0
implica que x est a en la clausura de V , que es el propio V , porque la
frontera es cerrada, pero esto es absurdo, porque x x[K
0
] U y U es abierto,
luego no contiene a los puntos de U.
7.5. El teorema de cambio de variable 245
Por transferencia, podemos encontrar un n umero natural est andar n
0
tal
que, si partimos [a, b] en n
0
intervalos de la misma longitud, la partici on corres-
pondiente P
0
de Q tiene la propiedad de que la suma de los vol umenes de los
cubos que cortan a V es menor que y ninguno de ellos corta a x[K
0
].
Llamemos K a la uni on de los cubos determinados por P
0
y que est an con-
tenidos en V . As, x[K
0
] K V , el conjunto K es un dominio de integraci on
compacto est andar y v(V \ K) < .
Como U \ t[K] U \ K
0
, tenemos tambien que v(U \ t[K]) < .
Ahora consideramos de nuevo una partici on innitesimal de [a, b] en n seg-
mentos de longitud r = (ba)/n, pero tomamos n m ultiplo de n
0
, de modo que,
si consideramos la partici on P de Q y llamamos I al conjunto de los multindices
i I
P
tales que Q
i
K, tenemos que
K =

iI
Q
i
.
Si i I y Q
i
= [a
1
, a
1
+ r] [a
d
, a
d
+ r], entonces a K, luego
p =

a K V , porque K es compacto, luego podemos aplicar el teorema
anterior, en virtud del cual
v(t[Q
i
])
v(d
p
t[Q
i
])
=
|(t(p))|v(t[Q
i
])
v(Q
i
)
1.
En particular, tenemos que t[Q
i
] es un dominio de integraci on. El teorema
de la media nos da que
_
t[Q
i
]
f(x(t))|(t)| dt
v(t[Q
i
])
= f(x(t
i
))|(t
0
)|,
para un cierto t
i
t[Q
i
], que ser a de la forma t
i
= t(x
i
), con x
i
Q
i
.
Como x
i
p, tambien t(x
i
) t(p), luego |(t
i
)| |(t(p))|, y, como
(t(p)) es est andar,
|(t
i
)|
|(t(p))|
1.
A partir de aqu vamos a seguir de cerca el razonamiento que hemos empleado
en la prueba del teorema 7.24. Para cada dominio de integraci on D V ,
denimos
I(D) =
_
t[D]
f(x(t))|(t)| dt.
Para que I(D) este bien denido es necesario que t[D] sea un dominio de
integraci on. Hemos visto que I(Q
i
) est a bien denido, y adem as
I(Q
i
)
v(t[Q
i
])
= f(x(t
i
))|(t
i
)|,
luego
|(t(p))|v(t[Q
i
])
v(Q
i
)
|(t
i
)|
|(t(p))|
I(Q
i
)
v(t[Q
i
])
f(x(t
i
))|(t
i
)|,
246 Captulo 7. C alculo integral de varias variables
o, equivalentemente,
I(Q
i
)
x
i
f(x
i
),
para cierto x
i
Q
i
.
Razonando como en 7.24, tenemos que
I(Q
i
) x
i
< f(x
i
)x
i
< I(Q
i
) +x
i
,
de donde, sumando para i I, obtenemos que
I(K)

i
x
i
<

i
f(x
i
)x
i
< I(K) +

i
x
i
.
Notemos que I(K) est a denido porque t[K] es un dominio de integraci on,
ya que es la uni on de los dominios t[Q
i
]. Sin embargo, ahora no es cierto que
V \ K tenga volumen innitesimal. Lo que tenemos es que v(V \ K) < y
v(U \ t[K]) < .
Tomando partes est andar en las desigualdades anteriores, llegamos a que
I(K) v(K)
_
K
f(x) dx I(K) +v(K),
luego

I(K)
_
K
f(x) dx

v(K) v(V ).
Por lo tanto:

_
U
f(x(t))|(t)| dt
_
V
f(x) dx

I(K)
_
K
f(x) dx

+|I(V \ K)| +

_
V \K
f(x) dx

v(V ) +M
1
v(U \ t[K]) +M
2
v(V \ K) M,
donde M
1
es una cota de f(x(t))|(t)| en U, M
2
es una cota de f(x) en V y
M = v(V ) + M
1
+ M
2
. Como esto vale para todo > 0 est andar, tenemos la
igualdad del enunciado.
Coordenadas polares Un cambio de variables que a menudo resulta util es
el determinado por las coordenadas polares. Llamemos
A = ]0, +[ ], [ , B = R
2
\ {(x, 0) R
2
| x 0}
y consideremos la aplicaci on p : A B dada por
p(, ) = ( cos , sen).
7.5. El teorema de cambio de variable 247
Es f acil ver que es biyectiva y de clase C

. Su matriz jacobiana es
Jp(, ) =
_
cos sen
sen cos

y su determinante jacobiano es (, ) = . Por el teorema de la funci on inversa,


la inversa de p es tambien de clase C

. Si U A y V = p[U] son dominios


de integraci on y f : V R es una funci on continua y acotada, el teorema de
cambio de variables nos da que
_
V
f(x, y) dxdy =
_
U
f( cos , sen) dd.
Ejemplo Vamos a calcular de nuevo la integral del ejemplo de la p agina 233:
_
C
x + 1
2
dxdy,
donde C = {(x, y) R
2
| x
2
+y
2
1}.
Es equivalente calcularla sobre
V = {(x, y) R
2
| x
2
+y
2
< 1} \ {(x, 0) R
2
| x 0},
pues hemos quitado un conjunto nulo. Este conjunto es la imagen por el cambio
de coordenadas polares del cubo ]0, 1[ ], [. Por lo tanto:
_
C
x + 1
2
dxdy =
_

_
1
0
cos + 1
2
dd =
_

3
6
cos +

2
4

1
0
d
=
_

_
cos
6
+
1
4

d =

sen
6
+

4

=

2
.
r

2r
Ejemplo Sean C
r
= {(x, y) R
2
| x
2
+ y
2
< r} y
Q
r
= ]r, r[
2
. Claramente, C
r
Q
r
C

2r
, como
muestra la gura. Dado que la funci on e
(x
2
+y
2
)/2
es siem-
pre positiva, es claro que
_
C
r
e
(x
2
+y
2
)/2
dxdy
_
Q
r
e
(x
2
+y
2
)/2
dxdy
_
C

2r
e
(x
2
+y
2
)/2
dxdy.
Por el teorema 7.21:
_
Q
r
e
(x
2
+y
2
)/2
dxdy =
_
Q
r
e
x
2
/2
e
y
2
/2
dxdy
=
__
r
r
e
x
2
/2
dx
__
r
r
e
y
2
/2
dy

=
__
r
r
e
x
2
/2
dx

2
.
248 Captulo 7. C alculo integral de varias variables
Por otra parte, cambiando a coordenadas polares:
_
C
r
e
(x
2
+y
2
)/2
dxdy =
_

_
r
0
e

2
/2
d =
_

_
e

2
/2
_
r
0
d = 2(1e
r
2
/2
).
As pues,
2(1 e
r
2
/2
)
__
r
r
e
x
2
/2
dx

2
2(1 e
r
2
),
luego
_
1 e
r
2
/2

_
r
r
1

2
e
x
2
/2
dx
_
1 e
r
2
Con esto podemos calcular el lmite cuando r tiende a + de la integral,
que habitualmente se representa como
_
+

2
e
x
2
/2
dx = 1.
-2 -1 1 2
1
El integrando se conoce como campana de Gauss, y es una de las distribu-
ciones de probabilidad m as importantes en estadstica. Puede probarse que no
admite una primitiva expresable en terminos de las funciones usuales, a partir
de la cual calcular la integral.
Coordenadas cilndricas Un cambio de variable util para trabajar con s olidos
de revoluci on es el correspondiente a las coordenadas cilndricas:
x = cos , y = sen, z = z.
Se comprueba inmediatamente que, como en el caso de las coordenadas po-
lares, el determinante jacobiano es . Un s olido de revoluci on est a determinado
por una funci on = r(z) que determina la distancia al eje z de la supercie del
s olido a cada altura z. Es claro entonces que su volumen (es decir, la integral
de su funci on caracterstica) en coordenadas cilndricas viene dado por
V =
_
b
a
_
r(z)
0
_

dddz = 2
_
b
a

2
2

r(z)
0
dz =
_
b
a
r
2
(z) dz,
que es la misma f ormula obtenida en la p agina 150 mediante un razonamiento
ad hoc.
7.5. El teorema de cambio de variable 249
Terminamos esta secci on destacando una consecuencia te orica del teorema
de cambio de variable. Hemos denido la integraci on sobre dominios de R
d
,
pero, m as en general, si V es un espacio vectorial de dimensi on d dotado de un
producto escalar (por ejemplo, si V es un subespacio vectorial de R
n
, lo que
nos permite dotarlo de la restricci on a V del producto escalar de R
n
), podemos
considerar en V una base ortonormal, es decir una base v
1
, . . . , v
d
formada por
vectores que cumplan v
i
v
i
= 1, v
i
v
j
= 0, para i 6= j (vectores de norma 1
perpendiculares entre s). (El algebra lineal garantiza que siempre existen bases
ortonormales.) A su vez, podemos denir una aplicaci on lineal : R
d
V
determinada por que (e
i
) = v
i
, donde e
i
son los vectores de la base can onica
de R
d
. La aplicaci on conserva el producto escalar:
(x)(y) =
_

i
x
i
v
i
_

i
y
i
v
i

i
x
i
y
i
= xy,
y, en particular, conserva la distancia entre puntos. Es f acil ver entonces que
transforma los cubos de R
d
en lo que, por denici on, podemos llamar cubos
en V , del mismo volumen. En el caso en que V sea un subespacio de R
n
,
por ejemplo, un plano en R
3
, los cubos de V son rect angulos situados en una
posici on arbitraria en el espacio.
Ahora podramos desarrollar en V toda la teora de integraci on que hemos
visto (particiones, sumas superiores e inferiores, etc.), pero podemos llegar al
mismo resultado por un camino m as corto: podemos denir un dominio de
integraci on D V como un subconjunto de V tal que D
0
=
1
[D] sea un
dominio de integraci on en R
d
, y diremos que una funci on acotada f : D R
es integrable si lo es |
D
0 f, en cuyo caso denimos la integral
_
D
f(x) dx =
_
D
0
f((t)) dt.
Como decimos, una comprobaci on rutinaria permitira mostrar que estas
deniciones nos llevan al mismo concepto de integral que si desarrollamos sis-
tem aticamente en V el c alculo integral que hemos desarrollado en R
d
. Para
tomar la igualdad anterior como denici on de integral, necesitamos una com-
probaci on que la justique, y ah es donde interviene el teorema de cambio de
variable: hemos de probar que la denici on de dominio de integraci on en V y
de integral de una funci on sobre un dominio de V no dependen de la elecci on
de la base ortonormal.
En efecto, si tomamos dos bases ortonormales en V , estas dan lugar a dos
aplicaciones ,
0
: R
d
V , con las que podemos formar otra aplicaci on lineal
=
01
: R
d
R
d
.
Como y
0
conservan el producto escalar, lo mismo le sucede a , luego, si
A es la matriz de en la base can onica de R
d
, tenemos que, para todo par de
vectores x, y R
d
, se cumple que xAA
t
y
t
= xy. Aplicando esto a los vectores
de la base can onica concluimos que AA
t
= I, y tomando determinantes vemos
que |A|
2
= 1, luego |A| = 1.
De este modo, si D V y
1
[D] es un dominio de integraci on en R
d
, el
teorema 7.27 nos da que [
1
[D]] =
01
[D] tambien lo es, y el teorema de
250 Captulo 7. C alculo integral de varias variables
cambio de variable nos da que
_

01
[D]
f(
0
(t)) dt =
_

1
[
0
[D]]
f(
0
((t))) dt =
_

1
[D]
f((t)) dt.
(En realidad, tenemos esto probado bajo la hip otesis de que f sea continua,
no meramente integrable, en D. Podramos probar el caso general, pero no
merece la pena.)
As pues, el c alculo integral en V no depende de la base ortonormal elegida.
En particular, si tomamos V = R
d
, concluimos que esta generalizaci on de inte-
gral respecto de una base ortonormal coincide con la integral que ya tenamos
denida (respecto de la base can onica).
7.6

Areas de supercies
En esta secci on veremos c omo calcular el area de una supercie curva S.
Del mismo modo que no hemos denido el area de cualquier supercie plana,
sino unicamente de los dominios de integraci on, tambien ser a necesario que
la supercie sea razonable en alg un sentido de la palabra. Concretamente,
vamos a considerar el caso en que S es la gr aca de una funci on de clase C
1
.
En particular, esto signica que si aplicamos a S una homotecia de centro uno
de sus puntos y raz on innita, obtenemos un plano. Dicho de otro modo: vista
a traves de una lupa de innitos aumentos, S es plana.
Dejando de lado de momento las homotecias innitas, una aproximaci on al
area de A(S) (que queremos denir) puede obtenerse pegando en S peque nos
cuadraditos. Pensemos, por ejemplo, en una esfera de un metro de radio cubierta
por cuadraditos de un milmetro cuadrado. Evidentemente, los cuadraditos no
se ajustan perfectamente a la esfera, porque son planos y cualquier fragmento
de esfera, por diminuto que sea, tiene cierto abombamiento. No obstante, el
producto del area de cada cuadradito por el n umero de cuadraditos que hemos
necesitado para cubrir S, es una (buena) aproximaci on al area que buscamos.
M as a un, podemos aceptar que, cuanto menores sean los cuadraditos, menor
ser a el error de la aproximaci on, de modo que A(S) podra verse como el lmite
de estas aproximaciones, cuando el area (o el lado) de los cuadraditos tiende
a 0.
Esto no es una denici on operativa, porque no es f acil denir en general
c omo deben ajustarse los cuadraditos para cubrir la supercie. No obstante,
de aqu podemos deducir una propiedad que, seg un esto, debe tener el area que
pretendemos denir: si aplicamos a S (y a los cuadraditos) una homotecia H
r
de radio r < 1, los cuadraditos reducidos se ajustan incluso mejor a la supercie
reducida H
r
, puesto que tambien se habr an reducido los resquicios entre los
cuadraditos. Ahora bien, las areas de los cuadraditos se habr an multiplicado por
r
2
. Como esto vale para todas las aproximaciones de A(S) (para cuadraditos de
cualquier area), lo mismo ha de valer para el lmite, es decir, se ha de cumplir
que
A(H
r
[S]) = r
2
A(S).
7.6.

Areas de supercies 251
Puesto que S se obtiene de H
r
[S] mediante una homotecia de radio 1/r, esta
relaci on leda al reves nos dice que es v alida igualmente cuando r > 1.
Otra propiedad elemental que est a implcita en todo lo que venimos diciendo
es que si dos supercies (razonables) S
1
y S
2
s olo comparten puntos de su
frontera, entonces se ha de cumplir que
A(S
1
S
2
) = A(S
1
) +A(S
2
).
Consideramos ahora una funci on est andar g : K R
2
R de clase C
1
en
un dominio de integraci on compacto K. (Esto signica, por denici on, que g es
de clase C
1
en un abierto que contiene a K.) Su gr aca es la imagen S = f[K]
de la aplicaci on f : K R
3
dada por
f(x, y) = (x, y, g(x, y)).
Nuestro prop osito es llegar a una denici on razonable del area A(S) que
respete los principios que acabamos de discutir. Observemos que f : K S
es un homeomorsmo, pues su inversa es la restricci on a S de la proyecci on
R
3
R
2
en las dos primeras componentes. Podemos pensar en f como un
mapa plano de la supercie S.
K
S
H
1/r
En lugar de cubrir S con cuadraditos, tomamos
un cuadrado Q que contenga a K y consideramos
una partici on de Q en cuadrados innitesimales Q
i
de lado r. Las im agenes en S de estos cuadrados
ser an cuadrados algo deformados, pero no mucho,
en el sentido de que, tal y como veremos enseguida,
vistos con una lupa de 1/r aumentos, es decir, trans-
formados por una homotecia de raz on 1/r, resultan
ser indistinguibles de paralelogramos cuya area podremos calcular. En efecto,
pongamos que
Q
i
= [a, a +r] [b, b +r] K
y sea p =

(a, b) K. (Est a en K porque K es compacto). Llamamos = d
p
f
y sea Q
1
= [0, 1]
2
. Como f es estrictamente diferenciable en p, tenemos que,
para todo (x, y) Q
1
, se cumple que
f(a +rx, b +ry) f(a, b) (rx, ry)
rk(x, y)k
0.
Llamemos

f(x, y) =
f(a +rx, b +ry)
r
,

(x, y) =
f(a, b) +(rx, ry)
r
=
f(a, b)
r
+(x, y).
De este modo, cuando (x, y) recorre Q
1
, tenemos que f(a+rx, b+ry) recorre
f[Q
i
], y

f(x, y) recorre f[Q
i
] aumentado con una lupa de 1/r aumentos.
Igualmente,

(x, y) recorre f(a, b) +[Q
i
] aumentado 1/r veces. Lo que hemos
probado es que

f(x, y)

(x, y),
252 Captulo 7. C alculo integral de varias variables
de modo que cada punto de

f[Q
1
] est a a distancia innitesimal de un punto de

[Q
1
], y viceversa. En otros terminos, las im agenes f[Q
i
] y f(a, b) + [Q
i
] son
indistinguibles incluso si se amplan 1/r veces para volverlas apreciables.
Ahora introducimos un tercer principio que determine la denici on de area
(recordemos que los otros dos han sido la aditividad de las areas y su compor-
tamiento ante las homotecias): si los conjuntos

f[Q
1
] y

[Q
1
] son apreciables e
indistinguibles entre s, sus areas han de ser indistinguibles, es decir:
A(

f[Q
1
]) A(

[Q
1
]).
Como

es la composici on de una traslaci on, el area de

[Q
1
] ha de ser la
misma que la de [Q
1
], y esta la hemos denido al nal de la secci on anterior, ya
que es una aplicaci on lineal, luego [Q
1
] es un paralelogramo (plano). Usando
v para el area de un dominio de integraci on plano (que s que tenemos denida),
lo que tenemos es que el concepto de area que pretendemos denir debe cumplir
la relaci on
A(

f[Q
1
]) v([Q
1
]).
Enseguida calcularemos el miembro derecho, que es un n umero est andar no
nulo, por lo que podemos escribir:
A(

f[Q
1
])
v([Q
1
])
1.
Puesto que

f[Q
1
] es la imagen de f[Q
i
] por una homotecia de radio 1/r,
teniendo en cuenta la relaci on entre las areas y las homotecias, esto equivale a
A(f[Q
i
])
r
n
v([Q
1
])
1
o, equivalentemente,
A(f[Q
i
])
v[Q
i
]
v([Q
1
]).
Nos ocupamos ahora de calcular el area del paralelogramo P = [Q
1
]. Seg un
lo visto al nal de la secci on anterior, para ello deberamos aplicar a P una
aplicaci on lineal que lo transforme en un subconjunto de R
2
conservando las
distancias, y calcular entonces el area de su imagen, pero podemos ahorrarnos
todo esto mediante un truco. Tenemos que
(1, 0) = (1, 0, g
x
), (0, 1) = (0, 1, g
y
),
donde
g
x
=
g
x

p
, g
y
=
g
y

p
.
Ahora observamos que v = (g
x
, g
y
, 1) cumple que
v(1, 0) = v(0, 1) = 0,
7.6.

Areas de supercies 253
es decir, que es perpendicular a P. Sea : R
3
R
3
la aplicaci on lineal que
sobre la base can onica toma los valores
(e
1
) = (1, 0), (e
2
) = (0, 1), (e
3
) = v.
e
1
e
2
(e
1
)
(e
2
)
(e
3
)
P
La imagen por del cubo unitario [0, 1]
3
es el
paraleleppedo de base P y altura
kvk =
_
1 +g
2
x
+g
2
y
,
luego su volumen es kvkv(P). Por otra parte,
sabemos que este volumen es el determinante de
, luego,
v(P) =
1
kvk

1 0 g
x
0 1 g
y
g
x
g
y
1

=
_
1 +g
2
x
+g
2
y
.
Si llamamos (p) =
_
1 +g
2
x
+g
2
y
(que, ciertamente, depende unicamente
del punto p), hemos probado que
A(Q
i
)
v(Q
i
)
(p) (a
i
),
donde a
i
Q
i
es el vertice que antes llam abamos (a, b) p, y la ultima apro-
ximaci on se debe a que la funci on (x, y) es continua en p. As, para cualquier
> 0 est andar, tenemos que
x
i
< a(Q
i
) (a
i
)x
i
< x
i

y, sumando para los Q


i
K, tenemos que

i
x
i
< a(K)

i
(a
i
)x
i
<

i
x
i
.
Ahora aplicamos el teorema 7.7, en virtud del cual, al tomar partes est andar
obtenemos:
v(K) a(K)
_
K
(x) dx v(K).
Como esto vale para todo > 0 est andar, ha de ser
a(K) =
_
K
(x) dx.
En denitiva, llegamos a la siguiente denici on:
254 Captulo 7. C alculo integral de varias variables
Denici on 7.30 Sea g : K R una aplicaci on de clase C
1
denida sobre
un dominio de integraci on compacto K R
2
. Denimos : K R como la
funci on dada por
(x) =

1 +
_
g
x

2
+
_
g
y

2
.
Entonces, el area de la gr aca de g se dene como
A =
_
K
(x) dx.
Ejemplo Vamos a calcular de nuevo el area de una esfera de radio R. Para
ello calculamos, en realidad, el area de una semiesfera, que es la gr aca de la
funci on
f(x, y) =
_
R
2
x
2
y
2
,
denida sobre el crculo C = {(x, y) R
2
| x
2
+y
2
R}.
Tenemos un problema y es que f no es derivable en los puntos de la circun-
ferencia, as que calcularemos el area de la gr aca sobre el conjunto
C

= {(x, y) R
2
| x
2
+y
2
R},
lo que nos sit ua en las condiciones de la denici on que hemos dado, y luego
haremos tender a 0. Para ello calculamos:
(x, y) =

1 +
x
2
R
2
x
2
y
2
+
y
2
R
2
x
2
y
2
=
R
_
R
2
x
2
y
2
.
As pues, el area que queremos calcular es
_
C

Rdxdy
_
R
2
x
2
y
2
.
Aplicamos el cambio a coordenadas polares: x = cos , y = sen, con lo
que
_
C

Rdxdy
_
R
2
x
2
y
2
= R
_

_
R
0
d
_
R
2

2
d
= 2R
_

_
R
2

2
_
R
0
= 2R
2
2R
_
R
2
(R)
2
Haciendo tender a cero, es claro que el area de la semiesfera es 2R
2
, luego
el area de la esfera es 4R
2
, como ya sabamos.
7.6.

Areas de supercies 255
Ejemplo ahora vamos a calcular el area de la semiesfera de radio R situada
bajo el crculo de centro (R/2, 0) y radio R/2.
R/2
R

El tri angulo de la gura es is osceles. El m aximo valor


de para un angulo > 0 dado es el que cumple
cos =
/2
R/2
,
es decir, = Rcos . Para evitar el problema de que el
integrando (el mismo del ejemplo anterior) no es derivable en (R, 0), calculare-
mos la integral en el semicrculo superior, y nos restringiremos al compacto K

determinado por /2. As,


_
K

Rdxdy
_
R
2
x
2
y
2
= R
_
/2

_
Rcos
0
d
_
R
2

2
d
= R
_
/2

_
R
2

2
_
Rcos
0
d = R
_
/2

(RRsen) d
R
2
[ + cos ]
/2

= R
2
/2 R
2
( + cos ).
Haciendo tender a cero y multiplicando por 2 (porque hemos integrado s olo
en el semicrculo superior) queda que el area buscada es
A = R
2
2R
2
.
En muchos libros se llama b oveda de Viviani a la supercie cuya area acaba-
mos de calcular, pero el nombre es hist oricamente incorrecto. Vincenzo Viviani
fue un discpulo de Galileo que, en cierta ocasi on, plante o (y resolvi o) el siguiente
problema:
Encontrar la forma de perforar dos ventanas en una b oveda se-
miesferica de modo que el area de la supercie resultante sea cua-
drable.
Cuadrable signica que pueda construirse un cuadrado de la misma area.
En la pr actica, quiere decir que el area no dependa de . La soluci on al problema
de Viviani consiste en eliminar la supercie de la b oveda que queda sobre dos
crculos tangentes de radio R/2. Seg un acabamos de calcular, cada una de estas
dos ventanas tiene area R
2
2R
2
, el area de las dos juntas es 2R
2
4R
2
y, como el area de la semiesfera es 2R
2
, el area de la b oveda sin las ventanas
resulta ser A = 4R
2
.
256 Captulo 7. C alculo integral de varias variables
As pues, la b oveda de Viviani, la b oveda que resuelve el problema de Viviani,
no es el fragmento de esfera situado sobre el crculo, sino la semiesfera perforada
con los dos agujeros o ventanas:
Para terminar, vamos a comparar la denici on que hemos dado del area de
una gr aca con la denici on 4.27 del area de una supercie de revoluci on. Una
supercie de revoluci on no es la gr aca de ninguna funci on, pero la mitad de
ella s que lo es.
z
r(x)
y
Si la supercie viene determinada por
una funci on r(x), la mitad de la supercie
correspondiente a los puntos con z > 0 es
la gr aca de la funci on z =
_
r(x)
2
y
2
,
sobre el dominio
D = {(x, y) R
2
| a x b, r(x) y r(x)}.
Para calcular el area seg un la denici on 7.30 calculamos:
z
x
=
rr
0
_
r
2
y
2
,
z
y
=
y
_
r
2
y
2
,
con lo que
(x, y) =
r(x)
_
r(x)
2
y
2
_
1 +r
0
(x)
2
.
El area ser a:
A =
_
b
a
_
r(x)
r(x)
r(x)
_
r(x)
2
y
2
_
1 +r
0
(x)
2
dydx.
Observemos que el integrando no est a denido cuando y = r(x). En prin-
cipio tendramos que restringir la integral a un dominio menor y luego tomar
lmites, como ya hemos hecho en otras ocasiones. Dejamos esta precisi on a
7.7. Apendice: Descomposici on de aplicaciones lineales 257
cargo del lector. Para calcular la integral interior hacemos el cambio de variable
y = r(x) sen, con lo que el area es
_
b
a
_
/2
/2
1
cos
_
1 +r
0
(x)
2
r(x) cos ddx =
_
b
a
_
/2
/2
_
1 +r
0
(x)
2
r(x) ddx
=
_
b
a
_
1 +r
0
(x)
2
r(x) dx,
que es la mitad del valor dado por la denici on 4.27 (porque estamos calculando
el area de la mitad de la supercie de revoluci on).
7.7 Apendice: Descomposici on de aplicaciones
lineales
Demostramos aqu el resultado sobre descomposici on de aplicaciones lineales
biyectivas en aplicaciones elementales que hemos utilizado en la prueba del
teorema 7.27, a saber:
Teorema 7.31 Toda aplicaci on lineal biyectiva f : R
d
R
d
se puede expresar
como composici on de un n umero nito de aplicaciones lineales g de uno de los
tres tipos siguientes:
a) g permuta los vectores e
1
, . . . , e
d
de la base can onica de R
d
.
b) g(e
1
) = re
1
y g(e
i
) = e
i
para i > 1, donde r R es no nulo.
c) g(e
1
) = e
1
+e
2
y g(e
i
) = e
i
, para i > 1.
Demostraci on: Sea A la matriz asociada a f en la base can onica. Es
conocido que f puede transformarse en una matriz diagonal de la forma
D =
_
_
_
_
_
_
_
_
_
_
1
.
.
.
1
0
.
.
.
0
_
_
_
_
_
_
_
_
_
_
mediante un n umero nito de operaciones elementales de los tipos siguientes:
a) permutar dos las o columnas,
b) multiplicar una la o columna por un n umero real no nulo,
c) sumar a una la o columna otra multiplicada por un n umero.
En efecto, los pasos a seguir son los siguientes:
258 Captulo 7. C alculo integral de varias variables
Si A = (a
ij
) tiene alg un coeciente no nulo, podemos permutar sus las y
columnas hasta conseguir que a
11
6= 0. (En caso contrario, A ya tiene la
forma indicada.)
Dividiendo la primera la entre a
11
conseguimos que a
11
= 1.
Sumando a cada columna i > 1 la primera multiplicada por a
1i
con-
seguimos que a
1i
= 0, y operando igualmente con las conseguimos que
a
i1
= 0.
As llegamos a una matriz de la forma
_
_
_
_
_
1 0 0
0
.
.
. A
0
0
_
_
_
_
_
para una cierta submatriz A
0
. Repetimos el proceso con A
0
hasta llegar a una
submatriz nula.
Ahora observamos que cada operaci on elemental sobre una matriz se puede
conseguir multiplic andola por la izquierda o por la derecha (seg un que se haga
sobre las o sobre columnas) por una de las siguientes matrices elementales:
_
_
_
_
_
_
_
_
_
_
_
_
j k
1
.
.
.
j 0 1
.
.
.
k 1 0
.
.
.
1
_
_
_
_
_
_
_
_
_
_
_
_
,
_
_
_
_
_
_
_
_
_
_
_
_
_
k
1
.
.
.
j
.
.
.
r
.
.
.
.
.
.
.
.
.
1
_
_
_
_
_
_
_
_
_
_
_
_
_
,
_
_
_
_
_
_
_
j
1
.
.
.
j r
.
.
.
1
_
_
_
_
_
_
_
.
La primera permuta las las o columnas i, j, la segunda suma a la la o
columna j-esima la k-esima multiplicada por r, y la tercera multiplica la la o
columna j-esima por r.
As pues llegamos a una ecuaci on de la forma
E
1
E
n
AE
0
1
E
0
n
0 = D,
7.7. Apendice: Descomposici on de aplicaciones lineales 259
donde las matrices E
i
y E
0
i
son elementales. Ahora bien, todas las matrices
elementales tienen determinante diferente de 0, y A tambien (porque f es bi-
yectiva), luego D tambien ha de tener determinante diferente de 0, lo cual s olo
puede suceder si D es la matriz identidad.
Por otra parte, la inversa de una matriz elemental es tambien una matriz
elemental (la inversa de la matriz que multiplica una la o columna por r es
la que la multiplica por 1/r, y la inversa de la matriz que suma a una la o
columna otra multiplicada por r es la que suma la otra multiplicada por r).
Por consiguiente, podemos despejar A y expresarla como producto de matrices
elementales.
Equivalentemente, la aplicaci on lineal f es composici on de aplicaciones de-
nidas por matrices elementales. Una aplicaci on lineal g denida por una matriz
elemental est a en uno de los casos siguientes:
a) Permuta los vectores de la base can onica.
b) g(e
i
) = re
i
, g(e
j
) = e
j
para j 6= i.
c) g(e
i
) = e
i
+re
j
, g(e
k
) = e
k
para k 6= i.
Si g est a en el caso c) puede descomponerse como sigue: permutamos los
vectores de la base can onica para que e
i
7 e
1
y e
j
7 e
2
(tipo a), hacemos
e
2
7 re
2
(tipo b), hacemos e
1
7 e
1
+ e
2
, hacemos e
2
7 (1/r)e
2
(tipo b),
invertimos la permutaci on inicial (tipo a).
Por consiguiente, podemos reducir el caso c) a g(e
1
) = e
1
+e
2
.
Por ultimo, si g est a en el caso b) puede descomponerse as: permutamos los
vectores de la base can onica de modo que e
i
7e
1
, hacemos e
1
7re
1
y desha-
cemos la permutaci on inicial. As hemos descompuesto f en homomorsmos de
los tipos indicados en el enunciado.
Apendice A
La teora de Nelson
Describimos aqu una teora axiom atica de conjuntos en la que pueden for-
malizarse todos los resultados expuestos en los captulos precedentes de este
libro exactamente en el mismo sentido en que los resultados expuestos en cual-
quier libro de an alisis est andar pueden formalizarse en la teora de conjuntos
ZFC. Se trata de la teora expuesta por Nelson en [4].
El lenguaje formal de la teora de Nelson consta de los signos l ogicos usuales
m as el relator (di adico) de pertenencia y un relator mon adico st. Convendre-
mos en leer la f ormula st x como el conjunto x es est andar.
Las expresiones del lenguaje de la teora de Nelson pueden dividirse en inter-
nas, si no contienen el relator st, y externas si lo contienen. Equivalentemente,
las expresiones internas son las expresiones del lenguaje de ZFC.
Pasamos ahora a presentar los axiomas de la teora de Nelson. En primer
lugar:
Todos los axiomas de ZFC son axiomas de la teora de Nelson.
Como consecuencia, todos los teoremas de ZFC son tambien teoremas de la
teora de conjuntos de Nelson, sin cambio o precisi on alguna. En particular, en
la teora de Nelson podemos usar todos los signos matem aticos que se introducen
en ZFC a traves de deniciones: , x y, x y, f : A B, etc.
Notas Observemos que un teorema de ZFC (un esquema teorem atico, en rea-
lidad), es el esquema de especicaci on, en virtud del cual, si (x, x
1
, . . . , x
n
) es
cualquier f ormula cualquier f ormula del lenguaje de ZFC, es decir, cualquier
f ormula interna del lenguaje de Nelson la f ormula siguiente es un teorema:
_
x
1
x
n
_
A
1
_
B
_
x(x B x A (x, x
1
, . . . , x
n
)).
Este teorema nos permite denir
{x A | (x, x
1
, . . . , x
n
)}
261
262 Apendice A. La teora de Nelson
como el unico conjunto B que cumple el teorema anterior. Seg un lo dicho, todo
esto sigue siendo v alido en la teora de Nelson, pero ahora es crucial recordar
que la teora de Nelson (a falta de otros axiomas) s olo nos permite especicar
subconjuntos mediante f ormulas internas. Nada de lo dicho hasta aqu nos
legitima a extender el esquema de especicaci on a f ormulas externas. As, del
mismo modo que en ZFC no podemos asegurar la existencia de
R = {x | x / x}
porque no se est a restringiendo x a ning un conjunto prejado A, en contra de
lo que exige el esquema de especicaci on, en la teora de Nelson no podemos
asegurar la existencia de
{x N | st x},
ya que la f ormula st x es externa.
M as a un, igual que en ZFC se puede demostrar que no existe ning un conjunto
R cuyos elementos sean los conjuntos que no se pertenecen a s mismos, veremos
que en la teora de Nelson se puede demostrar que no existe ning un conjunto
cuyos elementos sean los n umeros naturales est andar.
Otra precauci on relacionada con esta es tiene que ver con el principio de
inducci on, en virtud del cual, si (n) es una f ormula (tal vez con m as variables
libres), se cumple que
((0)
_
n N((n) (n + 1)))
_
n N(n).
Nuevamente, el hecho de que esto sea un esquema teorem atico de ZFC im-
plica que tambien lo sea de la teora de Nelson, pero s olo para f ormulas internas.
As pues, en la teora de Nelson no son v alidos los razonamientos por inducci on
respecto a f ormulas externas. Decimos que esto est a relacionado con el caso
anterior porque el principio de inducci on se demuestra en ZFC considerando el
conjunto
A = {n N | (n)},
y probando que A = N. Si la f ormula es externa, entonces la existencia de
A no puede deducirse de los axiomas de ZFC y, por consiguiente, tampoco de
los axiomas de la teora de Nelson que hemos visto hasta ahora (que son los
mismos).
La teora de Nelson consta de los axiomas de ZFC m as tres esquemas axiom a-
ticos adicionales. Para enunciarlos conviene introducir la notaci on siguiente: si
es una f ormula, escribiremos
_
st
x
_
x(st x ),
_
st
x
_
x(st x ).
Principio de Transferencia Si (x, x
1
, . . . , x
n
) es una f ormula interna cu-
yas variables libres sean exactamente las indicadas, la f ormula siguiente es un
axioma:
_
st
x
1
x
n
(
_
st
x(x, x
1
, . . . , x
n
)
_
x(x, x
1
, . . . , x
n
)).
263
Equivalentemente, (considerando el axioma correspondiente a e invir-
tiendo la implicaci on)
_
st
x
1
x
n
(
_
x(x, x
1
, . . . , x
n
)
_
st
x(x, x
1
, . . . , x
n
)).
Informalmente, el principio de transferencia puede enunciarse as:
Si todo conjunto est andar cumple una propiedad interna que de-
pende a lo sumo de par ametros est andar, entonces todo conjunto
(est andar o no) cumple dicha propiedad. Equivalentemente, si existe
un conjunto (est andar o no) que cumple una propiedad interna con
par ametros est andar, entonces existe un conjunto est andar que tam-
bien la cumple.
Como primera consecuencia:
Teorema A.1 Si t(x
1
, . . . , x
n
) es un termino interno cuyas variables libres
sean exactamente las indicadas, entonces
_
st
x
1
x
n
st t(x
1
, . . . , x
n
).
Demostraci on: Basta considerar la f ormula x = t(x
1
, . . . , x
n
). El principio
de transferencia nos da que
_
st
x
1
x
n
(
_
x(x = t(x
1
, . . . , x
n
))
_
st
x(x = t(x
1
, . . . , x
n
)).
Fijados conjuntos est andar x
1
, . . . , x
n
, es trivialmente cierto que existe un
conjunto x = t(x
1
, . . . , x
n
), luego deducimos que existe un x est andar que cum-
ple x = t, en denitiva, que t(x
1
, . . . , x
n
) es est andar.
As, por ejemplo, ahora podemos asegurar que
st , st N, st 250, st

2
y, en general, que cualquier conjunto denible explcitamente en ZFC es est andar.
Si una denici on tiene par ametros, entonces hemos de exigir que los par ametros
sean est andar. Por ejemplo:
_
st
xy st(x y),
_
st
xy st(x y),
_
st
xy st{x, y},
_
st
mn(m N n N st(m+n)), etc.
En palabras: la uni on de conjuntos est andar es un conjunto est andar, la
intersecci on de conjuntos est andar es un conjunto est andar, el par formado por
dos conjuntos est andar es un conjunto est andar, la suma de n umeros natura-
les est andar es un n umero natural est andar, y, en general, cualquier conjunto
264 Apendice A. La teora de Nelson
construido a partir de conjuntos est andar mediante una construcci on denible
en ZFC, es est andar.
1
Otra consecuencia del principio de transferencia es la siguiente:
Teorema A.2 Si dos conjuntos est andar tienen los mismos elementos est andar,
entonces son iguales.
Demostraci on: Dados dos conjuntos est andar x e y, la hip otesis es que
_
st
u(u x u y).
El principio de transferencia nos permite pasar a
_
u(u x u y),
lo cual implica que x = y.
As pues, si dos conjuntos est andar tienen los mismos elementos est andar, au-
tom aticamente tienen tambien los mismos elementos no est andar. En particular,
si a un conjunto est andar le quitamos un elemento no est andar, necesariamente
deja de ser est andar (o, si no, tendramos dos conjuntos est andar distintos con
los mismos elementos est andar).
El segundo axioma nos da la existencia de conjuntos no est andar:
Principio de Idealizaci on Si (x, y) es una f ormula interna con al menos
las variables libres x, y, entonces la f ormula siguiente es un axioma:
_
st
z(z nito
_
x
_
y z (x, y))
_
x
_
st
y(x, y).
El miembro izquierdo del axioma arma que la f ormula interna (x, y) de-
termina una relaci on concurrente, es decir, que dado cualquier familia est andar
nita
2
z de conjuntos existe un conjunto x relacionado con todos ellos. As, el
principio de idealizaci on puede leerse as:
1
En principio, si + representa la suma de numeros naturales (denida en ZFC), lo que
nos da el teorema A.1 es que
_
st
mn st(m + n). Aqu hemos de entender que si m y n
no son n umeros naturales, el termino m + n es una descripci on impropia. Adoptamos el
convenio de que todas las descripciones impropias representan un mismo objeto, que podemos
especicar o no. Por ejemplo, podemos convenir (podemos tomar como axioma) que todas las
descripciones impropias son el conjunto vaco: (x | x = x) = . El principio de transferencia
nos obliga a elegir como descripci on impropia un conjunto est andar, ya que, como acabamos
de ver, permite probar que la descripci on impropia es est andar. Este convenio s olo es util
en teora para que enunciados como el teorema A.1 tengan sentido sin necesidad de imponer
restricciones al termino t. En la pr actica podemos particularizar f ormulas como
_
st
mn st(m+n) a
_
st
mn(m N n N st(m+n))
y as evitamos tratar con descripciones impropias.
2
La noci on de nitud es, por supuesto, la usual, tal y como se dene habitualmente en
ZFC.
265
Una relaci on interna (tal vez con par ametros no est andar) es con-
currente si y s olo si hay un conjunto relacionado con todos los con-
juntos est andar.
En la pr actica no es frecuente trabajar con relaciones denidas sobre todos
los conjuntos, sino s olo sobre un conjunto prejado. Por ello suele ser m as util
la siguiente versi on relativizada del principio:
Teorema A.3 Si (x, y) es una f ormula interna con al menos las variables
libres x, y, entonces la f ormula siguiente es un teorema:
_
A
__
st
z(z A z nito
_
x
_
y z (x, y))
_
x
_
st
y A(x, y)
_
.
Demostraci on: Aplicamos el principio de idealizaci on a la f ormula
(x, y) y A (x, y).
Si la relaci on es concurrente en A, es decir, si cumple el miembro izquierdo
del enunciado, entonces, para cada conjunto z est andar y nito tenemos que el
conjunto z
0
= z A es est andar (por el teorema anterior), es nito y est a
contenido en A. Por hip otesis
_
x
_
y z
0
(x, y)), y esto es equivalente a
que
_
x
_
y z (x, y). As pues, es concurrente, luego por el principio de
idealizaci on
_
x
_
st
y (x, y), lo cual equivale a
_
x
_
st
y A(x, y). El recproco
se prueba igualmente.
El resultado b asico sobre existencia de conjuntos no est andar es el siguiente:
Teorema A.4 Un conjunto es est andar y nito si y s olo si todos sus elementos
son est andar.
Demostraci on: Sea A un conjunto. Aplicamos el principio de idealizaci on
a la relaci on interna (x, y) = x Ax 6= y, donde A aparece como par ametro
(no necesariamente est andar). La relaci on es concurrente si y s olo si
_
st
z(z nito
_
x
_
y z(x A x 6= y))
o equivalentemente, si A no est a contenido en ning un conjunto est andar y -
nito z.
Por tanto, si A es est andar y nito, por el principio de idealizaci on,
_
x A
_
st
y x = y,
pero esto equivale a que todos los elementos de A son est andar.
Recprocamente, si todos los elementos de A son est andar el principio de
idealizaci on implica que la relaci on no es concurrente, y por tanto A est a
contenido en un conjunto est andar y nito z. Entonces A es nito y A Pz.
Por el principio de transferencia, Pz es est andar y, como tambien es nito, la
parte ya probada permite concluir que Pz s olo tiene elementos est andar. Luego
A es tambien est andar.
Otra consecuencia notable del principio de idealizaci on es la siguiente:
266 Apendice A. La teora de Nelson
Teorema A.5 Existe un conjunto nito que contiene a todos los conjuntos
est andar.
Demostraci on: Basta aplicar el principio de idealizaci on a la f ormula
(x, y) y x x es nito.
Existen otras teoras de conjuntos no est andar en las que no se cumplen
exactamente los mismos hechos b asicos. En la teora de Nelson, el principio de
idealizaci on es especialmente fuerte, por lo que de cara a traducir los resultados
a otras aproximaciones al an alisis no est andar, conviene observar que, en las
aplicaciones usuales de la teora al an alisis, la topologa, etc., nunca es necesario
usar el principio de idealizaci on de Nelson en toda su generalidad, sino que en
la pr actica es suciente con los teoremas A.3, A.4 y la siguiente versi on debil
del teorema anterior:
Teorema A.6 Todo conjunto A tiene un subconjunto nito B que contiene a
todos sus elementos est andar.
Demostraci on: Basta tomar F A, donde F es un conjunto nito que
contenga a todos los conjuntos est andar.
Todos los resultados que hemos demostrado en los captulos precedentes de
este libro han usado unicamente el principio de idealizaci on a traves del teorema
A.4 y, en contadas ocasiones, del teorema A.6 (resultados que en el captulo I
hemos llamado Principio de idealizaci on I y II). El teorema A.3 es necesario,
por ejemplo, en el estudio de espacios topol ogicos arbitrarios, no necesariamente
metrizables, estudio en el que no hemos entrado en este libro.
Ejemplo Ahora estamos en condiciones de demostrar algo que habamos ar-
mado m as arriba, a saber, que no existe
{x N | st x}
o, en otras palabras, que no existe ning un conjunto cuyos elementos sean los
n umeros naturales est andar. En efecto, si existiera tal conjunto, llamemoslo A,
entonces N\A sera el conjunto de los n umeros naturales no est andar, que es no
vaco, ya que N es innito, luego tiene elementos no est andar. Todo subconjunto
no vaco de N tiene un mnimo elemento. Sea, pues, el mnimo de N \ A. Se
trata de un n umero natural no est andar, luego ha de ser 6= 0, ya que st 0.
Por lo tanto, ha de ser = n + 1, para cierto n < . Por la minimalidad de ,
concluimos que n es est andar, pero entonces = n+1 es suma de dos n umeros
est andar, luego debera ser est andar, y tenemos una contradicci on.
Vemos, pues, que en la teora de Nelson hay f ormulas (externas) que no
denen conjuntos. Pese a ello, a menudo es util utilizar la notaci on conjuntista
con estas f ormulas, es decir, hablar de
{x A | (x, x
1
, . . . , x
n
)}
267
aunque la f ormula sea externa. Esto ser a lcito siempre y cuando cualquier
expresi on que contenga un conjunto inexistente de este tipo pueda ser refor-
mulada en terminos de . Por ejemplo, es util denir en general

A = {x A | st x}.
Antes hemos demostrado que no existe ning un conjunto cuyos elementos
sean los n umeros naturales est andar, es decir, que no existe

N. Expresaremos
esto diciendo que

N es un conjunto externo, de modo que los conjuntos externos
son esencialmente lo mismo que las clases propias en ZFC (y en la propia teora
de Nelson, pues, igual que podemos hablar de clases propias en ZFC, podemos
hacerlo en la teora de Nelson).
La diferencia entre conjuntos externos y clases propias es que llamamos cla-
ses propias a las colecciones de conjuntos denidas por f ormulas que no denen
conjuntos porque no acotan la variable tal y como exige el esquema de especi-
caci on, y llamamos conjuntos externos a las colecciones de conjuntos denidas
por f ormulas que no denen conjuntos porque son externas. As, por ejemplo,
A = {x |
_
y(x = {y})}
(la clase de todos los conjuntos con un elemento) es una clase propia, pero
B = {x N | st x}
(el conjunto de todos los n umeros naturales no est andar) es un conjunto externo.
Notemos que tiene sentido armar, por ejemplo, que A B = , porque
con ello estamos diciendo algo que puede expresarse sin hacer referencia ni a
clases propias ni a conjuntos externos, a saber, que es imposible que un n umero
natural sea no est andar y tenga un unico elemento, ya que el unico n umero
natural con un elemento es 1 = {0}, y es est andar.
En general, una armaci on que involucre conjuntos externos ser a admisible
en la teora de Nelson en la medida en que pueda reformularse sin hacer refe-
rencia a conjuntos externos. Por ejemplo, el teorema A.4 puede reenunciarse
como:
Un conjunto A es est andar y nito si y s olo si A =

A.
Esto es admisible precisamente porque la igualdad A =

A puede sustituirse
por la f ormula
_
x A st x, en la que no aparecen conjuntos externos.
Este resultado muestra, por otra parte, que

A no siempre es externo: Si A
es un conjunto est andar y nito, entonces

A es interno y est andar, porque es
el propio A.
A veces, a los conjuntos los llamaremos tambien conjuntos internos, por
oposici on a los conjuntos externos. As, podemos decir que N es un conjunto
interno, mientras que

N es externo, pero debemos tener presente que decir que
N es un conjunto interno signica exactamente lo mismo que decir simplemente
268 Apendice A. La teora de Nelson
que es un conjunto, es decir, uno de los objetos de los que habla la teora de
Nelson.
El tercer esquema axiom atico que completa la teora de Nelson nos permite
denir conjuntos a partir de f ormulas externas, pero no en el mismo sentido en
que lo hace el esquema de especicaci on:
Principio de Estandarizaci on Si (z) es una f ormula (interna o externa)
con al menos la variable libre x, entonces la f ormula siguiente es un axioma:
_
st
x
_
st
y
_
st
z(z y z x (z)).
Dado un conjunto est andar x, el conjunto y que postula el principio de
estandarizaci on es unico en virtud del teorema A.2, y podemos llamarlo
S
{z x | (z)}.
Aqu es esencial recordar que este conjunto no est a formado por los elementos
z x que cumplen (z), sino que sus elementos est andar son los elementos
est andar z x que cumplen (z), pero que, aparte, puede tener otros elementos
no est andar, sobre los que en principio no podemos decir nada.
Podemos pensar en A 7
S
A como una operaci on que asigna un conjunto
est andar a cada conjunto externo (su estandarizaci on), pero tambien podemos
estandarizar conjuntos internos: si A es un conjunto interno, podemos denir
S
A =
S
{x A | x A},
que es el conjunto est andar que tiene los mismos elementos est andar que A. As,
es claro que un conjunto A es est andar si y s olo si A =
S
A.
Veamos un ejemplo detallado del uso de los principios de transferencia y
estandarizaci on, que nos proporciona un ejemplo m as en el que un conjunto

A
puede ser interno:
Teorema A.7 Si A es un conjunto nito con un n umero est andar de elementos,
entonces

A =
S
A. En particular,

A es un conjunto interno, est andar y nito.
Demostraci on: Por hip otesis, existe un n umero natural est andar n y una
aplicaci on biyectiva f : I
n
A, donde I
n
= {m N | m n}. Llamamos
g =
S
f. As, todo elemento est andar de g es un elemento de f, luego
_
st
x g
_
ma(m I
n
a A x = (m, a)).
Como la f ormula que sigue al cuanticador inicial es interna, podemos aplicar
el principio de transferencia y concluir que g I
n
A. Similarmente, si m I
n
,
tenemos que
_
st
ab((m, a) g (m, b) g a = b),
269
ya que si (m, a) g con m y a est andar, entonces (m, a) es est andar, luego
(m, a) f, e igualmente (m, b) f, y f es una funci on. (Observemos que
m es est andar, porque I
n
es est andar y nito, luego todos sus elementos son
est andar.)
Ahora podemos aplicar el principio de transferencia porque la f ormula tras
el cuanticador inicial es interna y porque el unico par ametro que aparece en
ella es g, es es un conjunto est andar. La conclusi on es que g es una funci on.
Similarmente, si m
1
, m
2
I
n
,
_
st
a((m
1
, a) g (m
2
, a) g m
1
= m
2
),
luego, aplicando el principio de transferencia (lo cual es lcito porque los par a-
metros g, m
1
y m
2
son est andar), concluimos que g es inyectiva.
Sea D I
n
el dominio de g, que es un conjunto est andar, porque el dominio
de una funci on est andar ha de ser un conjunto est andar. Si m D, entonces
g(m) es est andar (porque lo son m y g), luego (m, g(m)) g implica que
(m, g(m)) f, lo que a su vez implica que g(m) A o, m as concretamente,
g(m)

A. As pues, g[D]

A.
Recprocamente, si a

A, existe un m I
n
tal que (m, a) f. Como m y
a son ambos est andar, tambien lo es (m, a), luego (m, a) g, luego a g[D].
En denitiva,

A = g[D] es un conjunto est andar y nito (porque la imagen de
un conjunto est andar por una aplicaci on est andar es un conjunto est andar).
Como

Aes un conjunto est andar que contiene los mismos elementos est andar
que A, ha de ser

A =
S
A.
Otra aplicaci on sencilla del principio de estandarizaci on es la posibilidad
de denir una funci on est andar especicando unicamente las im agenes de los
elementos est andar de su dominio:
Teorema A.8 (Principio de extensi on) Si X e Y son conjuntos est andar
y f :

X

Y es una aplicaci on externa, entonces existe una aplicaci on
est andar

f : X Y que extiende a f.
Demostraci on: Hay que entender que f es cualquier criterio que asigna
a cada elemento est andar de X un unico elemento est andar de Y . M as con-
cretamente, el enunciado supone que existe una f ormula (x, y) (tal vez con
par ametros) de modo que se demuestra que
_
st
x X
1
_
st
y Y (x, y).
Denimos

f =
S
{(x, y) X Y | (x, y)}. As, los elementos est andar de

f son pares ordenados de X Y y para todo x X est andar existe un unico


y Y tal que (x, y)

f. Aplicando el principio de transferencia a estos hechos
concluimos que

f : X Y , y claramente extiende a f.
El interes del principio de extensi on es que, la forma de asignar un elemento
est andar de Y a cada elemento est andar de X puede expresarse mediante una
270 Apendice A. La teora de Nelson
f ormula externa y, pese a ello, la aplicaci on nal

f : X Y ser a est andar.
M as en general, podemos denir un concepto mediante una f ormula externa y,
si restringimos el alcance de la denici on a conjuntos est andar, podemos exigir
que el conjunto de todos los objetos que cumplen la denici on sea est andar.
Remitimos a la denici on 2.29 y las explicaciones posteriores para ilustrar esta
posibilidad, fundamental para una exposici on natural del an alisis no est andar.
Apendice B
La teora de Hrbacek
En este apendice expondremos la teora de conjuntos no est andar presentada
por K. Hrbacek en [2], que se diferencia de la de Nelson en que formaliza la
noci on de conjunto externo. Nos referiremos a ella como H.
El lenguaje de ZFC est a formado por las variables x, y, z, . . . , por los
dos relatores , =, el negador , el implicador , el generalizador
_
y por el
descriptor |.
Consideraremos como axioma de ZFC que todas las descripciones impropias
son el conjunto vaco, es decir: x|(x = x) = . Formalmente esto ha de
entenderse como un axioma a nadido a los axiomas de ZFC, pero en realidad es
una denici on: estamos conviniendo que todo lo que este mal denido es por
denici on el conjunto vaco. En la pr actica nunca vamos a trabajar con nociones
mal denidas, pero al tratar sistem aticamente con expresiones arbitrarias hemos
de contemplar la posibilidad de que sean descripciones impropias. En cuanto
hayamos justicado la existencia del conjunto vaco en H adoptaremos tambien
este axioma en la teora de Hrbacek.
Cualquier otro signo lo consideraremos como una abreviatura de una ex-
presi on que contenga unicamente estos signos. Por ejemplo,
x y x z (x y) x z.
No consideramos a los parentesis como signos de nuestro lenguaje, pues te orica-
mente pueden suprimirse a condici on de alterar la sintaxis del lenguaje.
El lenguaje de la teora de Hrbacek consta de los signos del lenguaje de ZFC
m as dos nuevos relatores st x (x es est andar) e inx (x es interno). Si es una
f ormula, usaremos las abreviaturas
_
st
x,
_
st
x,
_
in
x,
_
in
x
con los signicados obvios. Cuando hablemos de f ormulas de ZFC entenderemos
que son f ormulas en las que no aparecen los relatores que acabamos de introducir,
mientras que si hablamos de f ormulas de H entenderemos que pueden contener
estos relatores.
271
272 Apendice B. La teora de Hrbacek
Para indicar que un conjunto es arbitrario, no necesariamente interno, dire-
mos que es externo. Cuando queramos indicar que no es interno diremos que es
estrictamente externo.
La idea b asica que debe guiarnos es que los conjuntos est andar de H se
corresponden con los conjuntos est andar de la teora de Nelson, los conjuntos
internos de H se corresponden con los conjuntos de la teora de Nelson (los
que existen formalmente, es decir, los internos) y los conjuntos estrictamente
externos de H se corresponden con los conjuntos externos de la teora de Nelson,
de los que s olo tiene sentido hablar metamatem aticamente.
1
Desgraciadamente, no podemos suponer que los conjuntos externos satisfa-
cen la axiom atica completa de ZFC. Nos tendremos que limitar a la axiom atica
de Zermelo incluido el axioma de elecci on, es decir, suprimimos el axioma de
reemplazo e incluimos el axioma de especicaci on. Como contrapartida, exten-
demos dicho axioma a f ormulas arbitrarias de H, luego, a diferencia de lo que
sucede en la teora de Nelson, podemos usar libremente los relatores st e in
para denir conjuntos (lo que suceder a es que por regla general los conjuntos
denidos con estos relatores ser an estrictamente externos). Explcitamente, los
axiomas b asicos son los siguientes:
Extensionalidad
_
xy(
_
u(u x u y) x = y),
Par
_
xy
_
z
_
u(u z u = x u = y),
Uni on
_
x
_
y
_
u(u x u y),
Especificaci on Para toda f ormula (u, x
1
, . . . , x
n
) de H,
_
x
_
y
_
u(u y u x (u, x
1
, . . . , x
n
)),
Partes
_
x
_
y
_
u(u x u y),
Elecci on Todo conjunto admite un buen orden.
El conjunto cuya existencia postula el axioma de especicaci on es unico por
extensionalidad, y es el que se representa usualmente por
{u x | (u, x
1
, . . . , x
n
)}.
Notemos que de aqu se sigue la existencia de un conjunto sin elementos
(tomando (u) u 6= u), por lo que no hemos necesitado el axioma del conjunto
vaco. Tampoco hemos incluido el axioma de innitud porque se deducir a de
los axiomas restantes. Veremos luego que el axioma del reemplazo y el axioma
de regularidad son contradictorios con los otros axiomas de H.
La supresi on del axioma de reemplazo s olo hace que la teora de conjuntos
se resienta en lo concerniente a la teora de ordinales y cardinales. Por ejemplo,
no es posible demostrar la existencia del ordinal 2, por lo que un conjunto
bien ordenado no tiene por que tener asociado un ordinal. Sin embargo, los
1
En realidad los axiomas de H determinan propiedades ligeramente distintas para los con-
juntos internos que los axiomas de Nelson. Las diferencias son mnimas, pero debemos tener
presente que la correspondencia entre ambas es aproximada.
273
resultados que no dependen directamente de estas nociones (lo cual incluye a
los resultados b asicos del algebra, la topologa o del an alisis) siguen disponibles
en esta teora.
2
En particular disponemos de todo el lenguaje conjuntista b asico:
aplicaciones, relaciones, etc.
Introducimos ahora dos axiomas que en la teora de Nelson son triviales,
pues en ella todo conjunto es interno:
Inclusi on:
_
st
xinx (Todo conjunto est andar es interno.)
Transitividad:
_
in
x
_
u(u x inu) (Los elementos de los conjuntos
internos son internos.)
El axioma de transitividad arma que al introducir los conjuntos externos
en la teora no estamos modicando los conjuntos internos, en el sentido de que
no les a nadimos elementos.
Ahora debemos insistir en que una armaci on que en la teora de Nelson
empiece por para todo n umero natural. . . equivale a una armaci on de H que
empiece por para todo n umero natural interno. . . Para formalizar esta idea
hemos de introducir la noci on de relativizaci on de una f ormula:
Si es una expresi on de ZFC, denimos
in
como la expresi on determinada
por las reglas siguientes:
a) x
in
x,
b) (x = y)
in
x = y, (x y)
in
x y,
c) ()
in

in
,
d) ( )
in

in

in
,
e) (
_
x)
in

_
in
x
in
,
f) (x|)
in
x|(inx
in
).
Son claras las identidades
( )
in

in

in
, ( )
in

in

in
, ( )
in

in

in
,
as como las equivalencias l ogicas
(
_
x)
in

_
in
x
in
, y (
1
_
x)
in

1
_
x(inx
in
).
Por ejemplo y basta aplicar las reglas correspondientes a
la implicaci on y a la negaci on. Lo mismo sucede con la conjunci on
( ) y la coimplicaci on ( ) ( ).
2
Un uso elemental del esquema de reemplazo es la prueba de la existencia de x y, pero
teniendo en cuenta que (u, v) = {{u}{u, v}}, podemos obtener x y por especicaci on desde
P(P(x y)).
274 Apendice B. La teora de Hrbacek
Para el cuanticador existencial tenemos que
_
x
_
x, luego
(
_
x)
in

_
in
x
in
.
Esto no es exactamente lo mismo que
_
in
x
in
, pero ambas f ormulas son
l ogicamente equivalentes, luego en la pr actica relativizar un cuanticador
_
es
cambiarlo por
_
in
. Similarmente sucede con la existencia unica.
Ejemplo Veamos un ejemplo del funcionamiento de esta noci on. Todava
no estamos en condiciones de justicar nada de lo que vamos a decir. Este
ejemplo es meramente orientativo.
Ahora tenemos que distinguir entre el conjunto N de los n umeros naturales
y el conjunto N
in
de los n umeros naturales
in
. El primero es el conjunto de los
n umeros naturales (externos) construido a partir de los axiomas de Zermelo.
Por ejemplo, podemos denir N como la intersecci on de todos los conjuntos
(externos) que contienen a 0 = y que si contienen a un conjunto n contienen
tambien a n + 1 = n {n}. Con esta denici on se prueba que N s olo contiene
n umeros est andar. La prueba se basa en que podemos denir el conjunto
X = {n N | st n},
(lo cual no es lcito en la teora de Nelson) y demostrar que
0 X
_
n X n + 1 X.
Por denici on de N tenemos que N X, luego N = X.
Por otra parte, N
in
es la intersecci on de todos los conjuntos internos que
contienen a 0 y que si contienen a n contienen a n{n}. El conjunto X resulta
ser estrictamente externo, luego no forma parte de la intersecci on que estamos
considerando. El resultado es que N N
in
, pero el segundo contiene muchos
conjuntos que no est an en N, conjuntos que son n umeros naturales
in
, pero no
son n umeros naturales. Demostraremos que N = {n N
in
| st n}.
El siguiente grupo de axiomas de H es:
ZFC
in
: Si es un axioma de ZFC, entonces
3

in
es un axioma de H.
En otras palabras, los conjuntos internos (al igual que en la teora de Nelson)
cumplen ZFC. El hecho de que los conjuntos externos no cumplan todo ZFC no
tiene gran importancia, pues debemos tener presente que el objeto de la teora
H es estudiar los conjuntos internos como herramienta a su vez para el estudio
de los conjuntos est andar. Los conjuntos externos son un mero auxiliar.
3
Aqu suponemos que los axiomas de ZFC no tienen variables libres. En el caso del axioma
del reemplazo, donde aparece una f ormula que puede tener par ametros x
1
, . . . , x
n
, hay que
entender que el axioma empieza con
_
x
1
x
n
.
275
Ejemplo El axioma del conjunto vaco en ZFC arma que
_
x
_
y x / y, es
decir, existe un conjunto sin elementos. Por el axioma de extensionalidad es
unico, lo que justica la denici on x|
_
y y / x.
Ahora tenemos que
_
in
x
_
in
y x / y es un axioma de H, es decir, existe un
conjunto interno sin elementos internos. A este conjunto lo deberamos llamar

in
x|(inx
_
in
y y / x). Ahora bien, como los conjuntos internos s olo pueden
tener elementos internos concluimos que
in
no tiene elementos en absoluto,
luego es simplemente
in
= . En particular tenemos que es interno.
Veamos un resultado trivial:
Teorema B.1 Sea t(x
1
, . . . , x
n
) un termino del lenguaje de ZFC con las varia-
bles libres indicadas. Entonces se prueba en H que
_
in
x
1
. . . x
n
int
in
.
Demostraci on: Un termino ha de ser necesariamente una variable t x,
en cuyo caso el teorema es trivial, o bien una descripci on t x|(x, x
1
, . . . , x
n
),
y entonces t
in
es el unico x interno que cumple
in
si es que existe (y entonces
es interno) o bien es (x|x = x) = si no existe (y tambien es interno).
En la teora de Nelson, al suponer todos los axiomas de ZFC tenemos au-
tom aticamente todos los teoremas de ZFC. El an alogo para H no es igual de
inmediato, pero tambien se cumple:
Teorema B.2 Si es un teorema de ZFC sin variables libres, entonces
in
es
un teorema de H.
La prueba de este teorema es una comprobaci on rutinaria basada en la de-
nici on de demostraci on que proporciona la l ogica matem atica: una f ormula
es un teorema de ZFC si se deduce en un n umero nito de pasos a partir de los
axiomas de ZFC y de los axiomas l ogicos mediante la aplicaci on de ciertas reglas
de inferencia. Se comprueba que si es un axioma l ogico (con variables libres
x
1
, . . . , x
n
) entonces
_
in
x
1
x
n

in
es un teorema de H; por otra parte, si es
un axioma de ZFC entonces
in
es un axioma de H; nalmente, se comprueba
que si se deduce de otras f ormulas mediante una regla de inferencia, entonces
_
in
x
1
x
n

in
puede demostrarse en H a partir de las relativizaciones de las
premisas. De aqu se sigue f acilmente el teorema. La demostraci on es construc-
tiva, en el sentido de que permite obtener explcitamente la demostraci on en H
de cualquier f ormula
in
sin variables libres a partir de la demostraci on de en
ZFC.
Hemos demostrado que
in
= , y hemos anunciado que N
in
6= N. Vamos a
ver ahora que la relativizaci on a conjuntos internos es trivial para los conceptos
b asicos de la teora de conjuntos, es decir, que en la medida de lo posible
los conceptos internos coinciden con los externos. Para ello introducimos el
concepto siguiente:
Denici on B.3 Diremos que un termino t(x
1
, . . . , t
n
) de ZFC es absoluto si
_
in
x
1
x
n
t
in
(x
1
, . . . , x
n
) = t(x
1
, . . . , x
n
).
276 Apendice B. La teora de Hrbacek
Una f ormula (x
1
, . . . , x
n
) de ZFC es absoluta si
_
in
x
1
x
n
(
in
(x
1
, . . . , x
n
) (x
1
, . . . , x
n
)).
Por ejemplo, hemos demostrado que es absoluto. El teorema siguiente nos
permite reconocer muchas expresiones absolutas:
Teorema B.4 Se cumple
a) Un termino t es absoluto si y s olo si lo es la f ormula x = t, donde x es
una variable que no este libre en t.
b) Si una f ormula es equivalente en la teora de Zermelo Z a una f ormula
absoluta entonces es absoluta.
c) x = y y x y son f ormulas absolutas.
d) Si y son f ormulas absolutas, tambien lo son , , , ,
,
_
x y ,
_
x y ,
1
_
x y , x|(x y ).
e) Si (x
1
, . . . , x
n
) es una expresi on absoluta y t
1
, . . . , t
n
son terminos abso-
lutos, entonces (t
1
, . . . , y
n
) tambien es absoluta.
Demostraci on: a) Si x = t es absoluta tenemos que
_
x
1
x
n
x(x = t
in
x = t),
y sustituyendo x por t
in
obtenemos que t
in
= t. El recproco es similar.
b) Si en Z tenemos
_
x
1
x
n
( ), entonces en H tenemos
_
in
x
1
x
n
(
in

in
), y
_
x
1
x
n
( ).
En particular
_
in
x
1
x
n
( ), con lo que la conclusi on es clara.
c) es inmediato.
d) La prueba para y es inmediata. Para los conectores restantes
se deduce de estos dos casos. Para el cuanticador universal tenemos que probar
que
_
in
x
1
x
n
y(
_
x y
_
in
x y
in
).
Como es absoluta tenemos que
_
in
x
1
x
n
y(
_
in
x y
_
in
x y
in
),
pero el axioma de transitividad nos permite cambiar el primer
_
in
x por
_
x, ya
que los elementos de y son necesariamente internos.
El caso del cuanticador existencial puede reducirse al anterior o demostrarse
an alogamente. Para el cuanticador con unicidad tenemos que
1
_
x y
_
z y
_
x y( x = z),
luego tambien se reduce a los casos anteriores.
277
Por ultimo, jados x
1
, . . . , x
n
, y internos, tenemos que un conjunto x cumple
x y si y s olo si es interno y cumple x y
in
, pues x y ya implica
que x es interno y como es absoluta
in
equivale a . Por consiguiente, o
bien existe un unico conjunto interno x y que cumple
in
, y este es tambien
el unico conjunto x que cumple x y , o bien no se da ninguna de las dos
unicidades. En cualquier caso
_
x|(x y )
_
in
= x|(x y ) (Si no se da la
unicidad ambos miembros son el conjunto vaco.)
e) Si es una f ormula tenemos que
_
in
x
1
x
n
(
in
(x
1
, . . . , x
n
) (x
1
, . . . , x
n
)).
Por otra parte, si y
1
, . . . , y
m
son las variables libres en los terminos t
1
, . . . , t
n
,
tenemos que
_
in
y
1
y
m
(t
in
i
(y
1
, . . . , y
m
) = t
i
(y
1
, . . . , y
m
)).
Adem as, jados y
1
, . . . , y
m
tenemos que cada t
in
i
es un conjunto interno,
luego podemos sustituir en la f ormula anterior y queda
_
in
y
1
y
m
(
in
(t
in
1
, . . . , t
in
n
) (t
1
, . . . , t
m
)).
Es f acil ver que
in
(t
in
1
, . . . , t
in
n
) (t
1
, . . . , t
m
)
in
, con lo que la composici on
es absoluta.
Si es un termino, el resultado se sigue del caso que acabamos de probar
aplicado a la f ormula x = .
Por ejemplo, ahora es claro que la uni on de conjuntos es absoluta, es decir,
_
in
xy (x y)
in
= x y.
Una prueba directa es la siguiente: el miembro izquierdo es por denici on el
unico conjunto interno cuyos elementos internos son los elementos internos de x
o y, pero por transitividad sobran todas las especicaciones interno, es decir,
(x y)
st
es el unico conjunto interno cuyos elementos son los elementos de x o
y. As pues, (x y)
in
= x y. En otras palabras, la uni on interna de conjuntos
internos es simplemente su uni on.
Por otra parte, el teorema anterior nos permite llegar mec anicamente a la
misma conclusi on: basta ver que
z = x y
_
u z(u x u y)
y el miembro derecho es absoluto por el teorema anterior, luego el izquierdo
tambien.
Similarmente se prueba que x y, x \ y, {x}, {x, y}, x y son absolutos.
Ahora, el termino (x, y) {{x}, {x, y}} es absoluto por el apartado e) del
teorema. Por otra parte,
z = x y
_
w z
_
u x
_
v y w = (u, v),
luego x y tambien es absoluto.
278 Apendice B. La teora de Hrbacek
Otros ejemplos de expresiones absolutas son f : x y (inyectiva, supra-
yectiva, biyectiva), f(u), R es una relaci on (reexiva, simetrica, antisimetrica,
transitiva). Por ejemplo:
f : x y
_
z f
_
u x
_
v y z = (u, v)
_
u x
1
_
v y
_
w f(w = (u, v) w f).
Para probar que f(x) y|(x, y) f es absoluto observamos que si f y x
son internos entonces f(x)
in
= y|(iny (x, y) f), donde usamos que (x, y) es
absoluto. Ahora bien, iny es redundante, pues si (x, y) f necesariamente y es
interno, ya que y {x, y} (x, y) f, luego tenemos la igualdad.
En denitiva, las propiedades y operaciones conjuntistas b asicas son ab-
solutas. Esto implica en particular que al realizar dichas operaciones sobre
conjuntos internos obtenemos conjuntos internos: la uni on, la intersecci on, el
producto cartesiano, etc. de conjuntos internos es un conjunto interno. Por
ejemplo x y = (x y)
in
, luego es interno por el teorema B.1.
Ejemplo Anticipamos (sin prueba) un ejemplo de concepto no absoluto: Px.
En efecto, P
in
N
in
es por denici on el conjunto (interno) de todos los subcon-
juntos internos de N
in
, y no coincide con PN
in
, que es el conjunto de todos los
subconjuntos (internos y externos) de N
in
. As pues, la f ormula
_
in
x(P
in
x = Px)
falla cuando se aplica al conjunto interno x = N
in
. Por consiguiente Px no es
absoluto.
Ejemplo Es un teorema de ZFC que 0 N
_
n Nn{n} N. Teniendo en
cuenta que 0, y {x} son conceptos absolutos, la relativizaci on de este teorema
es
0 N
in

_
n N
in
n {n} N
in
.
Notemos que no hace falta poner
_
in
n N
in
porque N
in
es interno, luego sus
elementos son necesariamente internos. Esta f ormula es un teorema de H, y de
ella se sigue que N
in
es un conjunto innito. Por ello no hemos incluido el axioma
de innitud entre los axiomas sobre los conjuntos externos. Ahora ya tenemos
justicada la existencia de conjuntos (externos) innitos y, en particular, la
existencia de N.
Los axiomas que faltan se corresponden aproximadamente con los principios
de transferencia, idealizaci on y estandarizaci on de la teora de Nelson. Para
enunciar el principio de idealizaci on necesitamos unas deniciones:
Denici on B.5 Para cada conjunto A, denimos

A = {x A | st x}.
Diremos que un conjunto B tiene tama no est andar si existe un conjunto est andar
A y una aplicaci on f :

A B suprayectiva.
279
En particular, si A es un conjunto est andar entonces

A es un conjunto de
tama no est andar. Los axiomas restantes son:
Transferencia: Si (x, x
1
, . . . , x
n
) es una f ormula interna cuyas variables
libres sean exactamente las indicadas, la f ormula siguiente es un axioma:
_
st
x
1
x
n
(
_
st
x
in
(x, x
1
, . . . , x
n
)
_
in
x
in
(x, x
1
, . . . , x
n
)).
Idealizaci on: Para toda f ormula (x, y, x
1
, . . . , x
n
) del lenguaje de ZFC
_
in
x
1
x
n
_
A(A tiene tama no est andar
_
z(z A z nito
_
in
x
_
in
y z
in
(x, y, x
1
, . . . , x
n
))
_
in
x
_
in
y A
in
(x, y, x
1
, . . . , x
n
)).
Estandarizaci on:
_
x
_
st
y
_
st
u(u y u x).
Del principio de transferencia se sigue que si dos conjuntos est andar tienen
los mismos elementos est andar entonces tienen los mismos elementos internos y,
por transitividad, son iguales. Por consiguiente, del principio de estandarizaci on
se sigue que para todo conjunto A existe un unico conjunto est andar
S
A cuyos
elementos est andar son los mismos que los de A.
De principio de transferencia se sigue, an alogamente a como hemos hecho en
la teora de Nelson, que las versiones internas de todos los conceptos denibles
en ZFC son de hecho est andar. Por ejemplo, N
in
es un conjunto est andar. Para
probarlo aplicamos el principio de transferencia a la f ormula (sin par ametros)
(z = N)
in
, lo cual nos da que
_
in
z z = N
in

_
st
z z = N
in
.
Similarmente, la uni on de conjuntos est andar es est andar y, en general, cual-
quier conjunto denido mediante una expresi on de ZFC a partir de par ametros
est andar es est andar.
Los n umeros naturales Ahora ya podemos demostrar que, tal y como hab-
amos anticipado, N =

N
in
, es decir, que los n umeros naturales externos son los
n umeros naturales
in
est andar.
Una inclusi on es simple: Relativizando teoremas de ZFC a conjuntos internos
tenemos 0 = N
in
y
_
n N
in
n+1 N
in
. Aqu hemos usado que x{x} es
un termino absoluto, con lo que si n es un conjunto interno entonces (n+1)
in
=
(n {n})
in
= n {n}.
M as a un, tenemos que 0

N
in
y
_
n

N
in
n + 1

N
in
, pues si n es
est andar entonces n+1 es est andar (por transferencia). El principio de inducci on
nos da entonces que N

N
in
.
Supongamos ahora que A =

N
in
\ N 6= . Entonces A
S
A 6= . Todo
conjunto interno que contenga n umeros naturales
in
contiene un mnimo n umero
natural
in
(esto es la versi on interna de un teorema de ZFC). Sea m el mnimo
n umero natural
in
de
S
A. Como
S
A es un conjunto est andar y m est a denido
a partir de
S
A, el principio de transferencia nos da que m es est andar. En
particular m

N
in
\ N. Necesariamente m 6= 0, luego existe n = m 1, que
280 Apendice B. La teora de Hrbacek
es un n umero natural
in
que adem as es est andar por transferencia. M as a un,
(n < m)
in
. Esto nos lleva a una contradicci on, pues la minimalidad de m fuerza
a que n N, pero entonces tambien m = n + 1 N.
No tiene sentido decir que la suma de n umeros naturales es absoluta. Esto
sera tanto como decir que
_
mn N
in
(m+n)
in
= m+n,
pero si m y n son n umeros naturales
in
no est andar, el miembro derecho no
est a denido (o, en sentido estricto, est a denido como el conjunto vaco y, en
cualquier caso, no se da la igualdad). Lo que si es cierto es algo m as debil que
el car acter absoluto:
_
mn N(m+n)
in
= m+n,
es decir, la suma de n umeros naturales
in
restringida a los n umeros naturales
externos coincide con la usual. Esto es consecuencia de que ambas cumplen la
misma relaci on recurrente. Lo mismo vale para el producto, la exponenciaci on,
la relaci on de orden, etc.
La nitud El concepto de nitud dista mucho de ser absoluto. Podemos
denir los conjuntos nitos como los biyectables con n umeros naturales. Enton-
ces un conjunto interno es nito
in
si es biyectable
in
con un n umero natural
in
.
Observemos que biyectable no es absoluto: ser biyectable
in
con un conjunto
supone que la biyecci on sea interna.
As pues, todo n umero natural
in
es por denici on nito
in
, pero no tiene por
que ser nito. En primer lugar demostramos lo siguiente:
Teorema B.6 Un conjunto interno es est andar y nito
in
si y s olo si es nito
y todos sus elementos son est andar, si y s olo si es est andar y nito.
Demostraci on: Sea x est andar y nito
in
. Entonces su cardinal
in
es un
n umero natural
in
est andar n, luego es un n umero natural, y existe una biyecci on
f : n x interna que, por transferencia, podemos tomar est andar. Como los
elementos de n son todos est andar y la imagen de un conjunto est andar por una
aplicaci on est andar es est andar, concluimos que todos los elementos de x son
est andar. Obviamente x es nito.
Recprocamente, si x es un conjunto nito formado por conjuntos est andar,
probaremos que x es est andar nito
in
por inducci on sobre su cardinal. Si x =
es evidente. Supuesto cierto para conjuntos de cardinal n, pongamos que x tiene
cardinal n + 1. Sea y x y sea x
0
= x \ {y}. Por hip otesis de inducci on x
0
es est andar y nito
in
, pero {y} es interno porque el termino {y} es absoluto,
es est andar por transferencia y es nito
in
porque es un teorema de ZFC que
_
y({y} es nito). Por otra parte, la uni on de conjuntos est andar es est andar y
la uni on de conjuntos nitos
in
es nita
in
, luego x es est andar y nito
in
.
Respecto a la otra equivalencia, por la parte ya probada tenemos que todo
conjunto est andar nito
in
es est andar y nito. Si x es est andar y nito probamos
281
que es nito
in
por el mismo argumento inductivo sobre el cardinal con la variante
siguiente: si el cardinal de x es n + 1, en particular x 6= , luego
_
y y x y
por transferencia
_
st
y y x. Tomamos, pues y x est andar, y el resto del
argumento vale igual.
Para ir m as lejos necesitamos el principio de idealizaci on. Vamos a demostrar
el an alogo al teorema A.3:
Teorema B.7 Sea (x, y, x
1
, . . . , x
n
) una f ormula de ZFC. Entonces
_
in
x
1
x
n
A(
_
st
z(z A z nito
_
in
x
_
y z
in
(x, y))
_
in
x
_
st
y A
in
(x, y)).
Demostraci on: Fijados x
1
, . . . , x
n
y A, suponemos la concurrencia y con-
sideramos el conjunto
S
A, es decir, el conjunto de todos los elementos est andar
del estandarizado de A, que obviamente tiene tama no est andar. En efecto, se
cumple que
_
z(z
S
A z nito
_
in
x
_
in
y z
in
(x, y)),
pues basta tener en cuenta que si z
S
A A es nito, como todos sus
elementos son est andar, el teorema anterior nos da que es est andar, y podemos
aplicar la hip otesis.
El principio de idealizaci on nos da que
_
in
x
_
in
y
S
A
in
(x, y), de donde
se sigue claramente que
_
in
x
_
st
y A
in
(x, y).
La implicaci on contraria es trivial, teniendo en cuenta que los elementos de
un conjunto est andar nito son todos est andar.
Ahora ya podemos demostrar el teorema general sobre existencia de conjun-
tos no est andar:
Teorema B.8 Un conjunto interno A es est andar y nito si y s olo si todos sus
elementos son est andar.
Demostraci on: Aplicamos el teorema anterior a la relaci on dada por
(x, y) x A x 6= y. Esta relaci on es concurrente en A si y s olo si A
no es est andar y nito. Por el teorema anterior esto equivale a que A tiene un
elemento no est andar.
Para completar la compatibilidad con la teora de Nelson observamos que el
teorema siguiente (an alogo de A.6) se deduce del teorema anterior aplicado a la
relaci on (x, y) y x x A x es nito.
Teorema B.9 Todo conjunto interno tiene un subconjunto nito
in
que contiene
a todos sus elementos est andar.
Ahora es claro que todos los resultados que hemos demostrado en los captu-
los precedentes a partir de la axiom atica de Nelson pueden demostrarse tambien
en la teora de Hrbacek.
282 Apendice B. La teora de Hrbacek
El teorema de extensi on La versi on general que hemos dado del principio
de idealizaci on permite demostrar una versi on fuerte del principio de extensi on
(comparar con A.8).
Teorema B.10 (Teorema de extensi on) Si A es un conjunto est andar y f
es una funci on externa en

A con valores internos, entonces f se extiende a una
funci on interna denida en A.
Demostraci on: La funci on f, es decir, el conjunto {(x, f(x)) | x

A},
tiene tama no est andar, por lo que podemos aplicarle el principio de idealizaci on.
Si z f es nito, entonces z es una funci on cuyo dominio es un subconjunto
nito a de

A. El conjunto a es nito y todos sus elementos son est andar,
luego es est andar. Una simple inducci on sobre su cardinal demuestra que z es
interno, y es una funci on que contiene a todos los elementos de f. Aplicamos
el principio de idealizaci on a la f ormula x es una funci on y f, con lo que
obtenemos una funci on F que contiene a f, luego su dominio contiene a

A y
por transferencia a A.
Regularidad y reemplazo Es claro que el axioma de regularidad no se cum-
ple en la teora de Hrbacek. Por ejemplo, si tenemos en cuenta que N
in
no es
sino el conjunto de todos los (ordinales nitos)
in
y que, por lo tanto, la relaci on
de orden es la pertenencia, vemos que el conjunto N
in
\

N no tiene un ele-
mento minimal para la relaci on de pertenencia, lo cual contradice al axioma de
regularidad.
Tampoco podemos suponer el axioma de reemplazo. Para verlo observemos
que si es un ordinal
in
est andar, entonces

est a bien ordenado por la relaci on
de pertenencia. En efecto, si x

y x 6= , entonces
S
x es un subconjunto
interno no vaco de , luego contiene un mnimo ordinal , que por transferencia
ser a est andar. As pues, x y es el mnimo de x.
Si suponemos el axioma de reemplazo podemos considerar el ( unico) ordinal
semejante a

. Ahora probamos que si =

entonces = . En efecto,
tenemos una biyecci on f :



que conserva el orden y, aplicando el
principio de transferencia, es f acil ver que
S
f : es una biyecci on que
conserva el orden, luego = .
Consideremos ahora el conjunto de todos los ordinales de cardinal menor
o igual que el cardinal de N
in
(este cardinal tampoco puede denirse sin el
axioma de reemplazo). De el seleccionamos el conjunto de los ordinales que son
de la forma , para cierto ordinal
in
est andar , y otra vez por el axioma del
reemplazo formamos el conjunto A de todos los ordinales
in
est andar tales que
es inyectable en N
in
.
Ahora bien, el conjunto A contiene a todos los ordinales
in
est andar, pues
si es uno de ellos y F es un conjunto nito
in
tal que

F , existe
f : F N
in
inyectiva, que se restringe a

y prueba que A.
Cambiando A por su estandarizado, podemos suponer que A es est andar.
Tenemos as un conjunto est andar que contiene a todos los ordinales
in
est andar.
283
Por transferencia A contiene a todos los ordinales
in
, pero esto es imposible, pues
se demuestra en ZFC que ning un conjunto contiene a todos los ordinales.
4
Pese a esto, en el apendice C demostraremos que podemos suponer
5
que la
relaci on de pertenencia est a bien fundada en la clase S de todos los conjuntos
est andar, es decir, que para todo conjunto no vaco A S,
_
x A
_
y Ay / x.
Si dispusieramos del axioma de reemplazo, podramos denir por recursi on
transnita sobre la relaci on de pertenencia una aplicaci on que a cada conjunto
est andar x le asigna un conjunto x determinado por la relaci on recurrente
x = { y | y x st y}.
M as a un, la teora general de recursi on transnita permite demostrar que
esta aplicaci on biyecta la clase de todos los conjuntos est andar con una unica
clase transitiva (su colapso transitivo) de modo que se conserva la relaci on de
pertenencia, es decir, x y x y. En el apendice C veremos que podemos
suponer todo esto y que el colapso transitivo de la clase de todos los conjuntos
est andar es precisamente la clase R de todos los conjuntos regulares, es decir,
la clase denida recurrentemente por
R
0
=
_
R
+1
= PR

_
R

=

<
R

R =

,
donde recorre todos los ordinales y todos los ordinales lmite (esta jerarqua
tampoco puede denirse en general sin el axioma de reemplazo). Si suponemos
todo esto, tenemos una aplicaci on : R S que es un isomorsmo para la
relaci on de pertenencia (la inversa de la funci on colapsante).
El lector familiarizado con la teora de modelos b asica comprender a el sig-
nicado de esta aplicaci on: el principio de transferencia arma que S es un
submodelo elemental de la clase I de los conjuntos internos, luego en particular
satisface todos los axiomas de ZFC, y a traves de la funci on colapsante llegamos a
que R tambien los satisface. As pues, aunque no podemos suponer que todos los
conjuntos externos cumplen ZFC, s que podemos suponer que la existe clase de
los conjuntos regulares y que cumple todo ZFC. Todos los conceptos conjuntistas
son absolutos para R, por lo que, por ejemplo, R

= (R
R
)

= R
S
= R
I
= R
in
.
En general, transforma cada conjunto externo en su correspondiente interno.
4
Esta es una diferencia entre la teora de Hrbacek y la de Nelson: en esta s que existe
un ordinal mayor que todos los ordinales est andar, por la versi on fuerte del principio de
idealizaci on.
5
En todo este apartado podemos suponer signica que podemos tomarlo como axioma
de modo que se sigue cumpliendo el teorema de conservaci on.
Apendice C
El teorema de conservaci on
Dedicamos este apendice a demostrar el teorema de conservaci on para la
teora de Nelson y para la de Hrbacek. Nos referiremos a ellas como N y H,
respectivamente. Para la primera arma que todo teorema interno de N es
tambien un teorema de ZFC. Para la segunda arma que si es una f ormula
de ZFC tal que
in
es un teorema de H, entonces es un teorema de ZFC. Los
razonamientos que emplearemos ser an metamatem aticos nitistas es decir,
armaciones sobre la teora axiom atica de conjuntos que no pueden ser entendi-
dos como teoremas de teora alguna o teoremas de ZFC; en ning un caso han
de entenderse como teoremas de la teora de conjuntos no est andar.
C.1 Modelos internos
La herramienta b asica para obtener el teorema de conservaci on ser a la teora
de modelos internos, que fue ideada por von Neumann para probar la inde-
pendencia del axioma de regularidad y que despues uso G odel para probar la
consistencia de la hip otesis del continuo generalizada y el axioma de elecci on.
Seleccionamos cinco variables de (el lenguaje de) H, a las que llamaremos
M, E, I, S y d, de modo que ninguna expresi on que consideremos tendr a estas
variables salvo que lo indiquemos explcitamente. Para cada expresi on de
H que no contenga estas variables, denimos su relativizaci on
MEISd
(que
abreviaremos por
M
) como la expresi on construida seg un las reglas siguientes.
a) x
M
x,
b) (t
1
= t
2
)
M
t
1
= t
2
,
(t
1
t
2
)
M
t
1
E t
2
(t
1
, t
2
) E,
(st t)
M
t S,
(int)
M
t I.
c) ()
M

M
,
285
286 Apendice C. El teorema de conservaci on
d) ( )
M

M

M
,
e) (
_
x)
M

_
x M
M
,
f) (x|)
M
x|((
1
_
x(x M
M
) x M
M
)
((
1
_
x(x M
M
) x = d).
En denitiva (dejando de lado las descripciones, que comentaremos ense-
guida) la relativizaci on de se obtiene cambiando cada por E, cada st por
S, cada in por I y cada
_
x por
_
x M. Por ejemplo,
(
_
u(u x u y))
M

_
u M(u E x u E y)
Para interpretar esta denici on supongamos que (en ZFC) hemos jado un
conjunto M, una relaci on E M M, unos subconjuntos S I M y
un elemento d M. Entonces, si es una f ormula de H, la f ormula
M
es
lo que signica si llamamos conjuntos a los elementos de M unicamente,
conjuntos est andar a los elementos de S, conjuntos internos a los conjuntos
de I y consideramos que la relaci on de pertenencia es la relaci on E.
Por ejemplo, (x y)
M
es la f ormula que acabamos de calcular, de modo que
x es un subconjunto de y visto desde M si todo elemento de M que pertenece
en M a x (es decir, que cumple u E x), tambien pertenece en M a y.
Similarmente
M
est a denido como el unico elemento x M que cumple
_
u Mu E x, si es que existe tal elemento, o bien d si no existe.

Esta es la idea subyacente a la denici on de relativizaci on, pero en sentido


estricto lo unico que hemos hecho ha sido asociar a cada expresi on de H otra
expresi on
M
de ZFC cuyas variables libres son las mismas de m as quiz a las
variables M, E, I, S y d. Es claro que si es una f ormula de N (resp. de ZFC)
entonces
M
no contiene la variable I (resp. S e I), por lo que podemos hablar
de
MESd
(resp.
MEd
).
Todo lo anterior ha de entenderse metamatem aticamente, mientras que la
denici on siguiente es una denici on en ZFC:
Denici on C.1 Llamaremos modelo a toda quntupla M = (M, E, I, S, d) tal
que E M M, d M, (S I M).

Esta es la denici on de un modelo del lenguaje de H. Similarmente se dene


un modelo para el lenguaje de N suprimiendo la I, mientras que un modelo para
el lenguaje de ZFC se obtiene suprimiendo tambien la S. Para referirnos a este
ultimo caso hablaremos de un modelo est andar. Cuando no indiquemos a que
tipo de modelo nos estamos reriendo o a que lenguaje pertenecen las f ormulas
que estamos considerando ser a porque lo que digamos valdr a en cualquiera de
los tres casos posibles.
En la pr actica diremos que M es un modelo sobrentendiendo que lo es con
un universo M, una relaci on E, una descripci on impropia d, etc.
C.1. Modelos internos 287
La relativizaci on de los signos l ogicos denidos es f acil de calcular:
( )
M

M

M
, ( )
M

M

M
, ( )
M

M

M
.
Para el cuanticador existencial tenemos que
(
_
x)
M

_
x M
M
, (
1
_
x)
M

1
_
x M
M
.
(Comparar con la relativizaci on a conjuntos internos en la teora de Hrbacek,
apendice B)
Teorema C.2 Si t(x
1
, . . . , x
n
) es un termino con las variables libres indicadas.
se prueba en ZFC que si M es un modelo entonces
_
x
1
. . . x
n
M t
M
M.
Demostraci on: Si t x el teorema se reduce a
_
x M x M, lo cual
es obvio, mientras que si t x|(x, x
1
, . . . x
n
) entonces t
M
es el unico elemento
de M que cumple
M
si existe tal elemento (y entonces est a en M), o bien d si
no existe (y en tal caso tambien est a en M por denici on de modelo).
Informalmente hemos de pensar que t
M
es lo que llamara t alguien que cre-
yera que los conjuntos son los elementos de M, que la relaci on de pertenencia
es E, etc.
Denici on C.3 Sea = {
1
, . . . ,
m
} una colecci on nita de f ormulas y sean
x
1
, . . . x
n
las variables que aparezcan libres en ellas. Abreviaremos
M
_
x
1
. . . x
n
M
M
1

M
m
.
De este modo, M es una f ormula cuyas unicas variables libres son M,
E, I, S y d (o menos si consideramos f ormulas y modelos de N o de ZFC). Se
suele leer M es un modelo de y tambien se dice que las f ormulas de son
verdaderas en M. Si tenemos una sola f ormula escribiremos tambien M .
Es importante observar que no podemos denir de este modo que signica
que innitas f ormulas sean verdaderas en un modelo dado, pues tendramos que
formar la conjunci on de innitas f ormulas. La denici on es posible, pero eso
nos llevara a la teora de modelos propiamente dicha en vez de a la teora de
modelos internos, que es la que necesitamos.
El resultado fundamental sobre modelos internos es el siguiente:
Teorema C.4 Sea una colecci on nita de f ormulas y una consecuencia
l ogica de . Se demuestra en ZFC que si M entonces M .
Este teorema se demuestra con un argumento formalmente an alogo al que
prueba el teorema B.2 (ver la observaci on tras este resultado). Hemos de insistir
en el car acter constructivo de la prueba: a partir de una demostraci on de a
partir de las premisas de es posible obtener explcitamente una demostraci on
de que si M entonces M .
288 Apendice C. El teorema de conservaci on
El teorema siguiente es una de las piedras angulares de nuestra demostraci on
del teorema de conservaci on. Recordemos que en ZFC se dene la jerarqua
{V

}, donde recorre los n umeros ordinales, de modo que


V
0
=
_
V
+1
= PV

_
V

=

<
V

,
donde vara en los ordinales lmite, y se demuestra que todo conjunto est a en
un cierto V

.
Por conveniencia, nosotros llamaremos V

a lo que normalmente se llama


V
+
. Los conjuntos V

son transitivos, es decir, si x V

entonces x V

, y
forman una sucesi on creciente: si entonces V

.
Consideraremos a V

como un modelo est andar con la relaci on de pertenencia


usual y con d = .
Teorema C.5 (Teorema de Reexi on) Sea = {
1
, . . . ,
m
} una colecci on
nita de f ormulas internas cuyas variables libres esten entre x
1
, . . . , x
n
. Enton-
ces se demuestra en ZFC que existe un ordinal lmite tal que
_
x
1
. . . x
n
V

(
V

i

i
), i = 1, . . . , m.
Demostraci on: Es claro que podemos construir una sucesi on nita de
expresiones
1
, . . . ,
r
con las propiedades siguientes:
a) Las f ormulas
1
, . . . ,
m
est an entre
1
, . . . ,
r
.
b) Todas las subexpresiones de cada
i
aparecen previamente en la sucesi on.
c) Si
i
x|, entonces
1
_
x (y, por consiguiente, ) aparece previamente
en la sucesi on.
Vamos a construir una sucesi on de ordinales
0
<
1
< Tomamos como

0
cualquier ordinal. Supongamos denido
k
.
Si
i

_
x(x, x
1
, . . . , x
n
) para cada n-tupla (x
1
, . . . , x
n
) V
n

k
deni-
mos f(x
1
, . . . , x
n
) como el mnimo ordinal tal que existe x V

tal que
(x, x
1
, . . . , x
n
) si es que existe tal x, y = 0 en caso contrario.
Sea
i
k
el mnimo ordinal tal que V

i
k
contiene el rango de f, es decir, tal
que f : V
n

k
V

i
r
.
Si
i
no es de esta forma, denimos
i
r
= 0. Sea
r+1
el m aximo entre
r
+1
y todos los
i
r
. El supremo de la sucesi on {
r
} es un ordinal lmite . Veamos
que cumple lo pedido.
Por construcci on, (x|x = x) V

y si
i

_
x(x, x
1
, . . . , x
n
) y para ciertos
x
1
, . . . , x
n
V

existe un x tal que (x, x


1
, . . . , x
n
), entonces existe un x que
cumple esto y adem as est a en V

.
C.1. Modelos internos 289
Vamos a probar por inducci on sobre i que si
i
es un termino con variables
libres x
1
, . . . , x
n
entonces
_
x
1
x
n
V

(
i
(x
1
, . . . x
n
) =
V

i
(x
1
, . . . x
n
))
y si
i
es una f ormula entonces
_
x
1
x
n
V

(
i
(x
1
, . . . x
n
)
V

i
(x
1
, . . . x
n
)).
Como las
j
del enunciado est an entre las
i
, el teorema quedar a probado.
Si
i
x entonces lo que hay que probar es que
_
x V

x = x, lo cual es
obvio.
Si
i
t
1
t
2
, entonces los terminos t
1
y t
2
aparecen antes en la sucesi on,
luego por hip otesis de inducci on
_
x
1
x
n
V

(t
1
= t
V

1
t
2
= t
V

2
).
Lo que hemos de probar es que
_
x
1
x
n
V

(t
1
t
2
t
V

1
t
V

2
), lo cual
es obvio. El caso en que
i
t
1
= t
2
es identico a este.
Si
i
, por hip otesis de inducci on
_
x
1
x
n
V

(
V

),
y es claro que esto sigue siendo cierto si negamos ambos terminos. El caso en
que
i
es an alogo.
Si
i

_
x, por hip otesis de inducci on tenemos que
_
xx
1
x
n
V

((x, x
1
, . . . , x
n
)
V

(x, x
1
, . . . , x
n
))
y hemos de probar que
_
x
1
x
n
V

(
_
x(x, x
1
, . . . , x
n
)
_
x V

(x, x
1
, . . . , x
n
)).
Ahora bien, jados x
1
, . . . , x
n
V

, si suponemos que
_
x y tomamos un
x V

, tenemos (x, x
1
, . . . , x
n
) y por hip otesis de inducci on
V

(x, x
1
, . . . , x
n
),
es decir, se cumple
_
x V

.
Recprocamente, si
_
x existe un x que cumple (x, x
1
, . . . , x
n
) y por
construcci on de existe un x V

tal que (x, x


1
, . . . , x
n
). Por hip otesis de
inducci on
V

(x, x
1
, . . . , x
n
), luego no se cumple
_
x V

.
Supongamos nalmente que
i
x|. Entonces, jados x
1
, . . . , x
n
V

, por
hip otesis de inducci on
1
_
x(x, x
1
, . . . , x
n
)
1
_
x V

(x, x
1
, . . . , x
n
)
y
_
x V

((x, x
1
, . . . , x
n
)
V

(x, x
1
, . . . , x
n
)).
290 Apendice C. El teorema de conservaci on
Supongamos que se dan las dos unicidades y sea x el unico conjunto de
V

que cumple
V

. Entonces tambien cumple , luego es de hecho el unico


conjunto que cumple . Por tanto (x|) = x = (x|)
V

.
Si no se dan las unicidades, (x|) = = (x|)
V

.
El ultimo concepto que necesitamos sobre modelos internos es el de inmersi on
elemental:
Denici on C.6 Una inmersi on elemental j : MM
0
entre dos modelos (del
mismo lenguaje) es una aplicaci on j : M M
0
tal que para toda f ormula
(x
1
, . . . , x
n
) con las variables libres indicadas se cumple
_
x
1
x
n
M(
M
(x
1
, . . . , x
n
)
M
0
(j(x
1
), . . . , j(x
n
))). (C.1)
Nota Esta denici on carece de sentido tal y como est a enunciada, pues la
armaci on para toda f ormula carece de signicado matem atico. Fijada
una colecci on nita de f ormulas , podemos denir una -inmersi on elemental
como la conjunci on de las equivalencias (C.1) para cada una de las f ormulas
de . En la pr actica, cuando tomemos como hip otesis que una aplicaci on
j es una inmersi on elemental se entender a que lo es respecto a una colecci on
nita de f ormulas sucientemente grande como para que se cumpla la tesis que
queremos demostrar, mientras que cuando demostremos que una aplicaci on j es
una inmersi on elemental signicar a que, para toda colecci on nita de f ormulas
es posible demostrar que j es una -inmersi on elemental.
Por ejemplo, podemos decir que toda inmersi on elemental es inyectiva, apli-
cando la denici on a la f ormula x = y, con lo cual hay que entender que toda
inmersi on elemental respecto a una colecci on nita de f ormulas que contenga a
x = y es inyectiva.
Teorema C.7 Si j : M M
0
es una inmersi on elemental tal que j(d) = d
0
,
entonces para todo termino t(x
1
, . . . , x
n
) se cumple
_
x
1
x
n
M(j(t
M
(x
1
, . . . , x
n
)) = t
M
0
(j(x
1
), . . . , j(x
n
))).
Demostraci on: Si t es una variable es trivial, y si t = x|, distinguimos
dos casos: Si se cumple que
1
_
x M
M
(x, x
1
, . . . , x
n
), entonces
1
_
x M
0

M
0
(x, j(x
1
), . . . , j(x
n
))
(pues estas f ormulas son las relativizaciones de
1
_
x a M y M
0
). Pero m as
a un, si x M es el unico que cumple
M
(x, x
1
, . . . , x
n
), entonces se cumple

M
(j(x), j(x
1
), . . . , j(x
n
)). Por consiguiente x = (x|)
M
y j(x) = (x|)
M
0
.
Si no se da la unicidad en M, tampoco se da en M
0
, luego j((x|)
M
) =
j(d) = d
0
= (x|)
M
0
.
Terminamos esbozando el plan de la prueba del teorema de conservaci on.
Suponemos que una f ormula interna es demostrable a partir de los axiomas
C.2. Ultrapotencias 291
de N. Aunque los axiomas son innitos, en una demostraci on s olo puede aparecer
una cantidad nita de ellos. Sea la colecci on de todos ellos. No perdemos
generalidad si suponemos que no tiene variables libres.
El resultado principal que nos falta por probar es (aproximadamente) el
siguiente:
Si es una colecci on nita de axiomas de N y es una f ormula
interna sin variables libres, existe una colecci on nita de axiomas
de ZFC de modo que en ZFC se demuestra que si el modelo est andar
M = V

cumple M entonces existe un modelo no est andar N


tal que N y adem as M si y s olo si N .
De hecho tendremos una inmersi on elemental j : MN, de modo que los
conjuntos est andar de N ser an los de la imagen de j.
Admitiendo esto, la prueba del teorema de conservaci on es como sigue: con-
sideramos la colecci on correspondiente a los axiomas con los que se prueba
, aplicamos el teorema de reexi on a las f ormulas de y a , de modo que
encontramos un modelo M = V

tal que M y adem as M . El


teorema que nos falta probar nos da un modelo no est andar N tal que N ,
luego N , luego M , luego . En denitiva, hemos probado en ZFC.
Insistimos en que la prueba es totalmente constructiva: si tenemos una de-
mostraci on explcita de a partir de los axiomas no est andar , el teorema que
vamos a probar nos da explcitamente la colecci on , el teorema de reexi on nos
da una prueba explcita en ZFC de que M y de la implicaci on M .
El teorema que nos falta probar nos da una prueba explcita en ZFC de que
M N y M N , con lo que tenemos una prueba explcita
de que N y N , el teorema C.4 nos da una prueba explcita en ZFC
de que N y terminamos con una prueba explcita de en ZFC.
El argumento para H es ligeramente m as complicado, pero a grandes rasgos
coincide con este.
C.2 Ultrapotencias
En esta secci on veremos c omo construir modelos no est andar a partir de
modelos est andar. Recordemos algunas deniciones conjuntistas:
Denici on C.8 Un ltro en un conjunto I es una familia F de subconjuntos
de I con las propiedades siguientes:
a) I F, / F,
b) Si X Y I y X F entonces Y F,
c) Si X, Y F entonces X Y F.
292 Apendice C. El teorema de conservaci on
Un ultraltro U en un conjunto I es un ltro con la propiedad adicional de
que si X I entonces X U o I \ X U.
Toda familia de subconjuntos de I con la propiedad de la intersecci on nita
(es decir, tal que la intersecci on de cualquier subfamilia nita es no vaca) est a
contenida en un ltro, a saber, en el ltro de todos los subconjuntos de I que
contienen una intersecci on nita de conjuntos de la familia.
De aqu se sigue f acilmente que un ultraltro es un ltro maximal respecto de
la inclusi on, por lo que el lema de Zorn nos da que todo ltro est a contenido en
un ultraltro. En particular, toda familia de subconjuntos de I con la propiedad
de la intersecci on nita est a contenida en un ultraltro. El teorema siguiente es
inmediato:
Teorema C.9 Sean V e I dos conjuntos, sea U un ultraltro en I y sea V
I
el
conjunto de todas las aplicaciones de I en V . La relaci on
f =
U
g {i I | f(i) = g(i)} U
es una relaci on de equivalencia en V
I
.
Denici on C.10 Si V es un conjunto y U es un ultraltro en un conjunto I,
llamaremos ultrapotencia de V respecto a U al conjunto cociente

V = V
I
/U
de V
I
respecto de la relaci on de equivalencia =
U
.
Denimos la inmersi on natural j : V

V como la aplicaci on dada por
j(x) = [c
x
], donde c
x
: I V es la aplicaci on constante c
x
(i) = x. Es claro
que j es inyectiva.
Supongamos ahora que (V, E, d) es un modelo est andar. Podemos denir la
relaci on

E en

V mediante
[f]

E[g] {i I | f(i) E g(i)} U.


Es inmediato comprobar que esta denici on no depende de los representantes
f y g de las clases de equivalencia, as como que la aplicaci on j cumple
_
xy V (x E y j(x)

Ej(y)).
El teorema fundamental sobre ultrapotencias es el siguiente:
Teorema C.11 Sea una f ormula interna con x
1
, . . . , x
n
como variables libres.
Entonces en ZFC se demuestra lo siguiente: Si (V, E, d) es un modelo est andar
y

V es una ultrapotencia, entonces (

V,

E, j(d)) es un modelo est andar tal que


_
f
1
f
n
V
I
_

V
k
([f
1
], . . . , [f
n
]) {i I |
V
k
(f
1
(i), . . . , f
n
(i))} U
_
.
En particular j : V

V es una inmersi on elemental.


C.2. Ultrapotencias 293
Demostraci on: Sea
1
, . . .
r
una sucesi on de expresiones en las mismas
condiciones exigidas en la prueba del teorema de reexi on. Veamos por in-
ducci on sobre k que si
k
es un termino y f
1
, . . . , f
n
V
I
entonces

V
i
([f
1
], . . . , [f
n
]) = [g],
donde g : I V viene dada por g(i) =
V
k
(f
1
(i), . . . , f
n
(i)), mientras que si

k
es una f ormula entonces cumple la propiedad del enunciado.
Si
k
x
1
tenemos que g = f
1
, luego el resultado es trivial.
Si
k
t
1
t
2
y f
1
, . . . , f
n
V
I
, tenemos que
t

V
1
([f
1
], . . . , [f
n
]) = [g
1
], t

V
2
([f
1
], . . . , [f
n
]) = [g
2
],
donde g
1
y g
2
est an determinados por la hip otesis de inducci on. As,

V
k
([f
1
], . . . , [f
n
]) [g
1
]

E[g
2
] {i I | g
1
(i) E g
2
(i)} U
{i I | t
V
1
(f
1
(i), . . . , f
n
(i)) E t
V
2
(f
1
(i), . . . , f
n
(i))} U
{i I |
V
k
(f
1
(i), . . . , f
n
(i)))} U.
El caso
k
t
1
= t
2
es similar, usando la denici on de =
U
.
Si
k
, por hip otesis de inducci on tenemos que

V
([f
1
], . . . , [f
n
]) {i I |
V
(f
1
(i), . . . , f
n
(i))} U,
y como U es un ultraltro

V
([f
1
], . . . , [f
n
]) V
I
\ {i I |
V
(f
1
(i), . . . , f
n
(i))} U,
pero esto equivale a

V
([f
1
], . . . , [f
n
]) {i I |
V
(f
1
(i), . . . , f
n
(i))} U,
que es lo que haba que probar.
Si
k
probaremos la coimplicaci on de las negaciones:
( )

V
([f
1
], . . . , [f
n
])

V
([f
1
], . . . , [f
n
])

V
([f
1
], . . . , [f
n
]).
Usando la hip otesis de inducci on y el caso anterior esto equivale a
{i I |
V
(f
1
(i), . . . , f
n
(i))} U {i I |
V
(f
1
(i), . . . , f
n
(i))} U
{i I | (
V

V
)(f
1
(i), . . . , f
n
(i))} U
{i I | ( )
V
(f
1
(i), . . . , f
n
(i))} U.
294 Apendice C. El teorema de conservaci on
Usando que U es un ultraltro esto equivale a que
{i I |
V
k
(f
1
(i), . . . , f
n
(i))} / U,
que es lo que tenamos que probar.
Si
k

_
x probaremos tambien la coimplicaci on de las negaciones:

V
k
([f
1
], . . . , [f
n
])
_
f V
I

V
([f], [f
1
], . . . , [f
n
].)
Usando la hip otesis de inducci on y el caso ya probado, esto equivale a
_
f V
I
{i I |
V
(f(i), f
1
(i), . . . , f
n
(i))} U. (C.2)
Falta probar que esto equivale a
{i I |
_
x V
V
(x, f
1
(i), . . . , f
n
(i))} U. (C.3)
En efecto, si existe f seg un (C.2) es claro que el conjunto que est a en U seg un
(C.2) est a contenido en el conjunto que ha de estar en U seg un (C.3), luego se
cumple (C.3). Recprocamente, si se cumple (C.3), para cada i en el conjunto
indicado tomamos f(i) V de modo que se cumpla
V
(f(i), f
1
(i), . . . , f
n
(i)), y
si i no est a en el conjunto dado por (C.3) tomamos como f(i) cualquier elemento
de V . Es claro que f cumple (C.2).
Si
k
x|, sea g(i) =
V
r
(f
1
(i), . . . , f
n
(i)). Por hip otesis de inducci on
1
_
x

V
(x, [f
1
], . . . , [f
n
]) {i I |
1
_
x V
V
(x, x
1
, . . . , x
n
)} U.
Llamemos X al conjunto de la derecha. Si se da la unicidad, entonces X U
y hemos de probar que [g] es el unico elemento de

V que cumple

V
. Ahora
bien, por la unicidad basta ver que

V
([g], [f
1
], . . . , [f
n
]) y por hip otesis de
inducci on esto sucede si y s olo si
{i I |
V
(g(i), f
1
(i), . . . , f
n
(i))} U,
pero es que X est a contenido en este conjunto.
Si no se da la unicidad, entonces I \ X U y para cada i I \ U tenemos
que g(i) = d = c
d
(i), luego [g] = j([d]) =

V
r
([f
1
], . . . , [f
n
]).
En particular, si no tiene variables libres hemos obtenido que
V

V .
A su vez esto implica que si V satisface una colecci on nita de axiomas de
ZFC entonces

V tambien los satisface (los axiomas de ZFC no tienen variables
libres).
Podemos convertir a

V en un modelo no est andar (del lenguaje de N) de-
niendo S = j[V ], es decir, tomando como conjuntos est andar las im agenes por
j de los conjuntos de V .
C.2. Ultrapotencias 295
Teorema C.12 Si V es un modelo est andar y

V es una ultrapotencia, enton-
ces

V cumple el principio de transferencia de N.
Demostraci on: M as precisamente, lo que vamos a probar es que si

_
st
x
1
x
n
(
_
st
x
_
x)
es un caso particular del principio de transferencia (donde es una f ormula de
ZFC) entonces en ZFC se demuestra que si V es un modelo est andar y

V una
ultrapotencia entonces

V .
En efecto, hemos de probar

V
, que es la f ormula
_
x
1
x
n
S(
_
x S

V
(x, x
1
, . . . , x
n
)
_
x

V
(x, x
1
, . . . , x
n
)).
Fijamos j(x
1
), . . . , j(x
n
) S, donde x
1
, . . . , x
n
V . Suponemos que
_
x S

V
(x, j(x
1
), . . . , j(x
n
))
o, lo que es lo mismo,
_
x V

V
(j(x), j(x
1
), . . . , j(x
n
)).
Por el teorema anterior esto equivale a
_
x V
V
(x, x
1
, . . . , x
n
) (
_
x)
V
(x
1
, . . . , x
n
),
y aplicando otra vez el teorema (
_
x)

V
(j(x
1
), . . . , j(x
n
)). As pues,
_
x

V
(x, j(x
1
), . . . , j(x
n
)),
como tenamos que probar.
Ahora probaremos que si el ultraltro U se escoge adecuadamente entonces

V satisface una forma debil del principio de idealizaci on.


Denici on C.13 Sea V un conjunto y

V una ultrapotencia. Para cada X V
denimos

X

V como el conjunto dado por


[f]

X {i U | f(i) X} U.
Se comprueba inmediatamente que la denici on no depende de la elecci on
del representante f, as como que se cumplen las propiedades siguientes:

(X Y ) =

X

Y,

(X Y ) =

X

Y,

(V \ X) =

V \

X.
_
x V (x X j(x)

X).
Llamemos

V al conjunto de todos los ultraltros en V y sea t :

V

V la
aplicaci on dada por t() = {X PV |

X}. Diremos que la ultrapotencia

V es adecuada si la aplicaci on t es suprayectiva.


296 Apendice C. El teorema de conservaci on
Teorema C.14 Todo conjunto tiene una ultrapotencia adecuada.
Demostraci on: Sea V un conjunto y sea I el conjunto de todos los sub-
conjuntos nitos de PV . Para cada X V denimos

X = {i I | X i}. Es
claro que si X
1
, . . . , X
n
son subconjuntos de V entonces

X
1


X
n
6= , pues
contiene a i = {X
1
, . . . , X
n
}. Por consiguiente la familia de los conjuntos

X est a
contenida en un ultraltro U sobre I. Sea

V la ultrapotencia correspondiente
y veamos que es adecuada.
Para ello tomamos un ultraltro F en V y para cada i I llamamos A
i
a la intersecci on de todos los elementos de i que est an en F (entendiendo que
A
i
= V si no hay ninguno). As A
i
6= .
Para cada i I elegimos f(i) A
i
y llamamos = [f]

V . Basta probar
que t() = F. En efecto, si X F entonces para cada i I tal que X i
tenemos que A
i
X, luego f(i) X. As pues,

X {i I | f(i) X}, lo que
prueba que este ultimo conjunto est a en U, es decir,

X. Por denici on de
t esto signica que X t(). Con esto hemos probado que F t(), pero como
ambos conjuntos son ultraltros se ha de dar la igualdad F = t().
Teorema C.15 Sea (x, y, x
1
, . . . , x
m
) una f ormula de ZFC con las variables
libres indicadas. Entonces en ZFC se demuestra que si V es un modelo est andar
de una cierta colecci on nita de axiomas de ZFC y

V es una ultrapotencia
adecuada entonces

V
_
st
x
1
x
m
(
_
st
z(z nito
_
x
_
y z (x, y))
_
x
_
st
y, (x, y)).
Demostraci on: La relativizaci on de esta f ormula es
_
x
1
x
m
S(
_
z S(z nito

_
x

V
_
y

V (y E z

V
(x, y))

_
x

V
_
y S

V
(x, y)).
Fijamos m elementos de S, de la forma j(x
1
), . . . , j(x
m
), con x
i
V . Supo-
nemos
_
z S
_
z nito

_
x

V
_
y

V (y E z

V
(x, y, j(x
1
), . . . , j(x
m
))
_
.
Sea la colecci on de axiomas necesarios para demostrar en ZFC la existencia
de {x}, la existencia de la uni on de dos conjuntos, que la uni on de dos conjuntos
nitos es nita y que {x} es siempre un conjunto nito.
Tomemos y
1
, . . . , y
n
V . Del hecho de que V se sigue que existe un
z V tal que z es nito
V
y y
i
E z para todo i = 1, . . . , n.
Como j es elemental, tenemos que j(z) es nito

V
y j(y
i
)

Ej(z) para todo


i = 1, . . . , n. Por la hip otesis tenemos que
_
x

V
_
y

V (y E z

V
(x, y))
C.3. Lmites inductivos 297
y, como j es elemental, existe un x V tal que
V
(x, y
i
, x
1
, . . . , x
m
) para todo
i = 1, . . . n. En otros terminos, hemos probado que la familia de los conjuntos
{x V |
V
(x, y, x
1
, . . . , x
m
)} para y V
tiene la propiedad de la intersecci on nita, luego est an contenidos en un ultral-
tro F de V . Como la ultrapotencia es adecuada, existe

V tal que F = t().


De este modo, si j(y) S tenemos que {x V |
V
(x, y, x
1
, . . . , x
m
)} F,
luego

{x V |
V
(x, y, x
1
, . . . , x
m
)}, y por el teorema C.11 esto implica
que

V
(, j(y), j(x
1
), . . . , j(x
m
)). Por consiguiente
_
x

V
_
y S

V
(x, y, j(x
1
), . . . , j(x
m
))
(tomando x = ), que es lo que tenamos que demostrar.
Con esto tenemos que

V cumple (una implicaci on de) el principio de ideali-
zaci on de N, pero exigiendo adem as que los par ametros sean est andar. Desgra-
ciadamente el caso general no tiene por que cumplirse en

V , lo cual nos lleva a
renar la construcci on.
C.3 Lmites inductivos
Denici on C.16 Un sistema inductivo es una familia {M

}
<
de conjuntos
no vacos, donde es un ordinal lmite, junto con una familia de aplicaciones
inyectivas j

0 : M

0 tales que si <


0
<
00
< entonces se cumple
la relaci on j

0 j

00 = j

00 .
Diremos que {x

0
<
es una sucesi on inductiva si para cada se cumple
x

y para
0
<
0
< se cumple que x

0 = j

0 (x

).
Denimos el lmite inductivo de la familia como el cociente del conjunto
de todas las sucesiones inductivas respecto a la relaci on de equivalencia que
identica dos sucesiones si coinciden en su dominio com un.
Si llamamos M al lmite inductivo, denimos las aplicaciones j

: M

M
mediante j

(x) = [{j

0 (x)}
<
0
<
]. Es inmediato comprobar que para todos
los ordinales <
0
< se cumple la relaci on j

0 j

0 = j

, as como que todo


x M es de la forma j

(y) para un cierto < y un cierto y M

.
Supongamos ahora que los conjuntos M

son modelos est andar y que si


<
0
< entonces
_
xy M

(x E

y j

0 (x) E

0 j

0 (y)). Supongamos
tambien que j

0 (d

) = d

0 . Entonces podemos convertir al lmite inductivo M


en un modelo est andar con la relaci on
x E y
_
<
_
x
0
y
0
M

(x = j

(x
0
) y = j

(y
0
) x
0
E

y
0
).
De las hip otesis se desprende que esta denici on no depende de la repre-
sentaci on de x, y como x = j

(x
0
), y = j

(y
0
). Tomamos como descripci on
impropia a j

(d

), para cualquier .
298 Apendice C. El teorema de conservaci on
Teorema C.17 Si M es el lmite inductivo de un sistema de modelos est andar
para el que las aplicaciones j

0 son inmersiones elementales, entonces las apli-


caciones j

tambien lo son.
Demostraci on: Vamos a probar que todas las j

satisfacen la denici on de
inmersi on elemental para una f ormula dada. Par ello tomamos una sucesi on de
expresiones
1
, . . . ,
r
en las mismas condiciones que en la prueba del teorema
de reexi on y que la contenga. Probaremos que si
k
es una f ormula entonces
cada j

cumple la denici on de inmersi on elemental para ella y si es un termino


entonces cumple el teorema C.7.
En efecto, si
k
x el teorema se reduce a j

(x) = j

(x).
Si
k
t
1
t
2
, usando la hip otesis de inducci on vemos que

k
(x
1
, . . . , x
n
) t
M

1
(x
1
, . . . , x
n
) E

t
M

1
(x
1
, . . . , x
n
)
j

(t
M

1
(x
1
, . . . , x
n
)) E j

(t
M

1
(x
1
, . . . , x
n
))
t
M
1
(j

(x
1
), . . . , j

(x
n
)) E t
M
2
(j

(x
1
), . . . , j

(x
n
))

M
k
(j

(x
1
), . . . , j

(x
n
)).
El caso
k
t
1
= t
2
es identico.
Si
k
o
k
la conclusi on se sigue inmediatamente de la
hip otesis de inducci on.
Si
k

_
x, por hip otesis de inducci on tenemos que
_
xx
1
x
n
M

(
M

(x, x
1
, . . . , x
n
)
M
(j

(x), j

(x
1
), . . . , j

(x
n
)))
y hemos de probar que
_
x
1
x
n
M

(
_
x M

(x, x
1
, . . . , x
n
)
_
x M
M
(x, j

(x
1
), . . . , j

(x
n
))).
Una implicaci on es inmediata. Supongamos que
_
x M

(x, x
1
, . . . , x
n
)
y tomemos x M. Entonces existe un ordinal tal que < < y x = j

(x
0
),
con x
0
M

. Usando que j

es elemental concluimos que


_
x M

(x, j

(x
1
), . . . , j

(x
n
)).
En particular
M

(x
0
, j

(x
1
), . . . , j

(x
n
)). Ahora usamos la hip otesis de
inducci on para , con lo que

M
(j

(x
0
), j

(j

(x
1
)), . . . , j

(j

(x
n
))),
que es lo mismo que
M
(x, j

(x
1
), . . . , j

(x
n
)).
Si
k
x|, por hip otesis de inducci on tenemos que
1
_
x M

(x, x
1
, . . . , x
n
)
1
_
x M
M
(j

(x
1
), . . . , j

(x
n
)).
C.3. Lmites inductivos 299
Si se da la unicidad y x M

es el unico x que cumple


V

, por la hip otesis


de inducci on para tenemos que j

(x) cumple
M
, luego es el unico que lo
cumple. En denitiva j

((x|)
V

) = (x|)
M
.
Si no se da la unicidad, entonces (x|)
V

= d

y (x|)
M
= j

(d

), luego
tambien tenemos la relaci on que buscamos.
El teorema siguiente es inmediato:
Teorema C.18 Si V es un modelo est andar arbitrario y es un ordinal lmite,
existe una familia de modelos est andar {

V }

y una familia de inmersiones


elementales j

:

V

V , para < , de manera que


a)
0
V = V .
b) Para cada < el modelo
+1
V es una ultrapotencia de

V respecto a
un cierto ultraltro U

y j
+1
es la inmersi on natural can onica de la
ultrapotencia.
c) Para cada ordinal lmite los modelos {

V }
<
con las correspon-
dientes inmersiones j

forman un sistema inductivo y



V es el corres-
pondiente lmite inductivo, de modo que las inmersiones j

son las co-


rrespondientes a este lmite.
En estas circunstancias diremos que el modelo

V es un ultralmite del mo-
delo V . Es claro que los ultraltros U

pueden denirse recurrentemente a lo


largo del proceso de construcci on de los modelos

V . En particular podemos
denir U

en terminos de

V y en particular podemos exigir que
+1
V sea una
ultrapotencia adecuada de

V . En tal caso diremos que

V es un ultralmite
adecuado de V .
En la prueba del teorema de conservaci on para N necesitamos unicamente un
ultralmite numerable (es decir, con = ). En efecto, si partimos de cualquier
modelo est andar V y formamos un ultralmite

V =

V , tenemos la inmersi on
elemental j = j
0
: V

V . Convertimos a

V en un modelo del lenguaje de
N deniendo S = j[V ]. El hecho de que j sea una inmersi on elemental permite
probar, con el mismo argumento que en C.12, que

V cumple el principio de
transferencia:
Teorema C.19 Si V es un modelo est andar y

V es un ultralmite numerable,
entonces

V cumple el principio de transferencia de N.
La diferencia es que ahora podemos demostrar el principio de idealizaci on
sin restricciones:
Teorema C.20 Si V es un modelo est andar en el que se cumpla una cierta co-
lecci on nita de axiomas de ZFC y

V es un ultralmite adecuado numerable,
entonces

V cumple la implicaci on del principio de idealizaci on de N.
300 Apendice C. El teorema de conservaci on
Demostraci on: Fijamos una f ormula interna (x, y, x
1
, . . . , x
m
) y hemos
de probar que

V
_
x
1
x
m
__
st
z(z nito
_
x
_
y z (x, y))
_
x
_
st
y, (x, y)
_
,
es decir, que
_
x
1
x
m

V (
_
z S(z nito

_
x

V
_
y

V (y E z

V
(x, y))

_
x

V
_
y S

V
(x, y)).
Si x
1
, . . . , x
n


V existe un natural m tal que x
1
, . . . , x
n
j
m
[
m
V ]. Diga-
mos que x
i
= j
m
(x
0
i
), con x
0
i

m
V . Suponemos
_
z S(z nito

_
x

V
_
y

V (y E z

V
(x, y, j
m
(x
0
1
), . . . , j
m
(x
0
n
))).
Ahora usamos que j
m+1
:
m+1
V

V es una inmersi on elemental, con lo


que
_
z
m+1
S(z nito
m+1
V

_
x
m+1
V
_
y
m+1
V
(y E
n+1
z
m+1
V
(x, y, j
mm+1
(x
0
1
), . . . , j
mm+1
(x
0
n
))),
donde
m+1
S = j
0m+1
[V ]. En efecto: jado z
m+1
S tal que z es nito
m+1
V
,
entonces j
m+1
(z) S y es nito

V
, luego concluimos que
_
x

V
_
y

V (y E z

V
(x, y, j
m
(x
0
1
), . . . , j
m
(x
0
n
)),
y ahora volvemos a aplicar que j
m+1
es elemental. Aplicamos el teorema C.15
a
m
V , lo cual nos da que
_
x
m+1
V
_
y
m+1
S
m+1
V
(x, y, j
mm+1
(x
0
1
), . . . , j
mm+1
(x
0
n
)).
Fijamos un x
m+1
V que cumpla esto y observamos que entonces
_
y S

V
(j
m+1
(x), y, x
1
, . . . , x
n
).
En efecto, todo elemento de S es de la forma j(y), para un y
m+1
S que
ha de cumplir

m+1
V
(x, y, j
mm+1
(x
0
1
), . . . , j
mm+1
(x
0
n
)).
Usando de nuevo que j
m+1
es elemental pasamos a

V
(j
m+1
(x), j
m+1
(y), x
1
, . . . , x
n
).
En denitiva tenemos que
_
x

V
_
y S

V
(x, y, x
1
, . . . , x
n
),
como tenamos que probar.
C.3. Lmites inductivos 301
Para los axiomas restantes nos restringiremos al caso en que V es un modelo
V

, para un cierto ordinal lmite . Puede probarse que si V

cumple sucientes
axiomas de ZFC y z V

entonces z es nito
V

si y s olo si z es nito, pero


podemos a nadir esto como hip otesis en lugar de demostrarlo:
Teorema C.21 Existe un conjunto nito de axiomas de ZFC tal que en ZFC
se demuestra que si es un ordinal lmite tal que V

y
_
z V

(z es nito
V

z es nito)
entonces toda ultrapotencia adecuada numerable

V de V

cumple los principios


de transferencia, idealizaci on y estandarizaci on de N.
Demostraci on: Veamos que

V
_
st
z(z nito
_
y z st y). Esto
equivale a probar que
_
z S(z nito

_
y

V (y

Ez y S)).
Un tal z ser a de la forma z = j(z
0
), donde z
0
V

y como j es elemental
tenemos que z
0
es nito
V

. Por hip otesis z


0
es nito, digamos z
0
= {y
1
, . . . , y
n
}.
Basta probar que si y

Ez entonces y = j(y
i
) para alg un i = 1, . . . , n. Lo
probamos por inducci on sobre n.
Si z
0
= {y
1
} usamos la f ormula
_
y(y z
0
y = y
1
)
V

para concluir
_
y

V (y

Ez y = j(y
1
)), como queramos probar.
Si vale para n 1 llamamos z
00
= {y
1
, . . . , y
n1
}. Como
_
y(y z
0
y z
00
y = y
n
)
V

,
tenemos tambien
_
y

V (y

Ez y

Ej(z
00
) y = j(y
n
)),
y combinando esto con la hip otesis de inducci on llegamos a que si y

Ej(z
00
)
entonces y = j(y
i
) para i = 1, . . . , n 1. La conclusi on es inmediata.
Ahora observamos que la implicaci on del principio de idealizaci on es
una consecuencia l ogica de la sentencia

V
_
st
z(z nito
_
y z st y) que
acabamos de probar que se cumple en

V , luego por C.4 tambien se cumple
la implicaci on. El recproco nos lo da el teorema anterior. Nos falta probar el
principio de estandarizaci on, es decir, que

V
_
x
1
x
n
_
st
x
_
st
y
_
st
z(z y z x (z, x, y, x
1
, . . . , x
n
)).
Fijamos x
1
, . . . , x
n


V y x V . Hemos de probar que existe un y V

tal que
_
z S(z

Ej(y) z

Ej(x)

V
(z, j(x), j(y), x
1
, . . . , x
n
)).
Sea y = {z x |

V
(j(z), j(x), j(y), x
1
, . . . , x
n
)} V

. De este modo, si
j(z) S, con z V

, se cumple
302 Apendice C. El teorema de conservaci on
j(z)

Ej(y) z y z x

V
(j(z), j(x), j(y), x
1
, . . . , x
n
)
j(z)

Ej(x)

V
(j(z), j(x), j(y), x
1
, . . . , x
n
).
Con esto llegamos al resultado nal para la N:
Teorema C.22 Si es cualquier colecci on nita de axiomas de N y es una
f ormula interna sin variables libres, en ZFC se demuestra que existe un modelo
no est andar M tal que M y
M .
Demostraci on: Tomamos una colecci on nita de axiomas de ZFC que
contenga a todos los axiomas de ZFC que haya en y que satisfaga el teorema
C.21. Por el teorema C.5 podemos demostrar que existe un ordinal lmite tal
que V

est a en las hip otesis de C.21 y adem as


V

. Llamamos M a un
ultralmite adecuado numerable de V

. Entonces M , luego en particular M


cumple todos los axiomas de ZFC que hay en . Adem as
V
M . Por el
teorema C.21 podemos probar que M cumple los axiomas externos que haya en
, con lo que tenemos todas las propiedades requeridas.
Esto prueba el teorema de conservaci on: si es un teorema interno de la
teora de conjuntos no est andar entonces se demuestra a partir de una cantidad
nita de axiomas . El teorema anterior nos dice c omo demostrar en ZFC la
existencia de un modelo M tal que M y M , el teorema C.4 nos dice
c omo transformar la prueba que conocemos de a partir de los axiomas de la
teora no est andar en una prueba en ZFC de que M y reuniendo todo esto
obtenemos una prueba de en ZFC.
Nota La prueba que hemos visto puede entenderse as: la colecci on de todas
las armaciones matem aticas (internas) que los matem aticos han demostrado
hasta la fecha o se han planteado demostrar es nita. Por el teorema de reexi on
podemos encontrar un ordinal tal que en V

se cumplen todos los teoremas


demostrados hasta la fecha y, adem as, cualquier presunto teorema que un ma-
tem atico pueda estar interesado en probar (dentro de una selecci on nita, pero
arbitrariamente grande, de objetivos interesantes) se cumple en V

si y s olo si
se cumple de verdad.
Si formamos un ultralmite

V obtenemos otro modelo donde se cumplen
todos los teoremas demostrados y tal que un objetivo se cumple si y s olo si se
cumple de verdad. Pero adem as en

V se cumplen los axiomas de la teora de
conjuntos no est andar, por lo que si demostramos un objetivo con la ayuda de
estos axiomas y de cualquier teorema conocido previamente, estamos probando
que nuestro objetivo se cumple en

V , y entonces se cumple de verdad.
C.4. El teorema de conservaci on para la teora de Hrbacek 303
C.4 El teorema de conservaci on para la teora
de Hrbacek
El teorema de conservaci on para H requiere una construcci on m as delicada
que la que acabamos de emplear para N. Concretamente, hemos de demostrar
que si es una f ormula de ZFC tal que
in
es un teorema de H, entonces es
un teorema de ZFC.
Para empezar observamos que si M = (M, E, I, S, d) es un modelo del len-
guaje de H entonces (I, E|
II
, d) es un modelo est andar, y si (x
1
, . . . , x
n
) es
una f ormula de ZFC entonces
_
x
1
x
n
M((
in
)
M
(x
1
, . . . , x
n
)
I
(x
1
, . . . , x
n
)),
pues las restricciones x M x I que aparecen en (
in
)
M
equivalen a las
restricciones x I que aparecen en
I
. Se demuestra por inducci on sobre la
longitud de , probando al mismo tiempo que si es un termino entonces
_
x
1
x
n
M((
in
)
M
(x
1
, . . . , x
n
) =
I
(x
1
, . . . , x
n
)).
Partimos de un modelo V

que cumpla los sucientes axiomas de ZFC y tal


que, para la f ormula que queremos demostrar en ZFC, se cumpla
V

.
Basta construir un modelo M en el que se cumplan los axiomas de H junto
con una inmersi on elemental j : V

I, pues si
in
es demostrable en H
entonces tendremos (
in
)
M
, luego
I
, luego
V

y, por consiguiente, . Toda


la prueba ser a constructiva.
En realidad vamos a trabajar simult aneamente con todos los modelos V

,
para < . Por claridad enunciamos en un teorema las caractersticas de la
construcci on que vamos a realizar. Necesitamos una denici on adicional:
Denici on C.23 Una aplicaci on i : M M
0
entre dos modelos est andar es
una inmersi on inicial si es inyectiva, cumple
_
xy M(x E y i(x) E
0
i(y)),
i(d) = d
0
y
_
x M
_
y M
0
(y E
0
i(x)
_
y
0
M y = i(y
0
)).
Teorema C.24 Fijados ordinales lmite y , existe una sucesi on de modelos
est andar W

, con < , junto con aplicaciones inyectivas


i

0 : W

0 , j

: W

(para <
0
< , <
0
) tales que:
a) Si <
0
<
00
entonces j

00

= j

00

.
b) Si <
0
<
00
entonces i

0 i

00 = i

00 .
304 Apendice C. El teorema de conservaci on
c) Si <
0
, <
0
el diagrama siguiente es conmutativo:
W

0
j

0
//
W

0
W

0
OO
j

//
W

0
OO
d) Las aplicaciones j

son inmersiones elementales, y las aplicaciones i

0
son inmersiones iniciales.
e) W
0

= V

, E
0

es la relaci on de pertenencia, i
0

0 es la inclusi on.
f ) Cada W
+1

es una ultrapotencia de W

respecto a un ultraltro U

en
un conjunto I

(donde ninguno de los dos depende de ).


g) Si
0
es un ordinal lmite entonces W

es el lmite inductivo de los


modelos W

, para <
0
.
Demostraci on: Las condiciones del teorema determinan totalmente la
construcci on.

Unicamente hemos de explicitar la construcci on de las inmer-
siones iniciales.
Para = 0, la transitividad de cada V

implica que las inclusiones i


0

0 son
ciertamente inmersiones iniciales.
Supuestos construidos todos los modelos W

para todo < y un < ,


(junto con las aplicaciones correspondientes). Fijamos arbitrariamente un con-
junto I

y un ultraltro U

en I

y denimos W
+1

como la ultrapotencia
correspondiente de W

. Esto nos da autom aticamente las inmersiones elemen-


tales j
+1

.
Denimos i
+1

0 ([f]) = [f
0
], donde f
0
(i) = i

0 (f(i)). Una simple compro-


baci on muestra que i
+1

0 est a bien denida, satisface las relaciones indicadas y


es inicial. Por ejemplo, si [g] E
+1

0 i
+1

0 ([f]), entonces
{i I

| g(i) E

0 i

0 (f(i))} U

.
Como i

0 es inicial, para cada i en este conjunto, g(i) = i

0 (g
0
(i)), donde
g
0
(i) W

. Extendemos g
0
a una funci on sobre todos los ndices, de modo que
tenemos [g
0
] W

y claramente [g] = i

0 ([g
0
]).
Supongamos ahora construidos los modelos W

(con las aplicaciones corres-


pondientes) para todo <
0
, donde
0
es un ordinal lmite. Denimos W

como el lmite inductivo de los modelos W

. Las aplicaciones i

0 se denen
mediante
i

0 ([{x

}]) = [{i

0 (x

)}].
Se demuestra f acilmente que est an bien denidas, que cumplen todas las
relaciones y que son iniciales.
En realidad podemos exigir algo m as:
C.4. El teorema de conservaci on para la teora de Hrbacek 305
Teorema C.25 En las condiciones del teorema anterior, los conjuntos I

y los
ultraltros U

pueden elegirse de modo que cada W


+1

sea una ultrapotencia


adecuada de W

.
Demostraci on: Suponemos construidos los modelos {W

}
<
, con las
correspondientes inmersiones i

0 . Formamos el lmite inductivo W

y tomamos
I

y U

seg un el teorema C.14 aplicado a W

, es decir, I

es el conjunto de
todos los subconjuntos nitos de PW

. Vamos a comprobar que el argumento


de C.14 se rena levemente para probar que todas las ultrapotencias W
+1

son
adecuadas:
Tomamos un ultraltro F W

y para cada i I

llamamos A
i
a la inter-
secci on de los conjuntos (i

)
1
[X], donde X i e (i

)
1
[X] F (entendiendo
que A
i
= W

si no hay ning un X). En particular A


i
6= , por lo que podemos
tomar f(i) A
i
y formamos as un = [f] W
+1

.
Ahora, si Y F y X = i

[Y ] i entonces A
i
Y , luego f(i) Y , lo que a
su vez implica que

X {i I | f(i) Y },
luego el ultimo conjunto est a en U

. Como en C.14 se concluye ahora que


Y t(), con lo que F t() y al ser ultraltros tenemos la igualdad.
Tomamos concretamente = |V

|
+
(el menor cardinal mayor que el cardinal
de V

). Para cada ordinal denimos W

como el lmite inductivo del


sistema formado por los modelos {W

}
<
con las aplicaciones i

0 . Esto nos
da aplicaciones i

: W

. Es f acil ver que son iniciales. As mismo es


claro que V

se identica con W
0
de forma natural.
Si <
0
, denimos j

0
: W

0
como la unica aplicaci on que
cumple i

0
= j

. Es f acil ver que existe. Pronto veremos que j

0
es una inmersi on elemental, pero esto no es inmediato.
Llamamos I = W

e identicamos cada modelo W

con su imagen por la


aplicaci on j

. Es claro entonces que todas las inmersiones que estamos


considerando se identican con inclusiones. En particular
W

=

<
W

.
Recordemos que el ordinal lo proporciona el teorema de reexi on, de modo
que V

satisface una colecci on nita arbitrariamente grande de axiomas de ZFC.


Vamos a exigir que satisfaga tambien las propiedades siguientes (lo cual es po-
sible siempre por el teorema de reexi on)
a)
_
V

( es un ordinal
V

es un ordinal).
b)
_
< (V
V

= V

) (esto se obtiene por el teorema de reexi on aplicado


a x = V

).
306 Apendice C. El teorema de conservaci on
En la prueba del teorema de reexi on se ve que el ordinal se puede tomar
arbitrariamente grande, es decir, para cada f ormula tenemos que
_

0
(
0

_
x
1
x
n
V

0 (
V

0
(x
1
, . . . , x
n
) (x
1
, . . . , x
n
)).
(Aqu se entiende que representa un ordinal y
0
un ordinal lmite.)
Pues bien, vamos a suponer que V

cumple la relativizaci on de esta f ormula


a V

(para una colecci on nita arbitrariamente grande de f ormulas . Teniendo


en cuenta a) y b) lo que estamos suponiendo es que
_
<
_

0
(
0
<
_
x
1
x
n
V

0 (
V

0
(x
1
, . . . , x
n
)
V

(x
1
, . . . , x
n
)).
Pero esto es tanto como decir que la inclusi on i
0

0 : V

0 V

es una
inmersi on elemental para un conjunto de ordinales lmite
0
no acotado en .
Teorema C.26 En las condiciones anteriores, si i
0

0 es una inmersi on elemen-


tal, tambien lo es i

0
para todo .
Demostraci on: Fijada una f ormula, construimos una sucesi on de expre-
siones
1
, . . . ,
r
igual que en la prueba del teorema de reexi on y demostramos
que cada
k
cumple la denici on de inmersi on elemental o el teorema C.7 seg un
si es una f ormula o un termino. Razonamos por inducci on sobre . Para = 0
es trivial. Ahora suponemos que i

0
es una inmersi on elemental para todas las
expresiones
k
y siempre que i
0

0 lo es, y vamos a probarlo para i


+1

0
. A su vez
suponemos que se cumple para expresiones anteriores a
k
y lo probamos para
esta.
Si
k
x es trivial. Si
k
t
1
= t
2
o
k
t
1
t
2
se sigue inmediatamente
de que i
+1

0
no es m as que la inclusi on. Los casos
k
o
k
son
igualmente inmediatos a partir de la hip otesis para y .
Supongamos ahora que
k

_
x. La parte no trivial es suponer que, jados
x
1
, . . . , x
n
W
+1

0
, si se cumple
_
x W
+1

0

W
+1

0
(x, x
1
, . . . , x
n
) entonces
tambien
_
x W
+1

W
+1
(x, x
1
, . . . , x
n
).
Supongamos, por reducci on al absurdo, que existe x W
+1
de manera que

W
+1
(x, x
1
, . . . , x
n
). Tomemos entonces un ordinal lmite
00
>
0
tal que i
0

00
sea elemental y de modo que x W
+1

00
.
Por la hip otesis de inducci on para y
00
tenemos
W
+1

00
(x, x
1
, . . . , x
n
).
Tomemos funciones f
j
: I

0
funciones tales que x
j
= [f
j
]. Por el
teorema C.11 tenemos que
{i I

|
_
x W

00

00
(x, f
1
(i), . . . , f
n
(i))} U

.
Para cada ndice i en este conjunto aplicamos la hip otesis de inducci on en
virtud de la cual las inclusiones i

00
e i

0
son elementales para
k
, de donde se
sigue que
_
x W

0
(x, f
1
(i), . . . , f
n
(i)). As pues,
{i I

|
_
x W

0
(x, f
1
(i), . . . , f
n
(i))} U

.
C.4. El teorema de conservaci on para la teora de Hrbacek 307
De nuevo por C.11 concluimos que
_
x W
+1

0

W
+1

0
(x, x
1
, . . . , x
n
), en
contra de lo supuesto.
El caso en que
k
x| se trata con el mismo argumento que hemos em-
pleado en todos los resultados similares a este.
Ahora suponemos que es un ordinal lmite y que i

0 es una inmersi on
elemental para las expresiones
k
siempre que < y i
0

0 lo es. Hemos de
probarlo para i

0
, y a su vez lo suponemos cierto para las expresiones anteriores
a
k
.
Pasamos directamente al unico caso no trivial, es decir, cuando
k

_
x.
Fijamos x
1
, . . . , x
n
W

0
y suponemos que existe un x W

de manera que

(x, x
1
, . . . , x
n
).
Sea
00
> un ordinal lmite tal que i
0

00 sea elemental y x, x
1
, . . . , x
n
W

00
.
A su vez tomamos un < tal que x W

00 y x
1
, . . . , x
n
W

0 .
Por la hip otesis de inducci on para tenemos
W

00
(x, x
1
, . . . , x
n
), como la
inclusi on j

00
es elemental de aqu se sigue
W

00
(x, x
1
, . . . , x
n
), por la hip otesis
de inducci on para i

00 e i

0 respecto a
k
tenemos
_
x W

0
W

0
(x, x
1
, . . . , x
n
),
y usando que la inmersi on j

0
es elemental concluimos que
_
x W

0
(x, x
1
, . . . , x
n
).
Como consecuencia tenemos:
Teorema C.27 Si <
0
, la inclusi on j

0
: W

0
es una in-
mersi on elemental.
Demostraci on: Dada una f ormula (x
1
, . . . , x
n
), jamos x
1
, . . . , x
n
W

y tomamos un ordinal lmite


0
tal que x
1
, . . . , x
n
W

0
y las inclusiones i

0
,
i

0
sean elementales. Entonces, usando que j

0
es elemental, vemos que

(x
1
, . . . , x
n
)
W

0
(x
1
, . . . , x
n
)
W

0
(x
1
, . . . , x
n
)
W

0
(x
1
, . . . , x
n
).
Llamaremos j = j
0
, de modo que j : V

I es una inmersi on elemental.


Denimos S = j[V

] I. Los elementos de I ser an los conjuntos internos


del modelo que vamos a construir. Ahora nos falta construir los conjuntos
estrictamente externos. Conviene introducir el siguiente concepto:
Denici on C.28 Si x es un elemento de un modelo est andar M, llamaremos
extensi on de x al conjunto x = {u M | u E x}.
En la denici on siguiente las extensiones que aparecen hacen referencia a la
relaci on E del modelo est andar I:
308 Apendice C. El teorema de conservaci on
Denici on C.29 Denimos la familia de modelos est andar (Z

, E

, d), para
< , , determinada por las propiedades siguientes:
a) La descripci on impropia de todos los modelos es la de I.
b) (Z
0

, E
0

, d) = (W

, E

, d).
c) Z
+1

= Z

, donde
A

= {x I | x Z

}, B

= {x PZ

|
_
y I x 6= y}.
d) E
+1

= E

{(x, y) Z

| x E y} {(x, y) Z

| x y}.
e) Si
0
es un ordinal lmite, Z

=

<
0
Z

, E

=

<
0
E

.
Denimos M como la uni on de todos los modelos Z

, con la relaci on E que


resulta de unir todas las relaciones E

y con la descripci on impropia de I.


Veamos algunas consecuencias de esta denici on:
Teorema C.30 Se cumple:
a) S I M.
b) Si x I entonces la extensi on de x en M es la misma que en I.
c) Si x M \ I, entonces la extensi on de x es x.
d) Para todo a Z

existe un x Z
+1

tal que x = a.
e) Si <
0
< y <
0
, entonces Z

0 .
f ) Si x M, y Z

, x E y, entonces x Z

.
Demostraci on: Las propiedades a), b) y c) son inmediatas. La propiedad
d) se debe a que o bien existe un x A

tal que x = a, y entonces cumple lo


pedido, o bien tomamos x = a B

. La propiedad e) se demuestra f acilmente


por inducci on. La propiedad f) se prueba por inducci on sobre . El caso = 0
es consecuencia de que la inclusi on de W

en I es inicial.
Tenemos as un modelo M = (M, E, I, S, d). Hemos de probar que cumple
(cualquier subcolecci on nita de) los axiomas de H.
Extensionalidad Decir que M cumple el axioma de extensionalidad es tanto
como decir que si dos conjuntos x, y M tienen la misma extensi on entonces
son iguales. Ahora bien, si x, y M \ I entonces x = x = y = y, si x, y I
entonces las extensiones de x e y son sus extensiones en I, y ha de ser x = y
porque I satisface el axioma de extensionalidad. Por ultimo, no puede ocurrir
que x I e y M \ I tengan la misma extensi on, pues si y Z

y es el
mnimo ordinal para el que esto sucede, entonces = +1 y ha de ser y B

,
con lo que y = y 6= x.
C.4. El teorema de conservaci on para la teora de Hrbacek 309
Par El axioma del par es
_
xy M
_
z M
_
u M(u E z u = x u = y).
Sean y tales que x, y Z

. Consideremos a = {x, y} Z

. Basta
tomar el z Z
+1

cuya extensi on es a.
Uni on El axioma de la uni on es
_
x M
_
y M
_
uv M(u E v v E x u E y).
Consideremos a = {u M|
_
v M(u E v v E x)}. Si x Z

, entonces
todo v M que cumpla v E x est a tambien en Z

y lo mismo sucede con todo


u M tal que u E v. As pues, a Z

. Ahora basta tomar el x Z


+1

cuya
extensi on es a.
Partes El axioma de partes es
_
x M
_
y M
_
u M(
_
v M(v E u v E x) u E y).
Tomamos x M, que estar a de hecho en un Z

. Sea a = {u Z
+1

| u x}
y sea y Z
+2

cuya extensi on sea a. Entonces y cumple lo pedido, pues si


u M cumple
_
v M(v E u v E x), entonces u x Z

, luego existe un
u
0
Z
+1

tal que u = u
0
, luego por extensionalidad u = u
0
Z
+1

. M as a un,
u a, luego u E y.
Especicaci on El axioma de especicaci on es
_
x
1
x
n
x M
_
y M
_
u M(u E y u E x
M
(u, x
1
, . . . , x
n
)))
Tomamos y tales que x Z

y consideramos el conjunto
a = {u Z

| u E x
M
(u, x
1
, . . . , x
n
)}.
Es claro que el y Z
+1

cuya extensi on es a cumple lo necesario.


Elecci on Para demostrar el axioma de elecci on tomamos un conjunto x Z

y jamos un buen orden R en x. Teniendo en cuenta que (u, v) {{u}, {u, v}},
es f acil ver que si u E x v E x, entonces {u}
M
, {u, v}
M
Z
+1

y que
(u, v)
M
Z
+2

. Llamamos a al conjunto de todos los elementos de Z


+2

que
son de la forma (u, v)
M
, con (u, v) R y tomamos el conjunto y Z
+3

cuya
extensi on es a. Se comprueba que (y es un buen orden de x)
M
.
Inclusi on y transitividad El axioma de inclusi on es trivial, pues S I. El
axioma de transitividad equivale a que
_
x M
_
y I(x E y x I), lo cual
es cierto, pues la extensi on de un conjunto interno es su extensi on en I.
310 Apendice C. El teorema de conservaci on
ZFC
in
Podemos demostrar que M cumple cualquier cantidad nita de axio-
mas de ZFC relativizados a conjuntos internos gracias a la inmersi on elemental
j : V

I. En efecto, si es un axioma de ZFC, podemos suponer


V

, luego

I
, pero esto equivale a (
in
)
M
.
Transferencia Para demostrar el principio de transferencia hemos de probar
que
_
x
1
x
n
S(
_
x S
I
(x, x
1
, . . . , x
n
)
_
x I
I
(x, x
1
, . . . , x
n
)).
Sean j(x
1
), . . . , j(x
n
) S y supongamos que
_
x S
I
(x, j(x
1
), . . . , j(x
n
))
o, lo que es lo mismo,
_
x V

I
(j(x), j(x
1
), . . . , j(x
n
)). Como j es elemental,
esto equivale a
_
x V

(x, x
1
, . . . , x
n
) (
_
x)
V

(x
1
, . . . , x
n
). Usando de
nuevo que j es elemental concluimos que
_
x I
I
(x, j(x
1
), . . . , j(x
n
)).
Idealizaci on Observemos que si A M cumple (A tiene tama no est andar)
M
,
entonces existen B I y f M tales que (f :

B A suprayectiva)
M
. No es
cierto que f sea exactamente una aplicaci on fuera de M, pero en cualquier caso
determina una aplicaci on suprayectiva g : S

B

A. La aplicaci on j biyecta
S

B con un subconjunto de V

, luego |

A| |V

| < .
Llamemos A
0
=

A I. Tambien se cumple que |A
0
| < . Vamos a probar
que existen ordinales < , < tales que A
0
W

. Para ello necesitamos


algunos hechos previos:
1) Si x W

, entonces i

+1
(x) E j
0
+1
(V

).
En efecto, se prueba por inducci on sobre . Para = 0 es trivial
(entendiendo que j
00
+1
es la identidad). Si vale para y x W
+1

, entonces
x = [f], para cierta f : I

. Sea i
+1
+1
(x) = [g]. Aplicando la hip otesis
de inducci on a f(i), tenemos que g(i) = i

+1
(f(i)) E j
0
+1
(V

). Tomando
clases i
+1
+1
(x) E j
+1
+1
(j
0
+1
(V

)) = j
0+1
+1
(V

). Si es lmite y x W

,
existe un < tal que x = j

(x
0
), con x
0
W

. Por hip otesis de inducci on


i

+1
(x
0
) E j
0
+1
(V

), y aplicando j

+1
tenemos i

+1
(x) = j
0
+1
(V

).
2) Si x I y x Z
0

, entonces x Z
0
+2
.
En efecto, seg un la propiedad anterior (recordemos que Z
0

= W

) tenemos
que (x j(V

))
I
, luego x Pj(V

))
I
, y como j es elemental (Pj(V

))
I
=
j((PV

)
V

) = j(V
+1
). As pues, x E j(V
+1
) Z
0
+2
, y por el teorema C.30 f)
concluimos que x Z
0
+2
.
3) Z

I Z
0
+2
.
Por inducci on sobre < . Para = 0 es trivial. Si x Z
+1

I, entonces
x Z

I Z
0
+2
, luego por el apartado anterior x Z
0
+2+2
. Si es lmite
y x Z

I, entonces x Z

I, para un < . Por hip otesis de inducci on


x Z
0
+2
Z
0
+2
.
C.4. El teorema de conservaci on para la teora de Hrbacek 311
Volviendo al conjunto A de tama no est andar, si A Z

, ahora tenemos que


A
0
Z

I Z
0
+2
= W

+2
, pero como es un cardinal regular y |A
0
| < ,
ha de existir un < tal que A
0
W

+2
. Cambiando la notaci on, tenemos
un ordinal < y otro < tales que A
0
W

. Puesto que se puede


tomar arbitrariamente grande, podemos suponer que la inclusi on W

I es
elemental (ver el teorema C.26).
Fijados x
1
, . . . , x
n
I (que podemos suponer en W

) Hemos de demostrar
_
z M( z

A z nito
M

_
x I
_
y z A
0

I
(x, y, x
1
, . . . , x
n
))

_
x I
_
y A
0

I
(x, y, x
1
, . . . , x
n
).
Suponemos la hip otesis. Tomamos y
1
, . . . , y
m
A
0
. Puesto que las inclu-
siones W

I son elementales, podemos suponer que W

satisface
cualquier cantidad nita de axiomas de ZFC. Si suponemos que cumple los nece-
sarios para demostrar que existe {x} y es nito, que existe la uni on de conjuntos
y que la uni on de conjuntos nitos es nita, podemos construir un z W

cuya
extensi on sea {y
1
, . . . , y
m
}. Tambien es f acil ver que z es nito
M
, por lo que
_
x I
_
y I(y E z
I
(x, y, x
1
, . . . , x
n
)).
Usando que las inclusiones son elementales pasamos a
_
x W

_
y W

(y E z
W

(x, y, x
1
, . . . , x
n
)).
As pues, tenemos que los conjuntos {x W

|
W

(x, y, x
1
, . . . , x
n
)} para
y A
0
tienen la propiedad de la intersecci on nita, luego est an contenidos en
un ultraltro F en W

. Como la ultrapotencia W
+1

es adecuada, existe un
W
+1

tal que F = t(), y as, si y A


0
tenemos que

{x W

|
W

(x, y, x
1
, . . . , x
n
)},
lo cual, por el teorema C.11 equivale a

W
+1

(, j
+1

(y), j
+1

(x
1
), . . . , j
+1

(x
n
)).
Si usamos que j
+1

e i

son inmersiones elementales e identic andolas con


inclusiones llegamos a
I
(, y, x
1
, . . . , x
n
), para todo y A
0
, como tenamos que
probar.
Estandarizaci on Hemos de probar que
_
x M
_
y S
_
u S(u E y u E x).
Para ello demostramos primero que si < , u V

, y W

y
j
0

(u) = i

(y), entonces u V

.
Lo probamos por inducci on sobre . Para = 0 es trivial (entendiendo que
j
00

es la identidad). Si vale para , sea x


0
= j
0

(u), con lo que j


0+1

(u) =
j
+1

(x
0
) = [c
x
0 ].
312 Apendice C. El teorema de conservaci on
Por otra parte, si y = [f], para un conjunto de ndices i que est a en U

, se
ha de dar la igualdad c
x
0 (i) = i

(f(i)), es decir, existe un y


0
= f(i) W

tal
que x
0
= j
0

(u) = i

(y
0
). Por hip otesis de inducci on u V

.
Si es un lmite y vale para todo < , tomamos de modo que y = j

(y
0
),
para cierto y
0
W

. Entonces
j

(j
0

(u)) = i

(j

(y
0
)) = j

(i

(y
0
)),
luego j
0

(u) = i

(y
0
) y, por hip otesis de inducci on, u V

.
En particular, para = e identicando todos los modelos con subconjuntos
de I tenemos que si u V

cumple j(u) Z
0

entonces u V

.
Ahora demostramos que si u V

cumple j(u) Z

, con , < , entonces


u V
+
.
Observemos antes que podemos exigir que si , < entonces + < .
En efecto, basta suponer que V

cumple
_
x V

(x es un ordinal
V

x es un ordinal)
as como el teorema que arma que para cada dos ordinales existe su suma.
Razonamos por inducci on sobre . Para = 0 lo acabamos de probar.
Supong amoslo cierto para y sea j(u) Z
+1

. Si v u, entonces j(v) E j(u),


luego j(v) Z

. Por hip otesis de inducci on v V


+
, luego u V
+
, luego
u V
++1
. El caso lmite es trivial.
Ahora ya podemos demostrar el principio de estandarizaci on: dado x Z

,
con , < , tomamos a = {u V
+
| j(u) E x} V
++1
. As, para todo
u V

tenemos que j(u) E x si y s olo si u a, si y s olo si j(u) j(a), luego


basta tomar y = j(a) S.
En denitiva, hemos demostrado lo siguiente:
Teorema C.31 Si es cualquier colecci on nita de axiomas de H y es una
f ormula de ZFC sin variables libres, en ZFC se demuestra que existe un modelo
M tal que M y
M
in
.
De aqu se deduce el teorema de conservaci on para H exactamente igual que
el teorema para N se deduca de C.22. La prueba del teorema anterior y por
consiguiente del teorema de conservaci on es completamente constructiva.
Regularidad y reemplazo Vamos a justicar aqu las armaciones del ul-
timo apartado del apendice B. Ante todo, teniendo en cuenta que todos los
conjuntos de V
0
son nitos, es f acil ver que j biyecta V
0
con Z
0
0
. Por comodidad
podemos sustituir los conjuntos de Z
0
0
por sus antiim agenes en V
0
, de modo que
V
0
M y j es la identidad en V
0
.
C.4. El teorema de conservaci on para la teora de Hrbacek 313
Un conjunto x I tal que x Z
0
0
tiene todos sus elementos est andar, por
lo que ha de ser est andar y nito, lo cual obliga a que este en Z
0
0
. As pues,
Z
1
0
no tiene m as conjuntos internos que los de Z
0
0
. Por consiguiente Z
1
0
= PZ
0
0
.
Ahora es f acil demostrar en general que
_
< Z

0
= V

, luego V

M y la
relaci on E en M se restringe a la pertenencia usual en V

.
Se comprueba que los unicos ordinales
M
son los elementos de , y entonces
es f acil ver que en M puede construirse la jerarqua regular, de modo que los
conjuntos regulares son precisamente los de V

. En particular en M se cumple
que la relaci on de pertenencia est a bien fundada sobre los conjuntos regulares,
y a traves de la inmersi on j se prueba que tambien est a bien fundada sobre
los conjuntos est andar. M as a un, en M existe el colapso transitivo de cada
conjunto est andar x, pues no es sino j
1
(x).

Estos son los hechos que habamos
armado que pueden a nadirse como axiomas adicionales a H sin perder por ello
el teorema de conservaci on, lo cual queda ahora demostrado porque se cumplen
en M.
Bibliografa
[1] Diener, F. Cours danalyse nos standard, Universite dOran (1983).
[2] Hrbacek, K. Axiomatic foundations of nonstandard analysis,
Fund. Math. XCVIII (1978), pp. 119.
[3] Hrbacek, K. Nonstandard set theory, Amer. Math. Monthly 83 (1979),
pp. 659677.
[4] Nelson, E. Internal set theory: a new approach to nonstandard analysis,
Bull. Amer. Math. Soc. 83 (6) (1977), pp. 11651198.
[5] Stroyan, K. D., Luxemburg, W. A. J. Introduction to the theory of
innitesimals. Pure and Applied Mathematics, No. 72. Academic Press,
New York (1976).
315

Indice de Materias
abierto, 183
absolutamente convergente (serie),
159
acotada
funci on, 118
sucesi on, 58
acotado
conjunto, 17
espacio, 187
acumulaci on (punto de), 80
adherente (punto), 184
aislado (punto), 80
anillo, 21
aplicaci on, 12
arco seno, 134
arco tangente, 140
arquimediano (cuerpo), 48
Barrow (regla de), 125
bola, 185
buena ordenaci on (principio de), 17
cardinal, 20
casi est andar, 182
funci on, 163
n umero, 62
Cauchy (sucesi on de), 62, 170
cerrado, 184
cilndricas (coordenadas), 248
clase de equivalencia, 18
clausura, 186
compacto (espacio), 188
complementario, 9
concurrente (relaci on), 264, 265
conexo (espacio), 193
congruencia, 22
conjunto
cociente, 18
de oportunidades, 212
conservaci on (principio de), 41
continua (funci on), 78, 189
convergencia
casi uniforme, 168
de funciones, 109
de sucesiones, 54
puntual, 163
uniforme, 165
convexa (funci on), 97
coseno, 136
hiperb olico, 116
cota, 17
cubo, 219
cuerpo, 25
cu adrupla, 8
c oncava (funci on), 97
derivada, 86
parcial, 195
derivadas sucesivas, 99
diferenciable (funci on), 197
estricta, 201
distancia, 181
eucldea, 180
producto, 182
dominio de integraci on, 223
entorno, 86, 183
espacio
normado, 180
vectorial, 179
especicaci on (axioma de), 6
estandarizaci on (principio de), 40,
268
exponencial, 104, 107
316

INDICE DE MATERIAS 317


extensionalidad (axioma de), 3
extensi on, 307
extensi on (principio de), 33, 269
externa (armaci on, propiedad, etc.),
32
externa (expresi on), 261
externo (conjunto), 37, 267
factorial, 28
ltro, 291
nito
conjunto, 18
n umero, 49
n umero natural, 44
punto, 182
frontera, 187
funci on, 12
lagrangiana, 214
objetivo, 212
Gauss (campana de), 248
geometrica (suma de una serie), 103
gr aca, 77
halo, 53, 182
homeomorsmo, 193
idealizaci on (principio de), 36, 264
indeterminaci on, 59
inducci on (principio de), 11
inductivo (conjunto), 10
nmo, 70
innitamente pr oximos (n umeros),
51
innitesimal, 50
innito
conjunto, 18
n umero, 49
n umero natural, 44
innitud (axioma de), 10
inmersi on
elemental, 290
inicial, 303
integral, 121, 222
inferior, superior, 119, 221
interior, 186
interior (punto), 86, 183
interna (armaci on, propiedad, etc.),
6, 32
interna (expresi on), 261
intersecci on, 8
intervalo, 74
LH opital (regla de), 112115
Lagrange (condiciones de), 214
lagrangiana (funci on), 214
ley de composici on, 21
logaritmo, 105
longitud, 133, 145
lmite
de funciones, 109
de sucesiones, 55
innito, 59
inductivo, 297
superior, 174
matriz jacobiana, 198
m aximo, 17
local, 93, 212
mnimo, 17
local, 93, 212
modelo, 286
mon otona
funci on, 85
sucesi on, 73
multindice, 220
Newton (binomio), 29
norma, 180, 220
de una partici on, 118
eucldea, 180
nulo (conjunto), 224
n umeros
combinatorios, 28
enteros, 23
naturales, 10
racionales, 26
optimizaci on cl asica, 212
par
desordenado, 8
ordenado, 8
parte entera, 48
318

INDICE DE MATERIAS
parte est andar, 62, 182
partes (conjunto de), 9
partici on, 117, 220
Peano (axiomas de), 11
pertenencia, 3
pi, 137
polares (coordenadas), 147, 246
polinomio, 81
primitiva, 126
producto cartesiano, 9
radio de convergencia, 176
raz k-esima, 71
recta tangente, 142
regular (punto, conjunto), 211
relaci on, 16
de equivalencia, 18
de orden, 16
relativizaci on, 273, 285
remoto (punto), 182
restricci on, 13
secci on, 60
seno, 135
hiperb olico, 116
serie, 100
funcional, 171
simplicaci on (propiedad de), 16
sistema inductivo, 297
subconjunto, 4
sucesi on, 53
sumas de Riemann, 118, 220
supremo, 70
tangente, 88, 139
Tartaglia (tri angulo), 29
Taylor
polinomio de, 100
resto de, 100
serie de, 100
Teorema
de cambio de variable, 127, 244
de Cauchy, 96
de completitud, 68, 69
de la funci on implcita, 210
de la funci on inversa, 94, 206,
209
de la media, 236
de recursi on, 13
de Schwarz, 205
de Tychono, 189
de Weierstrass (primero), 83
de Weierstrass (segundo), 84
del valor medio, 96
terna, 8
transferencia (principio de), 33, 262
ultraltro, 292
ultralmite, 299
ultrapotencia, 292
adecuada, 295
unidad, 25
uni on, 8
vaco (conjunto), 7
valor absoluto, 48
valor medio, 236
Viviani (b oveda de), 255
volumen, 220, 223
Weierstrass (criterio de mayoraci on),
172

También podría gustarte