Cálculo Diferencial en Espacios de Banach

Cálculo Diferencial en Espacios de Banach
Hans Cristian Muller Santa Cruz
14 de marzo de 2008
2
Índice general
Prefacio V
I. Cálculo Diferencial en Espacios de Banach 1

I.1. Espacios de Banach . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1
I.1.1. Ejercicios . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 5
I.2. Aplicaciones Lineales . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 6
I.2.1. Ejercicios . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 10
I.3. Diferenciabilidad en los Espacios Normados . . . . . . . . . . . . . . . . . . . . . . . . . . . . 11
I.3.1. Ejercicios . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 14
I.4. Teorema de los Incrementos Finitos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 15
I.4.1. Ejercicios . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 16
I.5. Teorema del punto fijo de Banach . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 17
I.5.1. Ejercicios . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 21
I.6. Teorema de Inversión Local . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 22
I.6.1. Ejercicios . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 25
I.7. Teorema de las Funciones Implı́citas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 26
I.7.1. Ejercicios . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 28
I.8. Aplicaciones Bilineales y Multilineales . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 29
I.8.1. Ejercicios . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 30
I.9. Derivadas de Orden Superior . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 31
I.9.1. Ejercicios . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 33
I.10. Fórmula de Taylor . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 33
I.10.1. Ejercicios . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 34
II. Subvariedades Diferenciales 35

II.1. Teorema del Rango . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 35
II.2. Subvariedades Diferenciables . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 37
II.3. Espacio Tangente . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 39
II.4. Ejercicios . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 40
III. Máximos y Mı́nimos Locales 43

III.1. Máximos y mı́nimos relativos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 43
III.2. Multiplicadores de Lagrange . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 45
III.3. Ejercicios . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 48
IV. Ecuaciones Diferenciales Ordinarias 51

IV.1. Conceptos Básicos y Algunos Problemas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 51
IV.2. Existencia y Unicidad del Problema de Cauchy . . . . . . . . . . . . . . . . . . . . . . . . . . 60
i
ii ÍNDICE GENERAL
Índice de figuras
I.1.1. Sucesión de Funciones. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3

I.5.2. Método de las aproximaciones sucesivas para f (x) = cos x y f (x) = ex /4 . . . . . . . . . . . 18
I.5.3. Método de Newton (izquierda) y método de Newton simplificado (derecha) . . . . . . . . . 19
I.6.4. Coordenadas Polares . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 25
II.2.1. Visualización del teorema . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 37
IV.1.1.Trayectoria de una solución . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 53

IV.1.2.Vector Tangente . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 54
IV.1.3.Representación de un Campo de Vectores . . . . . . . . . . . . . . . . . . . . . . . . . . . . 54
IV.1.4.Trayectorias del Sistema Diferencial . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 56
IV.1.5.Familia de Circunferencias . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 59
IV.1.6.Angulo entre dos curvas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 59
IV.1.7.Curvas ortogonales . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 61
IV.2.8.Iteración de Picard-Lindelöf para el problema del ejemplo 1. . . . . . . . . . . . . . . . . . . 61
iii
iv ÍNDICE DE FIGURAS
Prefacio
v
vi PREFACIO
Capı́tulo I
Cálculo Diferencial en Espacios de
Banach
I.1. Espacios de Banach

En el Curso de Algebra Lineal se hizo un estudio profundo de los Espacios Vectoriales y sus propiedades. En
esta sección, se estudiará los espacios vectoriales bajo una óptica del análisis. A continuación damos algunas
definiciones útiles para nuestro estudio.
Definición I.1.1 Una norma sobre un espacio vectorial V es una aplicación k·k : V → V que verifica las
tres propiedades:
(N1) kxk ≥ 0 y kxk = 0 ⇐⇒ x = 0,
(N2) kλxk = |λ| · kxk,
(N3) kx + yk ≤ kxk + kyk (desigualdad del triángulo).
Definición I.1.2 Se dice que E es un espacio vectorial normado, si E es un espacio vectorial provisto
de una norma.
Definición I.1.3 Sea E un espacio vectorial normado. Se dice que la sucesión {xn } con valores en E es
convergente, si existe a ∈ E, tal que
∀ > 0 ∃N ∈ N, ∀n ≥ N kxn − ak < ;
si es el caso, se dirá que {xn } converge hacia a ∈ E.
Definición I.1.4 Sea E un espacio vectorial normado. Se dice que la sucesión {xn } con valores en E es
una sucesión de Cauchy, si
∀ > 0 ∃N ∈ N, ∀n, m ≥ N kxn − xm k < .
Definición I.1.5 Un espacio vectorial normado E se dirá que es completo si cada sucesión de Cauchy en
E es convergente. Un espacio vectorial normado y completo se llama un espacio de Banach.
En el curso de Primer Año de Análisis se mostró que Rn con la norma euclidiana es completo, de donde Rn
es un espacio de Banach. Podrı́amos creer ingenuamente que todos los espacios vectoriales reales provistos
de norma, son espacios de Banach. Lastimosamente, o por el contrario, existen espacios normados que no
son espacios de Banach. Más todavia, en la proposición siguiente, se verá que un mismo espacio provisto de
normas diferentes tiene comportamientos diferentes.
Proposición I.1.1 Sea

C([0, 1]) = {f : [0, 1] → R| f continua}.
1
2 CAPÍTULO I. CÁLCULO DIFERENCIAL EN ESPACIOS DE BANACH
Con la norma
kf k∞ = máx |f (t)| ,
t∈[0,1]
C([0, 1]) es un espacio de Banach. Al contrario, con una de las normas

s
Z 1 Z 1
2
kf k1 = |f (t)| dt o kf k2 = |f (t)| dt
0 0
el espacio C([0, 1]) no es un espacio de Banach.
Demostración.- Para ver que C([0, 1]) es un espacio vectorial es suficiente ver que es un subespacio de R[0,1]
es espacio de las funciones de [0, 1] en R, ver ejemplo 4 de I.1 texto de Algebra Lineal.
La verificación que k·k∞ es una norma sobre C([0, 1]), es consecuencia directa de las propiedades de máx
y sup vistas en el curso del Primer Año de Análisis. Por consiguiente, la demostración es un simple repaso
que se deja al estudiante.
La positividad, a homogeneidad y la desigualdad del triángulo para k·k1 y k·k2 resultan de las propiades
de la integral de Riemann, también vistas en el primer año de análisis. Mostraremos que k·k1 es estrictamente
positiva; es decir que kf k1 = 0, implica que f = 0. En efecto, supongamos lo contrario; es decir, existe una
función f ∈ C([0, 1]) no nula, tal que
Z 1
|f (t)| dt = 0.
0
Como f , es no nula, existe t0 ∈ [0, 1], tal que f (t0 ) 6= 0. Por la continuidad de f , en particular en t0 , existe
un subintervalo [t1 , t2 ], tal que |f (t)| ≥ |f (t0 )| /2, de donde
Z 1 Z t2
f (t0 )
|f (t)| dt ≥ |f (t)| dt ≥ (t2 − t1 );
0 t1 2
lo que conduce a una contradicción. Para k·k2 , la demostración es completamente similar.
Ahora bien, utilizando los resultados de la convergencia uniforme, para sucesiones de funciones, se tiene
C([0, 1]), con la norma de la convergencia uniforme, es un espacio de Banach.
Mostremos que C([0, 1]) con la norma k·k1 no es completo. En efecto, consideremos la sucesión de funciones
continuas sobre [0, 1], dada por
si x ≤ 12 − n+1
1

 0 ;
fn (x) = 1
1 + (n + 1)(x − 2 ) si 2 − n+1 ≤ x ≤ 12 ,
1 1
1 si x ≥≤ 21 .

En la figura I.1.1, observamos algunas de estas funciones. Esta sucesión es una sucesión de Cauchy, respecto
a la norma k·k1 . En efecto, un simple cálculo de áreas, dará

1 1 1
kfn − fm k = − → 0,
2 n + 1 m + 1
cuando n, m → ∞. Por otro lado, fijando x ∈ [0, 1], se observa,
0 si x < 12 ,

lı́m fn (x) =
n→∞ 1 si x ≥ 12.
Por lo tanto, constatamos que esta sucesión, puntualmente converge a una función que no es continua, la
discontinuidad está en 1/2.
Aunque la sucesión fn , no converga puntualmente a una función continua, eso no significa necesariamente
que la sucesión fn no converga a una función continua; por lo que debemos probar.
Supongamos que dicha sucesión converge a una función continua f definida sobre [0, 1]. Consideremos los
subintervalos [0, a] con a < 1/2. Las restricciones de fn sobre [0, a] convergen sobre la restriccion de f sobre
[0, a], porque
Z a Z 1
|fn (t) − f (t)| dt ≤ |fn (t) − f (t)| .
0 0
I.1. ESPACIOS DE BANACH 3
1/2 1
Figura I.1.1: Sucesión de Funciones.
Una verificación inmediata y la unicidad del lı́mite, dará que f (t) = 0, sobre [0, a]. El mismo razonamiento,
con [b, 1] b > 1/2, nos dará f (t) = 1 sobre [b, 1]. Esto significa que
0 si x < 21 ,

1 si x > 12;
conduciendo a que f sea discontinua en 1/2, lo que es contradictorio.
Proposición I.1.2 Consideremos el conjunto
B(A) = {f : A → R| f acotada}
de las funciones acotadas sobre A. B(A) con la adición y la multiplicación por escalar, la norma
kf k∞ = sup |f (t)|
t∈A
es un espacio de Banach.
Demostración.- Ejercicio.
Un Poco de Topologı́a
Definición I.1.6 Sean E un espacio vectorial; k·kp y k·kq normas sobre E. Se dirá que k·kp y k·kq son
equivalentes si:
existe Cq > 0 tal que ∀x ∈ E se tiene kxkp ≤ Cq kxkq ,
existe Cp > 0 tal que ∀x ∈ E se tiene kxkq ≤ Cp kxkp .
Remarca I.1.1 Se tiene las siguientes remarcas:
1. La equivalencia de normas, es una relación de equivalencia sobre el conjunto de normas del espacio
vectorial E.
2. La equivalencia de normas, conserva las caracterı́sticas de una sucesión; es decir si k·kp y k·kq son
equivalentes, se tendrá “{xn } sucesión en E es convergente, (de Cauchy) para la norma k·kp , si y
solamente si {xn } es convergente, (de Cauchy) para la norma k·kq ”
3. Por la remarca 1 y 2, al hablar de un espacio vectorial normado, uno se refiere, no solamente a una
norma, sino a una clase de equivalencia de normas, por loq que dependiendo la situación, uno elegirá la
norma más conveniente de la clase de equivalencia.
Proposición I.1.3 En Rn , todas las normas son equivalentes.
Demostración.- Suficiente mostrar que cualquier norma k·k es equivalente a la norma euclidiana sobre Rn .
Sea x ∈ Rn , se tiene.

Xn X n n
X
kxk = xi ei ≤ |xi | kei k ≤ máx kei k |xi | ,

1≤i≤n
i=1 i=1 i=1
aplicando la desigualdad de Cauchy, se obtiene

√
kxk ≤ n máx kei k kxk2 . (I.1.1)
1≤i≤n
Para la otra desigualdad, consideremos B = {x ∈ E| kxk2 = 1}. Denotemos por m = ı́nf kxk. Se tiene
x∈B
m ≥ 0, mostremos que m > 0, porque sino existirı́a una sucesión xn de B tal que
lı́m kxn k = 0,
n→∞
como B es compacto en Rn , (respecto a la norma euclidiana), existirı́a una subsucesión xnk que converge
a x ∈ B, (respecto a la norma euclidiana). Utilizando, la desigualdad (I.1.1), la sucesión xnk también
convergerı́a a x respecto a la otra norma, lo que imposible, porque x 6= 0. De donde, planteando C = 1/m,
y observando que x = kxk2 x/ kxk2 para x 6= 0, se obtiene
kxk2 ≤ C kxk .
Para x = 0 la desigualdad se cumple de todas maneras.
Corolario I.1.1 Rn provisto de una norma es un espacio de Banach.
Corolario I.1.2 Si E es un espacio vectorial normado de dimensión finita, entonces E es un espacio de

Banach.
Demostración.- Sea {d1 , . . . , dn } una base de E. La aplicación
ϕ : Rn −→ E
n
P
x →
7 xi di
i=1
es un isomorfismo de espacios vectoriales. Un ejercicio que se deja al estudiante, mostrará que si k·k es una
norma sobre Rn , la aplicación k·k◦ϕ−1 es una norma sobre E y que si k·k es una norma sobre E, la aplicación
k·k ◦ ϕ es una norma sobre Rn ; que una es la inversa de la otra. De donde existe una biyección entre los
conjuntos de las normas de Rn y E, con lo que se asegura la completitud de E para una norma dada.
Cuando los espacios vectoriales son de dimensión infinita, existen normas que no son equivalentes. La pro-
posición I.1.6 nos muestra que la norma kcdotk∞ , no es equivalente, ni con kcdotk1 , ni con la norma kcdotk2 .
A continuacion repasamos algunas de las definiciones, vistas en Rn que se generalizan a espacios normados.
I.1. ESPACIOS DE BANACH 5
Definición I.1.7 Sea E un espacio normado, una bola de centro a y radio r > 0, es el conjunto
Br (a) = {x ∈ E| kx − ak < r}.
Un conjunto V ⊂ E es un vecindario de a ∈ E, si existe > 0 tal que B (a) ⊂ V .

Un conjunto U ⊂ V es abierto, si U es vecindario de cada uno de sus elementos; es decir si
∀x ∈ U, ∃ > 0 B (x) ⊂ E.
Un conjunto A ⊂ E es cerrado, si el lı́mite de cada sucesión convergente {xn } con xn ∈ A, pertenece a A.

Un conjunto K ⊂ E es compacto, si cada {xn } con xn ∈ K admite una subsucesión que converge hacia un
elemento de K.
Dejamos como ejercicio, el repaso de las otras definiciones para R y Rn vistas en el Primer Año de Análisis.
Remarca I.1.2 Se tiene:
1. Las nociones de abierto, cerrado, vecindario, compacto, adherencia, interior, punto de acumulación,
etc, son invariantes para normas equivalentes.
2. La mayorı́a de los resultados obtenidos para Rn son ciertos, si se remplaza Rn por E espacio de Banach.
Hay que fijarse que en las demostraciones no intervenga la dimensión. Sin embargo, otras propiedades
se pierden, si se remplaza Rn por un espacio de Banach, por ejemplo:
• La bola cerrada {x ∈ E| kxk ≤ 1} no es necesariamente compacta.
• El teorema de Bolzano-Weirstraß“cada sucesión acotada posee una subsucesión convergente” no
es cierto.
• La caracterización “K compacto ⇐⇒ K cerrado y acotado” no es válida.
Ejemplo I.1.1 Consideremos B(R) el conjunto de las funciones acotadas sobre R, con la norma k·k∞ . Sea
fn ∈ B(R), definida por
1 si t = n,
fn (t) =
0 si t 6= 0,
Se tiene, para todo n, que kfn k = 1 y si n 6= m, kfn − fm k = 1. Por lo tanto, la sucesión es acotada.
Una verificación inmediata nos conduce a que ninguna subsucesión puede ser de Cauchy, por lo que {fn }
no admite sucesiones convergentes. Con este ejemplo, confirmamos la valides de los hechos expuestos en la
remarca precedente.
Continuidad
Las nociones de lı́mite y continuidad de aplicaciones f : U ⊂ E → F , donde E y F son espacios normados
se generalizan a partir de las aplicaciones de Rn y Rm . Por ejemplo.
Definición I.1.8 Sean E y F dos espacios de Banach y U ⊂ E. Una función f : U → F es continua en

x0 ∈ U si ∀ > 0, ∃δ > 0 tal que
x ∈ U y kx − x0 k < δ ⇒ kf (x) − f (x0 )k < .
I.1.1. Ejercicios
p
1. Mostrar que la aplicación N : R2 → R dada por N (x) = x21 − x1 x2 + x22 , define una norma sobre R2
y mostrar (explı́citamente) que esta norma es equivalente a la norma k·k∞ .
2. Mostrar que si h , i : E × E → R es un producto
p escalar sobre el espacio vectorial real E, entonces la
aplicación N : E → R dada por N (x) = hx, xi es una norma sobre E.
3. Sea E un espacio vectorial real. Mostrar que una norma k k proviene de un producto escalar sobre E,
si y solamente si, para todo x, y ∈ E se tiene
kx + yk + kx − yk = 2(kxk + kyk) (identidad del paralelogramo).
4. A un espacio E de Banach se lo llama espacio de Hilbert, si la norma del espacio E proviene de un

producto escalar. Mostrar mediante contraejemplos que Rn dotados de la normas k·k1 y k·k∞ no es un
espacio de Hilbert.
5. Se considera los subconjuntos de R2 siguientes:
A = {(x, y) ∈ R2 | 0 < x + y ≤ 1}
B = {(x, y) ∈ R2 | máx(|x| , |y|) < 3}
C = {(x, y) ∈ R2 | (x2 + y 2 )2 − 2x2 + 2y 2 = 0}
D = {(x, y) ∈ R2 | y = 0, x ∈ {1/n| n = 1, 2, . . .}}.
¿Qué conjuntos son abiertos, cerrados, acotados, compactos? Justificar.
6. Sea C([0, 1]) el conjunto de las funciones continuas de dominio [0, 1]. Mostrar que C([0, 1]) es un espacio
vectorial real para la adición de funciones y la multiplicación por escalar.
Mostrar que kf k1 y kf k2 definidas por
Z 1 Z 1 1/2
kf k1 = |f (t)| dt, kf k2 = (f (t))2 dt
0 0
son normas sobre C([0, 1]).
7. Demostrar que, pra un conjunto arbitrario no vacio A,
B(A) = {f : A → R| f es acotada} con kf k∞ = sup |f (t)| ,

t∈A
es un espacio de Banach.
I.2. Aplicaciones Lineales

En el curso de Algebra Lineal Avanzada, se ha estudiado en profundidad las aplicaciones lineales desde
un punto de vista algebraico. En esta sección agregaremos el concepto de continuidad a estas aplicaciones
lineales. A continuación, el teorema que caracteriza las aplicaciones lineales continuas.
Teorema I.2.1 Para una aplicación lineal A : E → f , E y F son espacios vectoriales normados, las
condiciones siguientes son equivalentes:
a) A es continua en 0 ∈ E.
b) A es continua en todo punto de E.
c) Existe C > 0 tal que ∀x ∈ E, kA(x)k ≤ C kxk.
Demostración.- La implicación (b) ⇒ (a) es obvia. Mostremos (a) ⇒ (b). Sea x ∈ E, como A es continua
en el origen, ∀ > 0, ∃δ > 0 tal que
z ∈ E y kzk < δ ⇒ kA(z)k < .
Planteando z = y − x, se tiene ky − xk < δ implica
> kA(y − x)k = kA(y) − A(x)k .

I.2. APLICACIONES LINEALES 7
Mostremos (a) ⇒ (c). A es continua en O, de donde existe δ(1) > 0 tal que
kxk < δ(1) ⇒ ka(x)k < 1.
Por lo tanto, si x 6= 0, se tiene

2 kxk δ(1) 2 kxk δ(1) 2
ka(x)k = a(
x) =
a( x) < kxk .
2δ(1) kxk δ(1) 2 kxk δ(1)
Tomando C = 2/δ(1), se tiene el punto (c), x = 0 es evidente.
(c) ⇒ (a). Para > 0 dado, tomar

δ= .
C

En los espacios de dimensión infinita, es usual llamar a una aplicación lineal operador lineal. Es frecuente
también, escribir Ax, en lugar de A(x) y si A es continua, por la propiedad (c) del teorema que acabamos
de demostrar, se dice que A es una aplicación lineal acotada.
Recordando el curso de Algebra Lineal, una aplicación lineal A de Rn en Rm se representa por una matriz,
que también es denotada por la misma letra A. Por lo tanto, la expresión Ax puede ser interpretada como
el valor de la aplicación A en el punto x, o bien como el producto de la matriz A con el vector x.
Proposición I.2.1 Sean E y F espacios normados, E de dimensión finita. Entonces toda aplicación lineal
A : E → F es continua.
Demostración.- Utilizaremos el punto (c) del teorema I.2.1. Sea {e1 , . . . , em } una base de E, por lo tanto

X m X m X m
kA(x)k = A( xi ei ) = xi A(ei ) ≤ |xi | kA(ei )k .

i=1 i=1 i=1
Denotanto M = máx kA(ei )k, la desigualdad de Cauchy y la equivalencia de normas en espacios finito
1≤i≤m
dimensionales, se obtiene
m
X √ √
kA(x)k ≤ M |xi | ≤ M n kxk2 ≤ ( nM C 0 ) kxk .
i=1
Corolario I.2.1 Todas las aplicaciones lineales A de Rn en Rm son continuas.
Cuando la dimensión del espacio dominio es no finita, pueden existir operadores lineales no continuos.
Ejemplo I.2.1 Consideremos C 1 ([0, 1]) el espacio vectorial de las funciones continuamente derivables sobre
[0, 1] provisto de la norma kf k = máx |f (t)|. El operador lineal
t∈[0,1]
D : C 1 ([0, 1]) −→ R
f 7→ f 0 (0)
no es continuo. En efecto, tomando fn (t) = sin(nt), se tiene por un lado kfn k = 1 y por el otro Df = n, con
lo que el punto (c) del teorema I.2.1 no se cumple.
En el curso de Algebra Lineal se utiliza Hom(E, F ) para referirse del espacio de las aplicaciones lineales de E
en F . En lugar de Hom(E, F ) es frecuente utilizar L(E, F ) y L(E) cuando E = F . Como estamos siguiendo
un curso de Análisis, nos interesa las aplicaciones lineales continuas, utilizaremos la notación L(E, F ) para
referirnos al conjunto de las aplicaciones lineales de E y F espacios normados y L(E) para el conjunto de
las aplicaciones lineales de E en E.
Obviamente se tiene ∅ = 6 L(E, F ) ⊂ L(E, F ). La aplicación lineal nula siempre es continua. Dejamos
como ejercicio la verificación de la:
Proposición I.2.2 L(E, F ) es un subespacio vectorial de L(E, F ).
El siguiente paso es dotar de una norma conveniente a L(E, F ) que refleje la caracterı́stica de aplicacion
lineal de los elementos de este espacio vectorial.
Definición I.2.1 Sean E y F espacios normados. Sea A ∈ L(E, F ) aplicación lineal continua, se define
kAxk
kAk = sup kxk = 1 kAxk = sup . (I.2.1)
x6=0 kxk
Esta definición significa que kAk es el número real más pequeño tal que
kAxk ≤ kAk · kxk . (I.2.2)
La desigualdad (I.2.2) es fundamental para todos los cálculos relacionados con las aplicaciones lineales.
Proposición I.2.3 El espacio L(E, F ) dotado de (I.2.1) es un espacio vectorial normado. Si F es completo,
entonces L(E, F ) es también un espacio completo.
Demostración.- Las propiedades de positividad y homogeneidad de una norma son faciles de mostrar.
Veamos la desigualdad del triángulo. Para A, B ∈ L(E, F ), se tiene
k(A + B)xk ≤ kAxk + kBxk ≤ (kAk + kBk) kxk .
Dividiendo esta relación por kxk, tomando el supremo, se obtiene la desigualdad del triángulo kA + Bk ≤
kAk + kBk.
Ahora mostremos la completitud del espacio. Supongamos F completo. Sea {An } una sucesión de Cauchy
en L(E, F ). Consideremos x ∈ E, la sucesión {An x} es una sucesión en F . Veamos que es una sucesión de
Cauchy, se tiene
kAn x − Am xk = k(An − Am )xk ≤ kxk kAn − Am k → O
cuando n, m → ∞. Como F es completo, denotemos Ax el lı́mite de la sucesión {An x}. Por consiguiente,
hemos obtenido una aplicación
A:E →F
x 7→ lı́mn→∞ An x
Esta aplicación es lineal, verificación dejada como ejercicio. Solamente nos falta mostrar que lı́mn→∞ An = A
en L(E, F ). Sea > 0, sea x ∈ E con kxk = 1, como An es una sucesión de Cauchy, existe N ∈ N tal que
1
n, m ≥ N ⇒ kAn x − Am xk ≤ kAn − Am k < .
2
Como An x → Ax, cuando n → ∞, existe M (x) tal que
1
m ≥ M (x) ⇒ ∞ kAx − Am xk < .
3
Por lo tanto tomando m ≥ máx N, M (x) y n ≥ N , se tiene
kAn x − Axk 5
≤ kAn x − Am xk + Am x − An x ≤ .
kxk 6
Por lo tanto kAn − Ak → 0, cuando n → ∞.
Proposición I.2.4 Sea I ∈ L(E) y consideremos las aplicaciones lineales A ∈ L(E, F ) y B ∈ L(F, G).
Entonces se tiene
kIk = 1, kABk ≤ kAk · kBk . (I.2.3)
I.2. APLICACIONES LINEALES 9
Demostración.- La propiedad kIk = 1 es evidente, pero hay que tener cuidado en utilizar la misma norma
en E. Para demostrar la estimación de kABk aplicamos dos veces la desigualdad fundamental (I.2.2),
k(AB)xk ≤ kAk · kBxk ≤ kAk · kBk · kxk .
Enseguida, se divide esta relación por kxk y tomamos el supremo para x 6= 0.

Proposición I.2.5 Sea A una matriz m × n; es decir, A ∈ L(Rn , Rm )y notemos por
kAxkp
kAkp = sup ,
kxk=1 kxkp
la expresión (I.2.1) si se utiliza la misma norma en los dos espacios Rn y Rm . Entonces, se tiene las fórmulas
explı́citas:
m
!
X
kAk1 = máx |aij | , (I.2.4)
j=1,...,n
i=1
 
n
X
kAk∞ = máx  |aij | , (I.2.5)
i=1,...,m
j=1
p
kAk2 = valor propio más grande de At A. (I.2.6)
Demostración.- Para la norma kxk1 . Se tiene

! !
m X
n m Xn n m m

X X X X X
kAxk1 = aij xj ≤ |aij | · |xj | = |aij | |xj | ≤ máx |aij | · kxk1 .
j=1,...,n
i=1 j=1
i=1 j=1 j=1 i=1 i=1
P P P
Deducimos que kAk1 ≤ máx( |aij |. Para mostrar la igualdad, se elige un j0 con máx( |aij | = |aij0 |.
j i j i i
Tomamos x = ej0 el j0 -simo vector de la base canónica, con
P la elección de este x se tiene igualdad, lo que
demuestra que kAk1 no puede ser más pequeño que máx( |aij |. La fórmula para kxk∞ se la demuestra de
j i
la misma manera.
Ahora mostremos para la norma euclidiana. La matriz At A es simétrica y semi definida positiva
t t 2
(x A Ax = kAxk2 ≥ 0), por consiguiente existe una base ortonormada de vectores propios y los valores
propios {λ1 , . . . , λn } respectivos son reales no +negativos. Denotamos por {d1 , . . . , dn } los elementos de esta
base ortonormada. Se tiene v
u n
2
uX
kAxk2 = t λ2i x2i ≤ máx λi kxk2 .
i
i=1
Para obtener igualdad, se plantea x igual al vector propio de la base ortnormada asociado al valor propio
más grande.

Ejemplo I.2.2 Para la matriz  

4 3
A =  −2 5
4 1
se tiene
kAk1 = máx{10, 9} = 10
kAk2 ≈ 6,4437,
kAk∞ = máx{7, 7, 5} = 7.
Ejemplo I.2.3 Sea k : [0, 1] × [0, 1] → R una función continua a dos variables. Consideramos el operador
lineal A : C([0, 1]) → C([0, 1]), dado por
Z 1
(Af )(t) = k(t, s)f (s) ds,
0
y las normas de la proposición I.1.6, se tiene

R1
kAk1 = máxs∈[0,1] 0 |k(t, s)| dt,
R1
kAk∞ =qmáxt∈[0,1] 0 |k(t, s)| ds,
R1R1 2
kAk2 ≤ 0 0
|k(t, s)| ds dt.
Ejercicio.- Mostrar los resultados del ejemplo (I.2.3)
Proposición I.2.6 Sea E un espacio de Banach y supongamos que el operador A ∈ L(E) satisface kAk ≤ 1.
Entonces I − A es inversible, (I − A)−1 es continua y se tiene
(I − A)−1 = I + A + A2 + A3 + · · · (I.2.7)
Demostración.- Mostremos primero que
An = I + A + A2 + · · · + An
n
es una sucesión de Cauchy en L(E). Utilizando kAn k ≤ kAk , se obtiene para m > n
n+1
n+1 m kAk
kAn − Am k = An+1 + · · · + Am ≤ An+1 + · · · + kAm k ≤ kAk

+ · · · + kAk ≤ .
1 − kAk
Como E es completo, entonces L(E) también es completo. Por lo tanto, {An } es una sucesión convergente,
cuyo lı́mite denotémosle por B.
Ahora bien, pasando al lı́mite cuando n → ∞ en la identidad An (I − A) = (I − A)An = I − An+1 se
obtiene que B(I − A) = (I − A)B = I lo que demuestra la inversibilidad de (I − A) en L(E).
I.2.1. Ejercicios
1. Sea E un espacio de Hilbert y sea A ∈ L(E). Mostrar que
hu, Avi
kAk = sup
u6=0,v6=0 kuk · kvk
donde h·, ·i es el producto escalar y k·k es la norma inducida por el producto escalar.
2. El radio espectral ρ(A) de una matriz n × n, A, está definido por:
ρ(A) = máx{|λ| | λ valor propio de A}
Sea E = Rn provisto de una norma y sea A ∈ L(E). Mostrar que para toda norma sobre Rn se tiene
la desigualdad siguiente
kAk ≥ ρ(A)
y que si A es simétrica se tiene la igualdad kAk2 = ρ(A).
3. Sea
0,999 1000
A= .
0 0,999
I.3. DIFERENCIABILIDAD EN LOS ESPACIOS NORMADOS 11
(a) Calcular el radio espectral ρ(A), ası́ como kAk1 , kAk2 y kAk∞ .
(b) Encontrar una norma k·k sobre R2 tal que para esta norma, se tenga kAk ≤ 1.
4. Consideremos el conjunto de las matrices n × n, que identificamos con Rn·n y que se le dota de la
norma kAk = supkxk≤1 kAxk. Sea l : Rn·n → Rn·n la aplicación lineal dada por l(H) = X0 H + HX0
donde X0 es una matriz fija. Calcular la norma de la aplicación l.
5. En el marco del ejemplo I.2.3 demostrar que

Z 1
kAk∞ = máx |k(t, s)| ds.
t∈[0,1] 0
Indicación.- Considerar primero que la función k(t, s) posee un número finito de ceros.
6. Consideremos la ecuación integral siguiente, llamada ecuación integral de Fredholm (segunda especie):
Z 1
y(t) = f (t) + k(t, s)y(s) ds, (I.2.8)
0
donde f ∈ C([0, 1]) y k ∈ C([0, 1] × [0, 1]) son datos e y es la incógnita. Se supone que
Z 1
máx |k(t, s)| ds < 1.
t∈[0,1] 0
(a) Demostrar que (I.2.8) posee una única solución en C([0, 1]).
(b) Utilizando la serie de Neumann, escribir la solución bajo la forma
Z 1
y(t) = f (t) + r(t, s)f (s) ds.
0
7. Resolver Z 1
1
y(t) = f (t) + et−2 y(s) ds (I.2.9)
2 0
R1
(a) Se plantea a ≡ 0 e−s y(s) ds. Multiplicando (I.2.9) por e−t e integrando, se encuentra a y por lo
tanto la solución y(t) = f (t) + aet /2.
(b) Utilizando la fórmula del ejercicio precedente.
I.3. Diferenciabilidad en los Espacios Normados

En el curso de Primer Año de Análisis, se dio la definicion de diferenciabilidad de una aplicación de Rn en
Rm . Esta misma definición puede ser generalizada a espacios normados.
Definición I.3.1 Sean E, F dos espacios vectoriales normados y U ⊂ E un abierto. Se dice que f : U → F
es diferenciable en a ∈ U , si existe una aplicación lineal continua f 0 (a) ∈ L(E, F ) tal que
f (x) = f (a) + f 0 (x)(x − a) + r(x) kx − ak , (I.3.1)
donde la función r : U → F safisface r(x) → 0 cuando x → a.
Remarca I.3.1 Respecto a la definicón para las funciones de Rn en Rm se exige que f 0 (a) sea continua. Esto
es importante, porque sino un función diferenciable podrı́a no ser continua. En el caso finito dimensional,
esta hipótesis está demás porque todas las aplicaciones lineales son continuas.
Ejemplo I.3.1 Sean E = R3 , F = R2 y f : E → F dada por

2
f1 (x1 , x2 , x3 ) x1 + x22 + x23
f (x) = = .
f1 (x1 , x2 , x3 ) x1 x2 x3
La derivada en el punto a = (a1 , a2 , a3 ) es la aplicación lineal f 0 (a) ∈ L(R3 , R2 ), cuya matriz es

2a1 2a2 2a3
f 0 (a) = .
a2 a3 a1 a3 a1 a2
Se verifica facilmenten que la aplicación r(x) de (I.3.1) satisface r(x) → 0 si x → 0. Como todas las normas
son equivalentes en Rn y Rm no es necesario precisar la norma con la cual se trabaja.
Ejemplo I.3.2 En el ejemplo precedente se dio la matriz de la derivada de la función. Consideremos E =

L(Rn ), como espacio vectorial E es de dimensión n × n. Sea f : E → E dada por f (X) = X 2 . Se tiene
f (A + H) = (A + H)2 = A2 + AH + HA + H 2 ,
deducimos que f 0 (A) es la aplicación lineal f (A)H = AH + HA.
Ejemplo I.3.3 Consideremos el espacio C([0, 1]) con la norma k·k∞ , denotemos sus elementos por x(t) o
a(t) y estudiemos la aplicación f : C([0, 1]) → C([0, 1]),
Z 1
f (x)(t) = k(t, s)g(x(s)) ds,
0
donde k : [0, 1] × [0, 1] → R es continua y g : R → R es 2 veces continuamente diferenciable. Para una función
a ∈ C([0, 1]) dada, busquemos la derivada f 0 (a). Con h ∈ C([0, 1]), se tiene:
Z 1
(f (a + h) − f (a))(t) = k(t, s)(g(a(s) + h(s)) − g(a(s)))ds
0
Z 1
1
= k(t, s)(g 0 (a(s))h(s) + g 00 (α(s)h(s)))h(s) ds,
0 2
donde α(s) es un valor entre a(s) y a(s)+h(s). Este cálculo muestra que la aplicación lineal f 0 (a) : C([0, 1]) →
C([0, 1]), definida por
Z 1
(f 0 (a)h)(t) = k(t, s)g 0 (a(s))h(s) ds,
0
es una buena candidata para la derivada de f . Esta aplicación es continua, ver ejemplo de la sección pre-
2
cedente. Además el resto kf (a + h) − f (a) − f 0 (a)hk∞ puede ser estimado por C khk∞ , por que g 00 (x) es
acotada sobre el intervalo que contiene a(s) y a(s) + h(s) para todo s ∈ [0, 1] y todo h con khk∞ ≤ 1
Definición I.3.2 Una aplicación A : E → F , donde E y F son espacios vectoriales normados es un

isomorfismo, si A es lineal, biyectiva, continua y si A−1 es continua.
Se denota
GL(E, F ) = {A ∈ L(E, F )|A es un isomorfismo}.
Para F = E, se escribe también GL(E) en lugar de GL(E, E).
Proposición I.3.1 Sea E un espacio de Banach. La aplicación f (X) = X −1 de GL(E) en L(E) es dife-
renciable y se tiene
f 0 (A)H = −A−1 HA−1 . (I.3.2)
Demostración.- La continuidad de f 0 (A) es una consecuencia de

2
kf 0 (A)Hk ≤ A−1 kHk .

I.3. DIFERENCIABILIDAD EN LOS ESPACIOS NORMADOS 13
El resto
X
f (A + H) − f (A) − f 0 (A)H = ((I + A−1 H)−1 − I + A−1 H)A−1 = (−A−1 H)j A−1
j≥2
2 3
puede ser estimado por kHk A−1 /(1 − A−1 − H ). Dividido por kHk, este resto tiende a 0 cuando
kHk → 0.
Para dos espacios vectoriales normados E1 y E2 , de normas respectivas k·kE1 y k·kE2 ; consideremos el espacio
producto E1 × E2 . Si al espacio producto se le dota de la norma
k(x1 , x2 )k = máx{kx1 kE1 , kx2 kE2 }, (I.3.3)
se obtiene un espacio vectorial normado.
Proposición I.3.2 El espacio producto E1 × E2 dotado de la norma (I.3.3) es un espacio de Banach, si y

solamente si E1 y E2 son espacios de Banach.
Definición I.3.3 Una aplicación bilineal B : E1 ×E2 → F es una aplicación bilineal acotada, si exite M > 0
tal que
kB(x1 , x2 )k ≤ M · kx1 kE1 · kx2 kE2 , ∀(x1 , x2 ) ∈ E1 × E2 . (I.3.4)
Proposición I.3.3 Una B : E1 × E2 → F bilineal acotada es diferenciable y su derivada está dada por
B 0 (a1 , a2 )(h1 , h2 ) = B(a1 , h2 ) + B(h1 , a2 ). (I.3.5)
Demostración.- La continuidad de B 0 (a1 , a2 ) resulta de
kB 0 (a1 , a2 )(h1 , h2 )k = kB(a1 , h2 ) + B(h1 , a2 )k

≤ kB(a1 , h2 )k + kB(h1 , a2 )k
≤ M (ka1 kE1 kh2 kE2 + kh1 kE1 ka2 kE2 )
≤ 2 · M k(a1 , a2 )k k(h1 , h2 )k .
La diferenciabilidad de B es una consecuencia de
B(a1 + h1 , a2 + h2 ) − B(a1 , a2 ) − B 0 (a1 , a2 )(h1 , h2 ) = B(h1 , h2 ),
porque
2
kB(h1 , h2 )k ≤ M ka1 kE1 kh2 kE2 ≤ M k(h1 , h2 )k .
Proposición I.3.4 Sean f, g : U → F , U abierto de E, diferenciables en a ∈ U , y sea λ ∈ R. Entonces, se

tiene
(f + g)0 (a) = f 0 (a) + g 0 (a), (λf )0 (a) = λf 0 (a). (I.3.6)

Proposición I.3.5 Sean E, F, G tres espacios vectoriales normados. Sean U abierto de E, V abierto de F .
Se considera dos aplicaciones, f : U → V diferenciable en a ∈ U y g : V → G diferenciable en f (a) ∈ V .
Entonces g ◦ f es diferenciable en a y se tiene
(g ◦ a)0 (a) = g 0 (f (a)) ◦ f 0 (a). (I.3.7)
Proposición I.3.6 (Fórmula de Leibniz) Sean E, F1 , F2 , F espacios vectoriales normados, U abierto

de E, f : U → F1 y g : U → F2 aplicaciones diferenciables en a ∈ U , y B : F1 × F2 → G una aplicación
bilineal acotada. Entonces la aplicación p(x) = B(f (x), g(x)) es diferenciable y se tiene
p0 (x)h = B(f (a), g 0 (a)h) + B(f 0 (a)h, g(a)). (I.3.8)
Demostración.- Consecuencia de las proposiciones sobre la diferenciabilidad de la aplicación bilineal aco-

tada y la composición de aplicaciones, por que p = B ◦ d donde
d(x) = (f (x), g(x)) con derivada d0 (x)h = (f 0 (x)h, g 0 (x)h).
I.3.1. Ejercicios
1. Sea E un espacio de Banach, consideramos la aplicación f : C(E) → C(E) dada por f (X) = X 3 .
Calcular la derivada de f . Mostrar con ejemplos que en general, f 0 (X) 6= 3X 2 .
2. Sea E un espacio de Banach, se considera la aplicación exp : C(E) → C(E) dada por la serie siguiente:
∞
X 1 n
exp(X) = X .
n=0
n!
(a) Mostrar que la aplicación exp está bien definida.

(b) Calcular la derivada, exp0 de la aplicación exp.
(c) Mostrar con ejemplos que en general exp0 (X) 6= exp(X).
Indicación.- Si le ayuda, suponer que E = Rn .
3. Calcular la derivada de la función f : GL(Rn ) → L(Rn ) dada por f (X) = (X t X)−1 .
4. Sea A : R → Mn,n (R) una función diferenciable con valores en las matrices de n × n. Mostrar que
d −1
A(x) = −A(x)−1 A0 (x)A(x)−1 .
dx
5. (a) Sea M : E1 ×· · ·×En → F una aplicación multilineal donde E1 , . . . , En , F son espacios vectoriales
normados. Calcular la derivada de M .
(b) Sea A : R → M3,3 (R) una función matricial, cuyas columnas son A1 (x), A2 (x) y A3 (x). Mostrar
que
d
det(A(x)) = det(A01 , A2 , A3 ) + det(A1 , A02 , A3 ) + det(A1 , A2 , A03 ).
dx
√
6. Sea f (x, y) = ln(x2 +y 2 ) para x2 +y 2 > 0 y g(x, y) = (xy, x/y)t para x > 0, y > 0. Calcular la derivada
de h(x, y) = (f ◦ g)(x, y) = ln(x2 y 2 + x/y 2 ) directamente y luego con la fórmula de diferenciación de
funciones compuestas.
I.4. TEOREMA DE LOS INCREMENTOS FINITOS 15
I.4. Teorema de los Incrementos Finitos

Para una función f : [a, b] → R, el teorema de los incrementos finitos, (o teorema de Lagrange) afirma que
existe un ξ ∈ (a, b) tal que
f (b) − f (a) = f 0 (ξ)(b − a)
si f es continua sobre [a, b] y diferenciable sobre (a, b).
Para una función f : [a, b] → Rm , la afirmación del teorema ya no es cierta. Un contra ejemplo es
la función f (x) = (cos x, sin x) y [a, b] = [0, 2π]. Se tiene que f (a) = f (b), sin embargo, no existe ξ con
f 0 (ξ) = (0, 0). Pero, se ve que la desigualdad
kf (b) − f (a)k ≤ kf 0 (ξ)k · kb − ak .
En un primer teorema, consideraremos las funciones f : [a, b] → F donde F es un espacio vectorial

normado. Enseguida, extenderemos el resultado a funciones f : U → F , donde U ⊂ E y E es otro espacio
vectorial normado
Teorema I.4.1 Sean a < b dos números reales, F un espacio vectorial normado, f : [a, b] → F y g : [a, b] →
R dos aplicaciones continuas sobre [a, b] y diferenciables sobre (a, b). Supongamos que kf 0 (t)k ≤ g 0 (t) para
a < t < b. Entonces
kf (b) − f (a)k ≤ g(b) − g(a).
Demostración.- Para un > 0 dado, consideremos la desigualdad
kf (t) − f (a)k ≤ g(t) − g(a) + (t − a) + . (I.4.1)
Esta desigualdad se cumple estrictamente para t = a, por la continuidad de f y g, en un vecindario de a.

Por lo tanto, el supremo
c = sup{t ∈ [a, b]| (I.4.1) se cumple }
existe y se tiene que c > a.
Mostremos que la desigualdad se cumple para c. Por definición del supremo, existe una sucesión {tn },
tn → c, tal que
kf (tn ) − f (a)k ≤ g(tn ) − g(a) + (tn − a) + . (I.4.2)
Pasando al lı́mite n → ∞, la continuidad de f y g aseguaran la desigualdad (I.4.1) para t = c.
Supongamos que c < b. La diferenciabilidad de f y g en el punto c implica la existencia de un η > 0 tal
que
kf (t) − f (c)k ≤ kf 0 (c)k (t − c) + 2 (t − c),
g(t) − g(c) ≥ g 0 (c)(t − c) − 2 (t − c)
para todo t ∈ [c, c + η]. La hipótesis kf 0 (c)k ≤ g 0 (c) implica entonces que

kf (t) − f (c)k ≤ g 0 (c)(t − c) + (t − c) ≤ g(t) − g(c) + (t − c).
2
Esto, con la desigualdad (I.4.1) para t = c, conduce a
kf (t) − f (a)k ≤ kf (t) − f (c)k + kf (c) − f (a)k

≤ g(t) − g(c) + (t − c) + g(c) − g(a) + (c − a) +
≤ g(t) − g(a) + (t − a) +
para todo t ∈ [c, c + η], lo que contradice la definición de c. Entonces, se tiene necesariamente c = b. Si se
deja tender hacia 0 en (I.4.1) con t = b, se obtiene la afirmación del teorema.

Consideremos la situación en la que f está definida sobre un abierto U de un espacio vectorial normado E,
que sea necesariamente R. Para a, b ∈ E, se llama segmento de extremidades a y b al conjunto de los puntos
x ∈ E que son de la forma x = a + t(b − a) con 0 ≤ t ≤ 1.
Teorema I.4.2 (Teorema de los Incrementos Finitos) Sean E, F espacios vectoriales normados y U ⊂
E abierto. Si f : U → F es diferenciable en U , y si el segemento de extremidades a y b está contenido en U ,
se tiene
kf (b) − f (a)k ≤ sup kf 0 (a + t(b − a))k · kb − ak . (I.4.3)
0<t<1
Demostración.- La aplicación h(t) = f (t + a(b − a)) es una aplicación diferenciable de [0, 1] en F y se tiene
h0 (t) = f 0 (a + t(b − a))(b − a), por lo tanto
kh0 (t)k ≤ kf 0 (a + t(b − a))k · kb − ak .
Suficiente aplicar el teorema I.4.1, remplazando a por 0, b por 1, f por h y g(t) por M t donde M =
sup kf 0 (a + t(b − a))k · kb − ak.
0<t<1
Se dice que un conjunto D de un espacio vectorial es convexo si, cuales sean a, b ∈ D, le segmento de
extremidades a y b está contenido en D.
Corolario I.4.1 Sean E, F espacios vectoriales normados, U ⊂ E abierto, f : U → F diferenciable, y

D ⊂ U convexo. Entonces,
kf (x) − f (y)k ≤ sup kf 0 (z)k · kx − yk
z∈D
para x, y ∈ D.
Demostración.- Consecuencia inmediata del teorema I.4.2.
Un abierto U de un espacio vectorial normado se dice conexo, si dos puntos cualesquiera de U pueden
ser unidos mediante una lı́nea segmentada en U recordemos que una linea segmentada es la union finita de
segmentos de extremidades ai−1 y ai , i = 1, . . . , m.
Corolario I.4.2 Sean E, F espacios vectoriales normados, U un abierto conexo de E, f : U → F una

aplicación diferenciable en U . Si f 0 (x) = 0 para todo x ∈ U , entonces f es constante.
Demostración.- Fijemos a ∈ U y tomemos x ∈ U arbitrario. Como U es conexo, existe una sucesión finita
a = a0 , a1 , . . . , am = x tales que los segmentos de extremidades ai−1 y ai están contenidos en U . El teorema
I.4.2 implica
kf (ai ) − f (ai−1 )k ≤ sup kf 0 (ai−1 + t(ai − ai−1 ))k · kai − ai−1 k = 0.
0<t<1
Por lo tanto, f (ai ) = f (ai−1 ) y por consiguiente f (x) = f (a).
I.4.1. Ejercicios
1. Sea f : [a, b] → R continua, x1 , x2 , . . . , xn ∈ (a, b) y f diferenciable sobre el conjunto D = (a, b) −
{x1 , x2 , . . . , xn }. Demostrar o dar contra ejemplos de las afirmaciones siguientes:
(a) Existe un x ∈ D tal que f (b) − f (a) = f 0 (ξ)(b − a).

(b) Se tiene la estimación
|f (b) − f (a)| ≤ sup |f 0 (t)| (b − a).
t∈D
I.5. TEOREMA DEL PUNTO FIJO DE BANACH 17
I.5. Teorema del punto fijo de Banach

Consideremos el problema de resolver una ecuación no lineal en un espacio de Banach. Para las funciones f
y g de E, el problema puede ser formulado de la manera siguiente:
• g(x) = 0, se busca un cero de g, o
• f (x) = x, se busca un punto fijo de f .
Planteando f (x) = x + g(x) o f (x) = x + Ag(x), con A ∈ GL(E), se puede pasar de una formulación a la
otra. El teorema siguiente da una condición suficiente para la existencia y la unicidad de una solución a este
problema.
Teorema I.5.1 (Teorema del punto fijo de Banach, 1922.) Sean E un espacio de Banach, D ⊂ E
cerrado, y f : D → E una aplicación que satisface:
i) f (D) ⊂ D.
ii) f es una contracción sobre D; es decir, existe α < 1 tal que
kf (x) − f (y)k ≤ α kx − hk para x, y ∈ D. (I.5.1)
Entonces f posee un único punto fijo en D.
Demostración.- Mostremos primero la unicidad. Sean x, y ∈ D dos puntos fijos; es decir f (x) = x y
f (y) = y. La contractividad implica que
kx − yk = kf (x) − f (y)k ≤ α kx − yk
con α < 1 es solo posible si x = y.

Para la existencia, tomemos x0 ∈ D y consideremos la sucesión dada por xn+1 = f (xn ). La hipótesis
f (D) ⊂ D asegura que {xn } es una sucesión en D. Mostremos que {xn } es una sucesión de Cauchy. Se tiene
kxn+1 − xn k = kf (xn ) − f (xn−1 )k ≤ α kxn − xn−1 k y aplicando esta desigualdad iterativamente, se obtiene
kxn+1 − xn k ≤ αn kx1 − x0 k .
Para m > n, se deduce que
kxm − xn k kxm − xm−1 k + kxm−1 − xm−2 k + · · · + kxn+1 − xn k

≤ (αm−1 + αm−2 + · · · + αn ) kx1 − x0 k
≤ kan k 1 − α kx1 − x0 k .
Entonces, {xn } es una sucesión de Cauchy. Como E es un espacio completo, esta sucesión converge hacia
x ∈ E. Como D es cerrado x ∈ D.
La condición de contractividad, implica que f sea uniformemente continua sobre D, por lo tanto continua.
Tomando el lı́mite n → ∞ en xn+1 = f (xn ) y utilizando la continuidad de f , se obtiene x = f (x).
La demostración del teorema del punto fijo de Banach es constructiva y nos conduce al algoritmo siguiente:
Método de las aproximaciones sucesivas

Para resolver un problema x = f (x) en un espacio de Banach, este método está definido por:
• Se elige x0 arbitrariamente,
• se aplica la iteración xn+1 = f (xn ).

Bajo las hipótesis del teorema, este algoritmo converge hacia una solución única del problema. A menudo,
las hipótesis son dificiles de verificar, pero de todas maneras se puede aplicar este algoritmo. Si se tiene
convergencia, estamos seguros de haber encontrado una solución (si f es continua). Esta solución no es
necesariamente única.
Ejemplo I.5.1 Tomemos la función f (x) = cos x sobre D = [0, 1]. Esta función es una contracción, por que
|f 0 (x)| ≤ sin 1 < 1 para x ∈ D. Otro ejemplo es la función f (x) = ex /4 sobre D = [0, 1,1]. Para esta función
se tiene |f 0 (x)| = ex /4 ≤ e1,1 /4 < 1 sobre D. Las iteraciones son ilustradas en la figura I.5.1
Figura I.5.2: Método de las aproximaciones sucesivas para f (x) = cos x y f (x) = ex /4
Ejemplo I.5.2 Consideremos el sistema de dos ecuaciones no lineales a dos incognitas

x = 2 + (x2 + y 2 )/20, y = 1 − xy 3 /10.
Sin verificar las hipótesis del teorema del punto fijo de Banach, aplicamos el método iterativo con valores
iniciales x0 = 2, y0 = 1. Se obtiene entonces y se observa que la sucesión converge a la solución x = 2,3014505,
x1 2,2500000 y1 0,8000000
x2 2,2851250 y2 0,8840000
x3 2,3002333 y3 0,8417129
x4 2,2999777 y4 0,8628284
Cuadro I.1: Iteraciones sucesivas
y = 0,8557662 del sistema.

Ejemplo I.5.3 Consideramos el espacio de Banach C([0, 1]) con la norma k·k∞ y el problema a punto fijo
Z 1
y(t) = f (t) + λ k(t, s)y(s) ds,
0
donde f y k son dados y λ es tal que

Z 1
|λ| · máx |k(t, s)| ds < 1, (I.5.2)
0≤t≤1 0
ver ejemplo 3 de la sección I.3. El método de las aproximaciones sucesivas se escribe como sigue: Se toma
una aproximación inicial, por ejemplo y0 (t) = f (t) y se itera según
Z 1
yn+1 (t) = f (t) + λ k(t, s)yn (s) ds.
0
La sucesión {yn (t)} converge hacia la solución única de (I.5.2.

Consideremos el problema de resolver f (x) = y para un vector dado y y busquemos resultados sobre la
existencia y la unicidad (local) de una solución; es decir, buscamos resultados sobre la biyectividad de f .
Además, nos gustarı́a saber si la solución depende continuamente del parámetro y. Esto está resumido en la
definición siguiente.
Definición I.5.1 Sean E, F espacios vectoriales normados, U ⊂ E y V ⊂ F . Una aplicación f : U → V es
un homeomorfismo de U sobre V , si f es biyectiva, continua y si la inversa f −1 : V → V es continua.
Método de Newton Simplificado

Supongamos que f (a) = b y consideremos el problema f (x) = y para un y dado, próximo a b. Sea x0 una
aproximación de la solución buscada, por ejemplo x0 = a. La idea de linealizar el problema alrededor de x0
y de resolver el problema linealizado para obtener una mejor aproximación x1 :
f (x0 ) + f 0 (x0 )(x1 − x0 ) = y ox1 = x0 − f 0 (x0 )−1 (f (x0 ) − y).
Iterando este procedimiento, se obtiene el método de Newton
xn+1 = xn − f 0 (xn )−1 (f (xn ) − y)
ver figura I.5.2. Este método puede ser interpretado como el método de las aproximaciones sucesivas aplicado
a x = g(x), donde g(x) = x − f 0 (x)−1 (f (x) − y).
En la práctica, se remplaza a menudo la derivada f 0 (xn ) por una aproximación A que no dependa de xn .
Esto simplifica el cálculo numérico y la teorı́a (estudio de convergencia, ver el teorema siguiente). Nosotros
consideraremos entonces el método de Newton Simplificado, que se escribe como xn+1 = g(xn ) donde
g(x) = x − A−1 (f (x) − y) (I.5.3)
Figura I.5.3: Método de Newton (izquierda) y método de Newton simplificado (derecha)
Proposición I.5.1 Sean E, F espacios de Banach, B = {x ∈ E| kx − ak ≤ ρ}, A : E → F un isomorfismo

y supongamos que f : B → F satisfaga
x − z − A−1 (f (x) − f (z)) ≤ α kz − zk para x, z ∈ B

(I.5.4)
con α < 1. Entonces
f es un homeomorfismo de B sobre f (B). Ademaás cada y con ky − f (a)k ≤ σ =
ρ(1 − α)/ A−1 está en f (B) y el método de Newton simplificado (con x0 = a) converge hacia la solución
de f (x) = y.
Demostración.- Mostremos primero que f : B → f (B) es un homeomorfismo. La aplicación g(x) de (I.5.3)

es una contracción sobre B para nuestra hipótesis. La continuidad de f (x) es una consecuencia de
kf (x) − f (z)k = kA(x − z) − A(g(x) − g(z))k ≤ kAk (1 + α) kx − zk .
−1
De la definición de g(x), deducimos
que
−1
x − z = g(x) − g(z) + A (f (x) − f (z)) y nosotros obtenemos la
estimación kx − zk ≤ α kx − zk + A · kf (x) − f (z)k. Se tiene por lo tanto
−1
A
kx − zk ≤ kf (x) − f (z)k para x, z ∈ B (I.5.5)
1−α
La función f : B → f (B) es sobreyectiva por definición. Por la propiedad (I.5.5) demuestra que es inyectiva
y por lo tanto biyectiva. Planteando u = f (x) y v = f (z) en (I.5.5), se obtiene

−1
f (u) − f −1 (v) ≤ A
−1
ku − vk , (I.5.6)
1−α
lo que demuestra la continuidad de f −1 sobre f (B).
Consideremos un y ∈ F con ky − f (a)k ≤ σ. Mostremos que g(B) ⊂ B. Esto proviene de g(x) − a =
x − a − A−1 (f (x) − f (a)) − A−1 (f (a) − y), porque
kg(x) − ak ≤ α kx − ak + A−1 · kf (a) − yk ≤ αρ + A−1 σ = ρ

para x ∈ B. Como B es cerrado, se puede aplicar el teorema del punto fijo de Banach. Para un tal y existe
x ∈ B satisfaciendo g(x) = x, es decir f (x) = y.

Si f (x) es diferenciable en a, el centro de la bola B, es natural elegir A = f 0 (a) a condición que A sea un
isomorfismo de espacios normados. Pero la diferenciabilidad en el punto a no garantiza que la estimación
(I.5.4) sea verificada para un α < 1. Nosotros consideraremos entonces una condición más fuerte que la
diferenciabilidad.
Definición I.5.2 Sean E y F espacios vectoriales normados, U ⊂ E abierto, a ∈ U . Se dice que f : U → F
es estrictamente diferenciable en a ∈ U si existe una aplicación lineal continua A : E → F tal que
f (x) − f (z) = A(x − z) + r(x, z) kx − zk , (I.5.7)
donde la función r : U × U → F satisface r(x, z) → 0 si (x, z) → (a, a).
Planteando z = a en (I.5.7) se tiene (I.3.1) con A = f 0 (a). De esta manera estrictamente diferenciable en
a, implica diferenciable en a. A partir de (I.5.7), se ve que una función estrictamente diferenciable en a es
continua en todo un vecindario de a.
Ejemplo I.5.4 Existe funciones que son diferenciables en a. pero no estrictamente diferenciables en a. Se
puede tomar una función que es diferenciable en a, pero que no es continua en ningún vecindario de a. Ver
Primer Año de Análisis. Otro ejemplo es la función

0 six = 0
f (x) =
x2 cos(1/x) sino.
Las sucesiones xn = 1/(2nπ) y zn = ((2n + 1)π)−1 convergen hacia 0, pero (f (xn ) − f (zn ))/(xn − zn ) =
(x2n + zn2 )/(xn − zn ) no convergen hacia f 0 (0) = 0 si n → 0.
Teorema I.5.2 Sean E, F espacios vectoriales normados U ⊂ E abierto y a ∈ U . Si f : U → F es
diferenciable en U y si la aplicación f 0 : U → L(E, F ) es continua en el punto a, entonces f es estrictamente
diferenciable en el punto a.
Demostración.- Apliquemos el teorema de los incrementos finitos a g(x) = f (x) = f 0 (a)x.

Como la derivada de g(x) es g 0 (x) = f 0 (x) − f 0 (a), se tiene
kf (x) − f (z) − f 0 (a)(x − z)k ≤ sup kf 0 (z + t(x − z)) − f 0 (a)k · kx − zk .
0<t<1
0
La continuidad de f (x) en el punto a implica que la expresión
sup kf 0 (z + t(x − z)) − f 0 (a)k
0<t<1
tiende a 0 si (x, z) → (a, a).


Ejemplo I.5.5 Retomemos la función f (X) = X −1 de la proposición I.3.3, para la cual la derivada es
f 0 (X)H = −X −1 HX −1 . Mostremos que esta función es estrictamente diferenciable en GL(E). Como
f (X)
es continua en A ∈ GL(E), se tiene que para todo > 0 existe un δ > 0 tal que X −1 − A−1 < si
kX − Ak < δ. Escribiendo
f 0 (X)H − f 0 (A)H = −X −1 HX −1 + A−1 HA−1 = −X −1 H(X −1 − A−1 ) − (X −1 − A−1 )HA−1 ,
se obtiene
k(f 0 (X) − f 0 (A))Hk ≤ ( X −1 + A−1 ) kHk .

Se deduce
kf 0 (X) − f 0 (A)k ≤ ( X −1 + A−1 )

y por lo tanto la continuidad de f 0 (X) en el punto A. Esto nos permite aplicar el teorema precedente.
Para todas las funciones de los ejemplos de la sección I.3, se puede demostrar sin dificultad que f 0 (x) es
continua. Entonces, el teorema 6,2 implica que son estrictamente diferenciales.
I.5.1. Ejercicios
1. Consideremos la función f : R → R definida por
x + e−x/2

si x ≥ 0
f (x) = .
ex/2 si x < 0
(a) Mostrar que |f (x) − f (y)| < |x − y| para x 6= y.
(b) Mostrar que la función f (x) no posee puntos fijos.
¿Hay una contradicción con el teorema del punto fijo?
2. Se considera C([0, 1]) con la norma k·k∞ y la aplicación f : C([0, 1]) → C([0, 1]) dada por
Z 1
f (x)(t) = λ k(t, s)g(x(s))ds
0
donde k ∈ C([0, 1] × [0, 1]) y g : R → R lo suficientemente diferenciablel. Encontrar una condición sobre
λ bajo la cual f es una contracción sobre el cerrado
D = {x ∈ C([0, 1])| kxk∞ ≤ 1}.
3. Mostrar que la hipótesis “D cerrado” no puede, en general, ser omitida en el teorema del punto fijo
de Banach: encontrar un D no cerrado y una aplicación f : D → E tales que f (D) ⊂ D y f es una
contracción sobre D, pero que f no posee un punto fijo en D.
4. Sea U un abierto conexo de R y E un espacio vectorial normado. Sea f : U → E una aplicación que
satisface
2
kf (x) − f (y)k ≤ C kx − yk para todo x, y ∈ U,
donde C > 0. Mostrar que f es constante sobre U .
5. Sea la función f : R2 → R3 dada por
 
x21 + x22 + 5
f (x1 , x2 ) =  3x1 x2 + 2 
x31 + x32
y sea K = {(x1 , x2 ) ∈ R2 | |x1 | ≤ 1, |x2 | ≤ 2}. Encontrar una constante L tal que
kf (x) − f (y)k∞ ≤ L kx − yk∞ para x, y ∈ K.
L se llama constante de Lipschitz.
6. Sea A ∈ L(E) con kAk < 1 y consideremos el problema
x = Ax + b.
Mostrar que la k-sima aproximación xk , obtenida por el método de las aproximaciones sucesivas con
(x0 = b) es igual a la aproximación obtenida al truncar la serie de Neumann para (I − A)−1 después
de k términos. Encontrar ası́ una conexión entre el ejercicio 6 de la sección I.2 y el ejemplo I.5.3.
7. Estimación del error para el método de las aproximaciones sucesivas. Sea x∗ un punto fijo dado por
este método. Demostrar
α
kx∗ − xk k ≤ kxk − xk−1 k . (I.5.5)
1−α
Para las funciones del ejemplo I.5.2, efectuar algunas iteraciones y utilizar (I.5.5) para obtener una
estimación rigurosa del error.
8. Sean E, F espacios vectoriales normados y U ⊂ E cerrado. Se plantea la interrogante siguiente: “¿Sea

f : U → F inyectiva, es f un homeomorfismo de U sobre f (U )?”.
(a) Demostrar que es cierto si E = Rn y U es acotado.

(b) Mostrar mediante un contra ejemplo que la afirmación no es cierta en espacios de dimensión finita
(considerar por ejemplo la identidad en un espacio provisto de 2 normas no equivalentes).
9. Considérese la función f : [−1, 1] → R dada por

1
− n1 ) 1 1

f (x) = n+1 (2 |x| si n≤ |x| n−1
0 si x=0
Mostrar que f es estrictamente diferenciable en el origen, pero que no es diferenciable en ningún

vecindario de 0.
Indication.- f (x) satisface f (1/n) = 1/n(n + 1) y es lineal sobre [1/n, 1/(n + 1)].
10. Sea A ∈ L(E) un isomorfismo. Para calcular su inversa, se aplica el método de Newton a la equatión
X −1 − A = 0. Mostrar que se obtiene la iteración
Xk+1 = Xk+1 + Xk (I − AXk )
y verificar que la sucesión {Xk } converge hacia A−1 si kI − AX0 k < 1.

Indication. Ek = I − AXk satisface Ek+1 = Ek Ek .
I.6. Teorema de Inversión Local

Continuamos con el estudio de la resolución de las ecuaciones no lineales f (x) = 0 o f (x) = y para un y en
un espacio de Banach.
Ejemplo I.6.1 Ejemplo Consideremos el sistema no lineal
x21 + x22 − 3x1 = y1 , x41 − x21 x2 + 2 = y2 . (I.6.1)
Para (x1 , x2 ) = (1, 2) se obtiene (y1 , y2 ) = (6, 1). La pregunta a la cual nos gustarı́a responder es la siguiente:
¿Para (y1 , y2 ) próximo de (6, 1), exite una solución (x1 , x2 ) de (I.6.1) que es próxima de (1, 2)? ¿Es localmente
única?
Decimos que una aplicación f : U → F , donde E, F son espacios vectoriales normados y U ⊂ E abierto,
es un homeomorfismo alrededor de a ∈ U , si existe un vecindario abierto U 0 ⊂ U de a y un vecindario
abierto de V 0 de f (a) tales que la restricción f |U 0 es un homeomorfismo de U 0 sobre V 0 .
I.6. TEOREMA DE INVERSIÓN LOCAL 23
Teorema I.6.1 (Teorema de Inversión Local) Sean E, F espacios de Banach, U ⊂ E abierto y a ∈ U .

Si f : U → F es estrictamente diferenciable en a y si f 0 (a) es un isomorfismo de E sobre F , entonces f es
un homeomorfismo local alrededor de a. Además, la aplicación inversa f −1 es estrictamente diferenciable en
b = f (a) y se tiene
(f −1 )0 (b) = (f 0 (a))−1 . (I.6.2)
Demostración.- Aplicamos la proposición I.5.3 con A = f 0 (a). La función f es estrictamente diferenciable

en a. Esto significa que para todo > 0 existe δ > 0 tal que
kf (x) − f (z) − f 0 (a)(x − z)k ≤ kx − zk para x, z ∈ B, (I.6.3)
donde B = {x ∈ E| kx − ak ≤ δ}. Entonces, se tiene también

x − z − f 0 (a)−1 (f (x) − f (z)) ≤ f 0 (a)−1 · kx − zk para x, z ∈ B,

(I.6.4)

Fijamos > 0 tal que f 0 (a)−1 ≤ 1/2. Para el δ correspondiente, f es un homeomorfismo de B sobre f (B)
por la proposición (I.5.3) y f (B) contiene el abierto V 0 = {y ∈ F | ky − bk < σ} donde σ = δ/(2 f 0 (a)−1 ).
Por lo tanto, f es un homeomorfismo del abierto U 0 = f −1 (V 0 ) sobre V 0 .
Para mostrar que f −1 es estrictamente diferenciable en b = f (a), planteamos x = f −1 (u) z = f −1 (v) en
(I.6.4). Esto da para u, v ∈ V 0
f (u) − f −1 (v) − f 0 (a)−1 (u − v) ≤ f 0 (a)−1 · f −1 (u) − f −1 (v) ≤ 2 f 0 (a)−1 2 ku − vk

−1
utilizando la estimación (I.5.6) con A = f 0 (a) y α = 1/2. Por lo tanto f −1 es estrictamente diferenciable en
b y la derivada está dada por (I.6.2).

Ejemplo I.6.2 Para el problema del ejemplo precedente, tenemos

0 2a1 − 3 3a22 −1 12
f (a) = =
4a31 − 2a1 a2 −a21 0 −1

Para la norma euclidiana, se calcula f 0 (a)−1 ≈ 12,1. Si se plantea = 0,04, se puede encontrar un δ > 0
tal que (I.6.3) se verifica. Para todo y ∈ R2 con ky − bk ≤ 2δ/12,1 el sistema (I.6.1) posee una solución x que
satisface kx − ak ≤ δ. En esta bola de radio δ no hay otra solución aparte de x. Además, la demostración
del teorema de inversión local muestra que el método de Newton simplificado converge hacia esta solución.
El objetivo siguiente es estudiar si la solución de f (x) = y depende de manera diferenciable de y. Más

precisamente, estudiaremos las condiciones bajo las cuales la función inversa es diferenciable en todo un
vecindario de b = f (a).
Definición I.6.1 Sean E, F espacios vectoriales normados, U ⊂ E y V ⊂ F abiertos.
♠ f : U → F es continuamente diferenciable o de clase C 1 sobre U , si f es diferenciable en todo punto de
U y si f 0 : U → L(E, F ) es continua.
♠ f : U → V es un difeomorfismo (de clase C 1 ) de U sobre V , si f es biyectiva, continuamente diferen-
ciable, y si la inversa f −1 : V → U es continuamente diferenciable.
♠ f : U → F es un difeomorfismo local alrededor de a ∈ U , si existen: un vecindario abierto U 0 ⊂ U
de a y un vecindario abierto V 0 de f (a) tales que f es un difeomorfismo de U 0 sobre V 0 .
Remarquemos que un homeomorfismo que es continuamente diferenciable no siempre es un difeomorfismo.
√
La función f : R → R definida por f (x) = x3 nos sirve como contra ejemplo, porque f −1 (y) = 3 y es
continua, pero no diferenciable en el origen.
Una función que es continuamente diferenciable sobre U es estrictamente diferenciable sobre U . Esto es
una consecuencia del teorema I.5.5
Teorema I.6.2 Sean E, F espacios de Banach, U ⊂ E un abierto y a ∈ U . Una aplicación f : U → F de

clase C 1 es un difeomorfismo local alrededor de a, si y solamente si f 0 (a) es un isomorfismo de E sobre F .
Además, se tiene
(f −1 )0 (y) = f 0 (x)−1 para y = f (x) en un vecindario de b = f (a).
Demostración.- ⇒: Si f : U → F es un difeomorfismo local alrededor de a, se puede derivar la identidad

f −1 (f (x)) = x. Esto da
(f −1 )0 (y)f 0 (x) = I con y = f (x) (I.6.5)
en un vecindario de a. Por consiguiente, f 0 (a) es inversible. La inversa de f 0 (a)−1 = (f −1 )0 (b) es una
aplicación acotada porque f −1 es supuesta diferenciable en b.
⇐: El teorema de inversión local implica que f es un homeomorfismo local alrededor de a. Solo queda mostrar
que f −1 es continuamente diferenciable en un vecindario de b = f (a). Como f 0 (x) es próxima a f 0 (a), la
continuidad de f 0 : U → L(E, F ) y GL(E, F ) es un abierto, f 0 (x) es un isomorfismo para todo x en un
vecindario U 0 de a. Podemos aplicar el teorema de inversión local a cada uno de los x ∈ U 0 , lo que implica
la diferenciabilidad de f −1 en V 0 = f (U 0 ). Derivando la identidad f −1 (f (x)) = x, se obtiene (I.6.5) y por lo
tanto (f −1 )0 (y) = f 0 (f −1 (y))−1 para y ∈ V 0 . La función (f −1 )0 : V 0 → L(F, E), siendo la composición de las
aplicaciones continuas f −1 , f 0 y (·)−1 , es por consiguiente continua.
Corolario I.6.1 Sean E, F espacios de Banach, U ⊂ E un abierto y f : U → F continuamente diferenciable

sobre U . Entonces, f es un difeomorfismo de U sobre f (U ), si y solamente si:
i) f es inyectiva sobre U ,
ii) f 0 (x) es un isomorfismo para todo x ∈ U .
Demostración.- Este resultado es una consecuencia del teorema precedente, por que la diferenciabilidad es
una propiedad local.
Ejemplo I.6.3 (Coordenadas Polares) Sean U = {(r, ϕ ∈ R2 |r > 0}, V = R2 − {(0, 0)} y f : U → V
dada por
(r, ϕ) 7→ (r cos ϕ, r sin ϕ).
Esta aplicación es un difeomorfismo local alrededor de cada punto de U , porque

0 cos ϕ −r sin ϕ
f (r, ϕ) =
sin ϕ r cos ϕ
y det(f 0 (r, ϕ)) = r > 0. f no es inyectiva, se tiene f (r, ϕ + 2π) = f (r, ϕ). Por lo tanto, no es un difeomorfismo
de U sobre V . Si se restringe los conjuntos U y V a
U0 = {(r, ϕ)|r > 0, −π < ϕ < π}, V0 = R2 − {(x, 0)|x ≤ 0},
f se convierte en un difeomorfismo de U0 sobre V0 . En la figura I.6.1 podemos observar una representación

de las coordenadas polares.
Ejemplo I.6.4 (Coordenadas Esféricas) La aplicación
(r, ϕ, ϑ) 7→ (r cos ϕ sin ϑ, r sin ϕ sin ϑ, r cos ϑ)
es un difeomorfismo de U = {(r, ϕ, ϑ)|r > 0, −π < ϕ < π, 0 < ϑ < π} sobre el conjunto V = R3 −
{(x, 0, z)|x ≤ 0, z ∈ R}, por que el determinante de la matriz jacobiana es −r2 sin ϑ 6= 0 y la aplicación es
inyectiva.
I.6. TEOREMA DE INVERSIÓN LOCAL 25
ϕ
2π
6
y
3
2
f 1 V
3 U x
−3 −2 −1 1 2 3
−1
−2
r −3
0
0 1 2 3
Figura I.6.4: Coordenadas Polares
Ejemplo I.6.5 (Transformación de Cayley) La aplicación

1 − x2 − y 2

2y
(x, y) 7→ , (I.6.6)
(1 − x)2 + y 2 (1 − x)2 + y 2
es un difeomorfismo del semiplano izquier-
y v
do {(x, y)|x < 0} sobre el disco abierto 1
2
{(u, v)|u2 + v 2 < 1}. Ver aplicaciones confor-
mes de la parte B del curso de Análisis de 1
Segundo Año. x f u
0
−4 −3 −2 −1 −1 1
−1
−2
−1
Por lo tanto, la aplicación (I.6.6) es biyectiva y es continuamente diferenciable.
I.6.1. Ejercicios
1. Consideremos la función f : R2 → R2 dada por
x≤


 x2 − x21 si 1 x2
x− 2
2 x1 x2
f1 (x1 , x2 ) = x1 , f2 (x1 , x2 ) = x21
si 0 ≤ x2 ≤ x21

−f2 (x1 , −x2 ) si x2 ≤ 0

Mostrar que:
(a) f es diferenciable en todo punto.
(b) f 0 (0) es inversible (calcular f 0 (0)).
(c) f no es estrictamente diferenciable en el origen.
(d) No existe vecindario del origen donde f sea inyectiva; es decir f no es un homeomorfismo alrededor
del origen.
2. Dar un difeomorfismo (a) del intervalo (0, 1) con R, (b) del intervalo (0, 1) con la semirecta R∗+ .
Pn
3. Sea el “cubo” C = {x ∈ Rn |0 < x1 < 1, i = 1, . . . , n} y el ”simplex ” S = {y ∈ Rn |yi > 0, i=1 yi < 1}
y se considera la aplicación ϕ : C → Rn dada por ϕ(x) = y con yk = (1 − x1 ) · · · (1 − xk−1 )xk para
k = 1, . . . , n.
(a) Para n = 2 graficar las imagenes de ϕ de las rectas paralelas al origen.
Pn Qn
(b) Verificar que i=1 yi = 1 − i=1 (1 − xi )
(c) Verificar que ϕ es un un difeormorfismo de C sobre S y encontrar su inversa.
4. Las coordenadas esféricas de Rn están dadas por ψ(r, θ1 , . . . , θn−1 ) = x donde
x1 = r cos θ1
x2 = r sin θ1 cos θ2
x3 = r sin θ1 sin θ2 cos θ3
..
.
xn−1 = r sin θ1 sin θ2 . . . sin θn−2 cos θn−1
xn = r sin θ1 sin θ2 . . . sin θn−2 sin θn−1 .
Mostrar que
det ψ 0 = rn−1 sinn−2 θ1 sinn−3 θ2 · · · sin θn−2 ,
y mostrar que la restricción de la aplicación ψ a (0, ∞) × (0, π)n−2 × (−π, π) es un difeomorfismo.
5. Sea αn el volumen de la esfera {x ∈ Rn | kxk2 ≤ 1} en Rn . Utilizando el resultado del ejercicio anterior,
el teorema de cambio de variable para integrales y la definición de la función Gamma Γ(x) mostrar que
π n/2
αn = .
Γ(n/2 + 1)
Mostrar igualmente queR παn → 0 cuando n → ∞.
Indicación. Para Ik = 0 sink t dt se tiene (k + 1)Ik+1 = kIk − 1.
6. En el plano con las coordenadas cartesianas (x, y) se considera las dos curvas
C1 = {(x, y) : x2 − y = 0}
C2 = {(x, y) : x − y 2 = 0}.
Encontrar un difeormorfismo local alrededor de (0, 0) f tal que
f (C1 ) = {(u, v) : v = 0}
f (C2 ) = {(u, v) : u = 0}.
7. Para todo a ∈ R se considera la función fa : R → R dada por fa (x) = ax − sin x. ¿Para qué valores
de a la función fa es un homeomorfismo?, ¿un difeomorfismo?, ¿un difeomorfismo local alrededor del
origen?
I.7. Teorema de las Funciones Implı́citas

En la sección precedente, hemos considerado el problema de resolver f (y) = x y hemos encontrado condiciones
suficientes que permiten escribir la solución bajo la forma y = g(x). El objetivo de esta sección es extender
este resultado al problema
f (x, y) = 0 (I.7.1)
donde x, y y f (x, y) están en espacios de Banach. Buscamos saver si la ecuación (I.7.1) puede ser resuelta
para obtener y = g(x) tal que (al menos localmente)
f (x, y) = 0 ⇐⇒ y = g(x). (I.7.2)
I.7. TEOREMA DE LAS FUNCIONES IMPLÍCITAS 27
Ejemplo I.7.1 Se pone a consideración los siguientes ejemplos:
1. Consideremos la función
f (x, y) = 16x3 − 84x2 + 162x − 89 + 27y 3 + 54xy 2 − 108y 2 + 36x2 y − 180xy + 162y
Por un punto (a, b) satisfaciendo

(a, b) = 0 y ∂f 0
∂y (a, b) 6= 0, existe vecindarios U de a,
2
V 0 de b y un función diferenciable g : U 0 → V 0 tales
que (I.7.2) es verdad para (x, y) ∈ U 0 × V 0 . Los pun-
tos sobre la curva que tienen una tangente vertical
o horizontal pueden ser localizados por la condición
∂f ∂f 1
∂y (a, b) = 0 y ∂x (a, b) = 0 respectivamente. En el
punto de cruce se tiene necesariamente f (a, b) = 0,
∂f ∂f
∂x (a, b) = 0 y ∂y (a, b) = 0.
1 2
2. Una función f (x1 , x2 , y) = 0 representa una superficie en R3 . ¿Cuando se puede escribir esta ecuación
bajo la forma y = g(x1 , x2 )?
3. El sistema de dos funciones

f1 (x, y1 , y2 ) = 0 f2 (x, y1 , y2 ) = 0
representa la intersección de dos superficies en R3 . ¿Bajo que condición, se puede escribir esta inter-
sección bajo la forma
y1 = g1 (x), y2 = g2 (x),
lo que representarı́a una curva en R3 .
Para una función f : U → G, U ⊂ E × F , donde E, F, G son espacios de Banach, se define la derivada

parcial ∂f
∂y (a, b) como la derivada de la aplicación h(y) = f (a, y), donde a es considerada como un paramétro
fijo; es decir, ∂f 0 1 1
∂y (a, b) = h (b). Si f es de clase C , h es también de clase C , porque h = f ◦λ donde la inyección
λ : F → E × F , definida por λ(y) = (a, y), es continuamente diferenciable.
En el caso en que x ∈ Rm , y ∈ Rn y f : Rm × Rn → Rn está dada por
 ∂f1 ∂f1
∂y1 (x, y) · · · ∂yn (x, y)
  
f1 (x1 , . . . , xm , y1 , . . . , yn )
.. ∂f .. ..
f (x, y) =   se tiene (x, y) =  .
   
. ∂y . .
∂fn ∂fn
∂y1 (x, y) · · ·
f2 (x1 , . . . , xm , y1 , . . . , yn ) ∂yn (x, y)
Teorema I.7.1 (Teorema de las Funciones Implı́citas) Sean E, F y G espacios de Banach, U ⊂ E y

V ⊂ F abiertos y f : U × V → G una aplicación de clase C 1 . Supongamos que para (a, b) ∈ U × V , se tiene
∂f
f (a, b) = 0 y (a, b) es un isomorfismo de F sobre G.
∂y
Entonces:
i) Existen: un vecindario U 0 de a, un vecindario V 0 de b y una única aplicación g : U 0 → V 0 , tales que

f (x, g(x)) = 0 para todo x ∈ U 0 .
ii) La aplicación g : U 0 → V 0 es de clase C 1 y se tiene

−1
∂f ∂f
g 0 (x) = − (x, g(x)) (x, g(x)). (I.7.3)
∂y ∂x
Demostración.- Consideremos la aplicación
F :U ×V →E×G definida por F (x, y) = (x, f (x, y))
y aplicar el teorema de inversión local. Esta aplicación es de clase C 1 y tiene como derivada

∂f ∂f
F 0 (a, b)(h, k) = h, (a, b)h + (a, b)k .
∂x ∂y
∂f
Además, satisface F (a, b) = (a, 0). Puesto que ∂y (a, b) es un isomorfismo, F 0 (a, b) es inversible con inversa

∂f ∂f
F 0 (a, b)−1 (ĥ, k̂) = ĥ, (a, b)−1 (k̂ − (a, b)k̂) .
∂y ∂x
Esta inversa es continua por que ∂f ∂f

∂x (a, b) y ∂y (a, b)
−1
lo son. Por el teorema de inversión local, F es un
1
difeomorfismo de clase C de un vecindario de (a, b) sobre un vecindario (a, 0). Se puede suponer que contienen
U 0 ×V 0 y U 0 ×W 0 , respectivamente, donde U 0 , V 0 y W 0 son vecindarios de a, b y 0 ∈ G. Si es necesario reducir
U 0 , también se puede suponer que F −1 (U 0 × {0}) ⊂ U 0 × V 0 . El difeomorfismo inverso F −1 es de la forma
F −1 (x, z) = (x̂, ĝ(x, z)) y se tiene por lo tanto f (x, ĝ(x, z)). La aplicación g(x) = ĝ(x, 0) es la aplicación
buscada.
Como F −1 (x, z) es de clase C 1 , las aplicaciones ĝ(x, z) y g(x) = ĝ(x, 0) lo son también. Se obtiene
finalmente la formula (I.7.3) derivando la identidad f (x, g(x)) = 0 respecto a x.
Ejemplo I.7.2 Sea pa (x) = a0 + a1 x + · · · + an xn un polinomio a coeficientes reales a = (a0 , a1 , . . . , an ).

¿La raiz x0 de pa (x) = 0 es una función diferenciable de a0 , a1 , . . . , an ? Para responder a esta interrogante,
consideremos la función
f (x, a0 , a1 , . . . , an ) = a0 + a1 x + a2 x2 + · · · + an xn = pa (x)
de n + 2 variables para la cual

∂f
(x, a0 , a1 , . . . , an ) = a1 + 2a2 x + · · · + nan xn−1 = p0a (x).
∂x
Si para coeficientes a∗ = (a∗0 , a∗1 , . . . , a∗n ) se tiene pa∗ (x∗0 ) y pa∗ (x∗0 ) 6= 0, la ecuación pa (x) = 0 posee, para
a próximo de a∗ una solución x0 (a) que es próxima de x∗0 y que además es una función diferenciable de
a0 , a1 , . . . , an .
En particular, el polinomio p (x) = x6 − x5 + x3 − 1 + tiene un cero próximo de x∗0 = 1 que depende
2 2
diferencialmente de , √ se tiene x0 () = 1 − /4 + O( ). Al contrario, los ceros del polinomio p (x) = x −
satisfacen x0 () = ± para > 0, una función no diferenciable en el origen, y para < 0 el polinomio no
tiene ni siquiera un cero real.
I.7.1. Ejercicios
1. Sea f : R4 → R2 la aplicación definida por
f1 (x, y, u, v) = u3 + vx + y
f2 (x, y, u, v) = uy + v 3 − x
y sea P0 = (x0 , y0 , u0 , v0 ) un punto de f −1 ({0}).
(a) Escribir una condición sobre P0 que permita obtener localmente alrededor de este punto el conjunto
f −1 ({0}) como el grafo de una función de la forma u = g1 (x, y), v = g2 (x, y).
∂g1
(b) Calcular ∂x (x0 , y0 ) si P0 = (0, −1, 1, 1).
I.8. APLICACIONES BILINEALES Y MULTILINEALES 29
2. Se considera el sistema
9 9
λc1 = 3c1 + c31 + c1 c22
4 2
2 3
λc2 = 2c2 + 3c1 c2 + c2 .
2
Encontrar los puntos de bifurca-
ción de las curbas c1 (λ) y c2 (λ).
Una condición necesaria para un
punto de bifurcación es que el
teorema de las funciones implı́ci-
tas no pueda ser aplicado.
3. Demostrar que el teorema de inversión local puede ser deducido del teorema de las funciones implı́citas.
4. Sea S = {(x, y, z)|xz + sin(xy) + cos(xy) = 1}. Determinar si en un vecindario de (0, 1, 1) el conjunto
S puede ser escrito bajo la forma
z = f (x, y) o y = g(x, z) o x = h(y, z).
I.8. Aplicaciones Bilineales y Multilineales

Las derivadas de orden superior son aplicaciones bilineales para la segunda derivada, trilineales para la tercera
derivada y multilineales de orden n para las n-sima derivada. Esta es la razón por la cual estudiaremos este
tipo de aplicaciones con un poco más de detalle.
Las definiciones y propiedades algebraicas han sido ya vistas en el curso de Algebra Lineal Avanzada,
por lo tanto nos abocaremos a estudiar la noción de continuidad en este tipo de aplicaciones.
De la misma manera que en la sección I.3, podemos generalizar las relación (I.3.4) y la proposición I.3.4
a productos de espacios. El espacio E1 × E2 × · · · × En , dotado de la norma
k(x1 , x2 , . . . , xn )k = máx{kx1 kE1 , . . . , kxn kEn }
es un espacio normado. Es un espacio de Banach, si y solamente cada uno de los espacios Ek , k = 1, . . . , n
es también un espacio de Banach.
Proposición I.8.1 Para una aplicación multilineal A : E1 × E2 × · · · × EN → F , donde E1 , . . . , En y F son
espacios vectoriales normados, las condiciones siguientes son equivalentes:
a) A es continua en todo punto de E1 × E2 × · · · × En ;
b) A es continua en el origen (0, 0, . . . , 0) ∈ E1 × · · · × En .
c) kA(x1 , . . . , xn )k es acotada sobre la bola unitaria de E1 × · · · × En .
Demostración.- La demostración es análoga a la del teorema I.2.1 sobre las aplicaciones lineales. Para
demostrar c) ⇒ a), escribimos
A(x1 , . . . , xn ) −A(a1 , . . . , an ) = A(x1 − a1 , x2 , . . . , xn )
+A(a1 , x2 − a2 , x3 , . . . , xn ) + · · · + A(a1 , . . . , an−1 , xn − an )
y estimemos cada termino separadamente.

Definición I.8.1 Sean E1 , . . . , En y F espacios vectoriales normados. se denota por L(E1 , . . . , En ; F ) el
conjunto de las aplicaciones multilineales continuas de E1 × · · · × En en F .
Para un elemento A ∈ L(E1 , . . . , En ; F ), se define
kA(x1 , . . . , xn )k
kAk = sup kA(x1 , . . . , xn )k = sup . (I.8.1)
k(x1 ,...,xn )k≤1 xi 6=0, i=1,...,n kx1 k · kx2 k · . . . · kxn k
Si E1 = · · · = En = E, se escribe también Ln (E; F ) en vez de L(E, . . . , E; F )
El espacio L(E1 , . . . , En ; F ) provisto de (I.8.1) es un espacio vectorial normado. Si F es completo, entonces

L(E1 , . . . , En ; F ) es un espacio completo. Esta afirmación se la demuestra exactamente como para el caso
lineal. El resultado siguiente es la base para la interpretación de la segunda derivada de una función como
aplicación bilineal.
Proposición I.8.2 Sean E, F, G espacios vectoriales normados. Entonces, la aplicación
ψ : L(E, L(F, G)) → L(E, F ; G)
definida por ψ(A) = B donde B(x, y) = (Ax)y es un isomorfismo que es igualmente una isometrı́a; es decir
kφ(A)k = kAk para todo A ∈ L(E, L(F, G)).
Demostración.- La aplicación ψ es lineal y biyectiva. Su inversa está dada por ψ 1 (B) = A donde, para
x ∈ E, Ax ∈ L(F, G) es la aplicación y → B(x, y). Para demostrar la continuidad. Para demostrar la
continuidad de ψ y de ψ −1 , es suficiente ver que kψ(A)k = kAk.
Utilizando la desigualdad fundamental para normas de aplicaciones lineales, una vez para Ax y una
segunda vez para A, obtenemos
kB(x, y)k = k(Ax)yk ≤ kAxk · kyk ≤ kAk · kxk · kyk .
Esto implica que B = ψ(A) satisface kBk ≤ kAk.

Por otro lado la definicón de norma para aplicaciones multilineales, muestra que
k(Ax)yk = kB(x, y)k ≤ kBk · kxk · kyk .
La norma de la aplicación lineal Ax satisface por lo tanto kAxk ≤ kBk · kxk y por consiguiente, kAk ≤ kBk.
estas dos desigualdades muestra que la aplicación ψ es una isometrı́a.

Se puede, por lo tanto, identificar las aplicaciones lineales de E en L(F, G) con las aplicaciones bilineales de
E × F en G.
Ejemplo I.8.1 Una matriz C (con n columnas y m filas) puede ser identificaco con la aplicación bilineal
B : Rm × Rn → R definida por B(x, y) = xt Cy. Puede tambien ser identificada como un elemento de
L(Rm , L(Rn , R)) de la manera siguiente: para x ∈ Rm el vector xt C ∈ L(Rn , R) define la aplicación xC :
y → xt Cy.
La afirmación de la proposición precedente puede ser generalizada a aplicaciones multilineales. Si E1 , . . . , En
y F son espacios vectoriales normados, la aplicación
ψ : L(E1 , L(E2 , . . . , En ; F )) → L(E1 , . . . , En : F ), (I.8.2)
definida para ϕ(A) = B donde B(x1 , x2 , . . . , xn ) = (Ax1 )(x2 , . . . , xn ), es un isomorfismo y una isometrı́a. La
demostración de este hecho es idéntico a la proposición precedente.
I.8.1. Ejercicios
1. Calcular la norma del determinante visto como una aplicación multilineal
det : Rn × · · · × Rn → R
donde Rn está dotado de la norma euclidiana. Deducir la desigualdad |det A| ≤ nn/2 (de Hadamard)
para una matriz A = (aij )1≤i,j≤n satisfaciendo |aij | ≤ 1.
2. Sea Rn y Rm dotados de la norma euclidiana. Sea b : Rn × Rm → R la aplicación bilineal dada por
b(x, y) = xt By, donde B es una matriz arbitraria de n × m. Mostrar que la norma de b satisface
kbk = kBk2 .
I.9. DERIVADAS DE ORDEN SUPERIOR 31
I.9. Derivadas de Orden Superior

La derivada de una función f : U → F , con U ⊂ E es una aplicación f 0 : U → L(E, F ). Como L(E, F ) es
un espacio vectorial normado, nada nos impide de considerar la diferenciabilidad de f 0 .
Definición I.9.1 Sean E, F dos espacios vectoriales normados, U ⊂ E un abierto y f : U → F diferenciable
en un vecindario de a ∈ U . Se dice que f es dos veces diferenciable en a si f 0 : U → L(E, F ) es diferenciable
en a. Por consiguiente (f 0 )0 (a) ∈ L(E, L(E, F )). Utilizando la identificación de la proposición I.8.3, se define
la segunda derivada de f en a como la aplicación bilineal
f 00 (a)(h, k) = ((f 0 )0 (a)h)k.
En la situación de la definición precedente, consideramos la aplicación gk : U → F definida por gk (x) = f 0 (x)k

con k ∈ E fijo. Entonces, por la fórmula de Leibniz, (gk (x) = B(f 0 (x), k) donde B : L(E, F ) × E → F es la
aplicación bilineal B(A, v) = Av), se obtiene
gk0 (a)h = ((f 0 )0 (a)h)k = f 00 (a)(h, k).
Ejemplo I.9.1 Consideremos una función f : Rn → Rm y denotemos x = (x1 , . . . , xn )t . Para k ∈ Rn fijo,

n
∂f Pn Pn ∂2f
la derivada de la función gk (x) = f 0 (x)k = 0
P
∂xj (x)kj está dada por gk (x)h = i=1 ( j=1 ∂xi ∂xj (x)kj )hi .
j=1
La segunda derivada de f es por lo tanto
n X
n
X ∂2f
f 00 (x)(h, k) = (x)hi kj .
i=1 j=1
∂xi ∂xj
Para la función f : R3 → R2 del ejemplo 1 de la sección I.3. La segunda derivada es por consiguiente

00 2h1 k1 + 2h2 k2 + 2h3 k3
f (a)(h, k) =
a1 (h2 k3 + h3 k2 ) + a2 (h1 k3 + h3 k1 ) + a3 (h1 k2 + h2 k1 )
Ejemplo I.9.2 Para la función f (X) = X −1 de GL(E) en L(E), la proposición I.3.3, muestra que gK (X) =
f 0 (X)K = −X −1 KX −1 para K ∈ L(E). La fórmula de Leibniz nos da por consiguiente
f 00 (X)(H, K) = A−1 HA−1 KA−1 + A−1 KA−1 HA−1 .
Teorema I.9.1 Sean E, F dos espacios vectoriales normados, U ⊂ E un abierto, y supongamos que f :
U → F es dos veces diferenciable en a ∈ U . Entonces, la aplicación bilineal f 00 (a) : E × E → F es simétrica,
es decir
f 00 (a)(h, k) = f 00 (a)(k, h) para h, k ∈ E.
Demostración.- Vamos a demostrar que

1
f 00 (a)(h, k) = lı́m (f (a + δh + δk) − f (a + δh) − f (a + δk) + f (a)). (I.9.1)
δ→0 δ2
Puesto que el lado derecho de (I.9.1) es simétrico en h y k, es lo mismo para f 00 (a)(h, k).
Para demostrar (I.9.1), consideramos la aplicación
gu (v) = f (a + u + v) − f (a + u) − f (a + v) + f (a) − f 00 (a)(u, v).
donde u y v son suficientemente pequeños en norma. Como gu (0) = 0, el teorema de los incrementos finitos,
implica que
kgu (v)k ≤ sup kgu0 (tv)k · kvk . (I.9.2)
0<t<1
Solo queda estimar la derivada
g 0 u(v) = f 0 (a + u + v) − f 0 (a + v) − f 00 (a)(u, ·)
(la notación f 00 (a)(u, ·) es utilizada para la aplicación h → f 00 (a)(v, h)). El hecho que f es dos veces diferen-
ciable en a, es decir x → f 0 (x) diferenciable en a, implica que
f 0 (a + u + v) = f 0 (a) + f 00 (a)(u + v, ·) + r(u + v) ku + vk

f 0 (a + v) = f 0 (a) + f 00 (a)(v, ·) + r(v) kvk
donde r(v) → 0 si v → 0. La sustracción de estas dos ecuaciones da para gu0 (v) la fórmula gu0 (v) = r(u +
v) ku + vk − r(v) kvk y se obtiene para 0 < t < 1
kgu0 (tv)k ≤ (kr(u + tv)k + kr(tv)k)(kuk + kvk). (I.9.3)
Se deduce de las estimaciones (I.9.2) y (I.9.3) que kgu (v)k /(kuk + kvk)2 → 0 si kuk + kvk → 0. Planteando
u = δh y v = δk se obtiene la afirmación (I.9.1).

La definición de tercera derivada es análoga a la definició (I.9.1). Supongamos que una función f : U → F
(E, F espacios vectoriales normados y U ⊂ E un abierto) sea 2 veces diferenciable en un vecindario de
a ∈ U . Se dice que f es tres veces diferenciable en a, si f 00 : U → L2 (E; F ) es diferenciable en a. La derivada
(f 00 )0 (a) ∈ L(E, L2 (E; F )) y utilizando la isometrı́a entre L(E, L2 (E; F )) y L3 (E; F ) se define la tercera
derivada de f en a como la aplicación trilineal
f 000 (a)(h, k, l) = (f 00 (a)h)(k, l).
De manera evidente, se define por inducción la p-sima derivada f (p) (a) como aplicación multilineal f (p) ∈
Lp (E; F ).
Para un cálculo práctico de la tercera derivada, se puede utilizar la fórmula
gk0 l(a)h = ((f 00 )0 (a)h)(k, l) = f 000 (a)(h, k, l) (I.9.4)
donde gkl : U → F está definida por f 00 (x)(h, k) y k, l ∈ E vectores fijos. La tercera derivada de f puede
también ser interpretada como la segunda deriva de gl (x) = f 0 (x)l, es decir
gl00 (a)(h, k) = ((f 0 )00 (a)(h, k))l = f 000 (a)(h, k, l). (I.9.5)
Las dos fórmulas (I.9.4) y (I.9.5) muestran que se puede intercambiar k y l ası́ como h y k sin cambiar el
valor de f 000 (a)(h, k, l). Se tiene el resultado siguiente.
Corolario I.9.1 Si, bajo las hipótesis del teorema I.9.2, la función f : U → F es p veces diferenciable en
a ∈ U , la aplicación multilineal f p (a) es simétrica, es decir,
f (p) (a)(h1 , . . . , hp ) = f (p) (a)(hσ(1) , . . . , hσ(p) )
donde σ es una permutación cualquiera de {1, . . . , p}.
Ejemplo I.9.3 La tercera derivada de una aplicación f : Rn → Rm está dada por

XXX ∂3f
f 000 (x)(h, k, r) = (x)hi kj rl .
i=1 j=1 l=1
∂xi ∂xj ∂xl
Definición I.9.2 Sean E, F espacios vectoriales normados, U ⊂ E y V ⊂ F abiertos.

♣ f : U → F es p veces continuamente diferenciable o de clase C p sobre U , si f es p veces diferenciable en
todo punto de U y si f (p) : U → Lp (E; F ) es continua.
♦ f : U → F es indefinidamente diferenciable o de clase C ∞ sobre U , si f es de clase C p para todo p.
♠ f : U → F es un difeomorfismo de clase C p de U sobre V , si f es biyectiva, p veces continuamente
diferenciable y si la inversa f −1 : V → U es p veces continuamente diferenciable.
I.10. FÓRMULA DE TAYLOR 33
Ejemplo I.9.4 La función f (X) = X −1 de GL(E) en L(E) es indefinidamente diferenciable. En efecto,

derivando la formula del ejemplo 2, se obtiene
f 000 (A)(H, K, L) = −A−1 HA−1 KA−1 LA−1 − A−1 HA−1 LA−1 KA−1
−A−1 KA−1 HA−1 LA−1 − −A−1 KA−1 LA−1 HA−1
−A−1 LA−1 HA−1 KA−1 − −A−1 LA−1 HA−1 HA−1 .
Se ve por inducción que cada derivada es una combinación lineal de expresiones que son un producto alternado
de A−1 con aplicaciones lineales constantes.
Proposición I.9.1 Sean E, F espacios vectoriales normados,U ⊂ E, V ⊂ F abiertos y f : U → V un

difeomorfismo de clase C 1 . Si f es de clase C p , entonces la función inversa f −1 : V → U es también de clase
Cp.
Demostración.- Por el teorema I.6.2 sabemos que
(f −1 )0 (y) = f 0 (f −1 (y))−1 ,
es decir, (f −1 )0 es la composición de tres aplicaciones: y → f −1 (y), x → f 0 (x) y A → A−1 . Las tres

aplicaciones son continuamente diferenciables. Entonces f −1 es de clase C 2 . La demostración para p ≥ 3 es
análoga.

Una consecuencia de esta proposición es la siguiente: si en el teorema de inversión local la función f es de
clase C p , entonces su inversa es automáticamente de clase C p . Similarmente, si en el teorema de las funciones
implı́citas la función f es de clase C p , entonces la aplicación g es también de clase C p .
I.9.1. Ejercicios
1. Sean f : E → F y g : F → G (donde E, F y G son espacios vectoriales normados) dos aplicaciones
dos veces diferenciables. Calcular (g ◦ f )00 (x)(h, k).
2. Sea b : E ×F → G (donde E, F y G son espacios vectoriales normados) una aplicación bilineal continua.
Calcular su segunda derivada.
3. Calcular la segunda derivada de f : R2 → R3 dada por
f (x) = (x31 + x1 x32 , e(x1 −x2 ) , cos(x1 x2 ))t .
I.10. Fórmula de Taylor

Finalizando este capı́tulo, veremos algunos resultados vinculados a desarrollos limitados a un número finito
de términos.
Teorema I.10.1 (Fórmula de Taylor) Sean E, F espacios vectoriales normados, U ⊂ E un abierto. f :
U → F una función n − 1 veces diferenciable sobre U y n veces diferenciable en a ∈ U . Entonces para todo
h ∈ E con a + h ∈ U , se tiene
1 1 n
f (a + h) = f (a) + f 0 (a)h + f 00 (a)(h, h) + · · · + f (n) (a) (h, . . . h) +o(khk ). (I.10.1)
2 n! | {z }
n veces
Demostración.- La demostración la realizaremos por inducción. Para n = 1 es la definición de f 0 (a).

Suponemos cierto hasta n − 1. En particular suponemos cierto para f 0 (a). Por lo tanto
1 1 n−1
f 0 (a + h) = f 0 (a) + f 00 (a)h + f 000 (h, h) + · · · + f (n) (a) (h, . . . , h) +o(khk ) (I.10.2)
2 (n − 1)! | {z }
n−1 veces
Planteamos
1 (n)
F (h) = f (a + h) − f (a) − f 0 (a)h − · · · − f (a) (h, . . . , h),
n! | {z }
n veces
derivamos y obtenemos
1 1
F 0 (h)k = f 0 (a + h)k − f 0 (a)(k) − f 00 (a)(h, k) − f 000 (a)(h, h, k) − · · · − f (n) (n − 1)!( h, . . . , h , k).
2 (n − 1)! | {z }
n−1 veces
La hipótesis de inducción sobre f 0 (a + h) da que

n−1
kF 0 (h)k = o(khk ).
Aplicando el teorema de los incrementos finitos, obtenemos finalmente

n
F (h) − F (0) = F (h) = o(khk ).
Teorema I.10.2 (Fórmula de Taylor con Resto de Lagrange) Sean E, F espacios vectoriales norma-
dos, U ⊂ E un abierto. f : U → F una función n + 1 veces diferenciable sobre U y a ∈ U . Entonces para
todo h ∈ E con a + h ∈ U , se tiene

1 1
f (a + h) = f (a) + f 0 (a)h + f 00 (a)(h, h) + · · · + f (n) (a) (h, . . . h)

2 n! | {z }
n veces

n+1
khk
≤ sup f (n+1) (a + th) . (I.10.3)

(n + 1)! 0<t<1
Demostración.- Realizamos la demostración para el caso E = R y [a, a + h] = [0, 1]. El caso general se
obtiene de la composición de la función t 7→ a + th y f .
Para n = 0 es el teorema de los incrementos finitos. Suponemos cierto para n−1. Como en la demostración
del teorema precedente
1
F (t) = f (t) − f (0) − . . . − f (n) (0)tn .
n!
La hipótesis de inducción aplicada a n − 1 y f 0 (t) nos conduce a
tn
kF 0 (t)k ≤ sup f (n+1) (t) .

n! 0<t<1
R1
Por otro lado F (1) = 0
F 0 (t) dt, de donde
Z 1 n
t 1
kF (1)k ≤ dt sup f (n+1) (t) = sup f (n+1) (t) .

0 n! 0<t<1 (n + 1)! 0<t<1
I.10.1. Ejercicios
1. Sea X ∈ GL(Rn ), calcular todas las derivadas de la función f (x) = X 3 .
Capı́tulo II
Subvariedades Diferenciales
En los cursos básicos de cálculo y geometrı́a, se ha estudiado subconjuntos particulares del plano y del
espacio, como ser curvas y superficies; ası́ como también la noción de rectas y planos tangentes.
En este capı́tulo, las nociones de curva y plano serán generalizadas, al igual que la noción de tangencia.
Comencemos viendo un teorema clave.
II.1. Teorema del Rango

Un cambio de coordenadas puede ser muy útil para el estudio de las funciones. Por ejemplo, si la función
f (x1 , x2 ) puede expresarse como una función de x21 + x22 es conveniente introducir coordenadas polares. El
objetivo de esta sección es buscar, para una función y = f (x) dada, coordenadas ξ y η en lugar de x e y,
para las cuales la función f se convierta en más simple, por ejemplo lineal.
Nos contentaremos de estudiar este problema localmente; es decir, alrededor de un punto a. Como un
cambio de coordenadas es equivalente a un difeomorfismo, el problema se plantea de la manera siguiente:
sean f : Rn → Rm , a ∈ Rn y b = f (a) ∈ Rm dados, encontrar un difeomorfismo local ϕ alrededor de a
(ξ = ϕ(x)) y un difeomorfismo local ψ alrededor de b (η = ψ(y)), tales que ψ ◦ f ◦ ϕ−1 sea “más simple” en
un vecindario de 0 ∈ Rn .
Teorema II.1.1 (Teorema del rango) Sean f : Rn → Rm de clase C k , con k ≥ 1, a ∈ Rn y b = f (a).
Los enunciados siguientes son equivalentes:
i) Existe difeomorfismos locales ϕ alrededor de a y ψ alrededor de b, de clase C k , tales que
(ψ ◦ f ◦ ϕ−1 )(ξ1 , . . . , ξn ) = (ξ1 , . . . , ξr , 0, . . . , 0)t alrededor de ξ = 0; (II.1.1)
ii) El rango de f 0 (x) es constante e igual a r en un vecindario de a.
Demostración.- Supongamos cierto i), es decir que existen los difeomorfismos ϕ y ψ que satisface (II.1.1).
Planteando g = ψ ◦ f ◦ ϕ−1 : Rn → Rm , derivando g se obtiene

Ir 0
g 0 (ξ) = ψ 0 (f (x))f 0 (x)(ϕ0 (x))−1 = ,
0 0
donde Ir es la matriz identidad de r × r. Como ψ y ϕ son difeomorfismos, sus derivadas son inversibles y
dejan invariante el rango, ver curso de álgebra lineal.
Supongamos cierto el inciso ii); es decir, que f 0 (x) es de rango r en un vecindario U de a. Si es necesario
permutar los xi y o los yj , podemos suponer que
r
∂fi
A= (a)
∂xj i,j=1
es inversible. Definimos la aplicación ξ = ϕ(x) por

fi (x1 , . . . , xn ) − bi para 1 ≤ i ≤ r
ϕi (x) = ξ = (II.1.2)
xi − ai para i ∈ {r + 1, . . . , n}
35
36 CAPÍTULO II. SUBVARIEDADES DIFERENCIALES
Puesto que la matriz jacobiana

0 A ∗
ϕ (a) =
0 I
es inversible, (II.1.2) define un difeomorfismo local alrededor de a. Consideremos la función
g(ξ) = (f ◦ ϕ−1 )(ξ), cuyas primeras r componentes están dadas por gi (ξ) = ξi + bi . Como el cambio de
coordenadas x ↔ ξ no cambia el rango, ver curso de álgebra lineal, la matriz

0 I 0
g (ξ) =
C(ξ) D(ξ)
es de rango r para todo ξ en un vecindario de ξ = 0. Por lo tanto D(ξ) = 0 y la función g(ξ) depende
solamente de ξ1 , . . . , ξr .
El siguiente paso es construir ψ. Consideremos, la aplicación η = ψ(y) definida por

y i − bi para i = 1, . . . , r
ψi (y) = ηi = (II.1.3)
yi − gi (y1 − b1 , . . . , yr − br ) para i = r + 1, . . . , m.
La matriz jacobiana de ψ, está dada por
0 I 0
ψ (b) =
∗ I
es inversible, por lo que (II.1.3) es un difeomorfismo local alrededor de b.
Por ultimo debemos verificar que ψ ◦ f ◦ ϕ−1 verifica (II.1.1), que dejamos como ejercicio

Consecuensia del Teorema del Rango, son los dos siguientes teoremas:
Teorema II.1.2 (Teorema de la inmersión) Sea f : Rn → Rm una inmersión en a ∈ Rn de clase C k ,
con k ≥ 1; es decir f 0 (a) es inyectiva (rango de f 0 (a) es n). Entonces, existen un vecindario U ⊂ Rn de a y
un difeomorfismo local ψ alrededor de b = f (a), de clase C k tal que
(ψ ◦ f )(x1 , x2 , . . . , xn ) = (x1 , . . . , xn , 0, . . . , 0)t , ∀x ∈ U. (II.1.4)
Demostración.- Si es necesario permutar los yi , se puede suponer que la submatriz

n
∂fi
A= (a)
∂xj i,j=1
es inversible, por consiguiente en un vecindario U de a. Definimos la aplicación η = ψ(y) de manera implı́cita

de la manera siguiente

fi (η1 , . . . , ηn ) para i = 1, . . . , n
yi =
fi (η1 , . . . , ηn ) − ηi para i = n + 1, . . . , m.
Como la matriz jacobiana de esta aplicación es inversible, ψ es un difeomorfismo local alrededor de b y
satisface (II.1.4).

Teorema II.1.3 (Teorema de la submersión) Sea f : Rn → Rm una submersión en a ∈ Rn de clase
C k , con k ≥ 1; es decir f 0 (a) es sobreyectiva (rango de f 0 (a) es m). Entonces, existe un difeomorfismo local
ϕ alrededor de 0, de clase C k tal que
(f ◦ ϕ)(ξ1 , . . . , ξn ) = f (a) + (ξ1 , . . . , ξm )t .
Demostración.- Para demostrar regresamos a la demostración del Teorema del Rango, no hay necesidad de
hacer permutaciones en la variable yi . Tomamos como ϕ, la aplicación ϕ−1 de la demostración del teorema
del Rango e inmediatamente g = f ◦ ϕ nos da el resultado deseado.

II.2. SUBVARIEDADES DIFERENCIABLES 37
II.2. Subvariedades Diferenciables

El objetivo de esta sección es describir diferentes objetos de Rn , como ser curvas, superficies y en general
subvariedades diferenciables. A continuación enunciamos el teorema que nos permitirá cacterisar dichos
objetos.
Teorema II.2.1 Sea M = 6 ∅ un subconjunto de Rn , a ∈ M y sea 0 ≤ r ≤ n. Los enunciados siguientes son
equivalentes:
i) existe un vecindario U ⊂ Rn de a y una aplicación diferenciable g : U → Rn−r con g(a) = 0 y g 0 (a)

sobreyectiva (g una submersión) tales que
M ∩ U = g −1 (0);
ii) existe un vecindario U ⊂ Rn de a, un vecindario V ⊂ Rn de 0 y un difeomorfismo ϕ : V → U con

ϕ(0) = a tales que
M ∩ U = ϕ((Rr × {0}) ∩ V );
iii) existe un vencidario U ⊂ Rn de a, un vecindario W ⊂ Rr de 0 y una aplicación diferenciable γ : W → U

con γ(0) = a y γ 0 (0) inyectiva (una inmersión) tales que
M ∩ U = γ(W )
y γ : W → M ∩ U es un homeomorfismo.
Demostración.- Para visualizar los enunciados del teorema, consideremos la Figura II.2.1 Mostremos i) ⇒

g
γ U
W
ϕ

V

Figura II.2.1: Visualización del teorema
ii). Por hipótesis g es una submersión en a, por consiguiente el teorema de la submersión asegura la existencia
de un difeomorfismo ϕ : Rn → Rn alrededor de 0 y ϕ(0) = a tal que
g ◦ ϕ(ξ1 , . . . , ξn ) = (ξr+1 , . . . , ξn )t ,
después de una eventual permutación de los ξi . La condición g(x) = 0, se convierte en consecuencia ξr+1 =
· · · = ξn , lo que conduce a M ∩ U = ϕ((Rr × {0}) ∩ V ).
ii) ⇒ i). Consideremos la proyección canónica π : V ⊂ Rn → Rn−r dada por π(ξ1 , . . . , ξn ) = (ξr+1 , . . . , ξn ).
Planteando g = π ◦ ϕ−1 tenemos el punto i); en efecto g es una submersión y g −1 (0) = ϕ(π −1 (0)) =
ϕ(V ∩ (Rr × {0})).
iii) ⇒ ii). El teorema de inmersión conduce a la existencia de un difeomorfismo local ψ alrededor de a tal
que
(ψ ◦ γ)(ξ1 , . . . , ξr ) = (ξ1 , . . . , ξr , 0, . . . , 0)t ,
para todo ξ alrededor de 0 ∈ Rr . De donde x ∈ γ(W 0 ) es equivalente a que ψ(x) ∈ Rr × {0}. Tomamos
ϕ = ψ −1 . Solo falta comprobar que ϕ((Rr × {0}) ∩ V ) = M ∩ U , en efecto, si es necesario achicar los
vecindarios, se tiene que γ : W → M ∩ U es un homeomorfismo, por lo tanto la preimagen de γ alrededor
de a es un vecindario de 0 ∈ R, con lo que se asegura ϕ((Rr × {0}) ∩ V ) = M ∩ U
ii) ⇒ i). Consideramos la inyección canónica i : Rr → Rn dada por i(ξ1 , . . . , ξr ) = (ξ1 , . . . , ξr , 0, . . . , 0),
planteamos γ = ϕ ◦ i. Dejamos al estudiante la comprobación que γ satisface ii).
Definición II.2.1 Un conjunto M = 6 ∅ que satisface las condiciones del teorema precedente para todo a ∈ M
se llama una subvariedad diferenciable en Rn de dimensión r y de codimensión n − r. La aplicación γ del
inciso iii) del teorema se llama parametrización local de M alrededor de a.
Ejemplo II.2.1 Consideremos: Consideremos la superficie de la esfera en R3 alrededor del polo sur a =
(0, 0, −1)t . Esta superfie puede ser descrita para n = 3 y r = 2
g(x, y, z) = x2 + y 2 + z 2 − 1,
p
también por ϕ(x, y, ζ) = (x, y, − 1 − x2 − y 2 + ζ)t y por γ(x, y) = ϕ(x, y, 0), o bien utilizar coordenadas
esféricas:
ϕ(α, β, ρ) = ((1 + ρ) sin α cos β, (1 + ρ) sin α sin β, −(1 + ρ) cos α)t
y γ(α, β) = ϕ(α, β, 0).
Ejemplo II.2.2 (Toro de revolución) Consideremos la circunferencia (x, z) = (d + ρ cos α, ρ sin α) con
0 < ρ < d y giremos alrededor del eje z. Esto da la parametrización
 
(d + ρ cos α) cos β
γ(α, β) =  (d + ρ cos α) sin β 
ρ sin α
de un toro. Dejamos como ejercicio la verifi-
cación que γ(α, β) es una inmersión que γ es
localmente un homeomorfismo.
Ejemplo II.2.3 (Cinta de Möbius) Consideremos una vara de longitud 2, parametrizada por −1 < t < 1
y girémosla alrededor de su centro, al mismo tiempo rotemos dos veces mas rápido alrdedor de un eje a una
distancia d. Esto da la parametrización
 
(d + t cos ϑ) cos 2ϑ
γ(t, ϑ) =  (d + t cos ϑ) sin 2ϑ  .
t sin ϑ
Ejemplo II.2.4 (Grupo Ortogonal) El conjunto
O(n) = {X|X t X = I}
es una subvariedad de dimensión n(n − 1)/2 de Mn,n (R) ' Rn·n . Para comprobar, consideremos la aplicación
g : Mn,n (R) → Sym(R) ' Rn(n+1)/2

n
II.3. ESPACIO TANGENTE 39
definida por g(X) = X t X − I, donde Symn denota el espacio de las matrices simétricas de dimensión. Se
tiene O(n) = g −1 (0). Se tiene que verificar que g es una submersión en todo A ∈ O(n). La derivada de g en
A es g 0 (A)H = At H + H t A. Para una matriz simétrica B, planteamos H = AB/2 que da g 0 (A)H = B, por
lo tanto g 0 (A) : Mn,n (R) → Symn (R) es sobreyectiva y O(n) es una subvariedad de codimensión n(n + 1)/2.
Ejemplo II.2.5 Las subvariedades de dimensión 0 son puntos discretos de Rn . Todo subespacio lineal o
afı́n de Rn es una subvariedad.
Ejemplo II.2.6 El conjunto {(x, y)|xy = 0} no es una subvariedad de R2 . Alrededor del origen este conjunto
no es difeomorfo a una recta.
Remarca II.2.1 La hipótesis “γ : W → M ∩ U es un homeomorfismo” del inciso iii) del teorema II.2.1,
no puede ser omitida. Por ejemplo la función γ(t) = ((1 + 0,1t2 ) cos t, (1 + 0,1t2 ) sin t) es una inmersión para
cada t, pero la imagen γ(R) no es una subvariedad de R2 a causa del cruce de la curva, ver figura de la
izquierda. Incluso la inyectividad de γ(t) no es suficiente como lo muestra la figura de la derecha.
II.3. Espacio Tangente

La tangente en un punto a una curva en R2 o Rn es una recta; es decir un espacio afı́n. Ubicando el origen
en a, esta tangente se convierte en un espacio vectorial. El plano tangente en un punto a de una superficie
es un espacio de dimensión 2. Un vector en este plano puede ser interpretado como γ 0 (0), donde γ(t) es una
curva diferenciable en la superficie que satisface γ(0) = a.
Definición II.3.1 Sea M ⊂ Rn una subvariedad y a ∈ M. El espacio tangente a M en a es

n 1

Ta M = h ∈ Rn existe γ : (−, ) → R de clase C 0 tal que γ(t) ∈ M .

para todo t ∈ (−, ), γ(0) = a y γ (0) = h.
Una subvariedad está caracterizada, ya sea por una submersión o bien por una parametrización, por lo que
el teorema siguiente nos da la forma de como determinar espacios tangentes.
Teorema II.3.1 Sea M ⊂ Rn una subvariedad y a ∈ M .
a) Si M está dada por una submersión g : U → Rn−r , entonces
Ta M = ker g 0 (a).
b) Si M está dada por una parametrización σ : W → Rn , entonces
Ta M = Im σ 0 (0).
Demostración.- a) Para una curva γ(t) con g(γ(t)) = 0 se tiene que g 0 (a)γ 0 (0) = 0 y por consiguiente
Ta M ⊂ ker g 0 (a). Sea h ∈ ker g 0 (a), el teorema de submersión conduce a la existencia de ϕ difeomorfismo
local alrededor del origen, con ϕ(0) = a tal que g ◦ ϕ(ξ) = (ξr+1 , . . . , ξn ). Como h ∈ ker g 0 (a), existe h̃ ∈ Rn ,
tal que h = ϕ0 (0)h̃, ya que ϕ0 (0) es un isomorfismo lineal. Por otro lado h̃ ∈ ker(g ◦ ϕ)0 (0), de donde h̃j = 0,
para r + 1 ≤ j ≤ n. Ahora bien, consideramos γ̃ : (−, ) → Rn , con > 0 lo suficientemente pequeño, con
γ̃(t) = th̃. Planteamos γ = ϕ ◦ γ̃, se tiene γ(t) ∈ M y γ 0 (0) = h.
b) Se tiene Im σ 0 (0) ⊂ Ta M por que γ = σ ◦ γ̃, con γ̃ curva diferenciable en Rr , es una curva en M. Solo falta
mostrar la inclusión en el otro sentido, consideramos una curva γ en M, el teorema de la inmersión asegura
la existencia de ψ difeomorfismo local alrededor de a tal que ψ ◦ σ(ξ) = (ξ1 , . . . , ξr , 0, . . . , 0), en consecuencia
la curva γ̃ = ψ ◦ γ es una curva diferenciable en Rr (proyectando Rn a Rr ), por lo tanto Ta M = Im σ 0 (0).
II.4. Ejercicios
1. Calcular el rango de la matriz jacobiana para
 
x1 + x2 + x3 + x4
f (x) =  x21 + x22 + x23 + x24 
x31 + x32 + x33 + x34
2. Sea f : Rn → Rm de clase C 1 . Mostrar que si rang f 0 (a) = r, entonces rang f 0 (x) ≥ r en un vecindario
de a. Dar un ejemplo para el cual rang f 0 (a) = r y rang f 0 (x) > r para x ∈ U − {a}, donde U es un
vecindario de a.
3. Sea A una matriz con n columnas y m filas de rang = r. Mostrar que existen matrices inversibles S y
T tales que
Ir 0
SAT = , (II.4.1)
0 0
donde Ir es la matriz identidad de talla r. Calcular una descomposición de la forma (II.4.1) para la
matriz
1 −1 2
A= .
−2 2 −4
4. De los conjuntos definidos más abajo, decidir cuales son subvariedades y cuales no, hacer gráficas si es
posible:
{(t, t2 ) ∈ R2 |t ∈ R} {(t, t2 ) ∈ R2 |t ≥ 0}
2 3 2
{(t , t ) ∈ R |t ∈ R} {(t2 , t3 ) ∈ R2 |t 6= 0}
2
{: (x, y) ∈ R |x > 0, y > 0} {(x, y, z) ∈ R3 |x = y = z = 0}
3 2 2 2
{(x, y, z) ∈ R |x + y − z = 1} {(x, y, z) ∈ R3 |x2 + y 2 + z 2 = 0}.
5. Dar una aplicación diferenciable g : R3 → R2 tal que el conjunto
M = {x ∈ R3 |g(x) = 0}
sea una subvariedad de dimensión 1 en R3 , pero que g 0 (x) no es sobreyectiva en ningún punto de M.
6. Verificar que el conjunto {(x, y)|xy = 0} no es una subvariedad de R2 , pero que {(x, y)|xy = 0}−{(0, 0)}
es una subvariedad.
7. Sean X ⊂ Rn e Y ⊂ Rm dos subvariedades. Mostra que el producto
X × Y = {(x, y) ∈ Rn × Rm |x ∈ X, y ∈ Y }
es una subvariedad de Rn × Rm , que se llama subvariedad producto.

II.4. EJERCICIOS 41
8. Demostrar que el conjunto
{(cos t + 2) cos λt, (cos t + 2) sin λt, sin t) ∈ R3 |t ∈ R}(II.4.2)
es una√subvariedad de R3 para λ = 2/13, ver dibujo. Para

λ = 2 el conjunto (II.4.2) no es una subvariedad y es
dense en el toro
{(cos u + 2) cos v, (cos u + 2) sin v, sin u)}.

Capı́tulo III
Máximos y Mı́nimos Locales
En el curso de Primer Año de Análisis se vio el problema de puntos extremales para funciones reales a una
variable. Se constató que una condición necesaria, cuando la función era diferenciable, es que la derivada es
nula en un punto extremal.
En este capı́tulo se estudiará el problema para funciones a varias variables de la forma f : U ⊂ E → R,
donde E es un espacio vectorial normado y luego estudiaremos problemas de máximo y mı́nimo para funciones
sometidas a ciertas restricciones.
III.1. Máximos y mı́nimos relativos

Sea U un abierto de un espacio vectorial normado E y f : U → R. Se dice que f posee un mı́nimo (máximo)
relativo en el punto a ∈ U , si existe un vecindario V de a, V ⊂ U tal que

f (x) ≥ f (a) f (x) ≤ f (a) ∀x ∈ V.
Un mı́nimo (máximo) relativo es estricto si

f (x) > f (a) f (x) < f (a) ∀x ∈ V − {a}.
Se dice que f posee un extremo relativo, si posee un mı́nimo o máximo relativo en a.
Teorema III.1.1 ((condición necesaria)) Sea U un abierto de un espacio vectorial normado E y su-
pongamos que f : U → R sea diferenciable en a ∈ U . Si f admite un extremo relativo en a, entonces
f 0 (a) = 0.
Demostración.- Supongamos que f admita un máximo relativo en a. Las hipótesis implican que para un
h fijo y || lo suficiente pequeño se tiene
0 ≥ f (a + h) − f (a) = f 0 (a)h + r(a + h) · · khk
donde r(a + h) → 0 si → 0. Dividiendo este limite por y considerando que → 0, se obtiene que
f 0 (a)h ≤ 0. Deducimos que f 0 (a) = 0, porque h ∈ E es arbitrario. Para el mı́nimo relativo la demostración
se la realiza de la misma manera.

Teorema III.1.2 ((Condición necesaria)) Sea U un abierto de un espacio normado E y f : U → R dos
veces diferenciable en a ∈ U . Si f posee un máximo relativo en a, entonces
f 00 (a)(h, h) ≤ 0, ∀h ∈ E. (III.1.1)
Demostración.- El desarrollo en serie de Taylor de f alrededor de a, para h fijo, está dado por
1 00 2
f (a + h) = f (a) + f 0 (a)h + f (a)(h, h) + o(2 khk ).
2!
Dividemos la fórmula por 2 y pasamos al lı́mite → 0.
43
44 CAPÍTULO III. MÁXIMOS Y MÍNIMOS LOCALES

Se dice que a ∈ U es un punto crı́tico de f : U → R si f 0 (a) = 0. La condición f 0 (a) = 0 no es suficiente para
asegurar un punto extremal, por ejemplo f (x) = x5 nos sirve como contraejemplo.
Teorema III.1.3 ((condición suficiente)) Sea U un abierto de un espacio vectorial normado y f : U → R
dos veces diferenciable en a ∈ U , si f 0 (a) = 0 y si f 00 (a) satisface
2
f 00 (a)(h, h) ≤ −γ khk ∀h ∈ E (III.1.2)
con γ > 0, entonces f admite un máximo relativo estricto en el punto a.
Demostración.- Aplicamos la fórmula de Taylor alrededor de a, lo que da

1 2
f (a + h) = f (a) + f 0 (a)h + f 00 (a)(h, h) + o(khk ),
2
las hipótesis sobre f 0 (a) y f 00 (a) nos llevan
1 00 2 2 2
f (a + h) − f (a) = f (a)(h, h) + o(khk ) ≤ (−γ khk + o(khk ).
2
2
Dividiendo por khk y pasando al lı́mite h → 0, deducimos para h 6= 0 y lo suficientemente pequeño que
f (a + h) − f (a) < 0,
con lo que f admite un máximo relativo estricto en el punto a.

El espacio vectorial normado es finito dimensional

Supongamos que E es de dimensión n, por consiguiente E = Rn en lo que sigue. La condición f 0 (a) = 0, es
equivalente a
∂f ∂f
(a1 , . . . , an ) = 0, . . . , (a1 , . . . , an ) = 0,
∂x1 ∂xn
lo que constituye un sistema de n ecuaciones para las n incognitas a1 , . . . , an . Por lo tanto, resolviendo el
sistema de n ecuaciones, encontramos los puntos crı́ticos de f . El siguiente paso es determinar el carácter de
los puntos crı́ticos. Sea a ∈ Rn un punto crı́tico, se tiene
2
f (a + h) = f (a) + f 00 (a)(h, h) + o(khk );
ahora bien, f 00 (a) es una forma bilineal simétrica llamada Hessiana de f en el punto a. Si f es dos veces
continuamente diferenciable, la matriz hessiana respecto a la base canónica es
 ∂2f ∂2f ∂2f 
∂x21
(a) ∂x1 ∂x2 (a) · · · ∂x1 ∂xn (a)
 ∂2f 
 ∂x ∂x (a) 
H(a) =  1 2 
 .. 
 . 
∂2f ∂2f
∂x1 ∂xn (a) ∂x2n (a)
La teorı́a de formas bilineales simétricas, vista en el curso de Algebra Lineal, asegura la existencia de una
base {di } de Rn , respecto a la cual la matriz hessiana es una diagonal
H(a) = diag(0, . . . , 0, 1, . . . , 1, −1, . . . , −1),

| {z } | {z } | {z }
p q r
de donde
2
f (a + h) = f (a) + h2p+1 + · · · + h2p+q − h2p+q+1 − · · · − h2n + o(khk )
III.2. MULTIPLICADORES DE LAGRANGE 45
con hi la i-sima compenente de h respecto a la base {di }. Por otro lado, la misma teorı́a de formas bilineales
simétricas, asegura que p, q, r son únicos y p es el ı́ndice de nulidad de H, q es el ı́ndice de positividad de
H y r es el indice de negatividad de H.
Se dirá quen a punto crı́tico de f es no singular si Hf (a) tiene un ı́ndice de nulidad O. Por consiguiente,
tenemos el siguiente teorema para los puntos crı́ticos no singulares.
Teorema III.1.4 ((Condición Suficiente)) Sea f : U ⊂ Rn dos continuamente diferenciable, a ∈ U un

punto crı́tico no singular, entonces:
a) La hessiana de f en a es de ı́ndice de positividad n si y solamente si f admite un mı́nimo relativo estricto

en a.
b) La hessiana de f en a es de ı́ndice de negatividad n si y solamente si f admite un máximo relativo

estricto en a.
c) En el caso en que la hessiana tenga ı́ndices de negatividad y positividad no nulos, a se llama punto silla.
Remarca III.1.1 En lugar de trabajar con los ı́ndices de positividad, negatividad y nulidad de la hessiana
de f , se hubiese podido trabajar con los valores propios de Hf (a), que dicho sea de paso, son reales. Dejamos
como ejercicio enunciar los resultados correspondientes con los valores propios.
III.2. Multiplicadores de Lagrange

Sea U un abierto de Rn , f : U → R y consideremos la subvariedad M ⊂ U . El problema consiste en
encontrar los mı́nimos o máximos relativos de la restricción f |M ; es decir, se busca a ∈ M tal que
f (x) ≥ (≤)f (a) ∀x ∈ V ∩ M,
donde V ⊂ U es un vecindario de a.
Para resolver este problema, suponemos que M es de dimensión r y codimensión s = n − r. Por lo
hecho en capı́tulo precedente, M se puede caracterizar alrededor de a ∈ M mediante σ : W ⊂ Rr → Rn
parametrización alrededor de a; o bien, como un conjunto de nivel de g : Rn → Rs , es decir
M = {x ∈ Rn |g(x) = 0}.
Teorema III.2.1 ((Condición necesaria)) Sea ⊂ Rn abierto, M ⊂ U subvariedad diferenciable f : U →

R continuamente diferenciable en a ∈ M. Si f |M admite un extremo relativo en a ∈ M, entonces
Ta M ⊂ ker f 0 (a). (III.2.1)
Demostración.- Como M es una variedad difenciable, existe σ : W ⊂ Rr → Rn parametrización local

alrededor de a. Como f |M presenta un valor extremal en a ∈ M , f ◦ σ admite un valor extremal en 0, por
lo tanto (f ◦ σ)0 (0) = 0. Aplicando la fórmula de derivación para la composición de aplicaciones,se tiene
f 0 (a) ◦ σ 0 (0) = 0, lo que conduce a que Im σ 0 (0) ⊂ ker f 0 (a), es decir
Ta M ⊂ ker f 0 (a).
Definición III.2.1 Un punto a ∈ calM satisfaciendo la condición (III.2.1) se llama punto crı́tico de f |M .
Los problemas de determinación de valores y puntos extremales de funciones restringidas sobre subvariedades
son formulados utilizando la forma submersiva para representar la subvariedad. Por otro lado la condición
(III.2.1) no es muy útil desde el punto de vista calculista.
Teorema III.2.2 (Multiplicadores de Lagrange) Sea U ⊂ Rn , f : U → R continuamente diferenciable

en un vecindario de a ∈ M = {x ∈ U |g(x) = 0} con g : U → Rs submersión alrededor de a. Si f |M posee un
extremo relativo en a ∈ M, entonces existe λ : Rs → R forma lineal (multiplicadores de Lagrange) tal que
f 0 (a) − λ ◦ g 0 (a) = 0, (III.2.2)
es decir: Ps
f 0 (a) − i=1 λi gi0 (a) = 0,
∂g1 ∂g1
···
 
∂x1 (a) ∂xn (a)
( ∂f ··· ∂f
− ( λ1 ··· ..
x1 (a) xn (a) ) λs )   = 0.
 
.
∂gs ∂gs
∂x1 (a) ··· ∂xn (a)
Demostración.- Como Ta M = ker g 0 (a), la condición
ker g 0 (a) ⊂ ker f 0 (a),
ver curso de algebra lineal espacios vectoriales cocientes, asegura la existencia de λ : Rn / ker g 0 (a) → Rs tal
que
f 0 (a) = λ ◦ g 0 (a).
Ahora bien Rn / ker g 0 (a) ∼
= Rs , con lo que se tiene (III.2.2).

Remarca III.2.1 Con la función de Lagrange o lagrangiano
L(x, λ) = f (x) − λ ◦ g(x)
las condiciones a ∈ M y (II.2.2) son equivalentes a
L0 (a, λ) = 0.
Ejemplo III.2.1 Sean

f (x, y, z) = x − y − z,
g1 (x, y, z) = x2 + 2y 2 − 1,
g2 (x, y, z) = 3x − 4z
y busquemos los valores extremos de f |M donde M = {(x, y, z) ∈ R3 |g1 (x, y, z) = 0, g2 (x, y, z) = 0}. El
conjunto M representa la intersección de un cilindro con un plano. Se verfica facilmente que g(x, y, z) es una
submersión para todo x ∈ M. La función de Lagrange está dada por
L(x, y, z, λ1 , λ2 ) = x − y − z − λ1 (x2 + 2y 2 − 1) − λ2 (3x − 4z).
Las condiciones necesarias (II.2.2) nos dan:
1 − 2λ1 x − 3λ2 = 0, −1 − 4λ1 y = 0, −1 + 4λ2 = 0,
Se obtiene λ2 = 1/4 y eliminando λ1 de las otras dos ecuaciones,se encuentra y+2x=0. Los puntos crı́ticos
son por consiguiente
(1/3, −2/3, 1/4) y (−1/3, 2/3, −1/4).
Al igual que la sección precedente, una vez determinados los puntos crı́ticos es determinar el carácter de
estos, dando condiciones necesarias y suficientes. En el caso de funciones definidas sobre abiertos de espacios
vectoriales normados, el análisis está centrado en el estudio de la segunda derivada. Ahora bien, para el
caso de puntos extremales sobre subvariedades se sigue con el mismo esquema, tomando en cuenta algunas
sutilezas.
Consideremos U ⊂ Rn abierto, M ⊂ U subvariedad, f : U → R de clase C 2 . Sean a ∈ M un punto crı́tico
de f |M , σ : Rr → Rn una parametrización local alrededor de a. Como a ∈ M es un punto crı́tico de f |M , se
III.2. MULTIPLICADORES DE LAGRANGE 47
tiene que 0 es un punto crı́tico de f ◦ σ, por consiguiente las condiciones necesarias y suficientes de la sección
precedente son válidas para O con f ◦ σ y por lo tanto serı́a suficiente estudiar (f ◦ ϕ)00 (0). Por otro lado
Ta M ∼= Rs por σ 0 (0), de donde definimos la forma bilineal simétrica
Hessa f |M : Ta M × Ta M −→ R
(III.2.3)
(h, k) 7 (f ◦ σ)00 (0)((σ 0 (0))−1 (h), (σ 0 (0))−1 (k))
→
Teorema III.2.3 Sean U ⊂ Rn abierto f : U → R dos veces continuamente diferenciable en M ⊂ U

subvariedad y g : U → Rs submersión de clase C 2 con M = {x ∈ U |g(x) = 0. Supongamos que a ∈ M es un
punto crı́tico de f |M , (por lo tanto existe λ : Rs → R forma lineal tal que f 0 (a) − λg 0 (a) = 0), entonces
Hessa f |M = f 00 (a) − λg 00 (a). (III.2.4)
y por consiguiente Hessa f |M indepediente de la parametrización local alrededor de a.
Demostración.- Sea σ : W ⊂ Rr → Rn una parametrización local alrededor de a punto crı́tico de f |M .

Denotamos h̃ = σ 0 (0)−1 (h) y k̃ = σ 0 (0)−1 (k). Se tiene
Hessa f |M (h, k) = (f ◦ σ)00 (0)(h, k) = f 00 (a)(h, k) + f 0 (a)σ 00 (0)(h̃, k̃).
Como a es un punto crı́tico, sabemos que f 0 (a) = λg 0 (a), de donde
Hessa f |M (h, k) = f 00 (a)(h, k) + λg 0 (a)σ 00 (0)(h̃, k̃).
Por otro lado g ◦ σ(x) = 0 para todo x ∈ W , de donde g 0 (a)σ 0 (0) = 0 y
(g ◦ σ)00 (0)(h̃, k̃) = g 00 (a)(h, k) + g 0 (a)σ 00 (0)(h̃, k̃) = 0,
de donde
Hessa f |M (h, k) = f 00 (a)(h, k) − λg 00 (a)(h, k).
Remarca III.2.2 La forma bilineal Hessa f |M nos permite tener las mismas condiciones necesarias y su-
ficientes para determinar el carácter de un punto crı́tico de funciones restringidas sobre subvariedades. La
fórmula (III.2.4) nos da una expresión sencilla a trabajar y el único cuidado que hay que tener es de trabajar
sobre los vectores del espacio tangente al punto crı́tico.
Ejemplo III.2.2 Utilizemos el teorema precedente para mostrar que el punto (1/3, −2/3, 1/4) es un máximo
relativo estricto de la función f |M del ejemplo 1 de esta sección. Como λ1 = 3/8 y λ2 = 1/4 tenemos para
h = (h1 , h2 , h3 )t
    
2 0 0 h1
3 1 3
( h1 h2 h 3 ) 0 −  0 4 0  − 0  h2  = − (2h21 + 4h22 ).
8 4 8
0 0 0 h3
h ∈ Ta M si g 0 (a)h = 0 en particular si 3h1 − 4h3 = 0, de donde
3 3 16 3 2
− (2h21 + 4h22 ) = − (h21 + 4h2 + h23 ) ≤ − khk2
8 8 9 8
y la condición suficiente para un máximo relativo estricto se verifica.

III.3. Ejercicios
1. Sea f : Rn → R dos veces diferenciable en a ∈ Rn . Demostrar que la condición
2
f 00 (a)(h, h) ≤ −γ khk ∀h ∈ Rn ,
con γ > 0 es equivalente a f 00 (a)(h, h) < 0 para todo h 6= 0.

2. Sea E = {f : [1, +∞) → R| f continua y acotada} con la norma k k∞ . Se considera la aplicación
F : E → R dada por Z ∞ 2 Z ∞ 3
f (t) f (t)
F (f ) = dt − dt.
1 t4 1 t2
Demostrar que:
a) F 0 (0) = 0 y F 00 (0)(h, h) > 0 para h 6= 0.
b) 0 ∈ E no es un mı́nimo relativo de F .
3. Mostrar que el valor maximal de la expresión

ax2 + 2bxy + cy 2
dx2 + 2exy + f y 2
es la raı́z más grande de
(df − e2 )λ2 − (af − 2be + cd)λ + (ac − b2 ) = 0.
4. Consideremos la función f (x, y, z) = αx2 ey + y 2 ez + z 2 ex . Demostrar que el origen es un punto crı́tico.

¿Para qué valor de α ∈ R, el origen es un punto extremal de f .
5. Sea m < n y A una matriz m×n de rango m. Entre todas las soluciones de Ax = b, encontrar utilizando
multiplicadores de Lagrange la solución para la cual kxk2 es minimal. Dar una interpretación geométrica
del resultado.
6. Sea E = C 0 ([0, 1]) y sea F : E → R dada por F (y) = 2y(0)3 − 3y(0)2 . Demostrar las afirmaciones
siguientes:
a) y0 (x) = 1 es un mı́nimo relativo de F , si E está provisto de la norma k k∞ .
b) y0 (x) = 1 no es un mı́nimo relativo de F , si de E está provisto de la norma k k1 .
7. Calcular geométricamente el mı́nimo de f |M donde f (x, y) = x2 + y 2 y
M = {(x, y)|g(x, y) = 0} con g(x, y) = y 2 − (x − 1)3 .
Mostrar que el sistema

f 0 (x) − λg 0 (x) = 0
no tiene solución. Explicar porque.
8. Calcular el valor maximal de

xα y β z γ (α, β, γ, xy, z > 0)
k k k
sujeta a la condición x + y + z = 1, (k > 0). Deducir la desigualdad
u α v β w γ u + v + w α+β+γ
≤ .
α β γ α+β+γ
III.3. EJERCICIOS 49
9. Calcular los extremos relativos de f (x, y, z) = x2 + y 2 + z 2 sobre M donde
x2 y2 z2

M = (x, y, z)| + + =1 y z =z+y .
4 9 25
Verificar las condiciones suficientes para un extremo.

Capı́tulo IV
Ecuaciones Diferenciales Ordinarias
Las ecuaciones diferenciales es un lenguaje muy cómodo y utilizado para modelisar una gran cantidad de
fenómenos de diversa ı́ndole, desde el movimiento de planetas y estrellas, fı́sica de grandes cuerpos; hasta
la dinámica de las moléculas. En Biologı́a, económica muchos problemas se resuelven utilizando ecuaciones
diferenciales para describir comportamientos y relaciones.
En el curso de Primer Año de Análisis se trato métodos de resolución de las ecuaciones ordinarias usua-
les. Sin embargo en casos muy raros se logra encontrar la solución bajo una forma analı́tica. En general,
uno está obligado a utilizar métodos numéricos para obtener soluciones, ver curso de Análisis Numérico. En
este capı́tulo vamos a tratar las cuestiones teóricas de las ecuaciones diferenciales ordinarias. En particu-
lar estudiaremos la existencia y unicidad de las soluciones, su sensibilidad respecto a perturbaciones y su
comportamiento sobre largos intervalos.
IV.1. Conceptos Básicos y Algunos Problemas

Definición IV.1.1 Un sistema diferencial de talla n y orden m es una expresión de la forma
F (t, x, ẋ, . . . , x(m) ) = 0,
donde
F : R × Rn × Rn × · · · × Rn → Rn .
| {z }
m+1 veces
continua, x(k) ∈ Rn k = 0, 1, . . . , m
Ejemplo IV.1.1 El movimiento balı́stico se rige por el sistema de ecuaciones diferenciales de orden 2.
ẍ = 0
ÿ = g
donde x denota la componente horizontal y y la componente vertical. La variable independiente “t” no

aparece de manera explı́cita.
Remarca IV.1.1 Se debe observar que:
1. Como la imagen de la función F es Rn , el sistema se lo expresa como
F1 (t, x, ẋ, . . . , x(m) ) = 0,

F2 (t, x, ẋ, . . . , x(m) ) = 0,
..
.
Fn (t, x, ẋ, . . . , x(m) ) = 0,
donde cada Fi : R × R(m+1)n → R es continua.
51
52 CAPÍTULO IV. ECUACIONES DIFERENCIALES ORDINARIAS
2. Para evitarse análisis complicados en la resolución de dichas ecuaciones, se prefiere trabajar con sistemas
explicitados, es decir, sistemas de la forma
x(m) = F (t, x, ẋ, . . . , x(m−1) ).
Más todavı́a con sistemas de orden 1.
Proposición IV.1.1 Todo sistema de ecuaciones diferenciales de orden m ≥ 1, es equivalente a un sistema

de primer orden.
Demostración.- Sea
x(m) == F (t, x, ẋ, . . . , x(m−1) ),
con x ∈ Rn un sistema de orden m y talla n. Introduciendo las variables
y1 =x
y2 = ẋ
..
.
ym = x(m−1)
se obtiene el sistema equivalente

ẏ1 = y2 ,
ẏ2 = y3 ,
..
.
ẏm−1 = ym ,
ẏm = F (t, y1 , y2 , . . . , ym ),
y denotando y = (y1 , . . . , ym ) ∈ Rnm se tiene lo que se quiere.
Remarca IV.1.2 En lo que sigue el capı́tulo, solo se considerará sistemas de primer orden, a menos que se
diga lo contrario.
Definición IV.1.2 Se dira que una función ϕ : I ⊂ R → Rn continuamente derivable es una solución del
sistema de primer orden, de talla n,
ẋ = f (t, x),
si ϕ̇(t) = f (t, ϕ(t)), ∀t ∈ I.
Sistemas Autónomos
Definición IV.1.3 Se dira que un sistema diferencial de talla n es autónomo si se puede escribir de la
forma
ẋ = f (x); (SDA)
es decir, la variable independiente t no aparece explı́citamente en el sistema diferencial.
Proposición IV.1.2 Todo sistema diferencial de primer orden, es equivalente a un sistema diferencial
autónomo.
Demostración.- Sea
ẋ = F (t, x),
un sistema diferencial no autónomo, planteando
xn+1 = t,
IV.1. CONCEPTOS BÁSICOS Y ALGUNOS PROBLEMAS 53
obtenemos esl sistema diferencial autónomo

ẋ = f (xn+1 , x)
ẋn+1 = 1;

x
y definiendo el vector X = ∈ Rn+1 , el sistema precedente lo escribimos como
xn+1

f (xn+1 , x)
Ẋ = F (X) = .
1
Definición IV.1.4 Cuando se trabaja con sistemas diferenciales autónomos (SDA), es costumbre llamar a
Rn espacio fase y las coordnedas de x, xi fase.
Definición IV.1.5 Si ϕ : I → Rn es una solución del (SDA), la imagen de ϕ, ϕ(I), se llama trayectoria
y en algunos casos linea de flujo.
Remarca IV.1.3 Se designa t la variable independiente haciendo en general referencia al tiempo. Una
solución describirá por consiguiente la ley de movimiento de un objeto, mientras que la trayectoria es la
traza dejada por el movimiento del objeto. La única información que puede proporcionar una trayectoria, es
las posiciones por don de ha estado el objeto y no el momento exacto. Sin embargo, a pesar de esta limitación
se puede obtener informaciones respecto a las soluciones conociendo las trayectorias. En la graficación de
las trayectorias, es corriente indicar el sentido del movimiento colocando una flecha para indicar. Ver figura
IV.1.1
xn
x2
x1
Figura IV.1.1: Trayectoria de una solución
Consideremos el sistema diferencial autónomo
ẋ = f (x),
y una solución ϕ : I → Rn . El vector tangente, (en fı́sica vector velocidad), en t = t0 es ϕ0 (t0 ) ∈ Rn . Ahora
bien
ϕ0 (t0 ) = f (ϕ(t0 )),
de donde a la trayectoria en el punto x∗ = ϕ(t0 ) se le puede asociar el vector tangente f (x∗ ). Ver figura
IV.1.2. Remarcamos inmediatamente que el lado derecho del (SDA) induce un campo de vectores tangentes
x*
Figura IV.1.2: Vector Tangente
(a las trayectorias) del Sistema Diferencial Autónomo, que lo denotamos

v : Rn → Rn
x 7→ f (x).
Es costumbre representar un campo de vectores en una gráfica, asociando a cada x ∈ Rn del espacio de fases
una flecha que corresponde el vector de la imagen. Ver figura IV.1.3.
Figura IV.1.3: Representación de un Campo de Vectores
Tipos de Soluciones
Consideremos el sistema diferencial autónomo de talla n
ẋ = F (x),
y ϕ : I ⊂ R → Rn una solución del sistema.
Definición IV.1.6 Se dirá que ϕ es una solución estacionaria si ϕ(t) = x∗ ∈ Rn para todo t ∈ I.
Definición IV.1.7 Se dirá que ϕ es una solución periódica si existe T > 0 tal que ϕ(t + T ) = ϕ(t) para
todo T , si es el caso T se llama periodo.
Proposición IV.1.3 Sea ẋ = F (x) un sistema autónomo, entonces:
a) ϕ es una solución estacionaria, si y solamente si la trayectoria de ϕ se reduce a un punto en el espacio
de fases, si y solamente si F (ϕ(t)) = 0.
b) ϕ es una solución periodica no estacionaria si y solamente s i la trayectoria de ϕ es una curva cerrada
y F no se anula nunca sobre la trayectoria.
Remarca IV.1.4 La proposición precedente para encontrar soluciones estacionarias nos da un medio al-
gebraico, resolver F (x) = 0 y un medio gráfico viendo las trayectorias que se reducen a un punto. En las
soluciones estacionarias, tenemos un medio gráfico que el estudio de las trayectorias cerradas.
Ahora bien, poder decidir si una curva es cerrada o no, es en general bastante complicado si n > 2. En el
plano es posible en general.
Por otro lado, un gran número de las aplicaciones de los sistemas diferenciales autónomos es de talla 2.
Por lo que vale la pena estudiarlos.
Sistemas Autónomos de Talla 2

Aparte de los sistemas autónomos de talla 2
˙
x x
=F ,
y y
es frecuente estudiar las ecuaciones diferenciales de segundo orden de la forma
ẍ = f (x, ẋ),
donde x depende de t como un sistema autónomo de talla 2. Con tal motivo se plantea
x1 = x,
x2 = ẋ;
el sistema diferencial autónomo equivalente está dado por
˙
x1 x2
= ,
x2 f (x1 , x2 )
y las componentes del plano de fases son x1 = x (la posición) y x2 = ẋ (la velocidad).
Volvamos al sistema
ẋ = F (x),
donde x ∈ R2 . F (x) induce un campo de vectores tangentes a las trayectorias. Aprovechando la relación
dx2 ẋ2
= ,
dx1 ẋ1
vista en Cálculo I, y si F (x1 , x2 ) = (F1 (x1 , x2 ), F2 (x1 , x2 )), las trayectorias son los grafos de las soluciones
de la ecuación diferencial
dx2 F2 (x1 , x2 )
= ,
dx1 F1 (x1 , x2 )
o bien los grafos de las soluciones de la ecuación diferencial
dx1 F1 (x1 , x2 )
= ,
dx2 F2 (x1 , x2 )
Acabamos de formular un método que nos determina las trayectorias, sin necesidad de conocer las soluciones
del sistema diferencial autónomo.
Remarca IV.1.5 Una familia de curvas en R2 pueden ser las trayectorias de muchos sistemas diferenciales,
pero el campo de pendientes de las curvas es único.
Ejemplo IV.1.2 (Predador-Presa) El comportamiento de dos poblaciones de animales en un ambiente
aislado en el que una de las poblaciones son por ejemplo conejos y la otra población son lobos se puede
modelar por el sistema diferencial
ẋ = x(α − βy),
ẏ = y(γx − δ)
donde x(t) represanta la población de conejos en el instante t e y(t) representa la población de lobos en el
instante t. Las trayectorias satisfacen la ecuación diferencial
y(γx − δ)
y0 =
x(α − βy)
que es una ecuación diferencial separable. Resolviendo la ecuación obtemos como solución general (en forma
implı́cita)
γx − δ ln x = α ln y − βy + C. (IV.1.1)
Las trayectorias del sistema diferencial son las curvas de nivel de (IV.1.1). En la figura II.4 están graficadas
las curvas de nivel de (IV.1.1) para α = 1, β = 1, γ = 2 y δ = 3. Observamos que las curvas de nivel son
curvas cerradas, por lo que deducimos que el comportamiento de estas poblaciones es cı́clico.
Figura IV.1.4: Trayectorias del Sistema Diferencial
Aplicaciones Geométricas
Veremos, cómo la utilización de conceptos relacionados a las ecuaciones y sistemas diferenciales permite la
resolución de problemas relacionados a familias de curvas, en particular curvas uniparamétricas, del plano.
Definición IV.1.8 Una familia de curvas uniparamétricas, es una familia de curvas si existe una función
F : R2 × R → R, de manera que cada curva es el lugar geométrico de los puntos (x, y) que satisfacen la
ecuación
F (x, y, c) = 0,
dejando c ∈ R fijo. La ecuación se llama ecuación general de la familia de curvas y c es el paramétro.
Proposición IV.1.4 Una familia de curvas es uniparamétrica, si y solamente si existe una función continua
f : R × R → R2 , de manera que las funciones ϕα : R → R2 definidas por
ϕα (t) = f (t, α),
sean parametrizaciones de cada una de las curvas de la familia.
Ejemplo IV.1.3 Las circunferencias centradas en el origen forman una familia uniparamétrica. En efecto,
la ecuación general es
x2 + y 2 − r2 = 0,
las parametrizaciones de las circunferencias centradas en el origen están dadas por
x(t) = r cos t
y(t) = r sin t.
Remarca IV.1.6 La solución general de una ecuación diferencial de primer orden que satisface una condi-
ción de Lipschtiz es una familia uniparamétrica de curvas. Asimismo, las trayectorias pueden de un sistema
diferencial autónomo forman una familia uniparamétrica, si el sistema satisface una condición de Lipschtiz;
las soluciones del sistema vienen a ser las parametrizaciones de las curvas.
Proposición IV.1.5 Para toda familia uniparamétrica existe una ecuación diferencial y 0 = f (x, y) cuya
solución general son las curvas de la familia uniparamétrica. Además también existe un sistema diferencial
autónomo cuyas trayectorias son las curvas de la familia uniparamétrica.
Demostración.- Sea F (x, y, c) = la ecuación general de la familia de curvas uniparamétrica. Derivando

respecto a x, se obtiene,
∂F ∂F
(x, y, c) + (x, y, c)y 0 = 0.
∂x ∂y
Por consiguiente, y 0 , c dejando x, y fijos, satisfacen el sistema de ecuaciones (algebraicas)
F (x, y, c) = 0
∂F
∂x (x, y, c) + ∂F
∂y (x, y, c)y 0 = 0,
de donde es posible obtener y 0 en función de x e y, es decir
y 0 = f (x, y).
Para el sistema, es suficiente considerar g1 (x, y) y g2 (x, y) de manera que
g2 (x, y)
f (x, y) = ,
g1 (x, y)
por lo que las curvas son trayectorias del sistema
ẋ = g1 (x, y)
ẏ = g2 (x, y).
Remarca IV.1.7 Para la existencia de f (x, y) se deberá considerar hipótesis suplementarias de F (x, y, c).
Ejemplo IV.1.4 La familia de parábolas de vértice el origen y eje de simetrı́a el eje y, satisface la ecuación
general
y = cx2 ,
derivando, se obtiene
y 0 = 2cx,
despejando c de la ecuación general obtenemos la ecuación diferencial
2y
y0 = .
x
Condiciones para que una familia de curvas sea uniparamétrica

Hemos visto que para que una familia de curvas sea uniparamétrica es necesario la existencia de una ecuación
general. Sin embargo encontrar dicha ecuación es en general una tarea complicada.
Ahora bien, utilizando resultados sobre las trayectorias y soluciones de ecuaciones y sistemas diferenciales,
uno se puede dar cuenta si una familia es uniparamétrica o no. En efecto, supongamos que tenemos una
familia de curvas uniparamétrica y sea
˙
x F1 (x, y)
= F (x, y) =
y F2 (x, y)
un sistema autónomo cuyas trayectorias son las curvas de la familia en cuestión. En general las funciones
F (x, y) tienen a lo más un número finito de soluciones del sistema F (x, y) = (0, 0) en cada región acotada,
para e fectos prácticos consideramos regiones rectangulares de la forma [a, b] × [c, d].
Por otro lado observamos que si en el punto (x, y), F (x, y) 6= 0, solo pasa por este punto una trayectoria.
Si F (x, y) = 0, (x, y) es un punto estacionario en que enventualmente pueden confluir y o emerger varias
trayectorias. En consecuencia, si en una región rectangular existen una infinidad de puntos en los cuales
pasan diferentes curvas, esta familia no es uniparamétrica.
Ejemplo IV.1.5 La familia de circunferencias del plano, no es una familia uniparmétrica porque por cada
punto del plano pasa una infinidad de circunferencias.
Ejemplo IV.1.6 La familia de circunferencias de centro en el eje x y que pasan por el origen, ver figura
IV.1.5, puede ser una familia uniparmétrica, solo existe un punto, el origen, por el cual pasa una infinidad
de circunferencias, por los otros, pasa exactamente una circunferencia. Ahora bien, esta es una familia
uniparamétrica, cuya ecuación general es facilmente deducible y es
(x − r)2 + y 2 − r2 = 0,
o bien
x2 + y2 − 2rx = 0.
Determinemos la ecuación diferencial y es sistema diferencial. Se tiene
x2 + y 2
r= ,
x
derivando obtenemos
2x2 + 2yy 0 x − x2 − y 2
0= ,
x2
despejamos y 0 , se obtiene
y 2 − x2
y0 = ,
2xy
de donde el sistema estará dado por
ẋ = 2xy
ẏ = y 2 − x2
Remarca IV.1.8 Es importante encontrar un sistema diferencial autónomo cuyas trayectorias sean las
curvas de una familia de curvas uniparamétrica, porque nos permite determinar un campo de vectores
tangentes. Y manipular vectores (tangentes) es mucho más sencillo que manipular las curvas.
Figura IV.1.5: Familia de Circunferencias
Familias de curvas que forman un ángulo dado con una familia de curvas dada
Consideremos el siguiente problema: “Dada una familia de curvas uniparamétrica, encontrar una familia de
curvas que forme un ángulo θ”. Interpretemos lo que significa este problema. El concepto de ángulo es un
concepto para rectas, que se generaliza a las curvas, definiendo el angulo entre dos curvas, como el ángulo
de los vectores tangentes, ver figura IV.1.6. Por consiguiente, determinamos primero el campo de vectores
D
u
Figura IV.1.6: Angulo entre dos curvas
tangentes a la familia de curvas dada, ya sabemos cómo, sea

v1 (x, y)
v(x, y) =
v2 (x, y)
el campo de vectores dados. Obtenemos el campo u(x, y) de la familia de curvas que forman el ángulo dado,
rotando por un ángulo θ, el campo v(x, y), es decir

u1 (x, y) cos θ − sin θ v1 (x, y)
= .
u2 (x, y) sin θ cos θ v2 (x, y)
El siguiente paso es considerar el sistema autónomo

˙
x u1 (x, y)
=
y u2 (x, y)
y determinar las trayectorias, que ya sabemos hacer.
Ejemplo IV.1.7 Consideremos nuevamente la familia de circunferencias de centro en el eje x y que pasan
por el origen y encontremos la familia de curvas ortogonales a esta familia de circunferencias. En el ejemplo
4, hemos encontrado un campo de vectores tangentes, dado por

2xy
v(x, y) = .
y 2 − x2
Aplicando una rotación de 90 grados obtenemos

2
0 −1 2xy x − y2
u(x, y) = = ,
1 0 y 2 − x2 2xy
de donde, las curvas ortogonales, son trayectorias del sistema diferencial

˙ 2
x x − y2
= .
y 2xy
Determinamos las trayectorias, resolviendo la ecuación diferencial

2xy
y0 = ,
x2 − y2
cuya solución general es

x2 + y 2 − cy = 0,
que es la ecuación general de una familia de circunferencias de centro el eje y y que pasan por el origen.
IV.2. Existencia y Unicidad del Problema de Cauchy

Consideremos el problema de Cauchy
ẋ = f (t, x), x(t0 ) = x0 (IV.2.1)
donde f : U → Rn (con U ⊂ R × Rn abierto) es una función continua. Integrando la ecuación diferencial

entre t0 y t, se obtiene la ecuación integral
Z t
x(t) = x0 + f (s, x(s)) ds. (IV.2.2)
t0
Cada solución de (IV.2.1) es solución de (IV.2.2). Lo contrario es también cierto, Si una función continua
y(x) verifica (IV.2.2) sobre un intervalo I, entonces es automáticamente de clase C 1 y verifica (IV.2.1).
Iteración de Picard-Lindelöf
La ecuación (IV.2.1) puede ser considerada como un problema de punto fijo en C(I). Por consiguiente, la idea
es aplicar el método de las aproximaciones sucesivas, ver capı́tulo I. El método se escribe para este problema
en particular
x0 (t) = x0 (o una función arbitraria)
Rt (IV.2.3)
xk+1 (t) = x0 + t0 f (s, xk (s)) dt.
IV.2. EXISTENCIA Y UNICIDAD DEL PROBLEMA DE CAUCHY 61
Figura IV.1.7: Curvas ortogonales
1

0
1 2 3 4
Figura IV.2.8: Iteración de Picard-Lindelöf para el problema del ejemplo 1.
Ejemplo IV.2.1 Consideremos el problema
ẋ = −x2 , x(0) = 1
con solución exacta x(t) = 1/(1 + t). Las primeras aproximaciones obtenidas por la iteración de Picard-
Lindelöf son x0 (t) = 1, x1 (t) = 1 − t y x2 (t) = 1 − x + x2 − x3 /3. Se observa una convergencia rápida hacia
la solución exacta en el intervalo [0, 3,75]. Para t demasiado grande, la iteración diverge.
Proposición IV.2.1 Sea A = {(x, y) ∈ R × Rn | |x − x0 | ≤ a, ky − y0 k ≤ b}, f : A → Rn una función

continua y M = máx kf (x, y)k. Para α = mı́n{a, b/m} el operador
(x,y)∈A
Z x
(T y)(x) = y0 + f (t, y(t)) dt
x0
está bien definido sobre B = {y : [x0 − α, x0 + α] → Rn | ycontinua y ky(x) − y0 k ≤ b} y satisface T (B) ⊂ B

Demostración.- La afirmación es una consecuencia de

Z x Z x

k(T y)(x) − y0 k =
f (t, y(t)) dt ≤
kf (t, y(t))k dt ≤ M |x − x0 | ≤ M α ≤ b.
x0 x0
Se dice que una función f : A → Rn , A como en la proposición precedente satisface una condición de
Lipschitz si
kf (x, y) − f (x, z)k ≤ L ky − zk para (x, y), (x, z) ∈ A.
La constante L se llama constante de Lipschitz.
Remarca IV.2.1 Remarcamos que la condición de Lipschitz no es una consecuencia de la continuidad de

f (x, y). Por ejemplo la función y 2/3 es continua y no verifica una condición de Lipschtz. Por otro lado una
función de clase C 1 verifica una condición de Lipschitz, como consecuencia del teorema de incrementos finitos.
Si f (x, y) satisface una condición de Lipschitz y si αL < 1, el operador T de la proposición precedente es

una contracción sobre B. Por consiguiente en este caso se puede aplicar el teorema del punto fijo de Banach
para concluir que T y = y posee una solución única en B. Vamos a mostrar la existencia y unicidad de una
solución sin esta condición suplementaria sobre α.
Teorema IV.2.1 Consideremos el conjunto A = {(x, y) ∈ R × Rm | |x − x0 | ≤ a, ky − y0 k ≤ b} y suponga-

mos que f :→ Rn sea continua y satisfaga una condición de Lipschitz.
Entonces, el problema de Cauchy y 0 = f (x, y) y(x0 ) = y0 posee una solución única sobre I = [x0 − α, x0 + α],
donde α = mı́n{a, b/M } y M = máx kf (x, y)k.
(x,y)∈A
Demostración.-

Cálculo Diferencial en Espacios de Banach

Cargado por

Información del documento

Derechos de autor

Formatos disponibles

Compartir este documento

Compartir o incrustar documentos

Opciones para compartir

¿Le pareció útil este documento?

¿Este contenido es inapropiado?

Copyright:

Formatos disponibles

Cálculo Diferencial en Espacios de Banach

Cargado por

Copyright:

Formatos disponibles

Cálculo Diferencial en Espacios de Banach

Hans Cristian Muller Santa Cruz

I. Cálculo Diferencial en Espacios de Banach 1

II. Subvariedades Diferenciales 35

III. Máximos y Mı́nimos Locales 43

IV. Ecuaciones Diferenciales Ordinarias 51

I.1.1. Sucesión de Funciones. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3

II.2.1. Visualización del teorema . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 37

IV.1.1.Trayectoria de una solución . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 53

I.1. Espacios de Banach

(N1) kxk ≥ 0 y kxk = 0 ⇐⇒ x = 0,

(N2) kλxk = |λ| · kxk,

(N3) kx + yk ≤ kxk + kyk (desigualdad del triángulo).

∀ > 0 ∃N ∈ N, ∀n ≥ N kxn − ak < ;

si es el caso, se dirá que {xn } converge hacia a ∈ E.

∀ > 0 ∃N ∈ N, ∀n, m ≥ N kxn − xm k < .

Proposición I.1.1 Sea

C([0, 1]) es un espacio de Banach. Al contrario, con una de las normas

el espacio C([0, 1]) no es un espacio de Banach.

Figura I.1.1: Sucesión de Funciones.

conduciendo a que f sea discontinua en 1/2, lo que es contradictorio.

Proposición I.1.2 Consideremos el conjunto

Remarca I.1.1 Se tiene las siguientes remarcas:

Proposición I.1.3 En Rn , todas las normas son equivalentes.

aplicando la desigualdad de Cauchy, se obtiene

Para x = 0 la desigualdad se cumple de todas maneras.

Corolario I.1.1 Rn provisto de una norma es un espacio de Banach.

Corolario I.1.2 Si E es un espacio vectorial normado de dimensión finita, entonces E es un espacio de

Demostración.- Sea {d1 , . . . , dn } una base de E. La aplicación

Br (a) = {x ∈ E| kx − ak < r}.

Un conjunto V ⊂ E es un vecindario de a ∈ E, si existe  > 0 tal que B (a) ⊂ V .

Un conjunto A ⊂ E es cerrado, si el lı́mite de cada sucesión convergente {xn } con xn ∈ A, pertenece a A.

Definición I.1.8 Sean E y F dos espacios de Banach y U ⊂ E. Una función f : U → F es continua en

x ∈ U y kx − x0 k < δ ⇒ kf (x) − f (x0 )k < .

kx + yk + kx − yk = 2(kxk + kyk) (identidad del paralelogramo).

4. A un espacio E de Banach se lo llama espacio de Hilbert, si la norma del espacio E proviene de un

5. Se considera los subconjuntos de R2 siguientes:

¿Qué conjuntos son abiertos, cerrados, acotados, compactos? Justificar.

son normas sobre C([0, 1]).

7. Demostrar que, pra un conjunto arbitrario no vacio A,

B(A) = {f : A → R| f es acotada} con kf k∞ = sup |f (t)| ,

I.2. Aplicaciones Lineales

b) A es continua en todo punto de E.

c) Existe C > 0 tal que ∀x ∈ E, kA(x)k ≤ C kxk.

z ∈ E y kzk < δ ⇒ kA(z)k < .

Planteando z = y − x, se tiene ky − xk < δ implica

 > kA(y − x)k = kA(y) − A(x)k .

kxk < δ(1) ⇒ ka(x)k < 1.

Por lo tanto, si x 6= 0, se tiene

Corolario I.2.1 Todas las aplicaciones lineales A de Rn en Rm son continuas.

Proposición I.2.2 L(E, F ) es un subespacio vectorial de L(E, F ).

kAxk ≤ kAk · kxk . (I.2.2)

k(A + B)xk ≤ kAxk + kBxk ≤ (kAk + kBk) kxk .

Por lo tanto kAn − Ak → 0, cuando n → ∞.

k(AB)xk ≤ kAk · kBxk ≤ kAk · kBk · kxk .

Enseguida, se divide esta relación por kxk y tomamos el supremo para x 6= 0.

Proposición I.2.5 Sea A una matriz m × n; es decir, A ∈ L(Rn , Rm )y notemos por

Demostración.- Para la norma kxk1 . Se tiene

Ejemplo I.2.2 Para la matriz  

y las normas de la proposición I.1.6, se tiene

Ejercicio.- Mostrar los resultados del ejemplo (I.2.3)

Demostración.- Mostremos primero que

2. El radio espectral ρ(A) de una matriz n × n, A, está definido por:

ρ(A) = máx{|λ| | λ valor propio de A}

∀ > 0 ∃N ∈ N, ∀n ≥ N kxn − ak < ;

∀ > 0 ∃N ∈ N, ∀n, m ≥ N kxn − xm k < .

Un conjunto V ⊂ E es un vecindario de a ∈ E, si existe > 0 tal que B (a) ⊂ V .

x ∈ U y kx − x0 k < δ ⇒ kf (x) − f (x0 )k < .

z ∈ E y kzk < δ ⇒ kA(z)k < .

> kA(y − x)k = kA(y) − A(x)k .

Demostración.- Para un > 0 dado, consideremos la desigualdad

kf (t) − f (a)k ≤ g(t) − g(a) + (t − a) + . (I.4.1)