Está en la página 1de 70

Cálculo Diferencial en Espacios de Banach

Hans Cristian Muller Santa Cruz

14 de marzo de 2008
2
Índice general

Prefacio V

I. Cálculo Diferencial en Espacios de Banach 1


I.1. Espacios de Banach . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1
I.1.1. Ejercicios . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 5
I.2. Aplicaciones Lineales . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 6
I.2.1. Ejercicios . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 10
I.3. Diferenciabilidad en los Espacios Normados . . . . . . . . . . . . . . . . . . . . . . . . . . . . 11
I.3.1. Ejercicios . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 14
I.4. Teorema de los Incrementos Finitos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 15
I.4.1. Ejercicios . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 16
I.5. Teorema del punto fijo de Banach . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 17
I.5.1. Ejercicios . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 21
I.6. Teorema de Inversión Local . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 22
I.6.1. Ejercicios . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 25
I.7. Teorema de las Funciones Implı́citas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 26
I.7.1. Ejercicios . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 28
I.8. Aplicaciones Bilineales y Multilineales . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 29
I.8.1. Ejercicios . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 30
I.9. Derivadas de Orden Superior . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 31
I.9.1. Ejercicios . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 33
I.10. Fórmula de Taylor . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 33
I.10.1. Ejercicios . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 34

II. Subvariedades Diferenciales 35


II.1. Teorema del Rango . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 35
II.2. Subvariedades Diferenciables . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 37
II.3. Espacio Tangente . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 39
II.4. Ejercicios . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 40

III. Máximos y Mı́nimos Locales 43


III.1. Máximos y mı́nimos relativos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 43
III.2. Multiplicadores de Lagrange . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 45
III.3. Ejercicios . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 48

IV. Ecuaciones Diferenciales Ordinarias 51


IV.1. Conceptos Básicos y Algunos Problemas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 51
IV.2. Existencia y Unicidad del Problema de Cauchy . . . . . . . . . . . . . . . . . . . . . . . . . . 60

i
ii ÍNDICE GENERAL
Índice de figuras

I.1.1. Sucesión de Funciones. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3


I.5.2. Método de las aproximaciones sucesivas para f (x) = cos x y f (x) = ex /4 . . . . . . . . . . . 18
I.5.3. Método de Newton (izquierda) y método de Newton simplificado (derecha) . . . . . . . . . 19
I.6.4. Coordenadas Polares . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 25

II.2.1. Visualización del teorema . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 37

IV.1.1.Trayectoria de una solución . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 53


IV.1.2.Vector Tangente . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 54
IV.1.3.Representación de un Campo de Vectores . . . . . . . . . . . . . . . . . . . . . . . . . . . . 54
IV.1.4.Trayectorias del Sistema Diferencial . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 56
IV.1.5.Familia de Circunferencias . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 59
IV.1.6.Angulo entre dos curvas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 59
IV.1.7.Curvas ortogonales . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 61
IV.2.8.Iteración de Picard-Lindelöf para el problema del ejemplo 1. . . . . . . . . . . . . . . . . . . 61

iii
iv ÍNDICE DE FIGURAS
Prefacio

v
vi PREFACIO
Capı́tulo I
Cálculo Diferencial en Espacios de
Banach

I.1. Espacios de Banach


En el Curso de Algebra Lineal se hizo un estudio profundo de los Espacios Vectoriales y sus propiedades. En
esta sección, se estudiará los espacios vectoriales bajo una óptica del análisis. A continuación damos algunas
definiciones útiles para nuestro estudio.

Definición I.1.1 Una norma sobre un espacio vectorial V es una aplicación k·k : V → V que verifica las
tres propiedades:

(N1) kxk ≥ 0 y kxk = 0 ⇐⇒ x = 0,

(N2) kλxk = |λ| · kxk,

(N3) kx + yk ≤ kxk + kyk (desigualdad del triángulo).

Definición I.1.2 Se dice que E es un espacio vectorial normado, si E es un espacio vectorial provisto
de una norma.

Definición I.1.3 Sea E un espacio vectorial normado. Se dice que la sucesión {xn } con valores en E es
convergente, si existe a ∈ E, tal que

∀ > 0 ∃N ∈ N, ∀n ≥ N kxn − ak < ;

si es el caso, se dirá que {xn } converge hacia a ∈ E.

Definición I.1.4 Sea E un espacio vectorial normado. Se dice que la sucesión {xn } con valores en E es
una sucesión de Cauchy, si

∀ > 0 ∃N ∈ N, ∀n, m ≥ N kxn − xm k < .

Definición I.1.5 Un espacio vectorial normado E se dirá que es completo si cada sucesión de Cauchy en
E es convergente. Un espacio vectorial normado y completo se llama un espacio de Banach.

En el curso de Primer Año de Análisis se mostró que Rn con la norma euclidiana es completo, de donde Rn
es un espacio de Banach. Podrı́amos creer ingenuamente que todos los espacios vectoriales reales provistos
de norma, son espacios de Banach. Lastimosamente, o por el contrario, existen espacios normados que no
son espacios de Banach. Más todavia, en la proposición siguiente, se verá que un mismo espacio provisto de
normas diferentes tiene comportamientos diferentes.

Proposición I.1.1 Sea


C([0, 1]) = {f : [0, 1] → R| f continua}.

1
2 CAPÍTULO I. CÁLCULO DIFERENCIAL EN ESPACIOS DE BANACH

Con la norma
kf k∞ = máx |f (t)| ,
t∈[0,1]

C([0, 1]) es un espacio de Banach. Al contrario, con una de las normas


s
Z 1 Z 1
2
kf k1 = |f (t)| dt o kf k2 = |f (t)| dt
0 0

el espacio C([0, 1]) no es un espacio de Banach.

Demostración.- Para ver que C([0, 1]) es un espacio vectorial es suficiente ver que es un subespacio de R[0,1]
es espacio de las funciones de [0, 1] en R, ver ejemplo 4 de I.1 texto de Algebra Lineal.
La verificación que k·k∞ es una norma sobre C([0, 1]), es consecuencia directa de las propiedades de máx
y sup vistas en el curso del Primer Año de Análisis. Por consiguiente, la demostración es un simple repaso
que se deja al estudiante.
La positividad, a homogeneidad y la desigualdad del triángulo para k·k1 y k·k2 resultan de las propiades
de la integral de Riemann, también vistas en el primer año de análisis. Mostraremos que k·k1 es estrictamente
positiva; es decir que kf k1 = 0, implica que f = 0. En efecto, supongamos lo contrario; es decir, existe una
función f ∈ C([0, 1]) no nula, tal que
Z 1
|f (t)| dt = 0.
0
Como f , es no nula, existe t0 ∈ [0, 1], tal que f (t0 ) 6= 0. Por la continuidad de f , en particular en t0 , existe
un subintervalo [t1 , t2 ], tal que |f (t)| ≥ |f (t0 )| /2, de donde
Z 1 Z t2
f (t0 )
|f (t)| dt ≥ |f (t)| dt ≥ (t2 − t1 );
0 t1 2
lo que conduce a una contradicción. Para k·k2 , la demostración es completamente similar.
Ahora bien, utilizando los resultados de la convergencia uniforme, para sucesiones de funciones, se tiene
C([0, 1]), con la norma de la convergencia uniforme, es un espacio de Banach.
Mostremos que C([0, 1]) con la norma k·k1 no es completo. En efecto, consideremos la sucesión de funciones
continuas sobre [0, 1], dada por
si x ≤ 12 − n+1
1

 0 ;
fn (x) = 1
1 + (n + 1)(x − 2 ) si 2 − n+1 ≤ x ≤ 12 ,
1 1

1 si x ≥≤ 21 .

En la figura I.1.1, observamos algunas de estas funciones. Esta sucesión es una sucesión de Cauchy, respecto
a la norma k·k1 . En efecto, un simple cálculo de áreas, dará

1 1 1
kfn − fm k = − → 0,
2 n + 1 m + 1
cuando n, m → ∞. Por otro lado, fijando x ∈ [0, 1], se observa,
0 si x < 12 ,

lı́m fn (x) =
n→∞ 1 si x ≥ 12.
Por lo tanto, constatamos que esta sucesión, puntualmente converge a una función que no es continua, la
discontinuidad está en 1/2.
Aunque la sucesión fn , no converga puntualmente a una función continua, eso no significa necesariamente
que la sucesión fn no converga a una función continua; por lo que debemos probar.
Supongamos que dicha sucesión converge a una función continua f definida sobre [0, 1]. Consideremos los
subintervalos [0, a] con a < 1/2. Las restricciones de fn sobre [0, a] convergen sobre la restriccion de f sobre
[0, a], porque
Z a Z 1
|fn (t) − f (t)| dt ≤ |fn (t) − f (t)| .
0 0
I.1. ESPACIOS DE BANACH 3

1/2 1

Figura I.1.1: Sucesión de Funciones.

Una verificación inmediata y la unicidad del lı́mite, dará que f (t) = 0, sobre [0, a]. El mismo razonamiento,
con [b, 1] b > 1/2, nos dará f (t) = 1 sobre [b, 1]. Esto significa que

0 si x < 21 ,


1 si x > 12;

conduciendo a que f sea discontinua en 1/2, lo que es contradictorio.

Proposición I.1.2 Consideremos el conjunto

B(A) = {f : A → R| f acotada}

de las funciones acotadas sobre A. B(A) con la adición y la multiplicación por escalar, la norma

kf k∞ = sup |f (t)|
t∈A

es un espacio de Banach.

Demostración.- Ejercicio.

Un Poco de Topologı́a
Definición I.1.6 Sean E un espacio vectorial; k·kp y k·kq normas sobre E. Se dirá que k·kp y k·kq son
equivalentes si:
existe Cq > 0 tal que ∀x ∈ E se tiene kxkp ≤ Cq kxkq ,
existe Cp > 0 tal que ∀x ∈ E se tiene kxkq ≤ Cp kxkp .

Remarca I.1.1 Se tiene las siguientes remarcas:

1. La equivalencia de normas, es una relación de equivalencia sobre el conjunto de normas del espacio
vectorial E.

2. La equivalencia de normas, conserva las caracterı́sticas de una sucesión; es decir si k·kp y k·kq son
equivalentes, se tendrá “{xn } sucesión en E es convergente, (de Cauchy) para la norma k·kp , si y
solamente si {xn } es convergente, (de Cauchy) para la norma k·kq ”
4 CAPÍTULO I. CÁLCULO DIFERENCIAL EN ESPACIOS DE BANACH

3. Por la remarca 1 y 2, al hablar de un espacio vectorial normado, uno se refiere, no solamente a una
norma, sino a una clase de equivalencia de normas, por loq que dependiendo la situación, uno elegirá la
norma más conveniente de la clase de equivalencia.

Proposición I.1.3 En Rn , todas las normas son equivalentes.

Demostración.- Suficiente mostrar que cualquier norma k·k es equivalente a la norma euclidiana sobre Rn .
Sea x ∈ Rn , se tiene.

Xn X n n
X
kxk = xi ei ≤ |xi | kei k ≤ máx kei k |xi | ,

1≤i≤n
i=1 i=1 i=1

aplicando la desigualdad de Cauchy, se obtiene



kxk ≤ n máx kei k kxk2 . (I.1.1)
1≤i≤n

Para la otra desigualdad, consideremos B = {x ∈ E| kxk2 = 1}. Denotemos por m = ı́nf kxk. Se tiene
x∈B
m ≥ 0, mostremos que m > 0, porque sino existirı́a una sucesión xn de B tal que

lı́m kxn k = 0,
n→∞

como B es compacto en Rn , (respecto a la norma euclidiana), existirı́a una subsucesión xnk que converge
a x ∈ B, (respecto a la norma euclidiana). Utilizando, la desigualdad (I.1.1), la sucesión xnk también
convergerı́a a x respecto a la otra norma, lo que imposible, porque x 6= 0. De donde, planteando C = 1/m,
y observando que x = kxk2 x/ kxk2 para x 6= 0, se obtiene

kxk2 ≤ C kxk .

Para x = 0 la desigualdad se cumple de todas maneras.

Corolario I.1.1 Rn provisto de una norma es un espacio de Banach.

Corolario I.1.2 Si E es un espacio vectorial normado de dimensión finita, entonces E es un espacio de


Banach.

Demostración.- Sea {d1 , . . . , dn } una base de E. La aplicación

ϕ : Rn −→ E
n
P
x →
7 xi di
i=1

es un isomorfismo de espacios vectoriales. Un ejercicio que se deja al estudiante, mostrará que si k·k es una
norma sobre Rn , la aplicación k·k◦ϕ−1 es una norma sobre E y que si k·k es una norma sobre E, la aplicación
k·k ◦ ϕ es una norma sobre Rn ; que una es la inversa de la otra. De donde existe una biyección entre los
conjuntos de las normas de Rn y E, con lo que se asegura la completitud de E para una norma dada.

Cuando los espacios vectoriales son de dimensión infinita, existen normas que no son equivalentes. La pro-
posición I.1.6 nos muestra que la norma kcdotk∞ , no es equivalente, ni con kcdotk1 , ni con la norma kcdotk2 .
A continuacion repasamos algunas de las definiciones, vistas en Rn que se generalizan a espacios normados.
I.1. ESPACIOS DE BANACH 5

Definición I.1.7 Sea E un espacio normado, una bola de centro a y radio r > 0, es el conjunto

Br (a) = {x ∈ E| kx − ak < r}.

Un conjunto V ⊂ E es un vecindario de a ∈ E, si existe  > 0 tal que B (a) ⊂ V .


Un conjunto U ⊂ V es abierto, si U es vecindario de cada uno de sus elementos; es decir si

∀x ∈ U, ∃ > 0 B (x) ⊂ E.

Un conjunto A ⊂ E es cerrado, si el lı́mite de cada sucesión convergente {xn } con xn ∈ A, pertenece a A.


Un conjunto K ⊂ E es compacto, si cada {xn } con xn ∈ K admite una subsucesión que converge hacia un
elemento de K.
Dejamos como ejercicio, el repaso de las otras definiciones para R y Rn vistas en el Primer Año de Análisis.
Remarca I.1.2 Se tiene:
1. Las nociones de abierto, cerrado, vecindario, compacto, adherencia, interior, punto de acumulación,
etc, son invariantes para normas equivalentes.
2. La mayorı́a de los resultados obtenidos para Rn son ciertos, si se remplaza Rn por E espacio de Banach.
Hay que fijarse que en las demostraciones no intervenga la dimensión. Sin embargo, otras propiedades
se pierden, si se remplaza Rn por un espacio de Banach, por ejemplo:
• La bola cerrada {x ∈ E| kxk ≤ 1} no es necesariamente compacta.
• El teorema de Bolzano-Weirstraß“cada sucesión acotada posee una subsucesión convergente” no
es cierto.
• La caracterización “K compacto ⇐⇒ K cerrado y acotado” no es válida.

Ejemplo I.1.1 Consideremos B(R) el conjunto de las funciones acotadas sobre R, con la norma k·k∞ . Sea
fn ∈ B(R), definida por 
1 si t = n,
fn (t) =
0 si t 6= 0,
Se tiene, para todo n, que kfn k = 1 y si n 6= m, kfn − fm k = 1. Por lo tanto, la sucesión es acotada.
Una verificación inmediata nos conduce a que ninguna subsucesión puede ser de Cauchy, por lo que {fn }
no admite sucesiones convergentes. Con este ejemplo, confirmamos la valides de los hechos expuestos en la
remarca precedente.

Continuidad
Las nociones de lı́mite y continuidad de aplicaciones f : U ⊂ E → F , donde E y F son espacios normados
se generalizan a partir de las aplicaciones de Rn y Rm . Por ejemplo.

Definición I.1.8 Sean E y F dos espacios de Banach y U ⊂ E. Una función f : U → F es continua en


x0 ∈ U si ∀ > 0, ∃δ > 0 tal que

x ∈ U y kx − x0 k < δ ⇒ kf (x) − f (x0 )k < .

I.1.1. Ejercicios
p
1. Mostrar que la aplicación N : R2 → R dada por N (x) = x21 − x1 x2 + x22 , define una norma sobre R2
y mostrar (explı́citamente) que esta norma es equivalente a la norma k·k∞ .
2. Mostrar que si h , i : E × E → R es un producto
p escalar sobre el espacio vectorial real E, entonces la
aplicación N : E → R dada por N (x) = hx, xi es una norma sobre E.
6 CAPÍTULO I. CÁLCULO DIFERENCIAL EN ESPACIOS DE BANACH

3. Sea E un espacio vectorial real. Mostrar que una norma k k proviene de un producto escalar sobre E,
si y solamente si, para todo x, y ∈ E se tiene

kx + yk + kx − yk = 2(kxk + kyk) (identidad del paralelogramo).

4. A un espacio E de Banach se lo llama espacio de Hilbert, si la norma del espacio E proviene de un


producto escalar. Mostrar mediante contraejemplos que Rn dotados de la normas k·k1 y k·k∞ no es un
espacio de Hilbert.

5. Se considera los subconjuntos de R2 siguientes:

A = {(x, y) ∈ R2 | 0 < x + y ≤ 1}
B = {(x, y) ∈ R2 | máx(|x| , |y|) < 3}
C = {(x, y) ∈ R2 | (x2 + y 2 )2 − 2x2 + 2y 2 = 0}
D = {(x, y) ∈ R2 | y = 0, x ∈ {1/n| n = 1, 2, . . .}}.

¿Qué conjuntos son abiertos, cerrados, acotados, compactos? Justificar.

6. Sea C([0, 1]) el conjunto de las funciones continuas de dominio [0, 1]. Mostrar que C([0, 1]) es un espacio
vectorial real para la adición de funciones y la multiplicación por escalar.
Mostrar que kf k1 y kf k2 definidas por
Z 1 Z 1 1/2
kf k1 = |f (t)| dt, kf k2 = (f (t))2 dt
0 0

son normas sobre C([0, 1]).

7. Demostrar que, pra un conjunto arbitrario no vacio A,

B(A) = {f : A → R| f es acotada} con kf k∞ = sup |f (t)| ,


t∈A

es un espacio de Banach.

I.2. Aplicaciones Lineales


En el curso de Algebra Lineal Avanzada, se ha estudiado en profundidad las aplicaciones lineales desde
un punto de vista algebraico. En esta sección agregaremos el concepto de continuidad a estas aplicaciones
lineales. A continuación, el teorema que caracteriza las aplicaciones lineales continuas.

Teorema I.2.1 Para una aplicación lineal A : E → f , E y F son espacios vectoriales normados, las
condiciones siguientes son equivalentes:

a) A es continua en 0 ∈ E.

b) A es continua en todo punto de E.

c) Existe C > 0 tal que ∀x ∈ E, kA(x)k ≤ C kxk.

Demostración.- La implicación (b) ⇒ (a) es obvia. Mostremos (a) ⇒ (b). Sea x ∈ E, como A es continua
en el origen, ∀ > 0, ∃δ > 0 tal que

z ∈ E y kzk < δ ⇒ kA(z)k < .

Planteando z = y − x, se tiene ky − xk < δ implica

 > kA(y − x)k = kA(y) − A(x)k .


I.2. APLICACIONES LINEALES 7

Mostremos (a) ⇒ (c). A es continua en O, de donde existe δ(1) > 0 tal que

kxk < δ(1) ⇒ ka(x)k < 1.

Por lo tanto, si x 6= 0, se tiene



2 kxk δ(1) 2 kxk δ(1) 2
ka(x)k = a(
x) =
a( x) < kxk .
2δ(1) kxk δ(1) 2 kxk δ(1)
Tomando C = 2/δ(1), se tiene el punto (c), x = 0 es evidente.
(c) ⇒ (a). Para  > 0 dado, tomar

δ= .
C

En los espacios de dimensión infinita, es usual llamar a una aplicación lineal operador lineal. Es frecuente
también, escribir Ax, en lugar de A(x) y si A es continua, por la propiedad (c) del teorema que acabamos
de demostrar, se dice que A es una aplicación lineal acotada.
Recordando el curso de Algebra Lineal, una aplicación lineal A de Rn en Rm se representa por una matriz,
que también es denotada por la misma letra A. Por lo tanto, la expresión Ax puede ser interpretada como
el valor de la aplicación A en el punto x, o bien como el producto de la matriz A con el vector x.
Proposición I.2.1 Sean E y F espacios normados, E de dimensión finita. Entonces toda aplicación lineal
A : E → F es continua.

Demostración.- Utilizaremos el punto (c) del teorema I.2.1. Sea {e1 , . . . , em } una base de E, por lo tanto

X m X m X m
kA(x)k = A( xi ei ) = xi A(ei ) ≤ |xi | kA(ei )k .


i=1 i=1 i=1

Denotanto M = máx kA(ei )k, la desigualdad de Cauchy y la equivalencia de normas en espacios finito
1≤i≤m
dimensionales, se obtiene
m
X √ √
kA(x)k ≤ M |xi | ≤ M n kxk2 ≤ ( nM C 0 ) kxk .
i=1

Corolario I.2.1 Todas las aplicaciones lineales A de Rn en Rm son continuas.

Cuando la dimensión del espacio dominio es no finita, pueden existir operadores lineales no continuos.
Ejemplo I.2.1 Consideremos C 1 ([0, 1]) el espacio vectorial de las funciones continuamente derivables sobre
[0, 1] provisto de la norma kf k = máx |f (t)|. El operador lineal
t∈[0,1]

D : C 1 ([0, 1]) −→ R
f 7→ f 0 (0)

no es continuo. En efecto, tomando fn (t) = sin(nt), se tiene por un lado kfn k = 1 y por el otro Df = n, con
lo que el punto (c) del teorema I.2.1 no se cumple.
En el curso de Algebra Lineal se utiliza Hom(E, F ) para referirse del espacio de las aplicaciones lineales de E
en F . En lugar de Hom(E, F ) es frecuente utilizar L(E, F ) y L(E) cuando E = F . Como estamos siguiendo
un curso de Análisis, nos interesa las aplicaciones lineales continuas, utilizaremos la notación L(E, F ) para
referirnos al conjunto de las aplicaciones lineales de E y F espacios normados y L(E) para el conjunto de
las aplicaciones lineales de E en E.
Obviamente se tiene ∅ = 6 L(E, F ) ⊂ L(E, F ). La aplicación lineal nula siempre es continua. Dejamos
como ejercicio la verificación de la:
8 CAPÍTULO I. CÁLCULO DIFERENCIAL EN ESPACIOS DE BANACH

Proposición I.2.2 L(E, F ) es un subespacio vectorial de L(E, F ).

El siguiente paso es dotar de una norma conveniente a L(E, F ) que refleje la caracterı́stica de aplicacion
lineal de los elementos de este espacio vectorial.

Definición I.2.1 Sean E y F espacios normados. Sea A ∈ L(E, F ) aplicación lineal continua, se define

kAxk
kAk = sup kxk = 1 kAxk = sup . (I.2.1)
x6=0 kxk

Esta definición significa que kAk es el número real más pequeño tal que

kAxk ≤ kAk · kxk . (I.2.2)

La desigualdad (I.2.2) es fundamental para todos los cálculos relacionados con las aplicaciones lineales.

Proposición I.2.3 El espacio L(E, F ) dotado de (I.2.1) es un espacio vectorial normado. Si F es completo,
entonces L(E, F ) es también un espacio completo.

Demostración.- Las propiedades de positividad y homogeneidad de una norma son faciles de mostrar.
Veamos la desigualdad del triángulo. Para A, B ∈ L(E, F ), se tiene

k(A + B)xk ≤ kAxk + kBxk ≤ (kAk + kBk) kxk .

Dividiendo esta relación por kxk, tomando el supremo, se obtiene la desigualdad del triángulo kA + Bk ≤
kAk + kBk.
Ahora mostremos la completitud del espacio. Supongamos F completo. Sea {An } una sucesión de Cauchy
en L(E, F ). Consideremos x ∈ E, la sucesión {An x} es una sucesión en F . Veamos que es una sucesión de
Cauchy, se tiene
kAn x − Am xk = k(An − Am )xk ≤ kxk kAn − Am k → O
cuando n, m → ∞. Como F es completo, denotemos Ax el lı́mite de la sucesión {An x}. Por consiguiente,
hemos obtenido una aplicación
A:E →F
x 7→ lı́mn→∞ An x
Esta aplicación es lineal, verificación dejada como ejercicio. Solamente nos falta mostrar que lı́mn→∞ An = A
en L(E, F ). Sea  > 0, sea x ∈ E con kxk = 1, como An es una sucesión de Cauchy, existe N ∈ N tal que

1
n, m ≥ N ⇒ kAn x − Am xk ≤ kAn − Am k < .
2
Como An x → Ax, cuando n → ∞, existe M (x) tal que

1
m ≥ M (x) ⇒ ∞ kAx − Am xk < .
3
Por lo tanto tomando m ≥ máx N, M (x) y n ≥ N , se tiene

kAn x − Axk 5
≤ kAn x − Am xk + Am x − An x ≤ .
kxk 6

Por lo tanto kAn − Ak → 0, cuando n → ∞.

Proposición I.2.4 Sea I ∈ L(E) y consideremos las aplicaciones lineales A ∈ L(E, F ) y B ∈ L(F, G).
Entonces se tiene
kIk = 1, kABk ≤ kAk · kBk . (I.2.3)
I.2. APLICACIONES LINEALES 9

Demostración.- La propiedad kIk = 1 es evidente, pero hay que tener cuidado en utilizar la misma norma
en E. Para demostrar la estimación de kABk aplicamos dos veces la desigualdad fundamental (I.2.2),

k(AB)xk ≤ kAk · kBxk ≤ kAk · kBk · kxk .

Enseguida, se divide esta relación por kxk y tomamos el supremo para x 6= 0.




Proposición I.2.5 Sea A una matriz m × n; es decir, A ∈ L(Rn , Rm )y notemos por

kAxkp
kAkp = sup ,
kxk=1 kxkp

la expresión (I.2.1) si se utiliza la misma norma en los dos espacios Rn y Rm . Entonces, se tiene las fórmulas
explı́citas:
m
!
X
kAk1 = máx |aij | , (I.2.4)
j=1,...,n
i=1
 
n
X
kAk∞ = máx  |aij | , (I.2.5)
i=1,...,m
j=1
p
kAk2 = valor propio más grande de At A. (I.2.6)

Demostración.- Para la norma kxk1 . Se tiene


! !
m X
n m Xn n m m

X X X X X
kAxk1 = aij xj ≤ |aij | · |xj | = |aij | |xj | ≤ máx |aij | · kxk1 .
j=1,...,n
i=1 j=1
i=1 j=1 j=1 i=1 i=1
P P P
Deducimos que kAk1 ≤ máx( |aij |. Para mostrar la igualdad, se elige un j0 con máx( |aij | = |aij0 |.
j i j i i
Tomamos x = ej0 el j0 -simo vector de la base canónica, con
P la elección de este x se tiene igualdad, lo que
demuestra que kAk1 no puede ser más pequeño que máx( |aij |. La fórmula para kxk∞ se la demuestra de
j i
la misma manera.
Ahora mostremos para la norma euclidiana. La matriz At A es simétrica y semi definida positiva
t t 2
(x A Ax = kAxk2 ≥ 0), por consiguiente existe una base ortonormada de vectores propios y los valores
propios {λ1 , . . . , λn } respectivos son reales no +negativos. Denotamos por {d1 , . . . , dn } los elementos de esta
base ortonormada. Se tiene v
u n
2
uX
kAxk2 = t λ2i x2i ≤ máx λi kxk2 .
i
i=1

Para obtener igualdad, se plantea x igual al vector propio de la base ortnormada asociado al valor propio
más grande.


Ejemplo I.2.2 Para la matriz  


4 3
A =  −2 5
4 1
se tiene
kAk1 = máx{10, 9} = 10
kAk2 ≈ 6,4437,
kAk∞ = máx{7, 7, 5} = 7.
10 CAPÍTULO I. CÁLCULO DIFERENCIAL EN ESPACIOS DE BANACH

Ejemplo I.2.3 Sea k : [0, 1] × [0, 1] → R una función continua a dos variables. Consideramos el operador
lineal A : C([0, 1]) → C([0, 1]), dado por
Z 1
(Af )(t) = k(t, s)f (s) ds,
0

y las normas de la proposición I.1.6, se tiene


R1
kAk1 = máxs∈[0,1] 0 |k(t, s)| dt,
R1
kAk∞ =qmáxt∈[0,1] 0 |k(t, s)| ds,
R1R1 2
kAk2 ≤ 0 0
|k(t, s)| ds dt.

Ejercicio.- Mostrar los resultados del ejemplo (I.2.3)

Proposición I.2.6 Sea E un espacio de Banach y supongamos que el operador A ∈ L(E) satisface kAk ≤ 1.
Entonces I − A es inversible, (I − A)−1 es continua y se tiene

(I − A)−1 = I + A + A2 + A3 + · · · (I.2.7)

Demostración.- Mostremos primero que

An = I + A + A2 + · · · + An
n
es una sucesión de Cauchy en L(E). Utilizando kAn k ≤ kAk , se obtiene para m > n
n+1
n+1 m kAk
kAn − Am k = An+1 + · · · + Am ≤ An+1 + · · · + kAm k ≤ kAk

+ · · · + kAk ≤ .
1 − kAk

Como E es completo, entonces L(E) también es completo. Por lo tanto, {An } es una sucesión convergente,
cuyo lı́mite denotémosle por B.
Ahora bien, pasando al lı́mite cuando n → ∞ en la identidad An (I − A) = (I − A)An = I − An+1 se
obtiene que B(I − A) = (I − A)B = I lo que demuestra la inversibilidad de (I − A) en L(E).

I.2.1. Ejercicios
1. Sea E un espacio de Hilbert y sea A ∈ L(E). Mostrar que

hu, Avi
kAk = sup
u6=0,v6=0 kuk · kvk

donde h·, ·i es el producto escalar y k·k es la norma inducida por el producto escalar.

2. El radio espectral ρ(A) de una matriz n × n, A, está definido por:

ρ(A) = máx{|λ| | λ valor propio de A}

Sea E = Rn provisto de una norma y sea A ∈ L(E). Mostrar que para toda norma sobre Rn se tiene
la desigualdad siguiente
kAk ≥ ρ(A)
y que si A es simétrica se tiene la igualdad kAk2 = ρ(A).

3. Sea  
0,999 1000
A= .
0 0,999
I.3. DIFERENCIABILIDAD EN LOS ESPACIOS NORMADOS 11

(a) Calcular el radio espectral ρ(A), ası́ como kAk1 , kAk2 y kAk∞ .
(b) Encontrar una norma k·k sobre R2 tal que para esta norma, se tenga kAk ≤ 1.

4. Consideremos el conjunto de las matrices n × n, que identificamos con Rn·n y que se le dota de la
norma kAk = supkxk≤1 kAxk. Sea l : Rn·n → Rn·n la aplicación lineal dada por l(H) = X0 H + HX0
donde X0 es una matriz fija. Calcular la norma de la aplicación l.

5. En el marco del ejemplo I.2.3 demostrar que


Z 1
kAk∞ = máx |k(t, s)| ds.
t∈[0,1] 0

Indicación.- Considerar primero que la función k(t, s) posee un número finito de ceros.

6. Consideremos la ecuación integral siguiente, llamada ecuación integral de Fredholm (segunda especie):
Z 1
y(t) = f (t) + k(t, s)y(s) ds, (I.2.8)
0

donde f ∈ C([0, 1]) y k ∈ C([0, 1] × [0, 1]) son datos e y es la incógnita. Se supone que
Z 1
máx |k(t, s)| ds < 1.
t∈[0,1] 0

(a) Demostrar que (I.2.8) posee una única solución en C([0, 1]).
(b) Utilizando la serie de Neumann, escribir la solución bajo la forma
Z 1
y(t) = f (t) + r(t, s)f (s) ds.
0

7. Resolver Z 1
1
y(t) = f (t) + et−2 y(s) ds (I.2.9)
2 0
R1
(a) Se plantea a ≡ 0 e−s y(s) ds. Multiplicando (I.2.9) por e−t e integrando, se encuentra a y por lo
tanto la solución y(t) = f (t) + aet /2.
(b) Utilizando la fórmula del ejercicio precedente.

I.3. Diferenciabilidad en los Espacios Normados


En el curso de Primer Año de Análisis, se dio la definicion de diferenciabilidad de una aplicación de Rn en
Rm . Esta misma definición puede ser generalizada a espacios normados.

Definición I.3.1 Sean E, F dos espacios vectoriales normados y U ⊂ E un abierto. Se dice que f : U → F
es diferenciable en a ∈ U , si existe una aplicación lineal continua f 0 (a) ∈ L(E, F ) tal que

f (x) = f (a) + f 0 (x)(x − a) + r(x) kx − ak , (I.3.1)

donde la función r : U → F safisface r(x) → 0 cuando x → a.

Remarca I.3.1 Respecto a la definicón para las funciones de Rn en Rm se exige que f 0 (a) sea continua. Esto
es importante, porque sino un función diferenciable podrı́a no ser continua. En el caso finito dimensional,
esta hipótesis está demás porque todas las aplicaciones lineales son continuas.
12 CAPÍTULO I. CÁLCULO DIFERENCIAL EN ESPACIOS DE BANACH

Ejemplo I.3.1 Sean E = R3 , F = R2 y f : E → F dada por


   2 
f1 (x1 , x2 , x3 ) x1 + x22 + x23
f (x) = = .
f1 (x1 , x2 , x3 ) x1 x2 x3

La derivada en el punto a = (a1 , a2 , a3 ) es la aplicación lineal f 0 (a) ∈ L(R3 , R2 ), cuya matriz es


 
2a1 2a2 2a3
f 0 (a) = .
a2 a3 a1 a3 a1 a2

Se verifica facilmenten que la aplicación r(x) de (I.3.1) satisface r(x) → 0 si x → 0. Como todas las normas
son equivalentes en Rn y Rm no es necesario precisar la norma con la cual se trabaja.

Ejemplo I.3.2 En el ejemplo precedente se dio la matriz de la derivada de la función. Consideremos E =


L(Rn ), como espacio vectorial E es de dimensión n × n. Sea f : E → E dada por f (X) = X 2 . Se tiene

f (A + H) = (A + H)2 = A2 + AH + HA + H 2 ,

deducimos que f 0 (A) es la aplicación lineal f (A)H = AH + HA.

Ejemplo I.3.3 Consideremos el espacio C([0, 1]) con la norma k·k∞ , denotemos sus elementos por x(t) o
a(t) y estudiemos la aplicación f : C([0, 1]) → C([0, 1]),
Z 1
f (x)(t) = k(t, s)g(x(s)) ds,
0

donde k : [0, 1] × [0, 1] → R es continua y g : R → R es 2 veces continuamente diferenciable. Para una función
a ∈ C([0, 1]) dada, busquemos la derivada f 0 (a). Con h ∈ C([0, 1]), se tiene:
Z 1
(f (a + h) − f (a))(t) = k(t, s)(g(a(s) + h(s)) − g(a(s)))ds
0
Z 1
1
= k(t, s)(g 0 (a(s))h(s) + g 00 (α(s)h(s)))h(s) ds,
0 2

donde α(s) es un valor entre a(s) y a(s)+h(s). Este cálculo muestra que la aplicación lineal f 0 (a) : C([0, 1]) →
C([0, 1]), definida por
Z 1
(f 0 (a)h)(t) = k(t, s)g 0 (a(s))h(s) ds,
0

es una buena candidata para la derivada de f . Esta aplicación es continua, ver ejemplo de la sección pre-
2
cedente. Además el resto kf (a + h) − f (a) − f 0 (a)hk∞ puede ser estimado por C khk∞ , por que g 00 (x) es
acotada sobre el intervalo que contiene a(s) y a(s) + h(s) para todo s ∈ [0, 1] y todo h con khk∞ ≤ 1

Definición I.3.2 Una aplicación A : E → F , donde E y F son espacios vectoriales normados es un


isomorfismo, si A es lineal, biyectiva, continua y si A−1 es continua.
Se denota
GL(E, F ) = {A ∈ L(E, F )|A es un isomorfismo}.
Para F = E, se escribe también GL(E) en lugar de GL(E, E).

Proposición I.3.1 Sea E un espacio de Banach. La aplicación f (X) = X −1 de GL(E) en L(E) es dife-
renciable y se tiene
f 0 (A)H = −A−1 HA−1 . (I.3.2)

Demostración.- La continuidad de f 0 (A) es una consecuencia de


2
kf 0 (A)Hk ≤ A−1 kHk .

I.3. DIFERENCIABILIDAD EN LOS ESPACIOS NORMADOS 13

El resto
X
f (A + H) − f (A) − f 0 (A)H = ((I + A−1 H)−1 − I + A−1 H)A−1 = (−A−1 H)j A−1
j≥2

2 3
puede ser estimado por kHk A−1 /(1 − A−1 − H ). Dividido por kHk, este resto tiende a 0 cuando
kHk → 0.

Para dos espacios vectoriales normados E1 y E2 , de normas respectivas k·kE1 y k·kE2 ; consideremos el espacio
producto E1 × E2 . Si al espacio producto se le dota de la norma

k(x1 , x2 )k = máx{kx1 kE1 , kx2 kE2 }, (I.3.3)

se obtiene un espacio vectorial normado.

Proposición I.3.2 El espacio producto E1 × E2 dotado de la norma (I.3.3) es un espacio de Banach, si y


solamente si E1 y E2 son espacios de Banach.

Demostración.- Ejercicio.

Definición I.3.3 Una aplicación bilineal B : E1 ×E2 → F es una aplicación bilineal acotada, si exite M > 0
tal que
kB(x1 , x2 )k ≤ M · kx1 kE1 · kx2 kE2 , ∀(x1 , x2 ) ∈ E1 × E2 . (I.3.4)

Proposición I.3.3 Una B : E1 × E2 → F bilineal acotada es diferenciable y su derivada está dada por

B 0 (a1 , a2 )(h1 , h2 ) = B(a1 , h2 ) + B(h1 , a2 ). (I.3.5)

Demostración.- La continuidad de B 0 (a1 , a2 ) resulta de

kB 0 (a1 , a2 )(h1 , h2 )k = kB(a1 , h2 ) + B(h1 , a2 )k


≤ kB(a1 , h2 )k + kB(h1 , a2 )k
≤ M (ka1 kE1 kh2 kE2 + kh1 kE1 ka2 kE2 )
≤ 2 · M k(a1 , a2 )k k(h1 , h2 )k .

La diferenciabilidad de B es una consecuencia de

B(a1 + h1 , a2 + h2 ) − B(a1 , a2 ) − B 0 (a1 , a2 )(h1 , h2 ) = B(h1 , h2 ),

porque

2
kB(h1 , h2 )k ≤ M ka1 kE1 kh2 kE2 ≤ M k(h1 , h2 )k .

Proposición I.3.4 Sean f, g : U → F , U abierto de E, diferenciables en a ∈ U , y sea λ ∈ R. Entonces, se


tiene
(f + g)0 (a) = f 0 (a) + g 0 (a), (λf )0 (a) = λf 0 (a). (I.3.6)

Demostración.- Ejercicio.


14 CAPÍTULO I. CÁLCULO DIFERENCIAL EN ESPACIOS DE BANACH

Proposición I.3.5 Sean E, F, G tres espacios vectoriales normados. Sean U abierto de E, V abierto de F .
Se considera dos aplicaciones, f : U → V diferenciable en a ∈ U y g : V → G diferenciable en f (a) ∈ V .
Entonces g ◦ f es diferenciable en a y se tiene

(g ◦ a)0 (a) = g 0 (f (a)) ◦ f 0 (a). (I.3.7)

Demostración.- Ejercicio.

Proposición I.3.6 (Fórmula de Leibniz) Sean E, F1 , F2 , F espacios vectoriales normados, U abierto


de E, f : U → F1 y g : U → F2 aplicaciones diferenciables en a ∈ U , y B : F1 × F2 → G una aplicación
bilineal acotada. Entonces la aplicación p(x) = B(f (x), g(x)) es diferenciable y se tiene

p0 (x)h = B(f (a), g 0 (a)h) + B(f 0 (a)h, g(a)). (I.3.8)

Demostración.- Consecuencia de las proposiciones sobre la diferenciabilidad de la aplicación bilineal aco-


tada y la composición de aplicaciones, por que p = B ◦ d donde

d(x) = (f (x), g(x)) con derivada d0 (x)h = (f 0 (x)h, g 0 (x)h).

I.3.1. Ejercicios
1. Sea E un espacio de Banach, consideramos la aplicación f : C(E) → C(E) dada por f (X) = X 3 .
Calcular la derivada de f . Mostrar con ejemplos que en general, f 0 (X) 6= 3X 2 .

2. Sea E un espacio de Banach, se considera la aplicación exp : C(E) → C(E) dada por la serie siguiente:

X 1 n
exp(X) = X .
n=0
n!

(a) Mostrar que la aplicación exp está bien definida.


(b) Calcular la derivada, exp0 de la aplicación exp.
(c) Mostrar con ejemplos que en general exp0 (X) 6= exp(X).

Indicación.- Si le ayuda, suponer que E = Rn .

3. Calcular la derivada de la función f : GL(Rn ) → L(Rn ) dada por f (X) = (X t X)−1 .

4. Sea A : R → Mn,n (R) una función diferenciable con valores en las matrices de n × n. Mostrar que

d −1
A(x) = −A(x)−1 A0 (x)A(x)−1 .
dx

5. (a) Sea M : E1 ×· · ·×En → F una aplicación multilineal donde E1 , . . . , En , F son espacios vectoriales
normados. Calcular la derivada de M .
(b) Sea A : R → M3,3 (R) una función matricial, cuyas columnas son A1 (x), A2 (x) y A3 (x). Mostrar
que
d
det(A(x)) = det(A01 , A2 , A3 ) + det(A1 , A02 , A3 ) + det(A1 , A2 , A03 ).
dx

6. Sea f (x, y) = ln(x2 +y 2 ) para x2 +y 2 > 0 y g(x, y) = (xy, x/y)t para x > 0, y > 0. Calcular la derivada
de h(x, y) = (f ◦ g)(x, y) = ln(x2 y 2 + x/y 2 ) directamente y luego con la fórmula de diferenciación de
funciones compuestas.
I.4. TEOREMA DE LOS INCREMENTOS FINITOS 15

I.4. Teorema de los Incrementos Finitos


Para una función f : [a, b] → R, el teorema de los incrementos finitos, (o teorema de Lagrange) afirma que
existe un ξ ∈ (a, b) tal que
f (b) − f (a) = f 0 (ξ)(b − a)
si f es continua sobre [a, b] y diferenciable sobre (a, b).
Para una función f : [a, b] → Rm , la afirmación del teorema ya no es cierta. Un contra ejemplo es
la función f (x) = (cos x, sin x) y [a, b] = [0, 2π]. Se tiene que f (a) = f (b), sin embargo, no existe ξ con
f 0 (ξ) = (0, 0). Pero, se ve que la desigualdad

kf (b) − f (a)k ≤ kf 0 (ξ)k · kb − ak .

En un primer teorema, consideraremos las funciones f : [a, b] → F donde F es un espacio vectorial


normado. Enseguida, extenderemos el resultado a funciones f : U → F , donde U ⊂ E y E es otro espacio
vectorial normado
Teorema I.4.1 Sean a < b dos números reales, F un espacio vectorial normado, f : [a, b] → F y g : [a, b] →
R dos aplicaciones continuas sobre [a, b] y diferenciables sobre (a, b). Supongamos que kf 0 (t)k ≤ g 0 (t) para
a < t < b. Entonces
kf (b) − f (a)k ≤ g(b) − g(a).

Demostración.- Para un  > 0 dado, consideremos la desigualdad

kf (t) − f (a)k ≤ g(t) − g(a) + (t − a) + . (I.4.1)

Esta desigualdad se cumple estrictamente para t = a, por la continuidad de f y g, en un vecindario de a.


Por lo tanto, el supremo
c = sup{t ∈ [a, b]| (I.4.1) se cumple }
existe y se tiene que c > a.
Mostremos que la desigualdad se cumple para c. Por definición del supremo, existe una sucesión {tn },
tn → c, tal que
kf (tn ) − f (a)k ≤ g(tn ) − g(a) + (tn − a) + . (I.4.2)
Pasando al lı́mite n → ∞, la continuidad de f y g aseguaran la desigualdad (I.4.1) para t = c.
Supongamos que c < b. La diferenciabilidad de f y g en el punto c implica la existencia de un η > 0 tal
que
kf (t) − f (c)k ≤ kf 0 (c)k (t − c) + 2 (t − c),
g(t) − g(c) ≥ g 0 (c)(t − c) − 2 (t − c)
para todo t ∈ [c, c + η]. La hipótesis kf 0 (c)k ≤ g 0 (c) implica entonces que

kf (t) − f (c)k ≤ g 0 (c)(t − c) + (t − c) ≤ g(t) − g(c) + (t − c).
2
Esto, con la desigualdad (I.4.1) para t = c, conduce a

kf (t) − f (a)k ≤ kf (t) − f (c)k + kf (c) − f (a)k


≤ g(t) − g(c) + (t − c) + g(c) − g(a) + (c − a) + 
≤ g(t) − g(a) + (t − a) + 

para todo t ∈ [c, c + η], lo que contradice la definición de c. Entonces, se tiene necesariamente c = b. Si se
deja tender  hacia 0 en (I.4.1) con t = b, se obtiene la afirmación del teorema.

Consideremos la situación en la que f está definida sobre un abierto U de un espacio vectorial normado E,
que sea necesariamente R. Para a, b ∈ E, se llama segmento de extremidades a y b al conjunto de los puntos
x ∈ E que son de la forma x = a + t(b − a) con 0 ≤ t ≤ 1.
16 CAPÍTULO I. CÁLCULO DIFERENCIAL EN ESPACIOS DE BANACH

Teorema I.4.2 (Teorema de los Incrementos Finitos) Sean E, F espacios vectoriales normados y U ⊂
E abierto. Si f : U → F es diferenciable en U , y si el segemento de extremidades a y b está contenido en U ,
se tiene
kf (b) − f (a)k ≤ sup kf 0 (a + t(b − a))k · kb − ak . (I.4.3)
0<t<1

Demostración.- La aplicación h(t) = f (t + a(b − a)) es una aplicación diferenciable de [0, 1] en F y se tiene
h0 (t) = f 0 (a + t(b − a))(b − a), por lo tanto

kh0 (t)k ≤ kf 0 (a + t(b − a))k · kb − ak .

Suficiente aplicar el teorema I.4.1, remplazando a por 0, b por 1, f por h y g(t) por M t donde M =
sup kf 0 (a + t(b − a))k · kb − ak.
0<t<1

Se dice que un conjunto D de un espacio vectorial es convexo si, cuales sean a, b ∈ D, le segmento de
extremidades a y b está contenido en D.

Corolario I.4.1 Sean E, F espacios vectoriales normados, U ⊂ E abierto, f : U → F diferenciable, y


D ⊂ U convexo. Entonces,
kf (x) − f (y)k ≤ sup kf 0 (z)k · kx − yk
z∈D

para x, y ∈ D.

Demostración.- Consecuencia inmediata del teorema I.4.2.

Un abierto U de un espacio vectorial normado se dice conexo, si dos puntos cualesquiera de U pueden
ser unidos mediante una lı́nea segmentada en U recordemos que una linea segmentada es la union finita de
segmentos de extremidades ai−1 y ai , i = 1, . . . , m.

Corolario I.4.2 Sean E, F espacios vectoriales normados, U un abierto conexo de E, f : U → F una


aplicación diferenciable en U . Si f 0 (x) = 0 para todo x ∈ U , entonces f es constante.

Demostración.- Fijemos a ∈ U y tomemos x ∈ U arbitrario. Como U es conexo, existe una sucesión finita
a = a0 , a1 , . . . , am = x tales que los segmentos de extremidades ai−1 y ai están contenidos en U . El teorema
I.4.2 implica
kf (ai ) − f (ai−1 )k ≤ sup kf 0 (ai−1 + t(ai − ai−1 ))k · kai − ai−1 k = 0.
0<t<1

Por lo tanto, f (ai ) = f (ai−1 ) y por consiguiente f (x) = f (a).

I.4.1. Ejercicios
1. Sea f : [a, b] → R continua, x1 , x2 , . . . , xn ∈ (a, b) y f diferenciable sobre el conjunto D = (a, b) −
{x1 , x2 , . . . , xn }. Demostrar o dar contra ejemplos de las afirmaciones siguientes:

(a) Existe un x ∈ D tal que f (b) − f (a) = f 0 (ξ)(b − a).


(b) Se tiene la estimación
|f (b) − f (a)| ≤ sup |f 0 (t)| (b − a).
t∈D
I.5. TEOREMA DEL PUNTO FIJO DE BANACH 17

I.5. Teorema del punto fijo de Banach


Consideremos el problema de resolver una ecuación no lineal en un espacio de Banach. Para las funciones f
y g de E, el problema puede ser formulado de la manera siguiente:

• g(x) = 0, se busca un cero de g, o

• f (x) = x, se busca un punto fijo de f .

Planteando f (x) = x + g(x) o f (x) = x + Ag(x), con A ∈ GL(E), se puede pasar de una formulación a la
otra. El teorema siguiente da una condición suficiente para la existencia y la unicidad de una solución a este
problema.

Teorema I.5.1 (Teorema del punto fijo de Banach, 1922.) Sean E un espacio de Banach, D ⊂ E
cerrado, y f : D → E una aplicación que satisface:

i) f (D) ⊂ D.

ii) f es una contracción sobre D; es decir, existe α < 1 tal que

kf (x) − f (y)k ≤ α kx − hk para x, y ∈ D. (I.5.1)

Entonces f posee un único punto fijo en D.

Demostración.- Mostremos primero la unicidad. Sean x, y ∈ D dos puntos fijos; es decir f (x) = x y
f (y) = y. La contractividad implica que

kx − yk = kf (x) − f (y)k ≤ α kx − yk

con α < 1 es solo posible si x = y.


Para la existencia, tomemos x0 ∈ D y consideremos la sucesión dada por xn+1 = f (xn ). La hipótesis
f (D) ⊂ D asegura que {xn } es una sucesión en D. Mostremos que {xn } es una sucesión de Cauchy. Se tiene
kxn+1 − xn k = kf (xn ) − f (xn−1 )k ≤ α kxn − xn−1 k y aplicando esta desigualdad iterativamente, se obtiene

kxn+1 − xn k ≤ αn kx1 − x0 k .

Para m > n, se deduce que

kxm − xn k kxm − xm−1 k + kxm−1 − xm−2 k + · · · + kxn+1 − xn k


≤ (αm−1 + αm−2 + · · · + αn ) kx1 − x0 k
≤ kan k 1 − α kx1 − x0 k .

Entonces, {xn } es una sucesión de Cauchy. Como E es un espacio completo, esta sucesión converge hacia
x ∈ E. Como D es cerrado x ∈ D.
La condición de contractividad, implica que f sea uniformemente continua sobre D, por lo tanto continua.
Tomando el lı́mite n → ∞ en xn+1 = f (xn ) y utilizando la continuidad de f , se obtiene x = f (x).

La demostración del teorema del punto fijo de Banach es constructiva y nos conduce al algoritmo siguiente:

Método de las aproximaciones sucesivas


Para resolver un problema x = f (x) en un espacio de Banach, este método está definido por:

• Se elige x0 arbitrariamente,

• se aplica la iteración xn+1 = f (xn ).


18 CAPÍTULO I. CÁLCULO DIFERENCIAL EN ESPACIOS DE BANACH

Bajo las hipótesis del teorema, este algoritmo converge hacia una solución única del problema. A menudo,
las hipótesis son dificiles de verificar, pero de todas maneras se puede aplicar este algoritmo. Si se tiene
convergencia, estamos seguros de haber encontrado una solución (si f es continua). Esta solución no es
necesariamente única.
Ejemplo I.5.1 Tomemos la función f (x) = cos x sobre D = [0, 1]. Esta función es una contracción, por que
|f 0 (x)| ≤ sin 1 < 1 para x ∈ D. Otro ejemplo es la función f (x) = ex /4 sobre D = [0, 1,1]. Para esta función
se tiene |f 0 (x)| = ex /4 ≤ e1,1 /4 < 1 sobre D. Las iteraciones son ilustradas en la figura I.5.1

Figura I.5.2: Método de las aproximaciones sucesivas para f (x) = cos x y f (x) = ex /4

Ejemplo I.5.2 Consideremos el sistema de dos ecuaciones no lineales a dos incognitas


x = 2 + (x2 + y 2 )/20, y = 1 − xy 3 /10.
Sin verificar las hipótesis del teorema del punto fijo de Banach, aplicamos el método iterativo con valores
iniciales x0 = 2, y0 = 1. Se obtiene entonces y se observa que la sucesión converge a la solución x = 2,3014505,

x1 2,2500000 y1 0,8000000
x2 2,2851250 y2 0,8840000
x3 2,3002333 y3 0,8417129
x4 2,2999777 y4 0,8628284

Cuadro I.1: Iteraciones sucesivas

y = 0,8557662 del sistema.


Ejemplo I.5.3 Consideramos el espacio de Banach C([0, 1]) con la norma k·k∞ y el problema a punto fijo
Z 1
y(t) = f (t) + λ k(t, s)y(s) ds,
0

donde f y k son dados y λ es tal que


Z 1
|λ| · máx |k(t, s)| ds < 1, (I.5.2)
0≤t≤1 0

ver ejemplo 3 de la sección I.3. El método de las aproximaciones sucesivas se escribe como sigue: Se toma
una aproximación inicial, por ejemplo y0 (t) = f (t) y se itera según
Z 1
yn+1 (t) = f (t) + λ k(t, s)yn (s) ds.
0

La sucesión {yn (t)} converge hacia la solución única de (I.5.2.


I.5. TEOREMA DEL PUNTO FIJO DE BANACH 19

Consideremos el problema de resolver f (x) = y para un vector dado y y busquemos resultados sobre la
existencia y la unicidad (local) de una solución; es decir, buscamos resultados sobre la biyectividad de f .
Además, nos gustarı́a saber si la solución depende continuamente del parámetro y. Esto está resumido en la
definición siguiente.
Definición I.5.1 Sean E, F espacios vectoriales normados, U ⊂ E y V ⊂ F . Una aplicación f : U → V es
un homeomorfismo de U sobre V , si f es biyectiva, continua y si la inversa f −1 : V → V es continua.

Método de Newton Simplificado


Supongamos que f (a) = b y consideremos el problema f (x) = y para un y dado, próximo a b. Sea x0 una
aproximación de la solución buscada, por ejemplo x0 = a. La idea de linealizar el problema alrededor de x0
y de resolver el problema linealizado para obtener una mejor aproximación x1 :
f (x0 ) + f 0 (x0 )(x1 − x0 ) = y ox1 = x0 − f 0 (x0 )−1 (f (x0 ) − y).
Iterando este procedimiento, se obtiene el método de Newton
xn+1 = xn − f 0 (xn )−1 (f (xn ) − y)
ver figura I.5.2. Este método puede ser interpretado como el método de las aproximaciones sucesivas aplicado
a x = g(x), donde g(x) = x − f 0 (x)−1 (f (x) − y).
En la práctica, se remplaza a menudo la derivada f 0 (xn ) por una aproximación A que no dependa de xn .
Esto simplifica el cálculo numérico y la teorı́a (estudio de convergencia, ver el teorema siguiente). Nosotros
consideraremos entonces el método de Newton Simplificado, que se escribe como xn+1 = g(xn ) donde

g(x) = x − A−1 (f (x) − y) (I.5.3)

Figura I.5.3: Método de Newton (izquierda) y método de Newton simplificado (derecha)

Proposición I.5.1 Sean E, F espacios de Banach, B = {x ∈ E| kx − ak ≤ ρ}, A : E → F un isomorfismo


y supongamos que f : B → F satisfaga
x − z − A−1 (f (x) − f (z)) ≤ α kz − zk para x, z ∈ B

(I.5.4)
con α < 1. Entonces
f es un homeomorfismo de B sobre f (B). Ademaás cada y con ky − f (a)k ≤ σ =
ρ(1 − α)/ A−1 está en f (B) y el método de Newton simplificado (con x0 = a) converge hacia la solución
de f (x) = y.

Demostración.- Mostremos primero que f : B → f (B) es un homeomorfismo. La aplicación g(x) de (I.5.3)


es una contracción sobre B para nuestra hipótesis. La continuidad de f (x) es una consecuencia de
kf (x) − f (z)k = kA(x − z) − A(g(x) − g(z))k ≤ kAk (1 + α) kx − zk .
20 CAPÍTULO I. CÁLCULO DIFERENCIAL EN ESPACIOS DE BANACH

−1
De la definición de g(x), deducimos
que
−1
x − z = g(x) − g(z) + A (f (x) − f (z)) y nosotros obtenemos la
estimación kx − zk ≤ α kx − zk + A · kf (x) − f (z)k. Se tiene por lo tanto
−1
A
kx − zk ≤ kf (x) − f (z)k para x, z ∈ B (I.5.5)
1−α
La función f : B → f (B) es sobreyectiva por definición. Por la propiedad (I.5.5) demuestra que es inyectiva
y por lo tanto biyectiva. Planteando u = f (x) y v = f (z) en (I.5.5), se obtiene

−1
f (u) − f −1 (v) ≤ A
−1
ku − vk , (I.5.6)
1−α
lo que demuestra la continuidad de f −1 sobre f (B).
Consideremos un y ∈ F con ky − f (a)k ≤ σ. Mostremos que g(B) ⊂ B. Esto proviene de g(x) − a =
x − a − A−1 (f (x) − f (a)) − A−1 (f (a) − y), porque
kg(x) − ak ≤ α kx − ak + A−1 · kf (a) − yk ≤ αρ + A−1 σ = ρ

para x ∈ B. Como B es cerrado, se puede aplicar el teorema del punto fijo de Banach. Para un tal y existe
x ∈ B satisfaciendo g(x) = x, es decir f (x) = y.


Si f (x) es diferenciable en a, el centro de la bola B, es natural elegir A = f 0 (a) a condición que A sea un
isomorfismo de espacios normados. Pero la diferenciabilidad en el punto a no garantiza que la estimación
(I.5.4) sea verificada para un α < 1. Nosotros consideraremos entonces una condición más fuerte que la
diferenciabilidad.
Definición I.5.2 Sean E y F espacios vectoriales normados, U ⊂ E abierto, a ∈ U . Se dice que f : U → F
es estrictamente diferenciable en a ∈ U si existe una aplicación lineal continua A : E → F tal que
f (x) − f (z) = A(x − z) + r(x, z) kx − zk , (I.5.7)
donde la función r : U × U → F satisface r(x, z) → 0 si (x, z) → (a, a).
Planteando z = a en (I.5.7) se tiene (I.3.1) con A = f 0 (a). De esta manera estrictamente diferenciable en
a, implica diferenciable en a. A partir de (I.5.7), se ve que una función estrictamente diferenciable en a es
continua en todo un vecindario de a.
Ejemplo I.5.4 Existe funciones que son diferenciables en a. pero no estrictamente diferenciables en a. Se
puede tomar una función que es diferenciable en a, pero que no es continua en ningún vecindario de a. Ver
Primer Año de Análisis. Otro ejemplo es la función

0 six = 0
f (x) =
x2 cos(1/x) sino.
Las sucesiones xn = 1/(2nπ) y zn = ((2n + 1)π)−1 convergen hacia 0, pero (f (xn ) − f (zn ))/(xn − zn ) =
(x2n + zn2 )/(xn − zn ) no convergen hacia f 0 (0) = 0 si n → 0.
Teorema I.5.2 Sean E, F espacios vectoriales normados U ⊂ E abierto y a ∈ U . Si f : U → F es
diferenciable en U y si la aplicación f 0 : U → L(E, F ) es continua en el punto a, entonces f es estrictamente
diferenciable en el punto a.

Demostración.- Apliquemos el teorema de los incrementos finitos a g(x) = f (x) = f 0 (a)x.


Como la derivada de g(x) es g 0 (x) = f 0 (x) − f 0 (a), se tiene
kf (x) − f (z) − f 0 (a)(x − z)k ≤ sup kf 0 (z + t(x − z)) − f 0 (a)k · kx − zk .
0<t<1
0
La continuidad de f (x) en el punto a implica que la expresión
sup kf 0 (z + t(x − z)) − f 0 (a)k
0<t<1

tiende a 0 si (x, z) → (a, a).


I.5. TEOREMA DEL PUNTO FIJO DE BANACH 21


Ejemplo I.5.5 Retomemos la función f (X) = X −1 de la proposición I.3.3, para la cual la derivada es
f 0 (X)H = −X −1 HX −1 . Mostremos que esta función es estrictamente diferenciable en GL(E). Como
f (X)
es continua en A ∈ GL(E), se tiene que para todo  > 0 existe un δ > 0 tal que X −1 − A−1 <  si
kX − Ak < δ. Escribiendo
f 0 (X)H − f 0 (A)H = −X −1 HX −1 + A−1 HA−1 = −X −1 H(X −1 − A−1 ) − (X −1 − A−1 )HA−1 ,
se obtiene
k(f 0 (X) − f 0 (A))Hk ≤ ( X −1 + A−1 ) kHk .

Se deduce
kf 0 (X) − f 0 (A)k ≤ ( X −1 + A−1 )

y por lo tanto la continuidad de f 0 (X) en el punto A. Esto nos permite aplicar el teorema precedente.
Para todas las funciones de los ejemplos de la sección I.3, se puede demostrar sin dificultad que f 0 (x) es
continua. Entonces, el teorema 6,2 implica que son estrictamente diferenciales.

I.5.1. Ejercicios
1. Consideremos la función f : R → R definida por
x + e−x/2

si x ≥ 0
f (x) = .
ex/2 si x < 0
(a) Mostrar que |f (x) − f (y)| < |x − y| para x 6= y.
(b) Mostrar que la función f (x) no posee puntos fijos.
¿Hay una contradicción con el teorema del punto fijo?
2. Se considera C([0, 1]) con la norma k·k∞ y la aplicación f : C([0, 1]) → C([0, 1]) dada por
Z 1
f (x)(t) = λ k(t, s)g(x(s))ds
0

donde k ∈ C([0, 1] × [0, 1]) y g : R → R lo suficientemente diferenciablel. Encontrar una condición sobre
λ bajo la cual f es una contracción sobre el cerrado
D = {x ∈ C([0, 1])| kxk∞ ≤ 1}.

3. Mostrar que la hipótesis “D cerrado” no puede, en general, ser omitida en el teorema del punto fijo
de Banach: encontrar un D no cerrado y una aplicación f : D → E tales que f (D) ⊂ D y f es una
contracción sobre D, pero que f no posee un punto fijo en D.
4. Sea U un abierto conexo de R y E un espacio vectorial normado. Sea f : U → E una aplicación que
satisface
2
kf (x) − f (y)k ≤ C kx − yk para todo x, y ∈ U,
donde C > 0. Mostrar que f es constante sobre U .
5. Sea la función f : R2 → R3 dada por
 
x21 + x22 + 5
f (x1 , x2 ) =  3x1 x2 + 2 
x31 + x32

y sea K = {(x1 , x2 ) ∈ R2 | |x1 | ≤ 1, |x2 | ≤ 2}. Encontrar una constante L tal que
kf (x) − f (y)k∞ ≤ L kx − yk∞ para x, y ∈ K.
L se llama constante de Lipschitz.
22 CAPÍTULO I. CÁLCULO DIFERENCIAL EN ESPACIOS DE BANACH

6. Sea A ∈ L(E) con kAk < 1 y consideremos el problema

x = Ax + b.

Mostrar que la k-sima aproximación xk , obtenida por el método de las aproximaciones sucesivas con
(x0 = b) es igual a la aproximación obtenida al truncar la serie de Neumann para (I − A)−1 después
de k términos. Encontrar ası́ una conexión entre el ejercicio 6 de la sección I.2 y el ejemplo I.5.3.

7. Estimación del error para el método de las aproximaciones sucesivas. Sea x∗ un punto fijo dado por
este método. Demostrar
α
kx∗ − xk k ≤ kxk − xk−1 k . (I.5.5)
1−α
Para las funciones del ejemplo I.5.2, efectuar algunas iteraciones y utilizar (I.5.5) para obtener una
estimación rigurosa del error.

8. Sean E, F espacios vectoriales normados y U ⊂ E cerrado. Se plantea la interrogante siguiente: “¿Sea


f : U → F inyectiva, es f un homeomorfismo de U sobre f (U )?”.

(a) Demostrar que es cierto si E = Rn y U es acotado.


(b) Mostrar mediante un contra ejemplo que la afirmación no es cierta en espacios de dimensión finita
(considerar por ejemplo la identidad en un espacio provisto de 2 normas no equivalentes).

9. Considérese la función f : [−1, 1] → R dada por


1
− n1 ) 1 1

f (x) = n+1 (2 |x| si n≤ |x| n−1
0 si x=0

Mostrar que f es estrictamente diferenciable en el origen, pero que no es diferenciable en ningún


vecindario de 0.
Indication.- f (x) satisface f (1/n) = 1/n(n + 1) y es lineal sobre [1/n, 1/(n + 1)].

10. Sea A ∈ L(E) un isomorfismo. Para calcular su inversa, se aplica el método de Newton a la equatión
X −1 − A = 0. Mostrar que se obtiene la iteración

Xk+1 = Xk+1 + Xk (I − AXk )

y verificar que la sucesión {Xk } converge hacia A−1 si kI − AX0 k < 1.


Indication. Ek = I − AXk satisface Ek+1 = Ek Ek .

I.6. Teorema de Inversión Local


Continuamos con el estudio de la resolución de las ecuaciones no lineales f (x) = 0 o f (x) = y para un y en
un espacio de Banach.

Ejemplo I.6.1 Ejemplo Consideremos el sistema no lineal

x21 + x22 − 3x1 = y1 , x41 − x21 x2 + 2 = y2 . (I.6.1)

Para (x1 , x2 ) = (1, 2) se obtiene (y1 , y2 ) = (6, 1). La pregunta a la cual nos gustarı́a responder es la siguiente:
¿Para (y1 , y2 ) próximo de (6, 1), exite una solución (x1 , x2 ) de (I.6.1) que es próxima de (1, 2)? ¿Es localmente
única?

Decimos que una aplicación f : U → F , donde E, F son espacios vectoriales normados y U ⊂ E abierto,
es un homeomorfismo alrededor de a ∈ U , si existe un vecindario abierto U 0 ⊂ U de a y un vecindario
abierto de V 0 de f (a) tales que la restricción f |U 0 es un homeomorfismo de U 0 sobre V 0 .
I.6. TEOREMA DE INVERSIÓN LOCAL 23

Teorema I.6.1 (Teorema de Inversión Local) Sean E, F espacios de Banach, U ⊂ E abierto y a ∈ U .


Si f : U → F es estrictamente diferenciable en a y si f 0 (a) es un isomorfismo de E sobre F , entonces f es
un homeomorfismo local alrededor de a. Además, la aplicación inversa f −1 es estrictamente diferenciable en
b = f (a) y se tiene
(f −1 )0 (b) = (f 0 (a))−1 . (I.6.2)

Demostración.- Aplicamos la proposición I.5.3 con A = f 0 (a). La función f es estrictamente diferenciable


en a. Esto significa que para todo  > 0 existe δ > 0 tal que

kf (x) − f (z) − f 0 (a)(x − z)k ≤  kx − zk para x, z ∈ B, (I.6.3)

donde B = {x ∈ E| kx − ak ≤ δ}. Entonces, se tiene también


x − z − f 0 (a)−1 (f (x) − f (z)) ≤  f 0 (a)−1 · kx − zk para x, z ∈ B,

(I.6.4)

Fijamos  > 0 tal que  f 0 (a)−1 ≤ 1/2. Para el δ correspondiente, f es un homeomorfismo de B sobre f (B)
por la proposición (I.5.3) y f (B) contiene el abierto V 0 = {y ∈ F | ky − bk < σ} donde σ = δ/(2 f 0 (a)−1 ).
Por lo tanto, f es un homeomorfismo del abierto U 0 = f −1 (V 0 ) sobre V 0 .
Para mostrar que f −1 es estrictamente diferenciable en b = f (a), planteamos x = f −1 (u) z = f −1 (v) en
(I.6.4). Esto da para u, v ∈ V 0

f (u) − f −1 (v) − f 0 (a)−1 (u − v) ≤  f 0 (a)−1 · f −1 (u) − f −1 (v) ≤ 2 f 0 (a)−1 2 ku − vk


−1

utilizando la estimación (I.5.6) con A = f 0 (a) y α = 1/2. Por lo tanto f −1 es estrictamente diferenciable en
b y la derivada está dada por (I.6.2).


Ejemplo I.6.2 Para el problema del ejemplo precedente, tenemos


   
0 2a1 − 3 3a22 −1 12
f (a) = =
4a31 − 2a1 a2 −a21 0 −1

Para la norma euclidiana, se calcula f 0 (a)−1 ≈ 12,1. Si se plantea  = 0,04, se puede encontrar un δ > 0
tal que (I.6.3) se verifica. Para todo y ∈ R2 con ky − bk ≤ 2δ/12,1 el sistema (I.6.1) posee una solución x que
satisface kx − ak ≤ δ. En esta bola de radio δ no hay otra solución aparte de x. Además, la demostración
del teorema de inversión local muestra que el método de Newton simplificado converge hacia esta solución.

El objetivo siguiente es estudiar si la solución de f (x) = y depende de manera diferenciable de y. Más


precisamente, estudiaremos las condiciones bajo las cuales la función inversa es diferenciable en todo un
vecindario de b = f (a).
Definición I.6.1 Sean E, F espacios vectoriales normados, U ⊂ E y V ⊂ F abiertos.
♠ f : U → F es continuamente diferenciable o de clase C 1 sobre U , si f es diferenciable en todo punto de
U y si f 0 : U → L(E, F ) es continua.
♠ f : U → V es un difeomorfismo (de clase C 1 ) de U sobre V , si f es biyectiva, continuamente diferen-
ciable, y si la inversa f −1 : V → U es continuamente diferenciable.
♠ f : U → F es un difeomorfismo local alrededor de a ∈ U , si existen: un vecindario abierto U 0 ⊂ U
de a y un vecindario abierto V 0 de f (a) tales que f es un difeomorfismo de U 0 sobre V 0 .
Remarquemos que un homeomorfismo que es continuamente diferenciable no siempre es un difeomorfismo.

La función f : R → R definida por f (x) = x3 nos sirve como contra ejemplo, porque f −1 (y) = 3 y es
continua, pero no diferenciable en el origen.
Una función que es continuamente diferenciable sobre U es estrictamente diferenciable sobre U . Esto es
una consecuencia del teorema I.5.5
24 CAPÍTULO I. CÁLCULO DIFERENCIAL EN ESPACIOS DE BANACH

Teorema I.6.2 Sean E, F espacios de Banach, U ⊂ E un abierto y a ∈ U . Una aplicación f : U → F de


clase C 1 es un difeomorfismo local alrededor de a, si y solamente si f 0 (a) es un isomorfismo de E sobre F .
Además, se tiene

(f −1 )0 (y) = f 0 (x)−1 para y = f (x) en un vecindario de b = f (a).

Demostración.- ⇒: Si f : U → F es un difeomorfismo local alrededor de a, se puede derivar la identidad


f −1 (f (x)) = x. Esto da
(f −1 )0 (y)f 0 (x) = I con y = f (x) (I.6.5)
en un vecindario de a. Por consiguiente, f 0 (a) es inversible. La inversa de f 0 (a)−1 = (f −1 )0 (b) es una
aplicación acotada porque f −1 es supuesta diferenciable en b.
⇐: El teorema de inversión local implica que f es un homeomorfismo local alrededor de a. Solo queda mostrar
que f −1 es continuamente diferenciable en un vecindario de b = f (a). Como f 0 (x) es próxima a f 0 (a), la
continuidad de f 0 : U → L(E, F ) y GL(E, F ) es un abierto, f 0 (x) es un isomorfismo para todo x en un
vecindario U 0 de a. Podemos aplicar el teorema de inversión local a cada uno de los x ∈ U 0 , lo que implica
la diferenciabilidad de f −1 en V 0 = f (U 0 ). Derivando la identidad f −1 (f (x)) = x, se obtiene (I.6.5) y por lo
tanto (f −1 )0 (y) = f 0 (f −1 (y))−1 para y ∈ V 0 . La función (f −1 )0 : V 0 → L(F, E), siendo la composición de las
aplicaciones continuas f −1 , f 0 y (·)−1 , es por consiguiente continua.

Corolario I.6.1 Sean E, F espacios de Banach, U ⊂ E un abierto y f : U → F continuamente diferenciable


sobre U . Entonces, f es un difeomorfismo de U sobre f (U ), si y solamente si:

i) f es inyectiva sobre U ,

ii) f 0 (x) es un isomorfismo para todo x ∈ U .

Demostración.- Este resultado es una consecuencia del teorema precedente, por que la diferenciabilidad es
una propiedad local.

Ejemplo I.6.3 (Coordenadas Polares) Sean U = {(r, ϕ ∈ R2 |r > 0}, V = R2 − {(0, 0)} y f : U → V
dada por
(r, ϕ) 7→ (r cos ϕ, r sin ϕ).
Esta aplicación es un difeomorfismo local alrededor de cada punto de U , porque
 
0 cos ϕ −r sin ϕ
f (r, ϕ) =
sin ϕ r cos ϕ

y det(f 0 (r, ϕ)) = r > 0. f no es inyectiva, se tiene f (r, ϕ + 2π) = f (r, ϕ). Por lo tanto, no es un difeomorfismo
de U sobre V . Si se restringe los conjuntos U y V a

U0 = {(r, ϕ)|r > 0, −π < ϕ < π}, V0 = R2 − {(x, 0)|x ≤ 0},

f se convierte en un difeomorfismo de U0 sobre V0 . En la figura I.6.1 podemos observar una representación


de las coordenadas polares.

Ejemplo I.6.4 (Coordenadas Esféricas) La aplicación

(r, ϕ, ϑ) 7→ (r cos ϕ sin ϑ, r sin ϕ sin ϑ, r cos ϑ)

es un difeomorfismo de U = {(r, ϕ, ϑ)|r > 0, −π < ϕ < π, 0 < ϑ < π} sobre el conjunto V = R3 −
{(x, 0, z)|x ≤ 0, z ∈ R}, por que el determinante de la matriz jacobiana es −r2 sin ϑ 6= 0 y la aplicación es
inyectiva.
I.6. TEOREMA DE INVERSIÓN LOCAL 25

ϕ

6
y
3
2

f 1 V
3 U x
−3 −2 −1 1 2 3
−1
−2

r −3
0
0 1 2 3

Figura I.6.4: Coordenadas Polares

Ejemplo I.6.5 (Transformación de Cayley) La aplicación


1 − x2 − y 2
 
2y
(x, y) 7→ , (I.6.6)
(1 − x)2 + y 2 (1 − x)2 + y 2
es un difeomorfismo del semiplano izquier-
y v
do {(x, y)|x < 0} sobre el disco abierto 1
2
{(u, v)|u2 + v 2 < 1}. Ver aplicaciones confor-
mes de la parte B del curso de Análisis de 1
Segundo Año. x f u
0
−4 −3 −2 −1 −1 1
−1

−2
−1
Por lo tanto, la aplicación (I.6.6) es biyectiva y es continuamente diferenciable.

I.6.1. Ejercicios
1. Consideremos la función f : R2 → R2 dada por

x≤


 x2 − x21 si 1 x2
x− 2
2 x1 x2
f1 (x1 , x2 ) = x1 , f2 (x1 , x2 ) = x21
si 0 ≤ x2 ≤ x21

−f2 (x1 , −x2 ) si x2 ≤ 0

Mostrar que:
(a) f es diferenciable en todo punto.
(b) f 0 (0) es inversible (calcular f 0 (0)).
(c) f no es estrictamente diferenciable en el origen.
(d) No existe vecindario del origen donde f sea inyectiva; es decir f no es un homeomorfismo alrededor
del origen.
26 CAPÍTULO I. CÁLCULO DIFERENCIAL EN ESPACIOS DE BANACH

2. Dar un difeomorfismo (a) del intervalo (0, 1) con R, (b) del intervalo (0, 1) con la semirecta R∗+ .
Pn
3. Sea el “cubo” C = {x ∈ Rn |0 < x1 < 1, i = 1, . . . , n} y el ”simplex ” S = {y ∈ Rn |yi > 0, i=1 yi < 1}
y se considera la aplicación ϕ : C → Rn dada por ϕ(x) = y con yk = (1 − x1 ) · · · (1 − xk−1 )xk para
k = 1, . . . , n.
(a) Para n = 2 graficar las imagenes de ϕ de las rectas paralelas al origen.
Pn Qn
(b) Verificar que i=1 yi = 1 − i=1 (1 − xi )
(c) Verificar que ϕ es un un difeormorfismo de C sobre S y encontrar su inversa.
4. Las coordenadas esféricas de Rn están dadas por ψ(r, θ1 , . . . , θn−1 ) = x donde
x1 = r cos θ1
x2 = r sin θ1 cos θ2
x3 = r sin θ1 sin θ2 cos θ3
..
.
xn−1 = r sin θ1 sin θ2 . . . sin θn−2 cos θn−1
xn = r sin θ1 sin θ2 . . . sin θn−2 sin θn−1 .
Mostrar que
det ψ 0 = rn−1 sinn−2 θ1 sinn−3 θ2 · · · sin θn−2 ,
y mostrar que la restricción de la aplicación ψ a (0, ∞) × (0, π)n−2 × (−π, π) es un difeomorfismo.
5. Sea αn el volumen de la esfera {x ∈ Rn | kxk2 ≤ 1} en Rn . Utilizando el resultado del ejercicio anterior,
el teorema de cambio de variable para integrales y la definición de la función Gamma Γ(x) mostrar que
π n/2
αn = .
Γ(n/2 + 1)
Mostrar igualmente queR παn → 0 cuando n → ∞.
Indicación. Para Ik = 0 sink t dt se tiene (k + 1)Ik+1 = kIk − 1.
6. En el plano con las coordenadas cartesianas (x, y) se considera las dos curvas
C1 = {(x, y) : x2 − y = 0}
C2 = {(x, y) : x − y 2 = 0}.
Encontrar un difeormorfismo local alrededor de (0, 0) f tal que
f (C1 ) = {(u, v) : v = 0}
f (C2 ) = {(u, v) : u = 0}.

7. Para todo a ∈ R se considera la función fa : R → R dada por fa (x) = ax − sin x. ¿Para qué valores
de a la función fa es un homeomorfismo?, ¿un difeomorfismo?, ¿un difeomorfismo local alrededor del
origen?

I.7. Teorema de las Funciones Implı́citas


En la sección precedente, hemos considerado el problema de resolver f (y) = x y hemos encontrado condiciones
suficientes que permiten escribir la solución bajo la forma y = g(x). El objetivo de esta sección es extender
este resultado al problema
f (x, y) = 0 (I.7.1)
donde x, y y f (x, y) están en espacios de Banach. Buscamos saver si la ecuación (I.7.1) puede ser resuelta
para obtener y = g(x) tal que (al menos localmente)
f (x, y) = 0 ⇐⇒ y = g(x). (I.7.2)
I.7. TEOREMA DE LAS FUNCIONES IMPLÍCITAS 27

Ejemplo I.7.1 Se pone a consideración los siguientes ejemplos:

1. Consideremos la función

f (x, y) = 16x3 − 84x2 + 162x − 89 + 27y 3 + 54xy 2 − 108y 2 + 36x2 y − 180xy + 162y

Por un punto (a, b) satisfaciendo


(a, b) = 0 y ∂f 0
∂y (a, b) 6= 0, existe vecindarios U de a,
2
V 0 de b y un función diferenciable g : U 0 → V 0 tales
que (I.7.2) es verdad para (x, y) ∈ U 0 × V 0 . Los pun-
tos sobre la curva que tienen una tangente vertical
o horizontal pueden ser localizados por la condición
∂f ∂f 1
∂y (a, b) = 0 y ∂x (a, b) = 0 respectivamente. En el
punto de cruce se tiene necesariamente f (a, b) = 0,
∂f ∂f
∂x (a, b) = 0 y ∂y (a, b) = 0.

1 2

2. Una función f (x1 , x2 , y) = 0 representa una superficie en R3 . ¿Cuando se puede escribir esta ecuación
bajo la forma y = g(x1 , x2 )?

3. El sistema de dos funciones


f1 (x, y1 , y2 ) = 0 f2 (x, y1 , y2 ) = 0
representa la intersección de dos superficies en R3 . ¿Bajo que condición, se puede escribir esta inter-
sección bajo la forma
y1 = g1 (x), y2 = g2 (x),
lo que representarı́a una curva en R3 .

Para una función f : U → G, U ⊂ E × F , donde E, F, G son espacios de Banach, se define la derivada


parcial ∂f
∂y (a, b) como la derivada de la aplicación h(y) = f (a, y), donde a es considerada como un paramétro
fijo; es decir, ∂f 0 1 1
∂y (a, b) = h (b). Si f es de clase C , h es también de clase C , porque h = f ◦λ donde la inyección
λ : F → E × F , definida por λ(y) = (a, y), es continuamente diferenciable.
En el caso en que x ∈ Rm , y ∈ Rn y f : Rm × Rn → Rn está dada por
 ∂f1 ∂f1
∂y1 (x, y) · · · ∂yn (x, y)
  
f1 (x1 , . . . , xm , y1 , . . . , yn )
.. ∂f .. ..
f (x, y) =   se tiene (x, y) =  .
   
. ∂y . .
∂fn ∂fn
∂y1 (x, y) · · ·
f2 (x1 , . . . , xm , y1 , . . . , yn ) ∂yn (x, y)

Teorema I.7.1 (Teorema de las Funciones Implı́citas) Sean E, F y G espacios de Banach, U ⊂ E y


V ⊂ F abiertos y f : U × V → G una aplicación de clase C 1 . Supongamos que para (a, b) ∈ U × V , se tiene

∂f
f (a, b) = 0 y (a, b) es un isomorfismo de F sobre G.
∂y
Entonces:

i) Existen: un vecindario U 0 de a, un vecindario V 0 de b y una única aplicación g : U 0 → V 0 , tales que


f (x, g(x)) = 0 para todo x ∈ U 0 .

ii) La aplicación g : U 0 → V 0 es de clase C 1 y se tiene


 −1
∂f ∂f
g 0 (x) = − (x, g(x)) (x, g(x)). (I.7.3)
∂y ∂x
28 CAPÍTULO I. CÁLCULO DIFERENCIAL EN ESPACIOS DE BANACH

Demostración.- Consideremos la aplicación

F :U ×V →E×G definida por F (x, y) = (x, f (x, y))

y aplicar el teorema de inversión local. Esta aplicación es de clase C 1 y tiene como derivada
 
∂f ∂f
F 0 (a, b)(h, k) = h, (a, b)h + (a, b)k .
∂x ∂y
∂f
Además, satisface F (a, b) = (a, 0). Puesto que ∂y (a, b) es un isomorfismo, F 0 (a, b) es inversible con inversa
 
∂f ∂f
F 0 (a, b)−1 (ĥ, k̂) = ĥ, (a, b)−1 (k̂ − (a, b)k̂) .
∂y ∂x

Esta inversa es continua por que ∂f ∂f


∂x (a, b) y ∂y (a, b)
−1
lo son. Por el teorema de inversión local, F es un
1
difeomorfismo de clase C de un vecindario de (a, b) sobre un vecindario (a, 0). Se puede suponer que contienen
U 0 ×V 0 y U 0 ×W 0 , respectivamente, donde U 0 , V 0 y W 0 son vecindarios de a, b y 0 ∈ G. Si es necesario reducir
U 0 , también se puede suponer que F −1 (U 0 × {0}) ⊂ U 0 × V 0 . El difeomorfismo inverso F −1 es de la forma
F −1 (x, z) = (x̂, ĝ(x, z)) y se tiene por lo tanto f (x, ĝ(x, z)). La aplicación g(x) = ĝ(x, 0) es la aplicación
buscada.
Como F −1 (x, z) es de clase C 1 , las aplicaciones ĝ(x, z) y g(x) = ĝ(x, 0) lo son también. Se obtiene
finalmente la formula (I.7.3) derivando la identidad f (x, g(x)) = 0 respecto a x.

Ejemplo I.7.2 Sea pa (x) = a0 + a1 x + · · · + an xn un polinomio a coeficientes reales a = (a0 , a1 , . . . , an ).


¿La raiz x0 de pa (x) = 0 es una función diferenciable de a0 , a1 , . . . , an ? Para responder a esta interrogante,
consideremos la función

f (x, a0 , a1 , . . . , an ) = a0 + a1 x + a2 x2 + · · · + an xn = pa (x)

de n + 2 variables para la cual


∂f
(x, a0 , a1 , . . . , an ) = a1 + 2a2 x + · · · + nan xn−1 = p0a (x).
∂x
Si para coeficientes a∗ = (a∗0 , a∗1 , . . . , a∗n ) se tiene pa∗ (x∗0 ) y pa∗ (x∗0 ) 6= 0, la ecuación pa (x) = 0 posee, para
a próximo de a∗ una solución x0 (a) que es próxima de x∗0 y que además es una función diferenciable de
a0 , a1 , . . . , an .
En particular, el polinomio p (x) = x6 − x5 + x3 − 1 +  tiene un cero próximo de x∗0 = 1 que depende
2 2
diferencialmente de , √ se tiene x0 () = 1 − /4 + O( ). Al contrario, los ceros del polinomio p (x) = x − 
satisfacen x0 () = ±  para  > 0, una función no diferenciable en el origen, y para  < 0 el polinomio no
tiene ni siquiera un cero real.

I.7.1. Ejercicios
1. Sea f : R4 → R2 la aplicación definida por

f1 (x, y, u, v) = u3 + vx + y
f2 (x, y, u, v) = uy + v 3 − x

y sea P0 = (x0 , y0 , u0 , v0 ) un punto de f −1 ({0}).

(a) Escribir una condición sobre P0 que permita obtener localmente alrededor de este punto el conjunto
f −1 ({0}) como el grafo de una función de la forma u = g1 (x, y), v = g2 (x, y).
∂g1
(b) Calcular ∂x (x0 , y0 ) si P0 = (0, −1, 1, 1).
I.8. APLICACIONES BILINEALES Y MULTILINEALES 29

2. Se considera el sistema
9 9
λc1 = 3c1 + c31 + c1 c22
4 2
2 3
λc2 = 2c2 + 3c1 c2 + c2 .
2
Encontrar los puntos de bifurca-
ción de las curbas c1 (λ) y c2 (λ).
Una condición necesaria para un
punto de bifurcación es que el
teorema de las funciones implı́ci-
tas no pueda ser aplicado.
3. Demostrar que el teorema de inversión local puede ser deducido del teorema de las funciones implı́citas.
4. Sea S = {(x, y, z)|xz + sin(xy) + cos(xy) = 1}. Determinar si en un vecindario de (0, 1, 1) el conjunto
S puede ser escrito bajo la forma
z = f (x, y) o y = g(x, z) o x = h(y, z).

I.8. Aplicaciones Bilineales y Multilineales


Las derivadas de orden superior son aplicaciones bilineales para la segunda derivada, trilineales para la tercera
derivada y multilineales de orden n para las n-sima derivada. Esta es la razón por la cual estudiaremos este
tipo de aplicaciones con un poco más de detalle.
Las definiciones y propiedades algebraicas han sido ya vistas en el curso de Algebra Lineal Avanzada,
por lo tanto nos abocaremos a estudiar la noción de continuidad en este tipo de aplicaciones.
De la misma manera que en la sección I.3, podemos generalizar las relación (I.3.4) y la proposición I.3.4
a productos de espacios. El espacio E1 × E2 × · · · × En , dotado de la norma
k(x1 , x2 , . . . , xn )k = máx{kx1 kE1 , . . . , kxn kEn }
es un espacio normado. Es un espacio de Banach, si y solamente cada uno de los espacios Ek , k = 1, . . . , n
es también un espacio de Banach.
Proposición I.8.1 Para una aplicación multilineal A : E1 × E2 × · · · × EN → F , donde E1 , . . . , En y F son
espacios vectoriales normados, las condiciones siguientes son equivalentes:
a) A es continua en todo punto de E1 × E2 × · · · × En ;
b) A es continua en el origen (0, 0, . . . , 0) ∈ E1 × · · · × En .
c) kA(x1 , . . . , xn )k es acotada sobre la bola unitaria de E1 × · · · × En .

Demostración.- La demostración es análoga a la del teorema I.2.1 sobre las aplicaciones lineales. Para
demostrar c) ⇒ a), escribimos
A(x1 , . . . , xn ) −A(a1 , . . . , an ) = A(x1 − a1 , x2 , . . . , xn )
+A(a1 , x2 − a2 , x3 , . . . , xn ) + · · · + A(a1 , . . . , an−1 , xn − an )
y estimemos cada termino separadamente.

Definición I.8.1 Sean E1 , . . . , En y F espacios vectoriales normados. se denota por L(E1 , . . . , En ; F ) el
conjunto de las aplicaciones multilineales continuas de E1 × · · · × En en F .
Para un elemento A ∈ L(E1 , . . . , En ; F ), se define
kA(x1 , . . . , xn )k
kAk = sup kA(x1 , . . . , xn )k = sup . (I.8.1)
k(x1 ,...,xn )k≤1 xi 6=0, i=1,...,n kx1 k · kx2 k · . . . · kxn k
30 CAPÍTULO I. CÁLCULO DIFERENCIAL EN ESPACIOS DE BANACH

Si E1 = · · · = En = E, se escribe también Ln (E; F ) en vez de L(E, . . . , E; F )

El espacio L(E1 , . . . , En ; F ) provisto de (I.8.1) es un espacio vectorial normado. Si F es completo, entonces


L(E1 , . . . , En ; F ) es un espacio completo. Esta afirmación se la demuestra exactamente como para el caso
lineal. El resultado siguiente es la base para la interpretación de la segunda derivada de una función como
aplicación bilineal.
Proposición I.8.2 Sean E, F, G espacios vectoriales normados. Entonces, la aplicación

ψ : L(E, L(F, G)) → L(E, F ; G)

definida por ψ(A) = B donde B(x, y) = (Ax)y es un isomorfismo que es igualmente una isometrı́a; es decir
kφ(A)k = kAk para todo A ∈ L(E, L(F, G)).

Demostración.- La aplicación ψ es lineal y biyectiva. Su inversa está dada por ψ 1 (B) = A donde, para
x ∈ E, Ax ∈ L(F, G) es la aplicación y → B(x, y). Para demostrar la continuidad. Para demostrar la
continuidad de ψ y de ψ −1 , es suficiente ver que kψ(A)k = kAk.
Utilizando la desigualdad fundamental para normas de aplicaciones lineales, una vez para Ax y una
segunda vez para A, obtenemos

kB(x, y)k = k(Ax)yk ≤ kAxk · kyk ≤ kAk · kxk · kyk .

Esto implica que B = ψ(A) satisface kBk ≤ kAk.


Por otro lado la definicón de norma para aplicaciones multilineales, muestra que

k(Ax)yk = kB(x, y)k ≤ kBk · kxk · kyk .

La norma de la aplicación lineal Ax satisface por lo tanto kAxk ≤ kBk · kxk y por consiguiente, kAk ≤ kBk.
estas dos desigualdades muestra que la aplicación ψ es una isometrı́a.

Se puede, por lo tanto, identificar las aplicaciones lineales de E en L(F, G) con las aplicaciones bilineales de
E × F en G.
Ejemplo I.8.1 Una matriz C (con n columnas y m filas) puede ser identificaco con la aplicación bilineal
B : Rm × Rn → R definida por B(x, y) = xt Cy. Puede tambien ser identificada como un elemento de
L(Rm , L(Rn , R)) de la manera siguiente: para x ∈ Rm el vector xt C ∈ L(Rn , R) define la aplicación xC :
y → xt Cy.
La afirmación de la proposición precedente puede ser generalizada a aplicaciones multilineales. Si E1 , . . . , En
y F son espacios vectoriales normados, la aplicación

ψ : L(E1 , L(E2 , . . . , En ; F )) → L(E1 , . . . , En : F ), (I.8.2)

definida para ϕ(A) = B donde B(x1 , x2 , . . . , xn ) = (Ax1 )(x2 , . . . , xn ), es un isomorfismo y una isometrı́a. La
demostración de este hecho es idéntico a la proposición precedente.

I.8.1. Ejercicios
1. Calcular la norma del determinante visto como una aplicación multilineal

det : Rn × · · · × Rn → R

donde Rn está dotado de la norma euclidiana. Deducir la desigualdad |det A| ≤ nn/2 (de Hadamard)
para una matriz A = (aij )1≤i,j≤n satisfaciendo |aij | ≤ 1.
2. Sea Rn y Rm dotados de la norma euclidiana. Sea b : Rn × Rm → R la aplicación bilineal dada por
b(x, y) = xt By, donde B es una matriz arbitraria de n × m. Mostrar que la norma de b satisface
kbk = kBk2 .
I.9. DERIVADAS DE ORDEN SUPERIOR 31

I.9. Derivadas de Orden Superior


La derivada de una función f : U → F , con U ⊂ E es una aplicación f 0 : U → L(E, F ). Como L(E, F ) es
un espacio vectorial normado, nada nos impide de considerar la diferenciabilidad de f 0 .
Definición I.9.1 Sean E, F dos espacios vectoriales normados, U ⊂ E un abierto y f : U → F diferenciable
en un vecindario de a ∈ U . Se dice que f es dos veces diferenciable en a si f 0 : U → L(E, F ) es diferenciable
en a. Por consiguiente (f 0 )0 (a) ∈ L(E, L(E, F )). Utilizando la identificación de la proposición I.8.3, se define
la segunda derivada de f en a como la aplicación bilineal

f 00 (a)(h, k) = ((f 0 )0 (a)h)k.

En la situación de la definición precedente, consideramos la aplicación gk : U → F definida por gk (x) = f 0 (x)k


con k ∈ E fijo. Entonces, por la fórmula de Leibniz, (gk (x) = B(f 0 (x), k) donde B : L(E, F ) × E → F es la
aplicación bilineal B(A, v) = Av), se obtiene

gk0 (a)h = ((f 0 )0 (a)h)k = f 00 (a)(h, k).

Ejemplo I.9.1 Consideremos una función f : Rn → Rm y denotemos x = (x1 , . . . , xn )t . Para k ∈ Rn fijo,


n
∂f Pn Pn ∂2f
la derivada de la función gk (x) = f 0 (x)k = 0
P
∂xj (x)kj está dada por gk (x)h = i=1 ( j=1 ∂xi ∂xj (x)kj )hi .
j=1
La segunda derivada de f es por lo tanto
n X
n
X ∂2f
f 00 (x)(h, k) = (x)hi kj .
i=1 j=1
∂xi ∂xj

Para la función f : R3 → R2 del ejemplo 1 de la sección I.3. La segunda derivada es por consiguiente
 
00 2h1 k1 + 2h2 k2 + 2h3 k3
f (a)(h, k) =
a1 (h2 k3 + h3 k2 ) + a2 (h1 k3 + h3 k1 ) + a3 (h1 k2 + h2 k1 )

Ejemplo I.9.2 Para la función f (X) = X −1 de GL(E) en L(E), la proposición I.3.3, muestra que gK (X) =
f 0 (X)K = −X −1 KX −1 para K ∈ L(E). La fórmula de Leibniz nos da por consiguiente

f 00 (X)(H, K) = A−1 HA−1 KA−1 + A−1 KA−1 HA−1 .

Teorema I.9.1 Sean E, F dos espacios vectoriales normados, U ⊂ E un abierto, y supongamos que f :
U → F es dos veces diferenciable en a ∈ U . Entonces, la aplicación bilineal f 00 (a) : E × E → F es simétrica,
es decir
f 00 (a)(h, k) = f 00 (a)(k, h) para h, k ∈ E.

Demostración.- Vamos a demostrar que


1
f 00 (a)(h, k) = lı́m (f (a + δh + δk) − f (a + δh) − f (a + δk) + f (a)). (I.9.1)
δ→0 δ2
Puesto que el lado derecho de (I.9.1) es simétrico en h y k, es lo mismo para f 00 (a)(h, k).
Para demostrar (I.9.1), consideramos la aplicación

gu (v) = f (a + u + v) − f (a + u) − f (a + v) + f (a) − f 00 (a)(u, v).

donde u y v son suficientemente pequeños en norma. Como gu (0) = 0, el teorema de los incrementos finitos,
implica que
kgu (v)k ≤ sup kgu0 (tv)k · kvk . (I.9.2)
0<t<1

Solo queda estimar la derivada

g 0 u(v) = f 0 (a + u + v) − f 0 (a + v) − f 00 (a)(u, ·)
32 CAPÍTULO I. CÁLCULO DIFERENCIAL EN ESPACIOS DE BANACH

(la notación f 00 (a)(u, ·) es utilizada para la aplicación h → f 00 (a)(v, h)). El hecho que f es dos veces diferen-
ciable en a, es decir x → f 0 (x) diferenciable en a, implica que

f 0 (a + u + v) = f 0 (a) + f 00 (a)(u + v, ·) + r(u + v) ku + vk


f 0 (a + v) = f 0 (a) + f 00 (a)(v, ·) + r(v) kvk

donde r(v) → 0 si v → 0. La sustracción de estas dos ecuaciones da para gu0 (v) la fórmula gu0 (v) = r(u +
v) ku + vk − r(v) kvk y se obtiene para 0 < t < 1

kgu0 (tv)k ≤ (kr(u + tv)k + kr(tv)k)(kuk + kvk). (I.9.3)

Se deduce de las estimaciones (I.9.2) y (I.9.3) que kgu (v)k /(kuk + kvk)2 → 0 si kuk + kvk → 0. Planteando
u = δh y v = δk se obtiene la afirmación (I.9.1).

La definición de tercera derivada es análoga a la definició (I.9.1). Supongamos que una función f : U → F
(E, F espacios vectoriales normados y U ⊂ E un abierto) sea 2 veces diferenciable en un vecindario de
a ∈ U . Se dice que f es tres veces diferenciable en a, si f 00 : U → L2 (E; F ) es diferenciable en a. La derivada
(f 00 )0 (a) ∈ L(E, L2 (E; F )) y utilizando la isometrı́a entre L(E, L2 (E; F )) y L3 (E; F ) se define la tercera
derivada de f en a como la aplicación trilineal

f 000 (a)(h, k, l) = (f 00 (a)h)(k, l).

De manera evidente, se define por inducción la p-sima derivada f (p) (a) como aplicación multilineal f (p) ∈
Lp (E; F ).
Para un cálculo práctico de la tercera derivada, se puede utilizar la fórmula

gk0 l(a)h = ((f 00 )0 (a)h)(k, l) = f 000 (a)(h, k, l) (I.9.4)

donde gkl : U → F está definida por f 00 (x)(h, k) y k, l ∈ E vectores fijos. La tercera derivada de f puede
también ser interpretada como la segunda deriva de gl (x) = f 0 (x)l, es decir

gl00 (a)(h, k) = ((f 0 )00 (a)(h, k))l = f 000 (a)(h, k, l). (I.9.5)

Las dos fórmulas (I.9.4) y (I.9.5) muestran que se puede intercambiar k y l ası́ como h y k sin cambiar el
valor de f 000 (a)(h, k, l). Se tiene el resultado siguiente.
Corolario I.9.1 Si, bajo las hipótesis del teorema I.9.2, la función f : U → F es p veces diferenciable en
a ∈ U , la aplicación multilineal f p (a) es simétrica, es decir,

f (p) (a)(h1 , . . . , hp ) = f (p) (a)(hσ(1) , . . . , hσ(p) )

donde σ es una permutación cualquiera de {1, . . . , p}.

Ejemplo I.9.3 La tercera derivada de una aplicación f : Rn → Rm está dada por


XXX ∂3f
f 000 (x)(h, k, r) = (x)hi kj rl .
i=1 j=1 l=1
∂xi ∂xj ∂xl

Definición I.9.2 Sean E, F espacios vectoriales normados, U ⊂ E y V ⊂ F abiertos.


♣ f : U → F es p veces continuamente diferenciable o de clase C p sobre U , si f es p veces diferenciable en
todo punto de U y si f (p) : U → Lp (E; F ) es continua.
♦ f : U → F es indefinidamente diferenciable o de clase C ∞ sobre U , si f es de clase C p para todo p.
♠ f : U → F es un difeomorfismo de clase C p de U sobre V , si f es biyectiva, p veces continuamente
diferenciable y si la inversa f −1 : V → U es p veces continuamente diferenciable.
I.10. FÓRMULA DE TAYLOR 33

Ejemplo I.9.4 La función f (X) = X −1 de GL(E) en L(E) es indefinidamente diferenciable. En efecto,


derivando la formula del ejemplo 2, se obtiene

f 000 (A)(H, K, L) = −A−1 HA−1 KA−1 LA−1 − A−1 HA−1 LA−1 KA−1
−A−1 KA−1 HA−1 LA−1 − −A−1 KA−1 LA−1 HA−1
−A−1 LA−1 HA−1 KA−1 − −A−1 LA−1 HA−1 HA−1 .

Se ve por inducción que cada derivada es una combinación lineal de expresiones que son un producto alternado
de A−1 con aplicaciones lineales constantes.

Proposición I.9.1 Sean E, F espacios vectoriales normados,U ⊂ E, V ⊂ F abiertos y f : U → V un


difeomorfismo de clase C 1 . Si f es de clase C p , entonces la función inversa f −1 : V → U es también de clase
Cp.

Demostración.- Por el teorema I.6.2 sabemos que

(f −1 )0 (y) = f 0 (f −1 (y))−1 ,

es decir, (f −1 )0 es la composición de tres aplicaciones: y → f −1 (y), x → f 0 (x) y A → A−1 . Las tres


aplicaciones son continuamente diferenciables. Entonces f −1 es de clase C 2 . La demostración para p ≥ 3 es
análoga.

Una consecuencia de esta proposición es la siguiente: si en el teorema de inversión local la función f es de
clase C p , entonces su inversa es automáticamente de clase C p . Similarmente, si en el teorema de las funciones
implı́citas la función f es de clase C p , entonces la aplicación g es también de clase C p .

I.9.1. Ejercicios
1. Sean f : E → F y g : F → G (donde E, F y G son espacios vectoriales normados) dos aplicaciones
dos veces diferenciables. Calcular (g ◦ f )00 (x)(h, k).
2. Sea b : E ×F → G (donde E, F y G son espacios vectoriales normados) una aplicación bilineal continua.
Calcular su segunda derivada.
3. Calcular la segunda derivada de f : R2 → R3 dada por

f (x) = (x31 + x1 x32 , e(x1 −x2 ) , cos(x1 x2 ))t .

I.10. Fórmula de Taylor


Finalizando este capı́tulo, veremos algunos resultados vinculados a desarrollos limitados a un número finito
de términos.
Teorema I.10.1 (Fórmula de Taylor) Sean E, F espacios vectoriales normados, U ⊂ E un abierto. f :
U → F una función n − 1 veces diferenciable sobre U y n veces diferenciable en a ∈ U . Entonces para todo
h ∈ E con a + h ∈ U , se tiene
1 1 n
f (a + h) = f (a) + f 0 (a)h + f 00 (a)(h, h) + · · · + f (n) (a) (h, . . . h) +o(khk ). (I.10.1)
2 n! | {z }
n veces

Demostración.- La demostración la realizaremos por inducción. Para n = 1 es la definición de f 0 (a).


Suponemos cierto hasta n − 1. En particular suponemos cierto para f 0 (a). Por lo tanto
1 1 n−1
f 0 (a + h) = f 0 (a) + f 00 (a)h + f 000 (h, h) + · · · + f (n) (a) (h, . . . , h) +o(khk ) (I.10.2)
2 (n − 1)! | {z }
n−1 veces
34 CAPÍTULO I. CÁLCULO DIFERENCIAL EN ESPACIOS DE BANACH

Planteamos
1 (n)
F (h) = f (a + h) − f (a) − f 0 (a)h − · · · − f (a) (h, . . . , h),
n! | {z }
n veces

derivamos y obtenemos
1 1
F 0 (h)k = f 0 (a + h)k − f 0 (a)(k) − f 00 (a)(h, k) − f 000 (a)(h, h, k) − · · · − f (n) (n − 1)!( h, . . . , h , k).
2 (n − 1)! | {z }
n−1 veces

La hipótesis de inducción sobre f 0 (a + h) da que


n−1
kF 0 (h)k = o(khk ).

Aplicando el teorema de los incrementos finitos, obtenemos finalmente


n
F (h) − F (0) = F (h) = o(khk ).

Teorema I.10.2 (Fórmula de Taylor con Resto de Lagrange) Sean E, F espacios vectoriales norma-
dos, U ⊂ E un abierto. f : U → F una función n + 1 veces diferenciable sobre U y a ∈ U . Entonces para
todo h ∈ E con a + h ∈ U , se tiene


1 1
f (a + h) = f (a) + f 0 (a)h + f 00 (a)(h, h) + · · · + f (n) (a) (h, . . . h)

2 n! | {z }
n veces

n+1
khk
≤ sup f (n+1) (a + th) . (I.10.3)

(n + 1)! 0<t<1

Demostración.- Realizamos la demostración para el caso E = R y [a, a + h] = [0, 1]. El caso general se
obtiene de la composición de la función t 7→ a + th y f .
Para n = 0 es el teorema de los incrementos finitos. Suponemos cierto para n−1. Como en la demostración
del teorema precedente
1
F (t) = f (t) − f (0) − . . . − f (n) (0)tn .
n!
La hipótesis de inducción aplicada a n − 1 y f 0 (t) nos conduce a

tn
kF 0 (t)k ≤ sup f (n+1) (t) .

n! 0<t<1
R1
Por otro lado F (1) = 0
F 0 (t) dt, de donde
Z 1 n 
t 1
kF (1)k ≤ dt sup f (n+1) (t) = sup f (n+1) (t) .

0 n! 0<t<1 (n + 1)! 0<t<1

I.10.1. Ejercicios
1. Sea X ∈ GL(Rn ), calcular todas las derivadas de la función f (x) = X 3 .
Capı́tulo II
Subvariedades Diferenciales

En los cursos básicos de cálculo y geometrı́a, se ha estudiado subconjuntos particulares del plano y del
espacio, como ser curvas y superficies; ası́ como también la noción de rectas y planos tangentes.
En este capı́tulo, las nociones de curva y plano serán generalizadas, al igual que la noción de tangencia.
Comencemos viendo un teorema clave.

II.1. Teorema del Rango


Un cambio de coordenadas puede ser muy útil para el estudio de las funciones. Por ejemplo, si la función
f (x1 , x2 ) puede expresarse como una función de x21 + x22 es conveniente introducir coordenadas polares. El
objetivo de esta sección es buscar, para una función y = f (x) dada, coordenadas ξ y η en lugar de x e y,
para las cuales la función f se convierta en más simple, por ejemplo lineal.
Nos contentaremos de estudiar este problema localmente; es decir, alrededor de un punto a. Como un
cambio de coordenadas es equivalente a un difeomorfismo, el problema se plantea de la manera siguiente:
sean f : Rn → Rm , a ∈ Rn y b = f (a) ∈ Rm dados, encontrar un difeomorfismo local ϕ alrededor de a
(ξ = ϕ(x)) y un difeomorfismo local ψ alrededor de b (η = ψ(y)), tales que ψ ◦ f ◦ ϕ−1 sea “más simple” en
un vecindario de 0 ∈ Rn .
Teorema II.1.1 (Teorema del rango) Sean f : Rn → Rm de clase C k , con k ≥ 1, a ∈ Rn y b = f (a).
Los enunciados siguientes son equivalentes:
i) Existe difeomorfismos locales ϕ alrededor de a y ψ alrededor de b, de clase C k , tales que
(ψ ◦ f ◦ ϕ−1 )(ξ1 , . . . , ξn ) = (ξ1 , . . . , ξr , 0, . . . , 0)t alrededor de ξ = 0; (II.1.1)

ii) El rango de f 0 (x) es constante e igual a r en un vecindario de a.

Demostración.- Supongamos cierto i), es decir que existen los difeomorfismos ϕ y ψ que satisface (II.1.1).
Planteando g = ψ ◦ f ◦ ϕ−1 : Rn → Rm , derivando g se obtiene
 
Ir 0
g 0 (ξ) = ψ 0 (f (x))f 0 (x)(ϕ0 (x))−1 = ,
0 0
donde Ir es la matriz identidad de r × r. Como ψ y ϕ son difeomorfismos, sus derivadas son inversibles y
dejan invariante el rango, ver curso de álgebra lineal.
Supongamos cierto el inciso ii); es decir, que f 0 (x) es de rango r en un vecindario U de a. Si es necesario
permutar los xi y o los yj , podemos suponer que
 r
∂fi
A= (a)
∂xj i,j=1

es inversible. Definimos la aplicación ξ = ϕ(x) por



fi (x1 , . . . , xn ) − bi para 1 ≤ i ≤ r
ϕi (x) = ξ = (II.1.2)
xi − ai para i ∈ {r + 1, . . . , n}

35
36 CAPÍTULO II. SUBVARIEDADES DIFERENCIALES

Puesto que la matriz jacobiana  


0 A ∗
ϕ (a) =
0 I
es inversible, (II.1.2) define un difeomorfismo local alrededor de a. Consideremos la función
g(ξ) = (f ◦ ϕ−1 )(ξ), cuyas primeras r componentes están dadas por gi (ξ) = ξi + bi . Como el cambio de
coordenadas x ↔ ξ no cambia el rango, ver curso de álgebra lineal, la matriz
 
0 I 0
g (ξ) =
C(ξ) D(ξ)
es de rango r para todo ξ en un vecindario de ξ = 0. Por lo tanto D(ξ) = 0 y la función g(ξ) depende
solamente de ξ1 , . . . , ξr .
El siguiente paso es construir ψ. Consideremos, la aplicación η = ψ(y) definida por

y i − bi para i = 1, . . . , r
ψi (y) = ηi = (II.1.3)
yi − gi (y1 − b1 , . . . , yr − br ) para i = r + 1, . . . , m.
La matriz jacobiana de ψ, está dada por  
0 I 0
ψ (b) =
∗ I
es inversible, por lo que (II.1.3) es un difeomorfismo local alrededor de b.
Por ultimo debemos verificar que ψ ◦ f ◦ ϕ−1 verifica (II.1.1), que dejamos como ejercicio

Consecuensia del Teorema del Rango, son los dos siguientes teoremas:
Teorema II.1.2 (Teorema de la inmersión) Sea f : Rn → Rm una inmersión en a ∈ Rn de clase C k ,
con k ≥ 1; es decir f 0 (a) es inyectiva (rango de f 0 (a) es n). Entonces, existen un vecindario U ⊂ Rn de a y
un difeomorfismo local ψ alrededor de b = f (a), de clase C k tal que
(ψ ◦ f )(x1 , x2 , . . . , xn ) = (x1 , . . . , xn , 0, . . . , 0)t , ∀x ∈ U. (II.1.4)

Demostración.- Si es necesario permutar los yi , se puede suponer que la submatriz


 n
∂fi
A= (a)
∂xj i,j=1

es inversible, por consiguiente en un vecindario U de a. Definimos la aplicación η = ψ(y) de manera implı́cita


de la manera siguiente

fi (η1 , . . . , ηn ) para i = 1, . . . , n
yi =
fi (η1 , . . . , ηn ) − ηi para i = n + 1, . . . , m.
Como la matriz jacobiana de esta aplicación es inversible, ψ es un difeomorfismo local alrededor de b y
satisface (II.1.4).

Teorema II.1.3 (Teorema de la submersión) Sea f : Rn → Rm una submersión en a ∈ Rn de clase
C k , con k ≥ 1; es decir f 0 (a) es sobreyectiva (rango de f 0 (a) es m). Entonces, existe un difeomorfismo local
ϕ alrededor de 0, de clase C k tal que
(f ◦ ϕ)(ξ1 , . . . , ξn ) = f (a) + (ξ1 , . . . , ξm )t .

Demostración.- Para demostrar regresamos a la demostración del Teorema del Rango, no hay necesidad de
hacer permutaciones en la variable yi . Tomamos como ϕ, la aplicación ϕ−1 de la demostración del teorema
del Rango e inmediatamente g = f ◦ ϕ nos da el resultado deseado.

II.2. SUBVARIEDADES DIFERENCIABLES 37

II.2. Subvariedades Diferenciables


El objetivo de esta sección es describir diferentes objetos de Rn , como ser curvas, superficies y en general
subvariedades diferenciables. A continuación enunciamos el teorema que nos permitirá cacterisar dichos
objetos.
Teorema II.2.1 Sea M = 6 ∅ un subconjunto de Rn , a ∈ M y sea 0 ≤ r ≤ n. Los enunciados siguientes son
equivalentes:

i) existe un vecindario U ⊂ Rn de a y una aplicación diferenciable g : U → Rn−r con g(a) = 0 y g 0 (a)


sobreyectiva (g una submersión) tales que

M ∩ U = g −1 (0);

ii) existe un vecindario U ⊂ Rn de a, un vecindario V ⊂ Rn de 0 y un difeomorfismo ϕ : V → U con


ϕ(0) = a tales que
M ∩ U = ϕ((Rr × {0}) ∩ V );

iii) existe un vencidario U ⊂ Rn de a, un vecindario W ⊂ Rr de 0 y una aplicación diferenciable γ : W → U


con γ(0) = a y γ 0 (0) inyectiva (una inmersión) tales que

M ∩ U = γ(W )

y γ : W → M ∩ U es un homeomorfismo.

Demostración.- Para visualizar los enunciados del teorema, consideremos la Figura II.2.1 Mostremos i) ⇒


g
γ U

W
ϕ
   
V


Figura II.2.1: Visualización del teorema

ii). Por hipótesis g es una submersión en a, por consiguiente el teorema de la submersión asegura la existencia
de un difeomorfismo ϕ : Rn → Rn alrededor de 0 y ϕ(0) = a tal que

g ◦ ϕ(ξ1 , . . . , ξn ) = (ξr+1 , . . . , ξn )t ,

después de una eventual permutación de los ξi . La condición g(x) = 0, se convierte en consecuencia ξr+1 =
· · · = ξn , lo que conduce a M ∩ U = ϕ((Rr × {0}) ∩ V ).
ii) ⇒ i). Consideremos la proyección canónica π : V ⊂ Rn → Rn−r dada por π(ξ1 , . . . , ξn ) = (ξr+1 , . . . , ξn ).
Planteando g = π ◦ ϕ−1 tenemos el punto i); en efecto g es una submersión y g −1 (0) = ϕ(π −1 (0)) =
ϕ(V ∩ (Rr × {0})).
38 CAPÍTULO II. SUBVARIEDADES DIFERENCIALES

iii) ⇒ ii). El teorema de inmersión conduce a la existencia de un difeomorfismo local ψ alrededor de a tal
que
(ψ ◦ γ)(ξ1 , . . . , ξr ) = (ξ1 , . . . , ξr , 0, . . . , 0)t ,
para todo ξ alrededor de 0 ∈ Rr . De donde x ∈ γ(W 0 ) es equivalente a que ψ(x) ∈ Rr × {0}. Tomamos
ϕ = ψ −1 . Solo falta comprobar que ϕ((Rr × {0}) ∩ V ) = M ∩ U , en efecto, si es necesario achicar los
vecindarios, se tiene que γ : W → M ∩ U es un homeomorfismo, por lo tanto la preimagen de γ alrededor
de a es un vecindario de 0 ∈ R, con lo que se asegura ϕ((Rr × {0}) ∩ V ) = M ∩ U
ii) ⇒ i). Consideramos la inyección canónica i : Rr → Rn dada por i(ξ1 , . . . , ξr ) = (ξ1 , . . . , ξr , 0, . . . , 0),
planteamos γ = ϕ ◦ i. Dejamos al estudiante la comprobación que γ satisface ii).

Definición II.2.1 Un conjunto M = 6 ∅ que satisface las condiciones del teorema precedente para todo a ∈ M
se llama una subvariedad diferenciable en Rn de dimensión r y de codimensión n − r. La aplicación γ del
inciso iii) del teorema se llama parametrización local de M alrededor de a.

Ejemplo II.2.1 Consideremos: Consideremos la superficie de la esfera en R3 alrededor del polo sur a =
(0, 0, −1)t . Esta superfie puede ser descrita para n = 3 y r = 2

g(x, y, z) = x2 + y 2 + z 2 − 1,
p
también por ϕ(x, y, ζ) = (x, y, − 1 − x2 − y 2 + ζ)t y por γ(x, y) = ϕ(x, y, 0), o bien utilizar coordenadas
esféricas:
ϕ(α, β, ρ) = ((1 + ρ) sin α cos β, (1 + ρ) sin α sin β, −(1 + ρ) cos α)t
y γ(α, β) = ϕ(α, β, 0).

Ejemplo II.2.2 (Toro de revolución) Consideremos la circunferencia (x, z) = (d + ρ cos α, ρ sin α) con
0 < ρ < d y giremos alrededor del eje z. Esto da la parametrización
 
(d + ρ cos α) cos β
γ(α, β) =  (d + ρ cos α) sin β 
ρ sin α
de un toro. Dejamos como ejercicio la verifi-
cación que γ(α, β) es una inmersión que γ es
localmente un homeomorfismo.

Ejemplo II.2.3 (Cinta de Möbius) Consideremos una vara de longitud 2, parametrizada por −1 < t < 1
y girémosla alrededor de su centro, al mismo tiempo rotemos dos veces mas rápido alrdedor de un eje a una
distancia d. Esto da la parametrización
 
(d + t cos ϑ) cos 2ϑ
γ(t, ϑ) =  (d + t cos ϑ) sin 2ϑ  .
t sin ϑ

Ejemplo II.2.4 (Grupo Ortogonal) El conjunto

O(n) = {X|X t X = I}

es una subvariedad de dimensión n(n − 1)/2 de Mn,n (R) ' Rn·n . Para comprobar, consideremos la aplicación

g : Mn,n (R) → Sym(R) ' Rn(n+1)/2


n
II.3. ESPACIO TANGENTE 39

definida por g(X) = X t X − I, donde Symn denota el espacio de las matrices simétricas de dimensión. Se
tiene O(n) = g −1 (0). Se tiene que verificar que g es una submersión en todo A ∈ O(n). La derivada de g en
A es g 0 (A)H = At H + H t A. Para una matriz simétrica B, planteamos H = AB/2 que da g 0 (A)H = B, por
lo tanto g 0 (A) : Mn,n (R) → Symn (R) es sobreyectiva y O(n) es una subvariedad de codimensión n(n + 1)/2.

Ejemplo II.2.5 Las subvariedades de dimensión 0 son puntos discretos de Rn . Todo subespacio lineal o
afı́n de Rn es una subvariedad.

Ejemplo II.2.6 El conjunto {(x, y)|xy = 0} no es una subvariedad de R2 . Alrededor del origen este conjunto
no es difeomorfo a una recta.

Remarca II.2.1 La hipótesis “γ : W → M ∩ U es un homeomorfismo” del inciso iii) del teorema II.2.1,
no puede ser omitida. Por ejemplo la función γ(t) = ((1 + 0,1t2 ) cos t, (1 + 0,1t2 ) sin t) es una inmersión para
cada t, pero la imagen γ(R) no es una subvariedad de R2 a causa del cruce de la curva, ver figura de la
izquierda. Incluso la inyectividad de γ(t) no es suficiente como lo muestra la figura de la derecha.

II.3. Espacio Tangente


La tangente en un punto a una curva en R2 o Rn es una recta; es decir un espacio afı́n. Ubicando el origen
en a, esta tangente se convierte en un espacio vectorial. El plano tangente en un punto a de una superficie
es un espacio de dimensión 2. Un vector en este plano puede ser interpretado como γ 0 (0), donde γ(t) es una
curva diferenciable en la superficie que satisface γ(0) = a.
Definición II.3.1 Sea M ⊂ Rn una subvariedad y a ∈ M. El espacio tangente a M en a es
 
n 1

Ta M = h ∈ Rn existe γ : (−, ) → R de clase C 0 tal que γ(t) ∈ M .

para todo t ∈ (−, ), γ(0) = a y γ (0) = h.
Una subvariedad está caracterizada, ya sea por una submersión o bien por una parametrización, por lo que
el teorema siguiente nos da la forma de como determinar espacios tangentes.
Teorema II.3.1 Sea M ⊂ Rn una subvariedad y a ∈ M .
a) Si M está dada por una submersión g : U → Rn−r , entonces

Ta M = ker g 0 (a).

b) Si M está dada por una parametrización σ : W → Rn , entonces

Ta M = Im σ 0 (0).

Demostración.- a) Para una curva γ(t) con g(γ(t)) = 0 se tiene que g 0 (a)γ 0 (0) = 0 y por consiguiente
Ta M ⊂ ker g 0 (a). Sea h ∈ ker g 0 (a), el teorema de submersión conduce a la existencia de ϕ difeomorfismo
local alrededor del origen, con ϕ(0) = a tal que g ◦ ϕ(ξ) = (ξr+1 , . . . , ξn ). Como h ∈ ker g 0 (a), existe h̃ ∈ Rn ,
tal que h = ϕ0 (0)h̃, ya que ϕ0 (0) es un isomorfismo lineal. Por otro lado h̃ ∈ ker(g ◦ ϕ)0 (0), de donde h̃j = 0,
40 CAPÍTULO II. SUBVARIEDADES DIFERENCIALES

para r + 1 ≤ j ≤ n. Ahora bien, consideramos γ̃ : (−, ) → Rn , con  > 0 lo suficientemente pequeño, con
γ̃(t) = th̃. Planteamos γ = ϕ ◦ γ̃, se tiene γ(t) ∈ M y γ 0 (0) = h.
b) Se tiene Im σ 0 (0) ⊂ Ta M por que γ = σ ◦ γ̃, con γ̃ curva diferenciable en Rr , es una curva en M. Solo falta
mostrar la inclusión en el otro sentido, consideramos una curva γ en M, el teorema de la inmersión asegura
la existencia de ψ difeomorfismo local alrededor de a tal que ψ ◦ σ(ξ) = (ξ1 , . . . , ξr , 0, . . . , 0), en consecuencia
la curva γ̃ = ψ ◦ γ es una curva diferenciable en Rr (proyectando Rn a Rr ), por lo tanto Ta M = Im σ 0 (0).

II.4. Ejercicios
1. Calcular el rango de la matriz jacobiana para
 
x1 + x2 + x3 + x4
f (x) =  x21 + x22 + x23 + x24 
x31 + x32 + x33 + x34

2. Sea f : Rn → Rm de clase C 1 . Mostrar que si rang f 0 (a) = r, entonces rang f 0 (x) ≥ r en un vecindario
de a. Dar un ejemplo para el cual rang f 0 (a) = r y rang f 0 (x) > r para x ∈ U − {a}, donde U es un
vecindario de a.

3. Sea A una matriz con n columnas y m filas de rang = r. Mostrar que existen matrices inversibles S y
T tales que  
Ir 0
SAT = , (II.4.1)
0 0
donde Ir es la matriz identidad de talla r. Calcular una descomposición de la forma (II.4.1) para la
matriz  
1 −1 2
A= .
−2 2 −4

4. De los conjuntos definidos más abajo, decidir cuales son subvariedades y cuales no, hacer gráficas si es
posible:
{(t, t2 ) ∈ R2 |t ∈ R} {(t, t2 ) ∈ R2 |t ≥ 0}
2 3 2
{(t , t ) ∈ R |t ∈ R} {(t2 , t3 ) ∈ R2 |t 6= 0}
2
{: (x, y) ∈ R |x > 0, y > 0} {(x, y, z) ∈ R3 |x = y = z = 0}
3 2 2 2
{(x, y, z) ∈ R |x + y − z = 1} {(x, y, z) ∈ R3 |x2 + y 2 + z 2 = 0}.

5. Dar una aplicación diferenciable g : R3 → R2 tal que el conjunto

M = {x ∈ R3 |g(x) = 0}

sea una subvariedad de dimensión 1 en R3 , pero que g 0 (x) no es sobreyectiva en ningún punto de M.

6. Verificar que el conjunto {(x, y)|xy = 0} no es una subvariedad de R2 , pero que {(x, y)|xy = 0}−{(0, 0)}
es una subvariedad.

7. Sean X ⊂ Rn e Y ⊂ Rm dos subvariedades. Mostra que el producto

X × Y = {(x, y) ∈ Rn × Rm |x ∈ X, y ∈ Y }

es una subvariedad de Rn × Rm , que se llama subvariedad producto.


II.4. EJERCICIOS 41

8. Demostrar que el conjunto

{(cos t + 2) cos λt, (cos t + 2) sin λt, sin t) ∈ R3 |t ∈ R}(II.4.2)

es una√subvariedad de R3 para λ = 2/13, ver dibujo. Para


λ = 2 el conjunto (II.4.2) no es una subvariedad y es
dense en el toro

{(cos u + 2) cos v, (cos u + 2) sin v, sin u)}.


42 CAPÍTULO II. SUBVARIEDADES DIFERENCIALES
Capı́tulo III
Máximos y Mı́nimos Locales

En el curso de Primer Año de Análisis se vio el problema de puntos extremales para funciones reales a una
variable. Se constató que una condición necesaria, cuando la función era diferenciable, es que la derivada es
nula en un punto extremal.
En este capı́tulo se estudiará el problema para funciones a varias variables de la forma f : U ⊂ E → R,
donde E es un espacio vectorial normado y luego estudiaremos problemas de máximo y mı́nimo para funciones
sometidas a ciertas restricciones.

III.1. Máximos y mı́nimos relativos


Sea U un abierto de un espacio vectorial normado E y f : U → R. Se dice que f posee un mı́nimo (máximo)
relativo en el punto a ∈ U , si existe un vecindario V de a, V ⊂ U tal que

f (x) ≥ f (a) f (x) ≤ f (a) ∀x ∈ V.
Un mı́nimo (máximo) relativo es estricto si

f (x) > f (a) f (x) < f (a) ∀x ∈ V − {a}.
Se dice que f posee un extremo relativo, si posee un mı́nimo o máximo relativo en a.
Teorema III.1.1 ((condición necesaria)) Sea U un abierto de un espacio vectorial normado E y su-
pongamos que f : U → R sea diferenciable en a ∈ U . Si f admite un extremo relativo en a, entonces
f 0 (a) = 0.

Demostración.- Supongamos que f admita un máximo relativo en a. Las hipótesis implican que para un
h fijo y || lo suficiente pequeño se tiene
0 ≥ f (a + h) − f (a) = f 0 (a)h + r(a + h) ·  · khk
donde r(a + h) → 0 si  → 0. Dividiendo este limite por  y considerando que  → 0, se obtiene que
f 0 (a)h ≤ 0. Deducimos que f 0 (a) = 0, porque h ∈ E es arbitrario. Para el mı́nimo relativo la demostración
se la realiza de la misma manera.

Teorema III.1.2 ((Condición necesaria)) Sea U un abierto de un espacio normado E y f : U → R dos
veces diferenciable en a ∈ U . Si f posee un máximo relativo en a, entonces
f 00 (a)(h, h) ≤ 0, ∀h ∈ E. (III.1.1)

Demostración.- El desarrollo en serie de Taylor de f alrededor de a, para h fijo, está dado por
1 00 2
f (a + h) = f (a) + f 0 (a)h + f (a)(h, h) + o(2 khk ).
2!
Dividemos la fórmula por 2 y pasamos al lı́mite  → 0.

43
44 CAPÍTULO III. MÁXIMOS Y MÍNIMOS LOCALES


Se dice que a ∈ U es un punto crı́tico de f : U → R si f 0 (a) = 0. La condición f 0 (a) = 0 no es suficiente para
asegurar un punto extremal, por ejemplo f (x) = x5 nos sirve como contraejemplo.
Teorema III.1.3 ((condición suficiente)) Sea U un abierto de un espacio vectorial normado y f : U → R
dos veces diferenciable en a ∈ U , si f 0 (a) = 0 y si f 00 (a) satisface
2
f 00 (a)(h, h) ≤ −γ khk ∀h ∈ E (III.1.2)

con γ > 0, entonces f admite un máximo relativo estricto en el punto a.

Demostración.- Aplicamos la fórmula de Taylor alrededor de a, lo que da


1 2
f (a + h) = f (a) + f 0 (a)h + f 00 (a)(h, h) + o(khk ),
2
las hipótesis sobre f 0 (a) y f 00 (a) nos llevan
1 00 2 2 2
f (a + h) − f (a) = f (a)(h, h) + o(khk ) ≤ (−γ khk + o(khk ).
2
2
Dividiendo por khk y pasando al lı́mite h → 0, deducimos para h 6= 0 y lo suficientemente pequeño que

f (a + h) − f (a) < 0,

con lo que f admite un máximo relativo estricto en el punto a.




El espacio vectorial normado es finito dimensional


Supongamos que E es de dimensión n, por consiguiente E = Rn en lo que sigue. La condición f 0 (a) = 0, es
equivalente a
∂f ∂f
(a1 , . . . , an ) = 0, . . . , (a1 , . . . , an ) = 0,
∂x1 ∂xn
lo que constituye un sistema de n ecuaciones para las n incognitas a1 , . . . , an . Por lo tanto, resolviendo el
sistema de n ecuaciones, encontramos los puntos crı́ticos de f . El siguiente paso es determinar el carácter de
los puntos crı́ticos. Sea a ∈ Rn un punto crı́tico, se tiene
2
f (a + h) = f (a) + f 00 (a)(h, h) + o(khk );

ahora bien, f 00 (a) es una forma bilineal simétrica llamada Hessiana de f en el punto a. Si f es dos veces
continuamente diferenciable, la matriz hessiana respecto a la base canónica es
 ∂2f ∂2f ∂2f 
∂x21
(a) ∂x1 ∂x2 (a) · · · ∂x1 ∂xn (a)
 ∂2f 
 ∂x ∂x (a) 
H(a) =  1 2 
 .. 
 . 
∂2f ∂2f
∂x1 ∂xn (a) ∂x2n (a)

La teorı́a de formas bilineales simétricas, vista en el curso de Algebra Lineal, asegura la existencia de una
base {di } de Rn , respecto a la cual la matriz hessiana es una diagonal

H(a) = diag(0, . . . , 0, 1, . . . , 1, −1, . . . , −1),


| {z } | {z } | {z }
p q r

de donde
2
f (a + h) = f (a) + h2p+1 + · · · + h2p+q − h2p+q+1 − · · · − h2n + o(khk )
III.2. MULTIPLICADORES DE LAGRANGE 45

con hi la i-sima compenente de h respecto a la base {di }. Por otro lado, la misma teorı́a de formas bilineales
simétricas, asegura que p, q, r son únicos y p es el ı́ndice de nulidad de H, q es el ı́ndice de positividad de
H y r es el indice de negatividad de H.
Se dirá quen a punto crı́tico de f es no singular si Hf (a) tiene un ı́ndice de nulidad O. Por consiguiente,
tenemos el siguiente teorema para los puntos crı́ticos no singulares.

Teorema III.1.4 ((Condición Suficiente)) Sea f : U ⊂ Rn dos continuamente diferenciable, a ∈ U un


punto crı́tico no singular, entonces:

a) La hessiana de f en a es de ı́ndice de positividad n si y solamente si f admite un mı́nimo relativo estricto


en a.

b) La hessiana de f en a es de ı́ndice de negatividad n si y solamente si f admite un máximo relativo


estricto en a.

c) En el caso en que la hessiana tenga ı́ndices de negatividad y positividad no nulos, a se llama punto silla.

Remarca III.1.1 En lugar de trabajar con los ı́ndices de positividad, negatividad y nulidad de la hessiana
de f , se hubiese podido trabajar con los valores propios de Hf (a), que dicho sea de paso, son reales. Dejamos
como ejercicio enunciar los resultados correspondientes con los valores propios.

III.2. Multiplicadores de Lagrange


Sea U un abierto de Rn , f : U → R y consideremos la subvariedad M ⊂ U . El problema consiste en
encontrar los mı́nimos o máximos relativos de la restricción f |M ; es decir, se busca a ∈ M tal que

f (x) ≥ (≤)f (a) ∀x ∈ V ∩ M,

donde V ⊂ U es un vecindario de a.
Para resolver este problema, suponemos que M es de dimensión r y codimensión s = n − r. Por lo
hecho en capı́tulo precedente, M se puede caracterizar alrededor de a ∈ M mediante σ : W ⊂ Rr → Rn
parametrización alrededor de a; o bien, como un conjunto de nivel de g : Rn → Rs , es decir

M = {x ∈ Rn |g(x) = 0}.

Teorema III.2.1 ((Condición necesaria)) Sea ⊂ Rn abierto, M ⊂ U subvariedad diferenciable f : U →


R continuamente diferenciable en a ∈ M. Si f |M admite un extremo relativo en a ∈ M, entonces

Ta M ⊂ ker f 0 (a). (III.2.1)

Demostración.- Como M es una variedad difenciable, existe σ : W ⊂ Rr → Rn parametrización local


alrededor de a. Como f |M presenta un valor extremal en a ∈ M , f ◦ σ admite un valor extremal en 0, por
lo tanto (f ◦ σ)0 (0) = 0. Aplicando la fórmula de derivación para la composición de aplicaciones,se tiene
f 0 (a) ◦ σ 0 (0) = 0, lo que conduce a que Im σ 0 (0) ⊂ ker f 0 (a), es decir

Ta M ⊂ ker f 0 (a).

Definición III.2.1 Un punto a ∈ calM satisfaciendo la condición (III.2.1) se llama punto crı́tico de f |M .

Los problemas de determinación de valores y puntos extremales de funciones restringidas sobre subvariedades
son formulados utilizando la forma submersiva para representar la subvariedad. Por otro lado la condición
(III.2.1) no es muy útil desde el punto de vista calculista.
46 CAPÍTULO III. MÁXIMOS Y MÍNIMOS LOCALES

Teorema III.2.2 (Multiplicadores de Lagrange) Sea U ⊂ Rn , f : U → R continuamente diferenciable


en un vecindario de a ∈ M = {x ∈ U |g(x) = 0} con g : U → Rs submersión alrededor de a. Si f |M posee un
extremo relativo en a ∈ M, entonces existe λ : Rs → R forma lineal (multiplicadores de Lagrange) tal que

f 0 (a) − λ ◦ g 0 (a) = 0, (III.2.2)

es decir: Ps
f 0 (a) − i=1 λi gi0 (a) = 0,
∂g1 ∂g1
···
 
∂x1 (a) ∂xn (a)
( ∂f ··· ∂f
− ( λ1 ··· ..
x1 (a) xn (a) ) λs )   = 0.
 
.
∂gs ∂gs
∂x1 (a) ··· ∂xn (a)

Demostración.- Como Ta M = ker g 0 (a), la condición

ker g 0 (a) ⊂ ker f 0 (a),

ver curso de algebra lineal espacios vectoriales cocientes, asegura la existencia de λ : Rn / ker g 0 (a) → Rs tal
que
f 0 (a) = λ ◦ g 0 (a).
Ahora bien Rn / ker g 0 (a) ∼
= Rs , con lo que se tiene (III.2.2).


Remarca III.2.1 Con la función de Lagrange o lagrangiano

L(x, λ) = f (x) − λ ◦ g(x)

las condiciones a ∈ M y (II.2.2) son equivalentes a

L0 (a, λ) = 0.

Ejemplo III.2.1 Sean


f (x, y, z) = x − y − z,
g1 (x, y, z) = x2 + 2y 2 − 1,
g2 (x, y, z) = 3x − 4z
y busquemos los valores extremos de f |M donde M = {(x, y, z) ∈ R3 |g1 (x, y, z) = 0, g2 (x, y, z) = 0}. El
conjunto M representa la intersección de un cilindro con un plano. Se verfica facilmente que g(x, y, z) es una
submersión para todo x ∈ M. La función de Lagrange está dada por

L(x, y, z, λ1 , λ2 ) = x − y − z − λ1 (x2 + 2y 2 − 1) − λ2 (3x − 4z).

Las condiciones necesarias (II.2.2) nos dan:

1 − 2λ1 x − 3λ2 = 0, −1 − 4λ1 y = 0, −1 + 4λ2 = 0,

Se obtiene λ2 = 1/4 y eliminando λ1 de las otras dos ecuaciones,se encuentra y+2x=0. Los puntos crı́ticos
son por consiguiente
(1/3, −2/3, 1/4) y (−1/3, 2/3, −1/4).

Al igual que la sección precedente, una vez determinados los puntos crı́ticos es determinar el carácter de
estos, dando condiciones necesarias y suficientes. En el caso de funciones definidas sobre abiertos de espacios
vectoriales normados, el análisis está centrado en el estudio de la segunda derivada. Ahora bien, para el
caso de puntos extremales sobre subvariedades se sigue con el mismo esquema, tomando en cuenta algunas
sutilezas.
Consideremos U ⊂ Rn abierto, M ⊂ U subvariedad, f : U → R de clase C 2 . Sean a ∈ M un punto crı́tico
de f |M , σ : Rr → Rn una parametrización local alrededor de a. Como a ∈ M es un punto crı́tico de f |M , se
III.2. MULTIPLICADORES DE LAGRANGE 47

tiene que 0 es un punto crı́tico de f ◦ σ, por consiguiente las condiciones necesarias y suficientes de la sección
precedente son válidas para O con f ◦ σ y por lo tanto serı́a suficiente estudiar (f ◦ ϕ)00 (0). Por otro lado
Ta M ∼= Rs por σ 0 (0), de donde definimos la forma bilineal simétrica

Hessa f |M : Ta M × Ta M −→ R
(III.2.3)
(h, k) 7 (f ◦ σ)00 (0)((σ 0 (0))−1 (h), (σ 0 (0))−1 (k))

Teorema III.2.3 Sean U ⊂ Rn abierto f : U → R dos veces continuamente diferenciable en M ⊂ U


subvariedad y g : U → Rs submersión de clase C 2 con M = {x ∈ U |g(x) = 0. Supongamos que a ∈ M es un
punto crı́tico de f |M , (por lo tanto existe λ : Rs → R forma lineal tal que f 0 (a) − λg 0 (a) = 0), entonces

Hessa f |M = f 00 (a) − λg 00 (a). (III.2.4)

y por consiguiente Hessa f |M indepediente de la parametrización local alrededor de a.

Demostración.- Sea σ : W ⊂ Rr → Rn una parametrización local alrededor de a punto crı́tico de f |M .


Denotamos h̃ = σ 0 (0)−1 (h) y k̃ = σ 0 (0)−1 (k). Se tiene

Hessa f |M (h, k) = (f ◦ σ)00 (0)(h, k) = f 00 (a)(h, k) + f 0 (a)σ 00 (0)(h̃, k̃).

Como a es un punto crı́tico, sabemos que f 0 (a) = λg 0 (a), de donde

Hessa f |M (h, k) = f 00 (a)(h, k) + λg 0 (a)σ 00 (0)(h̃, k̃).

Por otro lado g ◦ σ(x) = 0 para todo x ∈ W , de donde g 0 (a)σ 0 (0) = 0 y

(g ◦ σ)00 (0)(h̃, k̃) = g 00 (a)(h, k) + g 0 (a)σ 00 (0)(h̃, k̃) = 0,

de donde

Hessa f |M (h, k) = f 00 (a)(h, k) − λg 00 (a)(h, k).

Remarca III.2.2 La forma bilineal Hessa f |M nos permite tener las mismas condiciones necesarias y su-
ficientes para determinar el carácter de un punto crı́tico de funciones restringidas sobre subvariedades. La
fórmula (III.2.4) nos da una expresión sencilla a trabajar y el único cuidado que hay que tener es de trabajar
sobre los vectores del espacio tangente al punto crı́tico.

Ejemplo III.2.2 Utilizemos el teorema precedente para mostrar que el punto (1/3, −2/3, 1/4) es un máximo
relativo estricto de la función f |M del ejemplo 1 de esta sección. Como λ1 = 3/8 y λ2 = 1/4 tenemos para
h = (h1 , h2 , h3 )t
    
2 0 0 h1
3 1 3
( h1 h2 h 3 ) 0 −  0 4 0  − 0  h2  = − (2h21 + 4h22 ).
8 4 8
0 0 0 h3

h ∈ Ta M si g 0 (a)h = 0 en particular si 3h1 − 4h3 = 0, de donde

3 3 16 3 2
− (2h21 + 4h22 ) = − (h21 + 4h2 + h23 ) ≤ − khk2
8 8 9 8

y la condición suficiente para un máximo relativo estricto se verifica.


48 CAPÍTULO III. MÁXIMOS Y MÍNIMOS LOCALES

III.3. Ejercicios
1. Sea f : Rn → R dos veces diferenciable en a ∈ Rn . Demostrar que la condición
2
f 00 (a)(h, h) ≤ −γ khk ∀h ∈ Rn ,

con γ > 0 es equivalente a f 00 (a)(h, h) < 0 para todo h 6= 0.


2. Sea E = {f : [1, +∞) → R| f continua y acotada} con la norma k k∞ . Se considera la aplicación
F : E → R dada por Z ∞ 2 Z ∞ 3
f (t) f (t)
F (f ) = dt − dt.
1 t4 1 t2
Demostrar que:
a) F 0 (0) = 0 y F 00 (0)(h, h) > 0 para h 6= 0.
b) 0 ∈ E no es un mı́nimo relativo de F .

3. Mostrar que el valor maximal de la expresión


ax2 + 2bxy + cy 2
dx2 + 2exy + f y 2
es la raı́z más grande de

(df − e2 )λ2 − (af − 2be + cd)λ + (ac − b2 ) = 0.

4. Consideremos la función f (x, y, z) = αx2 ey + y 2 ez + z 2 ex . Demostrar que el origen es un punto crı́tico.


¿Para qué valor de α ∈ R, el origen es un punto extremal de f .

5. Sea m < n y A una matriz m×n de rango m. Entre todas las soluciones de Ax = b, encontrar utilizando
multiplicadores de Lagrange la solución para la cual kxk2 es minimal. Dar una interpretación geométrica
del resultado.

6. Sea E = C 0 ([0, 1]) y sea F : E → R dada por F (y) = 2y(0)3 − 3y(0)2 . Demostrar las afirmaciones
siguientes:
a) y0 (x) = 1 es un mı́nimo relativo de F , si E está provisto de la norma k k∞ .
b) y0 (x) = 1 no es un mı́nimo relativo de F , si de E está provisto de la norma k k1 .

7. Calcular geométricamente el mı́nimo de f |M donde f (x, y) = x2 + y 2 y

M = {(x, y)|g(x, y) = 0} con g(x, y) = y 2 − (x − 1)3 .

Mostrar que el sistema


f 0 (x) − λg 0 (x) = 0
no tiene solución. Explicar porque.

8. Calcular el valor maximal de


xα y β z γ (α, β, γ, xy, z > 0)
k k k
sujeta a la condición x + y + z = 1, (k > 0). Deducir la desigualdad
 u α  v β  w γ  u + v + w α+β+γ
≤ .
α β γ α+β+γ
III.3. EJERCICIOS 49

9. Calcular los extremos relativos de f (x, y, z) = x2 + y 2 + z 2 sobre M donde

x2 y2 z2
 
M = (x, y, z)| + + =1 y z =z+y .
4 9 25

Verificar las condiciones suficientes para un extremo.


50 CAPÍTULO III. MÁXIMOS Y MÍNIMOS LOCALES
Capı́tulo IV
Ecuaciones Diferenciales Ordinarias

Las ecuaciones diferenciales es un lenguaje muy cómodo y utilizado para modelisar una gran cantidad de
fenómenos de diversa ı́ndole, desde el movimiento de planetas y estrellas, fı́sica de grandes cuerpos; hasta
la dinámica de las moléculas. En Biologı́a, económica muchos problemas se resuelven utilizando ecuaciones
diferenciales para describir comportamientos y relaciones.
En el curso de Primer Año de Análisis se trato métodos de resolución de las ecuaciones ordinarias usua-
les. Sin embargo en casos muy raros se logra encontrar la solución bajo una forma analı́tica. En general,
uno está obligado a utilizar métodos numéricos para obtener soluciones, ver curso de Análisis Numérico. En
este capı́tulo vamos a tratar las cuestiones teóricas de las ecuaciones diferenciales ordinarias. En particu-
lar estudiaremos la existencia y unicidad de las soluciones, su sensibilidad respecto a perturbaciones y su
comportamiento sobre largos intervalos.

IV.1. Conceptos Básicos y Algunos Problemas


Definición IV.1.1 Un sistema diferencial de talla n y orden m es una expresión de la forma

F (t, x, ẋ, . . . , x(m) ) = 0,

donde
F : R × Rn × Rn × · · · × Rn → Rn .
| {z }
m+1 veces

continua, x(k) ∈ Rn k = 0, 1, . . . , m

Ejemplo IV.1.1 El movimiento balı́stico se rige por el sistema de ecuaciones diferenciales de orden 2.

ẍ = 0
ÿ = g

donde x denota la componente horizontal y y la componente vertical. La variable independiente “t” no


aparece de manera explı́cita.

Remarca IV.1.1 Se debe observar que:

1. Como la imagen de la función F es Rn , el sistema se lo expresa como

F1 (t, x, ẋ, . . . , x(m) ) = 0,


F2 (t, x, ẋ, . . . , x(m) ) = 0,
..
.
Fn (t, x, ẋ, . . . , x(m) ) = 0,

donde cada Fi : R × R(m+1)n → R es continua.

51
52 CAPÍTULO IV. ECUACIONES DIFERENCIALES ORDINARIAS

2. Para evitarse análisis complicados en la resolución de dichas ecuaciones, se prefiere trabajar con sistemas
explicitados, es decir, sistemas de la forma

x(m) = F (t, x, ẋ, . . . , x(m−1) ).

Más todavı́a con sistemas de orden 1.

Proposición IV.1.1 Todo sistema de ecuaciones diferenciales de orden m ≥ 1, es equivalente a un sistema


de primer orden.

Demostración.- Sea
x(m) == F (t, x, ẋ, . . . , x(m−1) ),
con x ∈ Rn un sistema de orden m y talla n. Introduciendo las variables

y1 =x
y2 = ẋ
..
.
ym = x(m−1)

se obtiene el sistema equivalente


ẏ1 = y2 ,
ẏ2 = y3 ,
..
.
ẏm−1 = ym ,
ẏm = F (t, y1 , y2 , . . . , ym ),
y denotando y = (y1 , . . . , ym ) ∈ Rnm se tiene lo que se quiere.

Remarca IV.1.2 En lo que sigue el capı́tulo, solo se considerará sistemas de primer orden, a menos que se
diga lo contrario.

Definición IV.1.2 Se dira que una función ϕ : I ⊂ R → Rn continuamente derivable es una solución del
sistema de primer orden, de talla n,
ẋ = f (t, x),
si ϕ̇(t) = f (t, ϕ(t)), ∀t ∈ I.

Sistemas Autónomos
Definición IV.1.3 Se dira que un sistema diferencial de talla n es autónomo si se puede escribir de la
forma
ẋ = f (x); (SDA)
es decir, la variable independiente t no aparece explı́citamente en el sistema diferencial.

Proposición IV.1.2 Todo sistema diferencial de primer orden, es equivalente a un sistema diferencial
autónomo.

Demostración.- Sea
ẋ = F (t, x),
un sistema diferencial no autónomo, planteando

xn+1 = t,
IV.1. CONCEPTOS BÁSICOS Y ALGUNOS PROBLEMAS 53

obtenemos esl sistema diferencial autónomo


ẋ = f (xn+1 , x)
ẋn+1 = 1;
 
x
y definiendo el vector X = ∈ Rn+1 , el sistema precedente lo escribimos como
xn+1
 
f (xn+1 , x)
Ẋ = F (X) = .
1

Definición IV.1.4 Cuando se trabaja con sistemas diferenciales autónomos (SDA), es costumbre llamar a
Rn espacio fase y las coordnedas de x, xi fase.

Definición IV.1.5 Si ϕ : I → Rn es una solución del (SDA), la imagen de ϕ, ϕ(I), se llama trayectoria
y en algunos casos linea de flujo.

Remarca IV.1.3 Se designa t la variable independiente haciendo en general referencia al tiempo. Una
solución describirá por consiguiente la ley de movimiento de un objeto, mientras que la trayectoria es la
traza dejada por el movimiento del objeto. La única información que puede proporcionar una trayectoria, es
las posiciones por don de ha estado el objeto y no el momento exacto. Sin embargo, a pesar de esta limitación
se puede obtener informaciones respecto a las soluciones conociendo las trayectorias. En la graficación de
las trayectorias, es corriente indicar el sentido del movimiento colocando una flecha para indicar. Ver figura
IV.1.1

xn

x2

x1

Figura IV.1.1: Trayectoria de una solución

Consideremos el sistema diferencial autónomo

ẋ = f (x),

y una solución ϕ : I → Rn . El vector tangente, (en fı́sica vector velocidad), en t = t0 es ϕ0 (t0 ) ∈ Rn . Ahora
bien
ϕ0 (t0 ) = f (ϕ(t0 )),
de donde a la trayectoria en el punto x∗ = ϕ(t0 ) se le puede asociar el vector tangente f (x∗ ). Ver figura
IV.1.2. Remarcamos inmediatamente que el lado derecho del (SDA) induce un campo de vectores tangentes
54 CAPÍTULO IV. ECUACIONES DIFERENCIALES ORDINARIAS

x*

Figura IV.1.2: Vector Tangente

(a las trayectorias) del Sistema Diferencial Autónomo, que lo denotamos


v : Rn → Rn
x 7→ f (x).
Es costumbre representar un campo de vectores en una gráfica, asociando a cada x ∈ Rn del espacio de fases
una flecha que corresponde el vector de la imagen. Ver figura IV.1.3.

Figura IV.1.3: Representación de un Campo de Vectores

Tipos de Soluciones
Consideremos el sistema diferencial autónomo de talla n
ẋ = F (x),
y ϕ : I ⊂ R → Rn una solución del sistema.
IV.1. CONCEPTOS BÁSICOS Y ALGUNOS PROBLEMAS 55

Definición IV.1.6 Se dirá que ϕ es una solución estacionaria si ϕ(t) = x∗ ∈ Rn para todo t ∈ I.
Definición IV.1.7 Se dirá que ϕ es una solución periódica si existe T > 0 tal que ϕ(t + T ) = ϕ(t) para
todo T , si es el caso T se llama periodo.
Proposición IV.1.3 Sea ẋ = F (x) un sistema autónomo, entonces:
a) ϕ es una solución estacionaria, si y solamente si la trayectoria de ϕ se reduce a un punto en el espacio
de fases, si y solamente si F (ϕ(t)) = 0.
b) ϕ es una solución periodica no estacionaria si y solamente s i la trayectoria de ϕ es una curva cerrada
y F no se anula nunca sobre la trayectoria.
Remarca IV.1.4 La proposición precedente para encontrar soluciones estacionarias nos da un medio al-
gebraico, resolver F (x) = 0 y un medio gráfico viendo las trayectorias que se reducen a un punto. En las
soluciones estacionarias, tenemos un medio gráfico que el estudio de las trayectorias cerradas.
Ahora bien, poder decidir si una curva es cerrada o no, es en general bastante complicado si n > 2. En el
plano es posible en general.

Por otro lado, un gran número de las aplicaciones de los sistemas diferenciales autónomos es de talla 2.
Por lo que vale la pena estudiarlos.

Sistemas Autónomos de Talla 2


Aparte de los sistemas autónomos de talla 2
˙  
x x
=F ,
y y
es frecuente estudiar las ecuaciones diferenciales de segundo orden de la forma
ẍ = f (x, ẋ),
donde x depende de t como un sistema autónomo de talla 2. Con tal motivo se plantea
x1 = x,
x2 = ẋ;
el sistema diferencial autónomo equivalente está dado por
 ˙   
x1 x2
= ,
x2 f (x1 , x2 )
y las componentes del plano de fases son x1 = x (la posición) y x2 = ẋ (la velocidad).
Volvamos al sistema
ẋ = F (x),
donde x ∈ R2 . F (x) induce un campo de vectores tangentes a las trayectorias. Aprovechando la relación
dx2 ẋ2
= ,
dx1 ẋ1
vista en Cálculo I, y si F (x1 , x2 ) = (F1 (x1 , x2 ), F2 (x1 , x2 )), las trayectorias son los grafos de las soluciones
de la ecuación diferencial
dx2 F2 (x1 , x2 )
= ,
dx1 F1 (x1 , x2 )
o bien los grafos de las soluciones de la ecuación diferencial
dx1 F1 (x1 , x2 )
= ,
dx2 F2 (x1 , x2 )
Acabamos de formular un método que nos determina las trayectorias, sin necesidad de conocer las soluciones
del sistema diferencial autónomo.
56 CAPÍTULO IV. ECUACIONES DIFERENCIALES ORDINARIAS

Remarca IV.1.5 Una familia de curvas en R2 pueden ser las trayectorias de muchos sistemas diferenciales,
pero el campo de pendientes de las curvas es único.
Ejemplo IV.1.2 (Predador-Presa) El comportamiento de dos poblaciones de animales en un ambiente
aislado en el que una de las poblaciones son por ejemplo conejos y la otra población son lobos se puede
modelar por el sistema diferencial
ẋ = x(α − βy),
ẏ = y(γx − δ)
donde x(t) represanta la población de conejos en el instante t e y(t) representa la población de lobos en el
instante t. Las trayectorias satisfacen la ecuación diferencial
y(γx − δ)
y0 =
x(α − βy)
que es una ecuación diferencial separable. Resolviendo la ecuación obtemos como solución general (en forma
implı́cita)
γx − δ ln x = α ln y − βy + C. (IV.1.1)
Las trayectorias del sistema diferencial son las curvas de nivel de (IV.1.1). En la figura II.4 están graficadas
las curvas de nivel de (IV.1.1) para α = 1, β = 1, γ = 2 y δ = 3. Observamos que las curvas de nivel son
curvas cerradas, por lo que deducimos que el comportamiento de estas poblaciones es cı́clico.

Figura IV.1.4: Trayectorias del Sistema Diferencial

Aplicaciones Geométricas
Veremos, cómo la utilización de conceptos relacionados a las ecuaciones y sistemas diferenciales permite la
resolución de problemas relacionados a familias de curvas, en particular curvas uniparamétricas, del plano.
Definición IV.1.8 Una familia de curvas uniparamétricas, es una familia de curvas si existe una función
F : R2 × R → R, de manera que cada curva es el lugar geométrico de los puntos (x, y) que satisfacen la
ecuación
F (x, y, c) = 0,
dejando c ∈ R fijo. La ecuación se llama ecuación general de la familia de curvas y c es el paramétro.
IV.1. CONCEPTOS BÁSICOS Y ALGUNOS PROBLEMAS 57

Proposición IV.1.4 Una familia de curvas es uniparamétrica, si y solamente si existe una función continua
f : R × R → R2 , de manera que las funciones ϕα : R → R2 definidas por

ϕα (t) = f (t, α),

sean parametrizaciones de cada una de las curvas de la familia.

Demostración.- Ejercicio.

Ejemplo IV.1.3 Las circunferencias centradas en el origen forman una familia uniparamétrica. En efecto,
la ecuación general es
x2 + y 2 − r2 = 0,
las parametrizaciones de las circunferencias centradas en el origen están dadas por

x(t) = r cos t
y(t) = r sin t.

Remarca IV.1.6 La solución general de una ecuación diferencial de primer orden que satisface una condi-
ción de Lipschtiz es una familia uniparamétrica de curvas. Asimismo, las trayectorias pueden de un sistema
diferencial autónomo forman una familia uniparamétrica, si el sistema satisface una condición de Lipschtiz;
las soluciones del sistema vienen a ser las parametrizaciones de las curvas.

Proposición IV.1.5 Para toda familia uniparamétrica existe una ecuación diferencial y 0 = f (x, y) cuya
solución general son las curvas de la familia uniparamétrica. Además también existe un sistema diferencial
autónomo cuyas trayectorias son las curvas de la familia uniparamétrica.

Demostración.- Sea F (x, y, c) = la ecuación general de la familia de curvas uniparamétrica. Derivando


respecto a x, se obtiene,
∂F ∂F
(x, y, c) + (x, y, c)y 0 = 0.
∂x ∂y
Por consiguiente, y 0 , c dejando x, y fijos, satisfacen el sistema de ecuaciones (algebraicas)

F (x, y, c) = 0
∂F
∂x (x, y, c) + ∂F
∂y (x, y, c)y 0 = 0,

de donde es posible obtener y 0 en función de x e y, es decir

y 0 = f (x, y).

Para el sistema, es suficiente considerar g1 (x, y) y g2 (x, y) de manera que

g2 (x, y)
f (x, y) = ,
g1 (x, y)

por lo que las curvas son trayectorias del sistema

ẋ = g1 (x, y)
ẏ = g2 (x, y).

Remarca IV.1.7 Para la existencia de f (x, y) se deberá considerar hipótesis suplementarias de F (x, y, c).
58 CAPÍTULO IV. ECUACIONES DIFERENCIALES ORDINARIAS

Ejemplo IV.1.4 La familia de parábolas de vértice el origen y eje de simetrı́a el eje y, satisface la ecuación
general
y = cx2 ,
derivando, se obtiene
y 0 = 2cx,
despejando c de la ecuación general obtenemos la ecuación diferencial
2y
y0 = .
x

Condiciones para que una familia de curvas sea uniparamétrica


Hemos visto que para que una familia de curvas sea uniparamétrica es necesario la existencia de una ecuación
general. Sin embargo encontrar dicha ecuación es en general una tarea complicada.
Ahora bien, utilizando resultados sobre las trayectorias y soluciones de ecuaciones y sistemas diferenciales,
uno se puede dar cuenta si una familia es uniparamétrica o no. En efecto, supongamos que tenemos una
familia de curvas uniparamétrica y sea
˙  
x F1 (x, y)
= F (x, y) =
y F2 (x, y)
un sistema autónomo cuyas trayectorias son las curvas de la familia en cuestión. En general las funciones
F (x, y) tienen a lo más un número finito de soluciones del sistema F (x, y) = (0, 0) en cada región acotada,
para e fectos prácticos consideramos regiones rectangulares de la forma [a, b] × [c, d].
Por otro lado observamos que si en el punto (x, y), F (x, y) 6= 0, solo pasa por este punto una trayectoria.
Si F (x, y) = 0, (x, y) es un punto estacionario en que enventualmente pueden confluir y o emerger varias
trayectorias. En consecuencia, si en una región rectangular existen una infinidad de puntos en los cuales
pasan diferentes curvas, esta familia no es uniparamétrica.
Ejemplo IV.1.5 La familia de circunferencias del plano, no es una familia uniparmétrica porque por cada
punto del plano pasa una infinidad de circunferencias.
Ejemplo IV.1.6 La familia de circunferencias de centro en el eje x y que pasan por el origen, ver figura
IV.1.5, puede ser una familia uniparmétrica, solo existe un punto, el origen, por el cual pasa una infinidad
de circunferencias, por los otros, pasa exactamente una circunferencia. Ahora bien, esta es una familia
uniparamétrica, cuya ecuación general es facilmente deducible y es
(x − r)2 + y 2 − r2 = 0,
o bien
x2 + y2 − 2rx = 0.
Determinemos la ecuación diferencial y es sistema diferencial. Se tiene
x2 + y 2
r= ,
x
derivando obtenemos
2x2 + 2yy 0 x − x2 − y 2
0= ,
x2
despejamos y 0 , se obtiene
y 2 − x2
y0 = ,
2xy
de donde el sistema estará dado por
ẋ = 2xy
ẏ = y 2 − x2

Remarca IV.1.8 Es importante encontrar un sistema diferencial autónomo cuyas trayectorias sean las
curvas de una familia de curvas uniparamétrica, porque nos permite determinar un campo de vectores
tangentes. Y manipular vectores (tangentes) es mucho más sencillo que manipular las curvas.
IV.1. CONCEPTOS BÁSICOS Y ALGUNOS PROBLEMAS 59

Figura IV.1.5: Familia de Circunferencias

Familias de curvas que forman un ángulo dado con una familia de curvas dada
Consideremos el siguiente problema: “Dada una familia de curvas uniparamétrica, encontrar una familia de
curvas que forme un ángulo θ”. Interpretemos lo que significa este problema. El concepto de ángulo es un
concepto para rectas, que se generaliza a las curvas, definiendo el angulo entre dos curvas, como el ángulo
de los vectores tangentes, ver figura IV.1.6. Por consiguiente, determinamos primero el campo de vectores

D
u

Figura IV.1.6: Angulo entre dos curvas

tangentes a la familia de curvas dada, ya sabemos cómo, sea


 
v1 (x, y)
v(x, y) =
v2 (x, y)

el campo de vectores dados. Obtenemos el campo u(x, y) de la familia de curvas que forman el ángulo dado,
rotando por un ángulo θ, el campo v(x, y), es decir
    
u1 (x, y) cos θ − sin θ v1 (x, y)
= .
u2 (x, y) sin θ cos θ v2 (x, y)
60 CAPÍTULO IV. ECUACIONES DIFERENCIALES ORDINARIAS

El siguiente paso es considerar el sistema autónomo


˙  
x u1 (x, y)
=
y u2 (x, y)

y determinar las trayectorias, que ya sabemos hacer.

Ejemplo IV.1.7 Consideremos nuevamente la familia de circunferencias de centro en el eje x y que pasan
por el origen y encontremos la familia de curvas ortogonales a esta familia de circunferencias. En el ejemplo
4, hemos encontrado un campo de vectores tangentes, dado por
 
2xy
v(x, y) = .
y 2 − x2

Aplicando una rotación de 90 grados obtenemos


    2 
0 −1 2xy x − y2
u(x, y) = = ,
1 0 y 2 − x2 2xy

de donde, las curvas ortogonales, son trayectorias del sistema diferencial


˙  2 
x x − y2
= .
y 2xy

Determinamos las trayectorias, resolviendo la ecuación diferencial


2xy
y0 = ,
x2 − y2

cuya solución general es


x2 + y 2 − cy = 0,
que es la ecuación general de una familia de circunferencias de centro el eje y y que pasan por el origen.

IV.2. Existencia y Unicidad del Problema de Cauchy


Consideremos el problema de Cauchy

ẋ = f (t, x), x(t0 ) = x0 (IV.2.1)

donde f : U → Rn (con U ⊂ R × Rn abierto) es una función continua. Integrando la ecuación diferencial


entre t0 y t, se obtiene la ecuación integral
Z t
x(t) = x0 + f (s, x(s)) ds. (IV.2.2)
t0

Cada solución de (IV.2.1) es solución de (IV.2.2). Lo contrario es también cierto, Si una función continua
y(x) verifica (IV.2.2) sobre un intervalo I, entonces es automáticamente de clase C 1 y verifica (IV.2.1).

Iteración de Picard-Lindelöf
La ecuación (IV.2.1) puede ser considerada como un problema de punto fijo en C(I). Por consiguiente, la idea
es aplicar el método de las aproximaciones sucesivas, ver capı́tulo I. El método se escribe para este problema
en particular
x0 (t) = x0 (o una función arbitraria)
Rt (IV.2.3)
xk+1 (t) = x0 + t0 f (s, xk (s)) dt.
IV.2. EXISTENCIA Y UNICIDAD DEL PROBLEMA DE CAUCHY 61

Figura IV.1.7: Curvas ortogonales

1 





 


0
1 2 3 4

Figura IV.2.8: Iteración de Picard-Lindelöf para el problema del ejemplo 1.

Ejemplo IV.2.1 Consideremos el problema

ẋ = −x2 , x(0) = 1

con solución exacta x(t) = 1/(1 + t). Las primeras aproximaciones obtenidas por la iteración de Picard-
Lindelöf son x0 (t) = 1, x1 (t) = 1 − t y x2 (t) = 1 − x + x2 − x3 /3. Se observa una convergencia rápida hacia
la solución exacta en el intervalo [0, 3,75]. Para t demasiado grande, la iteración diverge.

Proposición IV.2.1 Sea A = {(x, y) ∈ R × Rn | |x − x0 | ≤ a, ky − y0 k ≤ b}, f : A → Rn una función


continua y M = máx kf (x, y)k. Para α = mı́n{a, b/m} el operador
(x,y)∈A

Z x
(T y)(x) = y0 + f (t, y(t)) dt
x0

está bien definido sobre B = {y : [x0 − α, x0 + α] → Rn | ycontinua y ky(x) − y0 k ≤ b} y satisface T (B) ⊂ B


62 CAPÍTULO IV. ECUACIONES DIFERENCIALES ORDINARIAS

Demostración.- La afirmación es una consecuencia de


Z x Z x

k(T y)(x) − y0 k =
f (t, y(t)) dt ≤
kf (t, y(t))k dt ≤ M |x − x0 | ≤ M α ≤ b.
x0 x0

Se dice que una función f : A → Rn , A como en la proposición precedente satisface una condición de
Lipschitz si
kf (x, y) − f (x, z)k ≤ L ky − zk para (x, y), (x, z) ∈ A.
La constante L se llama constante de Lipschitz.

Remarca IV.2.1 Remarcamos que la condición de Lipschitz no es una consecuencia de la continuidad de


f (x, y). Por ejemplo la función y 2/3 es continua y no verifica una condición de Lipschtz. Por otro lado una
función de clase C 1 verifica una condición de Lipschitz, como consecuencia del teorema de incrementos finitos.

Si f (x, y) satisface una condición de Lipschitz y si αL < 1, el operador T de la proposición precedente es


una contracción sobre B. Por consiguiente en este caso se puede aplicar el teorema del punto fijo de Banach
para concluir que T y = y posee una solución única en B. Vamos a mostrar la existencia y unicidad de una
solución sin esta condición suplementaria sobre α.

Teorema IV.2.1 Consideremos el conjunto A = {(x, y) ∈ R × Rm | |x − x0 | ≤ a, ky − y0 k ≤ b} y suponga-


mos que f :→ Rn sea continua y satisfaga una condición de Lipschitz.
Entonces, el problema de Cauchy y 0 = f (x, y) y(x0 ) = y0 posee una solución única sobre I = [x0 − α, x0 + α],
donde α = mı́n{a, b/M } y M = máx kf (x, y)k.
(x,y)∈A

Demostración.-

También podría gustarte