Documentos de Académico
Documentos de Profesional
Documentos de Cultura
ITULO 1. C
(0, 0; ) D ,= donde la
bola con centro en (0, 0) y radio se dene como
B
(0, 0) = (x, y) [
_
x
2
+ y
2
<
y la notacion B
1
(0, 0). Es claro entonces que (0, 0) es punto se acumulacion de D.
La siguiente es una tabla de valores (x, y) tomados al azar y los corre-
spondientes valores de f(x, y)
1.1. L
ITULO 1. C
(a, b) entonces
[x a[, [y b[
_
(x a)
2
+ (y b)
2
<
1.1. L
ITULO 1. C
ITULO 1. C
(t) = (t cos )
2
+ 2(t sin )
2
= (cos
2
+ 2 sin
2
)t
2
= (1 + sin
2
)t
2
10 CAP
ITULO 1. C
u
(0)
1.3. DERIVADA DIRECCIONAL, PARCIAL Y GRADIENTE 11
-2 -1 1 2
-1
-0.75
-0.5
-0.25
0.25
0.5
0.75
1
Figure 1.3: Gracos de algunas funciones f
(t)
-2
-1
0
1
2
x
-2
-1
0
1
2
y
-5
0
5
z
-2
-1
0
1
2
y
Figure 1.4: Graco de z = x
2
y
2
12 CAP
ITULO 1. C
ITULO 1. C
ITULO 1. C
() = D
1
f(a, b) cos + D
2
f(a, b) sin
Por lo tanto la direccion de maximo crecimiento se obtiene maximizando la
tasa de crecimiento instantanea m respecto de . Igualando la derivada a
cero obtenemos
0 = m
() = D
1
f(a, b) sin + D
2
f(a, b) cos .
Vemos que cualquier solucion es de la forma
(cos , sin ) = (D
1
f(a, b), D
2
f(a, b))
en donde es un escalar, siempre que el vector (D
1
f(a, b), D
2
f(a, b)) sea
distinto de cero. Este se llama el vector gradiente
f(a, b) = (D
1
f(a, b), D
2
f(a, b)),
y determina una direccion
0
de crecimiento crtica
(cos
0
, sin
0
, ) =
f(a, b)
[[f(a, b)[[
En efecto,
m
(
0
) = [[f(a, b)[[
2
y la direccion crtica
0
es de maximo crecimiento.
Enunciemos esta propiedad importante
Proposicion 3. Sea : B
r
(a, b) R
2
y u = (cos , sin ) un vector unitario
en la direccion . La direccion de maximo crecimento de f a partir del punto
(a, b) es
(cos
0
, sin
0
) =
f(a, b)
[[f(a, b)[[
1.3. DERIVADA DIRECCIONAL, PARCIAL Y GRADIENTE 17
Ejemplo 1.312. Encuentre el angulo de la direccion de maximo crecimiento
de la funcion f(x, y) = x
2
+ 2y
2
en el punto (1, 1).
Tenemos
f
(t) = (1 +t cos )
2
+ 2(1 +t sin )
2
de donde la tasa de crecimiento en la direccion es
m() = 2 cos + 4 sin
Resolviendo la ecuacion
0 = m
() = 4 cos 2 sin
obtenemos
tan = arccos(2)
o bien = arctan(2). Existe una solucion en (/2, /2) [(cos , sin ) en el
primer cuadrante] y otra en (/2, 3/2) [(cos , sin ) en el tercer cuadrante],
que diere por . Usando la formula
cos =
1
1 + tan
2
, sin =
tan
1 + tan
2
5
, sin =
2
5
(1.3)
La segunda solucion solo diere en signo. Es facil ver que m
(
0
) < 0 para
(cos , sin ) en el primer cuadrante de modo que la direccion de maximo
crecimento es (1.3).
Calculando directamente el vector unitario en la direccion del gradiente
en (1, 1) obtenemos
f(x, y) = (2x, 4y), de donde
f(x, y)
[[f(x, y)[[
=
(2, 4)
2
5
= (
1
5
,
2
5
)
que es consistente con
Otra propiedad importane del gradiente es en relacion a las curvas de
nivel f(x, y) = constante
Proposicion 4. Sea f : B
r
(a, b) R
2
, Si f(a, b) ,= 0, entonces f(a, b)
es ortogonal a la curva de nivel f(x, y) = c que pasa por (a, b).
18 CAP
ITULO 1. C
(a) = (
f
x
(a, b),
f
y
(a, b)) (1, m)
donde (1, m) es el vector tangente a la curva de nivel en el punto (a, b). Lo
anterior nos dice que la curva de nivel es ortogonal al gradiente en ese punto.
Si la curva de nivel se pude parametrizar como x = h(y) el argumento es
similar. El teorema de la funcion implicita garantiza que si f(a, b) ,= 0
alguna de las parametrizaciones anteriores es posible.
Ejemplo 1.313. En la gura (1.10) se muestran las curvas de nivel de una
funcion f(x, y). Estime la direccion de maximo crecimiento de la funcion en
puntos sobre la curva del nivel 1.
El campo gradiente asociado a una funcion z = f(x, y) es al campo vecto-
rial X = f. En la gura 1.11 se muestra el campo gradiente junto con las
curvas de nivel para la funcion f(x, y) = (x
2
+y
2
) exp(x
2
y
2
). Observe la
propiedad mencionada en la proposicion (4). a la curv
1.3. DERIVADA DIRECCIONAL, PARCIAL Y GRADIENTE 19
2 1.5 1 0.5 0 0.5 1 1.5 2
2
1.5
1
0.5
0
0.5
1
1.5
2
0.1
0
.
1
0
.
1
0
.1
0.1
0
.
1
0
.
1
0
.1
0
.
1
0.1
0
.
2
0.2
0
.2
0
.
2
0
.
2
0.2
0
.2
0
.
2
0
.
2
0
.2
0
.
3
0.3
0
.3
0
.
3
0
.3
0.3
0
.
3
0
.
3
0.3
0.3
0
.
4
0.4
0
.
4
0.4 0
.
4
0
.
4
0.4
0
.
4
0.4
0
.
4
0
.5
0
.5
0.5
0
.
5
0.5 0.5
0.5
0
.
5
0
.6
0
.
6
0
.6
0.6
0
.
6
0
.6
0
.7
0.7
Figure 1.10: Curvas de nivel f(x, y) = const..
-2 -1 0 1 2
-2
-1
0
1
2
Figure 1.11: Curvas de nivel de la funcion f(x, y) = (x
2
+y
2
) exp(x
2
y
2
)
y su campo gradiente.
20 CAP
ITULO 1. C
2
t
2
2
+ t
4
4
= lim
t0
t(
2
2
+ t
2
4
)
por lo tanto si ,= 0 entonces D
u
f(0, 0) = 0. Si = 0 se verica directa-
mente que f(t, t) = 0, por lo tanto D
u
f(0, 0) = 0 para cualquier direccion
u.
Un ojo a la graca 1.13 en un entorno de (0, 0) nos sugiere que la funcion
puede no ser continua ah.
22 CAP
ITULO 1. C
(a) es la derivada de f en a.
Observe que la existencia del lmite anterior es equivalente a escribir
f(a + h) f(a) = f
(a)h) en donde
lim
h0
r(h)
h
= 0 (1.5)
Diremos que r(h) es un residuo de primer orden y escribiremos
1
r(h) = o(h).
Concretamente, (1.4) es una denicin equivalente de derivada:
1
Precisamente: si (h) es una funci on real denida para h proximo de cero, diremos
que (h) = o(h) si lim
h0
(h)
h
= 0.
1.5. LA DERIVADA 23
Proposicion 5. Sea f : (a r, a +r) R R. Entonces f es derivable en
a si y solo si existe un n umero con la propiedad
f(a + h) f(a) = h + r(h)
en donde
lim
h0
r(h)
h
= 0
Demostraci on.
Hemos probado ya que si f
(a) existe,
lim
h0
f(x + h) f(a)
h
= lim
h0
h + r(h)
h
= + lim
h0
r(h)
h
=
es decir la derivad existe y es precisamente f
(a) = .
Observe que de la igualdad (1.4) se sigue que
lim
h0
f(a + h) = f(a)
equivalentemente lim
xa
f(x) = f(a), lo que signica que la funcion debe ser
continua en a.
Teorema 2. Sea f : (a r, a +r) R R. Si f es derivable en a entonces
es continua en a.
Con el n de tener una notacion mas comoda introducimos la nocion de
incremento funcional
Denicion 5. Si z = f(x, y) est a denida en una bola B
r
(a, b) R
2
, den-
imos el incremento funcional en el punto (a, b) con incrementos independi-
entes (h, k) como
f(a, b; (h, k)) = f(a + h, b + k) f(a, b)
Adoptaremos (1.4,1.5) como denicion, pues tiene varias ventajas sobre
la original, en particular que puede extenderse al caso general de funciones
denidas entre espacios euclideanos de cualquier dimension y a un entre es-
pacios de dimension innita.
24 CAP
ITULO 1. C
h
2
+ k
2
= 0
Por un resultado del Analisis que se vera en la segunda parte de estas no-
tas, todas las normas en R
n
son equivalentes, es decir dan el mismo lmite,
cuando existe. En particular podemos utilizar cualquier norma conveniente
en el denominador de la expresion anterior. As, la propiedad de residuo es
equivalente a, p.ej.
lim
(h,k)(0,0)
r(h, k)
[h[ +[k[
= 0
y en casos concretos podemos usar la norma que mas convenga.
Observaci on 3. En la denicion de derivada (7) podemos escribir
f(a, b; (h, k)) = Df(a, b) (h, k) + r(h, k)
y en el mismo sentido que para funciones de una variable la derivada es la
mejor aproximacion lineal a la graca de la supercie z = f(x, y) en un
entorno del punto (a, b, f(a, b)).
Observaci on 4. Que la funcion sea derivable en (a, b) es mas fuerte solo
tener derivadas parciales y a un direccionales. Con mas precision:
Proposicion 6. Sea f : B
r
(a, b) R
2
R. Si f es derivable en (a, b)
entonces existen las derivadas direccionales en (a, b) en cualquier direccion.
Demostraci on.
Porque si (, ) es un vector unitario, tomando en la dencion de derivada (??)
los incrementos independientes cmo (h, k) = (t, t) se tiene
f(a + t, b + t) f(a, b) = (t) + (t) + r(t, t)
Si ahora calculamos el cociente que dene la derivada direccional
f(a + t, b + t) f(a, b)
t
= + +
r(t, t)
t
= + +
r(t, t)
[[(t, t)[[
[[(t, t)[[
t
= + +
r(t, t)
[[(t, t)[[
[t[
t
26 CAP
ITULO 1. C
h
2
+ k
2
= lim
(h,k)(0,0)
h
2
h
2
+ k
2
+ lim
(h,k)(0,0)
2bk
2
h
2
+ k
2
+
lim
(h,k)(0,0)
k
3
h
2
+ k
2
+
usando alguna de las desigualdades h
2
+k
2
h
2
, h
2
+k
2
k
2
se pude probar
que cada termino tiene lmite cero.
Ejemplo 1.517. Investigar la diferenciablidad de f(x, y) = sin x + sin y.
f(a, b; (h, k)) = sin(a + h) + sin(b + k) sin(a) sin(b)
= sin a cos h + sin b cos k sin(a) sin(b)
En este caso la expansion en terminos lineales en h, k podra hacerse usando
el teorema del valor medio
sin a cos h + sin b cos k sin(a) sin(b)
= sin(a) + cos(a)h + sin(b) cos(b)k sin(a) sin(b)
= cos(a)h cos(b)k
en donde a esta entre a y a+h y b esta entre b y b+k. Por ello a depende
de a y h , b depende de by k. Necesitamos coecientes lineales en h y k que
no dependan de h, k. Ello puede subsanarse notando que para (h, k) proximo
a cero, (a, b) es proximo a de (a, b), luego podemos escribir
f(a, b; (h, k)) = (cos(a) cos(a))h (cos(b) cos(b))k
= cos(a)h cos(b)k + r(h, k)
28 CAP
ITULO 1. C
h
2
+ k
2
[
[(cos(a) cos(a))[
[h[
h
2
+ k
2
+ [ sin(b) sin(b))[
[k[
h
2
+ k
2
Los terminos [(cos(a) cos(a))[, [ sin(b) sin(b))[ tienden a cero cuando
(h, k) (0, 0) por continuidad de las funciones cos, sin, en tanto que los
factores
[h[
h
2
+ k
2
0,
[k[
h
2
+ k
2
0.
En conclusion f es diferenciable en todo punto (a, b) y
Df(a, b) (h, k) = cos(a)h cos(b)k
1.6 Derivacion de funciones en R
n
R
m
En lo que sigue supondremos, salvo pocas excepciones, que las funciones a
considerar estan denidas en todo un espacio euclideano, para simplicar la
notacion y presentar ms claramente los conceptos basicos. Sin embargo, todos
los enunciados pueden facilmente reescribirse en terminos de los dominios
apropiados. Volveremos a este punto al establecer la Regla de la Cadena.
Por ultimo, en algunos temas de caracter local, tales como los Teoremas
de Funcion Implcita e Inversa es indispensable considerar que las funciones
estan solo denidas en ciertos subconjuntos de los espacios euclideanos re-
spectivos.
Denicion 8. Sea f : R
n
R
m
, p R
n
. Decimos que f es diferenciable en
p si existe una transformaci on lineal : R
n
R
m
tal que
f(p +h) f(p) = h + r(h)
1.7. ALGUNAS PROPIEDADES TE
ORICAS 29
donde
lim
h0
r(h)
[[h[[
= 0
Ejemplo 1.618. [Derivada de una constante]. Sea f : R
n
R
m
, f(z) = c,
una constante, entonces f(p; h) = 0, por lo que Df(p) 0 (la funcion
lineal cero).
Ejemplo 1.619. [Derivada de una transformacion lineal]. Si L: R
n
R
m
es lineal, entonces DL(p) = L para todo p R
n
. pues L(p + h) L(p) =
L(p) + L(h) L(p) = L(p) asque la transformacion lineal que funciona es
la misma L con residuo identicamente igual a cero.
Observaci on 7. Los ejemplos anteriores muestran que es necesario distinguir
entre em la derivada en un punto, la cual es una transformacion lineal, y la
funcion derivada, la cual es una funcion que asocia a cada punto x donde la
derivad exista una transformacion lineal. As, para f : R
n
R
m
, tenemos
que
Df(x) L(R
n
, R
m
) es una transformaci on lineal,
en tanto que
Df : U R
n
L(R
n
, R
m
),
donde U es el conjunto de puntos donde la funcion es derivable, es una
funcion que no es necesariamente lineal. En el ejemplo 1.5, Df(x, y) (h, k) =
2xh + 3y
2
k no es lineal con respecto a x o y. Desde luego, jado el punto
(x, y) la transformacion correspondiente es lineal en (h, k).
Ejemplo 1.620. Podemos incluir el caso de funciones f : R R en nues-
tra denicion general. En principio, la derivada de una tal funcion en un
punto es un n umero: f
R
m
. Este conjunto es en smismo un espacio vectorial, pues estan denidas la
30 CAP
ITULO 1. C
n
i=1
[x
i
[ para x R
n
y de manera similar en R
m
. Recurriendo a una base
cualquiera e
i
, i = 1, 2, . . . , n de R
n
, obtenemos
[[L(x)[[
R
m = [[L(
n
i=1
x
i
e
i
)[[
R
m
= [[
n
i=1
x
i
L(e
i
)[[
R
m
M
n
i=1
[x
i
[ = M[[x[[
R
m
para alguna constante M > 0, ya que el conjunto [[L(e
i
)[[
R
m [ i = 1, 2, . . . , n
es nito. En otras palabras, para toda x distinto de 0 el cociente
[[L(x)[[
R
m
[[x[[
R
m
esta acotado, por lo tanto podemos considerar
[[L[[
R
n
,R
m sup
[[L(x)[[
R
m
[[x[[
R
m
[ x ,= 0
Se puede vericar que [[L[[
R
n
,R
m dene una norma en el espacio vectorial
L(R
n
, R
m
) (vease la parte II de estas notas). En particular, si en lo sucesivo
omitimos los subnidices en las normas involucradas,
[[Lx[[ [[L[[[[x[[ (1.7)
para toda x R
n
.
Se tiene en particular
1.7. ALGUNAS PROPIEDADES TE
ORICAS 31
Proposicion 7. Sea L L(R
n
, R
)
entonces L es continua en 0. Adem as
son equivalentes la siguientes armaciones:
1. L es continua en 0.
2. L es continua en x para toda x R
n
.
Demostraci on.
De la desigualdad (1.7) se sigue que [[L x[[ < si [[x[[ < /[[L[[, por lo tanto
L es continua en 0.
Suponga ahora que L es continua en 0. Para x, y R
n
se tiene
[[L x L y[[ = [[L (x y)[[ [[L[[[[x y[[
lo que prueba que L es continua en x.
Analogamente, una funcion B: R
n
R
n
R
m
se dice bilineal si para
x R
n
jo la funcion B(x, ): R
n
R
m
es lineal y para y R
n
jo la
funcion B(, y): R
n
R
m
es lineal. Al igual que para las funciones lineales
recurriendo a una base e
i
, i = 1, 2, . . . , n de R
n
, podemos escribir
[[B(x, y)[[ = [[
n
i,j=1
x
i
y
j
B(e
i
, e
j
)[[
i=1
[x
i
[[y
j
[B(e
i
, e
j
)[[
n[[x[[
n
i=1
[y
j
[B(e
i
, e
j
)[[
n
2
[[x[[[[y[[
n
i=1
[[B(e
i
, e
j
)[[
M[[x[[[[y[[
para alguna constante M > 0, de donde el cociente
[[B(x, y)[[
[[x[[[[y[[
es siempre acotado, si x, y ,= 0. Por lo tanto se puede denir la norma de la
aplicacion bilineal B, como
[[B[[ = sup
[[BL(x, y)[[
[[x[[[[y[[
[ x, y ,= 0
32 CAP
ITULO 1. C
L(R
n
, R) satisfacen ambas
f(p; h) = h + o(h), f(p; h) =
h + o(h),
entonces =
Demostraci on.
Restando ambas igualdades tenemos
S h = o(h)
donde S =
, es decir
lim
h0
S h
[[h[[
= 0
Tomemos una base de vectores unitarios e
i
, i = 1, 2, . . . , n y de manera
sucesiva en i, h = e
i
, con 0+ luego,
0 = lim
h0
S h
[[h[[
= lim
0
S e
i
[[
=
[[
S e
i
= S e
i
para i = 1, 2, . . . , n, es decir S 0 como transformacion lineal. Por lo tanto
=
.
El resultado anterior justica hablar de la derivada en el punto p y es-
cribirla como Df(p).
Teorema 3. Si la derivada de f : R
n
R
m
en p existe, entonces la funci on
es continua en p.
1.7. ALGUNAS PROPIEDADES TE
ORICAS 33
Demostraci on.
Como Df(p) es lineal, entonces es continua en 0, de
f(x; h) = f(x +h) f(x) = Df(p) h + o(h)
se sigue que si h 0, entonces f(x; h) 0 lo que prueba la continuidad.
La recproca no es cierta. Ya en en una variabe la funcion [x es continua
pero no es derivable en el origen.
La nocion de derivada parcial se puede tambien extender a funciones en
R
n
R
m
.
Denicion 9. Sea f : R
n
R
m
. Sea
i
, i = 1, 2, . . . , n la base canonica
en R
n
. La derivada parcial iesima en el punto p R
n
se dene por
D
i
f(p) = lim
t0
f(p + t
i
) f(p)
t
si tal lmite existe.
Observe que la derivada parcial es un vector D
i
f(p) R
m
.
Proposicion 9. Sea f : R
n
R
m
. Si f es diferenciable en p R
n
, entonces
existen todas las derivadas parciales y
D
i
f(p) = Df(p)
i
Demostraci on.
En la denicion de derivada, tomando el incremento de la forma h = t
i
con
t 0 tenemos
f(p + t
i
) f(p)
t
=
1
t
Df(p) (t
i
) +
1
t
r(t
i
)
= Df(p)
i
+
1
t
r(t
i
) Df(p)
i
, cuando t 0.
34 CAP
ITULO 1. C
j
, j = 1, 2, . . . , m en R
n
y R
m
es una matriz m n cuya
iesima columna es el vector Df(p)
i
expresado en la base
j
o sea
Df(p)
i
=
m
j=1
_
j
Df(p)
i
_
j
=
m
j=1
_
Df
j
(p)
i
_
j
=
m
j=1
D
i
f
j
(p)
j
En otras palabras la matriz asociada a la derivada es la matriz Jacobiana
_
_
D
1
f
1
D
2
f
1
D
n
f
1
D
1
f
2
D
2
f
2
D
n
f
2
D
1
f
m
D
2
f
m
D
n
f
m
_
_
Ejemplo 1.821. Calcule la matriz Jacobiana de f : R
2
R
2
dada por
f(x, y) = (x
2
y
2
, 2xy).
Tenemos f
1
(x, y) = x
2
y
2
, f
2
(x, y) = 2xy.
[Df(, xy)] =
_
f
1
x
f
1
y
f
2
x
f
2
y
_
=
_
2x 2y
2y 2x
_
Ejemplo 1.822. En el caso de funciones f : R
n
R la matriz Jacobiana
se representa por una matriz 1 n o un vector renglon que se conoce como
vector gradiente en coordenadas cartesianas
[Df(x)] = [D
1
f(x), D
2
f(x), . . . , D
n
f(x)] f(x)
Si h R
n
entonces
Df(x) h = f(x) h
1.8. MATRIZ JACOBIANA, GRADIENTE 35
Es s olo en este caso que el gradiente se puede identicar con la derivada.
En general, si , ) es un producto escalar y q
1
, q
2
, . . . , q
n
son coordenadas
arbitrarias el vector gradiente se dene por la igualdad anterior, es decir
Df(q) h = f(x), h)
1.8.1 Coordenadas curvilneas
Suponga que se da un producto escalar en cada punto , )
q
(esto es lo que
se llama una metrica Riemanniana). El campo gradiente se dene por la
identidad
Df(q) h = f(q), h)
q
(1.8)
Esta construccion es usual cuando se usan coordenadas curvilneas, o
generalizadas. En tal caso sea r = r(q
1
, q
2
, . . . , q
n
) el cambio a coordenadas
cartesianas r = (x
1
, x
2
, . . . , x
n
). La condicion de que sea un cambio de coor-
denadas signica que en cada punto q los vectores
e
i
(q)
r
q
i
, i = 1, 2, . . . , n
formen un conjunto linealmente independiente. Equivalentemente el deter-
minante de matriz Jacobiana
(x
1
, x
2
, . . . , x
n
)
(q
1
, q
2
, . . . , q
n
)
es siempre distinto de cero. Dena entonces
v, v)
q
=
n
i,j=1
(e
i
e
j
)v
i
w
j
(1.9)
donde
v =
n
i=1
v
i
e
i
, w =
n
j=1
w
i
e
j
denen las coordenadas v
i
, w
j
en terminos de la base e
j
. Es costumbre de-
notar la relacion metrica 1.9 en la forma
ds
2
=
n
i,j=1
g
ij
dq
i
dq
j
36 CAP
ITULO 1. C
i
g
ii
dq
2
i
=
n
i
h
2
i
dq
2
i
,
que equivale a escribir
e
i
= h
i
e
i
donde e
i
es un vector unitario en la direccion e
i
, es decir tanto h
i
= [[e
i
[[.
Ejemplo 1.823. Calcule los coecientes metricos h
r
, h
en coordenadas po-
lares y el gradiente de una funcion f(r, )
El cambio a coordenadas cartesianas es
x
1
= r cos , x
2
= r sin
por lo que la matriz Jacobiana es
_
cos r sin
sin r cos
_
de donde
e
r
= (cos , sin ), e
= r(sin , cos )
Es claro que el sistema de coordenadas es ortogonal, pues e
r
e
= 0. Como
e
r
es unitario entones h
r
= 1, por otro lado [[e
[[ = r de donde h
= r.
Sea f(r, ) = Ae
r
+ Be
k
para cualesquiera (h, k) por lo tanto
A =
f
r
, y B =
1
r
f
ITULO 1. C
h
2
+ k
2
no existe pues tomando k = h tenemos
lim
(h,k)(0,0)
h
2
k
(h
2
+ k
2
)
3/2
= lim
h0
h
3
(h
2
+ h
2
)
3/2
= lim
h0
=
h
3
(2h
2
)
3/2
=
1
(2)
3/2
,= 0
El teorema que sigue es muy importante en la practica, pues nos permite
establecer la diferenciabilidad de una funcion que tiene derivadas parciales
mas una propiedad adicional.
Teorema 4. Si f : R
n
R tiene derivadas parciales continuas en una bola
B
r
(p) R
n
, entonces la funcion es diferenciable en p.
Demostraci on.
Haremos la demostracion para dimension n = 2. Los argumentos pueden
generalizarse facilmente para n arbitrario.
Tomando (h, k) sucientemente peque nos y por el teorema del valor medio
para funciones de una variable,
f(a + h, b + k) f(a, b) = f(a + h, b + k) f(a, b + k) + f(a, b + k) f(a, b)
=
f
x
(a
, b + k)h +
f
y
(a, b)k
=
f
x
(a, b)h +
f
y
(a, b)k + r(h, k)
en donde
r(h, k) =
_
f
x
(a
, b + k)
f
x
(a, b)
_
h +
_
f
y
(a, b)
f
y
(a, b)k
_
1.8. MATRIZ JACOBIANA, GRADIENTE 39
en donde a esta entre a y a+h, b esta entre b y b+k. Por Por la continuidad
de las derivadas parciales los factores entre parentesis tienden a cero, en tanto
que
h
h
2
+ k
2
,
k
h
2
+ k
2
son acotados cuando (h, k) (0, 0) luego
lim
(h,k)(0,0)
r(h, k)
h
2
+ k
2
= 0.
La recproca del teorema anteior es falsa, como lo muestra el siguiente
ejemplo en una variable: Sea f(x) = x
2
sin(1/x), f(0) = 0. Su derivada es
f
(x) ,= f
(0)
As que la derivada, que es la unica derivada parcial en este caso, no es
continua en el origen, a pesar de que la funcion es diferenciable all.
Denicion 10. Si f : R
n
R tiene derivadas parciales continuas en D
R
n
decimos que es continuamente diferenciable en D o bien, que es una
funcion de clase C
1
(D).
Ejemplo 1.826. Analice la diferenciablidad de la funcion del ejemplo 1.8.2,
fuera del origen.
Las derivadas parciales
f
x
=
y
x
2
+ y
2
2x
2
y
(x
2
+ y
2
)
2
,
f
y
=
x
x
2
+ y
2
2xy
2
(x
2
+ y
2
)
2
son funciones continuas en todo punto (x, y) ,= (0, 0) en particular dado
(a, b) ,= (0, 0) ambas son continuas en una bola B
r
(a, b) de radio suciente-
mente peque no. Por el teorema (??) la funcion es diferenciable en (a, b)
40 CAP
ITULO 1. C
(0) = 0.
2. Sea z = f(x, y) denida en B
r
(a, b) considere el siguiente problema: De
todas los planos que pasan por (a, f(a)) zf(a, b) = m(xa)+n(yb)
encuentre aquel (i.e. m y n) que mejor aproxime a z = f(x, y)) en un
entorno de (a, f(a)) en el sentido de que si
f(a, b) (h, k) (mh + nk) = r(h, k)
entonces r tiene derivada en (0, 0) y r
ITULO 1. C
D(gf)(x)
""
E
E
E
E
R
n
Dg(f(x))
//
R
p
Demostraci on.
Calculemos el incremento nito de la composicion
(g f)(x; h) = g(f(x +h)) g(f(x)) = g(y +v) g(y)
donde y = f(x) y v = f(x +h) f(x) = f(x, h). Note que v depende de
h. Por ser g diferenciable en y
(g f)(x; h) = Dg(y) v + r(v)
= Dg(y) (f(x +h)) f(x)) + r(v)
= Dg(y) (Df(x) h + s(h)) + r(v) [por ser f diferenciable]
= Dg(y) (Df(x) h) + Dg(y) s(h) + r(v) [por linealidad]
Aqu s(h) r(v) son residuos que satisfacen
s(h) = o(h), r(v) = o(v)
Provemos que el residuo total es
Dg(y) s(h) + r(v) = o(h)
Para ello analicemos cada termino. Por la desigualdad de Banach
[[Dg(y) s(h)[[
[[h[[
[[Dg(y)[[ [[s(h)[[
[[h[[
= [[Dg(y)[[
_
[[s(h)[[
[[h[[
_
0
44 CAP
ITULO 1. C
(y) f(D) E.
Cuando nos cuestionamos sobre la diferenciabilidad global es decir sobre
todo un conjunto entnces los dominios de las funciones necesitan ser conjuntos
abiertos, es decir todos sus puntos deben ser interiores. En este contexto, un
enunciado mas preciso para la regla de la cadena sera:
1.12. LA VERSI
k=1
g
j
y
k
f
k
x
i
para i = 1, 2, . . . , n y j = 1, 2, . . . , p.
46 CAP
ITULO 1. C
(x) = g
(f(x))f
(x)
o bien en la notacion clasica, si hacemos u = f(x), y = g(u), tenemos
dy
dx
=
dy
du
du
dx
.
2. El caso n = 1, m N, p = 1.
R
f
//
R
m
g
//
R
Aqu conviene usar la variable t en vez de x, para recordar que es una
variable real. Tenemos
u(t) = g(f(t)) = g(f
1
(t), f
1
(t), . . . , f
m
(t))
de donde
u
(t) =
m
k=1
D
k
g(f(t))f
k
(t) = g f
(t)
3. El caso n N, m = p = 1. Aqu
R
n
f
//
R
g
//
R
Con u(x) = g(f(x)), podemos escribir,
Du(x) = g
(f(x))Df(x)
donde g
(f(x)) (Df(x) h)
= g
(f(x)) ((x) h) = [g
(f(x))(x)] h
48 CAP
ITULO 1. C
(f(x))f(x).
Ejemplo 1.1229. Sea f = (f
1
, f
2
): R
2
R, g : R
2
R. En este caso,
u(x, y, z) = g(f
1
(x, y, z), f
2
(x, y, z)) = g(u
1
, u
2
)
donde u
1
= f
1
(x, y), u
2
= f
2
(x, y). Tenemos
Du(x, y, z) = D
1
g(u
1
, u
2
)Df
1
(x, y, z) +D
2
g(u
1
, u
2
)Df
2
(x, y, z)
Evaluando en h R
3
arbitario y usando la denicion de gradiente
Du(x, y, z) h = D
1
g(u
1
, u
2
)Df
1
(x, y, z) h + D
2
g(u
1
, u
2
)Df
2
(x, y, z) h
u(x, y, z) h = D
1
g(u
1
, u
2
)Df
1
(x, y, z) h + D
2
g(u
1
, u
2
)Df
2
(x, y, z) h
en donde D
1
g(u
1
, u
2
), D
2
g(u
1
, u
2
) son escalares, luego
u(x, y, z) = D
1
g(u
1
, u
2
)f
1
(x, y, z) + D
2
g(u
1
, u
2
)f
2
(x, y, z)
1.13 Aplicaciones de la regla de la cadena
La formula de Euler. Decimos que g : R
m
R es homogenea de grado si
g(tx) = t
s
g(x) para toda t R, y x R
m
. Las funciones homogeneas son
muy importantes, e incluyen en particular a los polinomios homogeneos, por
ejemplo
g(x, y, z) = xy
2
+ x
3
+ xz
2
xyz
es una funcion polinomial R
3
R homogenea de grado 3. Otro ejemplo, es
g(x, y) = exp(y/x)
que es una funcion R
2
R homogenea de grado 0.
Vamos a demostrar la llamda formula de Euler para funciones homogeneas
g(x) x = sg(x)
1.13. APLICACIONES DE LA REGLA DE LA CADENA 49
o en notacion clasica poniendo u = g(x
1
, x
2
, . . . , x
m
)
m
i=1
x
i
u
x
i
= su.
En efecto, sea x R
n
jo y sea u(t) = g(tx). Por la regla de la cadena
tenemos
u
(1) = g(x) x,
por otro lado u(t) = t
s
g(x), de donde u
(x p)
la cual es la ecuacion de un hiperplano en R
m
cuyo vector normal es
n = (g(x), 1).
Dicho hiperplano es tangente a la supercie M R
m
denida por la graca
de la funcion
graf(g) = (x, z) [ z = g(x).
como habremos de probar en un momento. Lo que se quiere resaltar aqu que
esta es la idea intuitiva que hemos estado persiguiendo desde un principio
para el concepto de funcion diferanciable: la existencia de un plano tangente
a la graca.
Veriquemos entonces la armacion anterior. Para ello consideremos una
curva diferenciable arbitraria contenida en graf(g), que pase por el punto p,
digamos : R R
m
con (0) = p. Debemos entonces vericar que
(0),
50 CAP
ITULO 1. C
(0) = g(p) x
(0) o bien (x
(0), z
(0)) (g(p), 1) = 0
que era lo que se quera probar.
Las ideas anteriores se pueden generalizar como sigue (vease tambien la
seccion 1.3). Consideremos la hipersupercie de nivel
M
c
= F
1
(c)
que pasa por un punto y R
m+1
, i.e. F(y) = c, donde F : R
m+1
R. En
este caso F(y) es normal a la supercie M
c
. En efecto, si : R R
m+1
es una curva en M
c
por denicion F((t)) = c para toda t de donde, por la
regla de la cadena,
0 = F(y)
(0)
que muestra que la supercie M
c
es perpendicular al vector gradiente. Veamos
que esta es una generalizacion del caso anterior. En efecto, si g : R
m
R es
diferenciable en p y z
0
= g(p), podemos considerar a F : R
m
R = R
m+1
R
denida como F(x, z) = g(x) z. Entonces F es diferenciable en (p, z
0
)y el
gradiente en (p, z
0
) es
F(p, z
0
) = (g(p), 1).
As, si R graf(g) R
m
entonces z(t) = g((t)) satisface que (t) =
((t), z(t)) es una curva : R R
m+1
contenida en M
0
cuyo vector tangente
en t = 0 es
(
(0), 1).
1.14 Ejercicios
1. Enuncie con precision y muestre que se sigue de la regla de la cadena,
las siguientes armaciones tpicas en libros de calculo:
1.14. EJERCICIOS 51
(A) Sustituyendo las coordenadas cartesianas x, y por las coorde-
nadas polares x = r cos , y = r sin en la funcion w = f(x, y) se
obtiene
w
r
=
f
x
cos +
f
y
sin ,
1
r
w
=
f
x
sin +
f
y
cos .
(B) Sean w = w(u, v), u = u(x, y, z), v = v(x, y, z) funciones diferen-
ciables. Considerando a w como funcion de x, y, z, su gradiente en
cada punto (x
0
, y
0
, z
0
) esta en el mismo plano que los gradientes
de u y v de en ese punto.
2. Por que esta equivocado el siguiente argumento? Si a w = f(x, y, z)
y z = g(x, y) le aplicamos la Regla de la Cadena,
w
x
=
w
x
x
x
+
w
y
y
x
+
w
z
z
x
=
w
x
+
w
z
z
x
,
por lo tanto
w
z
z
x
= 0.
de modo que alguna de las derivadas parciales
w
z
,
z
x
es cero.
3. Use la regla de la cadena para mostrar que bajo las bajo hipotesis
adecuadas (enunciarlas!):
d
dx
_
x
0
f(x, y) dy = f(x, x) +
_
x
0
f
x
(x, y) dy
4. (El teorema de transporte en dimension 1) Haga las hipotesis necesarias
para calcular la derivada
d
dt
_
b(t)
a(t)
f(t, y) dy
Se denomina teorema de transporte pues el dominio D
t
= [a(t), b(t)]
se mueve con el tiempo t y f(t, y) es una cantidad que depende del
tiempo y de la variable espacial y D
t
.
52 CAP
ITULO 1. C
2
s
2
2
C
s
2
+ rs
C
s
rC = 0, s > 0, 0 < t < T
y la condicion de frontera C(s, T) = maxs K, 0 gobiernan el com-
portamiento de los valores C(s, t) de una opcion de compra (call eu-
ropeo). Muestre que esta ecuacion puede reducirse a la ecuacion de
calor mediente dos cambios de variables sucesivos.
(a) Sea s = K exp(x), t = T 2/
2
y C(s, t) = Kv(x, ). La
ecuacion queda
v
=
2
v
x
2
+ ( 1)
v
x
v, < x < , > 0.
y v(x, 0) = maxexp(x) 1, 0, con = 2/
2
.
54 CAP
ITULO 1. C
1
2
( 1)x
1
4
( + 1)
2
_
w(x, )
y la ecuacion anterior se transforma en
w
=
2
w
x
2
, < x < , > 0.
con
w(x, 0) = max
_
exp
_
1
2
( + 1)x
_
exp
_
1
2
( 1)x
_
, 0
_
1.15 El teorema del valor medio
Recordemos primero el caso de una variable.
Teorema 8 (TVM en una variable). Si g : [a, b] R es continua y
diferenciable en (a, b), entonces existe c (a, b) tal que
g(b) g(a) = f
(c)(b a).
Mediante la Regla de la Cadena y el TVM en una variable podemos
probar la version mas general
Teorema 9 (TVM para funciones R
n
R). Sea f : D R
n
R difer-
enciable en un disco D R
n
, entonces dados p, q R
n
existe c perteneciente
al segmento que une p con q tal que
f(p) f(q) = Df(c) (p q)
Demostraci on.
Ya que D es un disco, entonces si p, q R
n
entonces el segmento (1t)p+tq,
0 t 1, pertence tambien al disco D. Considerese entonces g : [0, 1] R
denida por
g(t) = f((1 t)p + tq),
que es diferenciable por ser composicion de funciones diferenciables. Ademas
por el TVM en una variable real, existe c (0, 1) tal que
g(1) g(0) = g
(c).
1.15. EL TEOREMA DEL VALOR MEDIO 55
Figure 1.14: Contraejemplo al TVM para funciones a valores vectriales.
Calculando la ultima derivada por la regla de la cadena nos queda
g
ITULO 1. C
(t) dt =
_
1
0
Df((1 t)p +tq) (p q) dt
de donde se sigue el resultado.
Corolario 1. Sea f : D R
n
R
m
diferenciable en un disco D R
n
.
Dados p, q R
n
, si
[[Df((1 t)p + tp)[[ M, 0 t 1
para cierta constante M 0, entonces
[[f(p) f(q)[[ M[[(p q)[[
Demostraci on.
Basta aplicar la desigualdad de Banach
[[Df((1 t)p + tq) (p q)[[ [[Df((1 t)p + tq)[[ [[p q[[
Proposicion 10. Sea f : D R
n
R
m
diferenciable en un disco D R
n
,
k R
m
. Dados p, q R
n
, entonces existe c perteneciente al segmento que
une p con q tal que
(f(p) f(q)) k = (Df(c) (p q)) k
Demostraci on.
La funcion a valores reales f
k
(x) = f(x) k, donde () denota el producto
interior usual, cumple con las hipotesis del Teorema 9, luego
f
k
(p) f
k
(q) = Df
k
(c) (p q)
pero (verique)
Df
k
(c) h = (Df(c) h) k
observe el distinto signicado de (). De aqu que se sigue el resultado
1.16. EL TEOREMA DE LA FUNCI
ON INVERSA 57
Corolario 2. Sea f : D R
n
R
m
diferenciable en un disco D R
n
.
Dados p, q R
n
, entonces existe una transformaci on lineal L(R
n
, R
m
)
tal que
f(p) f(q) = L (p q)
Demostraci on.
Consideremos la base canonica e
j
, j = 1, 2, . . . , m de R
m
y apliquemos la
proposicion anterior tomando sucesivamente k = e
j
. Observe que f
e
j
= f
j
,
la jesima funcion componente, luego existe c
j
perteneciente al segmento
que une p con q tal que
f
j
(p) f
j
(q) = Df
j
(c
j
) (p q)
La transformacion lineal = (
1
,
2
, . . . ,
m
) L(R
n
, R
m
) se puede tomar
como
j
= Df
j
(c
j
) L(R
n
, R).
Observaci on 10. En el ultimo corolario, observe que la transformacion lineal
no concide necesesariamente con Df(c), para alg un c entre p y q, ya que
los c
i
no son en general iguales.
1.16 El Teorema de la funcion inversa
Los teoremas de la funci n inversa e implcita constituyen uno de los pilares
del calculo diferencial. Ambos tienen m ultiples aplicaciones y conexiones
con otras ramas de la matematica. En esta seccion enunciaremos el teorema
de la funcion inversa en una y varias variables. Comenzaremos por motivar
la version en una variable y gradualmente con ejemplos en varias pocas
variables.
Consideremos una funcion de una variable y = f(x). Nos pregunta-
mos bajo que condiciones podemos despejar a y en funcion de x. En la
gura 1.15 se muestran dos ejemplos En el ambos casos la funcion es invert-
ible ya que y = f(x) es creciente, por lo cual la inversa x = g(y) esta bien
denida, lo cual es el signicado preciso de despejar
3
a y; sin embargo
3
El termino despejar sigue siendo ambiguo, por ejemplo, se puede despejar a x de
la ecuaci on y = xe
x
?. La respuesta es no en terminos de funciones elementales, como
polinomios, cocientes de polinomios (funciones racionales), raices (a un de exponentes frac-
cionarios) de funciones racionales, logaritmos o exponenciales. Puede uno simplemente
darle un nombre a la funci on inversa, digamos x = LogExp(y) y mostrar sus propiedades.
58 CAP
ITULO 1. C
(x
0
) ,= 0 y y
0
= f(x
0
), entonces existen vecindades I
x
0
= (x
0
, x
0
+) de
x
0
, I
y
0
= (y
0
, y
0
+) de y
0
, y una funcion g : I
y
0
I
x
0
tal que x = h(f(x))
para toda x I
x
0
, y y = f(h(y)) para toda y I
y
0
. Adem as, la funci on g es
diferenciable en y
0
y
h
(y
0
) =
1
f
(x
0
)
.
Ejemplo 1.1630. Sea y = ax, entonces si a ,= 0, entonces se puede despejar
x = a
1
y. Observe que a = dy/dx.
Antes de proceder al siguiente ejemplo, mencionemos el siguiente resul-
tado util.
Lema 1. Sea f : R R de clase C
1
en una vecindad de 0 y f(0) = 0.
Entonces f(x) = xh(x) con h continua en 0
Finalmente queremos saber el comportamiento de la funci on, si es mon otona, si es con-
tinua, sus derivadas, el rango de valores, etc. En este sentido, en el enunciado del teorema
de la funci on inversa, la existencia y la diferenciabildad de la funci on inversa es lo real-
mente importante, y no como se hace enfasis en los libros elementales, que la derivada de
la inversa es
dx
dy
=
1
dy
dx
.
1.16. EL TEOREMA DE LA FUNCI
ON INVERSA 59
Demostraci on.
Por el teorema del valor medio
f(x) = xf
(x
)
para alg un x
entre 0 y x, luego x
0 si x 0. Sea h(x) = f
(x
), como f
con
rango [x[ < , tal que
y = f(g(y)) = a g(y) +r(g(y))
o bien, si x = g(y)
x = a
1
y + k(y)
donde
k(y) = a
1
r(g(y))
Como g(0) = 0, entonces k(0) = r(g(0)) = 0 luego k(y) = yn(y) para cierta
n(y) continuamente diferenciable. Ademas
n(0) = k
(0) = r
(g(0))g
(0) = r
(0)g
(0) = 0.
Ejemplo 1.1632. El siguiente ejemplo generaliza el anterior a mas dimen-
siones. Sean x, y R
n
y considere la ecuacion
y = Ax + r(x),
60 CAP
ITULO 1. C
= lim
n
x
n
= 0
as hemos encontrado x
,= 0 tal que x
= 0, una contradiccion.
Ahora, para x R
n
arbitrario, naturalmente
k
_
x
[[x[[
_
4
Aquusamos el siguiente resultado del An alisis que probaremos m as adelante: Toda
sucesi on en un conjunto compacto, tiene una subsucesi on convergente. En este caso el
compacto es la esfera unitaria en R
n
.
1.16. EL TEOREMA DE LA FUNCI
ON INVERSA 61
de donde por linealidad
k[[x[[ [[ x[[.
Recuerde que hemos denido una funcion de clase C
1
(D) si su derivadas
parciales existen y son funciones continuas en D.La siguiente es una forma
alternativa de ver a las funciones de clase C
1
, independientes de coordenadas.
Denicion 11. Una funci no f : D R
n
R
m
, denida en un disco abierto
D, se dice de clase C
1
en D, si la diferencial Df : D L(R
n
, R
m
) es con-
tinua.
Observaci on 11. Se puede dotar al espacio L(R
n
, R
m
) de diversas normas,
de modo que tiene sentido hablar de la continudad de la diferencial vista
como funcion del punto. Ante la elecci n de bases dicho espacio no es sino
R
mn
donde todas las normas son equivalentes.
Observaci on 12. Sea e
i
, i = 1, 2, . . . , n una base de R
n
. Notemos que la
funcion ev
e
i
: L(R
n
, R
m
) R
m
, dada por L L e
i
es continua, ya que
evidentemente es lineal y por la desigualdad de Banach,
[[ev
e
i
L[[ = [[L e
i
[[ [[L[[ [[e
i
[[
se sigue la continuidad. La Derivada parcial se obtiene como la composicion
D
i
f = ev
e
i
Df, es decir, D
i
f(p) = Df(p) e
i
, as recuperamos la denicion
anterior de funcion de clase C
1
. El recproco es tambien cierto ya que Df(p)
h =
n
i=1
D
i
f(p)h
i
, es decir
Df =
n
i=1
D
i
f
i
donde : R
n
R son las proyecciones: (h) = h
i
, para h R
n
, y D
i
f
i
es
la multiplicacion de funciones a valores reales.
El siguiente resultado muestra como la diferencial aproxima linealmente
a la funcion en toda una vecindad donde la funcion se a de clase C
1
.
Lema 2. Si f : D R
n
R
m
es de clase C
1
en el disco B
r
(p) D,
entonces dado > 0 existe > 0 tal que
[[f(x
1
) f(x
2
) Df(p) (x
1
x
2
)[[ [[x
1
x
2
[[
62 CAP
ITULO 1. C
j=1
[[Df
j
(c
j
) Df
j
(p)[[
L(R
n
,R)
j=1
[[Df(c
j
) Df(p)[[
L(R
n
,R
m
)
j=1
m
nalmente
[[f(x
1
) f(x
2
) Df(p) (x
1
x
2
)[[ [[Df(p)[[ [[x
1
x
2
[[ [[x
1
x
2
[[
Teorema 12 (TFINV debil). Si f : D R
n
R
m
es de clase C
1
en el
disco B
r
(p) D, y Df(p) es inyectiva, entonces existe > 0 tal que la
restriccion de f al disco cerrado B
(p)).
1.16. EL TEOREMA DE LA FUNCI
ON INVERSA 63
Demostraci on.
Como Df(p) es invertible, existe r > 0 tal que
r[[h[[ [[Df(p) h[[ (1.15)
Por otra parte del lema 2 con = r/2,
[[f(x
1
) f(x
2
) Df(p) (x
1
x
2
)[[
r
2
[[x
1
x
2
[[
de la desigualdad del triangulo
[[Df(p) (x
1
x
2
)[[ [[f(x
1
) f(x
2
)[[
[[f(x
1
) f(x
2
) Df(p) (x
1
x
2
)[[
r
2
[[x
1
x
2
[[
por lo tanto
[[Df(p) (x
1
x
2
)[[
r
2
[[x
1
x
2
[[ +[[f(x
1
) f(x
2
)[[,
y aplicando la desigualdad 1.15 con h = x
1
x
2
, obtenemos
r[[x
1
x
2
[[ [[Df(p) (x
1
x
2
)[[
r
2
[[x
1
x
2
[[ +[[f(x
1
) f(x
2
)[[,
de donde
r
2
[[x
1
x
2
[[ [[f(x
1
) f(x
2
)[[
lo cual muestra que la funcion es inyectiva, ya que si x
1
,= x
2
entonces
f(x
1
) ,= f(x
2
).
La continuidad de la inversa se sigue de las siguientes propiedades que
seran justicadas en la segunda parte de estas notas:
Proposicion 12. Sea f : K R
n
R
m
continua con K compacto. Si f
tiene inversa g : f(K) R
n
entonces la inversa es una funcion continua.
El teorema anterior muestra que el sistema de ecuaciones
y
1
= f
1
(x
1
, x
2
, . . . , x
n
),
y
2
= f
2
(x
1
, x
2
, . . . , x
n
),
.
.
.
y
n
= f
m
(x
1
, x
2
, . . . , x
n
),
64 CAP
ITULO 1. C
(y
1
, y
2
, . . . , y
n
)
(x
1
, x
2
, . . . , x
n
)
que no es abierto en R
2
.
Ejemplo 1.1634. Considere la funcion en R
2
R
f(x, y) =
_
(x
2
y
2
)(x+y)
x
2
+y
2
si (x, y) ,= (0, 0),
0 si (x, y) = (0, 0)
Las derivadas parciales en el origen son:
D
1
f(0, 0) = lim
h0
1
h
f(h, 0) =
1
h
h
3
h
2
= 1,
D
2
f(0, 0) = lim
k0
1
k
f(0, k) =
1
k
k
3
k
2
= 1,
Cosidere ahora la funcion F : R
2
R
2
denida como F(x, y) = (f(x, y), x +
y). La matriz Jacobiana en el origen es
_
1 1
1 1
_
1.16. EL TEOREMA DE LA FUNCI
ON INVERSA 65
-0.4-0.2 0.2 0.4
-0.4
-0.2
0.2
0.4
-0.4 -0.2 0.20.4
-1
-0.5
0.5
1
-1 -0.5 0.5 1
-1
-0.5
0.5
1
-1 -0.5 0.5 1
-1
-0.5
0.5
1
Figure 1.16: Imagen del disco y el cuadrado unitario bajo la funcion F del
ejemplo 1.16
que evidentemente es no singular, pues el determinante es 2. Sin embargo en
la gura ?? se muestra, en la columna izquierda el disco y el rectangulo de
lado 1 con centro en el origen y en la columna derecha sus imagenes bajo F,
como se puede apreciar las imagenes no son vecindades de F(0, 0) = (0, 0),
pues no existe un disco con centro en (0, 0) contenido en la imagen, en ning un
caso.
Otro inconveniente del teorema anterior, es que se busca tener resultados
sobre la diferenciabilidad de la funcion inversa. La primera dicultad es que
la imagen f(B
ITULO 1. C
(p) B
r
(p) tal que la imagen V = f(B
(p)) es una
vecindad de f(p).
2. La funcion inversa g : V R
n
existe y es continua
3. Si y V es un punto interior de V , con y = f(x), entonces g es
diferenciable en y con derivada
Dg(y) = Df(x)
1
.
En la practica, el analisis de una transformacion f : R
n
R
n
comienza
con calcular el conjunto singular donde la diferencial no sea inyectiva y su
imagen, los valores crticos. As, fuera del conjunto singular y de los valores
crticos, el TFIN garantiza la existencia de una inversa local que ademas es
diferenciable. Vamos a precisar
Denicion 12. Sea f : R
n
R
n
diferenciable. Se dice que x R
n
es
un punto crtico de f, si Df(x) L(R
n
, R
n
) no es invertible
5
. Un punto
y Im(f) R
n
es un valor crtico, si es la imagen de un punto crtico, en
caso contrario se dice que es un valor regular. Los puntos donde Df(x) es
invertible se llaman puntos regulares.
El conjunto de puntos crticos de f se llama el conjunto de singularidades
de f, o conjunto singular y se denota por
f = x R
n
[ Df(x) es singular.
Ejemplo 1.1635. El cambio de coordenadas polares a cartesianas
x = r cos
y = r sin (1.17)
5
Recuerde que para una transformaci on lineal son equivalentes las propiedades de ser:
(a) inyectiva , (b) suprayectiva, (c) invertible, (d) determinante distinto de cero
1.16. EL TEOREMA DE LA FUNCI
ON INVERSA 67
puede considerarse como una funcion T : R
2
(r, ) R
3
(x, y). Como es usual,
distinguimos el dominio y el contradominio por las coordenadas y llamamos
a (r, ) el plano polar y (x, y) el plano cartesiano.
El determinante de la matriz jacobiana es
cos r sin
sin r cos
= r
de donde el conjunto de singularidades es el eje r = 0, en el plano polar.
La imagen del conjunto singular es el origen en el plano cartesiano, ya que
x
2
+ y
2
= r
2
.
Fuera del conjunto de singularidades la funcion es localmente invertible
con inversa diferenciable. En la gura 1.17 se muestra la imagen de los
rectangulos [0, 1] [0, ] y [0, 1] [0, 2]. Ambos tienen una arista sobre el
conjunto singular r = 0 del plano polar la cual se mapea en el origen, la arista
derecha r = 1, se mapea en cada caso a la semicircunferencia exterior o la
circunferencia completa, respectivamente. Observe tambien que las aristas
horizontales [0, 1] 0 y [0, 1] 2 del rectangulo mayor, se aplican ambas
sobre el rayo 0 x 1, y = 0 del plano cartesiano. Esto muestra una di-
cultad de las coordenadas polares para representar de manera unica puntos
en el plano cartesiano. En el ejericio (?) se muestra una manera de lidiar
con esta dicultad, esencialmente identicando con + 2k, cuando k sea
cualquier entero. Esta manera de pensar obliga a pensar a la transformacion
como una funcion
f : [0, ) S
1
R
2
donde [0, ) S
1
es un cilindro, el producto cartesiano de un intervalo con
la circunferencia de radio 1. Esta manera de pensar nos lleva a rehacer el
calculo para funciones de la forma f : M R
m
donde M es alguna supercie
en R
p
de dimension n.
En la gura 1.18 se muestra la imagen bajo la transformacion polar en
la vecindad un punto (r, ) = (0, /4) sobre el conjunto singular en cambio
en la gura 1.19 se muestra la imagen de un peque no rectangulo en una
vecindad de un punto regular (1, /4) en el plano polar y su imagen en el
plano cartesiano. En la gura 1.20 se muestra la imagen de un rectangulo
mas grande que toca al conjunto singular, su imagen en el plano cartesiano
revela que la funcion no es biyectiva en esta vecindad.
Esto ultimo muestra que el TFIV garantiza bajo las hipotesis adecuadas
, la existencia de la inversa pero solo localmente.
68 CAP
ITULO 1. C
ON INVERSA 69
0.9 0.95 1.05 1.1
r
0.75
0.8
0.85
q
0.650.70.750.80.85
x
0.65
0.7
0.75
0.8
0.85
y
Figure 1.19: Imagen bajo la transformacion polar 1.17 de un peque no
rectangulo mayor alrededor de (1, /4) en el plano polar y su imagen bajo la
transformacion 1.17.
-0.5 -0.25 0.250.50.751
r
0.75
0.8
0.85
q
0.2 0.4 0.6 0.8
x
0.2
0.4
0.6
0.8
y
Figure 1.20: Imagen bajo la transformacion polar 1.17 de un rectangulo
mayor alrededor de (0, /4) en el plano polar y su imagen bajo la transfor-
macion 1.17.
70 CAP
ITULO 1. C
y
r
y
z
r
z
_
_
_
=
_
_
sin cos r cos cos r sin sin
sin sin r cos sin r sin cos
cos r sin 0
_
_
cuyo determinante es r
2
sin , por lo tanto si r ,= 0 y ,= k para alg un k
entero, la diferencial es invertible. Observe que los valores crticos constituyen
el eje z en el espacio cartesiano, ya que
x
2
+ y
2
= r
2
sin
2
1 x
2
1.17. EL TEOREMA DE LA FUNCI
ON IMPL
ICITA 71
y
x
Figure 1.21: La curva f(x, y) no es la graca de una funcion y = (x).
donde el signo signica que debemos elegir una rama de la raiz cuadrada,
en este caso elegimos el signo mas pues queremos que la graaca de y = (x)
satisfaga 1 = (0). Claramente la funcion (x) =
1 x
2
solo esta denida
y es diferenciable en (0, 1). Esto muestra que no podemos espera que la
funcion este denidas sino en un entorno de x
0
.
Geometricamente, seras posible despejar a y en funcion de x cuando toda
recta vertical cercana a x = x
0
corte a la curva de nivel f(x, y) = c en un solo
punto, es decir la curva no se doble sobre s misma como en la Figura 1.21
Observe que si ocurre un doblez, la tangente a la curva es vertical y por
lo tanto el gradiente es horizontal. Como
f(x, x) =
_
f
x
,
f
y
_
la tangente a la curva es vertical precisamente cuando
f
y
= 0. Este resultado
esta contenido en el Teorema de la Funcion Implcita (TFIm)para funciones
de una variable real.
Teorema 14 (TFIM en R R). Sea f(x, y): B
r
(x
0
, y
0
) R
2
R de
clase C
1
en B
r
(x
0
, y
0
), y f(x
0
, y
0
) = c. Si
f
y
(x
0
, y
0
) ,= 0
entonces existe una funcion diferenciable
: (x
0
, x
0
+ ) (y
0
+ , y
0
+ )
72 CAP
ITULO 1. C
(x) =
f
x
(x, (y))
f
y
(x, (y))
.
Ejemplo 1.1738. Considere el sistema lineal
ax + by + cz = 0,
dx + ey + fz = 0
el cual tiene una variable libre. Con mas precision, si
1
= ae bd ,= 0
entonces se puede escribir
ax + by = cz,
dx + ey = fz
y para cada z se obtienen valores unicos de x y y; en otras palabras existen
funciones x =
1
(x), y =
1
(z) que satisfacen el sistema
a
1
(z) + b
1
(z) + cz = 0,
d
1
(z) + e
1
(z) +fz = 0
para toda z R. Las funciones
1
,
2
se encuentran explcitamente, usando
la regla de Cramer, como
x =
1
(z) =
(ce + bf)z
ae bd
, y =
1
(z) =
(af + cd)z
ae bd
.
Observe que
1
(0) = 0 y
1
(0) = 0
1.17. EL TEOREMA DE LA FUNCI
ON IMPL
ICITA 73
Ejemplo 1.1739. Considere el mismo sistema lineal que en el ejemplo an-
terior
ax + by + cz = 0,
dx + ey + fz = 0
pero suponga ahora que
2
= af cd ,= 0
entonces se despejar a x, z en funcion de y,
x =
2
(z) =
(bf + ce)y
af cd
, z =
2
(z) =
(ae + bd)y
af cd
.
es decir
a
2
(y) + by + c
2
(y) = 0,
d
2
(y) + ey + f
2
(y) = 0
para toda y R.
Ejemplo 1.1740. Para el mismo sistema que en el ejemplo anterior, si
3
= bf ce ,= 0
entonces es posible despejar a a y, z en funcion de x.
Ejemplo 1.1741. Considere la version no lineal del ejemplo (1.17),
ax + by + cz + r(x, y, z) = 0,
dx + ey + fz + s(x, y, z) = 0
donde ae bd ,= 0, y donde r, s son funciones continuamente diferenciables
tales que r(x, y, z) k([x[
2
+[y[
2
+[z[
2
), s(x, y, z) k
([x[
2
+[y[
2
+[z[
2
), para
ciertas constantes k, k
ITULO 1. C
1
(z) + b
1
(z) +cz+
r
x
(
1
(z),
1
(z), z)
1
(z) +r
y
(
1
(z),
1
(z), z)
1
(z) + r
z
(
1
(z),
1
(z), z) = 0,
d
1
(z) + e
1
(z) + fz+
s
x
(
1
(z),
1
(z), z)
1
(z) +s
y
(
1
(z),
1
(z), z)
1
(z) +s
z
(
1
(z),
1
(z), z) = 0,
y evaluando en z = 0 y recordando que
1
(0) = 0,
1
(0) = 0, obtenemos
a
1
(0) + b
1
(0) = 0,
d
1
(0) +e
1
(0) = 0,
de donde podemos obtener
1
(0) =
(ce + bf)
ae bd
,
1
(0) =
(af + cd)
ae bd
.
es decir
x =
1
(z) =
(ce + bf)
ae bd
z + , y =
1
(z) =
(af + cd)
ae bd
z + .
donde ( ) signica terminos de orden 2 en adelante.
Teorema 15 (Teorema de la funcion implcita). Sea F : R
n
R
m
R
m
,
de clase C
1
en un disco alrededor de (a, b) R
n
R
m
. Si F(a, b) = c y
D
2
F(a, b) L(R
m
, R
m
) es no singular, entonces existe : B
(a) R
n
V R
m
tal que V es una vecindad de b, (a) = b y
F(x, (x)) = c
para toda x B
(a) y su derivada es
D(x) = D
2
F(x, (x))
1
D
1
F(x, (x)) (1.18)
En otras palabras, las soluciones de la ecuacion
F(x, y) = c
cercanas de una solucion (a, b) se pueden parametrizar diferenciablemente
como y = (x).
1.17. EL TEOREMA DE LA FUNCI
ON IMPL
ICITA 75
Observaci on 13. Observe la estructura de la composicion en (1.18) (omiti-
mos el punto de evaluacion):
R
m
D
2
F
1
""
E
E
E
E
E
E
E
E
R
n
D
1
F
<<
z
z
z
z
z
z
z
z
D
//
R
m
Observaci on 14. Un resultado similar se aplica para F : R
n
R
m
R
n
, de
clase C
1
en un disco alrededor de (a, b) R
n
R
m
. Bajo la condicion de
que F(a, b) = c y D
1
F(a, b) L(R
n
, R
n
) sea no singular, entonces existe
: B
(b) R
m
U R
n
tal que U es vecindad de a, (b) = a y
F((y), y) = c
para toda y B
ITULO 1. C
ON IMPL
ICITA 77
por lo cual, la condicio para poder despejar a x, y en funcion de z es precisa-
mente
a b
k m
,= 0.
Ejemplo 1.1743. Sea F : R
2
R
2
R
2
denda para x = (x
1
, x
2
), y =
(y
1
, y
2
) por
F(x, y) = (x
3
1
+ x
2
x
1
+ y
2
, x
1
y
2
+ x
2
2
y
1
).
Para cuales puntos (x, y) se puede resover la ecuacion F(x, y) = 0 para x
en terminos de y?
Sean
F
1
(x, y) = x
3
1
+ x
2
x
1
+ y
2
,
F
2
(x, y) = x
1
y
2
+ x
2
2
y
1
Necesitamos calcular la diferencial parcial
F
x
(x
0
, y
0
) L(R
2
, R
2
)
que se representa la matriz 2 2,
_
_
_
_
F
1
x
1
F
1
x
2
F
2
x
1
F
2
x
2
_
_
_
_
=
_
3x
2
1
+ x
2
x
1
y
2
2x
2
_
Por lo tanto, si 2x
2
(3x
2
1
+x
2
) x
1
y
1
,= 0 se puede despejar a x = (x
1
, x
2
) en
funcion de y = (y
1
, y
2
) en un entorno del punto.
1.17.1 Aplicaciones
Mecanica
El estado de movimiento de una partcula en un potencial gravitacional New-
toniano se puede describir por su energa y momento angular
e =
1
2
[[v[[
2
1
[[x[[
, h = x v
que son constantes de movimiento, i.e. permanecen constantes todo el tiempo.
78 CAP
ITULO 1. C
3
=
e
v
1
e
v
2
e
v
3
e
v
4
h
1
v
1
h
1
v
2
h
1
v
3
h
1
v
4
h
2
v
1
h
2
v
2
h
2
v
3
h
2
v
4
h
3
v
1
h
3
v
2
h
3
v
3
h
3
v
4
,= 0
El lector debera vericar que el determinant anterior es
3
= h
3
(x v)
Por lo tanto, si la componente en la direccion z del momento angular es
distinta de cero y la velocidad no es perpendicular al vector de posicion,
entonces es posible despejar a v y a x
3
en funcion de x
1
, x
2
.Una pregunta
de interes es entonces determinar la region de Hill, es decir la region en el
plano x
1
, x
2
que sea compatible con los valores de energa y momento angular
dados. Por ejemplo, de la ecuacion de la energa se deduce que
1
2
[[v1[[
2
= e +
1
[[x[[
0
por lo tanto, si e < 0 la region de Hill en x es la esfera
[[x[[ <
1
e
menos el origen. Si e 0 la region de Hill en x es todo R
2
0 En el plano
x
1
x
2
sucede que
_
x
2
1
+ x
2
2
[[x[[ <
1
e
y la region de Hill en el plano x
1
x
2
, para e < 0, esta contenida en el disco
de radio e
1
menos el origen. En la frontera del disco v = 0 por lo tanto
no podemos aplica el teorema de la funcion implcita.
1.18. DERIVADAS PARCIALES DE ORDEN SUPERIOR 79
1.18 Derivadas parciales de orden superior
En esta seccion estudiaremos las diferenciales de orden superior. Para ello
consideremos una funcion f : R
n
R
m
diferenciable en un disco B
r
(x
0
)
R
n
. La diferencial es una funcion
Df : B
r
(x
0
) R
n
L(R
n
, R
m
).
Mencionamos anteriormente que L(R
n
, R
m
) constiuye un espacio vectorial en
s mismo, por lo que tiene sentido preguntarse sobre la diferencial de Df en
un punto, digamos x
0
. En caso de existir tendramos
D(Df)(x
0
) L(R
n
, L(R
n
, R
m
))
Denicion 13. Sea f : R
n
R
m
diferenciable en un disco B
r
(x
0
) R
n
.
Decimos que f es dos veces diferenciable en x
0
, si Df : B
r
(x
0
) R
m
es
diferenciable en x
0
.
El espacio vectorial L(R
n
, L(R
n
, R
m
)) parece tener una estructura compli-
cada, por ello vamos a hacer una disgresion sobre las funciones multililneales
que al nal nos permitira identicar la diferencial de orden k en un punto
con una funcion multilineal.
El espacio de funciones multilineales
Denicion 14. El espacio de funciones multilineales en k argumentos vec-
toriales en R
n
a valores en R
m
, o brevemente kmultilineales vectoriales,
es
L
k
(R
n
, R
m
) =
_
B: (R
n
)
k
R [ B es multilineal
_
Los espacios L(R
n
, L(R
n
, R
m
)) y L
2
(R
n
, R
m
) se pueden identicar de
manera canonica, vgr. existe. En efecto, si B L(R
n
, L(R
n
, R
m
)) denamos
B como,
(B x) y =
B (x, y)
Dejamos al lector probar que la aplicacion
L(R
n
, L(R
n
, R
m
))
B
B
//
L
2
(R
n
, R
m
)
es un isomorsmo lineal (i.e. es lineal y biyectiva).
De manera analoga, los espacios L(
kfactores
R
n
, L(R
n
, . . . , L(R
n
, R
m
)) y L
k
(R
n
, R
m
)
se pueden indenticar de manera canonica mediante el isomorsmo
80 CAP
ITULO 1. C
B
//
L
k
(R
n
, R
m
)
donde,
( ((B x
1
) x
2
) )x
k
=
B (x
1
, x
2
, . . . , x
k
)
Observaci on 15. En consonancia con la notacion h para denotar la eval-
uacion de una transformacion lineal en un vector h, denotaremos por
B(h, k) la evaluacion de la transformacion bilineal B en la pareja de vectores
(h, k). Analogamente B(h
1
, h
2
, . . . , h
k
) denota la evaluacion de la funcion
multilineal B.
En el conjunto L
k
(R
n
, R
m
) estan denidas las operaciones de suma y
producto por un escalar, de modo que es un espacio vectorial sobre los reales.
Se puede tambien dotar de una norma a L
k
(R
n
, R
m
) deniendo
[[B[[ = supB(h
1
, h
2
, . . . , h
k
) [ [[x
1
[[ = [[x
2
[[ = = [[x
k
[[ = 1 (1.19)
con lo cual se satisface la desigualdad de Banach:
[[B(h
1
, h
2
, . . . , h
k
)[[ [[h
1
[[ [[h
2
[[ [[h
k
[[
Por supuesto se puede probar que el supremo en (1.19) existe por tratarse
de funciones multilineales en espacios vectoriales de dimensi on nita.
Denicion 15. Una funcion B(h
1
, h
2
, . . . , h
k
) se dice simetrica, si
B(h
1
, h
2
, . . . , h
k
) = B(h
1
, h
2
, . . . , h
k
)
para cualquier permutacion (
1
,
2
, . . . ,
k
) se los ndices (1, 2, . . . , k).
Por ejemplo, una funcion bilineal es simetrica si B(x, y) = B(y, x).
Proposicion 13. Si f : R
n
R
m
es 2 veces diferenciable en x
0
entonces
D(Df)(x
0
) es una funcion bilineal simetrica.
1.18.1 Derivadas de orden superior
Denicion 16. Sea f : R
n
R
m
diferenciable en un disco B
r
(x
0
) R
n
,
si Df : B
r
(x
0
) R
m
es diferenciable en x
0
, la diferencial de orden dos se
dene como la funcion bilineal
D
2
f(x
0
) =
D(Df)(x
0
).
1.18. DERIVADAS PARCIALES DE ORDEN SUPERIOR 81
Si
k1
D(D(D( D f) )): B
r
(x
0
) L(
k
R
n
, L(R
n
, R
m
)
es diferenciable en x
0
, entonces la diferencial de orden k se dene como la
funcion k-multilineal
D
k
f(x
0
) =
D(D(D( Df) ))(x
0
).
En otras palabras
(D(Df)(x
0
) h) k = D
2
f(x
0
) (h, k)
((D(D(Df))(x
0
) h) k) m = D
3
f(x
0
) (h, k, m),
etc.
El siguiente resultado nos permite calcular de manera efectiva la segunda
diferencial
Proposicion 14. Sea f : R
n
R
m
continuamente diferenciable en un disco
B
r
(x
0
) y dos veces diferenciable en x
0
. Para h R
n
dena f
h
: B
r
(x
0
)
R
n
R
m
como
f
h
(x) = Df(x) h
entonces f
h
es diferenciable en x
0
y para k R
n
se cumple que
Df
h
(x
0
) k = D
2
f(x
0
) (h, k)
Corolario 3. Sea f : R
n
R
m
, r: R R
n
. Bajo las hip otesis apropiadas,
d
dt
Df(r) h = D
2
f(r(t)) (r
(t), h)
Demostraci on.
Por la regla de la cadena
d
dt
Df(r(t)) h =
_
d
dt
Df(r(t))
_
h
= (D(Df)(r(t)) r
(t)) h
= D
2
f(r(t)) (r
(t), h)
82 CAP
ITULO 1. C
(t), h, k)
Ejemplo 1.1844. Considere la funcion f : R
3
R, f(x
1
, x
2
, x
3
) = x
1
x
2
x
2
x
3
+ x
3
x
1
. Sean h = (h
1
, h
2
, h
3
), k = (k
1
, k
2
, k
3
), entonces
f
h
=
f
x
1
h
1
+
f
x
2
h
2
+
f
x
3
h
3
= h
3
(x
1
x
2
) + h
2
(x
1
x
3
) + h
1
(x
2
+ x
3
)
de donde
D
2
f(a, b, c) ((h
1
, h
2
, h
3
), (k
1
, k
2
, k
3
)) = (h
2
+h
3
)k
1
+(h
1
h
3
)k
2
+(h
1
h
2
)k
3
(note que D
2
f(a, b, c) no depende de (a, b, c))
Ejemplo 1.1845. Sea f : R
3
R
2
, f(x, y, z) = (3xy
2
, x
2
z
3
). Sean h =
(h
1
, h
2
, h
3
), k = (k
1
, k
2
, k
3
) entonces
f
h
= (3y
2
h
1
+ 6xyh
2
, 3x
2
h
1
3z
2
h
3
)
de donde
D
2
f(a, b, c)((h
1
, h
2
, h
3
), (k
1
, k
2
, k
3
)) = (6bh
2
k
1
+ (6bh
1
+ 6ah
2
)k
2
, 6(ah
1
k
1
ch
3
k
3
))
Proposicion 15. Sea f : R
n
R
m
de clase C
2
en un disco B
r
(x
0
) R
n
.
Sea f
h
(t) = f(x
0
+ th), entonces en el desarrolo de Taylor de f
h
(t),
f
h
(t) = a + tb +
t
2
2
c + R
3
,
a = f(x
0
), b = Df(x
0
) h, c = D
2
f(x
0
) (h, h).
Demostraci on.
Evaluando f
h
(0) y f
h
(t) obtenemos
f
h
(0) = f(x
0
),
f
h
(t) = Df(x
0
+ th) h (1.20)
en particular,
f
h
(0) = Df(x
0
) h
1.18. DERIVADAS PARCIALES DE ORDEN SUPERIOR 83
derivando una vez mas (1.20) respecto de t, obtenemos del Corolario (3),
f
h
(0) = D
2
f(x
0
) (h, h)
El resultado anterior nos permite calcular la forma cuadratica D
2
f(x
0
)(h, h).
El siguiente resultado nos permite recuperar la forma bilineal
Proposicion 16. Sea B: R
n
R
n
R
m
bilineal simetrica, Q(x) = B(x, x),
entonces
B(x, y) =
1
2
(Q(x +y) Q(y) Q(x)) .
Ejemplo 1.1846. Calcule la segunda diferencial de f : R
3
R, f(x
1
, x
2
, x
3
) =
x
1
x
2
x
2
x
3
+ x
3
x
1
en el punto (a, b, c).
Tenemos
f
(h
1
,h
2
,h
3
)
(t) = (a + h
1
t)(b + h
2
t) + (a + h
1
t)(c + h
3
t) (b + h
2
t)(c + h
3
t)
Expandiendo en serie de Taylor a orden 2 se obtiene
f
(h
1
,h
2
,h
3
(t) = (a(b + c) bc) + (a(h
1
+ h
3
) + b(h
1
h
3
) + c(h
1
h
2
)) t
+(h
1
(h
2
+ h
3
) h
2
h
3
) t
2
+ O(t
3
)
si denotamos por B la forma bilineal D
2
f(a, b, c) y por Q la correspondiente
forma cuadratica, entonces
Q(h
1
, h
2
, h
3
) = 2 (h
1
(h
2
+ h
3
) h
2
h
3
)
luego
B((h
1
, h
2
, h
3
), (h
1
, h
2
, h
3
)) = (h
2
+ h
3
)k
1
+ (h
1
h
3
)k
2
+ (h
1
h
2
)k
3
.
ahora podemos generalizar la
1.18.2 El teorema de Taylor
Las diferenciales de orden superior permiten aproximar los valores de una
funcion en un entorno de un punto x
0
y es la generalizacion para funciones
de una variable real.
84 CAP
ITULO 1. C
0
) (h, h, , h)
para alg un punto x
0
contenido en el segmento que une x
0
con h.
1.19 Maximos y mnimos de funciones de varias
variables
En esta seccion abordaremos el problema de determina cuando una funcion
real de varias variables posee un mnimo o un maximo (valor exremo). Obvi-
amente habremos de considerar funciones a valores reales pues habremos de
comparar distitintos valores de la funcion, cosa que es imposible en funciones
a valores vectoriales. Existe sin embargo un concepto de optimalidad que
en cierta forma balancea valores antagonicos llamada otpimizacion de Pareto
pero que no habremos de considerar en estas notas, sino de pasada.
Para funciones de una variable real, (a) un punto extremo en un punto
interior del dominio es un punto crtico, i.e. la primera derivada se anula,
ademas, tratandose de un punto crtico, existen dos criterios para determinar
si tal punto crtico es extremo: (c) el cambio de signo de la primera derivada
o, (c) el signo de la segunda derivada en el punto crtico, si esta existe.
Para funciones de dos o mas variables, el criterio (a) se generaliza para
mas variables.
Denicion 17. Sea f : R
n
R
n
decimos que f tiene un maximo (resp.
mnimo) local en x
0
si f(x
0
) f(x) (resp. f(x
0
) f(x) para toda x en un
disco B
r
(x
0
) R
n
.
1.19. M
AXIMOS YM
(1/2) = 0.
Denicion 18. Un punto x D R
n
se dice interior, si existe un disco
B
r
(x) D.
Proposicion 17. Sea f : R
n
una funcion diferenciable en U R
n
. Si f
tiene un extremo en un punto interior de U, x
0
, entonces Df(x
0
) = 0.
Demostraci on.
Sea r tal B
r
(x) U y sea u un vector unitario cualquiera. El segmento
r(t) = x
0
+t u esta contenido en D para [t[ sucientemente peque no, pues x
0
es punto interior. De la hipotesis se sigue que la funcion real de una variable
real (t) = f(r(t)) tiene un maximo en t = 0, por lo que su derivada se anula
en t = 0. Por la regla de la cadena:
0 =
ITULO 1. C
i,j=1
x
i
x
j
B(
i
,
j
)
n
i=1
x
i
_
n
j=1
B
ij
x
j
_
donde la matrix de coecientes B = (B
ij
) es simetrica. Si los elementos
x R
n
se representan por vectores columna, entonces se puede escribir en
forma compacta
B(x, x) = x
T
Bx.
El siguiente resultado de algebral lineal sera muy util para nuestro analisis.
Teorema 17. Sea B R
nn
una matriz simetrica. Entonces existe una
matriz ortogonal Q R
nn
tal que
Q
T
BQ = D
donde D es una matriz diagonal. Las columnas de Q forman un conjunto
ortonormal de vectores propios de B.
Ejemplo 1.1948. La matriz simetrica
B =
_
2
2 1
_
1.19. M
AXIMOS YM
3
_
1
2 1
_
en efecto
Q
T
BQ =
1
3
_
1
2 1
__
2
2 1
__
1
2 1
_
=
1
3
_
1
2 1
2
__
0 3
2
0 3
_
=
_
0 0
0 3
_
=
_
1
0
0
2
_
Por supuesto, si conocemos solo la matriz simetrica la pregunta es como
calcular Q. El siguiente resultado muestra que vectores propios correspondi-
entes a valores propios distintos son ortogonales:
Proposicion 18. Sea B simetrica. Si
1
, e
1
,
1
, e
1
son parejas de valores y
vectores propios asociadas a valores propios distintos, entonces e
1
y e
2
son
ortogonales.
Demostraci on.
Multipliquemos las ecuaciones
Be
1
=
1
,
Be
2
=
2
,
la primera escalarmente por e
2
y la primera por e
1
; al restar se obtiene
e
T
2
Be
1
e
T
1
Be
2
= (
1
2
)e
T
2
e
1
El lado izquierdo es cero, por simetra, luego si
1
,=
2
entonces e
T
2
e
1
=
0.
En otras palabras, si B tiene n valores propios distintos
i
, i = 1, 2, . . . , n,
entonces la base de vectores propios se obtiene resolviendo los sitemas de
ecuaciones
Be
i
=
i
e
i
.
88 CAP
ITULO 1. C
3
0
3 6
_
_
El polinomio caracterstico p() = ( 3)
2
(7 ) tiene
1,3
= 3 como raiz
(doble) y
3
= 7. No es difcil ver que para
3
= 7 el sistema lineal a resolver
es
_
_
4 0 0
0 3
3
0
3 1
_
_
_
_
x
y
z
_
_
=
_
_
0
0
0
_
_
.
Claramente la segunda y tercera ecuacion son linealmente dependientes as
que el sistema a resolver se reduce a
4x = 0
3y +
3z = 0
cuya solucion general es
_
0,
z
3
, z
_
tomando z =
3
2
).
Para
1,2
= 3 el sistema
_
_
0 0 0
0 1
3
0
3 1
_
_
_
_
x
y
z
_
_
=
_
_
0
0
0
_
_
.
se reduce a una sola ecuacion independiente
y +
z
3
= 0
cuya solucion general depende de dos parametros, x y z:
(x,
3z, z)
1.19. M
AXIMOS YM
3, 1).
un vector unitario es
e
2
= (0,
3
2
,
1
2
).
En resumen, la matriz ortogonal que diagonaliza la forma cuadratica es
Q =
_
_
1 0 0
0
3
2
1
2
0
1
2
3
2
_
_
y se comprueba directamente que
Q
T
BQ = diag(3, 3, 7).
Observaci on 16. A un cuando haya valores propios repetidos, digamos que
k
tenga multiplicidad k < n, el sistema lineal
(A
k
I)x = 0
tiene rango k, es decir existen k soluciones linealmente independientes. Por
el proceso de ortogonalizacion de Gramm-Scmidt se pueden obtener k vec-
tores propios asociados al mismo valor propio que sean orgogonales entre s,
e
(k)
1
, e
(k)
2
, . . ., e
(k)
k
. Estos vectores propios se completan con el resto hasta
completar una base.
Denicion 19. Una matriz simetrica B se dice:
1. Denida, si
x
T
Bx ,= 0
para toda x ,= 0;
2. No negativa, si
x
T
Bx 0;
90 CAP
ITULO 1. C
tal que
x
T
Bx
= 0.
El siguiente criterio permite decidir si una forma cuadratica es denda
positiva o no.
Teorema 18. Una matriz simetrica B es:
1. Denida si y solo si todos los valores propios son distintos de cero.
2. Positiva (negativa) denda si y solo si todos los valores propios son
positivos (negativos).
3. Positiva semidenda si y solo si todos los valores propios son no nega-
tivos y al menos uno es cero.
Ejemplo 1.1950.
La matriz asociada a la forma cuadratica
B(x, x) = 2x
2
1
+ 2
2x
1
x
2
+ x2
2
es
B =
_
2
2 1
_
cuyo polinomio caracterstico es
p() = ( 3)
de donde los valores propios son
1
= 0 y
2
= 3. Se sigue que la forma
cuadratica es positiva semidenida. El lector puede comprobar la matriz
Q =
1
3
_
1
2 1
_
1.19. M
AXIMOS YM
(y, y) = x
T
Qx(Qy)
T
Q(Qy) = y
T
(Q
T
BQ)y = y
T
Dy = 3y
2
2
.
1.19.2 Aplicacion a la determinacion de maximos y
mnimos
Nuestro interes en diagonalizar una forma cuadatica es que la forma diagonal
es tan mas simple que se puede determinar el caracter de maximo o mnimo.
Teorema 19. Sea f : R
n
R una funcion diferenciable en B
r
(x
0
) R
n
que
posee diferencial de orden dos en x
0
. Sea B la matriz asociada a la forma
cuadratica D
2
f(x
0
). Entonces
1. Si B es positva denida, entonces x
0
es un maximo local.
2. Si B es negativa denida, entonces x
0
es un mnimo local.
3. Si B es denida, pero no es negativa ni positiva, entonces x
0
es un
punto silla