Está en la página 1de 38

Tema 2: Calculo diferencial en varias

variables

Indice
1. Funciones de varias variables reales 1
1.1. Nociones de Topologa en R
n
. . . . . . . . . . . . . . . . . . . . . . . 1
1.2. Funciones entre espacios eucldeos. Generalidades . . . . . . . . . . . 3
1.3. Lmites y continuidad . . . . . . . . . . . . . . . . . . . . . . . . . . . 4
2. Derivadas direccionales. Derivadas parciales 10
2.1. Derivada seg un un vector . . . . . . . . . . . . . . . . . . . . . . . . . 10
2.2. Derivadas de funciones vectoriales . . . . . . . . . . . . . . . . . . . . 11
2.3. Derivadas parciales . . . . . . . . . . . . . . . . . . . . . . . . . . . . 12
2.4. Derivadas de orden superior . . . . . . . . . . . . . . . . . . . . . . . 13
3. Diferenciabilidad 14
3.1. Diferenciabilidad de funciones escalares . . . . . . . . . . . . . . . . . 14
3.2. Diferenciabilidad de las funciones vectoriales . . . . . . . . . . . . . . 19
3.3. Regla de la cadena . . . . . . . . . . . . . . . . . . . . . . . . . . . . 20
4. Extremos de las funciones de varias variables 26
4.1. Extremos libres . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 26
4.2. Extremos condicionados . . . . . . . . . . . . . . . . . . . . . . . . . 34
1. Funciones de varias variables reales
Este tema constituye una introduccion al calculo diferencial de las funciones de
varias variables reales, es decir, funciones del tipo f : AR
m
, donde A es un
1
subconjunto del espacio R
n
. Nuestro proposito es extender a estas funciones las
nociones de lmite, continuidad y derivabilidad, que estudiabamos en Primer Curso
para las funciones de una variable.
1.1. Nociones de Topologa en R
n
La nocion de distancia facilita el estudio de propiedades topologicas en R
n
, que
desempe naran un papel importante en temas sucesivos. Todas estas propiedades
involucran de un modo u otro el siguiente concepto.
Denici on 1.1. Sean x
0
un punto de R
n
y r > 0. Se llama bola abierta de centro
x
0
y radio r al conjunto
B(x
0
, r) = x R
n
: d(x, x
0
) < r .
El conjunto
B(x
0
, r) = x R
n
: d(x, x
0
) r
se denomina bola cerrada de centro x
0
y radio r.
Estas nociones nos permiten clasicar los puntos de R
n
seg un su posicion respecto
a un conjunto de este espacio.
Denici on 1.2. Sea A un subconjunto de R
n
y sea x
0
R
n
. Se dice que:
(1) x
0
es un punto interior al conjunto A si existe una bola abierta centrada en
x
0
contenida en A.
(2) x
0
es un punto adherente al conjunto A si toda bola centrada en x
0
contiene
un punto de A.
(3) x
0
es un punto frontera de A si toda bola centrada en x
0
contiene un punto de
A y otro de su conjunto complementario R
n
A.
Notese que un punto interior de un conjunto A siempre pertenece a dicho con-
junto. No solo eso, muchos de sus vecinos (los elementos de una bola centrada en ese
punto) tambien estan en A. De la misma forma, un elemento del conjunto A siempre
es un punto adherente de dicho conjunto. El recproco no es cierto, pero si x
0
es un
punto adherente de A, entonces siempre se puede aproximar tanto como se quiera
por elementos de A. Finalmente, un elemento de R
n
sera un punto de frontera de
2
un conjunto A si puede aproximarse tanto como se quiera por puntos de A y por
puntos exteriores a A. De ah el nombre.
Dado un subconjunto A R
n
, utilizaremos los smbolos Int(A), A y fr(A) para
designar, respectivamente, a los conjuntos formados por los puntos interiores, puntos
adherentes y puntos de frontera de A.
Denici on 1.3. Se dice que el conjunto A es abierto si todo x
0
A es un punto
interior de A. Se dice que A es cerrado si todos sus puntos adherentes pertenecen a
el.
Reiteremos que para todo conjunto A se tienen las inclusiones
Int(A) A A.
El hecho de que A sea abierto (resp. cerrado) signica que Int(A) = A (resp. A = A).
Ejemplo.
Las bolas abiertas (resp. cerradas) en R
n
son conjuntos abiertos (resp. cerrados).
Justifquese esta armacion al menos en los casos en que n = 2 y n = 3.
1.2. Funciones entre espacios eucldeos. Generalidades
En este apartado presentamos algunas generalidades acerca de las funciones de
varias variables reales.
El dominio de una tal funcion es el conjunto de los puntos en los que esta denida.
Este conjunto sera representado por dom(f). As, por ejemplo, la expresion
f(x, y) =
x
x
2
+ y
2
tiene sentido para todo punto del plano distinto del (0, 0). Por eso, salvo que restrin-
jamos explcitamente su dominio, tendremos que
dom(f) =
_
(x, y) R
2
: (x, y) ,= (0, 0)
_
.
Sea f una funcion denida en un conjunto A de R
n
, con valores en R
m
. Se llama
rango (o imagen) de f al conjunto f(A) := f(a) : a A. As por ejemplo, para la
funcion considerada previamente se tiene f(A) = R 0 (razonese esto).
3
Se denomina graco de f al conjunto (a, f(a)) : a A. Tiene especial interes
el caso en que m = 2 y n = 1: el graco de f es entonces una supercie en R
3
.
As por ejemplo, el graco de la funcion f : R
2
R denida por
f(x, y) =
_
x
2
+ y
2
es el cono con vertice en el origen de coordenadas y tiene por generatriz cualquier
recta que forme un angulo de amplitud

4
con el plano z = 0. La expresion
f(x, y) =
_
R
2
(x
2
+ y
2
)
dene una funcion en el conjunto (x, y) R
2
: x
2
+ y
2
R
2
, cuya graca es la
porcion de esfera de radio R con centro en el punto (0, 0, 0) que queda por encima
del plano z = 0.
Otra nocion interesante, que desempe na un papel importante en la representacion
de conjuntos en el plano o el espacio, es el concepto de curva o supercie de nivel. Si
f es una funcion real denida en un subconjunto abierto A de R
n
y c es un n umero
real entonces el conjunto de nivel c de la funcion f es, por denicion, el conjunto
S = x A : f(x) = c .
Cuando n = 2 (respectivamente n = 3) este conjunto suele ser una curva plana
(respectivamente una supercie en el espacio tridimensional) y recibe el nombre de
curva (respectivamente supercie) de nivel c de la funcion f.
As por ejemplo, el conjunto de nivel c (siendo c una constante positiva) de la
funcion de dos variables denida por medio de la expresion
f(x, y) = x
2
+ y
2
es la circunferencia de radio

c centrada en el punto (0, 0). Que ocurre si c = 0?
Y si c < 0?
De la misma forma, los conjuntos de nivel (positivo) de la funcion
f(x, y, z) = x
2
+ y
2
+ z
2
son esferas centradas en el origen de coordenadas.
El estudio de las funciones vectoriales de varias variables reales se reduce en
muchos casos al de funciones escalares (es decir, funciones cuya imagen es un sub-
conjunto de R). Una funcion generica f : A R
n
R
m
asocia a cada a A
4
un vector del espacio R
m
. Designando por f
1
(a), . . . , f
m
(a) a las coordenadas de
este vector, obtenemos m funciones f
1
, . . . , f
m
: AR, que reciben el nombre
de funciones componentes de f. As por ejemplo, las componentes de la funcion
f : R
3
R
2
denida por la expresion
f(x, y, z) =
_
xy, x
2
+ y
2
z
3
_
son las funciones f
1
(x, y, z) = xy y f
2
(x, y, z) = x
2
+ y
2
z
3
.
Los conceptos de funcion acotada y extremo para una funcion de varias variables
son los que cabe esperar. La funcion f : A R
m
R
n
es acotada (en A) si es
acotado el conjunto imagen f(A), es decir, si existe una constante K > 0 tal que
|f(x)| K, para todo x A.
En el caso en que m = 1 se dice que f presenta un maximo absoluto (resp.
mnimo absoluto) en un punto a A si f(a) f(x) (resp. f(a) f(x)) para todo
x A. No puede denirse, en este contexto, el concepto de funcion monotona, ya
que en R
m
no existe un orden como en R.
1.3. Lmites y continuidad
La nocion de lmite para las funciones de varias variables es completamente
analoga a la de las funciones de una sola variable.
Denici on 1.4. Sea f una funcion denida en un subconjunto A de R
n
, con valores
en R
m
, y sea a un punto de acumulacion del conjunto A. Se dice que f tiende hacia
el punto R
m
, cuando x tiende hacia a, si para cada > 0 existe un > 0 tal
que para todo x A con 0 < |x a| < se tiene |f(x) | < . En este caso se
escribe
lm
xa
f(x) = .
Observese que con el smbolo | | hemos designado simultaneamente la norma
de R
n
y la de R
m
aunque estas representan, obviamente, cosas distintas cuando
n ,= m.
Intuitivamente, el hecho de que lm
xa
f(x) = signica que el punto f(x) puede
aproximarse a tanto como se quiera, con tal de tomar x sucientemente cerca de
a. Por otra parte, el punto a no puede aproximarse por elementos del dominio de f
cuando a es un punto aislado con respecto a dicho conjunto. Por esta razon hemos
exigido que a sea un punto de acumulacion de A en la denicion anterior. Notemos,
5
nalmente, que en no se exige que la funcion f este denida en el punto a para la
existencia de lmite en dicho punto.
Ejemplo.
Sea f : R
2
R la funcion que asocia a cada vector de R
2
su primera compo-
nente, es decir,
f(x, y) = x.
Demostremos que para cualquier (x
0
, y
0
) R
2
se tiene
lm
(x,y) (x
0
,y
0
)
f(x, y) = x
0
.
Fijado > 0 hemos de encontrar un > 0 tal que
si |(x, y) (x
0
, y
0
)| < entonces [x x
0
[ < . (1)
Como (y y
0
)
2
0 tenemos que
[x x
0
[
_
(x x
0
)
2
+ (y y
0
)
2
= |(x, y) (x
0
, y
0
)|
cualesquiera que sean los n umeros x, y R, y la armacion (1) se satisface tomando
= .
Las propiedades usuales de los lmites en una variable, tales como la unicidad,
la estabilidad frente a las operaciones aritmeticas, o las propiedades de orden y de
la funcion encajada (en el caso de funciones escalares) conservan su validez en este
contexto. As por ejemplo, para la funcion de tres variables dada por
f(x, y, z) =
x
x + y + z
se tiene
lm
(x,y,z) (x
0
,y
0
,z
0
)
f(x, y, z) =
x
0
x
0
+ y
0
+ z
0
cualquiera que se el vector (x
0
, y
0
, z
0
) tal que x
0
+ y
0
+ z
0
,= 0.
No vamos a probar estas propiedades, pues las demostraciones son adaptaciones
faciles de las que hicimos en Calculo para las funciones reales de una variable.
El siguiente resultado reduce el estudio del lmite de una funcion vectorial de
varias variables al de sus funciones componentes. Por esta razon restringiremos nues-
tra atencion a las funciones escalares.
6
Proposici on 1.5. Sea f una funcion denida en un subconjunto A de R
n
, con val-
ores en R
m
. Sea a un punto de acumulacion del conjunto A y sea = (
1
, . . . ,
m
)
R
m
. El lmite lm
xa
f(x) existe y vale si, y solo si, para cada i 1, . . . , n existe y
vale
i
el lmite lm
xa
f
i
(x).
A continuacion denimos los lmites seg un subconjuntos del dominio, que pueden
verse como generalizaciones de los lmites laterales para las funciones de una variable.
Denici on 1.6. Sea f una funcion denida en un subconjunto A de R
n
, con valores
en R
m
, sea B un subconjunto de A, y sea a un punto de acumulacion del conjunto
B. Se dice que f tiende hacia el vector R
m
, cuando x tiende hacia a seg un el
subconjunto B, si para cada > 0 existe un > 0 tal que para todo x B con
0 < |x a| < se tiene |f(x) | < . En este caso se escribe
lm
xa
xB
f(x) = .
Para funciones de una variable, la existencia del lmite en un punto equivale a que
existan y sean iguales los lmites laterales en dicho punto. Puede demostrarse una
formulacion analoga a este resultado en el caso de las funciones de varias variables,
pero es algo tecnica y ni siquiera la vamos a mencionar. Resulta util, no obstante,
la siguiente relacion entre el lmite ordinario y el lmite seg un un subconjunto.
Proposici on 1.7. Sea f una funcion denida en un subconjunto A de R
n
, con
valores en R
m
, sea B un subconjunto de A, y sea a un punto de acumulacion del
conjunto B.Si existe el lmite lm
xa
f(x) entonces tambien existe el lmite de f
con respecto a B en el punto a, y
lm
xa
xB
f(x) = lm
xa
f(x).
Esta proposicion se utiliza habitualmente para probar la no existencia de un
lmite: el contrarrecproco nos dice que si encontramos dos subconjuntos B
1
, B
2
A
(de los cuales a es un punto de acumulacion) y tales que
lm
xa
xB
1
f(x) ,= lm
xa
xB
2
f(x),
entonces no existe el lmite de f en el punto a.
7
Ejemplos: (i) Sea f la funcion real de dos variables denida por la expresion
f(x, y) =
_
_
_
xy
x
2
+ y
2
, (x, y) ,= (0, 0);
0, (x, y) = (0, 0).
Demostraremos que no existe el lmite
lm
(x,y) (0,0)
f(x, y).
Para ello calcularemos el lmite de f seg un la recta B
m
de ecuacion y = mx y
comprobaremos que dicho lmite depende de m. Para todo (x, y) B
m
tal que
(x, y) ,= (0, 0) se tiene
f(x, y) =
xy
x
2
+ y
2
=
x (mx)
x
2
+ m
2
x
2
=
m
1 + m
2
.
As pues,
lm
xa
xB
m
f(x, y) =
m
1 + m
2
.
Dando a m los valores 0 y 1, por ejemplo, vemos que son distintos los lmites de
f seg un las rectas y = 0 e y = x, de donde se inere que no existe el lmite de f
cuando (x, y) (0, 0).
(ii) Sea f : R
2
R la funcion denida por
f(x, y) =
_

_
x
2
y
, y ,= 0;
0, y = 0.
Probaremos que no existe
lm
(x,y) (0,0)
f(x, y)
viendo que el lmite seg un la recta y = x y la parabola y = x
2
son distintos.
Para cada x ,= 0 se tiene
f(x, x) =
x
2
x
= x,
de modo que el lmite de f en el punto (0, 0) seg un la recta y = x existe y es igual
a 0.
Estudiemos ahora el lmite seg un la parabola y = x
2
. Para cada x ,= 0 tenemos
que
f(x, x
2
) =
x
2
x
2
= 1.
8
Por tanto, el lmite de f seg un este subconjunto es igual a 1.
Habiendo obtenido valores distintos del lmite para subconjuntos distintos de R
2
puede concluirse que no existe el lmite propuesto.
La Proposicion 1.7 se utiliza a veces para conjeturar el posible valor de un lmite.
El siguiente ejemplo ilustra como puede hacerse esto.
Ejemplo. Sea f la funcion denida por
f(x, y) =
_

_
xy
_
x
2
+ y
2
, y ,= 0;
0, y = 0.
Puesto que para todo x ,= 0 es f(x, x) =
x

2
se sigue que existe y vale 0 el lmite
de f cuando (x, y) (0, 0) seg un la recta y = x. As pues, caso de existir, el lmite
lm
(x,y) (0,0)
f(x, y) debe ser necesariamente igual a 0.
Comprobemos que este es, efectivamente, el caso. Como para cada (x, y) ,= (0, 0)
se tienen las desigualdades [x[ |(x, y)| y [y[ |(x, y)| resulta
[f(x, y) 0[ = [f(x, y)[ =
[x[ [y[
_
x
2
+ y
2

|(x, y)| |(x, y)|


|(x, y)|
= |(x, y)|.
Y utilizando la propiedad de la funcion encajada inferimos que f(x, y) 0 cuando
(x, y) (0, 0).
Pasemos ya al estudio de la continuidad de las funciones de varias variables.
Denici on 1.8. Sea f una funcion denida en un subconjunto A de R
n
, con valores
en R
m
. Se dice que f es continua en un punto a A si para cada > 0 existe un
> 0 de modo que si x A y |x a| < entonces |f(x) f(a)| < .
Diremos que f es continua en A si lo es en cada uno de los puntos de dicho
conjunto.
Notemos que si a es un punto de acumulacion de A entonces f es continua en a
si, y solo si existe y vale f(a) el lmite lm
xa
f(x). Como consecuencia de este hecho
se sigue que una funcion con valores en el espacio R
n
es continua en un punto si, y
solo si, lo son sus funciones componentes.
Por otra parte, a partir de las propiedades de los lmites podemos deducir
propiedades locales de la continuidad para las funciones de varias variables analogas
a las existentes para las de una sola variable. En particular, la continuidad es estable
9
frente a las operaciones aritmeticas. El resultado de estabilidad frente a la composi-
cion de funciones se extiende tambien de forma natural: si g es una funcion denida
en un conjunto A R
n
y f es una funcion denida en un subconjunto B f(A),
entonces la funcion compuesta f g es continua en un punto a A si g es continua
en a y f es continua en g(a).
De vez en cuando utilizaremos la propiedad de conservacion del signo para fun-
ciones continuas: si f es una funcion real, denida en un subconjunto A R
n
, y a
es un punto de A donde f es continua y tal que f(a) ,= 0, entonces existe un r > 0
de modo que
signo f(x) = signo f(a), para todo x B(a, r) A.
Con respecto a la continuidad global, enunciamos sin demostracion el siguiente
teorema de Weierstrass, que sera util en el futuro.
Teorema 1.9 (Weierstrass). Sea D un subconjunto cerrado y acotado de R
n
. Si
f : DR es una funci on continua en D entonces f es acotada y tiene un maximo
y un mnimo absolutos.
2. Derivadas direccionales. Derivadas parciales
Hemos visto que, al menos desde un punto de vista formal, no hay muchas
diferencias entre las funciones de una o varias variables respecto a las propiedades
de los lmites y la continuidad. No sucede lo mismo con la derivabilidad. El primer
problema aparece en la denicion misma de derivada. Recordemos que una funcion
real f denida en un intervalo abierto I R es derivable en un punto a I si existe
y es nito el lmite
lm
t 0
f(a + t) f(a)
t
.
Esta denicion no puede extenderse a funciones de mas de una variable, al no estar
denida la division de vectores.
2.1. Derivada seg un un vector
La siguiente nocion constituye una primera generalizacion del concepto de deriva-
da para las funciones de varias variables reales.
10
Denici on 2.1. Sea f una funcion real denida en un subconjunto abierto A de R
n
y sea v un vector no nulo de R
n
. Se dice que f es derivable en un punto a A con
respecto a v si existe
lm
t 0
f(a + tv) f(a)
t
.
Este lmite se representa habitualmente con el smbolo D
v
f(a).
Si f es derivable en todo punto de A con respecto al vector v, la funcion que
asigna a cada a A el n umero D
v
f(a) recibe el nombre de derivada primera de f
con respecto al vector v, y se designa por D
v
f.
Nota
El hecho de que A sea un subconjunto abierto de R
m
permite que tenga sentido
la expresion
f(a + tv) f(a)
t
,
al menos cuando el n umero t se mueve en cierto intervalo centrado en 0.

Esta es
la razon por la que hemos exigido que A sea un conjunto abierto en la denicion
anterior.
Ejemplo.
Sea f la funcion denida en R
2
denida por medio de la expresion
f(x, y) =
_

_
x
2
y
, y ,= 0;
0, y = 0.
Ya hemos comprobado que f no es continua en (0, 0). Veamos ahora que f admite
derivada en este punto con respecto a cualquier vector v = (v
1
, v
2
) R
2
. Para cada
t ,= 0 se tiene
f ((0, 0) + t(v
1
, v
2
)) f(0, 0)
t
=
f (tv
1
, tv
2
)
t
.
Si v
2
= 0, entonces
f(tv
1
, tv
2
) = f (tv
1
, 0) = 0,
de suerte que
f ((0, 0) + t(v
1
, v
2
)) f(0, 0)
t
= 0,
11
y por tanto,
D
v
f(0, 0) = lm
t 0
f ((0, 0) + t(v
1
, v
2
)) f(0, 0)
t
= 0.
Si v
2
,= 0, entonces
f(tv
1
, tv
2
) =
tv
2
1
v
2
,
luego
f ((0, 0) + t(v
1
, v
2
)) f(0, 0)
t
=
v
2
1
v
2
.
Consecuentemente,
D
v
f(0, 0) = lm
t 0
f ((0, 0) + t(v
1
, v
2
)) f(0, 0)
t
=
v
2
1
v
2
.
2.2. Derivadas de funciones vectoriales
La nocion de derivada respecto a un vector se extiende sin problemas a funciones
vectoriales de varias variables: una funcion f denida en un abierto A de R
n
, con
valores en R
m
, es derivable en un punto a A con respecto al vector v R
n
si existe
el lmite
D
v
f(a) = lm
t 0
f(a + tv) f(a)
t
.
De acuerdo con las propiedades de los lmites para funciones vectoriales se sigue que
la funcion f es derivable en el punto a con respecto al vector v si, y solo si, lo es
cada una de las componentes de f, f
1
, . . . , f
m
, y en tal caso
D
v
f(a) = (D
v
f
1
(a), . . . , D
v
f
m
(a)).
As pues, el estudio de las derivadas de funciones vectoriales se reduce al de las
funciones escalares.
La derivacion direccional posee propiedades analogas a las de la derivacion de
funciones de una sola variable. Se verican, en particular, las reglas aritmeticas
usuales de derivacion. No vamos a entrar en estas cuestiones. La unica diferencia
relevante con respecto a las funciones de una variable esta en la derivacion de fun-
ciones compuestas, que estudiaremos mas adelante.
12
2.3. Derivadas parciales
Sea f una funcion (escalar o vectorial) denida en un conjunto abierto A del
espacio R
n
. Sea v = e
i
, es decir, el vector cuyas componentes son todas nulas salvo
la i-esima, que es igual a 1. La derivada D
v
f(a) recibe el nombre o derivada parcial
con respecto a la variable x
i
. Lo designaremos por
f
x
i
(a), o por D
i
f(a).
Cuando f es derivable con respecto a la variable x
i
en cada punto a A, la
funcion D
e
i
f : a
f
x
i
(a) se llama derivada parcial primera con respecto a la
variable x
i
y se denota normalmente con los smbolos
f
x
i
o D
i
f.
Veamos un metodo practico para el calculo de las derivadas parciales. Para sim-
plicar la notacion supondremos que f es una funcion denida en R
2
. Fijemos un
punto a = (x
0
, y
0
) R
2
, y designemos por a la funcion de una variable denida
por la expresion
(x) = f(x, y
0
).
Para cada t R, t ,= 0, se tiene
(x
0
+ t) (x
0
)
t
=
f(x
0
+ t, y
0
) f(x
0
, y
0
)
t
=
f(a + te
1
) f(a)
t
,
de modo que es derivable en t
0
si, y solo si, existe
f
x
(a), y en ese caso

(t
0
) =
f
x
(x
0
, y
0
).
Asimismo, el estudio de la derivada
f
y
(x
0
, y
0
) se reduce al de la derivada de la
funcion de una sola variable (t) = f(x
0
, t).
As pues, la derivada parcial de f respecto a la variable x (respectivamente y)
en el punto (x
0
, y
0
) puede obtenerse aplicando las reglas usuales de derivacion para
funciones de una variable real a la funcion f tratando a la variable y (respectivamente
x) como si fuese constante. Este resultado se extiende de forma obvia a las funciones
de tres o mas variables.
Ejemplo. Las derivadas parciales de la funcion
f(x, y, z) = x
3
+ y
2
5xz
13
en un punto generico (x
0
, y
0
, z
0
) R
3
son
f
x
(x
0
, y
0
, z
0
) = 3x
2
0
5z
0
,
f
y
(x
0
, y
0
, z
0
) = 2y
0
,
f
z
(x
0
, y
0
, z
0
) = 5x
0
.
2.4. Derivadas de orden superior
Sea f una funcion (escalar o vectorial) denida en un subconjunto abierto A de
R
n
. Supongamos la derivada de f respecto de la variable x
i
existe en todo punto
del conjunto A. Sea a A y sea j 1, . . . , n. Si la funcion D
i
f admite derivada
respecto de x
j
en el punto a entonces se dice que f es dos veces derivable en a
respecto de las variables x
i
y x
j
(en este orden). La derivada de la funcion D
i
f en
el punto a se denomina derivada segunda de f en el punto a con respecto a las
variables x
i
y x
j
, y se designa normalmente con el smbolo D
2
i,j
f o

2
f
x
i
x
j
. As pues,
D
2
i,j
f = D
j
(D
i
f)(a).
Si j = i, entonces se emplea la notacion D
2
i
f o

2
f
x
2
i
.
Si la funcion f admite derivada segunda con respecto a x
i
y x
j
en cada punto
a A cabe denir una nueva funcion, la que asigna a cada a A el vector D
2
i,j
f(a).
Esta funcion, denotada por D
2
i,j
f, recibe el nombre de derivada segunda de f respecto
a las variables x
i
y x
j
. Procediendo de forma analoga se denen las derivadas de f
de orden superior a dos.
Se dice que la funcion f es de clase (
p
(A) (p 1) si existen y son continuas en
el conjunto A todas sus derivadas parciales de orden p.
Teorema 2.2. Sea f una funcion denida en un subconjunto abierto de R
n
, y sean
i, j 1, . . . , n. Si las funciones D
2
i,j
f y D
2
j,i
f son continuas en un punto a A,
entonces
D
2
i,j
f(a) = D
2
j,i
f(a).
La demostracion de este resultado, haciendo uso de las herramientas de las que
disponemos, es algo tecnica y preferimos omitirla. Mas adelante veremos como puede
demostrarse de forma facil y elegante aplicando un resultado sobre integrales m ulti-
ples.
14
3. Diferenciabilidad
Las derivadas direccionales no constituyen la generalizacion genuina del concepto
de derivada para las funciones de una variable, pues tal y como hemos visto, no
implican siquiera continuidad. En esta seccion estudiamos una extension mas fuerte
de dicho concepto.
3.1. Diferenciabilidad de funciones escalares
Si f es una funcion real denida en un intervalo abierto I de n umeros reales,
entonces la derivabilidad de f en un punto a I equivale a la existencia de un
n umero real D tal que
lm
t 0
f(a + t) f(a) Dt
t
= 0.
Caso de existir este lmite, el n umero D no es otra cosa que la derivada de f en a.
Reemplazando el n umero D por un vector de R
n
obtenemos el siguiente concepto.
Denici on 3.1. Sea A un subconjunto abierto del espacio R
n
y sea f una funcion
real denida en A. Se dice que f es diferenciable en un punto a A si existe un
vector D R
n
tal que
lm
h0
f(a + h) f(a) D h
|h|
= 0,
o equivalentemente, si
lm
xa
f(x) f(a) D(x a)
|x a|
= 0.
Enseguida veremos que, el vector D, cuando existe es unico. Este vector se de-
nomina gradiente de f en el punto a, y se representa normalmente con el smbolo
f(a).
El siguiente resultado muestra que toda funcion diferenciable es continua.
Proposici on 3.2. Si f es diferenciable en a entonces es continua en dicho punto.
Demostracion. Para cada x A se tiene
f(x) f(a) = |x a|
f(x) f(a) f(a) (x a)
|x a|
+(f)(a) (x a).
15
Puesto que f es diferenciable en a se tiene
lm
xa
f(x) f(a) f(a) (x a)
|x a|
= 0.
Por otra parte,
lm
xa
f(a) (x a) = 0.
Por tanto,
lm
xa
(f(x) f(a)) = 0.
El siguiente teorema relaciona la diferenciabilidad con la existencia de derivadas
direccionales.
Teorema 3.3. Si f es diferenciable en el punto a entonces f es derivable en a con
respecto a cualquier vector no nulo v R
n
, y
D
v
f(a) = f(a) v.
Demostracion. Para simplicar vamos a suponer que A = R
n
. Por hipotesis se tiene
lm
h0
f(a + h) f(a) f(a) h
|h|
= 0.
En virtud de la Proposicion 1.7 se sigue que si B es un subconjunto de R
n
del cual
0 es un punto de acumulacion, entonces
lm
h0
hB
f(a + h) f(a) f(a) h
|h|
= 0.
Sea v un vector no nulo de R
n
, y sea
B = tv : t R.
Entonces
lm
t 0
f(a + tv) f(a) f(a) (tv)
|tv|
= 0,
y consecuentemente,
lm
t 0
f(a + tv) f(a) f(a) (tv)
t
= 0. (2)
16
Por otra parte, para cada n umero t ,= 0 es
f(a + tv) f(a)
t
=
(f(a + tv) f(a) f(a) (tv)) +f(a) (tv)
t
=
f(a + tv) f(a) f(a) (tv)
t
+f(a) v,
de donde utilizando (2) se inere que
lm
t 0
f(a + tv) f(a)
t
= f(a) v
como queramos demostrar.
Como consecuencia de este teorema se obtiene el resultado que anunciabamos
mas arriba sobre la unicidad del vector gradiente.
Corolario 3.4. Si f es diferenciable en a, entonces
f(a) =
n

i=1
f
x
i
(a)e
i
.
En particular, para cualquier vector no nulo v = (v
1
, . . . , v
n
) R
n
se tiene
D
v
f(a) =
n

i=1
v
i
f
x
i
(a).
Demostracion. Por el teorema anterior, para cada i = 1, . . . , n se tiene
f
x
i
(a) = D
v
f(a) = f(a) e
i
.
Por otra parte, como el conjunto e
1
, . . . , e
n
es una base ortonormal del espacio R
n
se sigue que
f(a) =
n

i=1
(f(a) e
i
)e
i
.
Por tanto,
f(a) =
n

i=1
f
x
i
(a)e
i
=
_
f
x
1
(a), . . . ,
f
x
n
(a)
_
.
Sea ahora v = (v
1
, . . . , v
n
) un vector no nulo de R
n
. Entonces, gracias al teorema
precedente, y a la expresion que hemos obtenido para el gradiente resulta
D
v
f(a) = f(a) v =
_
f
x
1
(a), . . . ,
f
x
n
(a)
_
(v
1
, . . . , v
n
) =
n

i=1
v
i
f
x
i
(a).
17
En ejemplos anteriores hemos visto que la funcion
f(x, y) =
_

_
x
2
y
, y ,= 0;
0, y = 0
no es continua en (0, 0) y admite en este punto derivada respecto de cualquier vector.
Este hecho pone de maniesto que en general, la existencia de derivadas direccionales
no implica diferenciabilidad. Sin embargo, no todo se pierde.
Teorema 3.5 (Criterio de diferencibilidad). Si f admite derivadas parciales en
A, y son continuas en a, entonces f es diferenciable en dicho punto.
Demostracion. La demostracion es algo tecnica, debido esencialmente a la notacion
empleada. Para simplicar las cosas supondremos que n = 2. Podemos asumir
asimismo que A = R
2
. Sea h = (h
1
, h
2
) un vector no nulo de R
2
. Trataremos de
estimar la diferencia
(h) = f(a + h) f(a) f(a) h. (3)
Sean los puntos
c
0
= (a
1
+ h
1
, a
2
+ h
2
) = a + h, c
1
= (a
1
, a
2
+ h
2
) , c
2
= (a
1
, a
2
) = a.
Entonces,
f(a + h) f(a) = [f(c
0
) f(c
1
)] + [f(c
2
) f(c
1
)] . (4)
Sea la funcion de una variable denida por la expresion
(t) = f (t, a
2
+ h
2
) .
Como f admite derivada con respecto a x se sigue que es derivable, y que

(t) = D
1
f (t, a
2
+ h
2
) .
Aplicando el Teorema del valor medio de Lagrange deducimos la existencia de un
n umero
1
(0, 1) tal que
(a
1
+ h
1
) (a
1
) = h
1

(a
1
+ h
1
).
Ahora bien, (a
1
) = f(c
1
) y (a
1
+ h
1
) = f(c
0
), luego
f(c
1
) f(c
0
) = h
1
D
1
f (a
1
+
1
h
1
, a
2
+ h
2
) . (5)
18
Utilizando un argumento analogo se comprueba que existe un n umero n umero
2

(0, 1) tal que
f(c
2
) f(c
1
) = h
2
D
2
f (a
1
, a
2
+
2
h
2
) . (6)
Sean ahora los puntos
c

1
(h) = (a
1
+
1
h
1
, a
2
+ h
2
)
y
c

2
(h) = (a
1
, a
2
+
2
h
2
),
Gracias a las igualdades (3), (4), (5) y (6), y a las desigualdades [h
1
[ |h| y
|h
2
| |h| se sigue que
[(h)[
|h|
[D
1
f(c

1
(h)) D
1
f(a)[ +[D
2
f(c

2
(h)) D
2
f(a)[ .
Para terminar falta ver que la expresion del segundo miembro tiende a 0 cuando h
tiende a 0. Como
1
(0, 1) tenemos que |c

i
(h) a| |h|. Por tanto,
lm
h0
c

1
(h) = a = c

1
(0).
Puesto que la funcion D
1
f es continua en el punto a se sigue que
lm
h0
[D
1
f(c

1
(h)) D
1
f(a)] = 0.
Analogamente,
lm
h0
[D
2
f(c

1
(h)) = D
2
f(a)] = 0.
3.2. Diferenciabilidad de las funciones vectoriales
La nocion de diferenciabilidad se extiende a las funciones con valores vectori-
ales. En lugar de dar la denicion usual de este concepto optamos por la siguiente
formulacion equivalente (mas asequible).
Denici on 3.6. Sea f una funcion denida en un abierto A de R
n
, con valores
en R
m
. Se dice que f es diferenciable en un punto a A si lo es cada una de las
funciones componentes f
1
, . . . , f
m
.
Como consecuencia del Teorema 3.3 y el Corolario 3.4 se obtiene la siguiente
caracterizacion de este concepto.
19
Teorema 3.7. Sea A un subconjunto abierto del espacio R
n
y sea f una funcion
denida en A, con valores en R
m
. Entonces f es diferenciable en un punto a A
si, y solo si, existe una matriz Jf(a) /
m,n
tal que
lm
h0
f(a + h) f(a) Jf(a) h
|h|
= 0.
En tal caso, f admite derivada en el punto a con respecto a cualquier vector no nulo
v R
n
, y
D
v
f(a)
t
= Jf(a) v.
En particular, la matriz Jf(a) es unica, y viene dada por la formula
Jf(a) =
_
_
_
_
_
_
D
1
f
1
(a) D
2
f
1
(a) . . . D
n
f
1
(a)
D
1
f
2
(x) D
2
f
2
(a) . . . D
n
f
2
(a)
.
.
.
.
.
.
.
.
.
D
1
f
m
(a) D
2
f
m
(a) . . . D
n
f
m
(a)
_
_
_
_
_
_
.
La matriz Jf(a) recibe el nombre de matriz jacobiana de f en el punto a.
Ejemplo
Sea f : R
2
(0, 0) R
2
la funcion denida por la expresion
f(x, y) =
_
x
x
2
+ y
2
,
y
x
2
+ y
2
_
.
Las derivadas parciales de la primera componente son
f
1
x
(x, y) =
y
2
x
2
(x
2
+ y
2
)
2
y
f
1
y
(x, y) =
2xy
(x
2
+ y
2
)
2
.
Para la funcion f
2
tenemos
f
2
x
(x, y) =
2xy
(x
2
+ y
2
)
2
y
f
2
y
(x, y) =
x
2
y
2
(x
2
+ y
2
)
2
.
20
Estas funciones estan denidas y son continuas en R
2
(0, 0). Por tanto, f es
diferenciable en todo punto de su dominio. La matriz jacobiana de f en un punto
generico (x, y) es
Jf(x, y) =
_
_
y
2
x
2
(x
2
+y
2
)
2
2xy
(x
2
+y
2
)
2
2xy
(x
2
+y
2
)
2
x
2
y
2
(x
2
+y
2
)
2
_
_
.
Calculemos ahora la derivada direccional de f en el punto (1, 0) con respecto al
vector v = (1, 1). La matriz jacobiana en (1, 0) es
Jf(1, 0) =
_
1 0
0 1
_
.
En virtud del Teorema 3.7 se sigue que
D
v
f(1, 0)
t
= Jf(1, 0) (1, 1)
t
=
_
1 0
0 1
_

_
1
1
_
=
_
1
1
_
y por tanto,
D
v
f(1, 0) = (1, 1).
3.3. Regla de la cadena
El concepto de matriz jacobiana permite extender de forma sencilla la Regla de
la cadena para la derivacion de funciones vectoriales compuestas.
Teorema 3.8. Sean A un subconjunto abierto de R
n
y B un subconjunto abierto de
R
m
. Sean f una funcion denida en A, con valores en B, y g una funcion denida
en B, con valores en R
p
. Si f es diferenciable en un punto a A, y g es diferenciable
en f(a), entonces la funcion g f es diferenciable en a. Ademas,
J(g f)(a) = Jg(f(a)) Jf(a).
En la demostracion de este teorema utilizaremos el siguiente resultado auxiliar.
Lema 3.9. Si M es una matriz de tama no m n, entonces existe una constante
C 0 tal que
|M h| C|h|, para cada h R
n
.
21
Demostracion. Consideremos la funcion f : R
n
R
m
denida por la expresion
f(h) = M h.
Claramente, f es una funcion continua y el conjunto S = h R
n
: |h| = 1 es
cerrado y acotado. En virtud del Teorema de Weierstrass se sigue que f es acotada,
de modo que existe una constante C > 0 tal que
_
_
_
_
M
h
|h|
_
_
_
_
C, para todo h R
n
, h ,= 0.
En particular,
|M h| =
_
_
_
_
|h| M
h
|h|
_
_
_
_
= |h|
_
_
_
_
M
h
|h|
_
_
_
_
C|h|.
Obviamente, esta desigualdad es tambien cierta para h = 0.
Demostracion del Teorema 3.8. Sea = g f. Claramente, la diferenciabilidad de
f en el punto a implica la existencia de una funcion E
f
: R
n
R
m
tal que
lm
y 0
E
f
(y) = 0, (7)
y
f(a + y) f(a) = Jf(a)y +|y|E
f
(y), para todo y R
n
. (8)
Analogamente, por la diferenciabilidad de g en el punto f(a) existe una funcion
E
g
: R
m
R
p
tal que
lm
z 0
E
g
(z) = 0, (9)
y
g(f(a) + z) g(a) = Jg(f(a))z +|z|E
g
(z), para todo z R
m
. (10)
Sea h R
n
, h ,= 0, y sea
v = v(h) = f(a + h) f(a).
Combinando las igualdades (8) y (10) se obtiene
(a + h) (a) = g(f(a + h)) g(f(a)) = g(f(a) + v) g(f(a))
= Jg(f(a))v +|v|E
g
(v)
= Jg(f(a)) [Jf(a)h +|h|E
f
(h)] +|v|E
g
(v)
= [Jg(f(a)) Jf(a)] h + Jg(f(a))|h|E
f
(h) +|v|E
g
(v)
= [Jg(f(a)) Jf(a)] h +|h|
_
Jg(f(a)) +
|v|
|h|
E
g
(v)
_
.
22
Falta probar que
lm
h0
_
Jg(f(a))E
f
(h) +
|v|
|h|
E
g
(v)
_
= 0.
Gracias a (7) resulta
lm
h0
(Jg(a) E
f
(h)) = 0.
La funcion f es continua en a (al ser diferenciable en dicho punto). Por tanto, la
funcion v(h) = f(a + h) f(a) es continua en 0. Como lm
v 0
E
g
(v) = 0, E
g
puede
extenderse a una funcion continua en 0 deniendo E
g
(0) = 0. Por tanto,
lm
h0
E
g
(v(h)) = 0.
Para terminar es suciente demostrar que el cociente
v(h)
h
es acotado en una con-
junto de la forma h : 0 < |h| < . Claramente,
v(h)
|h|
=
f(a + h) f(a) Jf(a)
|h|
+ Jf(a)
h
|h|
.
Gracias al lema precedente se sigue la existencia de una constante C > 0 tal que
_
_
_Jf(a)
h
h
_
_
_ C para todo h ,= 0. Por tanto,
|v(h)|
|h|

_
_
_
_
f(a + h) f(a) Jf(a)
|h|
_
_
_
_
+ C, para todo h ,= 0. (11)
Como f es diferenciable en a tenemos que
lm
h0
f(a + h) f(a) Jf(a)
|h|
= 0,
as que existe n umeros , D > 0 tales que
_
_
_
_
f(a + h) f(a) Jf(a)
|h|
_
_
_
_
D, si 0 < |h| < .
Utilizando ahora (11) se sigue que
|v(h)|
|h|
C + D, si 0 < |h| < , (12)
como queramos demostrar.
23
Ejemplo
Sean f y g las funciones denidas por las expresiones
f(x, y) = (x
2
+ 1, y
2
)
y
g(u, v) = (u + v, u, v
2
).
Calculemos las derivadas parciales de la composicion h = g f en el punto (1, 1).
Tanto f como g son diferenciables en sus dominios. Las matrices jacobianas de
estas funciones son
Jf(x, y) =
_
2x 0
0 2y
_
y
Jg(u, v) =
_
_
_
1 1
1 0
0 2v
_
_
_
.
Notemos que, cuando (u, v) = (1, 1) entonces (x, y) = f(1, 1) = (2, 1), de suerte que
Jh(1, 1) = Jg(2, 1) Jf(1, 1) =
_
_
_
2 2
2 0
0 4
_
_
_
Las derivadas parciales de la funcion g f en el punto (1, 1) son los vectores
(gf)
x
(1, 1) = (2, 2, 0) y
(gf)
y
(1, 1) = (2, 0, 4).
Como consecuencia del teorema anterior se obtiene el siguiente resultado.
Corolario 3.10. Sea f una funcion real denida en un abierto A de R
n
, y sea r una
funcion denida en un intervalo abierto I de R, con valores en A. Si r es derivable
en un punto t I, y f es diferenciable en el punto r(t), entonces la funcion f r es
derivable en t, y
(f r)

(t) = f(r(t)) r

(t) =
n

i=1
r

i
(t)
f
x
i
(r(t)).
Demostracion. Sean r
1
, . . . , r
n
las componentes de r. Como la derivabilidad de fun-
ciones de una variable real es equivalente a su diferenciabilidad se sigue que la funcion
24
r es diferenciable en t, y su matriz jacobiana en este punto es
Jr(t) =
_
_
_
_
_
_
r

1
(t)
r

2
(t)
.
.
.
r

n
(t)
_
_
_
_
_
_
= r

(t).
Por otra parte, es claro que
Jf(r(t)) =
_
f
x
1
(r(t)), . . . ,
f
x
n
(r(t))
_
.
Utilizando el Teorema 3.8 se sigue que la funcion f r es derivable en t, y que
(f r)

(t) = J(f r)(t) = Jf(r(t)) r

(t) = f(r(t)) r

(t).
3.3.1. Variedad tangente a un conjunto de nivel
La regla de la cadena proporciona una interpretacion geometrica interesante del
vector f, que resulta util para la determinacion de los planos tangentes a las
supercies de nivel en el espacio y las curvas de nivel en el plano.
Teorema 3.11. Sea f una funcion real diferenciable en el conjunto abierto A de R
3
(respectivamente R
2
), sea S el conjunto de nivel c de f, y sea a un punto de S. Si
r : (, ) R
3
(respectivamente r : (, ) R
2
) es una funcion derivable tal
que r(t) S para todo t y r(0) = a, entonces
f(a) r

(0) = 0.
Demostracion. Puesto que r(t) S se tiene
f(r(t)) = c, para todo t (, ).
Por tanto,
f(r(t)) r

(t) = 0.
En particular, para t = 0 resulta
f(a) r

(0) = f(r(0)) r

(0) = 0.
25
Este teorema (en el caso en que S R
3
) viene a decir que si C es una curva
cualquiera contenida en la supercie S que pasa por el punto a, entonces el vector
tangente a C en el punto a es perpendicular a f(a). Por tanto, si f(a) ,= 0, dicho
vector puede interpretarse geometricamente como un vector perpendicular al plano
tangente a S en el punto a. La misma interpretacion subsiste cuando se reemplazan
supercies por curvas de nivel.
Ejemplo
Hallemos la ecuacion del plano tangente a la esfera x
2
+y
2
+z
2
= 1 en el punto
a =
_
1

3
,
1

3
,
1

3
_
. Claramente, la esfera es la supercie de nivel 1 de la funcion
f(x, y, z) = x
2
+ y
2
+ z
2
.
El gradiente de f en un punto generico (x, y, z) es
f(x, y, z) = (2x, 2y, 2z).
En particular,
f(a) =
2

3
(1, 1, 1).
Como este vector es m ultiplo de (1, 1, 1), el plano tangente que vamos buscando es
el plano que pasa por el punto a y es perpendicular al vector (1, 1, 1). Su ecuacion
implcita es, por tanto,
x + y + z =
3

3
.
3.3.2. El Teorema del incremento nito
Pondremos n a esta seccion con el siguiente teorema del incremento nito para
las funciones de varias variables, que se obtiene como aplicacion del resultado cor-
respondiente para las funciones de una variable y la regla de la cadena.
Teorema 3.12. Sea f una funcion diferenciable en un subconjunto abierto A de
R
n
, y sea a A. Si h es un punto de R
n
tal que el segmento determinado por a y
a + h esta contenido en A entonces existe un n umero (0, 1) tal que
f(a + h) f(a) = f(a + h) h.
26
Demostracion. Sea r : [0, 1] R
n
la funcion denida por la expresion
r(t) = a + th.
Puesto que el segmento determinado por a y a+h esta contenido en A tenemos que
r(t) A para todo t [0, 1], de modo que podemos considerar la funcion
(t) = f(r(t)).
Claramente, r es derivable, siendo r

(t) = h. Como f es diferenciable en A, en virtud


del Corolario 3.10 tenemos que es derivable en todo punto t [0, 1], y

(t) = f(r(t)) r

(t) = f(r(t)) h.
Aplicando el Teorema del valor medio para las funciones de una variable deducimos
la existencia de un n umero (0, 1) tal que
(1) (0) =

()(1 0) =

() = f(r()) r

() = f(a + h) h.
Ahora bien, por la denicion de tenemos que (0) = f(a) y (1) = f(a +h). Por
tanto,
f(a + h) f(a) = f(a + h) h.
4. Extremos de las funciones de varias variables
En esta ultima seccion vemos como pueden aplicarse algunos resultados estudia-
dos previamente a la determinacion de extremos de las funciones de varias variables
reales.
4.1. Extremos libres
Sea f una funcion real denida en un conjunto abierto A de R
n
, y sea a A. Se
dice que f presenta en a un:
1. Maximo relativo si existe una bola B(a, r) A tal que
f(x) f(a), para todo x B(a, r).
27
2. Mnimo relativo si existe una bola B(a, r) A tal que
f(x) f(a), para todo x B(a, r).
Si alguna de las desigualdades anteriores es estricta (salvo para x = a) se dice que
el maximo o mnimo relativo es estricto.
Notemos que un maximo (respectivamente mnimo) absoluto es un maximo (re-
spectivamente mnimo) relativo de la funcion f.
El teorema siguiente proporciona una condicion necesaria para la existencia de
extremo relativo en un punto cuando la funcion f es diferenciable en dicho punto,
analoga a la que estudiamos en calculo para las funciones reales de una variable.
Teorema 4.1. Sea f una funcion denida en un conjunto abierto A de R
n
, con
valores en R y sea a A. Si f es diferenciable en el punto a y presenta un extremo
relativo en dicho punto, entonces
f(a) = 0.
Demostracion. Sea h un vector no nulo de R
n
. Como el conjunto A es abierto existe
un > 0 tal que a + th A para todo t (, ). Sea la funcion denida en
(, ) por medio de la expresion
(t) = f(a + th).
La funcion g(t) = a + th es derivable en todo punto t (, ), siendo g

(t) = h.
Ademas, = f g. Puesto que f es diferenciable, en virtud de la regla de la cadena
se tiene que es derivable en todo t (, ), y

(t) = f(g(t)) h = f(a + th) h.


En particular,

(0) = f(a) h. (13)


Supongamos que f presenta un mnimo relativo en el punto a. Como (0) = f(a)
es claro que tiene un mnimo relativo en t = 0. En particular,

(0) = 0,
y haciendo uso de (13) se sigue que
f(a) h = 0.
Esta igualdad es cierta para todo h R
n
. Haciendo h = f(a) se tiene, en partic-
ular, |f(a)|
2
= f(a) f(a) = 0, es decir, f(a) = 0.
28
El teorema anterior admite una interpretacion geometrica clara cuando f es una
funcion de dos variables: el plano tangente a la supercie de ecuacion z = f(x, y) en
un punto de extremo local es paralelo al plano z = 0.
Un punto en el que f es diferenciable y el gradiente se anula suele llamarse punto
crtico o estacionario.
El siguiente ejemplo pone de maniesto que un punto crtico no es necesariamente
extremo.
Ejemplo.
La funcion real f : R
2
R denida por la expresion
f(x, y, z) = x
3
+ y
2
es diferenciable en todo punto de R
2
por que?. De acuerdo con el teorema prece-
dente, los candidatos extremo de f son los puntos (x, y) R
2
tales que
f
x
(x, y) = 0
y
f
y
(x, y) = 0, es decir, los que satisfacen simultaneamente las ecuaciones
_
3x
2
= 0
2y = 0
La unica solucion de este sistema es el punto (0, 0).
Veamos que f no presenta extremo relativo alguno en este punto. Obviamente,
f(0, 0) = 0. Para todo punto de la forma (0, y) con y ,= 0 se tiene f(0, y) = y
2
> 0,
de suerte que f no tiene maximo relativo en (0, 0). Por otra parte, si x < 0 entonces
f(x, 0) = x
3
< 0 y (0, 0) no es, por tanto, un punto de mnimo relativo de f.
Estudiemos ahora una condicion suciente para la existencia de extremo local
en un punto. Si f es una funcion de una variable real y a es un punto interior de
su dominio tal que f

(a) = 0 entonces f presenta en a un maximo (respectivamente


mnimo) local si f

(a) < 0 (respectivamente f

(a) > 0). El papel de la segunda


derivada lo va a desempe nar, en el caso de las funciones de varias variables, la
matriz que denimos a continuacion.
Denici on 4.2. Sea A un conjunto abierto de R
n
y sean f una funcion real de clase
(
2
(A) y a un elemento de A. La matriz
_
_
_
_
_
_
D
2
1,1
f(x) D
2
1,2
f(x) . . . D
2
1,k
f(x)
D
2
2,1
f(x) D
2
2,2
f(x) . . . D
2
2,k
f(x)
.
.
.
.
.
.
.
.
.
D
2
k,1
f(x) D
2
k,2
f(x) . . . D
2
k,k
f(x)
_
_
_
_
_
_
29
recibe el nombre de hessiana de f en el punto a. Se representa normalmente con el
smbolo Hf(a).
Notemos que, gracias al Teorema 2.2, la hessiana de una matriz de clase (
2
(A)
es una matriz simetrica en todo punto a A.
La siguiente nocion extiende a las matrices simetricas el concepto de signo.
Denici on 4.3. Sea M una matriz simetrica de n umeros reales de tama no n. Se
dice que M es:
1. Denida positiva si para cada vector no nulo h R
n
se tiene
h
T
Mh > 0.
2. Denida negativa si para cada vector no nulo h R
n
se tiene
h
T
Mh < 0.
El siguiente resultado, debido a Sylvester, proporciona una caracterizacion de las
matrices simetricas denidas.
Teorema 4.4. Sea M = (a
i,j
) una una matriz simetrica de n umeros reales de
tama no n. Sea, para cada k 1, . . . , n,

k
= det
_
_
_
_
_
_
a
1,1
a
1,2
. . . a
1,k
a
2,1
a
2,2
. . . a
2,k
.
.
.
.
.
.
.
.
.
a
k,1
a
k,2
. . . a
k,k
_
_
_
_
_
_
.
Entonces:
1. M es denida positiva si, y solo si, los n umeros
1
, . . . ,
n
son todos positivos.
2. M es denida negativa si, y solo si, los n umeros
1
, . . . ,
n
forman una
sucesion de n umeros con signos alternativamente positivos y negativos, siendo

1
< 0, es decir,

1
< 0,
2
> 0,
3
< 0, . . .
La condicion suciente de extremo, anunciada mas arriba, viene dada por el
siguiente teorema.
30
Teorema 4.5. Sea f una funcion real denida en un conjunto abierto A de R
n
, que
admite derivadas parciales segundas continuas en A, y sea a A. Supongamos que
f(a) = 0. Entonces:
(i) Si la matriz Hf(a) es denida positiva, la funcion f presenta en a un mnimo
relativo estricto.
(ii) Si la matriz Hf(a) es denida negativa, la funcion f presenta en a un maximo
relativo estricto.
En la demostracion de este teorema utilizaremos dos resultados auxiliares. El
primero es una consecuencia casi inmediata de la propiedad de conservacion del
signo para funciones continuas. El segundo tiene interes independiente. Se trata de
una version de la formula de Taylor de orden 2 para las funciones reales de varias
variables reales.
Lema 4.6. Sea f una funcion real denida en un conjunto abierto A de R
n
, que
admite derivadas parciales segundas continuas en A, y sea a A. Si la matriz Hf(a)
es denida positiva (resp. denida negativa) entonces existe un n umero > 0 tal
que para todo x R
n
con |x a| < , la matriz Hf(x) es denida positiva (resp.
denida negativa).
Demostracion. Sea, para cada k 1, . . . , n, la funcion
k
: AR por medio de
la igualdad

k
(x) = det
_
_
_
_
_
_
D
2
1,1
f(x) D
2
1,2
f(x) . . . D
2
1,k
f(x)
D
2
2,1
f(x) D
2
2,2
f(x) . . . D
2
2,k
f(x)
.
.
.
.
.
.
.
.
.
D
2
k,1
f(x) D
2
k,2
f(x) . . . D
2
k,k
f(x)
_
_
_
_
_
_
.
Claramente,
k
puede expresarse como una suma de productos de derivadas par-
ciales segundas de f. Como estas son continuas en A se sigue que tambien
k
es
continua en A.
Supongamos por ejemplo que la matriz Hf(a) es denida positiva. Entonces,
gracias al Teorema 4.4 los n umeros
1
(a),
2
(a), . . . ,
n
(a) son todos positivos.
Como las funciones
1
, . . . ,
n
son continuas en el punto a, en virtud de la propiedad
de conservacion del signo podemos encontrar un n umero > 0 tal que si x
B(a; ) entonces los n umeros
1
(x), . . . ,
n
(x) son todos positivos. Y echando mano
31
nuevamente del Teorema 4.4 se sigue que la matriz Hf(x) es denida positiva para
cada x B(a; ).
Teorema 4.7 (F ormula de Taylor de orden 2). Sea f una funcion denida en
un conjunto abierto A de R
n
y sea a A. Supongamos que existen y son continuas
en A las derivadas parciales segundas de f. Entonces, para cualquier h R
n
existe
un n umero (0, 1) tal que
f(a + h) = f(a) +f(a) h +
1
2
h
T
Hf(a + h) h.
Demostracion. Podemos asumir que A = R
n
. Sea la funcion denida para t R
por medio de la expresion
(t) = f(a + th).
Como f admite derivadas parciales de orden 2 en el conjunto A se sigue que es dos
veces derivable. Por tanto, aplicando el Teorema de Taylor a la funcion resulta
(1) = (0) +

(0) +

()
2
para cierto (0, 1). (14)
Hallemos las expresiones para los n umeros implicados en el segundo miembro de
esta igualdad. Claramente,
(0) = f(a). (15)
La derivada primera de es

(t) = f(a + th) h =


n

i=1
h
i

f
x
i
(a + th). (16)
En particular,

(0) = f(a) h. (17)


Sea ahora, para cada i = 1, . . . , n, la funcion

i
(t) =
f
x
i
(a + th).
Utilizando el mismo argumento que antes se sigue que

i
(t) =
n

j=1

2
f
x
i
x
j
(a + th)h
j
.
32
El segundo miembro de esta expresion no es otra cosa que el producto de la la
i-esima de la matriz hessiana Hf(a + th) por el vector h. Sustituyendo en (16) y
teniendo en cuenta la regla del producto de matrices resulta

(t) = h
T
Hf(a + th) h.
Consecuentemente,

() = h
T
Hf(a + h) h. (18)
Llevando las igualdades (15), (17) y (18) a (14) resulta la conclusion deseada.
Demostracion del Teorema 4.5. Probaremos la armacion (i), la otra se deduce de
forma analoga. Gracias al Lema 4.6 existe un n umero > 0 tal que
h
T
Hf(x)h para todo x B(a; ) y todo h R
n
, h ,= 0. (19)
Fijemos h R
n
, con |h| < . Puesto que f(a) = 0, en virtud del Teorema 4.7
existe un n umero (0, 1) tal que
f(a + h) = f(a) +
1
2
h
T
Hf(a + h)h. (20)
Como |h| < y (0, 1) tenemos que a + h B(a; ), de modo que, por (19),
h
T
Hf(a + h)h > 0.
Combinando esta desigualdad con (20) resulta
f(a + h) f(a) > 0.
Como esta desigualdad es cierta para todo h B(0, ) se inere que f presenta un
mnimo relativo (estricto) en el punto a.
Ejemplo.
Determinemos los extremos relativos de la funcion f : R
3
R denida por
f(x, y, z) = x
2
+ y
2
+ z
4
+ xy x + y 4z.
Las derivadas parciales primeras de f son
f
x
(x, y, z) = 2x + y z,
f
y
(x, y, z) =
2y + x + 1 y
f
z
(x, y, z) = 4z
3
4. Estas funciones son obviamente continuas, de
modo que f es de clase (
1
(f esta incluso en la clase (

) y es, por tanto, diferenciable


33
en R
3
. Si f presenta un extremo relativo en (x, y, z) entonces f(x, y, z) = 0, es
decir,
_

_
2x + y 1 = 0
2y + x + 1 = 0
4z
3
4 = 0
Resolviendo obtenemos x = 1, y = 1, z = 1. As pues, el unico punto candidato
a ser extremo de f es el (1, 1, 1). Para comprobar si es efectivamente un extremo
hallamos la matriz hessiana de f. Las derivadas parciales segundas son

2
f
x
2
(x, y, z) =
2,

2
f
xy
(x, y, z) = 1,

2
f
xz
(x, y, z) = 0,

2
f
y
2
(x, y, z) = 2 y

2
f
z
2
(x, y, z) = 12z
2
. As pues,
la matriz hessiana en un punto generico (x, y, z) es
Hf(x, y, z) =
_
_
_
2 1 0
1 2 0
0 0 12z
2
_
_
_
.
Para nuestro punto candidato resulta
Hf(1, 1, 1) =
_
_
_
2 1 0
1 2 0
0 0 12
_
_
_
.
Veamos si esta matriz es denida. Claramente,

1
= 2,
2
= 3,
3
= 36
Al ser positivos los n umeros
1
,
2
,
3
la matriz Hf(1, 1, 1) es denida positiva,
y f presenta, por tanto, un mnimo relativo (estricto) en (1, 1, 1). No es difcil
ver que este mnimo es, ademas, absoluto.
El valor de f en este punto es
f(1, 1, 1) = 4.
Nota
Si f(a) = 0 pero la matriz hessiana Hf(a) no es denida no puede decirse nada,
a priori, acerca de la existencia de extremo en el punto a, y es necesario dilucidar
esta cuestion directamente, tal y como se hizo en un ejemplo anterior.
34
4.2. Extremos condicionados
Muchos de los problemas de optimizacion que aparecen en la practica consisten
en hallar los maximos o mnimos de una funcion sobre un subconjunto de su dominio
(generalmente no abierto) determinado por alguna restriccion. As por ejemplo, el
problema de hallar tres n umeros no negativos x, y, z tales que x
2
+y
2
+z
2
= 1 y de
modo que el producto xyz sea maximo consiste en maximizar la funcion
f(x, y, z) = xyz
no en R
3
, sino sobre el conjunto
(x, y, z) R
3
: x, y, z 0, x
2
+ y
2
+ z
2
1 = 0,
que como sabemos no es abierto. Un punto generico de este conjunto satisface la
igualdad z =
_
1 (x
2
+ y
2
). Por eso lo natural en este caso es sustituir en la
expresion de f la variable z por
_
1 (x
2
+ y
2
). De esta forma, el problema se
reduce al de maximizar la funcion de dos variables
(x, y) = xy
_
1 (x
2
+ y
2
)
en el conjunto (x, y) : x, y 0, x
2
+y
2
1. Una consideracion elemental permite
deducir que, si (x, y) es un punto de maximo para , entonces x
2
+y
2
,= 1, de modo
que nuestro problema consiste en maximizar sobre el abierto (x, y) : x
2
+y
2
< 1.
As pues, expresando una de las variables en funcion de las otras, el problema
se transforma en otro equivalente, que consiste en optimizar una funcion sobre un
conjunto (generalmente abierto). Sin embargo, no siempre es posible despejar una
variable en funcion de las otras. Y a veces, como ocurre en el ejemplo anterior, el
proceso resulta bastante engorroso. La solucion general de estos problemas puede
obtenerse normalmente utilizando el metodo que describimos a continuacion.
Metodo de los multiplicadores de Lagrange. En abstracto, el problema de la
determinacion de extremos condicionados puede plantearse como sigue. Sean f y g
funciones reales denidas en un abierto A de R
n
, y sea
S = x R
n
: g(x) = 0 .
Se trata de encontrar los puntos a S tales que
f(a) = max f(x) : x S
35
o
f(a) = mn f(x) : x S .
En este caso se dice que a es un punto de maximo (resp. mnimo) de f condicionado
por la restriccion o ligadura g(x) = 0.
El siguiente teorema proporciona una condicion necesaria para la existencia de
estos extremos.
Teorema 4.8. Sean f y g funciones reales diferenciables en un abierto A de R
n
, y
sea
S = x R
n
: g(x) = 0 .
Supongamos que f presenta un extremo condicionado en un punto a S. Entonces
existe un R tal que
f(a) g(a) = 0.
Idea de la demostracion. Con las herramientas de que disponemos no podemos dar
una prueba completa de este teorema. Pero es util ver la idea geometrica subyacente.
Para simplicar las cosas vamos a suponer que n = 3, de modo que el conjunto S
es una supercie de nivel de la funcion g.
Supongamos por ejemplo que f alcanza un maximo en el punto a. Sea r :
(, ) R
3
una funcion derivable cualquiera tal que r(t) S para todo t
(, ), y r(0) = a. Entonces la funcion de una variable
(t) = f(r(t))
alcanza un maximo en el punto t = 0. Por tanto,
0 =

(0) = f(r(0)) r

(0) = f(a) r

(0).
Esto signica que el vector f(a) es perpendicular a r

(0). Como esto es cierto


para toda funcion r con valores en S tenemos que f(a) es perpendicular al plano
tangente a S en el punto a. Por otra parte, gracias Teorema 4.1, el vector g(a) es
tambien perpendicular a dicho plano. As pues, f(a) y g(a) estan en la direccion
de una misma recta (la recta que pasa por el punto a y es perpendicular al plano
tangente a S en dicho punto). Esto implica que dichos vectores son colineales, es
decir, que existe R tal que f(a) = g(a).
As pues, la solucion de un problema de extremos condicionados puede obtenerse
siguiendo los siguientes pasos:
36
1. Se calcula el gradiente de la funcion
L(x) = f(x) g(x),
donde se trata como una constante.
2. Se buscan los puntos x = (x
1
, . . . , x
n
) A y los escalares R que satisfacen
la igualdad
L(x) = 0,
junto con la condicion de ligadura
g(x) = 0.
En la practica, esto se reduce a resolver el sistema de n + 1 ecuaciones:
_

_
f
x
1
(x)
g
x
1
(x) = 0;
.
.
.
f
x
n
(x)
g
x
n
(x) = 0;
g(x
1
, . . . , x
n
) = 0.
Los puntos x que satisfacen el sistema son los posibles valores extremos condiciona-
dos de f. Para ver si estos son realmente extremos (y dictaminar, en su caso, si se
trata de maximos o mnimos), lo mas practico suele ser estudiar el comportamiento
de la funcion f en cada uno de los puntos obtenidos. El n umero que recibe el
nombre de multiplicador de Lagrange, y la funcion L funcion lagrangiana asociada
a f y g.
Ejemplo
Resolvamos el problema planteado al principio del apartado, utilizando el metodo
de los multiplicadores de Lagrange. Con la notacion que hemos utilizado, el problema
consiste en encontrar los extremos de la funcion
f(x, y, z) = xyz,
sometidos a la ligadura g(x, y, z) = 0, siendo
g(x, y, z) = x
2
+ y
2
+ z
2
1.
37
La funcion lagrangiana correspondiente es
L(x, y, z) = (x, y, z) g(x, y, z) = xyz (x
2
+ y
2
+ z
2
1).
Claramente,
L(x, y, z) = (yz x, xz y, xy z) .
Por tanto, el sistema de ecuaciones resultante al aplicar el metodo de Lagrange es
_

_
yz 2x = 0;
xz 2y = 0;
xy 2z = 0;
x
2
+ y
2
+ z
2
= 1.
La naturaleza del problema implica que ninguno de los n umeros x, y, z puede ser 0
(si suponemos por ejemplo que x = 0, entonces se obtiene que o bien y = 0 y z = 1,
o bien y = 1 y z = 0. Por tanto, f(x, y, z) = 0, y el punto en cuestion no puede
ser un extremo para f). As pues, x, y, z ,= 0. Despejando en las tres primeras
ecuaciones e igualando resulta la igualdad
yz
x
=
xy
z
=
xz
y
,
de donde se obtiene que
x = y = z = 2.
Llevando estas igualdades a la cuarta ecuacion tenemos que
3
2
4
= 1, es decir, =
2

3
.
As pues,
x = y = z =
1

3
.
Naturalmente, la terna (x, y, z) encontrada maximiza la funcion f. En efecto, como
el conjunto
C = (x, y, z) : x, y, z 0, x
2
+ y
2
+ z
2
= 1
es cerrado y acotado, en virtud del Teorema de Weierstrass f alcanza un maximo
y un mnimo absoluto sobre este conjunto. El mnimo se alcanza en los puntos
(1, 0, 0), (0, 1, 0) y (0, 0, 1) (que son las ternas que resultan del sistema anterior y
hemos desechado por la naturaleza del problema). El maximo se alcanzara, por
tanto, en el punto crtico restante, x = y = z =
1

3
.
38

También podría gustarte