Propiedades de Las Funciones Diferenciables. 1. Regla de La Cadena

Univ.
de Alcala de Henares Ingeniera de Telecomunicacion

Calculo. Segundo parcial. Curso 2004-2005
Propiedades de las funciones diferenciables.
1. Regla de la cadena
Despues de la generalizacion que hemos elaborado en el anterior captulo, podemos empezar
a utilizar ese lenguaje para extender a las funciones f : R
n
R
m
muchos resultados que hemos
visto en el caso de funciones de una variable. El primero de ellos va a ser la regla de la cadena.
Recordemos que la regla de la cadena se utiliza cuando queremos derivar una composicion
de funciones. Supongamos por tanto que tenemos dos funciones que se pueden componer. Por
ejemplo, f : R
n
R
m
y g : R
m
R
k
. Vamos a utilizar esta notacion:
_
y = f( x) , con x = (x
1
, . . . , x
n
) y con y = (y
1
, . . . , y
m
)
z = f( y) , con z = (z
1
, . . . , z
k
)
Supongamos ademas que tenemos un punto p R
n
y sean q = f( p), r = g( q). Vamos a considerar
la composicion
h( x) = g(f( x)) = (g f)( x)
Entonces tenemos una aplicacion (g f) : R
n
R
k
, que transforma x en z pasando por y:
x y z
Para poder analizar la diferenciabilidad de h necesitamos suponer que f es diferenciable en p y
que g es diferenciable en q. Eso signica que se tiene
f( x) f( p) + Df( p) ( x p)
cuando x esta cerca de p y que
g( y) g( q) + Dg( q) ( y q)
cuando y esta cerca de q. Al componer f con g lo que hacemos es sustituir y por f( x). Haciendo
esta misma substitucion en las anteriores aproximaciones se obtiene:
h( x) = g(f( x)) g( q) + Df( q)
_
f( p) + Df( p) ( x p) q
_
Usamos que f( p) = q y que, por tanto, g( q) = g(f( p)) = h( p) para simplicar esta expresion:
h( x) h( p) + Df( q) Df( p) ( x p)
Recordemos ahora que si la aplicacion h : R
n
R
k
es diferenciable en p, entonces esperamos
encontrar una matriz Dh( p) de orden (k, m) tal que la aproximacion:
h( x) h( p) + Dh( p) ( x p)
sea muy buena cerca de p. Comparando esta expresion con la anterior, este razonamiento, que
no es una demostracion formal!, nos permite entender el siguiente enunciado de la regla de la
cadena.
1
Teorema 1 (Regla de la cadena).
_
Sean f : R
n
R
m
, g : R
m
R
k
. Si f es diferenciable en p R
n
, y g es diferenciable en q =
f( p) R
m
, entonces h = (gf) es diferenciable en p y, ademas, D(gf)( p) = Dg(f( p))Df( q).
1.1. Otras expresiones de la regla de la cadena
Al presentar y enunciar la regla de la cadena hemos empleado la notacion matricial para
subrayar el hecho de que el razonamiento por el que se obtiene este resultado no es esencialmente
mas complicado que lo que hicimos en el caso de funciones de una variable.
Sin embargo, en muchas aplicaciones es importante saber expresar la regla de la cadena en
terminos de las funciones componentes. Estas otras expresiones siempre se deducen del resultado
general, simplemente desarrollando el producto matricial. Vamos a ver como.
Si por un lado escribimos f = (f
1
, . . . , f
m
), con f
i
( x) = f
i
(x
1
, . . . , x
n
) y por otro lado
g = (g
1
, . . . , g
k
), con g
j
( y) = g
j
(y
1
, . . . , y
m
), entonces:
D(g f)( p) = Dg(f( p)) Df( p) =
_
_
_
_
_
_
_
_
_
_
_
_
f
1
x
1
f
1
x
2

f
1
x
n
f
2
x
1
f
2
x
2

f
2
x
n
.
.
.
f
m
x
1
f
m
x
2

f
m
x
n
_
_
_
_
_
_
_
_
_
_
_
_
f( p)
_
_
_
_
_
_
_
_
_
_
_
_
g
1
y
1
g
1
y
2

g
1
y
m
g
2
y
1
g
2
y
2

g
2
y
m
.
.
.
g
k
y
1
g
k
y
2

g
k
y
m
_
_
_
_
_
_
_
_
_
_
_
_
p
Los subndices de las matrices indican los puntos donde se calculan las derivadas parciales.
Otra forma de describir esta situacion anterior es mediante la notacion que ahora vamos a
describir. Por un lado, la aplicacion que hemos llamado f de R
n
en R
m
se representa mediante
estas ecuaciones:
f :
_
_
y
1
= y
1
(x
1
, . . . , x
n
)
y
2
= y
2
(x
1
, . . . , x
n
)
.
.
.
y
m
= y
m
(x
1
, . . . , x
n
)
Y por otro lado, la aplicacion que llamamos g de R
m
en R
k
se representa mediante:
g :
_
_
z
1
= z
1
(y
1
, . . . , y
m
)
z
2
= z
2
(y
1
, . . . , y
m
)
.
.
.
z
k
= z
k
(y
1
, . . . , y
m
)
La forma clasica de representar y hablar de la composicion g f supone que al considerar
conjuntamente estos dos sistemas de ecuaciones las variables z
1
, . . . , z
k
pasan a depender de las
2
x
1
, . . . , x
n
(por intermediacion de las variables y
1
, . . . , y
m
). Es decir, que sin mucha precision,
podemos pensar en expresiones como:
z
j
= z
j
(x
1
, . . . , x
n
)
O si queremos precisar un poco mas:
z
j
= z
j
(y
1
(x
1
, . . . , x
n
), . . . , y
m
(x
1
, . . . , x
n
))
En cualquier caso, en muchos casos (y casi siempre en las aplicaciones a la Fsica o la Ingeniera)
se utiliza un smbolo como
z
j
x
i
para representar las derivadas parciales de la funcion compuesta g f. El principal inconveniente
de este tipo de smbolo es que empleamos z para representar simultaneamente dos objetos: una
funcion que depende de x y una que depende de y.
En cualquier caso, con esta notacion la anterior ecuacion matricial se convierte en:
_
_
_
_
_
_
_
_
_
_
_
_
z
1
x
1
z
1
x
2

z
1
x
n
z
2
x
1
z
2
x
2

z
2
x
n
.
.
.
z
k
x
1
z
k
x
2

z
k
x
n
_
_
_
_
_
_
_
_
_
_
_
_
=
_
_
_
_
_
_
_
_
_
_
_
_
z
1
y
1
z
1
y
2

z
1
y
m
z
2
y
1
z
2
y
2

z
2
y
m
.
.
.
z
k
y
1
z
k
y
2

z
k
y
m
_
_
_
_
_
_
_
_
_
_
_
_
_
_
_
_
_
_
_
_
_
_
_
_
y
1
x
1
y
1
x
2

y
1
x
n
y
2
y
1
y
2
x
2

y
2
x
n
.
.
.
y
m
x
1
y
m
x
2

y
m
x
n
_
_
_
_
_
_
_
_
_
_
_
_
Y, al desarrollar el producto de matrices, obtenemos formulas como esta:
z
j
x
i
=
z
j
y
1
y
1
x
i
+
z
j
y
2
y
2
x
i
+ +
z
j
y
m
y
m
x
i
; j = 1, . . . , k, i = 1, . . . , n
Es decir:
z
j
x
i
=
m
h=1
z
j
y
h
y
h
x
i
; j = 1, . . . , k, i = 1, . . . , n
Estas formulas son la version componente a componente, y en notacion clasica, de la regla de
la cadena. Buena parte de la popularidad de la notacion clasica se debe sin duda a lo facil que
resulta producir estas formulas incluso en situaciones complicadas, una vez por supuesto que se
domina un poco la tecnica. Para ello, sin duda, hay que hacer un n umero suciente de ejercicios.
Vamos a presentar algunos ejemplos en notacion clasica para que el lector desarrolle un
esquema correcto de calculo.
Ejemplo 2. 1. Sea:
_
u = u(x, y)
v = v(x, y)
Y tambien:
_
r = r(u, v)
s = s(u, v)
3
Y supongamos que las aplicaciones denidas por estas ecuaciones son derivables. Vamos
a calcular
r
y
y
s
x
.
Una buena forma de organizarse para calcular por ejemplo
r
y
es dibujar un esquema como
este:
x
u
55
k
k
k
k
k
k
))
R
R
R
R
R
R
y
r
<<
y
y
y
y
y
y
y
##
G
G
G
G
G
G
G
x
v
55
k
k
k
k
k
k
))
R
R
R
R
R
R
y
La forma de utilizar este diagrama es imaginar que debemos ir desde r hasta y de todas las
formas posibles. Cada una de esas formas aporta un termino a la formula que obtendremos.
Cada camino se compone de una sucesi on de echas. Pues bien, cada echa se traduce en
un factor del termino que estamos escribiendo. Por ejemplo en el esquema anterior vamos
de r a u y de u a y. Eso corresponde a un termino:
r
u
u
y
Tambien podemos ir primero desde r a v y de v a y. Eso signica que tambien tenemos
un termino:
r
v
v
y
Y puesto que no hay mas formas de ir desde r hasta y la formula nal es la suma de estos
terminos:
r
y
=
r
u
u
y
+
r
v
v
y
Dejamos para el lector la otra derivada parcial pedida.
2. Supongamos dada la funcion:
F(x, y) = f(g(x, y), h(x), k(y))
y que nos piden
F
x
. Podemos hacernos un esquema como este:
x
g
55
l
l
l
l
l
l
((
Q
Q
Q
Q
Q
Q
y
F
==
z
z
z
z
z
z
z
//
((
Q
Q
Q
Q
Q
Q h
//
x
k
//
y
Es facil ver entonces que la formula buscada tiene dos terminos, y es:
F
x
=
F
g
g
x
+
F
h
dh
dx
4
Este calculo tambien ilustra que cuando una funcion, como h, solo depende de una variable,
cambiamos el smbolo de derivada parcial por el d de derivada total.
Observacion. Por supuesto, estos esquemas no son absolutamente necesarios. Cuando se tiene
un poco de practica es facil prescindir de ellos y obtener los terminos necesarios directamente.
En cualquier caso, siempre es posible, en caso de duda volver sobre estos esquemas y trabajar
un poco mas despacio pero con mas seguridad.
2. Derivaci on a lo largo de curvas. Velocidad y gradiente.
En este apartado vamos a estudiar un caso especial de aplicacion de la regla de la cadena, que
por su importancia merece un analisis detallado. Ya hemos visto que una aplicacion c : R R
n
,
dada por ejemplo mediante unas ecuaciones:
c : [a, b] R, dada por: c(t) = (x
1
(t), x
2
(t), . . . , x
n
(t))
puede interpretarse como las ecuaciones parametricas de una curva. Si las componentes de c
son funciones muy complicadas, entonces la curva puede ser un objeto geometrico muy extra no.
Incluso puede resultar difcil llamar curva a semejante objeto. Por esa razon nos vamos a -
jar ahora en curvas sucientemente regulares: todas las curvas que aparezcan en este apartado
vendran descritas por funciones diferenciables salvo que explcitamente digamos lo contrario.
Tambien hemos visto que en un punto t de (a, b) el vector tangente o vector velocidad de la
curva c es:
c(t) =
_
x
1
(t), x
2
(t), . . . , x
n
(t)
_
Supongamos ahora que f : R
n
R, dada mediante
z = f(x
1
, . . . , x
n
)
es una funcion escalar, que es diferenciable en p U. Suponemos ademas que la curva parame-
trizada c(t) pasa por p en el instante t
0
, es decir c(t
0
) = p. Entonces la composicion f c : R R
es una funcion (de una variable) diferenciable en t
0
, que representa los valores de f a lo largo
de la curva c(t):
t
curva c
(x
1
, . . . , x
n
)
funcion f
f(x
1
, . . . , x
n
)
Con el abuso de notacion habitual, esta funcion f c se representa mediante f(t). Su derivada
en t
0
se calcula aplicando la regla de la cadena:
df
dt
(t
0
) =
d(f c)
dt
(t
0
) =
f
x
1
p
dx
1
t
(dt
0
) +
f
x
2
p
dx
2
dt
(t
0
) + +
f
x
n
p
dx
n
dt
(t
0
)
Cuando las funciones involucradas son diferenciables en todos los puntos, se obtiene una formula
muy importante:
d(f c)
dt
=
df
dt
=
f
x
1
dx
1
dt
+
f
x
2
dx
2
dt
+ +
f
x
n
dx
n
dt
5
Lo que mas nos interesa de esta formula es que tiene la estructura de un producto escalar
entre dos vectores muy especiales:
df
dt
=
_
f
x
1
, . . . ,
f
x
n
_
_
dx
1
dt
, . . . ,
dx
n
dt
_
Como puede verse se trata del producto del gradiente de f por el vector tangente a la curva. Es
decir:
d(f c)
dt
= gradf(p) c
(t) (1)
Esta formula, que hace ver una relacion entre el gradiente de f y el vector tangente a c es muy
importante, porque permite obtener mucha informacion geometrica sobre el vector gradiente y
sobre la funcion f. Nuestro objetivo en el resto de este y en el proximo apartado sera desarrollar
estas ideas. Vamos, en primer lugar a ver unos ejemplos, que nos ayudaran a comprender mejor
el contenido de la ecuacion (1).
Ejemplo 3.
1. Sea z = f(x, y) = x
2
y
2
, cuya graca es como sabemos un paraboloide hiperbolico, y sea
c(t) la curva parametrica:
_
x = x(t) = t
y = y(t) = t
2
Observese que de estas ecuaciones se deduce que en la curva se cumple y = x
2
. Es decir
que estas son las ecuaciones parametricas de una parabola. Los valores de f a lo largo de
la parabola se calculan mediante:
f(c(t)) = (x(t))
2
(y(t))
2
= t
2
t
4
La situacion se ilustra en esta gura:
6
La funcion f(c(t)) es una funcion de una variable, cuya graca se muestra a la derecha
de la gura. Cuando t = 1 la curva c pasa por el punto p = (1, 1) del plano. En ese punto
la derivada de f a lo largo de c se puede calcular as:
d(f c)
dt
t=1
= gradf
(1,1)
c
(1) = (2x, 2y)

(1,1)
(1, 2t)
t=1
= (2, 2) (1, 2) = 2
Si pensamos, como podra hacer un fsico, que t es el tiempo, esta derivada nos informa
de la velocidad a la que cambian los valores de f a medida que recorremos la trayectoria c
(tasa de cambio de f).
2. Vamos a considerar ahora una funcion muy sencilla, z = f(x, y) =
x+y
2
1, cuya graca
es un plano. Y, como curva parametrica c
1
(t) vamos a emplear una circunferencia de radio
1 centrada en el origen. Usamos estas ecuaciones parametricas:
c
1
:
_
x = cos t
y = sent
Como puede comprobarse,
(x(t))
2
+ (y(t))
2
= 1
lo cual conrma que el punto c(t) = (x(t), y(t)) se halla en la circunferencia x
2
+ y
2
= 1.
Hemos usado t intencionadamente como nombre del parametro para que el lector piense
que se trata del tiempo. Al considerar los valores de f a lo largo de la curva c
1
se obtiene
f(c
1
(t)) =
cos t + sent
2
1
La situacion es la de esta gura.
Para t = , por ejemplo, la curva c(t) pasa por el punto c() = (1, 0). La derivada de
f(c(t)) en ese punto es:
d(f c)
dt
t=
= gradf
(1,0)
c
() =
_
1
2
,
1
2
_
(1,0)
(sent, cos t)
t=
=
_
1
2
,
1
2
_
(0, 1) =
1
2
7
Supongamos ahora que en lugar de esa curva parametrica consideramos estas ecuaciones,
que son las mismas cambiando t por t:
c
2
:
_
x = cos 2t
y = sen2t
Estas ecuaciones denen una nueva curva parametrica c
2
(t). En que se diferencian las
curvas c
1
(t) y c
2
(t)? La mejor forma de entender lo que representa ese cambio de t por
2t es pensar en terminos fsicos, interpretar t como el tiempo y esas ecuaciones como la
descripci on del movimiento de un punto. Entonces al cambiar t por 2t lo que hemos hecho
es aumentar la velocidad a la que se mueve el punto, pero la trayectoria sigue siendo la
misma. Es decir, que las ecuaciones de c
2
siguen vericando
(x(t))
2
+ (y(t))
2
= 1
Para conrmar que lo que ha sucedido es un cambio de velocidad vamos a calcular los
modulos de los vectores velocidad de ambas curvas:
c
1
(t) = (sent, cos t) = 1
c
2
(t) = (2 sen(2t), 2 cos(2t)) = 2
Como se ve, la curva c
1
representa el movimiento de un punto que da vueltas a la circun-
ferencia a velocidad constante 1, mientras que en c
2
la velocidad del punto al girar es 2.
La circunferencia es la misma, solo cambia la forma en la que se recorre.
El ultimo ejemplo pretende ilustrar el hecho de que una curva parametrica es algo mas que
un objeto geometrico, es mas que un conjunto de puntos. La curva parametrica no solo dice
cual es el recorrido del punto; ademas, nos da instrucciones sobre la forma en la que se lleva a
cabo ese recorrido: nos dice en que punto estamos en cada instante de tiempo. Esa informacion
esta ausente de una ecuacion como x
2
+ y
2
= 1.
Si queremos usar acertadamente la ecuacion (1), es muy importante entender la leccion del
ultimo ejemplo. Al considerar f(c(t)), pretendemos en muchos casos utilizar la curva f para
estudiar propiedades de la funcion f. La ventaja de este metodo es que, mientras f es una
funcion de n variables, f(c(t)) depende solo de t. Pero al hacer esto, no debemos perder de vista
que el instrumento que utilizamos, la curva parametrica c(t), inuye en los resultados Esto se
puede observar de manera muy sencilla en la ecuacion
d(f c)
dt
= gradf(p) c
(t)
Como se ve, el resultado depende no solo de f, sino de la velocidad de c. Es decir, que al usar
esta ecuacion para analizar f es preciso recordar que el resultado depende tanto de la funcion
como de la curva que se utiliza. Tendremos ocasion de ver un ejemplo de este tipo de situaciones
cuando tratemos sobre las derivadas direccionales.
2.1. Gradiente y conjuntos de nivel.
Conjuntos de nivel. Curvas y supercies? Ya hemos visto lo que signican las curvas
de nivel para una funcion de dos variables. Este concepto se extiende facilmente a funciones
escalares de mas variables.
8
Denicion 4 (Conjunto de nivel).
_
_
Sea f : R
n
R una funcion escalar. Su k-conjunto de nivel es:
f
k
= {p R
n
/f(p) = k}
Es decir, es el conjunto de puntos donde la funcion vale k.
Que tipo de objeto geometrico es un conjunto de nivel? En el caso de una funcion de dos
variables, z = f(x, y), hemos visto algunos ejemplos en los que sus conjuntos de nivel son
curvas, y por eso los hemos denominado genericamente curvas de nivel. De la misma forma,
cuando se consideran funciones de tres variables, w = f(x, y, z), en muchos casos los conjuntos
de nivel resultan ser supercies contenidas en R
3
, las supercies de nivel de f.
Ejemplo 5. Si se considera la funcion f : R
3
R denida mediante
f(x, y, z) = x
2
+ y
2
z
sus conjuntos de nivel se obtienen igualando f(x, y, z) a k. Es decir:
x
2
+ y
2
z = k, o lo que es lo mismo z = x
2
+ y
2
k
Y esta claro que el conjunto as descrito es un paraboloide circular. Ese paraboloide es la super-
cie de nivel de f para el valor k.
Hay muchos otros ejemplos similares en los que los conjuntos de nivel de una funcion f :
R
3
R se pueden interpretar de forma natural como supercies. Observese que si seguimos
aumentando el n umero de variables, la representacion graca se vuelve imposible. En dimensiones
superiores se utiliza el nombre hipersupercie para referirse a la generalizacion de la idea de
supercie de nivel, cuando se trata de una funcion f : R
n
R.
No obstante lo anterior, tambien hay muchos ejemplos en los que resulta imposible interpretar
un conjunto de nivel como una curva o una supercie.
Ejemplo 6.
En el plano, si se considera la funcion f(x, y) = x
2
+ y
2
, su conjunto de nivel 0 viene denido
por x
2
+ y
2
= 0. Y el unico punto del plano que satisface esta ecuaci on es el origen. Tiene
sentido decir que un punto es una curva?
Un ejemplo similar en el espacio: si se considera la funcion f(x, y, z) = (3x 2y 1)
2
+ (4x +
y z)
2
, su conjunto de nivel 0 esta formado por aquellos puntos (x, y, z) que cumplen
(3x 2y 1)
2
+ (4x + y z)
2
= 0
Y eso signica que esos puntos son soluciones del sistema
_
3x 2y = 1
4x + y z = 0
. Y, como sabemos,
estas ecuaciones denen una recta en el espacio. Este conjunto de nivel es una recta, no una
supercie.
En general puede ser muy complicado decidir en que casos una ecuacion de la forma
f(x, y) = k
9
dene una curva, o en que casos una ecuacion de la forma
f(x, y, z) = k
dene una supercie. Cuando estudiemos el teorema de la funcion implcita volveremos breve-
mente sobre este asunto.
El gradiente y los conjuntos de nivel Para descubrir el contenido geometrico de la ecuacion
(1), vamos a suponer que c : R R
n
es una curva parametrizada con la propiedad de que c(t)
pertenece al k conjunto de nivel de f para cualquier t R. Esto signica simplemente que f c
es constantemente igual a k. Por lo tanto:
d(f c)
dt
= 0,
porque es la derivada de una constante. Pero como, por otra parte, tenemos:
d(f c)
dt
= gradf(p) c
(t)
concluimos que el gradiente es perpendicular a c
(t).
Ya hemos visto que hay ocasiones en que no es facil interpretar geometricamente el conjunto
de nivel. Pero el razonamiento anterior nos dice que (si f es diferenciable), el gradiente es
perpendicular a cualquier curva parametrica (diferenciable) contenida en el conjunto de nivel.
Abreviaremos esta frase diciendo simplemente que el gradiente es perpendicular al conjunto de
nivel.
Teorema 7.
_
Si f : R
n
R es una funcion escalar diferenciable, el gradiente grad(f) de f es perpendicular
a los conjuntos de nivel de f.
Esta informacion geometrica permite utilizar el gradiente para escribir encontrar el plano tan-
gente o la recta normal a algunas supercies.
Ejemplo 8. La ecuacion
x
4
+ y
4
+ z
4
= 3
dene una supercie S similar a una esfera pero mas cuadrada, como se muestra en la gura:
10
Cual es el plano tangente a esta supercie en el punto (1, 1, 1)? Podramos tratar de despejar
z = f(x, y) en la anterior expresion, para usar los metodos que hemos visto en el caso de gracas.
Pero eso es complicado. Es mucho mas facil darse cuenta de que S es una supercie de nivel de
la funcion g(x, y, z) = x
4
+ y
4
+ z
4
. Por esa razon el gradiente de g:
gradg(x, y, z) = (4x
3
, 4y
3
, 4z
3
)
es perpendicular a S en cada punto. En concreto eso signica que el vector gradg(1, 1, 1) =
(4, 4, 4) es perpendicular a S en el punto (1, 1, 1). Y con esta informacion geometrica es sencillo
ver que el plano tangente es:
4(x 1) + 4(y 1) + 4(z 1) = 0
3. Derivadas direccionales
Las derivadas parciales se han denido a partir del analisis de las funciones
f
y
0
(x) = f(x, y
0
), f
x
0
(y) = f(x
0
, y)
y ya hemos discutido el signicado geometrico de estas funciones: son las secciones de la graca
de f con los planos verticales x = x
0
, y = y
0
.
Pero, como ilustra la gura de la derecha,
esos dos planos son solo dos de entre los
innitos planos verticales que pasan por
ese punto. Ahora queremos encontrar una
forma de estudiar el comportamiento de f
en esas otras direcciones.
Para ello tenemos que calcular los valo-
res de f a lo largo de una recta cualquie-
ra de las que pasan por el punto (x
0
, y
0
).
La regla de la cadena que hemos visto nos
proporciona la herramienta necesaria pa-
ra calcular estas derivadas. Las ecuaciones
parametricas de una de esas rectas, en la
direccion del vector v = (v
1
, v
2
), son
_
x = x
0
+ tv
1
y = y
0
+ tv
2
Llamemos entonces
c(t) = (x
0
+ tv
1
, y
0
+ tv
2
)
Esta recta es obviamente una curva parametrica diferenciable. Los valores de f a lo largo de
esta recta se calculan as:
f(c(t)) = f(x
0
+ tv
1
, y
0
+ tv
2
)
11
Esta expresion nos permite calcular, a partir de t, los valores de f. Y por tanto, esperamos que
la derivada
d(f(c(t)))
dt
en t = 0, que corresponde al punto p
nos sirva para averiguar como cambia f en la direccion del vector v. Pero, como vimos al hablar
de curvas parametricas, esta derivada depende no solo de f sino de la velocidad a la que se
recorre la curva parametrica (ver la seccion (2), pagina 5 y especialmente el ejemplo (3) y la
discusion siguiente). Recordemos que era:
d(f c)
dt
= gradf(p) c
(t) = gradf(p) v
ya que la velocidad de la recta es precisamente el vector v = (v
1
, v
2
). Es decir, recordando la
denicion de producto escalar:
d(f c)
dt
= gradf(p) v cos
siendo el angulo entre el gradiente de f y la recta, con direccion denida por v. Lo que estamos
tratando de denir es una forma de medir como cambia f en la direccion de la recta. De los tres
ingredientes que aparecen en esta ecuacion:
1. El modulo del gradiente en p depende solo de f
2. El angulo depende de la direccion de v, no de su modulo.
3. Pero v es arbitrario, podemos recorrer la recta a la velocidad que queramos.
Esta claro entonces que para obtener una nocion util, debemos eliminar esa arbitrariedad, hacien-
do el resultado independiente de la velocidad a la que se recorre la recta. Eso se puede conseguir
dividiendo el resultado por el modulo de v, de manera que la nocion que nos interesa es
1
v
d(f c)
dt
que, en los casos en que se aplique la regla de la cadena, sera lo mismo que
gradf(p) cos
As, nalmente llegamos a esta denicion.
Denicion 9 (Derivada direccional).
_
_
La derivada direccional de f en el punto p = (x
0
, y
0
) y en la direccion del vector no nulo
v = (v
1
, v
2
) es, si existe, el resultado del siguiente calculo:
D
v
f(p) =
1
v
lm
t0
_
f(x
0
+ tv
1
, y
0
+ tv
2
) f(x
0
, y
0
)
t
_
Es decir, se trata de la derivada en t = 0 (que corresponde a p) de la funcion compuesta
f(x
0
+tv
1
, y
0
+tv
2
) que mide los valores de f a lo largo de la recta, y dividido por el modulo de
v para hacer que la denicion no dependa de ese modulo.
12
Ejemplo 10. Nos piden que calculemos la derivada direccional de f(x, y) = x
2
+y
2
en el punto
(x
0
, y
0
) = (1, 2) y en la direccion del vector v = (2, 3). Para ello observamos que v =

13 y
por tanto
D
v
f(p) =
1
v
lm
t0
_
f(x
0
+ tv
1
, y
0
+ tv
2
) f(x
0
, y
0
)
t
_
=
1
13
lm
t0
_
f(1 + 2t, 2 3t) f(1, 2)
t
_
=
1
13
lm
t0
(1 + 2t)
2
+ (2 3t)
2
5
t
=
1
13
lm
t0
8t + 13t
2
t
=
8
13
La discusion con la que hemos empezado este apartado, indica que la regla de la cadena nos
permite calcular las derivadas direccionales. Es decir, que en el caso de una funcion diferenciable
se tiene este resultado.
Proposicion 11 (Derivadas direccionales y gradiente).
_
_
Si la funcion f es diferenciable en p, entonces existen todas las derivadas direccionales D
v
f(p),
sea cual sea el vector v. Y ademas, esas derivadas se pueden calcular usando la formula:
D
v
f(p) =
1
v
(gradf(p) v)
3.1. Direccion de maximo crecimiento
La expresion que hemos obtenido para calcular las derivadas direccionales en la proposicion
(11) tiene una consecuencia geometrica que merece la pena subrayar. Si es el angulo entre el
gradiente de f y el vector v, se cumple que
D
v
f(p) =
1
v
(gradf(p) v) =
1
v
gradf(p) v cos = gradf(p) cos
como hemos se nalado anteriormente. En que direccion se obtiene un valor maximo de la derivada
direccional? Cuando cos = 1. Es decir, cuando v y gradf(p) son paralelos. Esa es la direccion
en la que f crece mas rapidamente. En resumen,
Teorema 12.
_
_
Si la funcion f es diferenciable en p, entonces el gradiente de f en p indica la direccion de
maximo crecimiento de f (en el plano xy); es decir, la derivada para la que se obtiene el mayor
valor de la derivada direccional D
v
f(p). Ese valor maximo coincide con el modulo del gradiente,
gradf(p).
La denicion de derivada direccional y los teoremas y propiedades que hemos visto en esta
seccion para funciones de dos variables, se extienden sin ninguna dicultad al caso de funciones
f : R
n
R.
13

Propiedades de Las Funciones Diferenciables. 1. Regla de La Cadena

Cargado por

Información del documento

Título original

Derechos de autor

Formatos disponibles

Compartir este documento

Compartir o incrustar documentos

Opciones para compartir

¿Le pareció útil este documento?

¿Este contenido es inapropiado?

Copyright:

Formatos disponibles

Propiedades de Las Funciones Diferenciables. 1. Regla de La Cadena

Cargado por

Copyright:

Formatos disponibles

Univ.

de Alcala de Henares Ingeniera de Telecomunicacion

(1) = (2x, 2y)

También podría gustarte